0

0

Java中实现类似NumPy array_split 的列表分块操作

花韻仙語

花韻仙語

发布时间:2025-09-05 16:27:23

|

681人浏览过

|

来源于php中文网

原创

Java中实现类似NumPy array_split 的列表分块操作

本教程旨在介绍如何在Java中将一个列表(List)高效地分割成n个大致相等大小的子列表,以实现类似于Python NumPy库中array_split函数的功能。我们将重点探讨使用Google Guava库的Lists.partition方法,并详细说明如何计算分块大小以满足需求,提供实用的代码示例和注意事项。

引言:列表分块的需求与NumPy array_split

在数据处理和并行计算等场景中,我们经常需要将一个大型列表或数组分割成若干个较小的、大致相等大小的子列表或子数组。例如,当需要将任务分配给多个线程并行处理时,将原始数据集均匀分块是常见的做法。

在Python的NumPy库中,numpy.array_split(x, n) 提供了一个非常便捷的方法,可以将数组 x 分割成 n 个大致相等的子数组,即使 x 的长度不能被 n 整除,它也能智能地分配剩余元素。例如:

import numpy
x = [7, 3, 9, 10, 5, 6, 8, 13]
print(numpy.array_split(x, 3))
# 输出: [array([7, 3, 9]), array([10, 5, 6]), array([ 8, 13])]

然而,Java标准库中并没有直接提供一个与 numpy.array_split 功能完全对等的内置方法。虽然可以手动编写循环逻辑来实现,但更推荐使用成熟的第三方库来简化开发并确保代码的健壮性。本文将重点介绍如何利用Google Guava库来实现这一功能。

使用Google Guava Lists.partition 实现高效分块

Google Guava 是一个广泛使用的Java核心库,提供了许多实用的工具类和方法,其中包括 Lists.partition。Lists.partition(list, size) 方法可以将一个列表分割成固定大小为 size 的子列表。要实现类似于 numpy.array_split(list, n) 的功能(即分割成 n 份),我们需要巧妙地计算出每个子列表的 size。

核心原理:计算分块大小以实现指定份数分割

Lists.partition(list, size) 的 size 参数是每个子列表的最大长度。如果我们想将一个列表 originalList 分割成 n 个子列表,那么每个子列表的理想大小 size 应该为 originalList.size() / n。考虑到列表长度可能无法被 n 整除,我们需要向上取整,以确保所有元素都能被包含在 n 个子列表中。

立即学习Java免费学习笔记(深入)”;

计算公式如下: chunkSize = Math.ceil(originalList.size() / (double) n)

将 originalList.size() 转换为 double 类型进行除法运算,然后使用 Math.ceil() 向上取整,最后再转换为 int 类型,即可得到所需的 chunkSize。

代码示例

下面是一个完整的Java代码示例,演示了如何使用Guava的 Lists.partition 方法将一个列表分割成指定数量的子列表:

HTTPie AI
HTTPie AI

AI API开发工具

下载

首先,确保你的项目中已引入Guava依赖。如果你使用Maven,可以在 pom.xml 中添加以下依赖:


    com.google.guava
    guava
    32.1.3-jre 

然后,你可以编写以下Java代码:

import com.google.common.collect.Lists;
import java.util.ArrayList;
import java.util.Arrays;
import java.util.List;

public class ListSplitter {

    public static void main(String[] args) {
        // 原始列表
        List originalList = new ArrayList<>(Arrays.asList(7, 3, 9, 10, 5, 6, 8, 13));
        System.out.println("原始列表: " + originalList);

        // 目标分块数量
        int numberOfPartitions = 3;
        System.out.println("目标分块数量: " + numberOfPartitions);

        // 计算每个子列表的大小
        // 使用 Math.ceil 确保向上取整,以包含所有元素
        int chunkSize = (int) Math.ceil(originalList.size() / (double) numberOfPartitions);
        System.out.println("计算出的每个子列表大小 (chunkSize): " + chunkSize);

        // 使用 Guava 的 Lists.partition 进行分块
        List> partitions = Lists.partition(originalList, chunkSize);

        // 打印分块结果
        System.out.println("分块结果:");
        for (int i = 0; i < partitions.size(); i++) {
            System.out.println("  子列表 " + (i + 1) + ": " + partitions.get(i));
        }

        // 示例:处理空列表
        List emptyList = new ArrayList<>();
        System.out.println("\n处理空列表:");
        List> emptyPartitions = Lists.partition(emptyList, 3); // chunkSize 至少为1
        System.out.println("  空列表分块结果: " + emptyPartitions);

        // 示例:当分块数量大于列表元素数量时
        List smallList = new ArrayList<>(Arrays.asList(1, 2));
        int smallListPartitions = 5;
        int smallListChunkSize = (int) Math.ceil(smallList.size() / (double) smallListPartitions); // 2/5 = 0.4 -> ceil(0.4) = 1
        System.out.println("\n处理小列表 (分块数 > 元素数): " + smallList);
        System.out.println("  目标分块数量: " + smallListPartitions + ", 计算出的 chunkSize: " + smallListChunkSize);
        List> resultSmallList = Lists.partition(smallList, smallListChunkSize);
        System.out.println("  分块结果: " + resultSmallList);
    }
}

运行结果示例:

原始列表: [7, 3, 9, 10, 5, 6, 8, 13]
目标分块数量: 3
计算出的每个子列表大小 (chunkSize): 3
分块结果:
  子列表 1: [7, 3, 9]
  子列表 2: [10, 5, 6]
  子列表 3: [8, 13]

处理空列表:
  空列表分块结果: []

处理小列表 (分块数 > 元素数): [1, 2]
  目标分块数量: 5, 计算出的 chunkSize: 1
  分块结果: [[1], [2]]

从结果可以看出,[7, 3, 9, 10, 5, 6, 8, 13] 被成功分割成了 [7, 3, 9]、[10, 5, 6] 和 [8, 13] 三个子列表,与NumPy array_split 的行为一致。

Lists.partition 的特性与注意事项

  1. 返回的是视图 (View): Lists.partition 返回的 List> 并不是包含独立新列表的列表。它返回的每个子列表都是原始列表的一个视图。这意味着对子列表的修改会直接反映到原始列表上,反之亦然。如果需要独立的子列表,你需要手动复制它们(例如,使用 new ArrayList(subList))。
  2. 效率: 由于返回的是视图,Lists.partition 在创建子列表时避免了不必要的数据复制,因此效率很高,尤其适用于处理大型列表。
  3. 边界条件:
    • 空列表: 如果原始列表为空,Lists.partition 将返回一个空列表的列表。
    • chunkSize 为零或负数: Lists.partition 会抛出 IllegalArgumentException。在我们的计算中,chunkSize 至少为1(除非 numberOfPartitions 极大导致 originalList.size() / (double) numberOfPartitions 接近0,但 Math.ceil 会处理),因此通常不会出现此问题。
    • numberOfPartitions 大于 originalList.size(): 我们的 chunkSize 计算 (Math.ceil(originalList.size() / (double) numberOfPartitions)) 仍能正确工作。例如,如果 originalList 有2个元素,要分成5份,chunkSize 会计算为 ceil(2/5.0) = 1。最终会得到 [[1], [2]] 两个子列表,而不是5个。这与 numpy.array_split 的行为略有不同,NumPy 会尝试创建 n 个数组,即使其中一些可能是空的。Guava 的方法会创建尽可能多的非空子列表,直到所有元素都被分配。

总结

在Java中实现类似于NumPy array_split 的列表分块功能,最简洁高效的方法是结合使用Google Guava库的 Lists.partition 方法和精确的 chunkSize 计算。通过 chunkSize = (int) Math.ceil(originalList.size() / (double) numberOfPartitions),我们可以确保列表被分割成大致相等数量的子列表,并覆盖所有原始元素。这种方法不仅代码简洁,而且由于 Lists.partition 返回视图的特性,也具有较高的执行效率。在实际项目中,引入Guava库能有效提升开发效率和代码质量。

相关专题

更多
python开发工具
python开发工具

php中文网为大家提供各种python开发工具,好的开发工具,可帮助开发者攻克编程学习中的基础障碍,理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容,供大家免费下载使用。

715

2023.06.15

python打包成可执行文件
python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章,大家可以免费的下载体验。

625

2023.07.20

python能做什么
python能做什么

python能做的有:可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

739

2023.07.25

format在python中的用法
format在python中的用法

Python中的format是一种字符串格式化方法,用于将变量或值插入到字符串中的占位符位置。通过format方法,我们可以动态地构建字符串,使其包含不同值。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

617

2023.07.31

python教程
python教程

Python已成为一门网红语言,即使是在非编程开发者当中,也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章,大家可以免费体验学习。

1235

2023.08.03

python环境变量的配置
python环境变量的配置

Python是一种流行的编程语言,被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后,我们需要配置环境变量,以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

547

2023.08.04

python eval
python eval

eval函数是Python中一个非常强大的函数,它可以将字符串作为Python代码进行执行,实现动态编程的效果。然而,由于其潜在的安全风险和性能问题,需要谨慎使用。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

575

2023.08.04

scratch和python区别
scratch和python区别

scratch和python的区别:1、scratch是一种专为初学者设计的图形化编程语言,python是一种文本编程语言;2、scratch使用的是基于积木的编程语法,python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容,供大家免费下载体验。

698

2023.08.11

小游戏4399大全
小游戏4399大全

4399小游戏免费秒玩大全来了!无需下载、即点即玩,涵盖动作、冒险、益智、射击、体育、双人等全品类热门小游戏。经典如《黄金矿工》《森林冰火人》《狂扁小朋友》一应俱全,每日更新最新H5游戏,支持电脑与手机跨端畅玩。访问4399小游戏中心,重温童年回忆,畅享轻松娱乐时光!官方入口安全绿色,无插件、无广告干扰,打开即玩,快乐秒达!

30

2025.12.31

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 0.6万人学习

Django 教程
Django 教程

共28课时 | 2.6万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.0万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号