
本文介绍如何使用 Java Stream API 将数据流按照特定条件进行分区,并将分区后的数据分别收集到不同的集合中。通过 Collectors.partitioningBy 方法,可以高效地将数据流划分为满足条件和不满足条件的两部分,从而避免使用传统的循环方式,简化代码并提高可读性。
使用 partitioningBy 方法进行数据流分区
Java Stream API 提供了 Collectors.partitioningBy 方法,可以根据给定的 Predicate(断言)将数据流划分为两个集合:一个集合包含所有满足 Predicate 的元素,另一个集合包含所有不满足 Predicate 的元素。
partitioningBy 方法返回一个 Map
示例代码:
立即学习“Java免费学习笔记(深入)”;
假设我们有一个 ID 列表 myIdList 和一个将 ID 映射到对象的 Map myObjectMap。我们的目标是根据 ID 是否存在于 myObjectMap 中,将 ID 分成两组:存在于 myObjectMap 中的 ID 对应的对象放入一个 List,不存在于 myObjectMap 中的 ID 放入另一个 List。
import java.util.*;
import java.util.stream.Collectors;
public class StreamPartitioning {
public static void main(String[] args) {
List myIdList = Arrays.asList("a", "b", "c");
Map myObjectMap = new HashMap<>();
myObjectMap.put("b", "B");
Map> partitioned = myIdList.stream()
.collect(Collectors.partitioningBy(myObjectMap::containsKey));
List 代码解释:
- 创建数据: 首先,我们创建了一个包含字符串 ID 的列表 myIdList 和一个将字符串 ID 映射到对象的 Map myObjectMap。
- 使用 partitioningBy 分区: 我们使用 myIdList.stream() 创建一个流,然后使用 collect(Collectors.partitioningBy(myObjectMap::containsKey)) 将流分区。myObjectMap::containsKey 是一个方法引用,它作为 Predicate 传递给 partitioningBy 方法。 partitioningBy 方法会根据 myObjectMap 中是否包含某个 ID 作为键,将 myIdList 中的 ID 分成两组。
-
获取分区结果: partitioned 变量是一个 Map
>,其中键为 true 的值是 myIdList 中存在于 myObjectMap 中的 ID 列表,键为 false 的值是 myIdList 中不存在于 myObjectMap 中的 ID 列表。 - 提取对象列表和缺失 ID 列表: 我们使用 partitioned.get(true).stream().map(myObjectMap::get).collect(Collectors.toList()) 从存在于 myObjectMap 中的 ID 列表中提取对应的对象,并将它们收集到一个新的 List objectList 中。 我们直接使用 partitioned.get(false) 获取不存在于 myObjectMap 中的 ID 列表,并将它赋值给 missingObjIds 变量。
- 输出结果: 最后,我们输出 objectList 和 missingObjIds 的值。
输出结果:
objectList=[B] missingObjIds=[a, c]
注意事项
- partitioningBy 方法会遍历整个数据流,因此对于大型数据流,性能可能会受到影响。
- partitioningBy 方法返回的 Map 始终包含两个键:true 和 false。即使数据流中的所有元素都满足或都不满足 Predicate,这两个键仍然存在。
总结
Collectors.partitioningBy 方法是 Java Stream API 中一个强大的工具,可以用于将数据流按照特定条件进行分区,并将分区后的数据分别收集到不同的集合中。通过使用 partitioningBy 方法,可以简化代码并提高可读性。然而,需要注意的是,partitioningBy 方法可能会影响性能,因此在处理大型数据流时需要谨慎使用。










