
java.util.stream.Collector 接口是 Java Stream API 中一个核心组件,用于将流中的元素聚合成一个结果。它定义了三种泛型类型:
要创建一个自定义的 Collector,最常用的方法是使用 Collector.of() 工厂方法,它需要四个核心函数式接口作为参数:
一个常见的误解是,累加器类型 A 必须是一个独立的、专门为此目的创建的具名类,并且其方法(如 supply、accumulate、combine、finish)需要直接在 Collector 的实现中引用该类的静态方法或实例方法。实际上,Collector.of() 的函数参数提供了极大的灵活性,允许我们使用各种方式来定义这些行为,而无需强制创建额外的具名类。
累加器类型 A 的选择是实现自定义 Collector 的关键。它不一定非得是一个复杂的自定义类,可以是以下几种类型:
立即学习“Java免费学习笔记(深入)”;
对于简单的数值累加,一个单元素的基本类型数组(如 int[])是一个非常高效且简洁的累加器。它提供了可变性,并且避免了装箱拆箱的开销。
示例:计算流中整数的和
import java.util.stream.Collector;
import java.util.stream.Stream;
public class CustomSumCollector {
/**
* 创建一个收集器,用于计算整数流的总和。
* 累加器类型为 int[1],其中数组的第一个元素存储当前和。
*
* @return 收集整数到其总和的收集器。
*/
public static Collector<Integer, ?, Integer> sum() {
return Collector.of(
() -> new int[1], // supplier: 创建一个长度为1的int数组作为累加器
(a, i) -> a[0] += i, // accumulator: 将元素i加到数组的第一个元素
(a, b) -> { a[0] += b[0]; return a; }, // combiner: 合并两个累加器
a -> a[0], // finisher: 返回数组的第一个元素作为最终结果
Collector.Characteristics.UNORDERED // 标识收集器不关心元素顺序
);
}
public static void main(String[] args) {
Stream<Integer> numbers = Stream.of(1, 2, 3, 4, 5);
Integer totalSum = numbers.collect(sum());
System.out.println("Sum using custom collector: " + totalSum); // Output: Sum using custom collector: 15
}
}在这个例子中,int[1] 作为累加器 A,简洁地完成了累加任务。
Java 标准库中提供了许多可变的类,它们可以直接用作累加器,特别是当需要考虑线程安全时。
示例:使用 AtomicInteger 计算流中整数的和(并发安全)
import java.util.concurrent.atomic.AtomicInteger;
import java.util.stream.Collector;
import java.util.stream.Stream;
public class ConcurrentSumCollector {
/**
* 创建一个并发安全的收集器,用于计算整数流的总和。
* 累加器类型为 AtomicInteger。
*
* @return 并发收集整数到其总和的收集器。
*/
public static Collector<Integer, ?, Integer> concurrentSum() {
return Collector.of(
AtomicInteger::new, // supplier: 创建一个新的 AtomicInteger 实例
AtomicInteger::addAndGet, // accumulator: 将元素i原子地加到 AtomicInteger 中
(a, b) -> { a.addAndGet(b.intValue()); return a; }, // combiner: 合并两个 AtomicInteger
AtomicInteger::intValue, // finisher: 返回 AtomicInteger 的值作为最终结果
Collector.Characteristics.UNORDERED,
Collector.Characteristics.CONCURRENT // 标识收集器支持并发
);
}
public static void main(String[] args) {
Stream<Integer> numbers = Stream.of(1, 2, 3, 4, 5);
Integer totalSum = numbers.collect(concurrentSum());
System.out.println("Concurrent sum using custom collector: " + totalSum); // Output: Concurrent sum using custom collector: 15
}
}AtomicInteger 天然提供了线程安全的原子操作,非常适合在并行流中使用。
当没有合适的现有类型,并且不想创建新的具名类时,可以使用匿名内部类或 Object 的子类(通常通过 new Object() {} 语法)作为累加器。这种方式将累加器的定义局部化在 Collector 的实现内部,增加了封装性。
示例:收集 Map.Entry 流中具有最大值的键列表
假设我们有一个 Map.Entry<K, Integer> 的流,我们希望找出所有具有最大值的键,并以 List<K> 的形式返回。
方法一:使用 AbstractMap.SimpleEntry 作为累加器
AbstractMap.SimpleEntry 可以作为一个简单的键值对容器,这里我们用它来存储当前找到的最大值 (Integer) 和对应的键列表 (List<K>)。
import java.util.*;
import java.util.stream.Collector;
import java.util.stream.Stream;
public class KeysToMaximumCollector {
/**
* 收集 Map.Entry 流中具有最大值的键列表。
* 累加器类型为 AbstractMap.SimpleEntry<List<K>, Integer>。
*
* @param <K> 键的类型
* @return 收集器,返回具有最大值的键列表。
*/
public static <K> Collector<Map.Entry<K, Integer>, ?, List<K>> keysToMaximum() {
return Collector.of(
() -> new AbstractMap.SimpleEntry<>(new ArrayList<>(), Integer.MIN_VALUE), // supplier: 初始累加器
(current, next) -> { // accumulator: 处理每个 Map.Entry
int max = current.getValue();
int value = next.getValue();
if (value >= max) {
if (value > max) { // 找到更大的值,清空旧列表,更新最大值
current.setValue(value);
current.getKey().clear();
}
current.getKey().add(next.getKey()); // 添加当前键
}
},
(a, b) -> { // combiner: 合并两个累加器
int maxA = a.getValue();
int maxB = b.getValue();
if (maxA < maxB) return b; // B 的最大值更大,返回 B
if (maxA == maxB) a.getKey().addAll(b.getKey()); // 最大值相同,合并键列表
return a; // 否则返回 A
},
Map.Entry::getKey // finisher: 返回累加器中的键列表
);
}
public static void main(String[] args) {
Map<String, Integer> map = new HashMap<>();
map.put("A", 10);
map.put("B", 20);
map.put("C", 15);
map.put("D", 20);
map.put("E", 5);
List<String> keys = map.entrySet().stream().collect(keysToMaximum());
System.out.println("Keys with maximum value: " + keys); // Output: Keys with maximum value: [B, D] (顺序可能不同)
}
}方法二:使用匿名内部类作为累加器
这种方式创建了一个只在 Collector 内部可见的、具有特定字段的匿名对象作为累加器。
import java.util.*;
import java.util.stream.Collector;
import java.util.stream.Stream;
public class KeysToMaximumAdHocCollector {
/**
* 收集 Map.Entry 流中具有最大值的键列表。
* 累加器类型为匿名内部类。
*
* @param <K> 键的类型
* @return 收集器,返回具有最大值的键列表。
*/
public static <K> Collector<Map.Entry<K, Integer>, ?, List<K>> keysToMaximum() {
return Collector.of(
() -> new Object() { // supplier: 创建一个匿名内部类实例作为累加器
int max = Integer.MIN_VALUE;
final List<K> keys = new ArrayList<>();
},
(current, next) -> { // accumulator: 处理每个 Map.Entry
int value = next.getValue();
if (value >= current.max) {
if (value > current.max) {
current.max = value;
current.keys.clear();
}
current.keys.add(next.getKey());
}
},
(a, b) -> { // combiner: 合并两个匿名内部类累加器
if (a.max < b.max) return b;
if (a.max == b.max) a.keys.addAll(b.keys);
return a;
},
a -> a.keys // finisher: 返回累加器中的键列表
);
}
public static void main(String[] args) {
Map<String, Integer> map = new HashMap<>();
map.put("A", 10);
map.put("B", 20);
map.put("C", 15);
map.put("D", 20);
map.put("E", 5);
List<String> keys = map.entrySet().stream().collect(keysToMaximum());
System.out.println("Keys with maximum value (ad-hoc): " + keys); // Output: Keys with maximum value (ad-hoc): [B, D] (顺序可能不同)
}
}这两种方法都避免了为累加器单独创建一个具名类,使代码更加紧凑和局部化。
累加器类型的选择:
函数式接口的实现:
Collector.Characteristics:
通过灵活运用 Collector.of() 方法,并根据实际需求选择合适的累加器类型,开发者可以创建出高效、简洁且功能强大的自定义收集器,从而更好地利用 Java Stream API 的能力。无需为每个自定义收集器都创建独立的累加器类,这大大简化了代码结构和维护成本。
以上就是Java Stream Collector 高级用法:定制化累加器与收集器实现的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号