答案:Stream.distinct()基于equals方法去重,需重写equals和hashCode处理自定义对象,内部用HashSet实现,有状态且顺序流中保持顺序。

在Java 8中,Stream.distinct() 方法提供了一种简洁高效的方式来去除流中的重复元素。它基于元素的 equals() 方法判断是否重复,返回一个由不同元素组成的新的流,不改变原始数据源。
distinct() 方法的基本用法
distinct() 是 Stream 接口中的一个中间操作,返回去重后的流。常用于集合、数组等数据结构的处理。
例如,对一个包含重复整数的列表进行去重:
List
List
.distinct()
.collect(Collectors.toList());
// 结果:[1, 2, 3, 4]
对自定义对象去重的关键:重写 equals 和 hashCode
如果要对自定义对象(如 Person、Student 等)使用 distinct(),必须正确重写 equals() 和 hashCode() 方法。
立即学习“Java免费学习笔记(深入)”;
假设有一个 Person 类:
public class Person {
private String name;
private int age;
// 构造方法、getter 省略
@Override
public boolean equals(Object o) {
if (this == o) return true;
if (!(o instanceof Person)) return false;
Person person = (Person) o;
return age == person.age && Objects.equals(name, person.name);
}
@Override
public int hashCode() {
return Objects.hash(name, age);
}
}
使用 distinct() 去除重复的 Person 对象:
List
new Person("Alice", 25),
new Person("Bob", 30),
new Person("Alice", 25)
);
List
.distinct()
.collect(Collectors.toList());
// 只保留两个:Alice/25 和 Bob/30
distinct() 的底层原理与性能说明
distinct() 内部依赖一个 HashSet 来记录已出现的元素。遍历流时,每个元素通过 equals() 判断是否已存在,若不存在则加入结果并放入 Set。
- 该操作是**有状态的**(stateful),因为它需要保存之前见过的元素
- 对于大量数据,可能消耗较多内存
- 顺序流中,distinct() 保持元素首次出现的顺序
- 并行流中,结果顺序不保证,但仍是去重的
基本上就这些。只要确保对象的 equals 和 hashCode 正确实现,Stream.distinct() 就能可靠地完成去重任务,代码清晰且易于维护。










