使用Set接口去重是Java中最常见方式,HashSet适用于无序场景,LinkedHashSet保持插入顺序,Stream.distinct()提供函数式编程支持,均依赖正确重写的equals()和hashCode()方法。

在Java集合框架中,元素去重最常用的方式是利用Set接口的特性,因为Set集合不允许存储重复元素。只要元素的equals()和hashCode()方法正确实现,插入时就会自动去重。
使用HashSet去重(适用于无序场景)
将List或其他集合转为HashSet,可快速去除重复元素。
- 适合对顺序无要求的去重场景
- 底层基于HashMap,性能高
- 注意:需确保元素类正确重写
equals()和hashCode()
示例代码:
Listlist = Arrays.asList("a", "b", "a", "c"); Set set = new HashSet<>(list); // 结果:[a, b, c](顺序不保证)
使用LinkedHashSet去重(保持插入顺序)
如果需要保留元素首次出现的顺序,应使用LinkedHashSet。
立即学习“Java免费学习笔记(深入)”;
- 去重同时维护插入顺序
- 性能略低于HashSet,但顺序可控
示例代码:
Listlist = Arrays.asList("a", "b", "a", "c"); Set set = new LinkedHashSet<>(list); // 结果:[a, b, c](顺序与插入一致)
使用Stream.distinct()(函数式编程方式)
Java 8及以上版本支持通过Stream进行链式操作去重。
- 语法简洁,适合流式处理
- distinct()依赖equals和hashCode
- 可与其他中间操作组合使用
示例代码:
ListdistinctList = list.stream() .distinct() .collect(Collectors.toList());
自定义对象去重注意事项
对于自定义类(如Person、Student),必须重写equals()和hashCode()方法,否则去重会失效。
- IDE通常可自动生成这两个方法
- 建议基于关键业务字段生成(如id、name等)
- 若使用Lombok,可用
@Data注解自动包含
例如:
@Data
class Person {
private String id;
private String name;
}
// 使用@Data后,equals和hashCode已由Lombok生成
基本上就这些。根据是否需要保持顺序、JDK版本以及数据类型选择合适的方法即可。核心要点是理解Set的去重机制依赖对象的equals和hashCode。










