答案:HashSet通过hashCode和equals方法实现去重,添加元素时先计算哈希值定位,再用equals判断是否已存在。对于自定义对象如Student类,必须重写这两个方法才能正确去重;基本类型包装类因已重写,可直接使用。实际应用中需保证方法一致性、避免修改存入后的对象字段,并可根据需求选择LinkedHashSet保持顺序,同时注意null值仅能存在一个。

在Java开发中,HashSet 是最常用的集合之一,特别适合用于去除重复元素。它的底层基于 HashMap 实现,具有高效的添加、删除和查找性能,时间复杂度接近 O(1)。如果你需要对一组数据去重,HashSet 是一个简洁又高效的选择。
理解 HashSet 的去重机制
HashSet 能实现去重,关键在于它内部使用了 hashCode() 和 equals() 方法来判断两个对象是否相等。
当你向 HashSet 添加一个元素时:
- 先调用该元素的 hashCode() 方法计算哈希值,确定存储位置。
- 如果该位置已有元素,则进一步调用 equals() 方法比较内容。
- 若 equals() 返回 true,说明元素已存在,添加失败,从而实现去重。
因此,为了确保自定义对象能正确去重,必须重写类中的 hashCode() 和 equals() 方法。
立即学习“Java免费学习笔记(深入)”;
基本使用:去重简单类型
对于 Java 的基本包装类型(如 String、Integer),HashSet 可直接去重,无需额外操作,因为这些类已经重写了 hashCode 和 equals 方法。
Set自定义对象去重的关键:重写 hashCode 和 equals
假设你有一个 Student 类,包含 name 和 age 字段,如果不重写方法,即使两个对象内容相同,HashSet 也会认为它们不同。
正确做法是:
public class Student { private String name; private int age; // 构造方法、getter/setter 省略 @Override public boolean equals(Object o) { if (this == o) return true; if (!(o instanceof Student)) return false; Student student = (Student) o; return age == student.age && Objects.equals(name, student.name); } @Override public int hashCode() { return Objects.hash(name, age); } }完成重写后,将 Student 对象放入 HashSet 即可按业务逻辑去重:
Set实际应用建议与注意事项
在项目中使用 HashSet 去重时,注意以下几点:
- 保持 hashCode 和 equals 的一致性:如果两个对象 equals 为 true,它们的 hashCode 必须相同。
- 不可变对象更安全:如果对象的字段在加入 HashSet 后被修改,可能导致 hashCode 改变,影响后续查找或引发内存泄漏。
- 考虑使用 LinkedHashSet:如果需要保持插入顺序,可用 LinkedHashSet,它在去重的同时维护顺序。
- 空值处理:HashSet 允许一个 null 元素,多次添加 null 仍只保留一个。
基本上就这些。只要理解了 HashSet 的去重原理,并在必要时正确重写方法,就能在日常开发中高效利用它解决重复数据问题。不复杂但容易忽略细节。










