HashSet通过hashCode和equals方法判断重复,需重写这两个方法以确保去重正确;对于自定义类如Person,必须实现一致的equals和hashCode逻辑,否则可能导致去重失败或集合异常。

在Java中,HashSet 是一个基于哈希表实现的Set接口集合,它不允许存储重复元素。这使得 HashSet 成为去除重复数据的常用工具。只要正确使用,它可以高效地完成去重任务。
理解HashSet如何判断重复
HashSet 判断两个对象是否重复,依赖于对象的 equals() 和 hashCode() 方法。当向 HashSet 添加一个元素时:
- 先调用该对象的 hashCode() 方法获取哈希值,确定在哈希表中的位置。
- 如果该位置已有元素,则调用 equals() 方法比较内容。
- 只有当两个对象的 hashCode 相同且 equals 返回 true 时,才视为重复,添加失败。
因此,为了确保去重有效,存入 HashSet 的对象必须正确重写这两个方法,尤其是自定义类。
基本使用示例:去除基本类型包装类重复项
对于 Integer、String 等 JDK 内置类,equals 和 hashCode 已经实现良好,可直接使用:
立即学习“Java免费学习笔记(深入)”;
Setnames = new HashSet<>(); names.add("Alice"); names.add("Bob"); names.add("Alice"); // 重复,不会添加 System.out.println(names); // 输出: [Alice, Bob]
结果中只保留唯一值,重复的 "Alice" 被自动过滤。
自定义对象去重的关键:重写hashCode和equals
假设有一个 Person 类,我们希望根据姓名和年龄判断是否重复:
class Person {
private String name;
private int age;
public Person(String name, int age) {
this.name = name;
this.age = age;
}
@Override
public boolean equals(Object o) {
if (this == o) return true;
if (!(o instanceof Person)) return false;
Person person = (Person) o;
return age == person.age && name.equals(person.name);
}
@Override
public int hashCode() {
int result = name != null ? name.hashCode() : 0;
result = 31 * result + age;
return result;
}}
此时将多个 Person 对象加入 HashSet,相同姓名和年龄的只会保留一份:
Setpeople = new HashSet<>(); people.add(new Person("Tom", 25)); people.add(new Person("Tom", 25)); // 重复 people.add(new Person("Jerry", 20)); System.out.println(people.size()); // 输出: 2
实用技巧与注意事项
使用 HashSet 去重时,注意以下几点能避免常见问题:
- 确保自定义类正确实现 equals 和 hashCode,建议使用 IDE 自动生成或 Lombok 的 @EqualsAndHashCode 注解。
- HashSet 不保证元素顺序,如需有序去重,可使用 LinkedHashSet。
- HashSet 允许一个 null 元素,多次添加 null 只会保留一个。
- 若对象添加到 HashSet 后修改了影响 hashCode 或 equals 的字段,可能导致集合行为异常,应避免此类操作。
基本上就这些。掌握 hashCode 和 equals 的作用机制,再结合实际场景选择合适的 Set 实现,就能高效、稳定地完成去重任务。不复杂但容易忽略细节。










