HashSet通过hashCode和equals方法实现去重,添加元素时先计算哈希值定位,冲突时调用equals判断,二者均相同则视为重复;Integer、String等类型已重写相关方法可直接去重,自定义类如Person需手动重写hashCode和equals以保证逻辑正确;可通过new HashSet(list)批量去重或add()逐个添加并利用返回值判断是否重复,关键在于确保hashCode与equals的一致性。

在Java中,HashSet 是一个基于哈希表实现的 Set 接口集合类,它天然支持元素去重。当你尝试向 HashSet 中添加重复元素时,集合会自动忽略该操作,从而保证集合中所有元素的唯一性。
HashSet 去重的基本原理
HashSet 判断元素是否重复依赖于对象的 equals() 方法和 hashCode() 方法:
- 添加元素时,HashSet 会先调用该对象的 hashCode() 方法计算哈希值,确定存储位置。
- 如果该位置已有元素,再调用 equals() 方法判断是否真正相等。
- 若两个方法都判定为相等,则视为重复元素,添加失败,返回 false。
因此,为了正确去重,存入 HashSet 的对象必须正确重写 hashCode() 和 equals() 方法。
使用 HashSet 去除基本类型包装类的重复
Java 中的 Integer、String 等类已经重写了 hashCode 和 equals 方法,可直接用于去重:
立即学习“Java免费学习笔记(深入)”;
import java.util.*;
public class RemoveDuplicates {
public static void main(String[] args) {
List numbers = Arrays.asList(1, 2, 3, 2, 4, 1, 5);
Set uniqueNumbers = new HashSet<>(numbers);
System.out.println(uniqueNumbers); // 输出:[1, 2, 3, 4, 5]
}
}
对自定义对象去重需重写 hashCode 和 equals
假设有一个 Person 类,我们希望根据姓名和年龄去重:
class Person {
private String name;
private int age;
public Person(String name, int age) {
this.name = name;
this.age = age;
}
@Override
public boolean equals(Object o) {
if (this == o) return true;
if (!(o instanceof Person)) return false;
Person person = (Person) o;
return age == person.age && Objects.equals(name, person.name);
}
@Override
public int hashCode() {
return Objects.hash(name, age);
}
@Override
public String toString() {
return "Person{" + "name='" + name + '\'' + ", age=" + age + '}';
}
}
测试去重效果:
Listpeople = Arrays.asList( new Person("Alice", 25), new Person("Bob", 30), new Person("Alice", 25) ); Set uniquePeople = new HashSet<>(people); System.out.println(uniquePeople); // 输出:[Person{name='Alice', age=25}, Person{name='Bob', age=30}]
手动添加元素并检查是否重复
你也可以通过 add() 方法逐个添加,并利用其返回值判断是否为重复元素:
Setset = new HashSet<>(); boolean isAdded1 = set.add("apple"); boolean isAdded2 = set.add("apple"); System.out.println(isAdded1); // true System.out.println(isAdded2); // false
基本上就这些。只要确保对象的 hashCode 和 equals 行为一致,HashSet 就能高效完成去重任务。对于大多数场景,推荐直接使用构造函数传入原始列表来快速去重。不复杂但容易忽略的是自定义类必须正确重写那两个方法。










