HashSet无序,基于HashMap;LinkedHashSet有序,基于LinkedHashMap并维护双向链表。二者插入/查找均为O(1),但后者内存略高、迭代稍慢,且序列化后顺序仅在反序列化为LinkedHashSet时保留。

HashSet 和 LinkedHashSet 的底层实现差异
两者都基于 HashMap 实现,但关键区别在「如何维护元素顺序」:
HashSet 完全不保证插入或遍历顺序,内部只用 HashMap 存储键值对(元素作为 key,固定值 PRESENT 作为 value);
LinkedHashSet 则继承自 HashSet,但底层使用的是 LinkedHashMap —— 它在哈希表基础上额外维护了一个双向链表,记录插入顺序。
迭代时的顺序行为与性能开销
当你调用 iterator() 或用增强 for 遍历集合时:
- HashSet 返回的顺序是不确定的(取决于哈希值、扩容时机、JDK 版本),不能用于依赖顺序的逻辑;
- LinkedHashSet 严格按插入顺序返回元素,适合需要“记住添加先后”的场景,比如最近访问缓存、去重但保留原始序列的日志过滤。
性能上:
- 插入和查找平均时间复杂度都是 O(1);
- 但 LinkedHashSet 每次插入需更新链表指针,内存占用略高(每个节点多两个引用字段),迭代速度也稍慢(要沿链表走)。
构造函数参数含义不同
二者都有带初始容量和加载因子的构造方法,但注意:
- new HashSet(int initialCapacity, float loadFactor):仅影响底层 HashMap 的哈希桶数组大小;
- new LinkedHashSet(int initialCapacity, float loadFactor):同样控制哈希表部分,但链表结构不受这些参数影响——它始终存在且随插入动态增长。
常见误用:
- 认为给 LinkedHashSet 设大容量就能“提升顺序遍历性能” → 实际无意义,链表遍历成本与容量无关;
- 忘记 LinkedHashSet 仍会因哈希冲突导致桶内链表/红黑树结构,其“有序”仅指插入顺序,不等于“按哈希有序”或“按自然顺序”。
序列化与线程安全性一致
两者都不支持线程安全:
- 多线程写入未同步时,都可能引发 ConcurrentModificationException 或数据丢失;
- 若需并发安全,应选 Collections.synchronizedSet(new LinkedHashSet()) 或 ConcurrentHashMap.newKeySet()(JDK 8+)。
序列化行为相同:
- 都实现了 Serializable;
- 反序列化后,LinkedHashSet 仍保持插入顺序,HashSet 依然无序 —— 这一点常被忽略,尤其在分布式缓存或 RPC 场景中误以为序列化能“固化”某种顺序。
真正容易被绕过的点是:即使你用了 LinkedHashSet,只要中间经过 JSON 序列化(如 Jackson 默认转成数组),再反序列化回 Java 集合时若没指定类型为 LinkedHashSet,很可能变成 ArrayList 或默认 HashSet,顺序就丢了。










