手动用Map计数最通用可控,推荐Map.merge()或Stream.collect(),Guava的Multiset语义最匹配;注意null、线程安全、类型转换及性能陷阱。

用 Map 手动计数是最通用且可控的方式
Java 没有内置的“一键统计集合频次”方法,Collections 工具类也不提供。最稳妥的做法是遍历集合,用 HashMap 累计每个元素的出现次数。这种方式兼容所有元素类型(只要 equals() 和 hashCode() 正确),也便于后续做条件过滤或排序。
常见错误是直接用 ArrayList::indexOf 或嵌套循环暴力统计,时间复杂度升到 O(n²),尤其在千级以上数据时明显卡顿。
- 键类型必须与集合元素类型一致(如
String、Integer,或自定义类——需确保重写了equals()和hashCode()) - 推荐使用
Map.merge()简化逻辑,避免显式判空:Map
countMap = new HashMap<>(); list.forEach(s -> countMap.merge(s, 1, Integer::sum)); - 若集合含
null元素,HashMap允许一个null键,但ConcurrentHashMap不允许——多线程场景下需提前处理或换用compute()
Java 8+ 用 Stream.collect() 一行解决但要注意陷阱
借助 Collectors.groupingBy() 和 Collectors.counting() 可以写出简洁代码,但默认返回的是 Long 计数值,不是 Integer;且底层仍构造新 HashMap,对超大集合内存压力不比手动方式小。
典型误用是把 stream().collect() 套在频繁调用的热点路径里,每次新建中间对象,GC 压力陡增。
立即学习“Java免费学习笔记(深入)”;
- 基础写法:
Map
counts = list.stream() .collect(Collectors.groupingBy(Function.identity(), Collectors.counting())); - 想得到
Integer类型计数,改用summingInt:.collect(Collectors.groupingBy(Function.identity(), Collectors.summingInt(e -> 1)))
- 如果集合本身是
LinkedList或未实现RandomAccess,流式遍历性能可能略低于传统 for-each(JVM 优化已大幅缩小差距,但极端场景仍需实测)
guava 的 Multiset 是语义最匹配的工具
如果你项目已引入 guava,Multiset 是专为“可重复元素集合”设计的接口,HashMultiset 内部就是带计数的 HashMap,调用 count(Object) 直接查频次,语义清晰、API 直观。
注意它不是 Collection 子接口,不能直接当 List/Set 用;插入重复元素不会报错,但也不会自动去重——这点和初学者直觉可能相反。
- 初始化并添加:
Multiset
multiset = HashMultiset.create(list); - 查某个元素出现次数:
multiset.count("apple"),不存在则返回0 - 获取全部元素及频次:
multiset.entrySet()返回Multiset.Entry集合,其中getElement()和分别取值和数量
不要用 Collections.frequency() 统计整个集合
Collections.frequency(Collection, Object) 只适合查“某一个特定元素”的出现次数。如果硬要靠它遍历去统计全部元素,会反复全量扫描集合,时间复杂度是 O(n²),数据量稍大就明显变慢。
比如对含 10,000 个字符串的 ArrayList 统计全部频次,用 frequency() 循环调用可能耗时百毫秒以上;而一次遍历的 Map 方式通常在 1–2 毫秒内完成。
- 仅适用于单次查询:
Collections.frequency(list, "target")
- 它内部就是个简单 for 循环,没有缓存、无并发安全,也不支持自定义比较逻辑
- 对
LinkedList 调用该方法更慢——因为 get(i) 是 O(n),而 frequency() 内部用的是 Iterator,其实影响不大;真正伤性能的是外部反复调用它
实际编码中,90% 场景选第一种「手动 Map」或第三种「Guava Multiset」就够了。Stream 方式写起来爽,但得清楚它背后做了什么;至于 Collections.frequency(),只在调试或临时脚本里查一两个值时用。
Collections.frequency(Collection, Object) 只适合查“某一个特定元素”的出现次数。如果硬要靠它遍历去统计全部元素,会反复全量扫描集合,时间复杂度是 O(n²),数据量稍大就明显变慢。
比如对含 10,000 个字符串的 ArrayList 统计全部频次,用 frequency() 循环调用可能耗时百毫秒以上;而一次遍历的 Map 方式通常在 1–2 毫秒内完成。
- 仅适用于单次查询:
Collections.frequency(list, "target") - 它内部就是个简单 for 循环,没有缓存、无并发安全,也不支持自定义比较逻辑
- 对
LinkedList调用该方法更慢——因为get(i)是O(n),而frequency()内部用的是Iterator,其实影响不大;真正伤性能的是外部反复调用它
Collections.frequency(),只在调试或临时脚本里查一两个值时用。










