
本文深入探讨了“top k 频繁元素”问题的高效解决方案,主要采用哈希映射统计元素频率,并结合桶排序思想进行元素归类。文章详细解析了如何构建频率桶,并重点澄清了在填充桶时,为何必须遍历哈希映射的键集(keyset)而非原始数组,以避免将重复元素错误地放入桶中,确保最终输出的正确性。
“Top K 频繁元素”问题要求从一个整数数组中找出出现频率最高的 K 个元素。例如,给定数组 nums = [1,1,1,2,2,3] 和 k = 2,预期输出为 [1,2],因为 1 出现了 3 次,2 出现了 2 次,它们是频率最高的两个元素。解决此问题通常需要两个核心步骤:首先统计每个元素的频率,然后根据频率筛选出前 K 个元素。
解决此类问题的常见且高效的方法是结合使用哈希映射(HashMap)进行频率统计,以及桶排序(Bucket Sort)思想进行元素归类。
完成这两个步骤后,只需从桶数组的末尾(即高频率)向前遍历,收集元素直到达到 K 个,即可得到结果。
以下是基于上述思想的 Java 解决方案代码:
import java.util.ArrayList;
import java.util.HashMap;
import java.util.List;
import java.util.Map;
class Solution {
public int[] topKFrequent(int[] nums, int k) {
// 1. 统计每个元素的频率
Map<Integer, Integer> freqMap = new HashMap<>();
for (int n : nums) {
freqMap.put(n, freqMap.getOrDefault(n, 0) + 1);
}
// 2. 创建频率桶
// 桶的索引代表频率,桶内存储具有该频率的元素列表
// 频率最大为 nums.length,所以桶大小为 nums.length + 1
List<Integer>[] bucket = new ArrayList[nums.length + 1];
// 3. 将元素放入对应的频率桶中
// 遍历 freqMap 的 keySet,确保每个不重复的元素被放入桶中一次
for (int n : freqMap.keySet()) {
int freq = freqMap.get(n);
if (bucket[freq] == null) {
bucket[freq] = new ArrayList<>();
}
bucket[freq].add(n);
}
// 4. 从高频率向低频率遍历桶,收集前 K 个元素
int[] result = new int[k];
int count = 0; // 已收集的元素数量
// 从桶的末尾(最高频率)开始遍历
for (int i = bucket.length - 1; i >= 0; i--) {
if (bucket[i] != null) { // 如果当前频率的桶不为空
for (int element : bucket[i]) {
result[count++] = element;
if (count == k) { // 达到 K 个元素,返回结果
return result;
}
}
}
}
return result; // 理论上不会执行到这里,除非 k > 数组中所有不重复元素的数量
}
}在上述解决方案中,将元素放入频率桶的关键步骤是:
for (int n : freqMap.keySet()) { // 注意这里是 freqMap.keySet()
int freq = freqMap.get(n);
if (bucket[freq] == null) {
bucket[freq] = new ArrayList<>();
}
bucket[freq].add(n);
}有些开发者可能会疑惑,为什么不能直接遍历原始 nums 数组来填充桶,例如:
// 错误的示例:遍历 nums 数组来填充桶
for (int n : nums) { // 这里是 nums 数组
int freq = freqMap.get(n); // 获取元素 n 的频率
if (bucket[freq] == null) {
bucket[freq] = new ArrayList<>();
}
bucket[freq].add(n); // 将元素 n 添加到对应频率的桶中
}原因分析:
哈希映射 freqMap 的键是唯一的,它存储了数组中所有不重复的元素。当我们遍历 freqMap.keySet() 时,我们实际上是在遍历数组中所有不同的元素。对于每个不同的元素 n,我们获取其在 freqMap 中统计出的总频率 freq,然后将这个唯一的元素 n 添加到 bucket[freq] 列表中。这意味着 bucket[freq] 列表最终会包含所有频率为 freq 的不同元素。
然而,如果选择遍历原始 nums 数组,情况就不同了。nums 数组可能包含重复元素。例如,nums = [1, 1, 1, 2, 2, 3]。 当 n = 1 第一次出现时,它会被添加到 bucket[3] 中。 当 n = 1 第二次出现时,它又会被添加到 bucket[3] 中。 当 n = 1 第三次出现时,它还会被添加到 bucket[3] 中。 最终,bucket[3] 可能会变成 [1, 1, 1]。
这会导致以下问题:
因此,为了确保 bucket[freq] 列表中只包含唯一的、具有特定频率的元素,必须遍历 freqMap.keySet()。
通过本文的详细解析,我们不仅掌握了“Top K 频繁元素”问题的桶排序解决方案,更重要的是理解了在构建频率桶时遍历 map.keySet() 的必要性,从而避免了常见的逻辑陷阱。
以上就是精通LeetCode:Top K 频繁元素问题的桶排序解决方案与常见陷阱解析的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号