分组查询需结合聚合函数使用,GROUP BY按字段分组,聚合函数对每组计算,SELECT中非聚合字段必须出现在GROUP BY中,否则报错;用HAVING筛选分组结果,WHERE在分组前过滤可提升效率;为GROUP BY字段建索引加快分组速度,避免加入无关字段导致分组过细,合理使用WHERE缩小数据集以降低开销。

分组查询和聚合函数结合使用是 SQL 中处理统计类需求的核心方法。关键在于理解 GROUP BY 如何将数据划分为逻辑组,再通过聚合函数对每组独立计算结果。要高效使用,需注意语法顺序、索引优化和过滤时机。
正确使用 GROUP BY 与聚合函数
在 SELECT 中出现的非聚合字段必须出现在 GROUP BY 子句中,否则会报错或产生不可预期的结果。聚合函数(如 COUNT、SUM、AVG、MAX、MIN)作用于每一组数据。
例如:统计每个部门的员工数量和平均工资- SELECT dept_id, COUNT(*) AS emp_count, AVG(salary) AS avg_salary
- FROM employees
- GROUP BY dept_id;
这样数据库会按 dept_id 分组,每组独立计算员工数和平均薪资,结果清晰且准确。
用 HAVING 过滤分组结果
WHERE 是在分组前过滤行,而 HAVING 用于分组后筛选满足条件的组。这是提升效率的关键点——避免对无用数据进行聚合计算。
例如:只显示员工数超过 5 人的部门- SELECT dept_id, COUNT(*) AS emp_count
- FROM employees
- GROUP BY dept_id
- HAVING COUNT(*) > 5;
如果先用 WHERE 过滤原始数据,再分组,能进一步减少参与分组的数据量,提升性能。
合理利用索引提升性能
对 GROUP BY 中的字段建立索引,可显著加快分组速度,尤其是大表操作。索引让数据库快速定位和排序分组字段。
- 在 dept_id 上创建索引:CREATE INDEX idx_dept ON employees(dept_id);
- 若同时涉及排序(ORDER BY),复合索引可能更有效
注意:过多索引会影响写入性能,应根据查询频率权衡。
避免常见性能陷阱
不要在 GROUP BY 中加入不必要的字段,否则会导致分组过细,影响效率和结果准确性。例如,错误地加入员工姓名会使每条记录自成一组。
- 错误示例:SELECT dept_id, name, COUNT(*) FROM employees GROUP BY dept_id, name;
- 这等价于未分组,失去统计意义
尽量在聚合前通过 WHERE 减少数据集,比如限定时间范围或状态值,能大幅降低计算开销。
基本上就这些。掌握分组逻辑、善用 HAVING 和索引,就能写出既准确又高效的聚合查询。










