使用COUNT(DISTINCT column_name)可统计某字段去重后的数量,如SELECT COUNT(DISTINCT user_id) FROM orders;对多字段去重可用子查询先DISTINCT再计数,如SELECT COUNT(*) FROM (SELECT DISTINCT name, phone FROM customers) AS tmp;按组统计唯一值则结合GROUP BY,如按部门统计唯一员工数;注意索引优化与NULL值处理,避免在高基数字段频繁去重。

在MySQL中,去重后统计数量是常见的数据处理需求。通常我们希望去除重复记录,再对唯一值进行计数。实现方式主要依赖 DISTINCT 和 GROUP BY,结合 COUNT() 函数完成。
使用 DISTINCT 去重并统计总数
当你只需要统计某个字段的不重复值个数时,可直接使用 COUNT(DISTINCT column_name)。
语法示例:
SELECT COUNT(DISTINCT user_id) AS unique_count FROM orders;
这条语句会统计 orders 表中不同 user_id 的数量,自动忽略重复值。
对多字段组合去重后统计
如果需要根据多个字段联合去重(例如姓名+手机号视为一条唯一记录),可以嵌套子查询先去重,再统计行数。
示例:
SELECT COUNT(*) AS unique_records FROM (SELECT DISTINCT name, phone FROM customers) AS tmp;
这里先通过 DISTINCT name, phone 获取唯一的姓名与电话组合,再对外层结果计数。
使用 GROUP BY 实现分组统计
若需按某一字段分组并统计每组去重后的数量,GROUP BY 更适合。
比如统计每个部门中不同员工的数量:
SELECT department, COUNT(DISTINCT employee_id) AS unique_employees FROM staff GROUP BY department;
这将返回每个部门及其对应的唯一员工数。
注意事项与性能建议
- 对大表使用 DISTINCT 或子查询时,可能影响性能,建议在相关字段上建立索引。
- COUNT(DISTINCT) 不会计算 NULL 值,如有需要,可先用 IFNULL 或 COALESCE 处理。
- 避免在高基数字段(如UUID)上频繁做去重统计,尽量优化查询逻辑或使用缓存。
基本上就这些。掌握 COUNT(DISTINCT) 和子查询结合的方式,能应对大多数去重统计场景。










