distinct在sql中的核心作用是去重,其用法需注意以下要点:1. 基本用法为对单列去重,如select distinct city from users; 2. 对多列组合去重时,distinct作用于整行,若字段组合重复则会被去除,但join操作可能导致意外结果;3. 与聚合函数结合使用时,count(distinct city)可统计不同值的数量,误用count(city)则统计非空值;4. 性能上distinct依赖排序,大数据量下会影响效率,可通过group by替代或确认数据无重复时省略;5. 特殊情况中null值视为相同,仅保留一个。使用时应结合业务逻辑避免踩坑。
distinct 在 SQL 中的作用很简单:去重。但怎么用好它,尤其是在复杂查询里不踩坑,还是有一些细节需要注意的。
最简单的场景就是对某一列去重,比如你想查用户表中不同的城市:
SELECT DISTINCT city FROM users;
这样就能返回所有不同的城市名称。注意,distinct 是作用在整个结果行上的,不是只看某一个字段。也就是说,即使你只写了一个字段,数据库也会把整行数据拿来比对是否重复。
小提示:如果字段值是 NULL,distinct 会把多个 NULL 当成一个来处理,在大多数数据库中只会保留一个 NULL 值。
当你想对多个字段组合去重时,很多人直接这么写:
SELECT DISTINCT name, age FROM users;
这确实是对 name 和 age 的组合进行去重。但问题往往出在“你以为这是唯一的组合”,其实可能还有隐藏的重复情况。比如:
name | age |
---|---|
张三 | 25 |
张三 | 25 |
这种情况下,distinct 能正常去掉重复行。但如果这两个字段来自多个表的 join 结果,那就要小心了,因为 join 本身可能会放大行数,导致 distinct 没有达到预期效果。
distinct 最常见的搭配之一就是和 count、sum 等聚合函数一起用。比如统计不同城市的用户数量:
SELECT COUNT(DISTINCT city) FROM users;
这表示统计有多少个不同的城市。如果你不小心写成了:
SELECT COUNT(city) FROM users;
那你统计的就是所有非空 city 的数量,而不是“不同”城市的数量。
注意:有些数据库(如 MySQL)允许你在 GROUP BY 查询中混用未聚合的字段,但这会导致 distinct 不生效或结果不可控,建议养成良好的写法习惯。
虽然 distinct 很方便,但它背后其实是排序 + 去重的过程,尤其在大数据量下会拖慢查询速度。有时候你会发现用了 distinct 反而让结果变少得离谱,其实是逻辑没理清。
什么时候可以避免用 distinct?
基本上就这些。distinct 不复杂,但真正在项目里用的时候,还是要结合业务逻辑和数据结构来看,不然很容易变成“看起来没问题,实际数据错乱”。
以上就是sql 中 distinct 用法_sql 中 distinct 去重技巧的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号