SQL 如何检测重复数据？

冷炫風刃

发布时间：2026-01-25 14:43:02

216人浏览过

来源于php中文网

原创

最直接找重复行的方法是GROUP BY+HAVING：按疑似重复字段分组，用HAVING COUNT(*)>1筛选重复组；若需列出所有重复行，可用ROW_NUMBER()窗口函数标记并过滤rn>1的记录。

sql 如何检测重复数据？

用 GROUP BY + HAVING 找出重复的行

最直接的办法是把可能重复的字段组合起来分组，再统计每组出现次数。只要数量大于 1，就是重复数据。

GROUP BY 后面跟的是你怀疑会重复的列，比如 email、user_id 或多个字段组合（如 first_name, last_name）
HAVING COUNT(*) > 1 是关键：它在分组后过滤，只保留重复组；WHERE 不能用在这里，因为它在分组前执行
如果想看具体哪些行重复，可以再用子查询或 JOIN 关联原表，否则 GROUP BY 只返回每组一条汇总结果

示例：查出所有重复的邮箱

SELECT email, COUNT(*) AS cnt
FROM users
GROUP BY email
HAVING COUNT(*) > 1;

用窗口函数 ROW_NUMBER() 标记重复记录

当你要完整列出所有重复行（包括区分“第几次出现”），ROW_NUMBER() 比 COUNT() 更灵活。它按指定顺序给每行编号，相同值的行会得到不同序号，方便筛选或去重。

必须配合 PARTITION BY 使用，分区字段就是你判断重复的依据（如 email）
ORDER BY 在每个分区内决定编号顺序，建议用主键或时间字段，避免结果不稳定
重复行的 ROW_NUMBER() 值会是 2、3、4… 所以 WHERE rn > 1 就能选出所有“非首次出现”的重复行

示例：标记并查出所有重复邮箱的后续记录

SELECT *
FROM (
  SELECT *,
         ROW_NUMBER() OVER (PARTITION BY email ORDER BY id) AS rn
  FROM users
) t
WHERE t.rn > 1;

用 EXISTS 或 IN 快速判断某条记录是否重复

如果你只是想校验单条记录（比如插入前检查），没必要扫全表。用 EXISTS 效率更高，尤其有索引时。

降重鸟

要想效果好，就用降重鸟。AI改写智能降低AIGC率和重复率。

下载

EXISTS 只要找到一条匹配就返回 true，不遍历全部；IN 遇到 NULL 或子查询结果为空时行为易出错，优先选 EXISTS
确保被查字段（如 email）上有索引，否则即使语句对，性能也会骤降
注意 WHERE 条件里别漏掉排除自身的逻辑，比如插入新用户时，要排除 id != ? 这类条件，否则自己总会“查到自己”

示例：检查邮箱 'test@example.com' 是否已存在（且不是当前正在编辑的用户）

SELECT EXISTS (
  SELECT 1 FROM users 
  WHERE email = 'test@example.com' 
    AND id != 123
) AS is_duplicate;

唯一约束比查询更可靠，但无法回溯历史重复

靠 SQL 查询找重复，本质是补救。真正防重复，得靠数据库层约束。不过加约束前必须先清理已有重复，否则会失败。

ALTER TABLE users ADD CONSTRAINT uk_email UNIQUE (email) 是最常用方式；MySQL 中叫 UNIQUE KEY，PostgreSQL 和 SQL Server 类似
如果字段允许 NULL，多数数据库认为多个 NULL 不违反唯一约束——这点常被忽略，导致“看似加了约束，还是插进去了多条空邮箱”
复合唯一约束（如 (category_id, sort_order)）很常见，但要注意字段顺序和索引效率，尤其是高并发写入场景

加约束前务必先跑一遍 GROUP BY 查重，不然 ALTER TABLE 会直接报错中断。

SQL 四种隔离级别分别解决什么？

SQL 复合索引的最左前缀原则详解

SQL EXPLAIN 输出字段逐项解析

SQL CTE 是否会被物化？

SQL 中字符串比较是否区分大小写？

相关标签:

mysql go ai 邮箱 sql mysql NULL count 并发 table postgresql 数据库

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：SQL 如何实现区间累计统计？下一篇：暂无

作者最新文章

如何让 json.dumps 序列化时保持 dict 插入顺序

2026-01-24 17:13

mdadm resync=DELAYED 的强制继续同步参数与风险

2026-01-24 17:19

fastapi 如何实现 WebSocket 断线重连的客户端示例

2026-01-24 17:27

Windows 10 激活怎么做？Windows 10 激活方法说明

2026-01-24 17:33

SQL 使用 CTE 提升可维护性

2026-01-24 17:35

如何实现一个支持 getitem 和切片的自定义序列类

2026-01-24 17:48

如何让对象支持 weakref.proxy 但自定义代理行为

2026-01-24 17:56

AO3进不去怎么解决 ao3一直加载不出来怎么办

2026-01-24 17:57

俄罗斯引擎官方入口在哪里俄罗斯引擎官方入口搜索

2026-01-24 17:58

如何查询苹果手机的真伪和激活日期？

2026-01-24 17:58

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PC软件

相关专题

数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍：1、Excel，具有强大的计算和数据处理功能；2、SQL，可以进行数据查询、过滤、排序、聚合等操作；3、Python，拥有丰富的数据分析库；4、R，拥有丰富的统计分析库和图形库；5、Tableau，提供了直观易用的用户界面等等。

686

2023.10.12