0

0

mysql去重脚本怎么编写_mysql去重脚本编写详细教程

爱谁谁

爱谁谁

发布时间:2025-11-23 13:49:02

|

802人浏览过

|

来源于php中文网

原创

答案:MySQL去重需先识别重复数据,再安全删除冗余记录。以email为判断依据时,可用SELECT email, COUNT() FROM users GROUP BY email HAVING COUNT() > 1查询重复;MySQL 8.0+推荐使用ROW_NUMBER()窗口函数配合DELETE与CTE删除重复项,保留id最小的记录;低版本可采用自连接DELETE u1 FROM users u1, users u2 WHERE u1.email = u2.email AND u1.id > u2.id实现;也可通过临时表保存MIN(id)并删除原表不在临时表中的数据;去重后应添加ALTER TABLE users ADD UNIQUE INDEX idx_email_unique (email)防止未来重复;操作前必须备份表CREATE TABLE users_backup AS SELECT * FROM users,并在测试环境验证,生产环境低峰期执行。

mysql去重脚本怎么编写_mysql去重脚本编写详细教程

在MySQL中处理重复数据是日常数据库维护中的常见需求。编写一个有效的去重脚本,关键在于准确识别重复记录,并安全地保留一条有效数据,同时删除冗余项。下面详细介绍几种实用的MySQL去重方法,适用于不同场景。

1. 确定重复数据的标准

去重前要明确“什么是重复”。通常基于一个或多个字段判断,比如手机号、邮箱、用户名等唯一标识。

示例:假设有一张用户表 users,结构如下:

CREATE TABLE users (
    id INT AUTO_INCREMENT PRIMARY KEY,
    name VARCHAR(50),
    email VARCHAR(100)
);

我们以 email 字段作为判断重复的依据。

2. 查看重复数据条目

先查询哪些 email 出现了多次:

SELECT email, COUNT(*) as cnt
FROM users
GROUP BY email
HAVING cnt > 1;

这一步帮助你评估去重范围,避免误删。

3. 使用 ROW_NUMBER() 删除重复(推荐方式)

MySQL 8.0+ 支持窗口函数,可高效去重。思路是为每组重复数据编号,只保留编号为1的记录。

创建临时表或使用 CTE(公用表表达式):

DELETE t1 FROM users t1
INNER JOIN (
    SELECT 
        id,
        ROW_NUMBER() OVER (PARTITION BY email ORDER BY id) as rn
    FROM users
) t2 ON t1.id = t2.id
WHERE t2.rn > 1;

说明:

造梦阁AI
造梦阁AI

AI小说推文一键成片,你的故事值得被看见

下载
  • PARTITION BY email:按 email 分组
  • ORDER BY id:保留最早插入的记录(id最小)
  • ROW_NUMBER() > 1 的记录会被删除

4. 兼容低版本 MySQL 的去重方法

对于 MySQL 5.7 及以下版本,不支持窗口函数,可用自连接或临时表方式。

方法一:自连接删除

DELETE u1 FROM users u1, users u2
WHERE u1.email = u2.email AND u1.id > u2.id;

逻辑:保留 id 较小的记录,删除相同 email 中 id 更大的。

方法二:利用临时表

-- 创建临时表保存去重后的数据
CREATE TEMPORARY TABLE temp_users AS
SELECT MIN(id) as id, email
FROM users
GROUP BY email;

-- 删除原表数据 DELETE FROM users WHERE id NOT IN (SELECT id FROM temp_users);

注意:该方法会一次性删除所有不在临时表中的记录,操作前建议备份。

5. 添加唯一索引防止未来重复

去重完成后,建议添加唯一约束,防止数据再次重复:

ALTER TABLE users ADD UNIQUE INDEX idx_email_unique (email);

后续插入重复 email 时会报错,强制程序处理重复逻辑。

6. 安全操作建议

  • 执行去重前务必先备份表:CREATE TABLE users_backup AS SELECT * FROM users;
  • 在测试环境验证脚本逻辑
  • 小批量数据可先用 SELECT 验证匹配结果
  • 生产环境建议在低峰期操作

基本上就这些。根据你的 MySQL 版本和业务需求选择合适的方法。核心原则是:先查再删,保留关键记录,操作留痕。

相关专题

更多
mysql修改数据表名
mysql修改数据表名

MySQL修改数据表:1、首先查看数据库中所有的表,代码为:‘SHOW TABLES;’;2、修改表名,代码为:‘ALTER TABLE 旧表名 RENAME [TO] 新表名;’。php中文网还提供MySQL的相关下载、相关课程等内容,供大家免费下载使用。

662

2023.06.20

MySQL创建存储过程
MySQL创建存储过程

存储程序可以分为存储过程和函数,MySQL中创建存储过程和函数使用的语句分别为CREATE PROCEDURE和CREATE FUNCTION。使用CALL语句调用存储过程智能用输出变量返回值。函数可以从语句外调用(通过引用函数名),也能返回标量值。存储过程也可以调用其他存储过程。php中文网还提供MySQL创建存储过程的相关下载、相关课程等内容,供大家免费下载使用。

246

2023.06.21

mongodb和mysql的区别
mongodb和mysql的区别

mongodb和mysql的区别:1、数据模型;2、查询语言;3、扩展性和性能;4、可靠性。本专题为大家提供mongodb和mysql的区别的相关的文章、下载、课程内容,供大家免费下载体验。

281

2023.07.18

mysql密码忘了怎么查看
mysql密码忘了怎么查看

MySQL是一个关系型数据库管理系统,由瑞典MySQL AB 公司开发,属于 Oracle 旗下产品。MySQL 是最流行的关系型数据库管理系统之一,在 WEB 应用方面,MySQL是最好的 RDBMS 应用软件之一。那么mysql密码忘了怎么办呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

514

2023.07.19

mysql创建数据库
mysql创建数据库

MySQL是一个关系型数据库管理系统,由瑞典MySQL AB 公司开发,属于 Oracle 旗下产品。MySQL 是最流行的关系型数据库管理系统之一,在 WEB 应用方面,MySQL是最好的 RDBMS 应用软件之一。那么mysql怎么创建数据库呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

253

2023.07.25

mysql默认事务隔离级别
mysql默认事务隔离级别

MySQL是一种广泛使用的关系型数据库管理系统,它支持事务处理。事务是一组数据库操作,它们作为一个逻辑单元被一起执行。为了保证事务的一致性和隔离性,MySQL提供了不同的事务隔离级别。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

386

2023.08.08

sqlserver和mysql区别
sqlserver和mysql区别

SQL Server和MySQL是两种广泛使用的关系型数据库管理系统。它们具有相似的功能和用途,但在某些方面存在一些显著的区别。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

528

2023.08.11

mysql忘记密码
mysql忘记密码

MySQL是一种关系型数据库管理系统,关系数据库将数据保存在不同的表中,而不是将所有数据放在一个大仓库内,这样就增加了速度并提高了灵活性。那么忘记mysql密码我们该怎么解决呢?php中文网给大家带来了相关的教程以及其他关于mysql的文章,欢迎大家前来学习阅读。

599

2023.08.14

Golang gRPC 服务开发与Protobuf实战
Golang gRPC 服务开发与Protobuf实战

本专题系统讲解 Golang 在 gRPC 服务开发中的完整实践,涵盖 Protobuf 定义与代码生成、gRPC 服务端与客户端实现、流式 RPC(Unary/Server/Client/Bidirectional)、错误处理、拦截器、中间件以及与 HTTP/REST 的对接方案。通过实际案例,帮助学习者掌握 使用 Go 构建高性能、强类型、可扩展的 RPC 服务体系,适用于微服务与内部系统通信场景。

8

2026.01.15

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号