使用DISTINCT可查询去重,GROUP BY能按字段分组保留唯一记录,DELETE结合JOIN或子查询可删除重复行,最后添加唯一索引防止数据重复。

在MySQL中,去重通常指的是去除查询结果中的重复记录,或者从表中删除重复的数据行。常用的去重方式包括使用 DISTINCT 关键字进行查询去重,以及通过 DELETE 语句结合子查询或临时表来删除重复数据。下面详细介绍几种常见的去重执行过程。
如果只是想在查询时避免重复数据,可以直接使用 DISTINCT 关键字。
- 语法格式:SELECT DISTINCT 列名 FROM 表名 WHERE 条件;
- 示例:假设有一个用户表 users,包含字段 name 和 email,你想查出所有不重复的姓名:
SELECT DISTINCT name FROM users;
这将返回所有唯一的 name 值,重复的只显示一次。
GROUP BY 可以按指定字段分组,常用于配合聚合函数(如 MIN、MAX)实现去重,并可保留某条记录的完整信息。
- 示例:保留每个 name 的最小 id 记录SELECT MIN(id), name, email FROM users GROUP BY name;
这样可以获取每个 name 对应的第一条记录(基于最小 id),达到去重目的。
当表中存在多条完全相同或基于某些字段重复的记录时,需要真正删除冗余数据。
- 步骤一:确认重复数据先查看哪些数据是重复的:
SELECT name, email, COUNT(*) FROM users GROUP BY name, email HAVING COUNT(*) > 1;
- 步骤二:删除重复行(保留最小ID)使用自连接或子查询删除重复项,只保留每组中 id 最小的一条:
DELETE t1 FROM users t1 INNER JOIN users t2 WHERE t1.id > t2.id AND t1.name = t2.name AND t1.email = t2.email;
这条语句会删除所有与另一条记录在 name 和 email 上重复且 id 更大的行。
- 或者使用子查询方式(适用于不支持自删的版本):先创建临时表存储要保留的 id:
CREATE TEMPORARY TABLE temp_ids AS (SELECT MIN(id) AS id FROM users GROUP BY name, email);
然后删除原表中不在临时表里的记录:
DELETE FROM users WHERE id NOT IN (SELECT id FROM temp_ids);
为避免后续插入重复数据,建议对关键字段添加唯一约束。
ALTER TABLE users ADD UNIQUE INDEX idx_unique_name_email (name, email);
这样当程序尝试插入相同 name 和 email 的记录时,数据库会报错阻止插入。
基本上就这些常用方法。DISTINCT 适合查询去重,GROUP BY 适合分析去重,DELETE + 子查询或 JOIN 用于清理脏数据,最后加上唯一索引能有效防止重复积累。操作删除前建议先备份数据,避免误删。
以上就是mysql去重命令怎么执行_mysql去重命令执行详细过程的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号