sql删除重复数据的详细方法

php中文网
发布: 2016-06-07 16:22:00
原创
1860人浏览过

重复数据,通常有两种:一是完全重复的记录,也就是所有字段的值都一样;二是部分字段值重复的记录。 一. 删除完全重复的记录 完全重复的数据,通常是由于没有设置主键/唯一键约束导致的。 测试数据: if OBJECT_ID('duplicate_all') is not null drop table

   重复数据,通常有两种:一是完全重复的记录,也就是所有字段的值都一样;二是部分字段值重复的记录。

  一. 删除完全重复的记录

  完全重复的数据,通常是由于没有设置主键/唯一键约束导致的。

  测试数据:

MVM mall 网上购物系统
MVM mall 网上购物系统

采用 php+mysql 数据库方式运行的强大网上商店系统,执行效率高速度快,支持多语言,模板和代码分离,轻松创建属于自己的个性化用户界面 v3.5更新: 1).进一步静态化了活动商品. 2).提供了一些重要UFT-8转换文件 3).修复了除了网银在线支付其它支付显示错误的问题. 4).修改了LOGO广告管理,增加LOGO链接后主页LOGO路径错误的问题 5).修改了公告无法发布的问题,可能是打压

MVM mall 网上购物系统 0
查看详情 MVM mall 网上购物系统

  if OBJECT_ID('duplicate_all') is not null

  drop table duplicate_all

  GO

  create table duplicate_all

  (

  c1 int,

  c2 int,

  c3 varchar(100)

  )

  GO

  insert into duplicate_all

  select 1,100,'aaa' union all

  select 1,100,'aaa' union all

  select 1,100,'aaa' union all

  select 1,100,'aaa' union all

  select 1,100,'aaa' union all

  select 2,200,'bbb' union all

  select 3,300,'ccc' union all

  select 4,400,'ddd' union all

  select 5,500,'eee'

  GO

  (1) 借助临时表

  利用DISTINCT得到单条记录,删除源数据,然后导回不重复记录。

  如果表不大的话,可以把所有记录导出一次,然后truncate表后再导回,这样可以避免delete的日志操作。

  if OBJECT_ID('tempdb..#tmp') is not null

  drop table #tmp

  GO

  select distinct * into #tmp

  from duplicate_all

  where c1 = 1

  GO

  delete duplicate_all where c1 = 1

  GO

  insert into duplicate_all

  select * from #tmp

  (2) 使用ROW_NUMBER

  with tmp

  as

  (

  select *,ROW_NUMBER() OVER(PARTITION BY c1,c2,c3 ORDER BY(getdate())) as num

  from duplicate_all

  where c1 = 1

  )

  delete tmp where num > 1

  如果多个表有完全重复的行,可以考虑通过UNION将多个表联合,插到一个新的同结构的表,SQL Server会帮助去掉表和表之间的重复行。

  二. 删除部分重复的记录

  部分列重复的数据,通常表上是有主键的,可能是程序逻辑造成了多行数据列值的重复。

  测试数据:

  if OBJECT_ID('duplicate_col') is not null

  drop table duplicate_col

  GO

  create table duplicate_col

  (

  c1 int primary key,

  c2 int,

  c3 varchar(100)

  )

  GO

  insert into duplicate_col

  select 1,100,'aaa' union all

  select 2,100,'aaa' union all

  select 3,100,'aaa' union all

  select 4,100,'aaa' union all

  select 5,500,'eee'

  GO

  (1) 唯一索引

  唯一索引有个忽略重复建的选项,,在创建主键约束/唯一键约束时都可以使用这个索引选项。

  if OBJECT_ID('tmp') is not null

  drop table tmp

  GO

  create table tmp

  (

  c1 int,

  c2 int,

  c3 varchar(100),

  constraint UQ_01 unique(c2,c3) with(IGNORE_DUP_KEY = ON)

  )

  GO

  insert into tmp

  select * from duplicate_col

  select * from tmp

  (2) 借助主键/唯一键来删除

  通常会选择主键/唯一键的最大/最小值保留,其他行删除。以下只保留重复记录中c1最小的行。

  delete from duplicate_col

  where exists(select 1 from duplicate_col b where duplicate_col.c1 > b.c1 and (duplicate_col.c2 = b.c2 and duplicate_col.c3 = b.c3))

  --或者

  delete from duplicate_col

  where c1 not in (select min(c1) from duplicate_col group by c2,c3)

  如果要保留重复记录中的第N行,可以参考05.取分组中的某几行。

  (3) ROW_NUMBER

  和删除完全重复记录的写法基本一样。

  with tmp

  as

  (

  select *,ROW_NUMBER() OVER(PARTITION BY c2,c3 ORDER BY(getdate())) as num

  from duplicate_col

  )

  delete tmp where num > 1

  select * from duplicate_col

最佳 Windows 性能的顶级免费优化软件
最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号