首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 数据库 > Mysql >

怎么用MYSQL删除表中重复数据

2013-10-10 
如何用MYSQL删除表中重复数据?通常情况下,一个我们在做一个产品的时候,一开始可能由于设计考虑不周或者程

如何用MYSQL删除表中重复数据

?通常情况下,一个我们在做一个产品的时候,一开始可能由于设计考虑不周或者程序写的不够严谨,某个字段上的值产生重复了,但是又必须去掉,这个时候就稍微麻烦了一点,直接加一个?UNIQUE KEY?肯定是不行了,因为会报错。
?现在,我们来采用一种变通的办法,不过可能会丢失一些数据 :)

?在这里,我们设定一个表,其结构如下:

mysql> desc `user`;+-------+------------------+------+-----+---------+----------------+| Field | Type             | Null | Key | Default | Extra          |+-------+------------------+------+-----+---------+----------------+| id    | int(10) unsigned | NO   | PRI | NULL    | auto_increment || name  | char(10)         | NO   |     |         |                || extra | char(10)         | NO   |     |         |                |+-------+------------------+------+-----+---------+----------------+

?原来表中的数据假定有以下几条:

mysql> SELECT * FROM `user`;+----+-------+--------+| id | name  | extra  |+----+-------+--------+|  1 | user1 | user1  ||  2 | user2 | user2  ||  3 | user3 | user3  ||  4 | user4 | user4  ||  5 | user5 | user5  ||  6 | user3 | user6  ||  7 | user6 | user7  ||  8 | user2 | user8  ||  9 | USER2 | user9  || 10 | USER6 | user10 |+----+-------+--------+

1、将原来的数据导出

mysql>SELECT * INTO OUTFILE '/tmp/user.txt' FROM `user`;

2、清空数据表

mysql>TRUNCATE TABLE `user`;

3、创建唯一索引,并且修改 `name` 字段的类型为?BINARY CHAR?区分大小写

mysql> ALTER TABLE `user` MODIFY `name` CHAR(10) BINARY NOT NULL DEFAULT '';mysql> ALTER TABLE `user` ADD UNIQUE KEY ( `name` );

现在来看看新的表结构:

mysql> desc user;+-------+------------------+------+-----+---------+----------------+| Field | Type             | Null | Key | Default | Extra          |+-------+------------------+------+-----+---------+----------------+| id    | int(10) unsigned | NO   | PRI | NULL    | auto_increment || name  | char(10)         | NO   | UNI |         |                || extra | char(10)         | NO   |     |         |                |+-------+------------------+------+-----+---------+----------------+

4、把数据导回去,在这里,有两种选择:新的重复记录替换旧的记录,只保留最新的记录?或者是?新的记录略过,只保留最旧的记录

mysql> LOAD DATA INFILE '/tmp/user.txt' REPLACE INTO TABLE `user`;Query OK, 10 rows affected (0.00 sec)Records: 8  Deleted: 2  Skipped: 0  Warnings: 0mysql> SELECT * FROM USER;+----+-------+--------+| id | name  | extra  |+----+-------+--------+|  1 | user1 | user1  ||  8 | user2 | user8  ||  6 | user3 | user6  ||  4 | user4 | user4  ||  5 | user5 | user5  ||  7 | user6 | user7  ||  9 | USER2 | user9  || 10 | USER6 | user10 |+----+-------+--------+

?上面是采用?REPLACE?的方式,可以看到,导入过程中删掉了两条数据,结果验证确实是?新的重复记录替换旧的记录,只保留最新的记录
?现在,来看看用?IGNORE?的方式:

mysql> LOAD DATA INFILE '/tmp/user.txt' IGNORE INTO TABLE `user`;Query OK, 6 rows affected (0.01 sec)Records: 8  Deleted: 0  Skipped: 2  Warnings: 0mysql> SELECT * FROM USER;+----+-------+--------+| id | name  | extra  |+----+-------+--------+|  1 | user1 | user1  ||  2 | user2 | user2  ||  3 | user3 | user3  ||  4 | user4 | user4  ||  5 | user5 | user5  ||  7 | user6 | user7  ||  9 | USER2 | user9  || 10 | USER6 | user10 |+----+-------+--------+

?看到了吧,确实是?新的记录略过,只保留最旧的记录

?

?

查询时去重:

mysql 去除重复 Select中DISTINCT关键字的用法?

在使用mysql时,有时需要查询出某个字段不重复的记录,虽然mysql提供 有distinct这个关键字来过滤掉多余的重复记录只保留一条,但往往只用它来返回不重复记录的条数,而不是用它来返回不重记录的所有值。其原因是 distinct只能返回它的目标字段,而无法返回其它字段,这个问题让我困扰了很久,用distinct不能解决的话,我只有用二重循环查询来解决,而 这样对于一个数据量非常大的站来说,无疑是会直接影响到效率的。所以我花了很多时间来研究这个问题,网上也查不到解决方案,期间把容容拉来帮忙,结果是我 们两人都郁闷了。。。。。。。。。

下面先来看看例子:

???? table
?? id name
?? 1 a
?? 2 b
?? 3 c
?? 4 c
?? 5 b

库结构大概这样,这只是一个简单的例子,实际情况会复杂得多。

比如我想用一条语句查询得到name不重复的所有数据,那就必须使用distinct去掉多余的重复记录。

select distinct name from table
得到的结果是:

?? name
?? a
?? b
?? c

好像达到效果了,可是,我想要得到的是id值呢?改一下查询语句吧:

select distinct name, id from table

结果会是:

?? id name
?? 1 a
?? 2 b
?? 3 c
?? 4 c
?? 5 b

distinct怎么没起作用?作用是起了的,不过他同时作用了两个字段,也就是必须得id与name都相同的才会被排除。。。。。。。

我们再改改查询语句:

select id, distinct name from table

很遗憾,除了错误信息你什么也得不到,distinct必须放在开头。难到不能把distinct放到where条件里?能,照样报错。。。。。。。

很麻烦吧?确实,费尽心思都没能解决这个问题。没办法,继续找人问。

拉住公司里一JAVA程序员,他给我演示了oracle里使用distinct之后,也没找到mysql里的解决方案,最后下班之前他建议我试试group by。

试了半天,也不行,最后在mysql手册里找到一个用法,用group_concat(distinct name)配合group by name实现了我所需要的功能,兴奋,天佑我也,赶快试试。

报错。。。。。。。。。。。。郁闷。。。。。。。连mysql手册也跟我过不去,先给了我希望,然后又把我推向失望,好狠哪。。。。

再仔细一查,group_concat函数是4.1支持,晕,我4.0的。没办法,升级,升完级一试,成功。。。。。。

终于搞定了,不过这样一来,又必须要求客户也升级了。

突然灵机一闪,既然可以使用group_concat函数,那其它函数能行吗?

赶紧用count函数一试,成功,我。。。。。。。想哭啊,费了这么多工夫。。。。。。。。原来就这么简单。。。。。。

现在将完整语句放出:

select *, count(distinct name) from table group by name

结果:

?? id name count(distinct name)
?? 1 a 1
?? 2 b 1
?? 3 c 1

最后一项是多余的,不用管就行了,目的达到。。。。。

唉,原来mysql这么笨,轻轻一下就把他骗过去了,郁闷也就我吧(对了,还有容容那家伙),现在拿出来希望大家不要被这问题折腾。

哦,对,再顺便说一句,group by 必须放在 order by 和 limit之前,不然会报错。。。。。。。。!OK了

?

本文来自CSDN博客,转载请标明出处:http://blog.csdn.net/guocuifang655/archive/2009/03/16/3993612.aspx

热点排行