Форум пользователей MySQL

Ганибек · 12.10.2015 14:39:04

Есть таблица coll из 10 полей. Порядка 35 000 000 записей

Есть 3 поля. назовем f1,f2,f3 которые не уникальны, а должны быть таковыми.
Делаю запрос
select f1,f2,f3, count(*) from coll group by f1, f2, f3 having count(*)>1

Обнаружил что отображенное количество count(*) каждого из дубля равно двум.

Соответственно записи обнаруженные этой выборкой надо удалить.

Как это сделать? Простые решения не получаются.

deadka · 12.10.2015 14:47:36

Прочтите до конца
http://sqlinfo.ru/forum/viewtopic.php?id=274

Ганибек · 12.10.2015 15:23:12

У меня чуть другая ситуация, сравнивать надо на дубликаты значений группы полей f1,f2,f3 вместе. Concat делать не вариант, долго слишком
т.е.
есть таблица
f1, f2, f3 f4 ... f10
1/ abc 12 ab xy ........
2/ abc 12 ab az .......

одну (любую) из этих записей надо убить

Ганибек · 12.10.2015 17:17:12

В общем ничего не осталось поделать как выгрузить результаты запроса в другую таблицу, и убить дубликаты сравнением. Как ни странно на 35000000 записей (таблица 2 Гб) затратилось пол секунды. Видимо благодаря индексу на эти 3 поля.

vasya · 12.10.2015 17:35:56

Ещё можно

DELETE t1 FROM coll t1 LEFT JOIN coll t2

ON t1.f1 = t2.f1 AND t1.f2 = t2.f2 AND t1.f3 = t2.f3 AND t1.id < t2.id

WHERE t2.id IS NOT NULL;

удалит из таблицы строки с одинаковыми значениями полей f1,f2,f3 и меньшим id.

Форум пользователей MySQL

#1 12.10.2015 14:39:04

Как удалить дубликат из нескольких полей

#2 12.10.2015 14:47:36

Re: Как удалить дубликат из нескольких полей

#3 12.10.2015 15:23:12

Re: Как удалить дубликат из нескольких полей

#4 12.10.2015 17:17:12

Re: Как удалить дубликат из нескольких полей

#5 12.10.2015 17:35:56

Re: Как удалить дубликат из нескольких полей

Board footer