Есть таблица mysql в ней есть колонка megasup с текстом (статьями), а так же есть колонка tom (название тома). Всего уникальных томов около 1000, необходимо пройтись по каждому тому (колонка tom) и удалить дубликаты строчек в таблице (дубликаты по содержимому колонки megasup, по сути дубликаты статей встречающихся в пределах одного tom, один экземпляр дубликата оставляем). Дубликатом будем считать тогда, когда первые 200 статьи идентичны, при этом мы не учитываем встречающиеся теги html (

и
- они в одинаковых статьях могут быть на разных местах, но от этого статьи не перестают быть одинаковыми), разность в переносе строк, пробелы, т.е. учитываем только одинаковость последовательности символов, т.к. форматирование (перенос строк) может быть не идентична при идентичности статей.

Т.е. к примеру запускаем скрипт, он берет первое значение колонки tom "ааа" и проходит все строчки таблицы с этим значением tom и если по колонке megasup встречаются дубликаты, то оставляем только один из них.

У скрипта необходимо прикрутить онлайн мониторинг, чтобы понятно было какой tom на данный момент проходим, когда проверен очередной tom на наличие дубликатов.

Работа на субботу. Завтра с 11:00 до 13:00 в онлайне и хотелось бы определиться с исполнителем по проекту и все вопросы, которые могут у вас возникнуть.

15 лет назад
Borodach
Олег 
42 года
18 лет в сервисе
Был
3 года назад

Выбранный исполнитель

weblands
Евгений 
46 лет
15 лет в сервисе
Был
12 лет назад
34 отзыва
15 лет назад
$20
1 день
Скрипт сделан в самые сжатые сроки. Уже не первый раз работаем с Евгением, и в очередной раз представился случай убедиться в его профессионализме и надежности, в чем успешно и убедился )
Работаем не первый раз. Всегда четкой тз, своевременная оплата. Приятно работать с человеком, который четко знает, что ему нужно. Надеюсь на дальнейшее сотрудничество...

Заявки фрилансеров

weblands
Евгений 
46 лет
15 лет в сервисе
Был
12 лет назад
34 отзыва
15 лет назад