Программа\скрипт для Поиска дублей

Закрыт2 заявки212 просмотров

Итак, на входе 2 csv файла с нным кол-вом столбцов, разделенные запятыми или точка с запятой,

1 input file — основной

2 input file — дополнительный

Программа берет поочередно, сначала первую фразу из 1 input file из столбца PhraseYD и плюс к ней ВЕСЬ набор фраз из 2 input file. Проверяет на морфологическое совпадение (слова, слову, словам). Если все остальные из 2 input file определены как морфологические дубли, то они помечаются как Yes в столбце csv DoubleYD, потом отправляет так же следующую фразу из 1 input file. И так далее.

Это функция поиска дублей между 2мя файлами. Вторая функция — поиск дублей внутри одного файла по этому же принципу, первая фраза сравнивается с последующими, потом вторая фраза с последующими.

Объем большой, скорость важна.

Нужно использовать морфологию Яндекс mystem http://company.yandex.ru/technologies/mystem

Плюс должен быть файл с минус словами в папке со программой, будет подгружаться при загрузке.

13 лет назад

Сергей

44 года

17 лет в сервисе

Был

12 лет назад

181 отзыв(-2)

Выбранный исполнитель

Дмитрий Петелин

52 года

17 лет в сервисе

Был

4 года назад

7 отзывов

13 лет назад

$20

1 день

Заявки фрилансеров

Дмитрий Петелин

52 года

17 лет в сервисе

Был

4 года назад

7 отзывов

13 лет назад

Похожие заказы
Одеть PSD на Shop Script
$100
Всем привет! Что нужно: 1) Собственно сверстать и одеть PSDшку 2) На странице товара – при наведении мышки на фото товара (нажимать не надо – просто mouseover) ...
Веб-программирование1 заявка
Закрыт
13 лет назад
Настроить редирект на сайте, убрать дубли
Требуется настроить редирект на сайте, убрать дубли. Админка самописная. Ждем от Вас примерные цены.
Веб-программирование1 исполнитель
Завершен
13 лет назад
Дополнение к скрипту
Приветствую! Есть слайшоу, работающее по клику на каждый его элемент - http://openini.by/doors/barausse/palladio.html (см.пагинацию). Требуется настроить поочерёдное цикличное пролистывание слайдера на странице с сохранением переходов по пагинаци (подсветка стрелочки - ...
Веб-программирование1 исполнитель
Завершен
13 лет назад
Доработка вопросов/ответов. Приватно для BOB41K
$117
Над сделать так, чтобы была разбивка по производителям для модуля http://www.sorem.ru/vopros-otvet.html
Веб-программирование1 исполнитель
Завершен
13 лет назад
Настроить магазин на OsCommerrce
Все доброго дня, нужен человек хорошо разбирающийся в OsCommerrce... нужно настроить магазин подробности в icq: : 2654949 цена и срок .. жду предложений (фрилансеры только с отзывами)
Веб-программирование1 исполнитель
Закрыт
13 лет назад
Битрикс: верстка и программирование магазина
- верстка - програминг ---------------------------- тз пишу. ---------------------------- оставляйте контакты, как допишу – скину! ---------------------------- от вас ответственность, нормальные цены, icq или skype
Веб-программирование1 заявка
Закрыт
13 лет назад
Необходимо написать компонент для Joomla
Необходимо написать компонент под Joomla 1.7 "Представители по Украине". С помощью данного компонента можно будет добавлять представителей со следующим уровнем вложенности: - Область - Город - Представитель ...
Joomla
Веб-программирование3 заявки
Закрыт
13 лет назад
Установка цмс
Грамотно установить цмс вордпресс, готов рассмотреть и другие варианты. Вёрска пока не сделана, предпочтительно найти специалиста, который сделает вёрстку и установит цмс. Есть и другие проекты, которое готов предложить ...
WordPress
Веб-программирование10 заявок
Закрыт
13 лет назад
Вывести на сайт аналитику Google
$50
Необходимо сделать вывод на сайте аналитики Google. Верстка будет предоставлена.
Веб-программирование1 заявка
Закрыт
13 лет назад
Студия тюнинга automall66.ru
$1000
Требуется человек для доработки интернет-магазина автомобильных аксессуаров
Веб-программирование7 заявок
Закрыт
13 лет назад