Интернет-магазину "Обвал Цен" требуется помощь серьезного разработчика с большим опытом работы с базами данных. Наши карточки товаров импортируются со стороннего ресурса, а затем проходят автоматическую прогонку через машинный перевод Промт.

Чтобы улучшить качество текстов, мы хотим ввести новый скрипт, который позволял бы заменять определенные словосочетания при переводе в Промте на наш вариант. Для этого в первую очередь нужно, чтобы скрипт находил по задаваемым нами параметрам словосочетания. При повторном использовании скрипт должен учитывать минус-словосочетания, то есть те слова и фразы, которые уже были найдены в предыдущий раз и отмечены как переведенные.

В целом алгоритм требуемых действий должен выглядеть так :

1. Сканирование большого объема текстовой информации по частотности нахождения словосочетаний в тексте. Нужно, чтобы можно было задавать параметр фильтруемых словосочетаний по количеству включаемых при поиске слов. Например, от 2 до 5 слов или от 2 до 4, где 1 слово - идущие подряд буквенные или числовые значения без пробела.

2. Выгрузка найденных топ словосочетаний в Excel файл

3. Учет списка слов или словосочетаний, которые не нужно учитывать при следующей фильтрации текста

Размеры обрабатываемых данных: очень большие, текстовый файл txt весит больше 50МБ

Формат скрипта: желательно PHP

Тип базы данных:MySQL

Сроки работы: 1-3 дня

11 лет назад
ObvalCen2
47 лет
11 лет в сервисе
Был
11 лет назад

Заявки фрилансеров

Нет заявок фрилансеров
  • Похожие заказы

  • Есть американская программка финансового учета Quickbookshttp://prntscr.com/2dplvy. Она не позволяет вводить информацию русскими буквами. А именно происходит это вот так http://prntscr.com/2dpl98 при вооде информации все хорошо, но как только нажимаешь ENTER, данные отображаются вот таким ...

    Базы данных2 заявки
    Закрыт
    11 лет назад
  • Необходимо создать десктопный вариант программы, который подключаясь к уже имеющейся БД сайта позволит как можно легче находить соответствия между товарами для объединения в один. Имеется в виду один и тот же товар у разных поставщиков ...

    Базы данных2 заявки
    Закрыт
    11 лет назад
  • Крупная сеть розничной торговли продуктами питания приглашает на работу IT-специалиста (г. Харьков) Требования: - высшее профильное образование; - опыт работы Разработчиком на проектах с использованием Delphi, Oracle; - опыт ...

    Базы данныхнет заявок
    Закрыт
    11 лет назад
  • Дано. Знаки + и -. Это исходы спортивных событий. Требуется написать скрипт, или с помощью экселя, делать анализ данных, с помощью определенного правила, для подсчёта серий из проигрышей. Максимальные и другие серии. ...

    Базы данных1 исполнитель
    Завершен
    11 лет назад
  • $50

    Требования по проектированию БД и написанию курсовой работе по предмету «Базы и банки данных» Требования по разработке базы данных: * минимум 5 таблиц (таблицы должны находится в 3НФ или ...

    Базы данных3 заявки
    Закрыт
    11 лет назад