Есть кусок кода на перле.

Необходимо переписать две функции – wcomb и mkdict

Остальные функции не несут смысловой нагрузки.

В целом, данный скрипт выдран из бОльшего скрипта. Он предназначен для парсинга текста, и делает из него словарь.

Функцию парсинга текста get_text я вырезал за ненадобностью, т.к. текст будет браться либо из локального файла, либо закачиваться с компьютера.

Функция form_sents, видимо, убирает лишние символы.

Функция wcomb собирает из текста словосочетания из двух слов, если в тексте они встречаются N-ное кол-во раз, и помещает в файл WC. (wc_bwords.cfg – это, похоже, список стоп-слов)

Функция mkdict, собстственно, создает словарь. Вначале выполняется внешняя программа tagger, и сохраняет в файл с расширением «.tagg». Из созданного tag-файла парсятся части речи и складываются в соответствующие файлы: RB NN NNS VB VBN VBG JJ JJR. В заключение, на основе этих файлов и tagg-файла создаются так называемые темплейты.

Примеры файлов находятся в аттаче в папке dict.

Данный скрипт надо переписать и оформить в работающий скрипт на PHP или Python (Perl не желателен, предпочтителен PHP). Программа tagger будет находиться физически на том же сервере. Скрипт должен иметь простейший интерфейс, посредством которого можно будет указать путь до tagger’а, откуда брать текст (локальный файл, с компьютера или http), название созданного словаря (папка, в которой будут файлы, сейчас это dict). По окончании работы скрипта должно быть соответствующее извещение, название словаря, размер (кол-во строк) файлов RB NN NNS VB VBN VBG JJ JJR WC TMPL

Желательно реализовать таким образом, чтобы при закрытии страницы (кроме случая, когда файл в процессе загрузки с компьютера) скрипт продолжал работать.

15 лет назад
LeXs-work
17 лет в сервисе
Был
15 лет назад

Заявки фрилансеров

Нет заявок фрилансеров
  • Похожие заказы

  • Дана матрица X*Y ее элементы частично заполнены некими значениями Надо переставить значение из рандомной n-ной строки в m-ную этого же столбца на свободное место (если место занято, то итерацию повторить с другой строкой), ...

    Завершен
    15 лет назад
  • $35

    Нужно сегодня максимально быстро натянуть шаблон на готовый интернет магазин, структура сайта остается практически не изменная, меняется только графика, шаблоне не сложный. Оплата 1000р, Яндекс.Деньги

    Закрыт
    15 лет назад
  • $500

    Добрый день, Есть работа для PHP программиста в Санкт-Петербурге. Задача - доработка 2х порталов. Проект интересный и динамичный. От вас необходим опыт работы и способность разобраться в коде. Оплата сдельная, 1500 ...

    Закрыт
    15 лет назад
  • 1.Позволить восстанавливать пароль автору без указания секретного вопроса. Коментами указать в скрипте «старый вариант» дабы к нему в будущем вернуться . (В настоящий момент предусмотрено восстановление пароля только при ...

    Завершен
    15 лет назад
  • $1000

    Тз в приложении пишите цену без дизайна и без лицензии можете только написать какая лицензия понадобится и почем битрикс ее продает в общем покажите примеры работ на битриксе а ...

    Закрыт
    15 лет назад
  • Нужно создание странички вывода категорий товара и страничку информации о товаре для Virtuemart. Есть пример на сайте, нужно сделать ка и там. Общие черты: сайт по продаже видео роликов.

    Закрыт
    15 лет назад
  • Ищется специалист, для написания расширения под Virtuemart, необходимо организовать простейшую историю заказов. То есть что бы админ мог просматривать статистику по заказам,

    Завершен
    15 лет назад