Тема дипломного проекта:"Разработка информационного ресурса для автоматической обработки текста " .

Надо сделать 2 модуля на языке PHP.(морфология, синтаксис).

Первое:

Суть модулей:

1. Морфология - разбор слова(в окошечко вводим слова, оно посылается на сайт www.Aot.ru и выдает только результат.(Есть сделанный модуль только с сайтом Aot.ru я его вам прикреплю)) + надо еще сделать с http://www.morphology.ru/ и http://starling.rinet.ru/morph.htm

2.Синтаксис - разбор предложения (аналогично сделать как и морфологию на Aot.ru) + http://www.dictum.ru/ru/syntax/blog иhttp://slashzone.ru/parser/ (по одному предложению).

Второе. На сайте нужно добавить ссылку, позволяющую выполнять весь

цикл АОТ-обработки текста. Эта ссылка должна переводить на страницу, в

которой пользователь вводит текст, нажимает кнопку "графематическая

(первичная) обработка" и получает рез-тат обработки в виде таблицы:

--------------------------------------------------------------------

|№ предложения|№ графемы|графема|ссылка(идентификатор типа графемы)|

--------------------------------------------------------------------

графемой в соотв с aot.ru может быть цепочка русских букв с

прописной буквы, цепочка русских букв со строчной буквы, все буквы

большие, то же самое для англ букв, знаки препинания и т.д. см.

подробнее www.aot.ru.

каждому типу цепочки соответствует свой тип графемы. Это нужно сделать

ввиде pop-up сслыки через java.

Что нужно сделать:

На ПХП организовать загрузку файла в переменную. Далее текст разделить

на предложения. Признак окончания предложения: точка, воскл. знак,

вопр. знак, перенос строки. Каждому предложению соотв свой номер.

Выделив предложение, выделяете в нем графемы. Признак обособленности

графемы: пробел, знак табуляции, начало и конец предложения. Графемы

могут могут быть контактными, например: (слово) "слово", здесь () и

"" сливаются с основной графемой. Такие графемы - это кавычки,

скобки и т.д., не слова и не цифры. Чтобы решить эту проблему каждую

выделенную по пред. признакам графему необходимо "слева" и "справа"

проверить на наличие других графем.

таким образом:

Загружаете файл в переменную А.

Цыкл (по символам переменной А пока не достигнут конец текста)

{

В переменную B заносите графемы текущего предложения.

если (обнаружен признак конца предл.)

{

//B - графемы предложения

цыкл (по символам перем В)

{

если (обнаружены признаки обособленности графемы)

{

символы между признаками обособленности копируете в

перем. С

//определение графем слева слитных с С. Сохраняете

14 лет назад
totnsk
37 лет
14 лет в сервисе
Была
8 лет назад

Заявки фрилансеров

Нет заявок фрилансеров
  • Похожие заказы

  • Нужно доделать курсовой проект по Теории машин и механизмов. Сам а работа, которую нужно доделать находиться в аттач. Вот сама методичка, по которой нужно делать http://files.mail.ru/9PS3YW Наполовину сделанная ...

    Закрыт
    14 лет назад
  • $500

    Требуется ОЧЕНЬ СРОЧНО доработать диплом по ФИЛОЛОГИИ. Тема: Сообщения Ибн Бутлана (XI в.) и Абу-ль-Макарима (XIII в.) в контексте истории описаний Антиохии Объем: минимум 50стр. (сейчас есть 20стр. без оформления, ...

    Закрыт
    14 лет назад
  • От клиента: Тема называется Техническое обслуживание и ремонт магнитолы PANASONIC RX-FS 410 Мне нужно его доделать, в приложение есть файл с содержанием работы: следовательно что у меня имеется уже это - 1. ...

    Закрыт
    14 лет назад
  • $40

    ВУЗ - СГА, предмет - программирование на языке высокого уровня, кол-страниц -20, срок - 28.05, делается все в шаблоне по ГОСТу, темы на выбор (очень много, например телефонный справочник) методичку, темы и шаблон скину исполнителю! ...

    Завершен
    14 лет назад
  • $50

    Есть дипломная работа на английском языке: The Positive and Negative Influence of Globalization and Computerization on Languages необходимо написать к этому диплому: - summary (Краткое содержание) на английском языке ...

    Завершен
    14 лет назад
  • Курсовая работа. http://cdn1.iofferphoto.com/img/item/166/575/415/8nOj.jpg - есть вот такого типа циферблат (только 2 цыферки). Мне нужно его присобачить к параллельному порту и написать программу, которая будет выводить на него любую цыфру. Кстати на ...

    Закрыт
    14 лет назад