Есть Вёрстка. Нужно превратить её в шаблон DLE в минимальные сроки. Наворотов по программингу никаких. Пишите сроки и стоимость.
Парсер бредотекста на PHP
Разместите заказ на фриланс-бирже и предложения поступят уже через несколько минут.
Нужен парсер текста на php.
1). Задаём список урлов страниц.
Задаваться он может списком в textarea или грузиться из указанного текстового файла.
1.1). Задаём минимальную длину предложений.
1.2). Задаём выходной txt файл.
2). Тянем первую страницу из списка через file_get_contents() или сurl (предпочтительнее).
3). Используя эту открытую либу http://forum.dklab.ru/viewtopic.php?t=19849 вычищаем АБСОЛЮТНО всё, кроме текста.
Основная задача доработать эту библиотеку. Если найдёте, что-то более продвинутое - пожалуйста.
Поясню. Текст в моём понимании - это набор предложений, которые начинаются с прописной буквы,
и заканчиваются исключительно точкой. Если в исходном тексте попадаются предложения, которые заканчиваются вопросительным или восклицательным знаком, заменяем их на точки.
При этом каждое предложение должно быть не короче, чем указано в пункте 1.1.
Меня устроит, если длину считаем тупо через str_word_count().
Если предложение - часть диалога, вырезаем и начальные тире.
Никакого html и прочего форматирования.
Впрочем, в выходном файле, текст должен быть сплошным, а не обрываться на середине предложения переносом на следующую строку.
Между словами в предложениях и самими предложениями - строго один пробел.
Смысл текста может быть (и будет) потерян, но это абсолютно не важно.
То что напарсили, записываем в файл. Помним про кодировки! Помним об оперативке!!!
Страница с текстом может быть большая (например http://lib.ru/DETEKTIWY/DESTROER/dest02.txt).
Лучше тащите и обрабатывайте по кусочку.
4). Тянем следующую страницу и повторяем третий пункт до победного конца.
5). Теперь фишки и мои капризы.
Скрипт во время работы может остановиться. Там не хватило ресурсов сервера, или вылетело соединение с сетью на локалхосте. Поэтому текущую позицию парсинга (на каком именно ресурсе сейчас идёт работа), записываем во временный файлик. Чтобы при последующем запуске скрипта, продолжать с последнего момента.
Исходя из этого, хорошо бы сделать расписание заданий.
Т.е заполняем данные из пункта 1, и сохраняем. Это одно задание. Заполнинили и сохранили ещё раз - это второе.
При нажатии кнопки запуска, начинаем выполнять первое задание. Закончили - следующее. И так до пока задания не закончатся.
Ну и во время работы скрипта, я должен визуально контролировать ход выполнения (сколько уже напарсили,
сколько осталось, количество заданий и т.д)
Требования к исполнителю:
Обязательно наличие аськи. Лучше уточнить у меня неясности в процессе, чем править готовый скрипт.
Обязательно знание ООП. (Либа написана с использованием оного).
Если вы не уверены в своих силах, и задание хотите взять только для тренировки - проходите мимо.
Быдлокодить я и сам умею ;)
Цену сильно не ломить, я имею представление о стоимости подобных услуг.
Оплата:
Строго в WM.
Цену устанавливаем в WMZ, но оплачивать я могу в WMZ или в WMR (по курсу на момент оплаты) по своему усмотрению.
Оплата по факту - на моей стороне всё заработало, как и требовалось.
Впрочем, если у вас куча положительных отзывов по серьёзным работам, могу сделать предоплату. Обсуждаемо в аське.
В аську мне не ломиться, сегодня-завтра выберу интересные предложения и обращусь сам.
Выбранный исполнитель
Заявки фрилансеров
Похожие заказы
- $100Веб-программирование1 исполнительЗавершен15 лет назад
Необходимо исправить ошибки и доработать несколько модулей в админ панели. Модули представляют собой клиентские JavaScript приложения на ExtJS Серверная часть написана на PHP. По серверной части правки будут минимальные т.к. она ...
Веб-программирование2 заявкиЗакрыт16 лет назад- $50
Требуется сделать експорт данных из 1С в БД joomla 00000000130|1||PEX Трубы и фитинги||| 00000003521|1|00000000130|Позиции под заказ (PEX Трубы и фитинги)||| 00000000617|0|00000000130|Водорозетка PEX с вн. р. 16 х1/2" KALDE|шт|111,00| 00000002382|0|00000000130|Соед. ...
Веб-программирование1 исполнительЗавершен16 лет назад Есть справичник из 3х таблиц в БД Необходимо написать несколько функций на php + простенький html для вывода\ввода данных. 1) Поиск по БД с определенными условиями поисковых данных ...
Веб-программирование1 исполнительЗавершен16 лет назадЕсть страничка на сайте когда на нее попадает юзер с компа или оперы-мини то он и остается на ней а вот если с мобильного телефона, то идет переадресация на другую страничку, все это делается через ...
Веб-программирование4 заявкиЗакрыт16 лет назадНужна простая система чтобы можно было судить о посещаемости сайта в целом и по типовым, предлагаемым распространенными скриптами, показателям (сколько уникальных, откуда пришел, регион и т.п.). Возможно, система учета уже имеется, но просто не включена. ...
Веб-программирование1 исполнительЗавершен16 лет назадНеобходимо распарсить несколько порталов, общий результат записать excel-файл по образцу Name, LegislationForm, WebSite, Отрасль, Description, Logo, Email, Phone, Fax, EmployeesCount, Year, PostIndex, Country, Region, City Village, Street, House, OfficeNumber, контактное лицо, должность). ...
Веб-программирование6 заявокЗакрыт16 лет назадПрикрутить капчю к самописному движку
Веб-программирование1 исполнительЗавершен16 лет назадСграббить html страницу c js Сайт iseesolutions.ru_ Нужна главная страница сайта вместе со скриптом, который ротирует фотографии человеков и картинками.
Веб-программирование1 исполнительЗакрыт16 лет назад- $200
Диагностика - 500-1000 рублей Решение проблемы - В зависимости от сложности: Общая цена за решение данной проблемы - 4000-5000 рублей (webmoney) В зависимости от сложности работы, данная цифра может быть уменьшена или ...
Веб-программирование5 заявокЗакрыт16 лет назад