Скрипт-парсер на php

Закрыт5 заявок434 просмотра

Задача - написать php-скрипт, который бы разбирал страницу из указанного источника.

На текущий момент таких источников 15. Под каждый, естественно, пишется и оплачивается индивидуальный скрипт.

Результатом работы должен быть xml-файл, содержащий: meta-поля исходной страницы (title, description, keywords), заголовок страницы, текст, название источника и ссылка на него, ссылка на оригинал страницы. Файлу присваивается произвольное имя. Названия полей xml на Ваше усмотрение.

Также скрипт должен скачивать и сохранять в папку изображения, входящие в данную страницу. Изображения складываются в папку с именем идентичным имени xml-файла.

При обработке текстового содержания также нужно "очищать" исходный html, с тем чтобы убрать признаки форматирования, названия классов и т.п., т.е. на выходе вместо

должно быть

и т.д.

Также пути к картинкам должны быть исправлены на относительные, чтобы картинки загружались не с сайта-источника, а с преобразованной страницы.

Для того, чтобы выполнение проекта было поручено Вам, выполните, пожалуйста, разбор страницы http://korrespondent.net/kyiv/807215 по требованиям описанным выше.

В результирующий файл должна попасть только сама новость, начиная с заголовка и заканчивая "По материалам: УНИАН", то что идет до и после - игнорируется.

Результат разместите на любом доступном Вам хостинге. Так чтобы можно было зайти на страницу, ввести адрес (http://korrespondent.net/kyiv/807215), нажать ОК и получить ссылку на скачивание сформированного xml-файла и ссылки на сохраненные изображения, которые входят в состав страницы.

После проверки тестового задания, проект будет передам Вам на выполнение и сообщены адреса остальных источников.

Просьба в предложениях указать цену за каждый скрипт (т.е. за отдельный источник), можно не точную, достаточно от ... до ... . Возможно, источников станет больше или меньше.

HTML PHP

16 лет назад

Александр Дацько

46 лет

17 лет в сервисе

Был

16 лет назад

Заявки фрилансеров

Нет заявок фрилансеров

Похожие заказы
PHP скрипт распознающий сервер в ссылке
Столкнулся с проблемой. Flash плеер на сайте не распознаёт ссыки вида http://media1.pornhub.com/dl/479def0f5977a0bf01c9ffd44d0b3cb6/49ec2f17/videos/000/232/100/232100.flv так как она какая-то общая. Заметил что Download Master при вбивании этой ссылки в него коннектится не к серверу media1.pornhub.com а к nyc-53.pornhob.com ...
PHP
Веб-программирование1 исполнитель
Завершен
16 лет назад
Интерфейс работы с почтовым ящиком.
$25
Необходим простой веб-интерфейс для работы с почтовым ящиком. Работа с ящиком должна вестить либо через протокол IMAP, либо POP3. Подробное ТЗ выбранному исполнителю.
Веб-программирование1 исполнитель
Завершен
16 лет назад
Исправить баг с регистрацией
Есть онлайн игра, написанная на php. http://antibk.mdma.com.ua Работает через ИЕ. Теперь сама проблема: ПРи регистрации через мозилу. все работает суперски, при регистрации через ИЕ, выдает ошыбки: персонаж с именем таким то уже существует, ...
PHP
Веб-программирование5 заявок
Закрыт
16 лет назад
Исправить работу визуального редактора
$20
Визуальный редактор в нашей CMS работает в основных браузерах Internet Explorer 6 и выше; Mozilla Firefox 2-х Opera 9,63 и выше как выглядет редактор в прикрепленном файле ...
Веб-программирование2 заявки
Закрыт
16 лет назад
Создание коллекционной карточной онлайн игры.
Требуется сделать онлайн ККИ по типу KLANZ.RU Флэш не требуется. Дополнительные графические элементы не требуются. От вас работающие бои, удобный интерфейс коллекции карт, рынок пользователей, форум, удобный чат, гильдии, возможность конвертировать валюту, ...
Веб-программированиенет заявок
Закрыт
16 лет назад
Фотогалерея / lookbook . Срочно!
Нужна фотогалерея FLASH + XML, чтобы долго не обьяснять что нужно я нашел идеальный пример. http://www.prada.com/ раздел collections -> pdf lookbook. Цена договорная предложения отправляйте на [email protected]
Веб-программирование1 исполнитель
Завершен
16 лет назад
Загрузка файла на сервер C#
$5
Доброго времени суток, уважаемые фрилансеры. Требуется написать на C# метод загрузки файла на сервер. Последовательность действий такая: загрузить код главной страницы сайта (http://xmages.net): Я думаю, например, так: var req = WebRequest.Create(@"http://xmages.net/"); ...
Веб-программирование1 исполнитель
Завершен
16 лет назад
Онлайн плеер музыки с расширенными возможностями
$1000
Онлайн плеер музыки с расширенными возможностями [ Flash / Silverlight] 1) нужно сделать трек рендер (показывающий гистограмму как Sound Forge/ Wave Editor, с возможностью выставления маркеров (точек) ) 2) по ...
Веб-программирование7 заявок
Закрыт
16 лет назад
Найти либо доработать скрипт ajax рейтинга
Нужен скрипт такой же как и http://masugadesign.com/the-lab/scripts/unobtrusive-ajax-star-rating-bar/, но чтобы при нажатии на сам рейтинг ссылка была скрытая!! Это единственное условие. Можно подключить библиотеку http://www.m3nt0r.de/devel/raterDemo/ вместо имеющейся. ...
AJAX Java
Веб-программирование1 исполнитель
Завершен
16 лет назад
Программинг на сайте
Нужно написать скрипты которые обеспечат функционал сайта. функционал похож на этот сайт: http://www.zaspor.ru/ p/s цена имеет значение
Веб-программирование16 заявок
Закрыт
16 лет назад