Найдите исполнителя для вашего проекта прямо сейчас!
Разместите заказ на фриланс-бирже и предложения поступят уже через несколько минут.

Парсер perl\php заданных сайтов.

Суть парсера в извлечении полной базы больших англоязычных сайтов.

Структуру бд обсуждаем заранее. В принципе суть на всех сайтах одинакова: категории и типы объектов и сами объекты.

Рассмотрим на конкретном примере, берем сайт atvtraderonline.com. Сайт состоит из тысяч листингов(ориентировочно 15тыс), категорий и производителей.

Берем листинг, скажем atvtraderonline.com/find/listing/2009-YAMAHA-RHINO-94690776 , отсюда нам понадобятся: VEHICLE DETAILS, description,цена и 1 фото.

В бд должен храниться ИД изначального листинга на сайте-доноре. Так как в будущем потребуется обновление базы и проверка будет осуществляться по этому ИД. Скрипт запускается в кроне с определенной периодичностью, проверяя наличие новых листингов.

Возможно совмещение парсинга нескольких сайтов в одну бд. Скажем парсим листинги по продаже бу машин с нескольких сайтов в одну бд.

Скрипт само собой не должен падать наглухо из-за каких-то недочетов.

Реализация на perl(оч желательно) или php. Главное - понятный, легко обновляемый и дополняемый функционал.

Сами парсеры для конкретных сайтов у меня имеются, мне нужен человек на постоянные подобные задачи. Поэтому лучше, чтоб изначально написал свое дабы в своем коде понимать что, где и как.

Тобишь изначально вы пишете каркас, который в будущем, слегка переделав, используете для парсинга след сайта.

Работа не сложная и постоянная. Поначалу подобные задачи будут где-то раз в 1-2 недели. Жду конкретных предложений с примерами кода.

Оплата в ВМ евро.

спасибо

16 лет назад
exfinancier
Владимир 
42 года
17 лет в сервисе
Был
7 лет назад

Заявки фрилансеров

Нет заявок фрилансеров