Требуется доработать интернет магазин opticprofi.com.ua (Самописный на php, использует шаблонизатор Smarty.) ТЗ прикрепил к заданию. (5 пунктов) Указывайте срок и цену.
Написать парсеры
Разместите заказ на фриланс-бирже и предложения поступят уже через несколько минут.
Нужен скрипт, логика следующая:
1) К скрипту обращаются либо напрямую, либо с GET параметрами (IP, логин, пароль) – во втором случае скрипт должен работать через прокси, в первом без них.
2) При обращении, скрипт проверяет, есть ли в базе "поисковые слова" (далее – запросы) с отметкой 0. Если есть, то берет один запрос и переходит к пункту 4, если нет – то пункту 3.
3) Обращаемся к
https://export.yandex.ru/last/last20x.xml
Берем запросы, где found меньше определенного числа (выставляется в конфиге), кладем их в базу с пометкой 0 и переходим к пункту 2.
4) Переходим
https://www.flickr.com/search/?text={КЛЮЧЕВИК}
и берем урл первой картинки и вставляем в базу в виде тега картинки – img src. Если ничего нет, идем к пункту 5, если произошла ошибка (бан, или что-то еще) – нужно писать в отдельную таблицу/файл лог. Его структура в конце
5) Переходим на
http://www.youtube.com/results?search_query={КЛЮЧЕВИК}
Берем первое видео, записываем в виде iframe вставки. С ошибками тоже самое
6) Переходим на
https://news.yandex.ru/yandsearch?text={КЛЮЧЕВИК}&rpt=nnews2
берем первые N (выставляется в конфиге) новостей – картинка, заголовок, анонс, время. Вырезаем ссылки.
С ошибками действуем стандартно
7) Переходим на
https://www.google.com/search?tbm=bks&q={КЛЮЧЕВИК}
Тоже самое что с яндекс новостями, первые N (выставляется в конфиге) штук.
С ошибками действуем стандартно
8) Переходим
Из пункта 7 берем рандомную ссылку, переходим по ней, и ищем div, длина текста в котором больше N (выставляется в админке) символов. Если такого не находим, ищем по всем остальным ссылкам.
С ошибками действуем стандартно
9) Ставим запросу статус 1 в базе. Если ошибки или пусто по всем 5 парсерам – пишем в лог
10 )Структура лога: число и время, что за сервис, по возможности что за ошибка, запрос
При накапливании N (выставляется в админке) числа ошибок подряд (ошибки однотипные, например flickr не отдает картинки по какой-то причине – может верстка сменилась и т.п.), нужно отправлять email.
Так что видимо записывать придется и успешные действия.
Если логи храните в базе – нужно будет читалка логов, с get параметрами, какие логи выводить (тип парсера), промежуток даты, коилчество штук.
11) При появлении капчи (в частности в гугле и яндексе) – нужно научить ее распозновать с помощью antigate.com
При появлении капч N (в конфиге) раз подряд – ставить какую-то пометку в отдельной таблице, чтобы все запуски скрипта с этого прокси адреса были неудачными на N минут (в конфиге выставлять на сколько), а также отправлять email
12) Каждый парсер нужно писать в отдельном подключаемом файле, чтобы понимать что где находится.
13) Где есть API (youtube например, или google books) можно использовать API, но нужно согласовать и посмотреть лимиты.
Работаю без предоплат, возможна FairPay или поэтапная оплата.
Ваш бюджет – один из критериев выбора исполнителя
Заявки фрилансеров
Похожие заказы
- Веб-программирование8 заявокЗакрыт9 лет назад
Добрый день! Описание - Есть сайт - www.zelgrad24.ru Это "дочка" (сайт посвящен отдельному направлению) основного сайта - www.goszakaz24.ru Сайт был куплен готовый, как есть. Сейчас ...
Веб-программирование3 заявкиЗакрыт9 лет назадСайт http://motobunker.ru 1. Фотографии техники и запчастей не отображаются в Mozilla Firefox. Нужно исправить. 2.. К списку запчастей добавить пару полей. 3. На странице ЗАПЧАСТИ изменить отображение списка запчастей. ...
Веб-программирование3 заявкиЗакрыт9 лет назадПосле включения в joomla режима кеширования страниц все стало работать как надо,однако есть ошибки с отображением некоторых страниц.Требуется корректировка.
Веб-программирование1 исполнительЗавершен9 лет назад- $100
Нужно расширение для Magento 1.9.2, которое будет подменять контент Статичного блока на основе данных GeoIP. Содержимое статичного блока: html, cssБаза GeoIP - города РФ. (установить)Расширение: без изменения файлов Magento, шаблона. Создание и редактирование ...
Веб-программирование2 заявкиЗакрыт9 лет назад Необходимо написать бэкэнд для управления системой распространения цифрового контента.Функционал: Регистрация пользователяАктивация пробного периодаОплата услуг через процессингПроверка конфигурации системыАвтоматическая отправка писемКонтроль срока оплаты услуг (через процессинг) и автоматическое отключение после неоплаты
Веб-программирование1 исполнительЗавершен9 лет назадНеобходимо написать скрипт - позволяющий генерировать контент в виде буквенных и числовых комбинаций. Скрипт должен быть написан под cms Wordpress
Веб-программирование4 заявкиЗакрыт9 лет назадЕсть сайт isjaee.hydrogen.ru - карта сайта http://isjaee.hydrogen.ru/?pid=7 на самопис движке, я сначала с заказчиком договорился о разработке ТЗ. Вроде сайт является по сути новостным ресурсом, нужно структурировать и перечислить функционал (например ...
Веб-программированиенет заявокЗакрыт9 лет назадДень добрый, уважаемые программисты. на сайте http://vsebani.kiev.ua нужно сделать так, что бы в коде отображались адекватные ссылки на карточки, так как сделано сейчас поисковые системы не воспринимают ссылки.
Веб-программирование1 исполнительЗавершен9 лет назад- $400
Ищем специалиста по Node.js + AngularJS для доработки веб сервиса по ТЗ. Детали кандидатам. Работа срочная.
Веб-программирование6 заявокЗакрыт9 лет назад