1. Изменить хедер 2. Настроить отображения категорий 3. Поправить вывод краткого описание в карточке товара 4. Поправить страницу контакты 5. Формы оплаты и доставки 6. Новинки и Акции Подробно ...
Парсер
Разместите заказ на фриланс-бирже и предложения поступят уже через несколько минут.
Необходимо написать парсер, представляет собой серверный скрипт, считывающий ряд информационных данных с сайта https://www.flickr.com/ и формирующий ZIP архив для дальнейшего импорта на самописной CMS в соответствующем виде.
Техническое задание на разработку парсера:
Парсинг списка страниц:
Парсим список тегов-трендов недели https://www.flickr.com/photos/tags-week/ или тренды за сегодня https://www.flickr.com/photos/tags-day/ и https://www.flickr.com/photos/tags(блок Tags All Time Most Popular)
После берем основную точку входа https://www.flickr.com/search/?dimension_search_mode=min&width=5000&advanced=1&media=photos&license=9&sort=interestingness-desc&safe_search=1&text= и в параметр text в цикле тэги полученные на 1 этапе
Парсим все HTML страницы в соответствии с параметром text, например https://www.flickr.com/search/?dimension_search_mode=min&width=5000&advanced=1&media=photos&license=9&sort=interestingness-desc&safe_search=1&text=village Запуск скрипта должен быть возможен из консоли
Скрипт должен иметь возможность восстанавливать парсинг с последней точки при обрыве связи. (Хранить ID спарсенных изображений и при повторном запуске сверять полученные ID изображений и в случае совпадения пропускать)
Необходимо производить парсинг страниц с интервалом 1-2 секунд для избежания бана IP сервера
Обработка страниц:
При обработке полученных данных при парсинге списка страниц мы должны получить текстовые файлы без расширения в кодировке UTF-8 со следующей структурой
каждый макрос с новой строки
1. Метаданные.
#title# – парсится из тэга H1 страницы изображения
#desc# – парсится из тэга description, описание поста
#tags# – парсится из блока tags
#imgs# – полное URL изображения на сайте flickr в максимальном качестве
В конце URL изображения должна быть лицензия Creative Commons – CC0, например: https://www.flickr.com/photo.png | Creative Commons – CC0
#user# – имя автора Flickr Public Domain, задается в настройках
При обработке страниц необходимо исключить дублирующиеся изображения по имени файла
Выгрузка
Полученные данные необходимо выгрузить в структурированные папки, где:
Наименование папок являются имена тэгов из 1го этапа парсинга
Сформировать zip архив
Пример архива доступен по https://yadi.sk/d/8f8ib8n03ULu65
Дополнительные требования к реализации:
Никакая другая информация парситься не должна.
Все файлы в кодировке UTF-8
Необходимо пропускать изображения с пустыми #tags# (опционально)
Парсер должен запускаться по требованию на сервере с ключом
без ключей обычный парсинг всех данных
count – количество изображений, при отсутствии данного параметра необходим парсинг без ограничения по количеству
tdk – параметр 1-пропустить изображения с пустыми description
консольный запуск скрипта
Полное ТЗ здесь https://docs.google.com/document/d/1dr72HcS9YVmRKf9FWIhbCVAJf1JUtZIRT3z4cETpZNo/edit
Оплата поэтапно либо в конце
Заявки фрилансеров
Похожие заказы
- Веб-программирование1 заявкаЗакрыт7 лет назад
- $300
Нужен парсер товаров и категорий для интернет магазина. Подробности в ТЗ
Веб-программирование1 исполнительЗавершен7 лет назад Всем привет, ищу специалиста по плагинам вордпресс, который сделает возможность отключать показ объявлений adsense на определенных страницах сайта, по заданным стоп-словам. Указывайте плиз бюджет и опыт подобных работ.
Веб-программирование1 исполнительЗавершен7 лет назадОтдел продаж 12 пользователей 10 номеров, Астериск Интеграция с 1С 10,3 управление торговлей Без предоплат, оплата поэтапно. Оставляйте скайп.
Веб-программированиенет заявокЗакрыт7 лет назадНеобходима выгрузка товаров на авито. Т.е. создание XML файла по инструкции: autoload.avito.ru/format/... По сопоставлению категорий уже есть решение. - Магазин работает на компоненте VirtueMart 2*. Joomla! 2.5.14 Stable, Joomla Platform 11.4.0 ...
Веб-программирование1 исполнительЗакрыт7 лет назад- $500
Необходимо доработать скрипт, который будет обращаться к api Behance и Dribbble. Скрипт должен собирать данные и сохранять их в бд. Более детальное тз будет выдано после собеседования. На данный момент уже создан проект ...
Веб-программирование2 заявкиЗакрыт7 лет назад Нужно сделать бота на платформе dlg.im есть уже готовый рабочий бот в телеграм, по сути нужна его копия просто. Бот простой с кнопками и зашитой информации внутри. Кидаю ссылку на готовый телеграм @BerezhokBot Кто ...
Веб-программирование2 заявкиЗакрыт7 лет назадТребуется установка и настройка системы автоматизации IIKO для сети доставки пиццы и суши из трех и более точек.
Веб-программирование1 заявкаЗакрыт7 лет назад- $100
Предметом разработки является написание скрипта открытия модального окна в веб-сайте и анимирование элементов находящихся в нем Написание кода скрипта осуществляется на языке Javascript, допускается использование библиотеки jQuery версии не ниже 3.0 Скрипт должен ...
Веб-программирование2 заявкиЗакрыт7 лет назад Нужно добавить на сайт следующие функции - автоматический и ручной выбор города - кредитный калькулятор - местоположение офиса на карте - seo оптимизация верстки для последующего наполнения текстами - правка ...
Веб-программирование3 заявкиЗакрыт7 лет назад