Страница сайта http://mrsmetamorfa.website/tradify/request_new.html При удалении хештега остается фантомный след (см. скриншот). Такой момент только в Safari, остальные браузеры нормально. Нужна помощь в решении.
Парсинг сайта (добываем информацию из iframe)
Парсинг сайта (добываем информацию из iframe)
Парсим каждую из внутренних страниц сайта https://hpjav.tv (осторожно, эротика).
Пример страницы: https://hpjav.tv/73064/dtt-009
Шаг 1. Находим 7 iframe (2 типа) на каждой странице.
Шаг 2. В каждом из iframe находим ссылку на сайт (сохраняем в файл), ссылку на графический файл баннера (сохраняем в файл).
Шаг 3. Переходим по ссылке на сайт (взяли из iframe), (при этом отслеживаем все промежуточные страницы - сохраняем в файл).
Шаг 4. После окончания загрузки (и автоматического прохождения всех промежуточных страниц) - сохраняем финальный URL в файл.
Шаг 1-4 нужно повторить для каждого из 7 iframe на странице.
Вот дополнительная видео-инструкция (осторожно, эротика) https://drive.google.com/open?id=1fSolE2mq_PyofS7RYfDoPxlM5ks-GkK_
Результат должен быть в виде .csv файла со структурой строки (для каждого баннера своя строка):
ссылка на графический файл баннера - URL ; ссылка на сайт - URL ; промежуточные переходы если это возможно (URLs) ; финальный URL
Я должен запускать парсинг самостоятельно на своем сервере.
Технологии: на ваше усмотрение Python + Selenium или zennoposter или что-то аналогичное.
Выбранный исполнитель
Заявки фрилансеров
Похожие заказы
- Веб-программирование1 исполнительЗавершен6 лет назад
Нужно для сайта сделать визуализацию отображения товаров в контейнере. Пример на скриншоте. ТЗ прикреплено. Прошу указывать реальные сроки и цены на работы. Возможна работа через СБР, постоплата, частичная оплата в середине проекта.
Веб-программированиенет заявокЗакрыт6 лет назадНужен парсер постов из сообществ (групп/пабликов), базовое описание функционала: - сплошной парсинг постов (никнейм автора, дата/время, текст, смайлы, изображения); - сортировка постов в разделы на основе ключевых фраз (в качестве примера для упрощения ...
Веб-программирование3 заявкиЗакрыт6 лет назадНеобходимо довести сайт http://binarybets.ru/ (на вордпрессе) до значения в 100 (как для ПК, так и для мобильных) или если так не получится, значит хотя бы добиться зелёной зоны https://developers.google.com/speed/pagespeed/insights/ + Нужно адекватно настроить ...
Веб-программирование1 исполнительЗавершен6 лет назадПриложение описано в мозговой карте https://www.mindmeister.com/1195772322?t=9hN9FJLvwm Суть его создании возможности записи на прием к исполнителям запись на прием осуществляется через виджеты которые через iframе могут вставляться в сайты , приложения соц сетей ...
Веб-программирование1 исполнительЗавершен6 лет назадПубличная страница обращений не открывается у обычного автора по какой-то причине. Вроде настройки проверил, но ничего не помогло. Просто белая страница в паблике при попытке захода со стороны автора. ...
Веб-программирование2 заявкиЗакрыт6 лет назадАналог http://allfacebook.com.ua/images/tmp/2019-01-01_17-41-38.png
Веб-программирование11 заявокЗакрыт6 лет назад- $5
Нужно на PHP написать функцию, которая вернет домен по урлу. Примеры урлов: http://allfacebook.com.ua/images/tmp/exm-links.txt
Веб-программирование1 исполнительЗавершен6 лет назад - $5
Нужно изучить https://cloud.google.com/translate/docs/translating-text#translate_translate_text-php И сделать рабочий скрипт для перевода текста.
Веб-программирование1 исполнительЗавершен6 лет назад - $5
По запросу найти книги через https://www.google.com/search?tbm=bks&q=%D0%BA%D0%BD%D0%B8%D0%BA%D0%B8+%D0%B4%D0%B0%D0%BD%D1%86%D0%BE%D0%B2%D0%BE%D0%B9
Веб-программирование1 исполнительЗавершен6 лет назад