Расширение для хрома соединить с api сайта.
Консультация (скрипт) по парсингу сайта
Разместите заказ на фриланс-бирже и предложения поступят уже через несколько минут.
Есть сайт, страницы которого генерируются ajax-ом. Нужен скрипт (программа),которая бы сохраняла хтмл-код уже полностью сформированных страниц в отдельные txt-файлы.
Конкретно, на примере, страница сайта https://www.scoreboard.com/ru/team/hc-yugra/CpX7KoQr/results/, каждая строчка результата матча – это ссылка на статистику матча. Задача –
открыть все ссылки с результатами, дождаться полной загрузки статистики, и
сохранить хтмл-код полученной страницы в txt-файл с уникальным названием в папку с названием, к примеру,именем команды.
уточненное
Цель - нужен скрипт или программа, которая бы позволяла сохранять HTML-код страниц, ссылками на которые являются результаты матчей на типовых страницах, вроде этой - https://www.scoreboard.com/team/ska-st-petersburg/zVJwe4ER/results/ (английская версия сайта) . HTML-код сохраненных страниц должен содержать полный код, который отображается в браузере с учетом всех динамических элементов, подгружающихся AJAX-ом при заходе на страницы.
Все эти страницы с подробными результатами матча должны сохраняться отдельными txt-файлами в папке с названием команды и видом спорта (желательно). Кодировка файлов UTF-8. Названия txt-файлов чтобы начинались с порядкового номера в таком же порядке каком они идут на странице, а остальная часть названия составлялась из названий команд, даты, времени и счета, т.е. в формате (все в нижнем регистре)
(порядковый номер)_(название команды 1)_(название команды 2)_(дата)_(время)_(счет).txt
Названия уже на английском, так что по идее проблем не должно возникнуть.
Также нужно будет сделать проверку на наличие файла в папке (та и проверку наличия самой папки - если папка есть, то в нее и загружать), чтобы при повторной выкачке те результаты, которые уже есть, заново не загружались. И также хотелось бы чтобы можно было указывать количество выгружаемых результатов за раз - пусть всегда считает с начала списка, т.е. самые последние результаты, чтобы не тянуло сразу 150 штук. А, и самое главное чуть не забыл - нужно же сделать возможность указывать папку, в которой будет все создаваться (не ту папку, которая будет создаваться для txt-файлов, а просто папку, в которой будет все создаваться/сохраняться, какая нибудь произвольная).
Выбранный исполнитель
Заявки фрилансеров
Похожие заказы
- Веб-программирование6 заявокЗакрыт7 лет назад
- $5
Необходимо сделать php скрипт, чтобы он сам очищал базу данных. Список таблиц БД для полной очистки базы okaycms: TRUNCATE TABLE 'имя таблицы' TRUNCATE TABLE '' s_brands s_categories ...
Веб-программирование1 исполнительЗавершен7 лет назад Нужно скрыть через цсс опцию со страницы товара в магазине на платформе опенкарт.
Веб-программирование1 исполнительЗавершен7 лет назадДобрый день друзья! Наш домен: www.yurist.ru.com Надо разобраться, почему adguard блокирует часть страницы на сайте. Выяснить откуда сайт подгружает скрипт и зачем он нужен (как указывает браузер хром с неизвестного источника) и ...
Веб-программирование1 исполнительЗавершен7 лет назадСинхронизация товаров из XML поставщика (http://www.nashaigrushka.ru/Images/Goods/prices/catalog.xml.zip) в товары Вконтакте. Выгрузки уже проводили, но синхронизацию не настроили. Разрабатывали скрипт на Питоне Исходники: https://drive.google.com/drive/folders/0Bz0KR_9dHZcfWFB4SmFodjdfV00
Веб-программирование2 заявкиЗакрыт7 лет назадДобрый день. Требуется разработать лендинг на Тильде. Прототип во вложении. Обязательно наличие в портфолио проектов на Тильде. Прошу обозначить стоимость и сроки.
Веб-программирование3 заявкиЗакрыт7 лет назадНа сайте стоит плагин WooCommerce and 1C:Enterprise/1С:Предприятие Data Exchange После установки SSL сертификата - WP не дает авторизацию 1C. Надо настроить доступ в .htacsses! На форумах есть ...
Веб-программирование1 исполнительЗавершен7 лет назадЗдравствуйте! есть много мелких задач (добавление, редактирование контента) по цмс oneSSA кто может помочь?
Веб-программирование3 заявкиЗакрыт7 лет назадДобрый день! Сайт https://goo.gl/kG56YD Нужно настроить возможность сортировать товаров в Каталоге товаров. Например, нужно, чтобы в разделе "ЛАБОРАТОРНАЯ И МЕДИЦИНСКАЯ МЕБЕЛЬ" товары начинались с вытяжных шкафов, медицинских и гардеробных шкафов, ...
Веб-программирование5 заявокЗакрыт7 лет назадВот ссылка на проект: http://test.nikolas.com.ua/ Все задачи опишу ниже. Они не зависят друг от друга. В комментариях писать задачу/цену/срок. Так же можете задавать вопросы. Задачи: 1. Заметили проблему на хромиусе ...
Веб-программирование3 заявкиЗакрыт7 лет назад