Необходимо создать движок, который позволяет с помощью ключевых слов, собирать все упоминания (посты/комментарии/репосты) с различных сайтов. стартовый список источников - 1500 штук. В том числе : все социальные сети, блоги, форумы, онлайн СМИ и т.д.
Написать программу для автоматического парсинга
Требуется программист, который напишет, установит и научит работе, с программой для автоматического и регулярного (один раз в месяц или чаще/реже) парсинга данных с сайтов и экспорта данных в Excel.
Краткое описание задачи:
Этап 1. Есть сайт, на котором расположена (и регулярно обновляется) база данных, требуется с этого сайта, один раз в месяц, автоматически парсить данные. Данные должны экспортироваться в Excel.
В целевой таблице Excel должны быть следующие столбцы:
а. номер лицензии
б. название лицензиата
в. инн лицензиата
г. срок действия c ... по ... (нужно разделить на два столбца)
д. день начала оказания услуг
Ссылка на базу данных, откуда требуется парсить данные https://rkn.gov.ru/communication/register/license/
Мне нужны данные по компаниям, у которых заканчиваются лицензии в период через 1 - 6 месяцев с даты парсинга.
Выпадающее меню "Территория" - нужны данные по всей территории РФ.
Выпадающее меню "Услуга связи" - нужны данные по 7 из 21 услугам (по каким именно сообщу после выбора исполнителя).
Этап 2. Есть сайт, на котором расположены публичные данные по юридическим лицам.
ссылка на сайт https://zachestnyibiznes.ru
При вводе ИНН в поиске, появляется возможность просмотреть информацию о юридическом лице.
Есть ссылка на "Контактная информация" (при нажатии открывается в новом окне).
Нужно спарсить номер телефона с страницы "Контактная информация". Номер телефона должен попасть в столбец "номер телефона" и соответствующую строку исходного юридического лица.
Этап 3. По номеру телефона, ИНН, названию организации - требуется осуществить поиск (яндекс, гугл) веб-сайта юридического лица. Нужно спарсить в таблицу, в соответствующий столбец адрес веб-сайта, адрес email.
В финале Заказчик должен получить автоматический парсинг данных, с исходных сайтов, один раз в месяц (или чаще/реже по запросу). Данные должны экспортироваться в Excel файл. В файле должны быть столбцы 1. номер лицензии 2. название лицензиата 3. инн лицензиата 4. срок действия с 5. срок действия по 6. день начала оказания услуг 7. номер телефона 8. веб-сайт 9. адрес email.
Заявки фрилансеров
Похожие заказы
- Базы данных1 заявкаЗакрыт6 лет назад
Стоит битрикс. 1 запрос долго выполняется. Надо как-то ускорить. Прогнал mysqltuner, создал индекс - не помогло
Базы данных3 заявкиЗакрыт6 лет назадЧто нужно: 1) Залить на VDS базу на 5ГБ (~20кк записей) 2) Согласно макета в фотошопе сделать верстку. Там ничего особенного просто оформление информации из БД. 3) Типы страниц на сайте: страница ...
Базы данных6 заявокЗакрыт6 лет назадНужно вытащить из открытых данных osm - адреса и привязку к геокоординатам. залить это все в БД mysql. и прикрутить все это в автозаполнение input. более подробно - в скайп
Базы данных1 заявкаЗакрыт6 лет назад1) необходимо создать парсер данных с сайта http://avtopmr. com/ (товары, категории) 2) нужна простая настройка времени включения парсера и регулировка его нагрузки 3) вывод данных в гугл таблицу
Базы данных4 заявкиЗакрыт6 лет назадНужно разработать программу, базу данных под компьютер. Один пользователь. Программа будет содержать Базу данных организаций. Важно: интерфейс программы желательно не стандартная библиотека как на виндовс. Возможно есть готовые нароботки по ...
Базы данных20 заявокЗакрыт6 лет назадДобрый День Прошу рассмотреть следующее задание https://docs.google.com/document/d/1Da_bIWG28IrjjVITwIJcgcyHwzOy5NCMVNo18UdP8s4/edit# На все вопрос готов ответить письменно либо голосом Прошу написать стоимость и сроки Спасибо
Базы данных1 заявкаЗакрыт6 лет назадНужен скрипт бекапа (битрикс), который делает следующее: - удаляет старые бекапы - читает доступы к БД из конфиг-файла - создает бекап БД - создает архив файлов - прикрепляет в архив ...
Базы данных3 заявкиЗакрыт6 лет назадНеобходимо решить задачки с объяснениями как решалась (см. вложение). Готовое решение написать под задачей (запросы в MySQL в ворд). После проверки правильности решений оплата. При возникновение вопросов можно уточнять.
Базы данных1 заявкаЗакрыт6 лет назадCRM для музыкальной школы google Apps Script (css, php, html, jQuery, java script) Составлена ER диаграмма базы данных База данных хранится в гугл таблицах За интерфейс пользователя ...
Базы данных1 заявкаЗакрыт6 лет назад