Найдите исполнителя для вашего проекта прямо сейчас!
Разместите заказ на фриланс-бирже и предложения поступят уже через несколько минут.

ЗАДАЧА

Нужно написать парсер, который будет проходить по списку выданных сайтов и собирать контактную информацию.

1. Все сайты это финские компании с одним и тем же видом деятельности.

- Структура сайтов и дизайн разные.

- Степень защиты сайтов разная

2. Собирать надо все контактные данные, которые имеются.

(Порядок и наличие данных может быть разным, в зависимости от сайта.)

- Название отдела - по возможности

- Имя Фамилия - по возможности

- Должность - по возможности

- Телефон - обязательные данные

- Email - обязательные данные

3. Парсер должен искать данные в футере/хедере, также, заходить в раздел "контакты"/"о нас" и искать там, так как зачастую в футере/хедере может не быть данных или там только почта фирмы, а не CEO и т.д

КОНТАКТНЫЕ ДАННЫЕ

- Контактные данные - (то есть Название отдела, Должность, Имя Фамилия, телефон, email)

- Расположение контактных данных могут быть как на главной странице так и на отдельной предназначенной странице.

- Расположение контактных данных может быть как в шапке сайта, в футере, так и в любом другом месте на странице.

- На сайте может быть только один телефон и один email.

ВЫВОД РЕЗУЛЬТАТОВ

Вывод результатов должен быть в виде CSV файла

Данные должны быть структурированы (например номер телефона и почта) должны быть связаны друг с другом, чтобы было понятно, какой номер телефона принадлежит какой почте.

По возможности данные должны быть отфильтрованы от лишних данных (дубликатов и нерелевантных данных)

ИТОГ

Конечным продуктом является рабочий парсер с исходным кодом и с документацией, в котором можно самостоятельно заменять ссылки и чтобы он выполнял вышеуказанные задачи.

ДОПОЛНИТЕЛЬНО

К заданию прикреплен файл с частью ссылок для примера, а также скриншоты того какие именно данные собирать на сайте, а также пример того как полученные данные приблизительно должны выглядеть.

2 года назад
guest_16678960591817
2 года в сервисе
Был
2 года назад

Заявки фрилансеров

Андрей
 
21 год
3 года в сервисе
Был
2 года назад
2 года назад
Валера
 
30 лет
2 года в сервисе
Был
2 года назад
2 года назад
Павел
 
22 года
2 года в сервисе
Был
год назад
2 года назад
Максим
 
48 лет
19 лет в сервисе
Был
14 дней назад
2 года назад
Владимир
 
39 лет
8 лет в сервисе
Был
год назад
2 года назад
Антон
 
44 года
14 лет в сервисе
Был
11 часов назад
8 отзывов
2 года назад
Тимофей
 
21 год
2 года в сервисе
Был
24 дня назад
2 года назад
Сергей
 
26 лет
3 года в сервисе
Был
год назад
3 отзыва
2 года назад
Антон
 
37 лет
2 года в сервисе
Был
2 года назад
2 года назад
Андрей
 
22 года
3 года в сервисе
Был
9 месяцев назад
2 года назад
Никита
 
21 год
3 года в сервисе
Был
месяц назад
7 отзывов(-3)
2 года назад
  • Похожие заказы

  • Разработать плагин для QGIS3 на Python, который позволит пользователю задавать уровень затопления в метрах и получать отдельный слой с моделью затопления водохранилища Байкал. Также возможно описание алгоритма альтернативного решения задачи.

    Закрыт
    2 года назад
  • Ищем Middle+/Senior Backend developer (JS) для работы над проектом по автоматизации взаимодействия с YouTube и видео-стриминг платформами. Необходимы глубокие знания JavaScript, опыт в reverse engineering и разработки расширений для Chromium. Опыт backend разработки на Python и/или Node JS. Удаленная работа, стабильная зарплата, интересные задачи и дружелюбный коллектив.

    Закрыт
    2 года назад
  • Требуется разработать простой блокнот с использованием QT Designer, состоящий из нескольких форм. Необходимо реализовать функционал записи и редактирования текстов. Подробности будут обсуждены в личных сообщениях.

    Закрыт
    2 года назад
  • Требуется создать программу, которая будет автоматизировать репост рилс из веб-версии Инстаграма в сторис. Программа должна работать через эмулятор на ПК, заходя в профиль, находя указанный рилс и выполняя репост. Идеально, если возможно одновременно или по очереди использовать несколько аккаунтов. Рассмотрим различные технические решения.

    Закрыт
    2 года назад
  • $10

    Требуется разработать Telegram бота на Python с использованием библиотеки Telethon. Бот должен уметь запрашивать номер телефона, отправлять код подтверждения, сохранять сессию, отображать зарегистрированных пользователей и прослушивать чаты на наличие новых сообщений для выполнения определенных действий.

    Закрыт
    2 года назад
  • $15

    Необходимо создать программу для рассылки сообщений по чатам в Telegram с функцией добавления списка чатов и аккаунтов. Ожидается разработка прикладного ПО, которое упростит процесс коммуникации в мессенджере.

    Закрыт
    2 года назад
  • $500

    Требуется разработать скрипт на Python с использованием Selenium, который выполнит репост чужого поста (рилса) в историю Instagram. Укажите возможные инструменты для реализации задачи.

    Закрыт
    2 года назад
  • $70

    Необходимо разработать парсер на Python с использованием Selenium для извлечения данных о компаниях с LinkedIn. Парсер должен учитывать номера проходов и проверять, не парсился ли ранее указанный URL. В случае первого парсинга, необходимо собрать данные о вакансиях и сотрудниках, а также сохранить результаты в файл.

    Закрыт
    2 года назад
  • Требуется разработать внутреннюю программу для обмена данными и контроля персонала. Программа должна поддерживать интеграцию с Google Sheets для удобства работы с данными. Ожидается создание функционального и удобного интерфейса.

    Закрыт
    2 года назад
  • Задача заключается в парсинге коэффициентов окончания раунда из онлайн игры, созданной на Unity, и их переносе в таблицу Excel. Имеется аналогичный процесс для онлайн казино 1win, где данные можно извлекать через элементы сайта. Требуется автоматизация или упрощение процесса копирования данных.

    Закрыт
    2 года назад