Требуется разработка парсера, который будет собирать номера из определенных разделов на сайтах FB, VK, Авито, ЦИАН и Юла. Объем работы - не менее 50 000 номеров в день. Необходимо обеспечить стабильную и быструю работу парсера для обработки большого объема данных.
Написать 2 парсера для сайта
Разместите заказ на фриланс-бирже и предложения поступят уже через несколько минут.
Веб-интерфейс:
1. Окно загрузки слов для парсера - вставить список слов. Если в окно вставить больше 1 слова, то на каждое слово будет создана отдельная папка.
2. Сохранение zip архива папки с txt файлами с результатами.
Скрипт будет запускаться на своем сервере.
Нужно обеспечить неограниченную работу скрипта по времени.
Ошибки писать в лог в визуальный интерфейс. Там же - кнопка очистки лога.
-----------
1. ПАРСЕР АССОЦИАЦИЙ - сохраняет результаты со страницы: https://kartaslov.ru/%D0%B0%D1%81%D1%81%D0%BE%D1%86%D0%B8%D0%B0%D1%86%D0%B8%D0%B8-%D0%BA-%D1%81%D0%BB%D0%BE%D0%B2%D1%83/%D0%BF%D0%B0%D1%81%D0%BF%D0%BE%D1%80%D1%82
Сохранять в отдельные файлы данные из блоков:
1. Со словом «паспорт» ассоциируются слова. Название файла: keyword_1_words-key
2. Со словом «паспорт» ассоциируются фразы. Название файла: keyword_2_phrases
3. Слово «паспорт» ассоциируется со словами. Название файла: keyword_3_key-words
-----------
2. ПАРСЕР СОЧЕТАНИЙ - сохраняет результаты со страницы:
Сохранять в отдельные файлы данные из блоков:
1. С прилагательными. Название файла: keyword_1_adjectives
2. С существительными (главное слово). Название файла: keyword_2_nouns_main
3. С существительными (зависимое слово). Название файла: keyword_3_nouns_dependent
4. С глаголами (субъект). Название файла: keyword_4_verbs_subject
5. С глаголами (аргумент). Название файла: keyword_5_verbs_argument
------------
Общие параметры:
Если какого-то блока нет, то создаем файл, в названии которого указываем NO. Пример: keyword_2_phrases_NO
Сохранять без символа переноса столбца. Вместо него ставить пробел.
Внутри файлов каждую единицу (слово или фразу) сохранять с новой строки.
После завершения сбора файлы класть в папку по названию ключа на латинском, папку упаковывать в zip архив, по завершению - автоматически скачивать.
Заявки фрилансеров
Похожие заказы
- Веб-программирование2 заявкиЗакрыт3 года назад
Необходимо доработать фильтр на сайте www.qazeli.kz, чтобы он корректно отображал результаты при выборе одноместного и двухместного номеров. Исправьте ошибки, чтобы фильтр работал как на сайте бронирования отелей.
Веб-программирование2 заявкиЗакрыт3 года назадТребуется разработка Telegram-бота, пример которого будет предоставлен. Ожидается указание цены работы. Работа по безопасной сделке.
Веб-программирование7 заявокЗакрыт3 года назадНеобходимо разработать программу для автоматического скачивания всех страниц книги, оформленных в div, с веб-сайта. Каждая страница доступна через код элемента. Задача включает в себя анализ структуры страницы и реализацию скрипта для извлечения контента.
Веб-программирование4 заявкиЗакрыт3 года назадТребуется разработка админ панели для Telegram бота знакомств для геймеров на Node.js. Функционал включает блокировку пользователей, массовую рассылку, мониторинг и управление рекламными постами, а также оптимизацию работы бота. Срок выполнения 2-3 недели.
Веб-программирование1 исполнительЗакрыт3 года назадТребуется разработка MVP интернет-сервиса с поддержкой мобильного приложения. Сервис должен обеспечивать создание и управление заметками с подзаметками, используя Firebase для идентификации и базы данных. Дизайн уже готов, обсуждение условий после подписания NDA.
Веб-программирование2 заявкиЗакрыт3 года назадТребуется разработка сервиса онлайн трансляций, способного одновременно обслуживать 5000 и более пользователей с задержкой от 1 до 5 секунд. На данный момент используется инструмент ossrs.net для приема RTMP потока и выдачи HLS файлов. Необходимо оптимизировать текущую технологию или предложить альтернативное решение для снижения задержки, которая сейчас составляет 20-30 секунд.
Веб-программирование2 заявкиЗакрыт3 года назадНеобходимо реализовать хелп-деск для сайта с функционалом отправки сообщений в Telegram bot. Разработать форму отправки запросов, аналогичную форму в кабинете пользователя и страницу с таблицей сообщений в админке. Основное внимание уделить интеграции с Telegram для обработки запросов.
Веб-программированиенет заявокЗакрыт3 года назад- $200
Требуется разработать модуль на Node Express для работы с двумя API, каждый из которых включает 3 запроса. Документация предоставлена в формате Swagger. Бюджет проекта составляет 200$, сроки выполнения - до понедельника. Оплата производится после проверки продукта на сервере заказчика.
Веб-программирование3 заявкиЗакрыт3 года назад