Найдите исполнителя для вашего проекта прямо сейчас!
Разместите заказ на фриланс-бирже и предложения поступят уже через несколько минут.

Задача:

Написать парсер, который рекурсивно обойдет все файлы, которые хранятся на диске, разберёт данные и положит их в PostgreSQL.

Количество записей: ±2 млн

Объем данных: ±150 Gb

База данных: PostgreSQL (будет хоститься на DigitalOcean)

Требования:

- Ведение лога, чтобы можно было отловить ошибки и быть уверенным в целостности данных.

- Высокая скорость импорта. Нужно выбрать оптимальный способ для импорта данных в PostgreSQL. Желательная скорость 2-5 часа. Допустимая скорость 12 часов.

Структура базы данных:

- URL

- Title страницы

- Категория (laptops/device/hwid)

- Тип устройства (sound/video/ etc…) – только для категории device

- Бренд производителя (Acer/Asus/Nvidia/Intel/ etc…)

- Остальной HTML текст

- Количество символов в поле “Остальной HTML текст”

- Исходное название папки и файла из которого производился импорт

Пример исходных данных (полный архив весит ±150 Gb): https://wdfiles.ru/0aac93

3 года назад
DriverPack
Сэм 
45 лет
3 года в сервисе
Был
3 года назад

Заявки фрилансеров

Руслан
 
35 лет
3 года в сервисе
Был
3 года назад
3 отзыва
3 года назад
Ильдар
 
45 лет
16 лет в сервисе
Был
2 месяца назад
92 отзыва(-1)
3 года назад
  • Похожие заказы

  • $3340

    Ищем программиста уровня Middle/Senior для доработки алгоритмического торгового робота на спотовом рынке Binance. Необходим опыт работы с торговыми роботами и highload проектами. Работа будет проводиться помодульно. Обязательно укажите ставку в час, город и количество часов в неделю.

    Прикладное ПОнет заявок
    Закрыт
    3 года назад
  • Требуется разработка торгового бота для Binance на Python с управлением через Telegram. Учитывать возможность выставления более 2000 ордеров в секунду. Необходим специалист, знающий ограничения и методы обхода API Binance для эффективного функционирования бота.

    Закрыт
    3 года назад
  • Необходима программа для отслеживания движения пучка лазера на черном экране в темной комнате. Результат работы - таблица положения пучка от времени. Возможны различные способы отслеживания, включая использование двумерного массива или анализ изображения. Открыты к предложениям по использованию других датчиков и методов с помощью Arduino.

    Закрыт
    3 года назад
  • Требуется разработать скрипт на Python для разбивки прошивки на части, считывая данные по адресу 0х80. Скрипт должен извлекать начало раздела, его размер и имя, конвертируя данные в обратный порядок Uint32, а затем сохранять 14 файлов с указанными именами рядом с прошивкой.

    Закрыт
    3 года назад
  • Требуется разработать скетч для Arduino Mega, основываясь на предоставленном описании функционала и таблице с входами/выходами. В предложении укажите стоимость и срок выполнения работы.

    Закрыт
    3 года назад
  • Необходимо разработать программу-детектор смены сцен на Python с применением машинного обучения. В наличии есть полное описание задания в Jupyter Notebook, датасет и рабочий пример. Ожидается использование библиотек OpenCV, sklearn, numpy, pandas для реализации проекта.

    Закрыт
    3 года назад
  • $20

    Требуется разработка составного макроса для Excel, который будет автоматически обрабатывать прайсы и остатки, загружая файлы из Outlook. Макрос должен выполнять несколько задач, включая сохранение файлов, ВПР цен и остатков, а также удаление исходных документов. Есть готовый аналогичный макрос для адаптации. Цена обсуждаема.

    Закрыт
    3 года назад
  • Требуется разработать сложный Telegram-бот для обучения с возможностью интеграции в WhatsApp и VK. Функционал включает защиту контента, сегментацию пользователей, различные сценарии обучения, задания, геймификацию, аналитику и возможность продажи услуг. Ожидается опытный исполнитель с портфолио и готовый выполнить тестовое задание.

    Закрыт
    3 года назад
  • $180

    Требуется разработать десктопную программу, аналогичную ФотоШоу Про, с функционалом регистрации пользователей и оплатой для получения доступа. В приложении содержится техническое задание.

    Закрыт
    3 года назад