Парсер + программа по автодобавлению новинок манхв на сайт.

Задача будет состоять из нескольких этапов.

Этап 1Нужен парсер, который будет сканировать сайт в определенное время на наличие появление нового тайтла (Произведения) на сайте.

Нужные произведения находятся в закрытом доступе, и если включено 19+ тогда они видны. Для этого сделаем аккаунт, чтобы можно было всё проверить своими руками.

Есть 3 страницы, где появляются новинки

Работать парсер должен примерно с 12:00 до 16:30 по МСК. Периодичность сканирования с 12:00 до 14:40 каждые 5 минут.

С 14:45 до 15:10 каждые 1-2 минуты. Если можно быстрее, хорошо, главное бан не отхватить.

С 15:15 до 16:30 каждые 5 минут.

Тригеры.

Если новинка на сайте появилась, нужно сохранить его ссылку и название на корейском языке. Название прогнать через гугл\яндекс переводчик на русский и английский язык.

Сохранить все три названия (неважно, если переведет криво, потом подправим) в массив.

Очередность.

1. Англ название

2. Русс название

3. Кор название

4. Ссылка на новинку

… Далее будет пояснение, почему нужен массив.

Важно:Все данные нужно где-то хранить, чтобы можно было отделить уже ранее просканированые тайтлы и обращать внимание на новые.

Этап 2Добавление тайтлов на сайт с переводами.

Все данные, который мы спарсим на этапе 1 (Названия и ссылку), мы должны загнать софтом максимально быстро на сайт по переводам с манхвами, мангой.

Там будет очередность полей следующая.

  • Название английское
  • Название русское
  • Название другое (сюда корейское)
  • Поле описание (Сюда просто слово - “Позже…”)
  • Тип - Манхва
  • Категория, 3 штуки: Веб, В цвете, Хентай
  • Авторы манги - пропускаем
  • Жанры, 3 штука: Гарем, Романтика, Повседневность
  • Переводчики: (Добавим потом отдельно название)
  • Статус проекта - Продолжается
  • Возрастное ограничение - 18+
  • Год выпуска: Ставить текущий год (учитываем будущую работу)
  • Ссылка на манга чан - Пропускаем
  • Ссылка на оригинал\анонс - Сюда мы должны вставить ссылку с сайта издателя, где искали новинку.
  • Ссылка на анлейт - Пропускаем
  • Постер - дадим картинку отдельно.
  • Сообщение для модерации - “Описание, теги и обложку изменим позднее на подходящие”
Ну и если всё заполнено корректно, “нажать” на кнопку “Отправить на модерацию”

Важно:На сайте с переводами очень сильно не рекомендуется делать пустые заявки, тестовые, и т.д. Только реальные.

Что нужно учесть:

  • На сайте уже есть одна команда, у которой есть подобная схема работы, потому для нас важно, чтобы парсер + софт по добавлению тайтлов работал быстрее или на равне с ними. Для этого скорее всего нужно будет выделить сервер с базой данных и софтом для автоматизации работы.
  • Данные для анализа сайта для парсера + страницу, где заполнять поля предоставим исполнителю в ЛС.
  • Предусмотреть возможно замены аккаунта на корейской площадке, если аккаунт будет забанен.
2 года назад
cybervamp
Герман 
34 года
8 лет в сервисе
Был
год назад

Заявки фрилансеров

Диас
 
21 год
3 года в сервисе
Был
2 года назад
2 года назад
Евгений
 
38 лет
17 лет в сервисе
Был
23 минуты назад
557 отзывов(-1)
2 года назад
ТОП-5
Веб-программирование
  • Похожие заказы

  • Требуется разработка системы складского учета и CRM с использованием веб-программирования. Необходима интеграция интерфейса для удобства работы пользователей. Важна проработка функционала и интерфейса, чтобы обеспечить эффективное управление складскими процессами.

    Закрыт
    2 года назад
  • Требуется модернизация сайта на старой версии Joomla. Необходимо выполнить апгрейд до актуальной версии или предложить перенос на WordPress. Также нужен перенос на новый хостинг, добавление украиноязычной версии и переключателя языков. Ожидаются предложения по дизайну и реанимации РК в Google Ads.

    Завершен
    2 года назад
  • $10

    Требуется разработать jQuery скрипт, который будет находить div с атрибутом style='display:none' внутри тега form и удалять атрибут required у всех input внутри этого div. Скрипт должен работать не только при загрузке страницы, но и в процессе, учитывая динамическое изменение стилей.

    Завершен
    2 года назад
  • Необходимо спарсить сайт по указанной ссылке и собрать данные в формате XML. Извлечь title, description, url страницы и url больших картинок. Описание должно быть в чистом HTML. Укажите стоимость и сроки выполнения работы.

    Закрыт
    2 года назад
  • Необходимо создать код для вывода картинок-заставок из YouTube-роликов вместо произвольных изображений в миниатюрах постов на сайте WordPress. Проект связан с веб-программированием и требует интеграции с API YouTube.

    Закрыт
    2 года назад
  • Необходимо найти решение проблемы загрузки фотографий в админке MODX, когда изображения отображаются с белым фоном. Проблема возникла недавно, подробности и скриншот предоставлены для анализа.

    Закрыт
    2 года назад
  • $5

    Напишите программу на языке Java, реализующую криптографические преобразования с использованием перестановочного шифра для английского языка. Программа должна обеспечивать шифрование и дешифрование файлов, а результат представлять в битовом формате, используя шестнадцатеричную систему счисления.

    Закрыт
    2 года назад
  • Ищется разработчик для создания плагина на DLE 15.2, который будет обрабатывать логин и никнейм. Необходимо сделать уникальное поле fullname с проверкой, фильтрацией и ограничениями. При первичной авторизации логин должен формироваться автоматически. Также требуется добавление приставки 'Гость' для незарегистрированных пользователей.

    Закрыт
    2 года назад
  • Требуется реализовать скрипт для простого сайта на HTML, который будет отправлять введенные данные на email. При нажатии кнопки данные должны приходить на указанный адрес. Необходимы навыки в веб-программировании.

    Закрыт
    2 года назад