Найдите исполнителя для вашего проекта прямо сейчас!
Разместите заказ на фриланс-бирже и предложения поступят уже через несколько минут.

Задание состоит из нескольких частей:

Обучить модель машинного обучения на Python для решения задачи классификации новостных русскоязычных текстов по темам: экономика, политика, социальная сфера, здравоохранение, образование, экология, либо отнесение к категории "не заданная категория". Для классификации должен использоваться метод наивного байеса. Обучающую выборку я предоставлю.

Обучить модель машинного обучения на Python для решения задачи классификации русскоязычных комментариев по тональности: позитивная, негативная, нейтральная. Метод, используемый для классификации не принципиален, но необходимо указать его в комментариях к коду.

Обе модели должны сохранять текущее состояние, т.е. не обучаться с нуля при каждом запуске скрипта, а использовать уже имеющиеся знания для классификации.

Необходимо парсить посты и комментарии к ним из групп, начиная с 01.01.2024. Сообщества:

https://vk.com/mos

https://vk.com/m24

При запуске скрипта должны происходить следующие действия:

1)Создание .csv файла, который должен содержать в себе поля:

Post_ID – уникальный идентификатор каждой записи в таблице; Post_text – текстовое содержание поста;

Group – название группы, из которой был взят пост;

Post_date – дата публикации поста в формате дд.мм.гггг;

Post_topic – тема публикации – поле заполняется путем применения обученной ранее модели;

ERpost – коэффициент вовлеченности в обсуждение поста, который рассчитывается по формуле:

ERpost = (количество реакций на публикации + количество комментариев на публикации + количество репостов на публикации)/количество просмотров публикации.

Comment_text – текстовое содержание комментария к конкретной публикации;

Comment_tonality – поле, содержащее в себе оценку тональности комментария – поле заполняется путем применения обученной ранее модели;

Age – возраст автора комментария;

Gender – пол автора комментария.

Необходимо предоставить исходные файлы с кодом, весь код должен быть написан в объектно-ориентированном стиле и разбит на файлы для лучшей читаемости, должны быть соблюдены ограничения по количеству запросов к API вконтакте. При каждом запуске скрипта парсинг должен начинаться с последнего записанного в файле поста (т.е. последний пост пропускается и в файл записывается следующий за ним пост), в случае удаления со стены группы последнего поста - парсить начиная с последнего неудаленного поста. В случае, если какая-либо информация в профиле автора комментария недоступна/неуказана - оставить поле пустым.

год назад
guest_1714586241519
год в сервисе
Был
год назад

Заявки фрилансеров

Юрий
 
22 года
2 года в сервисе
Был
14 дней назад
год назад
Маркиян
 
26 лет
2 года в сервисе
Был
17 дней назад
3 отзыва
год назад
ТОП-10
Прикладное ПО
Дмитрий
 
22 года
3 года в сервисе
Был
час назад
3 отзыва(-2)
год назад
  • Похожие заказы

  • $500

    Ищется специалист по Excel макросам и скриптам Google для переноса готового макроса на Google Диск в виде скрипта. Необходимо производить расчеты на основе существующего макроса.

    Закрыт
    10 месяцев назад
  • Требуется разработка скрипта для отправки данных из Google Таблиц в Telegram-канал. Сообщение должно включать данные из ячеек A2, S2, G2 и текст шаблона. Каждая строка таблицы формирует отдельное сообщение, с параметром 1 как ссылкой. Необходимо обеспечить автоматизацию процесса для всех строк таблицы.

    Закрыт
    год назад
  • Разработать программу для численного интегрирования системы обыкновенных дифференциальных уравнений, описывающих движение космического аппарата. Программа должна быть написана на Delphi с использованием библиотеки Simulate+. Реализовать два варианта работы с типовым сценарием: подготовка данных, выполнение расчетов, анализ результатов и составление отчета.

    Закрыт
    год назад
  • $400

    Требуется разработка решения для онлайн коррекции перспективы в видео потоке с использованием raspberrypi pi camera на raspberrypi pi 4/5 или jetson nano. Формат видео - 1920x1080, 25fps. Основное внимание уделяется качеству обработки и скорости работы.

    Прикладное ПО1 исполнитель
    Завершен
    год назад
  • Требуется разработка уникальной системы контроля версий для дипломной работы на тему управления изменениями в ИТ. Ожидается создание функционала, схожего с GitHub, но более простого. Стек разработки не ограничен. Срок выполнения до 14.05, желательно раньше для подготовки презентации и документации. Заказчик предпочитает исполнителей из России.

    Закрытнет даты
  • Требуется разработать приложение на Python с использованием библиотеки OpenCV для обнаружения дефектов на плате в режиме реального времени. Программа должна обрабатывать видеопоток с камеры и выводить информацию на интерфейс. Необходима проработка интерфейса для удобного отображения данных.

    Закрыт
    10 месяцев назад
  • Необходимо разработать два скрипта для Google Таблиц. Первый скрипт должен заполнять поля PDF данными из таблицы. Второй скрипт формирует письмо-рассылку с несколькими предложениями, используя данные из двух таблиц: одна для описания товаров, другая для цен и условий. Заказ включает выборочные ячейки для генерации предложений.

    Закрыт
    10 месяцев назад
  • $30

    Требуется настроить AMO CRM для небольшого автосервиса. Имеется предпочтение к фрилансерам с опытом подобной настройки, чтобы учесть удобство работы и проработать карточки клиентов. Опыт в настройке системы будет преимуществом.

    Прикладное ПОнет заявок
    Закрыт
    10 месяцев назад
  • Необходимо разработать парсер для сбора данных с сайта https://pc-builds.com/ru/fps-calculator/. Спарсить информацию по всем доступным свойствам, открываемым после клика на кнопку 'приступить к расчёту'.

    Прикладное ПО1 исполнитель
    Завершен
    год назад