Нужно перевести твиты в формате xlsx c испанского/итальянского на английский (через Google Translate и Python) и прогнать через алгоритм анализа эмоционального оттенка VADER Sentiment Analysis. Этот анализ показывает какие эмоции выражает язык используемый в твитах – позитивные, нейтральные или негативные и дает оценку каждому параметру.  

Для этого уже есть инструмент на Python Packages – VADER Sentiment Analysis Multilanguage который автоматически переводит и дает значение для каждого твита. То есть задача состоит в том чтобы правильно прогнать файлы через этот анализ и получить значения. Анализ сам open source так что все ресурсы есть онлайн. 

Результат должен быть xlsx файл с определенными колонками (дата, оригинальный твит, перевод твита (англ.), позитивная оценка, нейтральная оценка, негативная оценка, абсолютная величина, и автор). 

Для работы не нужно знание языков или детальное знание самого анализа – нужно знание Python. Очень важно правильно сохранить последовательность данных и какое значение подходит к какому твиту. Я могу проверить во время и после завершения, перевод и правильность значений. 

Этот проект будет использован для академической работы. 

Приложенные файлы: Italian Tweets.xlxs (Итальянские твиты), Spanish Tweets xlsx (Испанские твиты) и файл с примером, ресурсами и инструкцией.

5 лет назад
guest_15781425636799
5 лет в сервисе
Был
5 лет назад

Заявки фрилансеров

Нет заявок фрилансеров