тз тут http://intranet.armrus.org/docs/pub/d31711747c48d51edcbe9da5e9fdb457/%D0%A2%D0%B5%D1%85%D0%BD%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%BE%D0%B5_%D0%B7%D0%B0%D0%B4%D0%B0%D0%BD%D0%B8%D0%B5_V2.0....?LoadFile=1
Парсер youtube
Разместите заказ на фриланс-бирже и предложения поступят уже через несколько минут.
Задача состоит из 2 частей.
Первая часть.
Парсер youtube, точнее данных о роликах (их адреса). Задача собрать максимальное количество роликов подпадающий под заданный запрос.
Те мы просматриваем как старые, так и вновь загруженные.т.е. при каждом новом запросе по данному слову мы используем разные фильтры поиска.
Плюс так же мы смотрим и схожие видео предлагаемое youtube до 5 вложений.
Итак, скрипт должен выискивать адреса видео роликов по указанному запросу (указываются в настройках) и схожими с ним видео.
Требуется найти максимально большое количество роликов по каждому запросу.
При этом не одного дубликата быть не должно!!
Т.е. перед добавлением проверяем нет ли такого кода уже в таблице.
Теперь особенности
В youtube адрес выглядит так
мы сохраняем только код
Имеется список
CRrLd-RCMRw
lNyV83CoIyg
xnO2Hajw7Qw
e9PVoazFrZI
QusOwC5nE5I
4nppYo-fVJU
VJhRVYa1KO8
MpZs2Z_eMEw
0QUEOzG8ex8
4fw9F5wCMBs
lc-cCSXRau0
gaxo6UzI3GM
3IrIPFaYp5A
VutdP-gnOS4
hzfpdd2sat4
1) Наша задача создать таблицы. Суть в том, что каждая таблица содержит только коды с определенной буквы. Т.е. либо с «a» либо с «А» и так для всего алфавита и цифр и спецсимволов.
Важно различие реестра.
Готов рассмотреть вариант деления по 2-5 первым символам. Или выслушать ваше предложения по оптимизации хранения указанных данных.
2) Так же полученный код мы размещаем в таблицу задание и добавляем код слова поиска и статусом обработано или нет.
В таблице не должно быть более 500000 кодов
Если более 500000 не обработанных кодов, то приостанавливаем работу парсера.
3) проверять есть ли обработанные коды и стирать их из таблицы.
Вторая часть.
Входные данные.
- Имеются таблицы код, поисковое слово
- список задания с кодами слов.
Задача создать многопоточный парсер информации о видео роликах на основании данных задания и занести это в таблицу
Должны получены данные отправленные в базу
1) Дата парсенга
2) запрос (слово). Берем из таблицы адресов.
3) названия ролика
4) дата добавление ролика
5) количество просмотров
6) количество лайков
7) количество дислайков
8) автор (имя если есть)
9) Не знаю возможно ли это, но хотелось бы знать есть ли реклама в ролике
10) Не знаю возможно ли это, но хотелось бы знать его длительность ( это можно посмотреть например во вкладке видео)
11) Получить информацию с какого раздела видео
12) его ник на youtube youtube.com/user/mnzadornov/ – > mnzadornov
13) !! описание к ролику
14) адрес ролика (код)
15) адрес канала (если возможно) www.youtube.com/channel/U... -> UCbMQvrm7kNe9sfALv8WhmLQ
16) количество комментариев
17) Во вкладке "видео" получить информацию, когда размещено последнее видео
18) если есть возможность то сколько всего видео на канале узнать
19) Во вкладке «о канале» получить данные о дате регистрации
20) Во вкладке «о канале» получить количество просмотров
21) Во вкладке «о канале» получить количество подписчиков.
22) Надо получить адрес видео для скачивания с максимальным качеством. Может какие внешние сервисы или какой алгоритм использовать.
Как только адрес из списка проверен (информацию спарсили) рядом с адресом в таблице задача: ставим единичку.
(цель подчищать задания и не копить все это)
Интересуют сроки
И цена за КАЖДУЮ часть
.
Выбранный исполнитель
Заявки фрилансеров
Похожие заказы
- $1000Прикладное ПО7 заявокЗакрыт10 лет назад
- $150
keyword planner – http://adwords.google.ru/KeywordPlanner Требуется разработать систему для сбора данных, построенная из следующих действий: -Аккаунт активируется в эдвордсе -В сервисе выбирается keyword ...
Прикладное ПО2 заявкиЗакрыт10 лет назад Требуется доработка vtiger 6.1. Просьба откликаться людям с портфолио, содержащим более 3 проектов.
Прикладное ПОнет заявокЗакрыт10 лет назадДобрый день! Недавно отдел Research небезызвестной компании Microsoft, представил широкой публике, а также опубликовал исходные коды революционного алгоритма стабилизации изображения для видеокамер. http://research.microsoft.com/en-us/um/redmond/projects/hyperlapse/ http://habrahabr.ru/post/232877/ В планах ...
Прикладное ПОнет заявокЗакрыт10 лет назад- $10
Программа реализации по методам оптимизации. Pascal Задание во вложении
Прикладное ПО4 заявкиЗакрыт10 лет назад Детальное описание см. в прикреплённом файле.
Прикладное ПО3 заявкиЗакрыт10 лет назад- $65
Выполнить по методичке, по заданному варианту (указан в приложении Б) , язык-С++ Моделирование систем управления. Оформить как курсовую Срок 18 ноября Оплата по факту или частями по мере ...
Прикладное ПОнет заявокЗакрыт10 лет назад - $40
Выполнить 2 работы, по шагам, по тексту из файла: 1. Влияние пропускной способности шины данных на масштабируемость программ (стр.20) 2. Влияние размера пула потоков на масштабируемость программ (стр.40) язык-С++ ...
Прикладное ПОнет заявокЗакрыт10 лет назад Программа для Windows предназначена для подготовки хоровых партитур (уже существующих музыкальных нот) для их отображения на планшетных компьютерах. Речь идет исключительно о графике, музыкальных знаний не нужно, все необходимое будет своевременно объяснено. Программа ...
Прикладное ПО7 заявокЗакрыт10 лет назадНеобходима программа для автоматического заполнения логина и пароля на Интернет-сайтах, в Windows-окнах, желательно и для авторизации в самой Windows. Все пароли должны храниться в зашифрованном виде на USB-флешке, либо на сервере, который должен быть доступен ...
Прикладное ПО1 заявкаЗакрыт10 лет назад