Всем добрый день,

Есть ТЗ и прототип, высылаю после небольшой беседы.

Суть: Система парсит контент с различных сайтов, сохраняет на сервере, выводит через веб-интерфейс. Три вида контента:

1. Тексты. Источники текстов - сайты из топа яндекс.xml по списку ключевых фраз. В настройках XML тип поиска "мировой", стандартный лимит 10К запросов в сутки. Как оказалось, одного аккаунта достаточно для проекта.

2. Картинки с yandex.ru/images/. Даже на простой запрос через file_get_contents, Яндекс сразу отдает пачку url'ов картинок. Хотя капчу тоже начинает отдавать, даже при 3 запросах в час. По картинкам планируется около 200 запросов в сутки. На один запрос нужен результат примерно 20 картинок, максимум 100. Можно из google. По пункту 2 я расчитываю на ваш опыт.

3. Видео с youtube, тоже поиск по запросам, примерно 100 запросов в сутки, нужны только url'ы. Вроде как можно через API: https://developers.google.com/youtube/v3/code_samples/php#search_by_keyword

Прокси будут закупаться. Потребуется поддержка cookies и антикапчи, и, скорее всего, headless-браузер.

Пишите сразу, был ли увас подобный опыт или хотя бы что-то похожее. Рассматриваю предложения от работников с плюсами, регистрация от полугода.

Смутно представляю трудозатраты, поэтому называйте примерный бюджет, если хотите.

8 лет назад
site-start
Александр 
42 года
8 лет в сервисе
Был
8 лет назад

Заявки фрилансеров

Нет заявок фрилансеров