Нужно понять API, могут ли биржи работать так как надо. Надо что бы при покупки на сайте Opencart биржа через API выдала криптовалютный кошелек и сумму для оплаты по курсу криптовалюты. После оплаты клиентом биржа продают ...
Парсер на Python (Scrapy)
Разместите заказ на фриланс-бирже и предложения поступят уже через несколько минут.
Написать парсер на Python с использованием фреймворка scrapy.
Обычный поисковый робот.
т.з.
Есть mysql таблица, таблица 1 со списком разрешенных сайтов для парсинга, status 0 парсили, 1 не парсили. Берем сайт из таблицы 1 со статусом 0, парсим все ВНУТРЕННИЕ ссылки (мусорные css\js\jpg и другие естественно фильтруем) остальное добавляем в таблицу 2, параллельно собираем title страницы, description, h1 и записываем эти данные с url в таблицу 2 не стесняемся заглядываем везде но правил сайта не нарушаем перед проходом заглядываем в robots.txt и гуляем только по разрешенным разделам (Scrapy умеет это вроде как из коробки) параллельно берем из robots.txt sitemaps и ее тоже парсим (Бывают в карте сайта ссылки на другие карты сайта так что это учитываем тоже при парсинге).
Как полностью сайт пропарсили берем из таблицы 1 следующий сайт, а тот что пропарсили обновляем status 1, как спарсили все меняем всем status 0 идем сначала. Сайты могут добавляться и удаляться заглядываем периодически.
Если парсим повторно то данные обновляем, в таблицах UNIQUE KEY столбец url.
Хочу протестировать фреймворк, думаю кто работал с фреймворком за час управится.
Если результат понравится будем сотрудничать дальше.
таблица 1
id|url|status|created_at|updated_at
1| site.ru|0
таблица 2
id|url|title|description|h1|created_at|updated_at|status
и mysql
Заявки фрилансеров
Похожие заказы
- Веб-программирование3 заявкиЗакрыт5 лет назад
Здравствуйте, коллеги Нужно сделать доработки интернет магазина на joomla Ознакомиться с перечнем задач можете по ссылке: https://docs.google.com/document/d/17KHT4EuDBLiHI370dutFEJgzHixlwuqZ9ZOi5g2pYGE/edit?usp=sharing Мы подобрали модули, которые можно установить, ...
Веб-программирование1 заявкаЗакрыт5 лет назад1. Сделать полный переход на https:// Серфтификат подключен, осталось сделать редиректы и прочие настройки 1.2 После подключения https:// не работает ни один скрипт, ни всплыв окно, ни купить в 1 клик и прочее ...
Веб-программирование1 заявкаЗакрыт5 лет назадПросто сделать копию сайта, чтобы сайт при этом я мог изменить данные Все что внутри, метатеги и пр. чтобы все было на 100 % идентичным и поставить на хостинг Оплата поэтапно, предоплата ...
Веб-программирование10 заявокЗакрыт5 лет назадНеобходимо немного переделать простенький стиль, поменять цветовую гамму, может быть чуть подправить форму объектов, ну там сменить закруглённые края на ровные, и пожалуй всё. Пример страницы, под которую нужно подогнать имеющийся стиль в скриншоте. ...
Веб-программирование13 заявокЗакрыт5 лет назадНужно настроить интеграцию с двумя дополнительными доменами в AmoCRM. Сейчас почему-то считает неверно заявки и не видит продажи с этих заявок.
Веб-программирование3 заявкиЗакрыт5 лет назадТЗ по ссылке https://docs.google.com/document/d/12dPrll_jzLi7noFWto2rKyKZcpy2U6IO1w9aiUqoUfU/edit?usp=sharing
Веб-программированиенет заявокЗакрыт5 лет назадНужен скрипт для заливки баннеров уже созданые кампании мне нужно используя вот это API https://developers.google.com/adwords/api/docs/guides/mobile-app-campaigns добавлять в существующие кампании новые баннеры в Universal App Campaigns
Веб-программирование3 заявкиЗакрыт5 лет назадТребуется указать файл и строку, где необходимо заменить статичный текст.
Веб-программирование2 заявкиЗакрыт5 лет назадМне требуется, чтобы Вы смогли подключить API платежной системы, которой я скажу. Проект на h-script. Свяжитесь со мной если Вы ориентируетесь на hyip проектах, если Вы студия или разработчик ...
Веб-программирование2 заявкиЗакрыт5 лет назад