Выгрузка для розетки Opencart 2.3 . Бюджет реальный, желательно в виде адаптированного модуля .
Парсинг сайта
Разместите заказ на фриланс-бирже и предложения поступят уже через несколько минут.
Можно реализовать на PHP 7.2.8+, Perl 5, Python 2.7.5
Лучше на Python, но не принципиально.
Данные в txt файлах или mysql.
Скрипт разделить на разные части:
1. Добавление/удаление ИНН, редактирование уже добавленных.
Перевод ИНН в не активный режим чтобы запись осталась, но парсинг по данному номеру не делался.
Данные можно хранить как в txt файлах, так и mysql базе на выбор исполнителя.
2. Часть отвечающая за парсинг должна быть отдельным скриптом, т.к. часто изменяются данные сайта для парсинга, как результат часто надо редактировать скрипт.
3. Отправка отчета на емаил.
Данные про ИНН:
1. Через HTML форму, без пароля (защита будет в htaccess), добавляем ИНН. (Проверять на дубликан, нельзя добавлять одинаковые ИНН)
2. Выводим список уже записанных ИНН с названиями юр.лиц (для понимания масштаба общий объём примерно до 2000 значений)
3. При клике на ИНН нужно показывать дату последнего парсинга. И получные данные. Нас интересует только адрес.
Нужно помнить все адреса какие были обнаружены у ИНН, т.к. их количество может быть бесконечным, на практике не более 20.
4. При клике на ИНН нужно кнопку на ВКЛ/ВЫКЛ для включения/исключения ИНН из парсинга.
Про парсинг:
1. Парсим sbis. Обращаемся по адресу https://sbis.ru/contragents/7736050003/772801001
Где 7736050003 это ИНН.
2. На полученной странице надо запоминать адрес и название организации, в данном примере "Москва г, ул.Намёткина, д.16, 117420" обязательно с индексом и "Газпром, ПАО"
3. Записать дату получение данных.
4. При получение данных сравнивать с уже сохранёнными.
5. Если есть различие хотябы в одном символе, то новые данные сохраняем, также сохраняем дату обнаружения нового адреса/названия.
В следующий раз будет сравниваться уже новый адрес/название.
6. Так как скрипт может выполнятся долго, хостинг может прибить скрипт. Поэтому предусмотреть запоминание на каком ИНН остановились, чтобы продолжить с нужного.
Желательно сделать параметр, сколько ИНН за один запуск проверять, например 10. Через cron будет сделан запуск скрипта по расписанию.
7. Для уменьшения бана за парсинг, после старта сделать параметр, чтобы при старте парсинг начинался в рандомном интервале от 1 до 3 минут.
Отправка отчета:
1. Когда парсинг заканчивается, скрипт должен запускать формирование отчёта.
Т.к. скрипт парсинга делает не сразу 2000, а по 10 ИНН, то по окончанию если появились изменения, то надо создать письмо, куда все обработанные ИНН и указания на все адреса/названия, включая новый.
2. Отчёт должен отправлять отдельный скрипт.
3. Пример отчёта:
Тема: обнаружены изменения
Текст письма:
ИНН 7736050003
01.01.2009 Адрес такой-то, Название такое-то.
02.02.2010 Адрес такой-то, Название такое-то
И так далее до нового адреса/названия включительно.
4. Если ИНН у которых произошли изменения несколько, то отчёт должен быть одним письмом.
Заявки фрилансеров
Похожие заказы
- Веб-программирование3 заявкиЗакрыт6 лет назад
Требуется рассчитать стоимость плагина (доработки) для AmoCRM: Для клиентов, которые купили больше на 100К – ставится автоматически тег "Ключевые клиенты". Дополнительно: Добавить в плагин возможность редактировать сумму и название тега. ...
Веб-программирование1 заявкаЗакрыт7 лет назадДобрый день. Нужно сделать парсинг товаров с сайтов: http://raysport-shop.ru/ https://fightwear.ru/ https://www.sonsoodo.ru/ http://ayashi-sport.ru/ http://fight-space.ru/ на сайт http://www.unisportsib.com/ , с описанием, всеми хар-ми и определенной наценкой. Интересует готовность взяться за работу, стоимость и срок?
Веб-программирование7 заявокЗакрыт7 лет назад- $10
Нужно будет выйти с нами на скайп и по мере настройки сайта консультировать в появляющихся вопросах. Сайт - http://niva.xyz.s40.hhos.ru/wp-login.php Шаблон: https://themeforest.net/item/disputo-wordpress-bbpress-forum-theme/21584099 Приблизительное время работы: 1-2 часа
Веб-программирование2 заявкиЗакрыт6 лет назад Дано: 1. Агентский аккаунт* Яндекс.Директ 2. Управляющий аккаунт* Google Ads (бывший Google AdWords) 3. API Директа (документация http://tech.yandex.ru/direct/doc/dg/concepts/about-docpage ) 4. API AdS ( http://support.google.com/google-ads/answer/15235?hl=ru ) * агентский или ...
Веб-программирование1 заявкаЗакрыт6 лет назадНужно установить плагин который будет делать экспорт в расширении json на сайте www_evcalyptus_kz CMS ocStore 2.3.0.2.3
Веб-программирование2 заявкиЗакрыт6 лет назадЗадача на основе данных из таблицы гугл.Док по выбраной колонке отображать рейтинг. https://docs.google.com/spreadsheets/d/1tn1ltE93v9sNaRw1R6uUgRc2nFtHKWiHmwZc-LalMMM/edit?usp=sharing Рейтинг выводить в виде списка + гистграммы, как тут показано http://yoursputnik.ru/wp-content/uploads/2013/10/5-video-card-performance-2013.png Т.е. название сайта, ...
Веб-программирование2 заявкиЗакрыт7 лет назадНужен специалист в технологии Unity 3D, эксперт WebGL. Необходимо: ускорить загрузку WebGL контента на сайте.возможно, дать консультацию нашим сотрудникам.О компании: VR, AR разработка. Создаем 3D туры на основе технологий WebGL. Сцена ...
Веб-программированиенет заявокЗакрыт6 лет назадЕсть ленд, собран на тильде. Обычное копирование не работает. Предоставлю все блоки в нужном виде (jpeg, png). Надо заново собрать ленд ну либо ваш вариант получения копии ленда с минимальными затратами
Веб-программирование1 исполнительЗавершен7 лет назадНужно сделать визуализацию игры на canvas, d3, three,js, phaser, pixijs / или другие фреймворки
Веб-программирование2 заявкиЗакрыт6 лет назад