На 2 сайтах. Указывайте стоимость. Сделать необходимо сегодня.
Скрипт парсинга и обработки выдачи по условию
УКАЗЫВАЙТЕ СРАЗУ ЦЕНУ И СРОКИ (ЗАЯВКИ БЕЗ ЭТИХ ПАРАМЕТРОВ НЕ БУДУТ РАССМАТРИВАТЬСЯ)
СРОКИ – ГАРАНТИРОВАННЫЕ
Язык программирования – php, python, delphi, c++, c#.
Если ЯП delphi, c++ или c# – потребуются исходные коды в том числе.
Цель:
Определить сайт компании из массива выдачи по входным данным.
Входные данные:
TXT-файл со строками (формат данных – одно значение либо два значения через
запятую, значение – это любое словофраза через пробел), пример строки с
двумя значениями: Торговый дом Прометей, мебель.
Процесс:
Загружаем файл с входными данными. Нажимаем кнопку "Обработать". Скрипт читает
первую строку, вырезает запятые (если есть, заменяя пробелом) и
вставляет её в строку поиска и получает выдачу, а именно – только первые
10 результатов поиска. Далее скрипт открывает каждый URL выдачи и
обрезает его до главной страницы домена (домен может быть как 2го, так и
3го уровня). С каждого полученного домена скрипт идёт по первым 100
внутренним страницам и на каждой странице он ищет вхождение первого
значения из обрабатываемой строки и отдельно второго значения (если оно
есть) из обрабатываемой строки. Если более чем на 3х внутренних страниц
есть и первое вхождение и второе вхождение – то данный домен
записывается в результирующий файл. В 90% случаях при обработке одной
строки из загружаемого файла (полученных 10 страниц выдачи) – в
результирующий файл будет записываться только один домен. Если по данным
условиям не найдено не одного файла, то в результирующий файл
записывается значение "Не найдено".
Дополнительные функции:
- Если поле "Ключ AntiGate" заполнено, то капчи поисковых систем должны
обрабатываться антикапчей. Если поле не заполнено, но капчи попадаются –
то в логе (блоке хода выполнения) это должно как-то фиксироваться,
чтобы было понимание, что надо вставить ключ антикапчи.
- Если стоит только чекбокс "Яндекс" – то парсинг идёт только по поисковой системе Яндекс и результат пишется в файл yandex.txt
- Если стоит только чекбокс "Google" – то парсинг идёт только по поисковой системе Google и результат пишется в файл google.txt
- Если выбраны оба чекбокса "Яндекс" и "Google" – то поиск производится
по двум поисковым системам с получением двух результирующих файлов
yandex.txt и google.txt
- Скрипт должен работать в многопоточном режиме(!)
Интерфейс:
- Поле "Файл для обработки" с выбором файла для загрузки (обязательное поле).
- Поле "Ключ AntiGate" (не обязательно для заполнения)
- Чебоксы "Яндекс" и "Google" (по умолчанию оба выбраны)
- Кнопка "Обработать файл".
- Блок с ходом выполнения, а именно – сколько строк (или какой процент) обработался.
Заявки фрилансеров
Похожие заказы
- Веб-программирование8 заявокЗакрыт8 лет назад
Мне нужен сайт магазин точно такой(копия) http://www.tshaurma.com/. Напишете пожалуйста ваши цены.
Веб-программирование12 заявокЗакрыт8 лет назадДобрый день, нужно сделать скрипт, который будет брать в реальном режиме времени число определенных "реакций" на конкретный пост в Facebook. Дизайн не нужен, просто цифры из поста.
Веб-программирование2 заявкиЗакрыт8 лет назадНа сайте myscore.ru в свободном доступе расписание ближайших футбольных матчей и игровая статистика. Нужно, чтобы бот выбирал матчи по определенным критериям в статистике играющих команд. Своего рода анализ для прогнозиста на исходы спортивных матчей (футбола). ...
Веб-программирование1 исполнительЗавершен8 лет назадCейчас тайтл на странице складывается из трех составлющих: слова, взятые из настроек сайта + название раздела + название подраздела. Возможности прописывать тайтлы для каждой страницы по отдельности нет.
Веб-программирование4 заявкиЗакрыт8 лет назадЗдравствуйте! У нас есть сайт заказчиков и исполнителей, который мы запускаем для своей внутренней работы. Сейчас он функционирует только для физ.лиц. Нам нужно доработать его для юридических лиц (регистрация, оплата, отчеты). Сайт не на платформе, ...
Веб-программирование3 заявкиЗакрыт8 лет назадЕсть система учета трафика CPA-Tracker Нужно запрограммировать пиксель, который передавал бы в трекер результаты конверсий с нужного сайта - заполнения формы регистрации. Пожалуйста, в заявках укажите стоимость и бюджет.
Веб-программирование1 заявкаЗакрыт8 лет назадНужен программист с навыками php + laravel нужно 1) установить на vps существующий проект написанный на php + laravel 2) провести со мной консультацию по скайпу чтоб я объяснил и показать функционал ...
Веб-программирование3 заявкиЗакрыт8 лет назад