|
ПРОЕКТЫ ДАННОЙ КАТЕГОРИИ Работа для специалиста по компьютерному зрению Написание обёртки на Java для вызова функции DLL Разработка надстройки для Outlook2007 на VBA Все проекты данной категории - 32 TOP 10 ФРИЛАНСЕРОВ Разработка прикладного ПО
|
CasinoParserРазработка прикладного ПО
Нужна программа, которая будет забирать страничики с сайта и преобразововать HTML в txt.
Например, есть относительный путь к страницам /games/handhistory/?gameCode=P4&handNumber=127833676, на определенном хосте, программа должна выкачивать страницы по этому пути меняя параметр handNumber в диапазоне который задается в настройках программы. Другие требования к программе: 1) Прога должна преобразовывать в txt только страницы которые содержат определенные слова, которые задаются в настройках. 2) После скачивания страницы должны сохранятся в каталоге программы в разных папках в зависимости от содержимого. 3) Cайт защищен от автоматических скачиваний, он не отдает страницы с хэндами если идут запросы слишком часто. Здесь нужно перезапрашивать страницу до тех пор пока сервер не отдаст её. То есть если в тексте страницы текст «Hand not found.» или страница с ошибкой 404, то ее нужно перезапросить. Я буду соксифицировать прогу и она будет ходить через соксы из списка, каждый раз они меняются, здесь основная задача сделать таймаут, если нет ответа от сайта в течениий 5 секунд, то послать этот запрос повторно ( в этот момент прога соксификатор подставит новый рабочий сокс) и так далее пока страница с данными не скачаеться. 4) Возможность запуска программы из командной строки с двумя параметрами - верхним и нижним пределом номеров страниц. 5) Интерфейс программы не должен зависать, во время закачки. Некоторые уточнения по тз будут даны после выбора исполнителя.
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||