Здравствуйте! Необходимо на сайте http://95.213.233.90/ подцепить внутреннюю страницу: https://yadi.sk/i/GNaygVF0sYWgD (есть psd) Стоимость, срок.
Написать парсер (граббер)
Разместите заказ на фриланс-бирже и предложения поступят уже через несколько минут.
Нам нужны данные по топовым игрокам игры World of Warcraft.
Топовые игроки измеряются различными метриками в зависимости от того, в чем они крутые, но в данном случае наша метрика – это кол-во очков внутриигровых достижений.
Вот на этом сайте есть полный список игроков, где Rank – это их позиция, определяемая количеством достижений (тот у кого больше всех – на первом месте). Character – имя персонажа. Guild – гильдия в которой он состоит. Realm – игровой сервер, на котором находится персонаж, Ach. Points – количество очков внутриигровых достижений.
Нас интересуют EU и US регионы, собственно 2 вышеприведенных ссылки – это таблица топ игроков по очкам достижений на EU и US.
Нам необходимо спарсить по 50 000 позиций из каждой вкладки. Причем если нажать на любого персонажа из этого списка – откроется страничка, на которой указаны дополнительные персонажи данного игрока. Например если открыть www.wowprogress.com/apoin... и там нажать на первую позицию (персонаж Метатроша) – откроется эта вкладка www.wowprogress.com/chara... , где можно увидеть дополнительный список его персонажей Alts and Transfers (Alts and Transfers: Метавоин (Азурегос), Метаохотник (Азурегос), Метахвостик (Азурегос), Метапаладин (Азурегос), Метарыцарь
(Азурегос)).
Нам нужны по 50 000 позиций с каждой вкладки, и все персонажи игрока, занимающего эту позицию. Т.е. нам надо не просто спарсить 100 000 персонажей (по 50к с каждого региона), но и еще спарсить всех персонажей из списков дополнительных персонажей. Т.е. в сумме мы получим 500 000 персонажей, учитывая, что у каждого игрока в среднем по 4 доп. персонажей + 1 главный.Собрать весь этот список надо в гугл док (желательно) или в Excel-file (на худой конец).
Собирать надо по следующему принципу : парсер открывает 50 000 персонажей из списка по-очереди, под открытием подразумевается клик по нику персонажа, который перебрасывает страничку с дополнительными персонажами. На странице с доп. персонажами парсер сначала берёт инфу по главному персонажу, а потом по доп. персонажам. Здесь наглядно объяснено где находится главный, а где доп. персонажи, а так же соотношение ник-сервер: pp.vk.me/c636216/v6362163...
Под каждый регион нужен отдельная таблица гугл док, внутри которой множество страниц, каждая страница соответствует серверу. Внутри каждой страницы мы собираем персонажей, находящихся на этом сервере. Собственно как надо собирать инфу : парсер кликает по первой позиции, открывает доп. страницу смотрит на главного персонажа, если сервер этого персонажа еще не существует в качестве странички внутри гугл.док файла – парсер создаёт новую страницу с названием сервера. Если страница сервера уже существует – добавляет в неё ник персонажа. Ники персонажей собираем сверху вниз по-очереди (не в ряд).
Т.е. внутри страниц просто ники персонажей сверху вниз, больше никакой инфы не надо. Потом парсер смотрит доп. персонажей и делает тоже самое. Потом закрывает эту вкладку и идёт к следующей позиции и делает там тоже самое, и так до позиции №50 000
Заявки фрилансеров
Похожие заказы
- Веб-программирование1 заявкаЗакрыт9 лет назад
Сайты: http://art-deckor.ru и http://lepnina-na-fasad.ru (работают на одном движке, но с разными админками – CMS Opencart) Задача: Автоматическое обновление цен 1.Импорт прайсов: > прайсы 9 шт. (сопоставление 3х прайсов ...
Веб-программирование1 заявкаЗакрыт9 лет назадЕсть небольшая рабочая программа на ASP.NET, которая имеет веб-форму с поисковой строкой, при нажатии "Найти" происходит полнотекстовый поиск по одной таблице в базе MS SQL 2008 и по-странично выдается результат найденных записей. При этом сейчас ...
Веб-программирование3 заявкиЗакрыт9 лет назадУ меня есть 300 html документов В каждом документе таблица Нужно выдернуть определенные данные из неё и занести в excel по столбцам
Веб-программирование20 заявокЗакрыт9 лет назадТребуется доработать ПО написанное на Java для сайта www.totup.com Объем работы 4-5 месяцев. Кандидатам, будет выслано ТЗ на доработку и информация по готовой части ПО
Веб-программирование3 заявкиЗакрыт9 лет назадНужно повторить слайдшоу с сайта http://beam.zackarias.com/index и интегрировать в сайт с самописной системой на php. моменты: 1. слайдшоу - это то, что возникает когда тыкнешь любое фото в галерее. ...
Веб-программирование1 исполнительЗавершен8 лет назадЗдравствуйте, заказ желательно сделать сегодня (дописать небольшой код) В превью товаров (см. файл) нужно вывести количество опций (они использованы как модификация), таким образом: Если 1 опция - выводится "1 модификация" Если 2 ...
Веб-программирование1 исполнительЗавершен9 лет назадЗадача: - Настроить экспорт данных о визите пользователя на лендинг в csv-файл. - Настроить отправку данных на электронную почту. Подробно о задачах: 1. Csv-файл должен содержать следующие переменные для каждой заявки/целевого ...
Веб-программирование2 заявкиЗакрыт9 лет назадПростая самописная (php mysql jquery css) система дистанционного тестирования сотрудников. В настоящий момент базово рабочая, но до конца не протестированная. Разработчик по личным причинам не может продолжить работу, тем временем с 01.08 ...
Веб-программированиенет заявокЗакрыт9 лет назад- $3
На входе файл html в кодировке UTF-8 с BOM например https://yadi.sk/d/0wcKUm4_thvdb Нужно получить на выходе тот же файл, но сохраненный в кодировке UTF-8 без BOM и с символом "_" вначале имени. Это нужно сделать средствами PHP. Зачем это ...
Веб-программирование1 исполнительЗавершен9 лет назад