Требуется специалист для доработки онлайн сервиса. Сервис федерального уровня. Обязательны практические навыки: - php - laravel - mysql - js – jquery, желательно angular 2 т.е. есть планы переходить ...
Парсинг данных
Разместите заказ на фриланс-бирже и предложения поступят уже через несколько минут.
[table]ЗадачаСобрать данные о вылетах и их задержках с сайта flightradar.
Ниже приведён пример ссылки, с которыми придётся работать.
https://www.flightradar24.com/data/airports/dme/departures
Все данные нужно сохранить в таблицах. Для каждой даты создаётся отдельная папка, которая
содержит информацию о полётах конкретного аэропорта, в названии файла используется код
IATA данного аэропорта, например, для Домодедово - DME. Таким образом дерево файлов
выглядит следующим образом, где названием файла выступает код аэропорта:
...
08.02.2018 ( folder )
-AAA.file
-AAB.file
-AAC.file
...
В файле содержится информацию о всех полётах, одна строка файла соответствует одной записи, например, для прикреплённого файла
пример_окна.png первая строка раскладывается в файле следующим образом:
Время вылета: 5:40 AM
Фактическое время вылета: 5:42 AM
Номер рейса - B2954
Аэропорт прибытия - Minsk (MSQ)
Оператор - Belavia
Тип судна - B735
Идентификатор судна - EW-252PA
Каждый день парсер будет собирать данные за прошлый день со всех аэропортов. Для того
чтобы получить данные о полётах очередного аэропорта достаточно заменить в адресной строке
код аэропорта на код текущего аэропорта.
Список всех кодов аэропортов можно получить по ссылке ниже. Соответственно, их тоже нужно будет спарсить:
http://www.galaxylogistics.ru/analitika/kodyi-aeroportov-mira-po-iata-iata.html
Так как мы парсим довольно большой объём данных, аэропортов в мире более 11 000 штук, то в случае прерывания парсинга,
мы должны начинать парсить данные за определённый день не с начала ( аэропорт AAA), а с последнего обработанного( спарсенного ) аэропорта.
Мы должны видеть текущий прогресс парсинга при запуске программы - например:
Aeroport AAA is parsing ( remaining 11234 airports to parse ).
Если файл не содержит записей, то сохранять на диск его не нужно, например за определённый день не было полётов с аэропорта AAA, тогда
файл AAA за этот день присутствовать в папке не должен.
Так как скорее всего возможны блокировки со стороны сайта из - за частого обращения к ним, то нужно предусмотреть
механизм умного парсинга на случай блокировки. Нужно рассмотреть различные варианты блокировки(flightradar-ом) в
частности по IP, по HTTP - заголовкам и предусмотреть программное решение для таких случаев. В частности в файле настроек
парсера нужно иметь возможность настроить время задержки между двумя обращениями - минимальное и максимальное количество секунд,
на деле же время задержки между двумя обращениями - случайное число между минимальным и максимальным значением из файла
настроек. Возможно использование платных прокси - серверов для решения задачи или сеть tor.
Программа не должна завершаться аварийно. Обязательные требованияРаботающая и компилирующая программа с исходниками, содержащая файл настроек. Программа не должна аварийно завершаться в случае блокировки сайтом, откуда парсим данные.
[/table]
Заявки фрилансеров
Похожие заказы
- Веб-программирование1 заявкаЗакрыт7 лет назад
- $15
Есть почти готовый сайт, но тотчеловек почему-то не хочет никак его доделать (или не может).Здесь нужно сделать, чтобы при наведении на подразделы меню мышкой, онистановились темнее. Шрифт на зеленом фоне был одинаковый на всех экранах (Это ...
Веб-программирование6 заявокЗакрыт7 лет назад - $20
1. Сделать адаптивным под компьютер и мобильные устройства evropotolki.spb.ru super.evropotolki.spb.ru natayzhnie.evropotolki.spb.ru 2. Сделать формы "заказать звонок" и "вызвать замерщика"на всех сайтах рабочими Заказы должны отправляться на почту ...
Веб-программирование2 заявкиЗакрыт7 лет назад Нужно дописать запрос для записей WP Подробнее в ЛС Оставляйте прямые контакты!
Веб-программирование5 заявокЗакрыт7 лет назадЗдравствуйте! движок сайта генерирует фид для маркета на 95% верный, а мб и на 100%. Необходимо дозаполнить данными фид , еще раз проверить его корректность. Суметь объяснить все значения полей фида заказчику
Веб-программированиенет заявокЗакрыт7 лет назадЗдравствуйте Александр! Рассмотрите возможность сотрудничества https://www.weblancer.net/projects/veb-programmirovanie-31/komponent-nformatc-jno-sistemi-reab-l-tatc-890486/ База данных готова, и проект в Angular 5 также, нужно встроить компонент сначала календаря Желательно контактировать на Watsapp, Viber, Telegram +380986205057 С уважением Дмитрий
Веб-программированиенет заявокЗакрыт7 лет назад- $15
Настроить скрипт формы отправки, добавив фуекцию вложения файла. Думаю работы максимум минут на 15-20.
Веб-программирование1 заявкаЗакрыт7 лет назад - $300
Необходимо разработать примерно вот такой браузерный он лайн редактор https://www.matrix.ru/choose-hair-color/ Человек загружает свое фото, показывает область волос,выбирает цвет и редактор перекрашивает ему в нужный цвет волосы,далее этим фото можно поделиться в соц сетях. ...
Веб-программирование1 заявкаЗакрыт7 лет назад Есть сайт на php. enhelp.org (кмс нету у сайта и не будет) Для раздела статьи требуется сделать систему комментариев. Сделать таким образом, что бы можно было код вставить в страницу и все ...
Веб-программирование3 заявкиЗакрыт7 лет назадТребуется дополнить новые карточки товаров.
Веб-программирование4 заявкиЗакрыт7 лет назад