Необходимо сделать: 1. Скрипт, который смог бы определить входит ли IP пользователя в этот список или нет http://agava.ru/runet ИЛИ 2. Перегнать http://agava.ru/runet в любой вид (например ...
Скрейпер данных с сайта недвижимости
Требуется написать скрипт умеющий таскать данные с сайта realtor.com. Конкретно надо утаскивать листинги домов (например: http://www.realtor.com/Prop/1077121176 ) То есть надо забрать адрес, цену дома, фотографии, Property Features структурированно и текстовое описание. Некоторые дома содержат виртульный тур, его брать не надо, но надо сохранить линк на него. Также надо данные продавца. И сорбственно URL, тот что в /prop/.
Трудность задачи состоит в том, чтобы обеспечить обновление базы не вытаскивая каждый раз ее всю по новой. То есть надо аккуратненько научится вытаскивать именно новые листинги и, что куда сложнее, убивать снятые с продажи. В любом случае надо быть аккуратным, сайт содержит три миллиона листингов и как-то прятаться от ока админов надо. Ротирование проксей использовать можно и нужно, но только вместе с их источником. То есть я не против купить лист подписки, но выбирать его вам.
Бюджет проекта указан ориентировочно и может быть легко скорректирован при хорошем решении задачи. Предоплты нет, но сервис безопасных сделок есть.
Прием работы сделаем крйне просто - открутим несколько циклов у вас на хостинге и увидим ловится она или нет, добротно ли собирает листинги новые, удивает ли старые, способна ли вообще в разумное время все сделать и т.п. Если все ок, то тогда уже ко мне перенесем.
Задача не так проста как кажется на первый взгляд. Утащить 3 миллиона листингов незаметно и обновлять это не кот начхал. Тут, к примеру, без многопоточности не жить ибо в один поток оно будет собираться несколько лет.
Выбранный исполнитель
Похожие заказы
- $5Веб-программирование1 заявкаЗакрыт18 лет назад
- $5
Необходимо сделать: 1. Скрипт, который смог бы определить входит ли IP пользователя в этот список или нет http://agava.ru/runet ИЛИ 2. Перегнать http://agava.ru/runet в любой вид (например ...
Веб-программированиенет заявокЗакрыт18 лет назад - $500
Необходимо доработать существующий веб модуль отображения картографической информации на flash по готовым требованиям. Web модуль работает с данными в формате xml Ориентирован на встраивание в инженерный веб сайт на php.
Веб-программирование12 заявокЗакрыт18 лет назад - $35
Нужно написать 2 php функции, одна кодирует данные, другая раскодирует. Данные будут только вида: Переменная = значение Ничего сложного. Перевод из base64 производится php функцией base64_decode. Все остальное ...
Веб-программирование10 заявокЗакрыт18 лет назад СРОЧНО нужно сделать небольшое анимационное меню на флеш из 7 кнопок и встроить в HTML страницу. Нужно сделать сейчас. указывайте ICQ для контакта. Оплата яндекс-деньгами
Веб-программирование1 исполнительЗавершен18 лет назадНужно создать софт под windows который делает следующее 1) задается ключевое слово 2) задается текст коммента с вариациями 2) по заданному ключевому слову ищутся посты в блогах по интернету, ...
Веб-программирование6 заявокЗакрыт18 лет назад- $1100
Есть простой платежный шлюз. Нужно навесить на него БД, административный интерфейс, возможно личный кабинет плательщика, систему отчетов. Для ориентира граница сверху 30т.р. Расмотрю все предложения от простых и элигантных, до средне-супер функциональных. Сильная навароченность не ...
Веб-программирование9 заявокЗакрыт18 лет назад - $50
Требуется написать скрипт для меню сайта. Скрипт должен делать меню, аналогично как на сайте http://www.wciom.ru/
Веб-программирование5 заявокЗакрыт18 лет назад - $50
Нужно анимировать пару картинок, и в флеш-меню сделать ссылки рабочими. Бюджет 50$ (не больше)
Веб-программирование1 исполнительЗавершен18 лет назад Имеется скрипт eXtreme Photo Hosting 2006 (скачать его можно здесь: http://filearchiv.ru/1590606) Это скрипт для организации бесплатного хостинга картинок. Необходимо: 1) перевести пользовательскую часть на русский язык(текстов там совсем немного, админ ...
Веб-программирование24 заявкиЗакрыт18 лет назад