Всем привет! Нужно написать софт для сбора мейлов, язык на ваше усмотрение. Примерный функционал: простой интерфейс многопоточность прокси Подробное ТЗ дам при личной переписке. Срок выполнения ...
Многопоточный парсер внешних ссылок с сайтов
Здравствуйте.
Требуется приложение на PHP+mysql - многопоточный парсер внешних ссылок с сайтов.
Структура:
1. Админ.часть
- настройка скорости сканирования (количество потоков)
- настройка глубины сканирования (количество кликов от главной страницы)
- загрузка txt файла со списком урлов (хосты или полный адрес)
- загрузка списка урлов через форму
- индикация состояния сканирования (количество хостов в очереди, кол-во готовых хостов, общая статистика, по желанию трафик)
- блокировка хостов (черный список сканирования)
2.Парсер
- многопоточность
- приблизительная структура бд: id, host, datetime последнего сканирования, url страницы, sum_links количество на странице, anchors анкоры ссылок в формате url_acceptor::anchor;;url_acceptor::anchor, status ответ сервера (0 - ожидание), level количество кликов от главной (0,1,2 и т.п.), error код ошибки
- предположительный размер БД 10-20млн. страниц (или 50-100 тыс. хостов)
- последовательность сканирования страниц должна быть случайной, то есть страницы сканируются не сразу для всего хоста, а берутся из бд вразнобой, сначала главные страницы, потом по одной второго уровня, затем случайные страницы третьего уровня разных хостов и т.п.
- внешними ссылками считать не закрытые от поисковых систем тегами noindex и nofollow
- подмена юзер-агента, реферера
- возможность работать через прокси (админ часть)
3.Пользовательский интерфейс
- обращение через GET запрос - ?host=site.ru
вывод суммы полей sum_links , где host=$_GET[host] , естественно с защитой от инъекций.
- обращение через GET запрос - ?host=site.ru&mode=view
вывод списка всех ссылок с хоста: url_acceptor - anchor
Бюджет неизвестен, предпочтение будет отдаваться при наличии уже действующего аналога или при предложении дополнительных возможностей или особого быстродействия.
Заявки фрилансеров
Похожие заказы
- $30Веб-программирование1 исполнительЗавершен14 лет назад
Требуется создание формы для принятия онлайн заказов на сайте трансферно-такси тематики. Приблизительный пример формы http://www.elittransfer.ru/order/transfer/ Эту форму нужно доработать до требуемой. Или создать новую с необходимыми параметрами. Выбор да нет ...
Веб-программирование1 исполнительЗавершен14 лет назад- $300
Здравствуйте! Нужно сделать сайт на Joomla или Drupal аналог transmap точка ru. Функционал остается такой же + доработки по моему ТЗ (инфо для кондидатов у кого будет примерная цена за работу)! Пишите пожалуйста ...
Веб-программирование4 заявкиЗакрыт14 лет назад Есть шаблон на дле, нужно установить и настроить фото галерею, видео плеер. + мелкие доработки самого шаблона. Вообщем все довести до ума.Ваши цены и сроки? Без предоплаты.
Веб-программирование1 исполнительЗавершен14 лет назадTinymce или fckeditor не подходят под конкретную задачу. Проблема слишком большие. Код который они делают не тот который мне нуден. Вариант 1. Пишем свой простой редактор, в котором есть такие функции: - Жирный, ...
Веб-программирование1 заявкаЗакрыт14 лет назадЗдравствуйте, есть сайт онлайн кинотеатр, там хочу организовать онлайн тв хотя б 3 4 канала, есть поток смотрю через VLC все норма, сам попробовал делать через VLC показывает все норма но сервер грузит и отключается ...
Веб-программирование1 заявкаЗакрыт14 лет назад- $10
Требуется создать пример 2-х колоночных новостей на Drupal, с выводом последних 4-х новостей...
Веб-программирование4 заявкиЗакрыт14 лет назад Требуется доработка функционала на js (jQuery, TinyMCE + ajax). Нужен специалист, который в этом разбирается. Кратко - требуется добиться работоспособности страницы с редактиром tinyMCE после замены контентной части ajax (не jQuery) Так же ...
Веб-программирование3 заявкиЗакрыт14 лет назадНужна форма оплаты Яндекс деньгами: 1. Форма пользователя html и обработка php 2. Форма администратора - должна предусматривать простое изменение яндекс счета также раздельно html и php ...
Веб-программирование2 заявкиЗакрыт14 лет назадНеобходимо залить, настроить и произвести правки проекта. Нужен хорошо знающий свое дело верстальщик/вебмастер/программист.
Веб-программирование6 заявокЗакрыт14 лет назад