Найдите исполнителя для вашего проекта прямо сейчас!
Разместите заказ на фриланс-бирже и предложения поступят уже через несколько минут.

Необходимо разработать универсальный парсер (грабер), либо доработать существующий.

Язык PHP

Простой и понятный интерфейс (чтобы мог работать любой человек)

Парсинг статей и картинок из заданных источников.

Удаление всех ссылок из текста без ущерба для текста (если ссылка имеет анкор, то ссылка исчезает, анкор остается).

Возможность настройки результатов экспорта в БД (настройка под CMS) и в .txt и в .html.

Удаление ненужных выражений еще на стадии парсинга.

Отдельный редактор результатов парсинга (задать чпу страниц, дату публикаций (возможность присваивать дату с заданным

интервалом), поиск и удаление дублей статей, добавления категорий и подкатегорий в которые добавлять статьи, сортировка по

категориям (перенос в другие категории), возможность по заданным тегам найти и сохранить в отдельную базу отобранные статьи,

синонимайзер, возможность перемешивания статей).

Возможность задавать размер картинок, и функция подбора картинок в яндексе или гугле, и добавления к статье в которой нет

картинки.

Настройка уровня парсинга (глубина), задавать кол-во статей которые нужно спарсить.

Возможность добавить источник в конце статьи с которого беруться статьи в виде. (с возможностью добавления noindex и nofolow)

Автор

ссылка (ссылка на сайт, либо на адрес страницы)

Запуск заданий по крону.

Возможность работы с проксями.

15 лет назад
AlexanderT
Александр 
52 года
15 лет в сервисе
Был
11 лет назад

Заявки фрилансеров

Нет заявок фрилансеров
  • Похожие заказы

  • Требуется качественный парсер маркета яндекса. Многопоточность Работа через прокси Обработка выходных данных Сохранние данных в ексель\csv Импорт полученных данных + написание,по мере надобности, дополнительны модулей ...

    Закрыт
    15 лет назад
  • $10

    День добрый! Есть проблема со скриптом редиректа: скрипт редиректа: http://редирект.ру конечный урл: www.сайт2.ру/раздел/?ID=3644 ссылка для редиректа имеет вид: http://редирект.ру/www.сайт2.ру/раздел/?ID=3644 Есть две следующих ...

    Закрыт
    15 лет назад
  • Необходимо разработать интернет магазин используя фришную цмс. В приложенном файле лежит описание требуемого продукта. Более точное описание будет выслано выбранному исполнителю. Дизайн сайта будет предоставлен исполнителю, необходимо будет его только сверстать. ...

    Закрыт
    15 лет назад
  • Сделана регистрация (нужно доработать), установлен комьюнити билдер, настроены объявления (доска объявлений по категориям), сделан личный кабинет, нужно доработать, и сделать все это на основе дизайн макетов, размещение вакансий, резюме и поиск по ним. ...

    Закрыт
    15 лет назад
  • Требуется разработать личный кабинет пользователя и панель администратора, для сервиса предлагающего услуги по продвижению сайтов BerryBerry.ru. Разделы личного кабинета: Главная страница Мои сайты ...

    Закрыт
    15 лет назад
  • Файл сформирован, настроен, но не доделан выводит ошибку http://happykid.biz/netcat/modules/netshop/export/yandexml.php Определена кодировка: windows-1251 (строка 0, столбец 0) Дата из файла: 2010-04-01 15:49 (строка 3, столбец 113) Ошибка: Тег "name" не ...

    Закрыт
    15 лет назад
  • http://www.dveri-shop.ru/ 1. Необходимо доработать сайт под полноценный интернет магазин 2. Перенести его на Битрикс (пакет Бизнес) 3. Рассмотреть возможность закачки цен в каталог из 1С

    Закрыт
    15 лет назад