Здравствуйте, нужно написать магазин с использованием php, mysql, API, API - Предоставим! "тз" так же предоставим. срок 1.5 недели! Ни каких предоплат! написали, я проверил , оплатил, вы ...
Скрипт парсера фраз с сайта по заданным критериям
Исходные данные:
- есть пул ключевых слов, например "красоте, красоту, красоты, маска, маски, маску"
- есть исходный сайт, пусть будет site.ru (для тестов сайт есть готовый)
Требуется спарсить все ключевые фразы с сайта, которые содержат ключевые слова, в нашем случае "мечта о красоте, салон красоты, как навести красоту, маска для лица, какая лучшая маска, как сделать маску дома" и т.п., по определенным критериям.
Алгоритм работы скрипта.
Задаю:
- количество потоков
- адрес сайта
- ключевые слова через запятую
- количество слов справа от ключевика, от и до (например, от 1 до 7, ключевик находится слева), получится набор фраз №1
- количество слов слева от ключевика, от и до (например, от 2 до 5, ключевик находится справа), получится набор фраз №2
- количество слов от ключевика по обеим сторонам (например, от 1 до 3, ключевик находится в центре), получится набор фраз №3
- символы, при обнаружении которых во фразе, такая фраза игнорируется (например, слово "маска" явилось первым словом в предложении и слева от него находится точка, следовательно, при добавлении даже одного слова во фразу слева от ключевика появится точка во фразе, тогда такую фразу игнорируем. Такими символами могут быть ,.?!:; и прочие знаки препинания)
- регистр знаков в ключевике в контенте игнорируется
После задания исходных данных:
Скрипт в многопоточном режиме сканирует каждую страницу сайта между тегами , добавляя к каждому ключевику по заданному количеству слов справа, слева и от центра по очереди. При необходимости могу остановить работу скрипта, поставить на паузу, продолжить парсинг.
Сканируемая страница/страницы отображаются, чтобы я видел, что скрипт работает, а не завис или стоит.
Дубликаты фраз удаляются, но подсчитывается количество для выходного файла.
После завершения работы парсер информирует об окончании.
Выходные данные:
Файл xls с колонками "Ключевик/Фраза/Кол-во фраз на сайте/Положение ключевика":
- ключевик – ключ, по которому ведется парсинг
- фраза – фраза с этим ключевиком
- кол-во фраз на сайте – сколько раз эта фраза попалась за парсинг
- положение ключевика – где находился ключевик в составе фразы (слева/справа/центр)
Возможно как десктопное решение (в приоритете), так и серверный вариант с управлением через веб-интерфейс.
Готов выслушать и ответить на Ваши вопросы и предложения.
Если Вы готовы выполнить данное задание, то, пожалуйста, ОБЯЗАТЕЛЬНО, укажите срок и стоимость выполнения. Без этих данных заявка сразу идет в отказ.
Заявки фрилансеров
Похожие заказы
- $450Веб-программирование4 заявкиЗакрыт10 лет назад
Задача 1: Сделать так чтобы эти мини прайсы отображались с картинкой. (примеры вышлю) Задача 2: Сейчас в мини прайсах можно выбрать только один какой-то прайс, чтобы сохранить его в пдф,. Нужно сделать ...
Веб-программирование5 заявокЗакрыт10 лет назад- $10
Приветствую всех! Необходимо доработать слайдер на странице renoar.by/classic.html: добавить к каждому слайду сменный блок текста, расположить его под слайдером - http://joxi.ru/1bmovv0tO7jQry Подобным образом слайдер работает здесь renoar.by/poeme-collection/symphonie/blue-ivory.html (блок ...
Веб-программирование1 исполнительЗавершен10 лет назад Нужен парсер с aliexpress для opencart. Необходимый функционал: 1. Парсить картинки 2. Описание товара 3. Цену. 4. Ссылка на товар с aliexpress ...
Веб-программирование2 заявкиЗакрыт10 лет назадНа сайте _converseofficial.ru уже установлен шопкипер. Необходимо настроить покупку в один клик как у конкурента _converse.com.ru Содрать попап окно ( оформление полностью ). То есть должна подтягиваться картинка, ссылка на товар, артикул ...
Веб-программированиенет заявокЗакрыт10 лет назадЕсть готовый Qiwi.class для приема платежей (php), пару дней назад Qiwi что-то изменили на сайте и класс перестал работать(authorize error), необходимо починить данный класс.
Веб-программирование3 заявкиЗакрыт10 лет назад- $5
Разобраться какой файл генерирует письмо http://galleryua.com/ при заполнении формы и нажатии отправить.
Веб-программирование8 заявокЗакрыт10 лет назад Здравствуйте, необходимо разработать с нуля или найти реализацию в интернете и адаптировать под мой сайт несколько калькуляторов для сайта тематики "похудение". Мой сайт http://negoloday.ru ВордПресс Примеры ...
Веб-программирование3 заявкиЗакрыт10 лет назад- $100
Верстка шаблона (исходники psd) + прикрутка к Wordpress (каталог работ художника с формой контактов), за деталями пишите в лс и оставляйте емайл.
Веб-программирование1 исполнительЗавершен10 лет назад Исходные данные: - есть пул ключевых слов, например "красоте, красоту, красоты, маска, маски, маску" - есть исходный сайт, пусть будет site.ru (для тестов сайт есть готовый) Требуется спарсить все ключевые ...
Веб-программирование3 заявкиЗакрыт10 лет назад