Техническое задание на создание парсера в файлы XLS + CSV по категориям + папка с JPG/GIF. Интернет-магазин.

Цель: Подготовка БД объектов для загрузки на сайт-интернет магазина.

Источники: 2 (два), будут даны в личке.

Задачи:

1. Создание общей БД в файле-xls БЕЗ дополнительных столцов

2. Создание CSV по разделам с дополнительными столбцами*

3. Парсинг фотографий в отдельную папку.

4. Подстановка фотографий в соответствующий столбец в CSV по принципу «1-я фотка – превью, 2-я - общий вид, 3-я – оригинал (открывается на сайте при нажатии)».

Разделы к парсингу (включая все возможные подкатегории):

1-й источник:

http://h*****.ru/domestic/ - бытовая техника для дома

http://h*****.ru /small_domestic/ - бытовая техника для кухни

http://h*****.ru /audio_video/ - Аудио, видео, ТВ и DVD

2-й источник – b************e.ru:

• Весь каталог целиком.

Описание итоговых форматов:

1. XLS – для использования оператором интернет-магазина.

1.1. Артикул – код, артикул, номенклатурный номер на сайте-источнике.

1.2. ID – необходимо настроить генерацию уникальных артикулов (собственных), для публикации на сайте, отличных от артикула на сайте-источнике.

1.3. Наименование – как называется товар

1.4. Описание – полное описание. Сюда можно спарсить все столбцы характеристик.

1.5. Цена 1 – стоимость на исходнике

1.6. Цена 2 – остается пустой, это _наша_ отпускная цена.

1.7. Склад – наличие на складе, по информации сайта-источника.

1.8. Фотографии.

2. CSV – для загрузки БД на сайт. Для каждой категории будет СВОЙ CSV со своими дополнительными столбцами. Примерный шаблон во вложениях.

2.1. Сортировка – номер товара на странице в своей категории (т.е. порядок вывода лотов)

2.2. ID – это сгенерированный нами ID (см. п. 1.2.).

2.3. Наименование – этот столбец – технический, для разнесения на категории и подкатегории. Как это делается: с помощью «!».

Например:

!Инструменты *** - категория

!!Шуруповерты - подкатегория

!!!Аккумуляторные дрели-шуруповерты – подкатегория 2 уровня

!!!!Ударные винтоверты – подкатегория 3 уровня

Аккумуляторный ударный винтоверт *** модель **** - товар (без знаков «!»)

2.4. Заголовок – заголовок карточки товара, т.е., его наименование, как оно будет отображаться на странице товара.

2.5. Подробное описание – вся ПРОЧАЯ информация о лоте

2.6. Краткое описание – текстовое описание лота для публикации на странице: например, на странице http://www.eldorado.ru/cat/detail/71032060/ текст, расположенный под заголовком («Пылесос Samsung VC5853 – это компактная…. ……………. даже дети и пожилые люди.») – это краткое описание товара.

2.7. Цена – оставляем пустой.

2.8. Склад - наличие на складе, по информации сайта-источника.

2.9. Фотография A,B,C – «А» - превьюшка в каталоге, «B» - общий вид в карточке объекта, «С» - вид при нажатии на фотку (т.е. оригинал в полный размер)

2.10. Допстолбец _1

2.11. Допстолбец_2

2.12. …

2.13. …. это - "динамические" (или варьирующиеся) столбцы, оригинальные для каждого CSV. Например, для ноутбуков это: «Процессор Экран Оперативная память Жесткий диск Видеокарта Программное обеспечение Тип упаковки Размеры в коробке (Д х Ш х В) Вес в коробке Срок гарантии», для мониторов это «Тип матрицы Экран Размер пикселя Яркость Контраст Время отклика Угол обзора по вертикали Угол обзора по горизонтали Частота вертикальной развертки Частота горизонтальной развертки Управление Динамики Разъемы Крепление на стену Соответствие стандартам Питание Потребляемая мощность Комплект поставки Размеры (Д х Ш х В) Вес Размеры в коробке (Д х Ш х В) Вес в коробке Срок гарантии».

Грубо говоря, необходимо выделить какие-то общие закономерности для категории товаров и автоматически сгенерировать столбцы. Если информация о каком-то лоте отличается от информации о всех остальных, т.е. не подходит под подобное описание, то ее можно отправить в стобец «2.5. Подробное описание.»

2.14. …

2.15. Допстолбец_N

Все описания и характеристики должны быть без доп.стилей типа

и т.д. (кроме переноса абзаца

- их можно оставить)

Конечный результат: Программа – парсер, с настройками в INI: последовательность столбцов, папки в которые складывается, задержки парсинга и т.п. + инструкция по пользованию

Комментарии:

1. Указывайте бюджет и сроки, чтобы можно было закрыть тендер.

2. Дополнительные комментарии или вопросы – в тендере, в личке могу не заметить сообщение.

3. Сроки – максимально-сжатые.

4. С большими бюджетами просьба не отвечать.

5. Хотелось бы видеть именно отдельное приложение, с настройками в ini или в самой проге.

PS. Дорогой друг! Если Вы ищете постоянного заказчика, адекватны в ценовой политике, работоспособны и аккуратны – мы Вас очень ищем и ждем. Нам необходим толковый прогер с желанием работать в команде. Если Вы справитесь с данным заданием быстро и качественно, будем рады продолжить сотрудничество.

UPD.

Еще один столбец в XLS - URL на сам товар

И еще один столбец в CSV - Производитель.

UPD.

точняющий комментарий.

"Наименование" помимо того, что задает структуру каталога с помощью !!! одновременно содержит информацию о том, как товар будет описан в каталоге, a

"Заголовок" - это заголовок внутри страница товара.

Т.е. "наименование" должно быть "Ноутбук Asus ЕЕЕ PC 1001 НА", т.е. буквально производитель и модель, не больше.

А "заголовок" может быть любым - обычно типа "Нетбук Asus EEE PC 1001HA (1A) Atom-N270/1G/160G/10,1/WiFi/cam/4400mAh/XP White".

UPD. Парсеры должны быть реализованы как web-приложения, чтобы их можно было разместить на хостинге в интернете, и управлять через web-интерфейс.Иначе я разорюсь на трафике.

UPD.

Очередной исполнитель пропал и не выходит на связь; объявлется поиск нового.

Также ознакомьтесь с нашей вакансией - http://www.weblancer.net/vacancies/35905.html

15 лет назад
5050482
41 год
17 лет в сервисе
Был
3 года назад

Выбранные исполнители

versgm
Митев 
41 год
15 лет в сервисе
Был
7 лет назад
3 отзыва
15 лет назад
$96
3 дня
Задание выполнено в полном объеме, корректно и в срок. Рекомендую Алексея как ответственного, аккуратного исполнителя, доступного онлайн практически в любой момент.
Отличный заказчик. Получил от него очень подробное ТЗ перед началом работы, чувствуется, что Александр хорошо разбирается в технических аспектах. Планирую работать с ним и в дальнейшем.
opananax
Пушкин 
39 лет
15 лет в сервисе
Был
15 лет назад
15 лет назад
$70
3 дня
Korvin
Сергей 
49 лет
20 лет в сервисе
Был
год назад
15 лет назад
$100
4 дня

Заявки фрилансеров

versgm
Митев 
41 год
15 лет в сервисе
Был
7 лет назад
3 отзыва
15 лет назад
opananax
Пушкин 
39 лет
15 лет в сервисе
Был
15 лет назад
15 лет назад
Korvin
Сергей 
49 лет
20 лет в сервисе
Был
год назад
15 лет назад