Парсинг сайта http://averettrade.ru, PrestaShop
1) Парсин базы в Excel с товарами: получить каждый товар, и его характеристики в базе через разделители ';"
2) Парсить сайт с товарами: получить названия, картинки и описания.
Что нужно в результате:
1. Каталог с картинками, картинки проименованны специальным образом.
2. Файл csv, заполненный определенным образом.
Состав csv: URL картинки, название товара, характеристики, описания (+ возможны ещё поля).
Подводные камни:
1. Надо будет рассортировать характеристики из экселя по ключевым словам.
Например, ячейку "Диагональ: 24 дюйма; Вес: 1,4 кг...." распарсить на отдельные столбцы.
2. У товаров в экселе и товаров на сайте нет общего ID, их надо будет сопоставлять по артикулу или названию товара, чтобы не было дублей, а информация по каждому товару была наиболее полная.
3. Не все позиции в базе имеют общий формат, нужно предусмотреть обработку тех товаров, где не полные данные (обработка исключений).
#Parse #Parsing #merge #excel #web. #парсер #парсеры #I_LOVE_FREELANCE #C++ #Qt