Исходные данные:

Две БД, 1 - товары с сайта, 2 - спарсенные товары

Проблема - разные поставщики/сайты по-разному пишут артикулы тех же позиций

Примеры:

1) ABCD 1234 или ABCD1234 или ABCD-1234

2) 11 222 3 или 112223 или 112223.0

3) другие вариации с 1-2 доп.символам/пробелами

По сути, основные данные (буквы и цифры) остаются теми же, различие в их разделителях, спец.символах.

Задача - написать алгоритм, распознающий дубли товаров между БД, чтобы не добавлять их на сайт.

Просьба указать:

- предварительные средства для решения

- примерное время

- сумму

5 лет назад
ThisIsL0gin
Александр 
33 года
7 лет в сервисе
Был
3 года назад

Заявки фрилансеров

Нет заявок фрилансеров