Как определять схожесть названия товара от разных поставщиков? Проблематика такова. Товарный ассортимент интернет магазина формируется на основании нескольких excel-файлов от разных поставщиков. Допустим в файле поставщика "А" есть товар "Пылесос Тайфун черный", а в файле поставщика"Б" есть такой же товар, но с немного измененным названием "Пылесос Тайфун (цвет: черый)". Как выявлять схожесть товаров, чтобы свести к минимуму наличие в базе данных одинаковых (дублирующих) товарных позиций?

21 Авг 2019 в 06:25
237 +1
0
Ответы
1

Для определения схожести названий товаров от разных поставщиков можно использовать алгоритмы вычисления сходства строк, такие как алгоритмы Левенштейна или Дамерау-Левенштейна.

Также можно применять методы нормализации текста перед сравнением, такие как удаление знаков препинания, приведение к нижнему регистру, удаление лишних пробелов и т.д.

Для автоматизации процесса сравнения названий товаров можно написать скрипт или программу, которая будет сравнивать названия товаров из разных excel-файлов и определять их схожесть на основании выбранного алгоритма.

Таким образом, можно выявить дублирующие товарные позиции и свести к минимуму их наличие в базе данных, что поможет улучшить качество и структуру товарного ассортимента интернет-магазина.

20 Апр в 13:18
Не можешь разобраться в этой теме?
Обратись за помощью к экспертам
Название заказа не должно быть пустым
Введите email
Бесплатные доработки
Гарантированные бесплатные доработки
Быстрое выполнение
Быстрое выполнение от 2 часов
Проверка работы
Проверка работы на плагиат
Интересные статьи из справочника
Поможем написать учебную работу
Название заказа не должно быть пустым
Введите email
Доверьте свою работу экспертам
Разместите заказ
Наша система отправит ваш заказ на оценку 92 493 авторам
Первые отклики появятся уже в течение 10 минут
Прямой эфир