АвтоматизированноеПри таком подходе сбор информации онлайн осуществляется с помощью
парсера. Он анализирует структуру веб-страниц и извлекает нужные данные, например, цены и описания из карточек товаров. Так, весь «М.Видео» можно собрать за три-четыре часа.
После того, как информация собрана, система запускает
автоматизированный матчинг товаров. Каждый SKU
сопоставляется по двенадцати параметрам, которые влияют на оценку точности:— Название— Ключевые слова с учётом морфологии и синонимов— Артикул производителя— Артикул магазина— Штрих-код (EAN)— Ссылка— Изображение товара— Проверка по цене— Проверка по стоп-словам— Проверка по дубликатам— Проверка по артикулу производителя— Проверка по единицам измеренияПо ним получаем три типа решений: — Товар идентичный;— Товар не идентичный;— Товар одновременно идентичный по одним параметрам и не идентичный по другим.Такие кейсы получает оператор для подтверждения или опровержения идентичности в ручном режиме. Система запоминает это решение и в дальнейшем сопоставляет автоматически.