Как настроить парсинг нестандартных товаров


Мониторинг цен важный инструмент в конкурентной борьбе, но иногда настроить процесс парсинга бывает проблематично, часто трудности случаются на этапе матчинга, о котором мы писали в этой статье. Аналогичные товары бывает сложно найти, если у них нет артикулов или стандартной маркировки. Сегодня мы расскажем вам, как справиться с подобными проблемами.

Нестандартная маркировка

Для мониторинга каталога конкурентов необходимо сопоставить собственные товары с аналогами конкурентов. Это легко сделать, если у товара имеется артикул, описание или шаблонное название, но в некоторых отраслях у товаров нет строгой маркировки или артикулов, в таких случаях названия и описания идентичных товаров могут различаться. Очевидным выходом кажется поиск по ключевым словам вручную, но такой подход приведёт к излишним временным затратам и потере качества собранной информации. Как же тогда поступать с неточными маркировками? 

Автоматизированный матчинг по параметрам

Этот способ основывается на определении характеристик товара, выделяющего его среди остального каталога. Именно его используют, чтобы найти и сопоставить множество товаров без чёткого артикула. 
Этот процесс делится на 5 этапов, сбор данных, анализ, стандартизация, матчинг и анализ. 

Сбор данных

В самом начале мы получаем каталог товаров с характеристиками и массив конкурентов. Перед сбором данных мы должны проанализировать уже имеющуюся информацию и запросить дополнительные сведения о товарах. После этого можно приступать к парсингу категорий товаров, представляющий собой неструктурированный массив, в котором перемешаны названия, характеристики, производитель и другая информация. Все эти элементы представлены в случайном порядке и различном формате. Собранную информацию нужно загрузить для анализа, чем больше входных данных будет получено, тем точнее получится анализ, но вместе с тем возрастёт и его сложность. 

Анализ

Теперь от массива полученной информации необходимо вручную отделить необходимые параметры и провести по ним матчинг. Для этого необходимо будет разделить товары по категориям. 

Стандартизация

Структурирование фильтров товаров при помощи выделенных параметров и есть процесс стандартизации. Ваши конкуренты могут иметь такой же набор параметров и характеристик в фильтрации товаров, но в другом порядке. Порядок не важен, самое главное это их наличие на сайте.

Матчинг

После стандартизации можно приступать к матчингу, сопоставлению товаров по заданным фильтрам. Поиск совпадений должен привести к нахождению совпадающих товаров в категориях ваших товаров и товаров конкурентов. Если углубиться в процесс, можно настроить значимость каждого параметра и задать допустимую погрешность для более точного сопоставления. Огромный набор параметров и значений может отпугнуть, но при соблюдении плана и погружении в понимание продукта вы сможете достигнуть хороших результатов.

Анализ матчинга

Сопоставив товары, вы можете увидеть, как при сопоставлении тысяч товаров друг с другом вы получили всего несколько сотен пар, в таком случае нужно определить причины ошибок. Вы можете добавить несколько переменных в список параметров или скорректировать его, а потом посмотреть на результаты. Сложно сказать, сколько раз нужно будет повторить данную процедуру, прежде чем вы получите удовлетворяющие результаты, может уйти несколько десятков попыток, главное добиться желаемого качества. После удачного сопоставления, на добавление новых товаров потребуется гораздо меньше времени. 

 

Запустите парсинг сайтов сейчас!

Получите все сразу: ежедневный мониторинг цен, поддержку 24/7 и удобные отчеты


Переход к демонстрации

Опишите в двух словах сферу вашей деятельности и укажите ваш E-mail. По желанию расскажите в комментарии любую дополнительную информацию или задайте нам вопросы.

Во время демонстрации вы сможете посмотреть на основные возможности системы по мониторингу и анализу цен. Мы готовы реализовать дополнительные нужные вам инструменты, чтобы наша система подходила под ваши задачи.