Кластерный анализ.

Кластерный анализ.
Статья посвящена кластерному анализу в маркетинге.

В самом общем определении кластер — это группа похожих вещей или людей, объединенная какими-либо общими признаками. В маркетинговых исследованиях кластер представляет собой набор объектов данных, которые в той или иной степени связаны друг с другом. Основная цель кластерного анализа состоит в том, чтобы классифицировать объекты в относительно однородные группы на основе набора рассматриваемых переменных. Эти переменные (демографические, психографические, покупательское поведение, отношение, предпочтения и т. д.) могут быть выбраны в соответствии с целями исследования рынка; какие проблемы необходимо решить и какие гипотезы необходимо доказать или опровергнуть. Кластеры не являются предопределенными, а скорее естественным образом предполагаются данными, выявляя любые сходства или различия. Поэтому важно, чтобы исследователь хорошо понимал цели анализа, что позволит собрать все соответствующие данные и провести корректный анализ.


При пороговом (или основанном на правилах) подходе к сегментации маркетолог выбирает априорные пороговые значения, как правило, в двух измерениях, и соответствующим образом разделяет клиентов.

Расскажем и о том, как проводить кластерный анализ:

1. Сформулируйте проблему. Выберите переменные, на которых будет основываться кластеризация. Переменные должны описывать сходство между объектами в терминах, имеющих отношение к проблеме исследования. Переменные следует выбирать на основе прошлых исследований, теории, проверяемых гипотез.

‍2. Выберите меру расстояния. Необходимо выбрать соответствующую меру расстояния, чтобы определить, насколько схожими должны быть объединяемые объекты.

3. Определите количество кластеров. Количество кластеров может основываться на теоретических, концептуальных или практических соображениях.

‍4. Интерпретируйте кластеры. Этот процесс включает в себя изучение центроидов кластеров. Центроиды представляют собой средние значения объектов, содержащихся в кластере, по каждой из переменных.

‍5. Оцените достоверность кластеризации. Некоторые методы проверки качества данных включают использование различных методов кластеризации и сравнение результатов или кластеризацию по меньшему набору переменных (случайно удаленных) и сравнение результатов со всем набором переменных.

Выделим преимущества и недостатки кластерного анализа. Среди преимуществ можно выделить:

· Практичность. Было бы практически невозможно использовать заранее определенные правила для точного сегментирования клиентов по многим параметрам.

· Однородность. Отклонения внутри каждой результирующей группы очень малы при кластерном анализе, тогда как сегментация на основе правил обычно группирует клиентов, которые на самом деле сильно отличаются друг от друга.

К недостаткам этого подхода относятся:

· Пороговые значения устанавливаются заранее, что приводит к результатам, которые обычно соответствуют первоначальным предположениям, в отличие от того, что сами данные позволяют выявить наиболее значимые различия среди конкретной анализируемой клиентской базы.

· Среди клиентов, найденных в каждом сегменте, могут быть очень большие различия.

· Очень сложно выполнить сегментацию более чем в двух измерениях.


Таким образом, кластеризация – это объединение объектов в однородные группы. Другими словами, это поиск схожих объектов, которые отличаются от остальных наблюдений по своим характеристикам. При качественном разбиении разброс значений внутри групп должен быть минимальным, а межгрупповой разброс максимальным. Выделяемые группы должны быть устойчивыми и воспроизводимыми.