Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Определение количества кластеров



Существует проблема определения числа кластеров. Иногда можно априорно определить это число. Однако в большинстве случаев число кластеров определяется в процессе агломерации/разделения множества объектов.

Процессу группировки объектов в иерархическом кластерном ана­лизе соответствует постепенное возрастание коэффициента, называемого критерием Е. Скачкообразное увеличение значение критерия Е можно определить как характеристику числа кластеров, которые действительно существуют в исследуемом наборе данных. Таким образом, этот способ сводится к определению скачкообразного увеличения некоторого коэф­фициента, который характеризует переход от сильно связанного к слабо связанному состоянию объектов.

В таблице 13.2 мы видим, что значение поля Coefficients увеличивает­ся скачкообразно, следовательно, объединение в кластеры следует оста­новить, иначе будет происходить объединение кластеров, находящихся на относительно большом расстоянии друг от друга.

В нашем примере — это скачок с 1,217 до 7,516. Оптимальным счита­ется количество кластеров, равное разности количества наблюдений (14) и количества шагов до скачкообразного увеличения коэффициента (12).

Следовательно, после создания двух кластеров объединений боль­ше производить не следует, хотя визуально мы ожидали появления трех кластеров.

Агрегирование данных может быть представлено графически в ви­де дендрограммы. Она определяет объединенные кластеры и значения коэффициентов на каждом шаге агломерации (отображены значения коэффициентов, приведенные к шкале от 0 до 25).

Дендрограмма для нашего примера приведена на рис.13.5. Разрез дерева агрегирования вертикальной чертой дал нам два кластера, состо­ящих из 9 и 5 объектов.

На верхней линии по горизонтали отмечены номера шагов алгоритма, всего алгоритму потребовалось 25 шагов для объединения всех объектов в один кластер.

CASE 0 5 10 15 20 25

Label Num +------------+-------------+-------------+-------------+-------------+

Case 9
Case 10
Case 3
Case 13
Case 1
Case 5
Case 8
Case 4
Case 12
Case 6
Case 7
Case 2
Case 14
Case 11

Рис.13.5. Дендрограмма процесса слияния





Дата публикования: 2014-11-18; Прочитано: 1135 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.007 с)...