Главная Случайная страница Контакты | Мы поможем в написании вашей работы! | ||
|
Разделение выборки объектов на непересекающиеся подмножества (кластеры) так, чтобы каждый кластер состоял из схожих объектов, а объекты разных кластеров существенно отличались.
Цели кластеризации
l Понимание данных (Каждому кластеру – свой метод анализа)
l Сжатие данных (Один типичный представитель от каждого кластера)
l Novelty Detection (Выделение нетипичных объектов)
Мера расстояния между кластерами – Евклидово расстояние
Методы объединения объектов в кластеры
l «Ближнего соседа»
l «Дальнего соседа»
l Центроидный
l Варда
l Невзвешенного попарного среднего
Взвешенного попарного среднего
Характеристики кластера
l Центр кластера - среднее геометрическое место точек в пространстве переменных.
l Радиус кластера - максимальное расстояние точек от центра кластера.
l Спорный объект - объект, который может быть отнесен к нескольким кластерам.
l Размер кластера может быть определен либо по радиусу кластера, либо по среднеквадратичному отклонению объектов для этого кластера.
l Объект относится к кластеру, если расстояние от объекта до центра кластера не больше радиуса кластера. Если это условие выполняется для двух и более кластеров, объект является спорным.
Дата публикования: 2015-01-09; Прочитано: 887 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!