Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Алгоритм WaveCluster



WaveCluster представляет собой алгоритм кластеризации на основе волновых преобразований. В начале работы алгоритма данные обоб­щаются путем наложения на пространство данных многомерной ре­шетки. На дальнейших шагах алгоритма анализируются не отдельные точки, а обобщенные характеристики точек, попавших в одну ячейку решетки. В результате такого обобщения необходимая информация умещается в оперативной памяти. На последующих шагах для опреде­ления кластеров алгоритм применяет волновое преобразование к обоб­щенным данным.

Главные особенности WaveCluster:

1. сложность реализации;

2. алгоритм может обнаруживать кластеры произвольных форм;

3. алгоритм не чувствителен к шумам;

4. алгоритм применим только к данным низкой размерности.

Алгоритм CLARA (Clustering LARge Applications)

Алгоритм CLARA был разработан Kaufmann и Rousseeuw в 1990 году для кластеризации данных в больших базах данных. Данный алгоритм строится в статистических аналитических пакетах, например, таких, как S+,

Изложим кратко суть алгоритма. Алгоритм CLARA извлекает мно­жество образцов из базы данных. Кластеризация применяется к каждому из образцов, на выходе алгоритма предлагается лучшая кластеризация.

Для больших баз данных этот алгоритм эффективнее, чем алгоритм РАМ. Эффективность алгоритма зависит от выбранного в качестве образ­ца набора данных. Хорошая кластеризация на выбранном наборе может не дать хорошую кластеризацию на всем множестве данных.





Дата публикования: 2014-11-18; Прочитано: 892 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.005 с)...