Главная Случайная страница Контакты | Мы поможем в написании вашей работы! | ||
|
Методы, которые мы рассмотрели, являются «классикой» кластерного анализа. До последнего времени основным критерием, по которому оценивался алгоритм кластеризации, было качество кластеризации: полагалось, чтобы весь набор данных умещался в оперативной памяти.
Однако сейчас, в связи с появление сверхбольших баз данных, появились новые требования, которым должен удовлетворять алгоритм кластеризации. Основное из них - это масштабируемость алгоритма.
Отметим также другие свойства, которым должен удовлетворять алгоритм кластеризации: независимость результатов от порядка входных данных; независимость параметров алгоритма от входных данных.
В последнее время ведутся активные разработки новых алгоритмов кластеризации, способных обрабатывать сверхбольшие базы данных. В них основное внимание уделяется масштабируемости. К таким алгоритмам относятся обобщенное представление кластеров (summarized cluster representation), а также выборка и использование структур данных, поддерживаемых нижележащими СУБД.
Разработаны алгоритмы, в которых методы иерархической кластеризации интегрированы с другими методами. К таким алгоритмам относятся: BIRCH, CURE, CHAMELEON, ROCK.
Дата публикования: 2014-11-18; Прочитано: 691 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!