Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Середньоквадратичне відхилення точок від центру кластера



4. Розмір кластера може бути визначений або по радіусу кластера, або по середньоквадратичному відхиленню об’єктів для цього кластера.

Об’єкт відноситься до кластера, якщо відстань від об’єкту до центру кластера менше радіусу кластера. Якщо ця умова виконується для двох і більш за кластери, об’єкт є спірним.

Спірний об’єкт – це об’єкт, який у міру схожості може бути віднесений до декількох кластерів.

Неоднозначність даного завдання може бути усунена експертом або аналітиком.

Кластерний аналіз спирається на два припущення:

Перше припущення – дані ознаки об’єкту в принципі допускають бажане розбиття сукупності об’єктів на кластери.

Друге припущення – правильність вибору масштабу або одиниць вимірювання ознак.

Вибір масштабу в кластерному аналізі має велике значення. Розглянемо приклад. Уявимо собі, що дані ознаки х в наборі даних А на два порядки більше за дані ознаки у: значення змінної х знаходяться в діапазоні від 100 до 700, а значення змінної у – в діапазоні від 0 до 1. Тоді, при розрахунку величини відстані між точками, що відображають положення об’єктів в просторі їх властивостей, змінна, що має великі значення, тобто змінна х, буде практично повністю домінувати над змінною з малими значеннями, тобто змінною у.

Таким чином, через неоднорідність одиниць вимірювання ознак неможливо коректно розрахувати відстані між точками. Ця проблема вирішується за допомогою попередньої стандартизаціїзмінних.

Стандартизація (standardization) або нормування (normalization) приводить значення всіх перетворених змінних до єдиного діапазону значень шляхом виразу через відношення цих значень до якоїсь величини, що відображає певні властивості конкретної ознаки. Існують різні способи нормування початкових даних.

Найбільш поширені способи стандартизації:

– ділення початкових даних на середньоквадратичне відхилення відповідних змінних;

– обчислення Z-вклада або стандартизованного внеску.

Разом із стандартизацією змінних, існує варіант присвоєння кожній з них певного коефіцієнта важливості, або ваги, яка б відображала значущість відповідної змінної. Як ваги можуть виступати експертні оцінки, отримані в ході опитування експертів – фахівців даної області. Отримані добутки нормованих змінних на відповідні ваги дозволяють отримувати відстані між точками в багатовимірному просторі з урахуванням неоднакової ваги змінних.

В ході експериментів можливе порівняння результатів, отриманих з урахуванням експертних оцінок і без них, і вибір кращого з них.





Дата публикования: 2015-01-04; Прочитано: 704 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.005 с)...