Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

1 страница. Аналогично предыдущему определены расстояния других объектов с

10,19

2,00

12,17

Рис. 5.1.4

Аналогично предыдущему определены расстояния других объектов с

формируемой совокупностью, состоящей из 4 и 5 объектов, и составлена таблица расстояний, представленная в таблице 5.1.3.

Таблица 5.1.3

        4,5  
    2,83 3,16 10,19 13,60
      3,16 8,94 12,53
        7,07 10,44
4,5         2,24
           

Жирным шрифтом в таблице 5.1.3 выделено наименьшее расстояние между объектом 4,5 и шестым объектом. Их объединяем в один объект 4,5,6. Расстояния между этим укрупнённым и исходными объектами определены по правилу «ближайшего соседа» и представлены в таблице 5.1.4.

Таблица 5.1.4

        4,5,6
    2,83 3,16 10,19
      3,16 8,94
        7,07
4,5,6        

Жирным шрифтом в таблице 5.1.4 выделено наименьшее расстояние

между первым и вторым объектами. Их объединяем в один объект 1,2. Расстояния между этим укрупнённым и другими объектами определены по правилу «ближайшего соседа» и представлены в таблице 5.1.5

Таблица 5.1.5

  1,2   4,5,6
1,2   3,16 8,94
      7,07
4,5,6      

Жирным шрифтом в таблице 5.1.5 выделено наименьшее расстояние между объединённым объектом 1,2 и третьим объектами. Их объединяем

в один объект 1,2,3. Расстояния между укрупнёнными объектами опреде-лены по правилу «ближайшего соседа» и представлены в таблице 5.1.6.

Таблица 5.1.6

  1,2,3 4,5,6
1,2,3   7,07
4,5,6    

Таким образом процесс кластерного анализа закончен. Выделено два

кластера. Расстояние между кластерами равно 7,07. Дендрограмма

результатов кластерного анализа представлена на рис. 5.1.5.

Расстояние

8

7,07

6

1 2 3 4 5 6

Номера объектов

Рис.5.1.5

Представим результаты кластерного анализа в виде совокуп-ности двух матриц: расстояний между объектами (таблица 5.1.7) и символов Кронекера (таблица 5.1.8).

Таблица 5.1.7

             
    2,83 3,16 10,19 12,17 13,60
      3,16 8,94 10,77 12,53
        7,07 9,06 10,44
          2,00 3,61
            2,24
             

Таблица 5.1.8

             
    1,00 1,00 0,00 0,00 0,00
      1,00 0,00 0,00 0,00
        0,00 0,00 0,00
          1,00 1,00
            1,00
             

Подсчитаем сумму расстояний между объектами:

0+2,83+3,16+10,19+12,17+13,60+

0+ 0+ 3,16+ 8,94+10,77+12,53+

0+ 0+ 0+ 7,07+ 9,06+10,44+

0+ 0+ 0+ 0+ 2+ 3,61+

0+ 0+ 0+ 0+ 0+ 2,24 =111,77.

Среднее расстояние = 111,77/15=7,45.

Сумма расстояний между объектами, вошедшими в кластеры:

1∙2,83+1∙3,16+1∙3,16+1∙2,00+1∙3,61+1∙2,24=17,00.

Среднее расстояние между объектами в кластерах = 17,00/6=2,83.

Сумма расстояний между объектами, находящимися в разных кластерах:

(1-0)∙10,19+(1-0)∙12,17+(1-0)∙13,60+

+( 1-0)∙8,94+(1-0)∙10,77+(1-0)∙12,53+

+( 1-0)∙7,07+(1-0)∙9,06+ (1-0)∙10,44= 94,77.

Среднее расстояние между объектами, находящимися в разных кластерах

=94,77/9=10,53.

Таким образом, мы убедились, что условия постановки задачи выполнены, т.е. среднее расстояние между элементами в кластерах более, чем в два с половиной раза меньше чем среднее расстояние между объектами: 7,45/2,83=2,63; а расстояние между объектами, находящимися в различных кластерах почти в полтора раза превышает среднее расстояние между объектами 10,53/7,45=1,41.

Пример 5.2

Евклидово расстояние. Наиболее удалённый сосед

Требуется разделить шесть объектов на два кластера. Объекты –

информационные системы характеризуются двумя признаками:

Х1-среднее время решения одной задачи в минутах;

Х2-количество задач, в решении которых было отказано ввиду перегрузки информационной системы.

Значения признаков Х1 и Х2 для объектов представлены в таблице 5.2.1.

Таблица 5.2.1

             
X1            
X2            

Вычислены расстояния между объектами по формуле Евклида по всем признакам, которые представлены в таблице 5.2.2.

Таблица 5.2.2

             
    2,83 3,16 10,19 12,17 13,60
      3,16 8,94 10,77 12,53
        7,07 9,06 10,44
          2,00 3,61
            2,24
             

Жирным шрифтом в таблице 5.2.2 выделено наименьшее расстояние

между четвёртым и пятым объектами. Их объединяем в один объект 4,5. Расстояния между этим укрупнённым и исходными объектами определены по принципу «наиболее удалённого соседа», применение которого для вычисления расстояния между 1 объектом и формируемым объектом, который состоит из 4 и 5 объектов поясняет рис.5.2.1.

4

10,19

2,00

12,17

Рис. 5.2.1

Аналогично определены расстояния между другими объектами и

объектом, состоящим из 4 и 5 объектов, и составлена таблица расстояний 5.2.3

Таблица 5.2.3

        4,5  
    2,83 3,16 12,17 13,60
      3,16 10,77 12,53
        9,06 10,44
4,5         3,61
           

Жирным шрифтом в таблице 5.2.3 выделено наименьшее расстояние

между первым и вторым объектами. Их объединяем в один объект 1,2. Расстояния между этим укрупнённым и остальными объектами определены по правилу «наиболее удалённого соседа» и представлены в таблице 5.2.4.

Таблица 5.2.4

  1,2   4,5  
1,2   3,16 12,17 13,60
      9,06 10,44
4,5       3,61
         

Жирным шрифтом в таблице 5.2.4 выделено наименьшее расстояние между объектом 1.2 и третьим объектами. Их объединяем в один объект

1,2,3. Расстояния между этим укрупнённым и другими объектами определены по правилу «наиболее удалённого соседа» и представлены в таблице 5.2.5.

Таблица 5.2.5

  1,2,3 4,5  
1,2,3   12,17 13,60
4,5     3,61
       

Жирным шрифтом в таблице 5.2.5 выделено наименьшее расстояние между объединённым объектом 4,5 и шестым объектами. Их объединяем в

один объект 4,5.6. Расстояния между укрупнёнными объектами определены по правилу «наиболее удалённого соседа» и представлены в таблице 5.2.6.

Таблица 5.2.6

  1,2,3 4,5,6
1,2,3   13.60
4,5,6    

Таким образом процесс кластерного анализа закончен. Выделено два кластера. Расстояние между кластерами равно 13,6. Дендрограмма

результатов кластерного анализа представлена на рис. 5.2.2.

14 Расстояние

13,60

12

...

...

...

1 2 3 4 5 6

Номера объектов

Рис. 5.2.2

Дендрограмма, представленная на рис 5.2.2, отличается от дендрограммы, представленной на рис. 5.1.5. Все остальные результаты примера 5.1 и примера 5.2 одинаковы. Повторим их с изменением номеров таблиц. Представим результаты кластерного анализа в виде совокупности двух матриц: расстояний между объектами (таблица 5.2.7) и символов Кронекера (таблица 5.2.8).

Таблица 5.2.7

             
    2,83 3,16 10,19 12,17 13,60
      3,16 8,94 10,77 12,53
        7,07 9,06 10,44
          2,00 3,61
            2,24
             

Таблица 5.2.8

             
    1,00 1,00 0,00 0,00 0,00
      1,00 0,00 0,00 0,00
        0,00 0,00 0,00
          1,00 1,00
            1,00
             

Подсчитаем сумму расстояний между объектами:

0+2,83+3,16+10,19+12,17+13,60+

0+ 0+ 3,16+ 8,94+10,77+12,53+

0+ 0+ 0+ 7,07+ 9,06+10,44+

0+ 0+ 0+ 0+ 2+ 3,61+

0+ 0+ 0+ 0+ 0+ 2,24 =111,77.

Среднее расстояние = 111,77/15=7,45.

Сумма расстояний между объектами, вошедшими в кластеры:

1∙2,83+1∙3,16+1∙3,16+1∙2,00+1∙3,61+1∙2,24=17,00.

Среднее расстояние между объектами в кластерах = 17,00/6=2,83.

Сумма расстояний между объектами, находящимися в разных кластерах:

(1-0)∙10,19+(1-0)∙12,17+(1-0)∙13,60+

+( 1-0)∙8,94+(1-0)∙10,77+(1-0)∙12,53+

+( 1-0)∙7,07+(1-0)∙9,06+ (1-0)∙10,44= 94,77.

Среднее расстояние между объектами, находящимися в разных кластерах

=94,77/9=10,53.

Таким образом, мы убедились, что условия постановки задачи выполнены, т.е. среднее расстояние между элементами в кластерах более, чем в два с половиной раза меньше чем среднее расстояние между объектами: 7,45/2,83=2,63; а расстояние между объектами, находящимися в различных кластерах почти в полтора раза превышает среднее расстояние между объектами 10,53/7,45=1,41.

Пример 5.3

Евклидово расстояние. По среднему значению

Требуется разделить шесть объектов на два кластера. Объекты –

информационные системы характеризуются двумя признаками:

Х1-среднее время решения одной задачи в минутах;

Х2-количество задач, в решении которых было отказано ввиду перегрузки информационной системы.

Значения признаков Х1 и Х2 для шести объектов представлены в таблице 5.3.1.

Таблица 5.3.1

             
X1            
X2            

Вычислены расстояния между объектами по формуле Евклида по двум признакам, которые представлены в таблице 5.3.2.

Таблица 5.3.2

             
    2,83 3,16 10,19 12,17 13,60
      3,16 8,94 10,77 12,53
        7,07 9,06 10,44
          2,00 3,61
            2,24
             

Жирным шрифтом в таблице 5.3.2 выделено наименьшее расстояние

между четвёртым и пятым объектами. Их объединяем в один объект 4,5. Расстояния между этим укрупнённым и исходными объектами определены по принципу «среднего значения» и представлены в таблице 5.3.3. Вычисление среднего расстояния пояснено на рис. 5.3.1.

4

3,61

6 m=2,925

2,00

2,24

Рис. 5.3.1

Таблица 5.3.3

        4,5  
    2,83 3,16 11,18 13,60
      3,16 9,855 12,53
        8,065 10,44
4,5         2,925
           

Жирным шрифтом в таблице 5.3.3 выделено наименьшее расстояние

между первым и вторым объектами. Их объединяем в один объект 1,2. Расстояния между этим укрупнённым и остальными объектами определены по принципу «среднего значения» и представлены в таблице 5.3.4.

Таблица 5.3.4

  1,2   4,5  
1,2   3,16 10,5175 13,065
      8,0650 10,44
4,5       2,925
         

Жирным шрифтом в таблице 5.3.4 выделено наименьшее расстояние между объектом 4,5 и шестым объектом. Их объединяем в один объект 4,5,6. Расстояния между этим укрупнённым и другими объектами определены по

правилу «среднего значения» и представлены в таблице 5.3.5.

Таблица 5.3.5

  1,2   4,5,6
1,2   3,16 11,79125
      9,25250
4,5.6      

Жирным шрифтом в таблице 5.3.5 выделено наименьшее расстояние между объединённым объектом 1,2 и третьим объектом. Их объединяем в

один объект 1,2,3. Расстояния между укрупнёнными объектами определены по правилу «среднего значения» и представлены в таблице 5.3.6.

Таблица 5.3.6

  1,2,3 4,5,6
1,2,3   10,521875
4,5,6    

Таким образом процесс кластерного анализа закончен. Выделено два

кластера. Расстояние между выделенными кластерами равно 10,52. Дендрограмма результатов кластерного анализа представлена на рис. 5.3.2.

Расстояние

10,52
10

8

6

1 2 3 4 5 6

Номера объектов

Рис. 5.3.2

Дендрограмма, представленная на рис 5.3.2, отличается от дендрограммы, представленной на рис. 5.1.5. Все остальные результаты примера 5.1 и примера 5.3 одинаковы. Повторим их с изменением номеров таблиц. Представим результаты кластерного анализа в виде совокупности двух матриц: расстояний между объектами (таблица 5.3.7) и символов Кронекера (таблица 5.3.8).

Таблица 5.3.7


Дата публикования: 2015-01-09; Прочитано: 1040 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.022 с)...