Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Пример 3. Иерархический кластерный анализ с предварительным факторным анализом



Иерархический кластерный анализ с предварительным факторным анализом

Рассмотрим пример из области географии. В 28 европейских странах в 1985 году были собраны следующие данные, выступающие здесь в качестве переменных:

Переменная Значение
land Страна
sb Процент городского населения
lem Средняя продолжительность жизни мужчин
lew  
ks Детская смертность на 1000 новорожденных
so Количество часов ясной погоды в году
nt Количество дней пасмурной погоды в году
tjan Средняя дневная температура в январе
tjul Средняя дневная температура в июле

Эти данные вы увидите, если откроете файл europa.sav. Переменная land является текстовой переменной, предназначенной для обозначения страны.

Целью нашего кластерного анализа является нахождение стран с похожими свойствами. При самом общем рассмотрении переменных (от непосредственного указания стран мы здесь воздержимся) становится заметным, что данные, содержащиеся в файле связаны исключительно с ожидаемой продолжительностью жизни или с климатом. Лишь процентный показатель населения, проживающего в городах, не вписывается в эти рамки. Стало быть, сходства, которые возможно будут найдены между некоторыми странами, основываются на продолжительности жизни и климате этих стран.

Исходя из вышесказанного, в данном случае перед проведением кластерного анализа рекомендуется сократить количество переменных. Подходящим методом для этого является факторный анализ (см. гл. 19), который вы можете провести, выбрав в меню Analyze (Анализ) Data Reduction (Преобразование данных) Factor... (Факторный анализ)

Если Вы проведёте факторный анализ и примените, к примеру, вращение по методу варимакса, то получите два фактора. В первый фактор войдут переменные: lem. lew, ks и sb, а во второй фактор - переменные: so, nt, tjan и tjul. Первый фактор однозначно характеризует продолжительность жизни, причём высокое значение фактора означает высокую продолжительность жизни, а второй отражает климатические условия; здесь высокие значения означают тёплый и сухой климат. Вместе с тем, Вы наверняка заметили, что в первый фактор интегрирована и переменная sb, что очевидно указывает на высокую ожидаемую продолжительность жизни при высоких процентных долях городского населения. Вы можете рассчитать факторные значения для этих двух факторов и добавить их к файлу под именами fac1_1 и fac2_1. Чтобы Вам не пришлось самостоятельно проводить факторный анализ на этом этапе, указанные переменные уже включены в файл europa.sav. Вы можете видеть, к примеру, что высокой продолжительностью жизни обладают северные страны (высокие значения переменной fac1_1) или южные страны с тёплым и сухим климатом (высокие значения переменной fac2_1). Факторные значения можно вывести с помощью меню Analyze (Анализ) Reports (Отчёты) Case Summaries... (Итоги по наблюдениям)

Они выглядят следующим образом:

Case Summaries a (Итоги по наблюдениям)

  LAND (Страна) Lebenserwartung (Ожидаемая продолжительность жизни) Klima (Климат)
  ALBA -1,78349 ,57155
  BELG ,55235 -,57937
  BULG -,43016 -,13263
  DAEN ,97206 -,23453
  DDR ,26961 -,3351 1
  DEUT ,19121 -,44413
  FINN -,30226 -1,28467
  FRAN 1,05511 1,04870
  GRIE ,12794 2,65654
  GROS ,75443 -,05221
  IRLA ,16370 -,66514
  ISLA 1,75315 -,97421
  ITAL ,40984 1,68933
  JUGO -2,63161 -,44127
  LUXE -.16469 -,98618
  NIED 1,31001 -,29362
  NORW ,96317 -,46987
  OEST -,20396 -,31971
  POLE -,65937 -,92081
  PORT -1,10510 1,59478
  RUMA -1,32450 ,09481
  SCHD 1,22645 -,20543
  SCHZ , 56289 -,45454
  SOWJ -,67091 -1,32517
  SPAN , 83627 1,91193
  TSCH -,59407 -,40632
  TUER -,52049 1,04424
  UNGA -,75761 -,08695
Total N      

a. Limited to first 100 cases (Ограничено первыми 100 наблюдениями).

Распределим эти 28 стран по кластерам при помощи двух факторов: ожидаемая продолжительность жизни и климат.





Дата публикования: 2015-04-10; Прочитано: 209 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.006 с)...