Главная Случайная страница Контакты | Мы поможем в написании вашей работы! | ||
|
Иерархический кластерный анализ с предварительным факторным анализом
Рассмотрим пример из области географии. В 28 европейских странах в 1985 году были собраны следующие данные, выступающие здесь в качестве переменных:
Переменная | Значение |
land | Страна |
sb | Процент городского населения |
lem | Средняя продолжительность жизни мужчин |
lew | |
ks | Детская смертность на 1000 новорожденных |
so | Количество часов ясной погоды в году |
nt | Количество дней пасмурной погоды в году |
tjan | Средняя дневная температура в январе |
tjul | Средняя дневная температура в июле |
Эти данные вы увидите, если откроете файл europa.sav. Переменная land является текстовой переменной, предназначенной для обозначения страны.
Целью нашего кластерного анализа является нахождение стран с похожими свойствами. При самом общем рассмотрении переменных (от непосредственного указания стран мы здесь воздержимся) становится заметным, что данные, содержащиеся в файле связаны исключительно с ожидаемой продолжительностью жизни или с климатом. Лишь процентный показатель населения, проживающего в городах, не вписывается в эти рамки. Стало быть, сходства, которые возможно будут найдены между некоторыми странами, основываются на продолжительности жизни и климате этих стран.
Исходя из вышесказанного, в данном случае перед проведением кластерного анализа рекомендуется сократить количество переменных. Подходящим методом для этого является факторный анализ (см. гл. 19), который вы можете провести, выбрав в меню Analyze (Анализ) Data Reduction (Преобразование данных) Factor... (Факторный анализ)
Если Вы проведёте факторный анализ и примените, к примеру, вращение по методу варимакса, то получите два фактора. В первый фактор войдут переменные: lem. lew, ks и sb, а во второй фактор - переменные: so, nt, tjan и tjul. Первый фактор однозначно характеризует продолжительность жизни, причём высокое значение фактора означает высокую продолжительность жизни, а второй отражает климатические условия; здесь высокие значения означают тёплый и сухой климат. Вместе с тем, Вы наверняка заметили, что в первый фактор интегрирована и переменная sb, что очевидно указывает на высокую ожидаемую продолжительность жизни при высоких процентных долях городского населения. Вы можете рассчитать факторные значения для этих двух факторов и добавить их к файлу под именами fac1_1 и fac2_1. Чтобы Вам не пришлось самостоятельно проводить факторный анализ на этом этапе, указанные переменные уже включены в файл europa.sav. Вы можете видеть, к примеру, что высокой продолжительностью жизни обладают северные страны (высокие значения переменной fac1_1) или южные страны с тёплым и сухим климатом (высокие значения переменной fac2_1). Факторные значения можно вывести с помощью меню Analyze (Анализ) Reports (Отчёты) Case Summaries... (Итоги по наблюдениям)
Они выглядят следующим образом:
Case Summaries a (Итоги по наблюдениям)
LAND (Страна) | Lebenserwartung (Ожидаемая продолжительность жизни) | Klima (Климат) | |
ALBA | -1,78349 | ,57155 | |
BELG | ,55235 | -,57937 | |
BULG | -,43016 | -,13263 | |
DAEN | ,97206 | -,23453 | |
DDR | ,26961 | -,3351 1 | |
DEUT | ,19121 | -,44413 | |
FINN | -,30226 | -1,28467 | |
FRAN | 1,05511 | 1,04870 | |
GRIE | ,12794 | 2,65654 | |
GROS | ,75443 | -,05221 | |
IRLA | ,16370 | -,66514 | |
ISLA | 1,75315 | -,97421 | |
ITAL | ,40984 | 1,68933 | |
JUGO | -2,63161 | -,44127 | |
LUXE | -.16469 | -,98618 | |
NIED | 1,31001 | -,29362 | |
NORW | ,96317 | -,46987 | |
OEST | -,20396 | -,31971 | |
POLE | -,65937 | -,92081 | |
PORT | -1,10510 | 1,59478 | |
RUMA | -1,32450 | ,09481 | |
SCHD | 1,22645 | -,20543 | |
SCHZ | , 56289 | -,45454 | |
SOWJ | -,67091 | -1,32517 | |
SPAN | , 83627 | 1,91193 | |
TSCH | -,59407 | -,40632 | |
TUER | -,52049 | 1,04424 | |
UNGA | -,75761 | -,08695 | |
Total N |
a. Limited to first 100 cases (Ограничено первыми 100 наблюдениями).
Распределим эти 28 стран по кластерам при помощи двух факторов: ожидаемая продолжительность жизни и климат.
Дата публикования: 2015-04-10; Прочитано: 209 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!