Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Рассмотрим несколько примеров



 
 

Предположим, n наблюдаемых объектов (автомобилей) оценивается в двумерном признаковом пространстве R2 с координатными осями: Х1 - стоимость автомобиля и Х2 - длительность рабочего ресурса мотора. При условии коррелированности Х1 и Х2 в системе координат появляется направленное и достаточно плотное скопление точек, формально отображаемое новыми осями (F1 и F2). Характерная особенность F1 и F2 заключается в том, что они проходят через плотные скопления точек и в свою очередь коррелируют с Х1 и Х2. Максимальное число новых осей Fr будет равно числу элементарных признаков (рис. 1 а, б).

На рисунке 1 дано геометрическое представление n наблюдаемых объектов в тривиальном пространстве элементарных признаков (а) и латентных факторов (б).

Допуская линейную зависимость Fr от Xj можем записать:

F1=a1x1+a2x2 и F2=a3x1+a4x2

Интерпретируем оси Fr: пусть F1 - экономичность автомобиля, F2 - его надежность в эксплуатации. Суждение об F1 и F2 базируется на оценке структуры латентных факторов, т. е. оценке весов Х1 и Х2 в Fr а именно по значениям коэффициентов aj.

Если объекты характеризуются достаточно большим числом элементарных признаков (т > 3), то логично и другое предположение - о существовании плотных скоплений точек (признаков) в пространстве n объектов. При этом новые оси обобщают уже не признаки Xj, а объекты ni, соответственно и латентные факторы Fr будут распознаны по составу наблюдаемых объектов:

Fr=c1n1+c2n2+…+cNnN,

где ci- вес объекта ni в факторе Fr.

Гипотетически легко представить следствием такого анализа, скажем, выявление классифицирующих факторов: F1 - промышленность, F2 - сельское хозяйство и т. п.

На рис. 2 приведён один из примеров распределения значений признаков 1 -стоимость автомобиля, Х2 - длительность рабочего ресурса мотора, Х3 - время набора максимальной скорости после старта, Х4 - количество потребляемого бензина на 100 км пути, Х5 - дальность тормозного пути) в координатном пространстве для двух видов автомобилей: n1 - «Вольво» и n2- «Фольксваген».

В зависимости от того, какой из рассмотренных выше тип корреляционной связи - элементарных признаков или наблюдаемых объектов исследуется в факторном анализе, различают R и Q - технические приемы обработки данных. Название R -техники носит объемный анализ данных по m признакам, в результате него получают r линейных комбинаций (групп) признаков (Fr=f(Xj);r =1..m).

Анализ по данным о близости (связи) n наблюдаемых объектов называется Q-техникой и позволяет определять r линейных комбинаций (групп) объектов: (F=f(ni);i =1..N).

В настоящее время на практике более 90% задач решается при помощи R- техники.

При использовании регрессионного анализа акцент делается на выявлении веса каждого факторного признака, воздействующего на результат, на количественную оценку чистого воздействия данного фактора при элиминировании остальных.

Существует и другой подход к исследованию структуры взаимодействия признаков, развивающийся в рамках факторного анализа. Этот подход основан на представлении о комплексном характере изучаемого явления, выражающемся, в частности, во взаимосвязях и взаимообусловленности отдельных признаков. Акцент в факторном анализе делается на исследовании внутренних причин, формирующих специфику изучаемого явления, на выявлении обобщенных факторов, которые стоят за соответствующими конкретными показателями.

Факторный анализ не требует априорного разделения признаков на зависимые и независимые, так как все признаки в нем рассматриваются как равноправные. Здесь нет допущения о неизменности всех прочих условий, свойственного регрессионно-корреляционному анализу.

Цель факторного анализа - сконцентрировать исходную информацию, выражая большое число рассматриваемых признаков через меньшее число более емких внутренних характеристик явления, которые, однако, не поддаются непосредственному измерению (например, уровень аграрного развития). При этом предполагается, что наиболее емкие характеристики окажутся одновременно и наиболее существенными, определяющими. В дальнейшем будем их называть обобщенными факторами (или просто факторами). Таким образом, главными целями факторного анализа являются: (1) сокращение числа переменных (редукция данных) и (2) определение структуры взаимосвязей между переменными, т.е. классификация переменных. Поэтому факторный анализ используется или как метод сокращения данных или как метод классификации.

Основной задачей, которую решают разнообразными методами факторного анализа, включая и метод главных компонент, является сжатие информации, переход от множества значений по m элементарным признакам с объемом информации (п * т) к ограниченному множеству элементов матрицы факторного

отображения (т * r) или матрицы значений неявных факторов для каждого наблюдаемого объекта размерностью (п *r), причем обычно r < т.

Методы факторного анализа позволяют также визуализировать структуру изучаемых явлений и процессов, а это значит определить их состояние и спрогнозировать развитие. Наконец, данные факторного анализа дают основания для идентификации объекта, т.е. решения задачи распознавания образа.

Методы факторного анализа обладают свойствами, весьма привлекательными для их использования в составе других статистических методов, наиболее часто в корреляционно-регрессионном анализе, кластерном анализе, многомерном шкалировании и др.





Дата публикования: 2014-11-18; Прочитано: 1196 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.007 с)...