Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Корреляционный анализ. Корреляционный анализ занимается степенью связи между двумя случайными величинами Х и Y



Корреляционный анализ занимается степенью связи между двумя случайными величинами Х и Y.

Корреляционный анализ экспериментальных данных для двух случайных величин заключает в себе следующие основные приемы:
1. Вычисление выборочных коэффициентов корреляции.
2. Составление корреляционной таблицы.
3. Проверка статистической гипотезы значимости связи.

Корреляционная зависимость между случайными величинами Х и Y называется линейной корреляцией, если обе функции регрессии f(x) и φ(x) являются линейными. В этом случае обе линии регрессии являются прямыми; они называется прямыми регрессии.

Для достаточно полного описания особенностей корреляционной зависимости между величинами недостаточно определить форму этой зависимости и в случае линейной зависимости оценить ее силу по величине коэффициента регрессии. Например, ясно, что корреляционная зависимость возраста Y учеников средней школы от года Х их обучения в школе является, как правило, более тесной, чем аналогичная зависимость возраста студентов высшего учебного заведения от года обучения, поскольку среди студентов одного и того же года обучения в вузе обычно наблюдается больший разброс в возраcте, чем у школьников одного и того же класса.

Для оценки тесноты линейных корреляционных зависимостей между величинами Х и Y по результатам выборочных наблюдений вводится понятие выборочного коэффициента линейной корреляции, определяемого формулой: , где и выборочные средние квадратические отклонения величин Х и Y, которые вычисляются по формулам:

, , .

Следует отметить, что основной смысл выборочного коэффициента линейной корреляции состоит в том, что он представляет собой эмпирическую (т.е. найденную по результатам наблюдений над величинами Х и Y) оценку соответствующего генерального коэффициента линейной корреляции r: .

Принимая во внимание формулы: видим, что выборочное уравнение линейной регрессии Y на Х имеет вид: , где . То же можно сказать о выборочном уравнений линейной регрессии Х на Y:

Основные свойства выборочного коэффициента линейной корреляции:

1. Коэффициент корреляции двух величин, не связанных линейной корреляционной зависимостью, равен нулю.

2. Коэффициент корреляции двух величин, связанных линейной корреляционной зависимостью, равен 1 в случае возрастающей зависимости и -1 в случае убывающей зависимости.

3. Абсолютная величина коэффициента корреляции двух величин, связанных линейной корреляционной зависимостью, удовлетворяет неравенству . При этом коэффициент корреляции положителен, если корреляционная зависимость возрастающая, и отрицателен, если корреляционная зависимость убывающая.

4. Чем ближе к 1, тем теснее прямолинейная корреляция между величинами Y, X.

По своему характеру корреляционная связь может быть прямой и обратной, а по силе – сильной, средней, слабой. Кроме того, связь может отсутствовать или быть полной.

Сила и характер связи между параметрами

Сила связи Характер связи
Прямая (+) Обратная (-)
Полная   -1
Сильная от 0,7 до 1 от -0,7 до -1
Средняя от 0,3 до 0,7 от -0,3 до -0,7
Слабая от 0,3 до 0 от -0,3 до 0
Связь отсутствует    

Графики линии регрессии:

1. Если , то линия регрессии параллельна оси Х. В этом случае говорят, что корреляционной зависимости между величинами Х и Y нет, т.е. при изменении Х среднее значение Y не изменяется.

2. Если , то . А это означает, что разброса значений Y относительно линии регрессии нет. Между Х и Y существует линейная функциональная зависимость.

Если выборочный коэффициент корреляции отличен от нуля, то необходимо при заданном уровне значимости проверить нулевую гипотезу : о равенстве нулю генерального коэффициента корреляции при конкурирующей гипотезе : . Если нулевая гипотеза отвергается, то это означает, что выборочный коэффициент корреляции значимо отличается от нуля, а X и Y – коррелированы, т.е. связаны линейной зависимостью. В противном случае выборочный коэффициент корреляции не значим, а X и Y – не коррелированы, т.е. не связаны линейной зависимостью.

Проверку гипотезы об отличии от нуля выборочного коэффициента корреляции осуществляем используя случайную величину , которая имеет распределение Стьюдента с степенями свободы.

Поскольку конкурирующая гипотеза имеет вид : , то критическая область должна быть двусторонняя.

Вычисляем наблюдаемое значение случайной величины по формуле и сравниваем с , определённым по таблице критических точек распределения Стьюдента (Приложение), по заданному уровню значимости и числу степеней свободы. Если , то нет оснований отвергать нулевую гипотезу, если , то нулевую гипотезу отвергают.

Пример 4. Изучалась зависимость между двумя величинами Y и Х. Результаты наблюдений приведены в таблице в виде двумерной выборки объема 11:

X                      
Y                      

Требуется:
1) Вычислить выборочный коэффициент корреляции;
2) Оценить характер и силу корреляционной зависимости;
3) Написать уравнение линейной регрессии Y на Х.

Решение. По известным формулам:

Отсюда, по (7) и (8):

Таким образом, следует сделать вывод, что рассматриваемая корреляционная зависимость между величинами Х и Y является по характеру – обратной, по силе – средней.

3) Уравнение линейной регрессии Y на Х:

Пример 5. Изучалась зависимость между качеством Y (%) и количеством Х (шт). Результаты наблюдений приведены в виде корреляционной таблицы:

Y\X         ny
           
           
           
           
90          
nx          

Требуется вычислить выборочный коэффициент линейной корреляции зависимости Y от Х.

1) Вычислить выборочный коэффициент корреляции;
2) Оценить характер и силу корреляционной зависимости;
3) Написать уравнение линейной регрессии Y на Х.

Решение. Для упрощения вычислений перейдем к новым переменным – условным вариантам (ui, vi), воспользовавшись формулами (*) (§3) при h1=4, h2=5, x0=26, y0=80. Для удобства перепишем данную таблицу в новых обозначениях:

u\v -2 -1     nv
-2          
-1          
           
           
           
nu          

Имеем при xi=ui и yj=vj:

Таким образом:

Отсюда,

Вывод: Корреляционная зависимость между величинами Х и Y - прямая и сильная.

Пример. Определить форму и направление взаимосвязи между показателями пульса покоя и абсолютными значениями пробы PWC170 у 13 исследуемых с помощью построения графика корреляционного поля, если данные выборок таковы:
xi, уд/мин ~ 80; 72; 71; 80; 84; 82; 78; 70; 83; 72; 72; 73; 81
yi, кГм/мин ~ 858; 979; 1071; 920; 982; 1000; 1004; 1022; 807; 1099; 817; 879; 982
Решение
1. Построим график данного корреляционного поля, отложив на оси Х в порядке возрастания показатели пульса покоя, на оси Y — абсолютные значения пробы PWC170.

2. Сделать вывод о форме и направлении взаимосвязи между исследуемыми показателями.

Вывод: график данного корреляционного поля позволяет предположить, что, возможно, между пульса покоя и абсолютными значениями пробы PWC170у исследуемой группы наблюдается прямая, обратная зависимость, т.е. со снижением показателя пульса покоя происходит увеличение абсолютных значений PWC170.





Дата публикования: 2015-01-10; Прочитано: 841 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.009 с)...