![]() |
Главная Случайная страница Контакты | Мы поможем в написании вашей работы! | |
|
Корреляционный анализ занимается степенью связи между двумя случайными величинами Х и Y.
Корреляционный анализ экспериментальных данных для двух случайных величин заключает в себе следующие основные приемы:
1. Вычисление выборочных коэффициентов корреляции.
2. Составление корреляционной таблицы.
3. Проверка статистической гипотезы значимости связи.
Корреляционная зависимость между случайными величинами Х и Y называется линейной корреляцией, если обе функции регрессии f(x) и φ(x) являются линейными. В этом случае обе линии регрессии являются прямыми; они называется прямыми регрессии.
Для достаточно полного описания особенностей корреляционной зависимости между величинами недостаточно определить форму этой зависимости и в случае линейной зависимости оценить ее силу по величине коэффициента регрессии. Например, ясно, что корреляционная зависимость возраста Y учеников средней школы от года Х их обучения в школе является, как правило, более тесной, чем аналогичная зависимость возраста студентов высшего учебного заведения от года обучения, поскольку среди студентов одного и того же года обучения в вузе обычно наблюдается больший разброс в возраcте, чем у школьников одного и того же класса.
Для оценки тесноты линейных корреляционных зависимостей между величинами Х и Y по результатам выборочных наблюдений вводится понятие выборочного коэффициента линейной корреляции, определяемого формулой: , где
и
выборочные средние квадратические отклонения величин Х и Y, которые вычисляются по формулам:
,
,
.
Следует отметить, что основной смысл выборочного коэффициента линейной корреляции состоит в том, что он представляет собой эмпирическую (т.е. найденную по результатам наблюдений над величинами Х и Y) оценку соответствующего генерального коэффициента линейной корреляции r:
.
Принимая во внимание формулы: видим, что выборочное уравнение линейной регрессии Y на Х имеет вид:
, где
. То же можно сказать о выборочном уравнений линейной регрессии Х на Y:
Основные свойства выборочного коэффициента линейной корреляции:
1. Коэффициент корреляции двух величин, не связанных линейной корреляционной зависимостью, равен нулю.
2. Коэффициент корреляции двух величин, связанных линейной корреляционной зависимостью, равен 1 в случае возрастающей зависимости и -1 в случае убывающей зависимости.
3. Абсолютная величина коэффициента корреляции двух величин, связанных линейной корреляционной зависимостью, удовлетворяет неравенству . При этом коэффициент корреляции положителен, если корреляционная зависимость возрастающая, и отрицателен, если корреляционная зависимость убывающая.
4. Чем ближе к 1, тем теснее прямолинейная корреляция между величинами Y, X.
По своему характеру корреляционная связь может быть прямой и обратной, а по силе – сильной, средней, слабой. Кроме того, связь может отсутствовать или быть полной.
Сила и характер связи между параметрами
Сила связи | Характер связи | |
Прямая (+) | Обратная (-) | |
Полная | -1 | |
Сильная | от 0,7 до 1 | от -0,7 до -1 |
Средняя | от 0,3 до 0,7 | от -0,3 до -0,7 |
Слабая | от 0,3 до 0 | от -0,3 до 0 |
Связь отсутствует |
Графики линии регрессии:
1. Если , то линия регрессии параллельна оси Х. В этом случае говорят, что корреляционной зависимости между величинами Х и Y нет, т.е. при изменении Х среднее значение Y не изменяется.
2. Если , то
. А это означает, что разброса значений Y относительно линии регрессии нет. Между Х и Y существует линейная функциональная зависимость.
Если выборочный коэффициент корреляции отличен от нуля, то необходимо при заданном уровне значимости проверить нулевую гипотезу
:
о равенстве нулю генерального коэффициента корреляции при конкурирующей гипотезе
:
. Если нулевая гипотеза отвергается, то это означает, что выборочный коэффициент корреляции значимо отличается от нуля, а X и Y – коррелированы, т.е. связаны линейной зависимостью. В противном случае выборочный коэффициент корреляции не значим, а X и Y – не коррелированы, т.е. не связаны линейной зависимостью.
Проверку гипотезы об отличии от нуля выборочного коэффициента корреляции осуществляем используя случайную величину
, которая имеет распределение Стьюдента с
степенями свободы.
Поскольку конкурирующая гипотеза имеет вид :
, то критическая область должна быть двусторонняя.
Вычисляем наблюдаемое значение случайной величины по формуле и сравниваем с
, определённым по таблице критических точек распределения Стьюдента (Приложение), по заданному уровню значимости и числу степеней свободы. Если
, то нет оснований отвергать нулевую гипотезу, если
, то нулевую гипотезу отвергают.
Пример 4. Изучалась зависимость между двумя величинами Y и Х. Результаты наблюдений приведены в таблице в виде двумерной выборки объема 11:
X | |||||||||||
Y |
Требуется:
1) Вычислить выборочный коэффициент корреляции;
2) Оценить характер и силу корреляционной зависимости;
3) Написать уравнение линейной регрессии Y на Х.
Решение. По известным формулам:
Отсюда, по (7) и (8):
Таким образом, следует сделать вывод, что рассматриваемая корреляционная зависимость между величинами Х и Y является по характеру – обратной, по силе – средней.
3) Уравнение линейной регрессии Y на Х:
Пример 5. Изучалась зависимость между качеством Y (%) и количеством Х (шт). Результаты наблюдений приведены в виде корреляционной таблицы:
Y\X | ny | ||||
90 | |||||
nx |
Требуется вычислить выборочный коэффициент линейной корреляции зависимости Y от Х.
1) Вычислить выборочный коэффициент корреляции;
2) Оценить характер и силу корреляционной зависимости;
3) Написать уравнение линейной регрессии Y на Х.
Решение. Для упрощения вычислений перейдем к новым переменным – условным вариантам (ui, vi), воспользовавшись формулами (*) (§3) при h1=4, h2=5, x0=26, y0=80. Для удобства перепишем данную таблицу в новых обозначениях:
u\v | -2 | -1 | nv | ||
-2 | |||||
-1 | |||||
nu |
Имеем при xi=ui и yj=vj:
Таким образом:
Отсюда,
Вывод: Корреляционная зависимость между величинами Х и Y - прямая и сильная.
Пример. Определить форму и направление взаимосвязи между показателями пульса покоя и абсолютными значениями пробы PWC170 у 13 исследуемых с помощью построения графика корреляционного поля, если данные выборок таковы:
xi, уд/мин ~ 80; 72; 71; 80; 84; 82; 78; 70; 83; 72; 72; 73; 81
yi, кГм/мин ~ 858; 979; 1071; 920; 982; 1000; 1004; 1022; 807; 1099; 817; 879; 982
Решение
1. Построим график данного корреляционного поля, отложив на оси Х в порядке возрастания показатели пульса покоя, на оси Y — абсолютные значения пробы PWC170.
2. Сделать вывод о форме и направлении взаимосвязи между исследуемыми показателями.
Вывод: график данного корреляционного поля позволяет предположить, что, возможно, между пульса покоя и абсолютными значениями пробы PWC170у исследуемой группы наблюдается прямая, обратная зависимость, т.е. со снижением показателя пульса покоя происходит увеличение абсолютных значений PWC170.
Дата публикования: 2015-01-10; Прочитано: 841 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!