Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Выборочный коэффициент корреляции



Решение второй задачи корреляционного анализа, то есть определение тесноты связи между признаками, сводится к нахождению выборочного коэффициента линейной корреляции

.

Значение коэффициента изменяется в пределах от -1 до 1. Чем ближе значение к 1, тем корреляционная связь между рассматриваемыми признаками теснее. Чем ближе значение к нулю, тем слабее связь между рассматриваемыми признаками. Оценку тесноты линейной связи между можно представить в следующей таблице.

Оценка тесноты линейной связи

Значение 0-0,1 0,1-0,3 0,3- 0,5 0,5-0,7 0,7-0,9 0,9-0,99  
Теснота линейной связи Нет Слабая Умеренная Заметная Высокая Очень высокая Функциональная

Знак коэффициента указывает на направление связи. Если , то связь между рассматриваемыми признаками прямая, то есть с увеличением значений одного признака значения другого признака тоже увеличиваются. Если , то связь между рассматриваемыми признаками обратная, то есть с увеличением значений одного признака значения другого признака уменьшаются.

Замечание: С помощью выборочного коэффициента корреляции можно судить не только о тесноте и направлении связи между признаками, но и предположить вид функциональной зависимости. Если значение близко с корреляционным отношением , то это дает основание выдвинуть гипотезу о том, что в генеральной совокупности функция регрессии линейная, то есть имеет вид . Причем, заметим схожесть формулы для вычисления выборочного коэффициента корреляции и коэффициентов линейной регрессии и , запишем их

; ; .

Следовательно, формулы для вычисления коэффициентов линейной регрессии можно преобразовать к виду

; .

Выборочный коэффициент корреляции является оценкой для коэффициента корреляции генеральной совокупности. Допустим, что выборочный коэффициент корреляции , найденный по выборке оказался отличен от нуля, то есть связь между рассматриваемыми признаками существует. Но это не значит, что коэффициент корреляции генеральной совокупности так же отличен от нуля, так как выборка производится случайным образом.

Поэтому, возникает необходимость проверки гипотезы о значимости коэффициента корреляции, то есть, значимо ли он отличается от нуля в генеральной совокупности.

Пусть и .

Если нулевая гипотеза будет принята, то коэффициент корреляции является не значимым, то есть он не значимо отличается от нуля в генеральной совокупности, следовательно, связь между рассматриваемыми признаками отсутствует. Если основная гипотеза будет отвергнута, то коэффициент корреляции является значимым, следовательно, связь между рассматриваемыми признаками существует.

Проверка гипотезы о значимости коэффициента корреляции производится по t- критерию Стьюдента. Для его применения необходимо знать две величины и , которые сравнивают между собой, и, если будет получено неравенство , то основную гипотезу отвергают и считают коэффициент корреляции значимым с вероятностью . В противном случае основную гипотезу принимают и считают коэффициент корреляции не значимым.

Наблюдаемое значение критерия вычисляют по формуле

.

Для нахождения критического значения , необходимо знать уровень значимости и число степеней свободы , и воспользоваться таблицей критических точек распределения Стьюдента (приложение 6).

Кроме проверки гипотезы о значимости генерального коэффициента корреляции, находят для него доверительный интервал по формуле

,

где - это стандартная ошибка при вычислении выборочного коэффициента корреляции;

- табличное значение (приложение 6).

Пример. Найти выборочный коэффициент корреляции по данным, приведенным в таблице.Проверить значимость коэффициента корреляции при уровне значимости . Найти доверительный интервал для генерального коэффициента корреляции.

x y       ny
         
         
         
nx        

Решение. Найдем условные средние

; ;

; ;

; .

Для удобства вычислений составим расчетные таблицы.

           
        47,1 4380,3
        108,67 26624,15
      - 32004,45
           
        3,06 4268,7
        4,96 26734,4
      - 32003,1

Тогда ; ;

; ;

;

;

.

.

Так как , то связь между рассматриваемыми признаками очень высокая, и так как , то связь прямая.

Проверим гипотезу о значимости коэффициента корреляции, то есть проверим гипотезу и

.

Воспользуемся t - критерием Стьюдента, найдем и :

.

Так как , , то

.

Таким образом, так как , то основную гипотезу отвергаем и считаем генеральный коэффициент корреляции значимым с вероятностью 0,95, то есть он значимо отличается от нуля и связь между рассматриваемыми признаками X и Y в генеральной совокупности существует.

Найдем доверительный интервал для генерального коэффициента корреляции, для этого рассчитаем стандартную ошибку для выборочного коэффициента корреляции . Получим

.

Найдем . Тогда доверительный интервал будет иметь вид:

; .

Найденный интервал показывает, что при повторении опыта 100 раз в 95 случаях истинное значение коэффициента линейной корреляции генеральной совокупности будет заключено в интервале от 0,9 до 1.





Дата публикования: 2014-10-20; Прочитано: 3828 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.008 с)...