Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Непараметрические показатели связи



Коэффициент корреляции Фехнера. Наряду с параметрическими показателями для измерения корреляционной зависимости между признаками применяют и непараметрические показатели. Одним из них является коэффициент корреляции, предложенный Г. Фехнером (1897):

. (16)

Этот показатель основан на учете знаков отклонений вариант от их средних арифметических. Здесь С – число совпадений одинаковых, как положительных, так и отрицательных, знаков разностей и , а H – число несовпадающих знаков.

Коэффициент корреляции Фехнера может принимать значения от – 1 до + 1. При положительной корреляции он имеет положительный, а при отрицательной – отрицательный знак.

Применяя коэффициент корреляции Фехнера, следует иметь в виду, что по сравнению с параметрическими показателями непараметрические являются лишь приближенными оценками связи. Поэтому вычисление последних можно ограничиться сотыми долями единицы. Также нужно иметь в виду то, что закон распределения коэффициента корреляции Фехнера неизвестен, поэтому вопрос об оценке достоверности Rф остается открытым.

Коэффициент корреляции рангов. Из непараметрических показателей связи наиболее широкое применение нашел коэффициент корреляции рангов, предложенный К. Спирменом (1904):

, (17)

где – разность между рангами сопряженных значений признаков X и Y; n – число парных членов ряда, или объем выборки.

В основу конструкции этого показателя положены следующие соображения. Ранжируя попарно связанные значения признаков, можно видеть, как они распределяются относительно друг друга. Если возрастающим значениям одного признака X соответствуют возрастающие значения другого Y, то между ними существует положительная связь. Если же при возрастании значений одного признака значения другого последовательно уменьшаются, это указывает на наличие отрицательной связи между ними. При отсутствии корреляции ранжированным значениям одного признака будут соответствовать самые различные значения другого.

Обозначив ранжированные значения признаков порядковыми числами 1, 2, 3, 4, …, нетрудно определить ранги этих значений и по их разности судить о степени зависимости одного признака от изменения другого. Очевидно, при полной связи ранги коррелируемых признаков совпадут и разность между ними будет равна нулю. В таких случаях коэффициент корреляции рангов окажется равным единице. Если же признаки варьируют независимо друг от друга, то величина , и коэффициент корреляции рангов будет равен нулю. Таким образом, как и пирсоновский коэффициент корреляции и коэффициент корреляции Фехнера, коэффициент корреляции рангов выражается в долях единицы и может принимать значения от – 1 до + 1, т.е. сопровождаться положительным или отрицательным знаком.

Как и другие выборочные показатели, эмпирический коэффициент корреляции рангов служит оценкой генерального параметра ρS и, как величина случайная, меняет свои значения при повторных выборках из одной и той же генеральной совокупности. Значимость этого показателя, имеющего распределение со средней ρS = 0 и дисперсией , оценивают путем сравнения выборочного коэффициента RS с критической точкой Rst, которую можно определить по формуле

,

где n – объем выборки; t и m – величины, связанные с уровнем значимости α следующим образом: для α = 5% t = 1,96 и m = 0,16; для α = 1% t = 2,58 и m = 0,69. Нулевую гипотезу отвергают, если эмпирически найденная величина RS превзойдет или окажется равной критическому значению Rst для принятого уровня значимости α и объема выборки n. Чтобы каждый раз не рассчитывать критические точки Rst, составлена специальная таблица.

Рассчитывая коэффициент корреляции рангов, следует иметь в виду, что на его значения сказывается наличие групп с одинаковыми рангами, и тем сильнее, чем больше таких групп среди сопряженных значений признаков X и Y. Чтобы получить более или менее точную оценку генерального параметра ρS, нужно при наличии указанных групп вносить поправку в формулу (17). Эту поправку, обозначаемую буквой T, прибавляют к числителю формулы, т.е.

, (18)

где , а Vx – поправка для одного признака (ряд X), Vy – для другого признака (ряд Y). Для определения Vx и Vy составлена специальная таблица, в которой l обозначает число групп с одинаковыми рангами, а t – число рангов в этих группах (табл.2).

Таблица 2

l t              
  0,5 1,0 1,5 2,0 2,5 3,0 3,5
  2,0 4,0 6,0 8,0 10,0 12,0 14,0
  5,0 10,0 15,0 20,0 25,0 30,0 35,0
  10,0 20,0 30,0 40,0 50,0 60,0 70,0

Коэффициент ранговой корреляции Спирмена и другие непараметрические показатели независимы от закона распределения, и в этом их большая ценность. Они позволяют измерять тесноту сопряженности между такими признаками, которые не поддаются непосредственному измерению, но могут быть выражены баллами или другими условными единицами, позволяющими ранжировать выборку. Ценность коэффициента корреляции рангов заключается также в том, что он позволяет быстро оценивать взаимосвязь между признаками независимо от закона распределения.

Коэффициент ассоциации. Тесноту связи между качественными признаками X и Y, группируемыми в четырехпольную корреляционную таблицу, измеряют с помощью коэффициента ассоциации, или тетрахорического показателя связи, предложенного К. Пирсоном в 1901 г. В простейшем виде формула, по которой рассчитывают этот показатель, обозначаемый символом RA, выглядит следующим образом:

. (19)

Здесь a, b, c и d – численность корреляционных групп (вариант), распределяемых по клеткам четырехпольной таблицы.

Коэффициент ассоциации, как и другие подобные показатели, имеют прямое отношение к пирсоновскому критерию χ2, на котором он основан; в данном случае .

При этом коэффициент ассоциации изменяется от – 1 до +1. Значимость выборочного коэффициента ассоциации оценивают по величине критерия Пирсона χ2. Нулевая гипотеза сводится к предположению, что в генеральной совокупности этот показатель ρА равен нулю. Ho-гипотезу отвергают, если для принятого уровня значимости (α) и числа степеней свободы k = 1.

Значимость RA можно проверить и с помощью t-критерия Стьюдента. Нулевую гипотезу отвергают, если

для принятого уровня значимости (α) и числа степеней свободы .

Ранее было показано, что распределение вероятных значений критерия χ2 является непрерывным. Качественные же признаки дискретны, их числовые значения не распределяются непрерывно. Учитывая эту особенность, в формулу (19) принято вносить поправку Йейтса на непрерывность вариации, равную половине объема выборки. Формула (19) принимает следующий вид:

. (20)

Коэффициент ассоциации Юла. Этот непараметрический показатель связи между качественными признаками, группируемыми в четырехпольную таблицу, определяют по формуле

. (21)

Как величина случайная, коэффициент ассоциации Юла сопровождается статистической ошибкой

. (22)

В формулах (21) и (22) символы a, b, c и d имеют то же значение, что и формуле (19). Достоверность этого выборочного показателя проверяют по величине t-критерия Стьюдента.

Коэффициент взаимной сопряженности. Для определения степени сопряженности между качественными признаками с числами вариант, большими двух, служит коэффициент взаимной сопряженности или полихорический показатель связи, предложенный К. Пирсоном:

, (23)

где – величина, в которой fxy обозначает частоты в клетках многопольной корреляционной таблицы, а и – суммы частот по строкам и столбцам той же таблицы; – общая сумма частот, или объем выборки.

Пирсоновский коэффициент взаимной сопряженности ) имеет один существенный недостаток: его значение значительно зависит от количества вариант коррелируемых качественных признаков.

Учитывая этот недостаток, А.А. Чупров внес поправки в формулу (23), которые приняли следующие выражения:

. (24)

Здесь К – коэффициент взаимной сопряженности Чупрова; nx и ny – численность групп по строкам и столбцам многопольной таблицы; N – объем выборки. Остальные символы объяснены выше. Нулевую гипотезу отвергают, если для принятого уровня значимости и числа степеней свободы.

Необходимо помнить, что правильное применение критерия χ2 основано на требовании, чтобы в клетках корреляционной таблицы содержалось не менее пяти вариант и чтобы общее число наблюдений не было меньше 50. Несоблюдение этих требований не гарантирует получение достаточно точных оценок генерального параметра ρ2χ, а следовательно, и правильных выводов, которые делают на основании выборочных показателей.

Коэффициент корреляции знаков. Иногда коррелируемые признаки выражаются не числами, а знаками: наличие признака – знаком плюс, отсутствие – знаком минус. Такие случаи встречаются, например, в психоло-педагогических исследованиях, когда выясняют зависимость между поведенческими признаками. Для измерения корреляции между такими признаками предложена формула

, (25)

где P(XY) – число совпадений положительных знаков в общей серии испытаний, отнесенной к их числу n, т.е. ; P(X) и P(Y) – частости положительного знака для каждого признака отдельно, т.е. и .

Коэффициент корреляции знаков принимает значения от нуля до единицы. Чем сильнее связь между признаками, тем этот показатель ближе к единице, и, наоборот, чем слабее зависимость одного признака от другого, тем меньше будет и коэффициент корреляции знаков.

Бисериальный коэффициент корреляции. Для измерения тесноты связи между качественными признаками с двумя вариантами и количественными признаками используют бисериальный коэффициент корреляции

, (26)

где и – средние арифметические из отдельных значений альтернативных групп с их объемами n1 и n2; – общее число наблюдений, или объем выборки; sx – среднее квадратическое отклонение для всей выборки.

Бисериальный коэффициент корреляции изменяется от – 1 до + 1; при он равен нулю. Знак для этого показателя не имеет, однако, смыслового значения.

Значимость выборочного Rbs оценивают по величине t-критерия Стьюдента с числом степеней свободы и принимаемым уровнем значимости.





Дата публикования: 2015-01-10; Прочитано: 1107 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.01 с)...