Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Модифицированный критерий Стьюдента



(парный t -тест) сравнения выборочных средних двух зависимых выборок

Модифицированный критерий Стьюдента.

Пусть из двух генеральных совокупностей Х и Y, имеющих распределение, близкое к нормальному, извлечено по одной выборке одинаковых объемов, варианты в которых попарно зависимы. Такие выборки называются зависимыми.

Поскольку обычно хi ¹ уi (i =1,… n), то необходимо установить, являются ли значимыми различия между результатами попарно зависимых измерений хi и уi. Значимость различия между ними определяется с помощью модифицированного критерия Стьюдента.

Рассматриваемый в этом параграфе критерий применяется для сравнения двух методов исследования, осуществляемых одной лабораторией, или сравнения результатов исследований, проведенных одним и тем же методом, но в разных лабораториях.

Разность (расхождение) наблюдаемых величин обозначается через di = хi - уi, тогда среднее расхождений равно . Требуется проверить основную гипотезу Н 0: =0 при альтернативной гипотезе Н 1: ¹0.

Наблюдаемое значение модифицированного критерия Стьюдента вычисляется по формуле:

, (4.5)

где величина называется ошибкой средней разности и вычисляется по формуле:

, (4.6)

где объем выборки n = nх = nу, di = хi - уi, суммирование проводится по всем парам наблюдений.

Правило принятия решения при использовании модифицированного критерия Стьюдента.

По таблице критических точек распределения Стьюдента (или вычисляется в Excel) для заданного уровня значимости a и числа степеней свободы распределения Стьюдента, равного

k = n -1, (4.7)

находится критическая точка двусторонней критической области t a(k). Это значение сравнивается с наблюдаемым значением критерия :

· если < t a(k), то нет оснований отвергнуть основную гипотезу, то есть результаты измерений различаются незначимо;

· если ³ t a(k), то основная гипотеза отвергается, то есть различие между результатами измерений признается существенным, систематическим.

Сравнение средних двух зависимых выборок в Excel.

Проверка значимости различия между результатами попарно зависимых измерений по модифицированному критерию Стьюдента (4.5) осуществляется в Excel с помощью инструмента анализа Парный двухвыборочный t-тест для средних. Для его вызова следует выполнить команду Сервис ® Анализ данных. В появившемся диалоговом окне Анализ данных выбрать инструмент Парный двухвыборочный t-тест для средних и нажать ОК. В появившемся диалоговом окне с названием выбранного инструмента анализа порядок заполнения точно такой же, как и в диалоговых окнах для t-тестов независимых выборок, описанных в предыдущем параграфе. После заполнения всех необходимых полей этого окна и нажатия на кнопку ОК появится таблица с названием Парный двухвыборочный t-тест для средних,в которой будут содержаться результаты вычислений.

Данный тест вычисляет средние и дисперсии обеих выборок, их объемы, коэффициенты корреляции (в строке: Корреляция Пирсона), число степеней свободы (4.7) (в строке: df), наблюдаемое значение модифицированного критерия Стьюдента (4.5) (в строке: t-статистика), остальные строки называются также как и в таблицах t -тестов независимых выборок, описанных в предыдущем параграфе.

Вычисленное в этом тесте наблюдаемое значение критерия (4.5), находящееся в строке t-статистика, сравнивается с критической точкой распределения Стьюдента, находящееся в строке t критическое двухстороннее (для двухсторонней критической области), а затем принимается решение согласно указанному выше правилу.

Практические задания

5.1. Оценка значимости результатов наблюдений в случае двух независимых выборок

Исследуется результат действия нового препарата на зрительную память человека. В одной группе испытуемых препарат не вводился, а в контрольной группе тест проведен после ведения данного препарата. Результаты теста в первой группе (хi) и в контрольной группе (уi) выглядят следующим образом:

хi                        
уi                        

Установить с уровнем значимости a=0,05, влияет ли данный препарат на зрительную память?

Для выполнения этого задания проделайте следующие пункты.

1. Наберите исходные данные в две колонки: - в столбец А, - в столбец В.

2. Сначала следует проверить гипотезу о равенстве генеральных дисперсий по критерию Фишера. Для этого выполните команду Сервис ® Анализ данных.

3. В появившемся диалоговом окне Анализ данных выберите среди инструментов анализа необходимый в данном случае Двухвыборочный F-тест для дисперсии и нажмите ОК.

4. В появившемся диалоговом окне Двухвыборочный F-тест для дисперсии поместите курсор в поле Интервал переменной 1 и введите в него адрес интервала ячеек с данными А1:А12 или выделите интервал ячеек с этими данными мышью, тогда адрес выделенного диапазона ячеек появится автоматически в поле, где находится курсор.

5. Поместите курсор в поле Интервал переменной 2. Затем введите адрес интервала ячеек с данными В1:В12 или выделите интервал ячеек с этими данными мышью, тогда адрес выделенного диапазона ячеек появится в поле, где находится курсор.

6. Проверьте, установлен ли необходимый вам уровень значимости a. По умолчанию в поле Альфа установлено значение 0,05.

7. В группе Параметры вывода активизируйте переключатель Выходной интервал и поместите курсор в ставшее активным (белым) поле ввода справа от него. Затем щелкните мышью по ячейке С1, тогда ее адрес появится в этом поле. Нажмите ОК.

8. В результате появится таблица с вычисленными значениями критерия Фишера. Сразу, не сбрасывая выделения с этой таблицы, выполните команду Формат ® Столбец ® Автоподбор ширины.

Полученная таблица должна иметь вид:

Двухвыборочный F-тест для дисперсии  
  Переменная 1 Переменная 2
Среднее 10,16666667 8,25
Дисперсия 2,333333333 2,022727273
Наблюдения    
df    
F 1,153558052  
P(F<=f) одностороннее 0,408471047  
F критическое одностороннее 2,817927225  

9. В первой колонке этой таблицы находятся названия статистических характеристик, вычисленных данным Инструментом анализа. Во второй и третьей колонках содержатся их вычисленные значения для переменных хi и уi.

10. Из полученной таблицы следует, что средние =10,16666667; =8,25 (Среднее); исправленные дисперсии =2,333333333; =2,022727273 (Дисперсия); объемы выборок (Наблюдения) n =12; числа степеней свободы (4.2) распределения Фишера (df) kх =11 и kу =11; наблюдаемое значение критерия Фишера (F) =1,153558052; критические точки распределения Фишера для заданного уровня значимости a=0,05 правосторонней критической области (F критическое одностороннее) F a(kх, kу)=2,817927225; вероятность того, что наблюдаемое значение критерия не попало в правостороннюю критическую область (P(F<=f) одностороннее) P ( < F a)=0,408471047.

11. Воспользовавшись правилом принятия решения из §5.2. для критерия Фишера в случае двусторонней критической области, можно сделать вывод: поскольку выполняется соотношение =1,15<2,815= F 0,05(11;11), то нет оснований отвергнуть основную гипотезу, то есть разница дисперсий генеральных совокупностей является статистически недостоверной (незначимой).

12. Теперь следует сравнить средние двух выборок. Поскольку с помощью F -теста установлено, что различие между дисперсиями этих выборок статистически недостоверно, то для сравнения средних следует использовать инструмент анализа Двухвыборочный t-тест с одинаковыми дисперсиями.

13. Для его вызова выполните команду Сервис ® Анализ данных, выделите нужный инструмент и нажмите ОК.

14. В появившемся диалоговом окне Двухвыборочный t-тест с одинаковыми дисперсиями заполните все необходимые поля точно также, как и в предыдущем случае в окне Двухвыборочный F-тест для дисперсии за исключением того, что в группе Параметры вывода в поле Выходной интервал укажите адрес ячейки С12.

15. После заполнения всех необходимых полей (оставьте пустым поле гипотетическая разность и не активизируйте переключатель метка), нажмите на ОК. В результате выполнения t -теста должна появиться таблица:

Двухвыборочный t-тест с одинаковыми дисперсиями
  Переменная 1 Переменная 2
Среднее 10,16666667 8,25
Дисперсия 2,333333333 2,022727273
Наблюдения    
Объединенная дисперсия 2,178030303  
Гипотетическая разность средних    
df    
t-статистика 3,181194744  
P(T<=t) одностороннее 0,002159563  
t критическое одностороннее 1,717144187  
P(T<=t) двухстороннее 0,004319126  
t критическое двухстороннее 2,073875294  

17. Структура этой таблицы примерно такая же, как и таблицы, появившейся после выполнения F -теста. После t -теста с одинаковыми дисперсиями, помимо выборочных средних и исправленных дисперсий выборок, вычисляются: дисперсия генеральной совокупности (Объединенная дисперсия) s2=2,178030303; число степеней свободы (4.4) распределения Стьюдента (df) k =22; наблюдаемой значение (4.3) критерия Стьюдента (t-статистика) =3,181194744; критические точки распределения Стьюдента для заданного уровня значимости a=0,05 правосторонней критической области (t критическое одностороннее) t a(k)=1,717144187 и двусторонней критической области (t критическое двухстороннее) t a(k)=2,073875294; вероятности того, что наблюдаемое значение критерия не попало соответственно в правостороннюю (P(T<=t) одностороннее) P ( < t a)=0,002159563 и в двухстороннюю (P(T<=t) двухстороннее) P ½< t a)=0,004319126 критические области.

18. Воспользовавшись правилом принятия решения из §5.3. для критерия Стьюдента в случае двусторонней критической области, можно сделать вывод: поскольку выполняется соотношение =3,18>2,07= t 0,05(22), то основная гипотеза отвергается. Это означает, что по измеряемому показателю новый препарат оказывает влияние на зрительную память.

5.2. Сравнение выборочных средних двух зависимых выборок

В результаты семилетних испытаний ячменя и овса на урожайность получены следующие данные:

xi 7,7 9,0 9,4 7,4 7,4 10,9 8,0
yi 8,26 7,22 8,43 5,57 6,35 8,00 9,13

где xi – урожайность ячменя в ц/га и yi – урожайность овса в ц/га в i -ом году. Установить, являются ли эти результаты существенно различными?

Для выполнения этого задания проделайте следующие пункты.

1. Занесите исходные данные в две колонки: xi - в столбец А, yi -в столбец В.

2. Поскольку результаты испытаний связаны попарно, то следует использовать модифицированный критерий Стьюдента (парный t -тест для средних).

3. Выполните команду Сервис ® Анализ данных. В появившемся диалоговом окне Анализ данных выберите среди Инструментов анализа необходимый в данном случае Парный двухвыборочный t-тест для средних и нажмите ОК.

4. В появившемся диалоговом окне Парный двухвыборочный t-тест для средних в группе Входные данные поместите курсор в поле Интервал переменной 1. Затем введите адрес интервала ячеек с данными xi A1:A7, или выделите интервал с этими данными мышью, тогда адрес выделенного диапазона появится автоматически.

5. Поместите курсор в поле Интервал переменной 2. Затем введите адрес интервала ячеек с данными уi В1:В7, или выделите интервал с этими данными мышью, тогда адрес выделенного диапазона появится автоматически.

6. Проверьте, установлен ли необходимый вам уровень значимости a. По умолчанию в поле Альфа находится 0,05.

7. В группе Параметры вывода активизируйте переключатель Выходной интервал и поместите курсор в ставшее активным (белым) поле справа от него. Затем щелкните мышью по ячейке С1, тогда ее адрес появится в поле Выходного интервала. Нажмите ОК.

8. В результате появится таблица с вычисленными значениями выборочных средних, дисперсии, коэффициента корреляции и модифицированного критерия Стьюдента. Сразу, не сбрасывая выделения этой таблицы, выполните команду Формат ® Столбец ® Автоподбор ширины. Полученная таблица должна иметь вид:

Парный двухвыборочный t-тест для средних  
  Переменная 1 Переменная 2
Среднее 8,542857143 7,565714286
Дисперсия 1,686190476 1,574161905
Наблюдения    
Корреляция Пирсона 0,393061395  
Гипотетическая разность средних    
df    
t-статистика 1,83746639  
P(T<=t) одностороннее 0,057891988  
t критическое одностороннее 1,943180905  
P(T<=t) двухстороннее 0,115783975  
t критическое двухстороннее 2,446913641  

9. В первой колонке этой таблицы находятся названия статистических характеристик, вычисленных данным Инструментом анализа. Во второй и третьей колонках содержатся вычисленные значения соответствующих статистических характеристик для переменных хi и уi.

10. Из полученной таблицы следует, что средние =8,542857143; =7,565714286; исправленные дисперсии =1,686190476; =1,574161905; число наблюдений n =7; коэффициент корреляции (Корреляция Пирсона) rв =0,393061395; число степеней свободы (4.7) распределения Стьюдента (df) k =6; наблюдаемой значение (4.5) модифицированного критерия Стьюдента (t-статистика) =1,83746639; критические точки распределения Стьюдента для заданного уровня значимости a=0,05 правосторонней критической области (t критическое одностороннее) t a(k)=1,943180905 и двусторонней критической области (t критическое двухстороннее) t a(k)=2,446913641; вероятности того, что наблюдаемое значение критерия не попало соответственно в правостороннюю (P(T<=t) одностороннее) P ( < t a)=0,057891988 и в двухстороннюю (P(T<=t) двухстороннее) P ½< t a)=0,115783975 критические области.

11. Воспользовавшись правилом принятия решения из §5.4. для модифицированного критерия Стьюдента в случае двусторонней критической области, можно сделать вывод: поскольку выполняется соотношение =1,84<2,45= t 0,05(6), то нет оснований отвергнуть основную гипотезу, то есть различие между ежегодной урожайностью ячменя и овса является статистически недостоверной (незначимой).





Дата публикования: 2015-03-26; Прочитано: 2873 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.011 с)...