Главная Случайная страница Контакты | Мы поможем в написании вашей работы! | ||
|
(парный t -тест) сравнения выборочных средних двух зависимых выборок
Модифицированный критерий Стьюдента.
Пусть из двух генеральных совокупностей Х и Y, имеющих распределение, близкое к нормальному, извлечено по одной выборке одинаковых объемов, варианты в которых попарно зависимы. Такие выборки называются зависимыми.
Поскольку обычно хi ¹ уi (i =1,… n), то необходимо установить, являются ли значимыми различия между результатами попарно зависимых измерений хi и уi. Значимость различия между ними определяется с помощью модифицированного критерия Стьюдента.
Рассматриваемый в этом параграфе критерий применяется для сравнения двух методов исследования, осуществляемых одной лабораторией, или сравнения результатов исследований, проведенных одним и тем же методом, но в разных лабораториях.
Разность (расхождение) наблюдаемых величин обозначается через di = хi - уi, тогда среднее расхождений равно . Требуется проверить основную гипотезу Н 0: =0 при альтернативной гипотезе Н 1: ¹0.
Наблюдаемое значение модифицированного критерия Стьюдента вычисляется по формуле:
, (4.5)
где величина называется ошибкой средней разности и вычисляется по формуле:
, (4.6)
где объем выборки n = nх = nу, di = хi - уi, суммирование проводится по всем парам наблюдений.
Правило принятия решения при использовании модифицированного критерия Стьюдента.
По таблице критических точек распределения Стьюдента (или вычисляется в Excel) для заданного уровня значимости a и числа степеней свободы распределения Стьюдента, равного
k = n -1, (4.7)
находится критическая точка двусторонней критической области t a(k). Это значение сравнивается с наблюдаемым значением критерия :
· если < t a(k), то нет оснований отвергнуть основную гипотезу, то есть результаты измерений различаются незначимо;
· если ³ t a(k), то основная гипотеза отвергается, то есть различие между результатами измерений признается существенным, систематическим.
Сравнение средних двух зависимых выборок в Excel.
Проверка значимости различия между результатами попарно зависимых измерений по модифицированному критерию Стьюдента (4.5) осуществляется в Excel с помощью инструмента анализа Парный двухвыборочный t-тест для средних. Для его вызова следует выполнить команду Сервис ® Анализ данных. В появившемся диалоговом окне Анализ данных выбрать инструмент Парный двухвыборочный t-тест для средних и нажать ОК. В появившемся диалоговом окне с названием выбранного инструмента анализа порядок заполнения точно такой же, как и в диалоговых окнах для t-тестов независимых выборок, описанных в предыдущем параграфе. После заполнения всех необходимых полей этого окна и нажатия на кнопку ОК появится таблица с названием Парный двухвыборочный t-тест для средних,в которой будут содержаться результаты вычислений.
Данный тест вычисляет средние и дисперсии обеих выборок, их объемы, коэффициенты корреляции (в строке: Корреляция Пирсона), число степеней свободы (4.7) (в строке: df), наблюдаемое значение модифицированного критерия Стьюдента (4.5) (в строке: t-статистика), остальные строки называются также как и в таблицах t -тестов независимых выборок, описанных в предыдущем параграфе.
Вычисленное в этом тесте наблюдаемое значение критерия (4.5), находящееся в строке t-статистика, сравнивается с критической точкой распределения Стьюдента, находящееся в строке t критическое двухстороннее (для двухсторонней критической области), а затем принимается решение согласно указанному выше правилу.
Практические задания
5.1. Оценка значимости результатов наблюдений в случае двух независимых выборок
Исследуется результат действия нового препарата на зрительную память человека. В одной группе испытуемых препарат не вводился, а в контрольной группе тест проведен после ведения данного препарата. Результаты теста в первой группе (хi) и в контрольной группе (уi) выглядят следующим образом:
хi | ||||||||||||
уi |
Установить с уровнем значимости a=0,05, влияет ли данный препарат на зрительную память?
Для выполнения этого задания проделайте следующие пункты.
1. Наберите исходные данные в две колонки: - в столбец А, - в столбец В.
2. Сначала следует проверить гипотезу о равенстве генеральных дисперсий по критерию Фишера. Для этого выполните команду Сервис ® Анализ данных.
3. В появившемся диалоговом окне Анализ данных выберите среди инструментов анализа необходимый в данном случае Двухвыборочный F-тест для дисперсии и нажмите ОК.
4. В появившемся диалоговом окне Двухвыборочный F-тест для дисперсии поместите курсор в поле Интервал переменной 1 и введите в него адрес интервала ячеек с данными А1:А12 или выделите интервал ячеек с этими данными мышью, тогда адрес выделенного диапазона ячеек появится автоматически в поле, где находится курсор.
5. Поместите курсор в поле Интервал переменной 2. Затем введите адрес интервала ячеек с данными В1:В12 или выделите интервал ячеек с этими данными мышью, тогда адрес выделенного диапазона ячеек появится в поле, где находится курсор.
6. Проверьте, установлен ли необходимый вам уровень значимости a. По умолчанию в поле Альфа установлено значение 0,05.
7. В группе Параметры вывода активизируйте переключатель Выходной интервал и поместите курсор в ставшее активным (белым) поле ввода справа от него. Затем щелкните мышью по ячейке С1, тогда ее адрес появится в этом поле. Нажмите ОК.
8. В результате появится таблица с вычисленными значениями критерия Фишера. Сразу, не сбрасывая выделения с этой таблицы, выполните команду Формат ® Столбец ® Автоподбор ширины.
Полученная таблица должна иметь вид:
Двухвыборочный F-тест для дисперсии | ||
Переменная 1 | Переменная 2 | |
Среднее | 10,16666667 | 8,25 |
Дисперсия | 2,333333333 | 2,022727273 |
Наблюдения | ||
df | ||
F | 1,153558052 | |
P(F<=f) одностороннее | 0,408471047 | |
F критическое одностороннее | 2,817927225 |
9. В первой колонке этой таблицы находятся названия статистических характеристик, вычисленных данным Инструментом анализа. Во второй и третьей колонках содержатся их вычисленные значения для переменных хi и уi.
10. Из полученной таблицы следует, что средние =10,16666667; =8,25 (Среднее); исправленные дисперсии =2,333333333; =2,022727273 (Дисперсия); объемы выборок (Наблюдения) n =12; числа степеней свободы (4.2) распределения Фишера (df) kх =11 и kу =11; наблюдаемое значение критерия Фишера (F) =1,153558052; критические точки распределения Фишера для заданного уровня значимости a=0,05 правосторонней критической области (F критическое одностороннее) F a(kх, kу)=2,817927225; вероятность того, что наблюдаемое значение критерия не попало в правостороннюю критическую область (P(F<=f) одностороннее) P ( < F a)=0,408471047.
11. Воспользовавшись правилом принятия решения из §5.2. для критерия Фишера в случае двусторонней критической области, можно сделать вывод: поскольку выполняется соотношение =1,15<2,815= F 0,05(11;11), то нет оснований отвергнуть основную гипотезу, то есть разница дисперсий генеральных совокупностей является статистически недостоверной (незначимой).
12. Теперь следует сравнить средние двух выборок. Поскольку с помощью F -теста установлено, что различие между дисперсиями этих выборок статистически недостоверно, то для сравнения средних следует использовать инструмент анализа Двухвыборочный t-тест с одинаковыми дисперсиями.
13. Для его вызова выполните команду Сервис ® Анализ данных, выделите нужный инструмент и нажмите ОК.
14. В появившемся диалоговом окне Двухвыборочный t-тест с одинаковыми дисперсиями заполните все необходимые поля точно также, как и в предыдущем случае в окне Двухвыборочный F-тест для дисперсии за исключением того, что в группе Параметры вывода в поле Выходной интервал укажите адрес ячейки С12.
15. После заполнения всех необходимых полей (оставьте пустым поле гипотетическая разность и не активизируйте переключатель метка), нажмите на ОК. В результате выполнения t -теста должна появиться таблица:
Двухвыборочный t-тест с одинаковыми дисперсиями | ||
Переменная 1 | Переменная 2 | |
Среднее | 10,16666667 | 8,25 |
Дисперсия | 2,333333333 | 2,022727273 |
Наблюдения | ||
Объединенная дисперсия | 2,178030303 | |
Гипотетическая разность средних | ||
df | ||
t-статистика | 3,181194744 | |
P(T<=t) одностороннее | 0,002159563 | |
t критическое одностороннее | 1,717144187 | |
P(T<=t) двухстороннее | 0,004319126 | |
t критическое двухстороннее | 2,073875294 |
17. Структура этой таблицы примерно такая же, как и таблицы, появившейся после выполнения F -теста. После t -теста с одинаковыми дисперсиями, помимо выборочных средних и исправленных дисперсий выборок, вычисляются: дисперсия генеральной совокупности (Объединенная дисперсия) s2=2,178030303; число степеней свободы (4.4) распределения Стьюдента (df) k =22; наблюдаемой значение (4.3) критерия Стьюдента (t-статистика) =3,181194744; критические точки распределения Стьюдента для заданного уровня значимости a=0,05 правосторонней критической области (t критическое одностороннее) t a(k)=1,717144187 и двусторонней критической области (t критическое двухстороннее) t a(k)=2,073875294; вероятности того, что наблюдаемое значение критерия не попало соответственно в правостороннюю (P(T<=t) одностороннее) P ( < t a)=0,002159563 и в двухстороннюю (P(T<=t) двухстороннее) P (½ ½< t a)=0,004319126 критические области.
18. Воспользовавшись правилом принятия решения из §5.3. для критерия Стьюдента в случае двусторонней критической области, можно сделать вывод: поскольку выполняется соотношение =3,18>2,07= t 0,05(22), то основная гипотеза отвергается. Это означает, что по измеряемому показателю новый препарат оказывает влияние на зрительную память.
5.2. Сравнение выборочных средних двух зависимых выборок
В результаты семилетних испытаний ячменя и овса на урожайность получены следующие данные:
xi | 7,7 | 9,0 | 9,4 | 7,4 | 7,4 | 10,9 | 8,0 |
yi | 8,26 | 7,22 | 8,43 | 5,57 | 6,35 | 8,00 | 9,13 |
где xi – урожайность ячменя в ц/га и yi – урожайность овса в ц/га в i -ом году. Установить, являются ли эти результаты существенно различными?
Для выполнения этого задания проделайте следующие пункты.
1. Занесите исходные данные в две колонки: xi - в столбец А, yi -в столбец В.
2. Поскольку результаты испытаний связаны попарно, то следует использовать модифицированный критерий Стьюдента (парный t -тест для средних).
3. Выполните команду Сервис ® Анализ данных. В появившемся диалоговом окне Анализ данных выберите среди Инструментов анализа необходимый в данном случае Парный двухвыборочный t-тест для средних и нажмите ОК.
4. В появившемся диалоговом окне Парный двухвыборочный t-тест для средних в группе Входные данные поместите курсор в поле Интервал переменной 1. Затем введите адрес интервала ячеек с данными xi A1:A7, или выделите интервал с этими данными мышью, тогда адрес выделенного диапазона появится автоматически.
5. Поместите курсор в поле Интервал переменной 2. Затем введите адрес интервала ячеек с данными уi В1:В7, или выделите интервал с этими данными мышью, тогда адрес выделенного диапазона появится автоматически.
6. Проверьте, установлен ли необходимый вам уровень значимости a. По умолчанию в поле Альфа находится 0,05.
7. В группе Параметры вывода активизируйте переключатель Выходной интервал и поместите курсор в ставшее активным (белым) поле справа от него. Затем щелкните мышью по ячейке С1, тогда ее адрес появится в поле Выходного интервала. Нажмите ОК.
8. В результате появится таблица с вычисленными значениями выборочных средних, дисперсии, коэффициента корреляции и модифицированного критерия Стьюдента. Сразу, не сбрасывая выделения этой таблицы, выполните команду Формат ® Столбец ® Автоподбор ширины. Полученная таблица должна иметь вид:
Парный двухвыборочный t-тест для средних | ||
Переменная 1 | Переменная 2 | |
Среднее | 8,542857143 | 7,565714286 |
Дисперсия | 1,686190476 | 1,574161905 |
Наблюдения | ||
Корреляция Пирсона | 0,393061395 | |
Гипотетическая разность средних | ||
df | ||
t-статистика | 1,83746639 | |
P(T<=t) одностороннее | 0,057891988 | |
t критическое одностороннее | 1,943180905 | |
P(T<=t) двухстороннее | 0,115783975 | |
t критическое двухстороннее | 2,446913641 |
9. В первой колонке этой таблицы находятся названия статистических характеристик, вычисленных данным Инструментом анализа. Во второй и третьей колонках содержатся вычисленные значения соответствующих статистических характеристик для переменных хi и уi.
10. Из полученной таблицы следует, что средние =8,542857143; =7,565714286; исправленные дисперсии =1,686190476; =1,574161905; число наблюдений n =7; коэффициент корреляции (Корреляция Пирсона) rв =0,393061395; число степеней свободы (4.7) распределения Стьюдента (df) k =6; наблюдаемой значение (4.5) модифицированного критерия Стьюдента (t-статистика) =1,83746639; критические точки распределения Стьюдента для заданного уровня значимости a=0,05 правосторонней критической области (t критическое одностороннее) t a(k)=1,943180905 и двусторонней критической области (t критическое двухстороннее) t a(k)=2,446913641; вероятности того, что наблюдаемое значение критерия не попало соответственно в правостороннюю (P(T<=t) одностороннее) P ( < t a)=0,057891988 и в двухстороннюю (P(T<=t) двухстороннее) P (½ ½< t a)=0,115783975 критические области.
11. Воспользовавшись правилом принятия решения из §5.4. для модифицированного критерия Стьюдента в случае двусторонней критической области, можно сделать вывод: поскольку выполняется соотношение =1,84<2,45= t 0,05(6), то нет оснований отвергнуть основную гипотезу, то есть различие между ежегодной урожайностью ячменя и овса является статистически недостоверной (незначимой).
Дата публикования: 2015-03-26; Прочитано: 2873 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!