Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

ТЕМА. Проверка статистических гипотез



Поскольку статистика как метод исследования имеет дело с данным, в которых интересующие исследователя закономерности искажены различными случайными факторами, большинство статистических вычислений сопровождается проверкой некоторых предположений или гипотез об источнике этих данных.

Статистическая гипотеза – это предположение о свойствах случайных величин или событий, которое мы хотим проверить по имеющимся данным.

Примеры статистических гипотез в педагогических исследованиях:

Гипотеза 1. Успеваемость класса стохастически (вероятностно) зависит от уровня обучаемости учащихся.

Гипотеза 2. Усвоение начального курса математики не имеет существенных различий у учащихся, начавших обучение с 6 или 7 лет.

Гипотеза 3. Проблемное обучение в первом классе эффективнее по сравнению с традиционной методикой обучения в отношении общего развития учащихся.

Нулевая гипотеза – это основное проверяемое предположение, которое обычно формулируется как отсутствие различий, отсутствие влияние фактора, отсутствие эффекта, равенство нулю значений выборочных характеристик и т.п. Примером нулевой гипотезы в педагогике является утверждение о том, что различие в результатах выполнения двумя группами учащихся одной и той же контрольной работы вызвано лишь случайными причинами.

Другое проверяемое предположение (не всегда строго противоположное или обратное первому) называется конкурирующей или альтернативной гипотезой. Так, для упомянутого выше примера гипотезы Н0 в педагогике одна из возможных альтернатив Н1 будет определена как: уровни выполнения работы в двух группах учащихся различны и это различие определяется влиянием неслучайных факторов, например, тех или других методов обучения.

Выдвинутая гипотеза может быть правильной или неправильной, поэ­тому возникает необходимость проверить ее. Так как проверку произво­дят статистическими методами, то данная проверка называется статистической.

Статистической проверкой статистической гипотезы называется процедура обоснованного сопоставления сформулированной гипотезы с полученными в ходе эксперимента выборочными данными . Обозначается гипотеза буквой .

Смысл проверки статистической гипотезы состоит в том, чтобы по имеющимся статистическим данным принять или отклонить статистическую гипотезу с минимальным рисков ошибки. Эта проверка осуществляется по определенным правилам.

Проверка статистических гипотез осуществляется с помощью статистического критерия (назовем его в общем виде К), являющегося функцией от результатов наблюдения.

Статистический критерий – это правило (формула), по которому определяется мера расхождения результатов выборочного наблюдения с высказанной гипотезой .

Статистическая проверка гипотез имеет вероятностный характер, так как принимаемые вывод основываются на изучении свойств распределения случайной переменной по данным выборки, а потому всегда существует риск допустить ошибку. Однако с помощью статистической проверки гипотез можно определить вероятность принятия ложного решения. Если вероятность последнего невелика, то можно считать, что применяемый критерий обеспечивает малый риск ошибки.

При проверке гипотез имеется возможность совершить ошибку двоякого рода:

а) ошибка первого рода - проверяемая гипотеза () является в действительности верной, но результаты проверки приводят к отказу от нее;

б) ошибка второго рода - проверяемая гипотеза в действительности является ошибочной, но результаты проверки приводят к принятию.

В статистике в настоящее время имеется большое число критериев для проверки практически любых гипотез. Притом основные принципы их построения и применения являются общими.

Под уровнем значимости понимается вероятность риска отклонить правильную гипотезу. В то же время уровень значимости есть минимальная вероятность, начиная с которой событие признаётся практически невозможным (маловероятным) и при единичном испытании не наступает. Обычно принимают .

Критерии не доказывают справедливость гипотезы, а лишь устанавливают её согласие или несогласие с данными наблюдениями.

Значение критерия, рассчитываемое по специальным правилам на основании выборочных данных, называется наблюдаемым значением критерия ().

Значения критерия, разделяющие совокупность значений критерия на область допустимых значений (наиболее правдоподобных в отношении нулевой гипотезы ) и критическую область (область значений, менее правдоподобных в отношении нулевой гипотезы ), определяемые на заданном уровне значимости а по таблицам распределения случайной величины К, выбранной в качестве критерия, называются критическими точками ().

Областью допустимых значений (областью принятия нулевой гипотезы ) называют совокупность значений критерия К, при которых нулевая гипотеза не отклоняется.

Критической областью называют совокупность значений критерия К, при которых нулевая гипотеза отклоняется в пользу конкурирующей .

Различают одностороннюю (правостороннюю или левостороннюю) и двустороннюю критические области.

Если конкурирующая гипотеза - правосторонняя, например, : , то и критическая область правосторонняя (рисунок 1). При правосторонней конкурирующей гипотезе критическая точка () принимает положительные значения.

Рис. 1

Если конкурирующая гипотеза - левосторонняя,например, : , то и критическая область – левосторонняя (рисунок 2). При левосторонней конкурирующей гипотезе критическая точка принимает отрицательные значения ().

Рис. 2.

Если конкурирующая гипотеза - двусторонняя,например, : , то и критическая область - двусторонняя(рисунок 3). При двусторонней конкурирующей гипотезе определяются 2 критические точки ( и ).

Рис. 3.

Основной принцип проверки статистических гипотез состоит в следующем:

- если наблюдаемое значение критерия () принадлежит критической области, то нулевая гипотеза отклоняется в пользу конкурирующей;

- если наблюдаемое значение критерия () принадлежит области допустимых значений, то нулевую гипотезу нельзя отклонить.

Можно принять решение относительно нулевой гипотезы путем сравнения наблюдаемого () и критического значений критерия ().

При правосторонней конкурирующей гипотезе:

- если , то нулевую гипотезу нельзя отклонить;

- если , то нулевая гипотеза отклоняется в пользу конкурирующей .

При левосторонней конкурирующей гипотезе:

- если , то нулевую гипотезу нельзя отклонить;

- если , то нулевая гипотеза отклоняется в пользу конкурирующей .

При двусторонней конкурирующей гипотезе:

- если , то нулевую гипотезу нельзя отклонить;

- если или , то нулевая гипотеза отклоняется в пользу конкурирующей .

Для построения статистического критерия, позволяющего проверить некоторую гипотезу, необходимо следующее:

Алгоритм проверки статистических гипотез:

1. Сформулировать основную и альтернативную гипотезы в вероятностных терминах на основе выборочных данных и в зависимости от цели исследования.

2. Выбрать соответствующий уровень значимости критерия;

3. Определить (если он не задан) объём выборки и число степеней свободы .

4. Вычислить статистическую характеристику критерия, т.е. наблюдаемую по выборке статистику , по формулам в зависимости от характера проверяемой гипотезы.

5. Найти по виду конкурирующей гипотезы определить тип критической области, которая зависит от объёма выборки (степень свободы ) и уровня значимости .

6. Сформулировать правила проверки гипотезы: гипотеза не отвергается на уровне значимости , если наблюдаемое значение статистического критерия данной выборки попадёт в область принятия гипотезы. Если же наблюдаемое значение статистического критерия попадает в критическую для область, то принимается альтернативная гипотеза , так как противоречит опытным данным.

Следует заметить, что даже в том случае, если нулевую гипотезу нельзя отклонить, это не означает, что высказанное предположение о генеральной совокупности является единственно подходящим: просто ему не противоречат имеющиеся выборочные данные, однако таким же свойством наряду с высказанной могут обладать и другие гипотезы.

Можно интерпретировать результаты проверки нулевой гипотезы следующим образом:

- если в результате проверки нулевую гипотезу нельзя отклонить, то это означает, что имеющиеся выборочные данные не позволяют с достаточной уверенностью отклонить нулевую гипотезу , вероятность нулевой гипотезы больше, а конкурирующей –меньше 1 -;

- если в результате проверки нулевая гипотеза отклоняется в пользу конкурирующей , то имеющиеся выборочные данные не позволяют с достаточной уверенностью принять нулевую гипотезу , вероятность нулевой гипотезы меньше, а конкурирующей – больше 1 -.

Следовательно, при проверке гипотезы возможны четыре варианта исходов, табл. 3.1.

Гипотеза Н 0 Решение Вероятность Примечание
Верна Принимается Доверительная вероятность
Отвергается Вероятность ошибки первого рода
Неверна Принимается Вероятность ошибки второго рода
Отвергается Мощность критерия

Выдвинем нулевую гипотезу о соответствующем теоретическом распределении по известному эмпирическому закону распределения из соображений вида функции распределения или физических особенностей реального объекта.

Теоретические законы распределения являются моделями реальных распределений. В качестве гипотетического можно принять распределения: нормальное, равномерное, экспоненциальное, логарифмическое, по законам Лапласа, Релея и др.

Самое распространённое теоретическое распределение – нормальное. Используется во всех случаях, когда отклонения результатов в положительную и отрицательную сторону равновероятны. К таким случаям можно отнести производительность труда, случайные ошибки измерения, все параметры человека.

Равномерный закон распределения даёт вероятность того. Что наблюдение будет находиться в определённом интервале, когда вероятность того. Что наблюдение принадлежит данному интервалу, прямо пропорциональна длине интервала. Используется для генерирования случайных чисел. Равномерному закону подчинены ошибки округления, время ожидания транспорта в некотором промежутке.

Экспоненциальное (показательное) распределение – распределение времени между независимыми событиями, появляющимися с постоянной интенсивностью. Это распределение используется в теории надёжности. Время безотказной работы электронных приборов также распределено по показательному закону.

Логарифмически нормальное распределение позволяет описать случайные величины, логарифм которых распределён по нормальному закону. Применимо, когда наблюдаемое значение случайной величины составляет случайную долю ранее наблюденного значения. Распределение размеров дохода, различных биологических явлений, времени безотказной работы некоторых приборов.

Распределение «хи-квадрат». Если нормальные независимые случайные величины имеют математическое ожидание, равное нулю, а среднее квадратическое отклонение, равное единице, то говорят, что они распределены по закону с степенями свободы; если эти величины связаны линейным соотношением, то число степеней свободы равно . С увеличением числа степеней свободы распределение медленно приближается к нормальному.

Для выдвижения гипотезы о законе распределения генеральной совокупности предложены схематично некоторые основные законы распределения и их характеристики в таблице

Плотность распределения вероятности даёт более наглядное представление о свойствах случайной величины, чем функция и поэтому при выдвижении нулевой гипотезы целесообразно сравнивать форму гистограммы и вид .

По виду гистограммы рассматриваемого примера выдвигаем нулевую гипотезу о нормальном распределении случайной величины.

Значения теоретической функции распределения вычисляются для соответсвующего закона распределения по формулам таблицы.

Проверка правдоподобия выдвинутой гипотезы осуществляется по критериям согласия.

Критериями согласия называют критерии, в которых гипотеза определяет закон распределения либо полностью, либо с точностью до небольшого числа параметров. Критерии согласия показывают, можно ли считать, что взятая кривая распределения действительно выравнивает исследуемый ряд распределения, т.е. можно ли использовать объективные черты, характеризующие сущность взятого распределения.

Критерии согласия решают вопрос о согласованности статистического распределения с выдвинутой гипотезой о теоретическом законе этого распределения.

Как бы хорошо ни была найдена теоретическая выравнивающая функция, между статистическими данными и этой функцией неизбежны расхождения. Эти расхождения могут быть связаны с ограниченностью выборки и вызваны случайными причинами. Если расхождение удовлетворяет выбранному критерию согласия, тогда выбранный теоретический закон не отвергается и достаточно хорошо описывает распределение. Расхождения могут быть существенными и отражать тот факт, что выравнивающая функция не годится для описания исследуемой величины.

При проверке гипотезы по критериям возможны варианты:

1) гипотеза верна;

2) гипотеза верна, но из-за случайного отклонения получилось противоречие;

3) гипотеза не верна.





Дата публикования: 2015-01-10; Прочитано: 2188 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.013 с)...