Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Тема 6. Статистические методы проверки гипотез



Cтатистическая гипотеза – это предположение относительно характеристик, вида или параметров распределения случайной переменной, которое можно проверить по результатам наблюдений в случайной выборке. Обозначается гипотеза Н от латинского слова hypothesis. Типичные примеры статистических гипотез:

- средние значения переменной в двух генеральных совокупностях различаются;

- переменная имеет в генеральной совокупности данное распределение (например, Пуассона).

Гипотеза «на Марсе есть жизнь» не является статистической, т.к. в ней не идет речь ни о виде, ни о параметрах распределения.

Виды гипотез.

Нулевой (основной) гипотезой называют выдвинутую гипотезу; обозначают ее Н 0.

Конкурирующей (альтернативной) гипотезой называют гипотезу, которая противоречит нулевой; обозначают ее Н 1. Альтернативную гипотезу принимают, если нулевая гипотеза неверна.

Например, если нулевая гипотеза состоит в предположении, что математическое ожидание а нормального распределения равно 10 (Н 0: а =10), то конкурирующая гипотеза, в частности, может быть следующей: Н 1: а ¹10.

Простой называют гипотезу, содержащую только одно предположение. Например, если l - параметр показательного распределения, то гипотеза Н0: l =5 – простая.

Сложной называют гипотезу, которая состоит из конечного или бесконечного числа простых гипотез. Например, сложная гипотеза Н: l >5 состоит из бесконечного множества простых гипотез вида Н: l = bi, где bi - любое число, большее 5. (Н: l =6, l =7, l =8 и т.д.).

Гипотеза является сложной, так как ее можно рассматривать как объединение простых гипотез о распределениях в обеих совокупностях с совпадающими средними значениями. ( =10; =25 и т.д.)

Как сама проверяемая гипотеза Н 0, так и конкурирующая ей Н1, могут быть простыми либо сложными, так что в этом отношении можно выделить 4 типа проверки гипотез: «Н 0:простая гипотеза против Н 1:простой», «Н 0:простая против Н 1:сложной», «Н 0:сложная против Н 1:простой», «Н 0:сложная против Н 1:сложной». Наиболее распространенный случай «Н 0:простая против Н 1:сложной».

Выдвинутая гипотеза Н0 может быть верной или неверной, поэтому возникает необходимость ее проверки. Поскольку проверку производят статистическими методами, ее называют статистической проверкой. В результате гипотеза Н 0 может быть отвергнута или не отвергнута (отвергают гипотезу категоричнее, чем принимают).

Основные понятия теории статистической проверки гипотез.

Статистика критерия проверки гипотезы – это функция от наблюдаемых в выборке значений признака х, представляющая собой специально подобранную случайную величину, точное или приближенное распределение которой известно и которая служит для проверки нулевой гипотезы Н 0: S (х)= f (x 1,.., xn). От выборке к выборке значения S (х) меняются и S (х) сама может быть рассмотрена как случайная величина. Вид функции f, т.е. формула расчета статистики критерия зависит от вида проверяемой гипотезы. От этого же зависит и распределение S(х).

В зависимости от вида распределения статистики критерия, она может иметь специальное обозначение. Так, если статистика распределена нормально, ее обозначают S, U или Z; если она распределена по закону Стьюдента - t, если она распределена по закону «хи-квадрат» - c 2, если она распределена по закону Фишера-Снедокорра – F.

Наблюдаемым значением статистики критерия S набл называют фактическое значение S (х), вычисленное по данным имеющейся в распоряжении исследователя выборки.

Критической областью m1 называется совокупность значений статистики критерия S (х), при которых нулевую гипотезу отклоняют.

Областью принятия гипотезы m0 называется совокупность значений статистики критерия S (х), при которых нулевую гипотезу не отклоняют.

Поскольку статистика критерия одномерная случайная величина, все ее возможные значения принадлежат некоторому интервалу. Поэтому критическая область и область принятия гипотезы также являются интервалами и, следовательно, существуют точки, которые их разделяют.

Критические точки (границы) Sкр – значения статистики критерия (точки), отделяющие критическую область от области принятия гипотезы.

Различают критическую область одностороннюю (правостороннюю и левостороннюю) и двустороннюю.

Правосторонняя критическая область определяется неравенством: S (х)> S кр

m 0 m 1

S кр

Левосторонняя критическая область определяется неравенством: S (х)< S кр

m 1 m 0

S кр

Двусторонняя критическая область определяется неравенствами: S (х)> S кр2 и S (X)< S кр1

m 1 m 0 m 1

S кр1 S кр2

Основное правило статистической проверки гипотезы: если наблюдаемое по выборке значение статистики критерия S набл принадлежит критической области (m 1), то гипотезу Н 0 отвергают; если S набл принадлежит области принятия гипотезы (m 0), то гипотезу Н 0 не отвергают.

Вид критической области Условие не отклонения Н 0 Условие отклонения Н 0
Правосторонняя S набл< S кр S набл> S кр
Левосторонняя S набл> S кр S набл< S кр
Двусторонняя S кр1< S набл< S кр2 S набл> S кр2 и S набл< S кр1

Следование этому правилу может привести к ошибкам двоякого рода:

а) Ошибка первого рода – это ошибка, заключающаяся в том, что будет отвергнута правильная основная гипотеза Н 0 и принята альтернативная гипотеза Н 1. Вероятность совершить ошибку первого рода принято обозначать через a, ее называют уровнем значимости. (a = Р [ S наблÎ mН 0]). Наиболее часто уровень значимости принимают равным 0,05 или 0,01. Например, если при Н 0: новый измерительный прибор лучше старого, установлено, что новый прибор не лучше, хотя на самом деле это не так.

б) Ошибка второго рода – это ошибка, заключающаяся в том, что будет принята неправильная основная гипотеза Н 0, а правильная альтернативная гипотеза Н1 будет отвергнута. Вероятность такой ошибки обозначают - b = Р [ S наблÎ mН 1]. Например, если мы решили, что новый измерительный прибор лучше старого, хотя на самом деле это не так.

Правильное решение может быть принято также в двух случаях:

1) Гипотеза принимается, причем и в действительности она правильная. Вероятность такого события есть доверительная вероятность, которая равна 1- a. g = Р [ S наблÎ mН0 ].

2) Гипотеза отвергается, причем и в действительности она неверна. Вероятность такого события называют мощностью критерия, она равна 1- b. 1- b = Р [ S наблÎ m1 ½ Н 1].

Чем меньше вероятности ошибок 1-ого и 2-ого родов, тем лучше. Но одновременно уменьшить a и b практически невозможно. Единственный способ одновременного уменьшения a и b состоит в увеличении объема выборки.

Обычно поступают так: задаются уровнем вероятности одной из ошибок (чаще a) и пытаются максимально уменьшить вероятность другой ошибки.

Рассмотрим, как определяется критическая область (критические точки), когда Н 0 -простая гипотеза, а Н 1 - сложная.

Задача отыскания S кр ставится так:

а) при правосторонней критической области: по заданному уровню значимости a найти S кр, удовлетворяющую равенству: P (S (х)> S крê H 0)= a;

б) при левосторонней критической области: по заданному уровню значимости a найти S кр, удовлетворяющую равенству: P (S (х)< S крê H 0)= a;

в) при двусторонней критической области: по заданному уровню значимости a найти S кр, удовлетворяющую равенству: P (S (х)< S кр1 ê H 0)+ P (S (X)> S кр2ê H 0)= a.

В случае двусторонней критической области критические точки могут быть выбраны бесчисленным множеством способов. Если же распределения статистики критерия симметрично относительно нуля и имеются основания (например, для увеличения мощности критерия или уменьшения b) выбрать симметричные относительно нуля точки - S кр и S кр, то: P (S (х)<- S кр ê H 0) = P (S (х)> S крê H 0), следовательно, P (S (х)> S крê H 0)= a /2. Это соотношение и служит для отыскания критических точек двусторонней критической области.

Для каждого вида статистики критерия S (х) имеются свои таблицы, по которым и находят критическую точку S кр при заданном уровне значимости a.





Дата публикования: 2015-01-09; Прочитано: 718 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.009 с)...