Главная Случайная страница Контакты | Мы поможем в написании вашей работы! | ||
|
Cтатистическая гипотеза – это предположение относительно характеристик, вида или параметров распределения случайной переменной, которое можно проверить по результатам наблюдений в случайной выборке. Обозначается гипотеза Н от латинского слова hypothesis. Типичные примеры статистических гипотез:
- средние значения переменной в двух генеральных совокупностях различаются;
- переменная имеет в генеральной совокупности данное распределение (например, Пуассона).
Гипотеза «на Марсе есть жизнь» не является статистической, т.к. в ней не идет речь ни о виде, ни о параметрах распределения.
Виды гипотез.
Нулевой (основной) гипотезой называют выдвинутую гипотезу; обозначают ее Н 0.
Конкурирующей (альтернативной) гипотезой называют гипотезу, которая противоречит нулевой; обозначают ее Н 1. Альтернативную гипотезу принимают, если нулевая гипотеза неверна.
Например, если нулевая гипотеза состоит в предположении, что математическое ожидание а нормального распределения равно 10 (Н 0: а =10), то конкурирующая гипотеза, в частности, может быть следующей: Н 1: а ¹10.
Простой называют гипотезу, содержащую только одно предположение. Например, если l - параметр показательного распределения, то гипотеза Н0: l =5 – простая.
Сложной называют гипотезу, которая состоит из конечного или бесконечного числа простых гипотез. Например, сложная гипотеза Н: l >5 состоит из бесконечного множества простых гипотез вида Н: l = bi, где bi - любое число, большее 5. (Н: l =6, l =7, l =8 и т.д.).
Гипотеза является сложной, так как ее можно рассматривать как объединение простых гипотез о распределениях в обеих совокупностях с совпадающими средними значениями. ( =10; =25 и т.д.)
Как сама проверяемая гипотеза Н 0, так и конкурирующая ей Н1, могут быть простыми либо сложными, так что в этом отношении можно выделить 4 типа проверки гипотез: «Н 0:простая гипотеза против Н 1:простой», «Н 0:простая против Н 1:сложной», «Н 0:сложная против Н 1:простой», «Н 0:сложная против Н 1:сложной». Наиболее распространенный случай «Н 0:простая против Н 1:сложной».
Выдвинутая гипотеза Н0 может быть верной или неверной, поэтому возникает необходимость ее проверки. Поскольку проверку производят статистическими методами, ее называют статистической проверкой. В результате гипотеза Н 0 может быть отвергнута или не отвергнута (отвергают гипотезу категоричнее, чем принимают).
Основные понятия теории статистической проверки гипотез.
Статистика критерия проверки гипотезы – это функция от наблюдаемых в выборке значений признака х, представляющая собой специально подобранную случайную величину, точное или приближенное распределение которой известно и которая служит для проверки нулевой гипотезы Н 0: S (х)= f (x 1,.., xn). От выборке к выборке значения S (х) меняются и S (х) сама может быть рассмотрена как случайная величина. Вид функции f, т.е. формула расчета статистики критерия зависит от вида проверяемой гипотезы. От этого же зависит и распределение S(х).
В зависимости от вида распределения статистики критерия, она может иметь специальное обозначение. Так, если статистика распределена нормально, ее обозначают S, U или Z; если она распределена по закону Стьюдента - t, если она распределена по закону «хи-квадрат» - c 2, если она распределена по закону Фишера-Снедокорра – F.
Наблюдаемым значением статистики критерия S набл называют фактическое значение S (х), вычисленное по данным имеющейся в распоряжении исследователя выборки.
Критической областью m1 называется – совокупность значений статистики критерия S (х), при которых нулевую гипотезу отклоняют.
Областью принятия гипотезы m0 называется совокупность значений статистики критерия S (х), при которых нулевую гипотезу не отклоняют.
Поскольку статистика критерия одномерная случайная величина, все ее возможные значения принадлежат некоторому интервалу. Поэтому критическая область и область принятия гипотезы также являются интервалами и, следовательно, существуют точки, которые их разделяют.
Критические точки (границы) Sкр – значения статистики критерия (точки), отделяющие критическую область от области принятия гипотезы.
Различают критическую область одностороннюю (правостороннюю и левостороннюю) и двустороннюю.
Правосторонняя критическая область определяется неравенством: S (х)> S кр
m 0 m 1
S кр
Левосторонняя критическая область определяется неравенством: S (х)< S кр
m 1 m 0
S кр
Двусторонняя критическая область определяется неравенствами: S (х)> S кр2 и S (X)< S кр1
m 1 m 0 m 1
S кр1 S кр2
Основное правило статистической проверки гипотезы: если наблюдаемое по выборке значение статистики критерия S набл принадлежит критической области (m 1), то гипотезу Н 0 отвергают; если S набл принадлежит области принятия гипотезы (m 0), то гипотезу Н 0 не отвергают.
Вид критической области | Условие не отклонения Н 0 | Условие отклонения Н 0 |
Правосторонняя | S набл< S кр | S набл> S кр |
Левосторонняя | S набл> S кр | S набл< S кр |
Двусторонняя | S кр1< S набл< S кр2 | S набл> S кр2 и S набл< S кр1 |
Следование этому правилу может привести к ошибкам двоякого рода:
а) Ошибка первого рода – это ошибка, заключающаяся в том, что будет отвергнута правильная основная гипотеза Н 0 и принята альтернативная гипотеза Н 1. Вероятность совершить ошибку первого рода принято обозначать через a, ее называют уровнем значимости. (a = Р [ S наблÎ m 1½ Н 0]). Наиболее часто уровень значимости принимают равным 0,05 или 0,01. Например, если при Н 0: новый измерительный прибор лучше старого, установлено, что новый прибор не лучше, хотя на самом деле это не так.
б) Ошибка второго рода – это ошибка, заключающаяся в том, что будет принята неправильная основная гипотеза Н 0, а правильная альтернативная гипотеза Н1 будет отвергнута. Вероятность такой ошибки обозначают - b = Р [ S наблÎ m 0½ Н 1]. Например, если мы решили, что новый измерительный прибор лучше старого, хотя на самом деле это не так.
Правильное решение может быть принято также в двух случаях:
1) Гипотеза принимается, причем и в действительности она правильная. Вероятность такого события есть доверительная вероятность, которая равна 1- a. g = Р [ S наблÎ m 0½ Н0 ].
2) Гипотеза отвергается, причем и в действительности она неверна. Вероятность такого события называют мощностью критерия, она равна 1- b. 1- b = Р [ S наблÎ m1 ½ Н 1].
Чем меньше вероятности ошибок 1-ого и 2-ого родов, тем лучше. Но одновременно уменьшить a и b практически невозможно. Единственный способ одновременного уменьшения a и b состоит в увеличении объема выборки.
Обычно поступают так: задаются уровнем вероятности одной из ошибок (чаще a) и пытаются максимально уменьшить вероятность другой ошибки.
Рассмотрим, как определяется критическая область (критические точки), когда Н 0 -простая гипотеза, а Н 1 - сложная.
Задача отыскания S кр ставится так:
а) при правосторонней критической области: по заданному уровню значимости a найти S кр, удовлетворяющую равенству: P (S (х)> S крê H 0)= a;
б) при левосторонней критической области: по заданному уровню значимости a найти S кр, удовлетворяющую равенству: P (S (х)< S крê H 0)= a;
в) при двусторонней критической области: по заданному уровню значимости a найти S кр, удовлетворяющую равенству: P (S (х)< S кр1 ê H 0)+ P (S (X)> S кр2ê H 0)= a.
В случае двусторонней критической области критические точки могут быть выбраны бесчисленным множеством способов. Если же распределения статистики критерия симметрично относительно нуля и имеются основания (например, для увеличения мощности критерия или уменьшения b) выбрать симметричные относительно нуля точки - S кр и S кр, то: P (S (х)<- S кр ê H 0) = P (S (х)> S крê H 0), следовательно, P (S (х)> S крê H 0)= a /2. Это соотношение и служит для отыскания критических точек двусторонней критической области.
Для каждого вида статистики критерия S (х) имеются свои таблицы, по которым и находят критическую точку S кр при заданном уровне значимости a.
Дата публикования: 2015-01-09; Прочитано: 721 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!