Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Проверка статистических гипотез. Статистические гипотезы.



Статистические гипотезы.

Пусть дана выборка из неизвестного совместного распределения . Тогда любое утверждение, касающееся природы называется статистической гипотезой. Гипотезы различают по виду предположений, содержащихся в них:

Статистическая гипотеза, однозначно определяющая распределение , то есть , где какой-то конкретный закон, называется простой.

Статистическая гипотеза, утверждающая принадлежность распределения к некоторому семейству распределений, то есть вида , где - семейство распределений, называется сложной.

На практике обычно требуется проверить какую-то конкретную и, как правило, простую гипотезу H0. Такую гипотезу принято называть нулевой. При этом параллельно рассматривается противоречащая ей гипотеза H1, называемая конкурирующей или альтернативной.

Выдвинутая гипотеза нуждается в проверке, которая осуществляется статистическими методами, поэтому гипотезу называют статистической. Для проверки гипотезы используют критерии, позволяющие принять или опровергнуть гипотезу. Статистической гипотезой называется любое предположение о виде неизвестного распределения или о параметрах известного распределения.

Пример

Пусть дана независимая выборка из нормального распределения, где μ — неизвестный параметр. Тогда , где μ0 — фиксированная константа, является простой гипотезой, а конкурирующая с ней — сложной.

Этапы проверки статистических гипотез.

1.Формулировка основной гипотезы H0 и конкурирующей гипотезы H1. Гипотезы должны быть чётко формализованы в математических терминах.

2.Задание вероятности α, называемой уровнем значимости и отвечающей ошибкам первого рода, на котором в дальнейшем и будет сделан вывод о правдивости гипотезы.

3.Расчёт статистики φ критерия такой, что:

-её величина зависит от исходной выборки ;

-по её значению можно делать выводы об истинности гипотезы H0;

-сама статистика φ должна подчиняться какому-то известному закону распределения, т.к. сама φ является случайной в силу случайности .

4.Построение критической области. Из области значений φ выделяется подмножество таких значений, по которым можно судить о существенных расхождениях с предположением. Его размер выбирается таким образом, чтобы выполнялось равенство . Это множество и называется критической областью.

Вывод об истинности гипотезы. Наблюдаемые значения выборки подставляются в статистику φ и по попаданию (или непопаданию) в критическую область выносится решение об отвержении (или принятии) выдвинутой гипотезы H0.

Виды критической области.

Выделяют три вида критических областей:

Двусторонняя критическая область определяется двумя интервалами , где находят из условий .

Левосторонняя критическая область определяется интервалом , где xα находят из условия P(φ < xα) = α.

Правосторонняя критическая область определяется интервалом , где xα находят из условия P(φ > xα) = α.

ВЫПОЛНЕНИЕ:

Во многих случаях представляет интерес не получение точеной оценки неизвестного параметра распределения, а указание области (например, интервала на числовой прямой), в которой этот параметр находится с вероятностью, не меньшей заданной. Statgraphics позволяет строить такие области.

ЗАДАНИЕ:

Требуется:

1) получить 10 случайный выборок объема n=100 из нормальной генеральной совокупности N(0,1);

2) построить по каждой из полученных выборок три доверительных интервала для математического ожидания M:

a) с доверительной вероятностью P=95%

b) с доверительной вероятностью P=90%

c) с доверительной вероятностью P=70%

3) выяснить, как часто доверительный интервал не накрывает истинное значение математического ожидания M=0 в случае a), в случае b), в случае c).

4) проанализировать, как зависит длина доверительного интервала от величины P;

5) сгенерировать 5 случайных выборок из N(0,1) с объемами n=10,30,50,100,1000;

6) построить для каждой из пяти выборок доверительные интервалы с одной и той же доверительной вероятностью P=95%

a) для математического ожидания M;

b) дисперсии σ2

7) проанализировать, как зависит длина доверительного интервала от объёма выборки в обоих случаях.

Для получений десяти нужных выборок используйте генератор случайных чисел. Заготовьте в тетради таблицу:





Дата публикования: 2015-04-06; Прочитано: 445 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.008 с)...