Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Проверка статистических гипотез. Статистической называют гипотезу о виде неизвестного распределения или о параметрах известных распределений



Статистической называют гипотезу о виде неизвестного распределения или о параметрах известных распределений. Наряду с выдвинутой (нулевой) гипотезой рассматривают и противоречащую (конкурирующую) гипотезу . Если нулевая гипотеза будет отвергнута, то имеет место конкурирующая гипотеза.

При проверке гипотезы могут быть допущены ошибки. Все решения принимаются относительно гипотезы . Если в действительности гипотеза верна, а принято решение отвергнуть , то допущена ошибка первого рода – отвергнута правильная гипотеза. С другой стороны, если в действительности верна гипотеза , а решили принять , то допущена ошибка второго рода – принята неправильная гипотеза. Вероятность совершить ошибку первого рода принято обозначать через , которое называют уровнем значимости критерия. Вероятность ошибки второго рода обозначают через .

Желательно, чтобы и были как можно меньше, однако, не меняя объема выборки, достичь этого невозможно: при уменьшении одного параметра растет другой. Решение дилеммы состоит в том, что фиксируют некоторое малое значение (например, 0.1, 0.05, 0.01) и предполагают, что будет также мало.

Для проверки нулевой гипотезы используют специально подобранную случайную величину, распределение которой известно, если выполняется гипотеза . Обозначим ее через и назовем статистическим критерием. После выбора определенного критерия множество всех его возможных значений разбивается на два непересекающихся подмножества. Одно из них содержит значения критерия, при которых нулевая гипотеза отвергается (критическая область), другое – при которых нулевая гипотеза принимается (область принятия гипотезы). По данным выборки вычисляют наблюдаемые значения входящих в критерий величин и получают наблюдаемое значение критерия . Если наблюдаемое значение критерия принадлежит критической области, то отвергаем и принимаем. Если наблюдаемое значение критерия принадлежит области принятия гипотезы, то принимается. Значение, разделяющее два подмножества, называется критическим значением критерия . Критические значения определяются из условия (правосторонний критерий), и эти значения приведены в специальных таблицах. Для правостороннего критерия, если выполнено условие , то отвергаем и принимаем; если , то принимаем.

Для проверки нулевой гипотезы о соответствии статистического распределения теоретическому закону распределения используется критерий Пирсона. Выбирают случайную величину, характеризующую степень расхождения теоретического и эмпирического распределений, в виде

,

где – вероятность попадания в частичный интервал случайной величины, распределенной по предполагаемому теоретическому закону. Рассматриваемая величина – случайная, так как в различных опытах принимает неизвестные заранее значения, и, если выполняется гипотеза , имеет распределение (хи-квадрат), которое зависит только от числа степеней свободы , где – число параметров предполагаемого теоретического распределения, – количество интервалов.

По данным статистического ряда вычисляем наблюдаемое значение , где вероятности находятся по формуле . Здесь – функция распределения случайной величины предполагаемого теоретического закона. Вероятности также можно приближенно вычислять по формуле

,

где – плотность теоретического распределения, – середина частичного интервала, – его длина. Критическое значение ищем из специальных таблиц в зависимости от числа степеней свободы и уровня значимости. Если , то нулевая гипотеза принимается, значит, можно принять при заданном уровне значимости теоретическое распределение исследуемого количественного признака. Иначе, если , то нулевая гипотеза отвергается и принимается конкурирующая гипотеза : количественный признак не имеет предполагаемого теоретического закона. Причинами этого вывода может оказаться следующее: либо признак действительно имеет другое распределение, либо недостаточно данных (объем выборки мал), либо неудачно выбраны частичные интервалы и их количество и т.п.

Задача о выборе теоретического вида распределения. Требуется по данным, представленным в выборочных совокупностях 1, 2 и 3, выдвинуть гипотезы о теоретическом законе распределения и проверить согласованность выборочных и теоретических распределений по критерию Пирсона при уровне значимости .

Выборка 1            
14,22 13,14 16,78 12,64 11,91 14,43 19,11 19,58 19,04 19,02
12,45 13,85 16,36 8,65 6,60 16,56 13,21 9,25 19,31 12,25
14,58 20,95 16,34 16,22 17,38 11,67 11,68 20,05 11,07 10,69
12,64 23,65 20,54 23,97 16,64 21,18 11,03 17,85 21,68 12,31
8,93 16,90 12,78 15,32 23,10 22,03 22,87 15,21 9,64 22,45
3,18 17,64 17,54 20,12 15,35 10,23 11,21 13,94 12,40 19,21
19,63 22,22 18,32 13,24 21,85 14,01 7,89 14,21 24,56 13,26
16,0 17,85 5,23 19,63 24,01 11,44 21,54 15,36 12,45 6,89
26,38 16,65 11,57 7,63 18,66 16,16 20,05 14,27 23,69 16,61
17,85 14,25 15,65 14,42 20,03 19,95 23,65 16,23 13,87 12,51

Решение

1. Построим статистический закон распределения и гистограмму.

Найдем наименьшее и наибольшее значения в выборке объема : и . Округляем эти значения до ближайших целых чисел так, чтобы все статистические значения входили в интервал. Будем исследовать диапазон статистических данных и выберем число частичных интервалов , а их длина будет . Количество интервалов целесообразно брать от 7 до 10 для выборки объема . Строим интервальный статистический ряд, где – плотность относительной частоты, а – середины частичных интервалов.

3-6 6-9 9-12 12-15 15-18 18-21 21-24 24-27
               
0,02 0,06 0,11 0,25 0,23 0,17 0,13 0,03
0,007 0,020 0,037 0,083 0,077 0,057 0,043 0,010
4,5 7,5 10,5 13,5 16,5 19,5 22,5 25,5

Если некоторое значение попало на границу интервалов, то принято записывать по полнаблюдения в соседние интервалы.

 
 

Гистограмма относительных частот имеет следующий вид

2. Вычисляем параметры статистического распределения.

Выборочная средняя , выборочная дисперсия , выборочное среднеквадратическое отклонение , асимметрия , эксцесс , коэффициент вариации .

3. Выдвигаем гипотезу о теоретическом законе распределения.

Так как асимметрия и эксцесс близки к нулю, по виду гистограммы выдвигаем нулевую гипотезу о нормальном распределении. Запишем плотность нормального распределения

,

где параметры и определяем, используя метод моментов: и .

Проверим нулевую гипотезу о нормальном распределении статистических данных с параметрами и по критерию Пирсона. Находим наблюдаемое значение

.

По таблице критических значений распределения в зависимости от уровня значимости и числа степеней свободы находим . Так как , то нулевая гипотеза принимается. Следовательно, по данной выборке можно принять нормальный закон для генеральной совокупности.

Выборка 2            
17,32 13,65 16,95 30,32 9,65 8,12 26,27 20,36 31,21 24,98
10,25 9,05 16,68 9,65 12,21 30,54 23,87 27,15 30,69 25,65
22,11 8,95 29,64 24,10 9,63 10,21 12,81 27,92 29,37 22,33
29,63 11,54 19,63 27,81 16,60 14,12 17,58 14,35 14,65 21,05
11,96 29,68 18,65 31,26 19,54 56,32 21,84 12,50 20,58 29,64
31,25 8,65 15,34 19,54 20,36 24,67 25,52 28,95 24,35 17,13
8,56 14,32 31,58 15,34 16,85 27,54 21,38 10,25 19,69 12,67
17,58 16,35 27,24 26,35 31,58 25,62 12,35 9,64 11,45 12,38
28,64 21,50 31,79 16,58 8,39 10,25 31,20 26,35 8,57 16,35
11,3 16,25 14,47 26,65 13,38 11,08 24,56 25,97 27,45 15,64

Решение

1. Построим статистический закон распределения и гистограмму.

Найдем наименьшее и наибольшее значения в выборке объема : и . Будем исследовать диапазон статистических данных и выберем число частичных интервалов , а их длина будет . Строим интервальный статистический ряд.

8-11 11-14 14-17 17-20 20-23 23-26 26-29 29-32
               
0,15 0,14 0,15 0,09 0,09 0,10 0,13 0,15
0,050 0,047 0,050 0,030 0,030 0,033 0,043 0,050
9,5 12,5 15,5 18,5 21,5 24,5 27,5 30,5

Гистограмма относительных частот имеет следующий вид

 
 

2. Вычисляем параметры статистического распределения.

Выборочная средняя , выборочная дисперсия , выборочное среднеквадратическое отклонение , асимметрия , эксцесс , коэффициент вариации .

3. Выдвигаем гипотезу о теоретическом законе распределения.

Так как асимметрия близка к нулю, по виду гистограммы выдвигаем нулевую гипотезу о равномерном распределении. Запишем плотность равномерного распределения

,

где параметры и определяем, используя метод моментов и .

Проверим нулевую гипотезу о равномерном распределении статистических данных с параметрами и по критерию Пирсона. Находим наблюдаемое значение . По таблице критических значений распределения в зависимости от уровня значимости и числа степеней свободы находим . Так как , то нулевая гипотеза принимается. Следовательно, по данной выборке можно принять равномерный закон для генеральной совокупности.

Выборка 3            
7,12 0,25 22,56 8,69 3,45 3,68 7,54 8,65 7,12 10,20
2,45 1,02 4,57 37,12 3,01 8,35 8,65 9,31 16,25 3,20
5,24 1,24 4,98 6,54 3,75 3,25 12,50 9,89 11,25 17,54
0,59 1,32 9,65 0,15 35,66 3,15 32,94 10,57 11,23 20,20
0,87 4,05 2,68 1,23 3,96 14,52 24,10 10,46 11,28 21,50
0,17 4,05 2,96 18,34 6,46 1,06 6,56 13,46 5,02 3,96
12,35 4,02 2,85 7,14 14,23 2,01 19,63 0,12 15,68 26,35
6,05 4,44 2,68 9,68 14,52 1,98 6,58 13,65 5,32 4,91
1,68 39,64 2,56 5,91 12,60 2,52 0,38 17,64 16,39 34,52
1,58 4,31 2,10 7,85 12,34 14,56 19,62 0,67 13,63 8,95

Решение

1. Построим статистический закон распределения и гистограмму.

Найдем наименьшее и наибольшее значения в выборке объема : и . Будем исследовать диапазон статистических данных и выберем число частичных интервалов , а их длина будет . Строим интервальный статистический ряд.

0-5 5-10 10-15 15-20 20-25 25-30 30-35 35-40
               
0,42 0,23 0,17 0,08 0,05 0,01 0,01 0,03
0,084 0,046 0,034 0,016 0,010 0,002 0,002 0,006
2,5 7,5 12,5 17,5 22,5 27,5 32,5 37,5

 
 

Гистограмма относительных частот имеет следующий вид

2. Вычисляем параметры статистического распределения.

Выборочная средняя , выборочная дисперсия , выборочное среднеквадратическое отклонение , асимметрия , эксцесс , коэффициент вариации .

3. Выдвигаем гипотезу о теоретическом законе распределения.

Так как коэффициент вариации близок к единице, по виду гистограммы выдвигаем нулевую гипотезу о показательном распределении. Запишем плотность показательного распределения

,

где параметр определяем, используя метод моментов: .

Проверим нулевую гипотезу о показательном распределении статистических данных с параметром по критерию Пирсона. Находим наблюдаемое значение . По таблице критических значений распределения в зависимости от уровня значимости и числа степеней свободы находим . Так как , то нулевая гипотеза принимается. Следовательно, по данной выборке можно принять показательный закон для генеральной совокупности.





Дата публикования: 2015-01-09; Прочитано: 820 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.013 с)...