Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Расчет доверительных интервалов



Суть выборочного наблюдения заключается в том, что из генеральной совокупности наудачу, чисто случайно отбирается n единиц, составляющих выборочную совокупность; для отобранных единиц рассчитываются обобщенные характеристики (средние или относительные показатели), а затем результаты выборочного обследования распространяются на всю генеральную совокупность. Основной задачей при этом является определение ошибок выборки, т.е. возможных расхождений между выборочной средней () и генеральной или выборочной долей единиц (w), обладающих изучаемым признаком, и генеральной долей (p).

Различают среднюю и предельную ошибки выборки.

Средняя ошибка выборки () характеризует среднюю величину возможных расхождений выборочной и генеральной средней (или доли). Средняя ошибка выборочной средней при повторном отборе определяется по формуле

, где - дисперсия изучаемого показателя в генеральной совокупности, а n –объем численность выборки.

Средняя ошибка выборочной доли определяется по формуле , где w- выборочная доля единиц обладающая изучаемым признаком, а - дисперсия доли альтернативного признака.

При бесповторном отборе в формулах под знаком радикала появляется множитель , где - численность генеральной совокупности.

Отклонение выборочной характеристики от генеральной называется предельной ошибкой выборки.

Предельная ошибка выборки, обозначаемая через , рассчитывается как

, где - средняя ошибка выборки, а - коэффициент доверия, т. е. показатель, зависящий от вероятности (P), с которой предельная ошибка определяется.

Общая формула предельной ошибки выборки для средней приобретает вид (для повторного отбора) или (для бесповторного отбора), а для доли соответственно

и .

Согласно центральной предельной теореме при большом объеме выборки вероятность появления того или иного значения выборочной средней, а следовательно и отклонение последней от генеральной подчиняется закону нормального распределения и может быть найдена как функция от t с помощью интеграла вероятностей Лапласа:

,

где - нормированное отклонение выборочной средней от генеральной.

Значения интеграла Лапласа (P) для разных t рассчитаны и приведены в специальных таблицах. Так, при t=1 вероятность P=0,683. Это означает, что с вероятностью 0,683 можно гарантировать, что отклонение генеральной средней от выборочной не превысит однократной средней ошибки, т.е. что в генеральной совокупности среднее значение признака () будет находиться в пределах .

Аналогично при t=2 вероятность P=0,954 означает, что предельная ошибка не выйдет за размер , т.е. .

Сказанное выше относиться и к расхождениям между выборочной долей единиц (w), обладающей определенным признаком, и генеральной долей (p). Так:

При t=1

или ;

при t=2

или и т.д.

Относительной ошибкой выборки называется процентное отношение абсолютной ошибки выборки к исследуемому параметру:

или . Можно и сразу определить относительную ошибку по формуле , где - коэффициент вариации.

Выборка считается репрезентативной (представительной), если .

Формулы предельной ошибки выборки конкретизируются в зависимости от применяемого вида выборки. Так, указанные выше формулы применимы для собственно случайной и механической выборок. Для типической (районированной) выборки, т.е. когда генеральная совокупность делится на группы по какому-либо существенному признаку, а затем из каждой группы производится случайный отбор и общая средняя величина признака (или доля) определяется по групповым выборочным показателям, в формуле предельной ошибки выборки учитывается средняя из групповых дисперсий т.е.

или

В этом случае ошибка выборки зависит от внутригрупповой вариации.

При серийной (гнездовой) выборке, когда из генеральной совокупности, разбитой на определенные равновеликие серии (гнезда), случайно отбираются серии, внутри которых проводится сплошное наблюдение, величина ошибки выборки зависит не от числа обследованных единиц, а от числа обследованных серий (s) и от величины межгрупповой дисперсии . Серийная выборка в основном проводится как бесповторная, и формула ошибки выборки имеет вид:

, где - межсерийная дисперсия; s – число отобранных серий; S - число серий в генеральной совокупности.

Все рассмотренные выше формулы используются при так называемой большой выборке.

Если n<20, то выборка именуются малой и при расчете ошибок выборки необходимо учитывать следующие моменты. Во-первых, в формуле средней ошибки в знаменателе принимается n-1, т.е.

. И во-вторых, при нахождении вероятности допуска той или иной ошибки или определении доверительных интервалов исследуемого показателя в генеральной совокупности пользуются таблицами вероятности Стьюдента, где P=S(t,n) определяется в зависимости от объема выборки и t. Формулы для n определяются из соответствующих

формул предельной ошибки.

При повторном отборе . Для доли .

При бесповторном отборе:

- для средней (); - для доли (w).

В случае изучения доли определенных единиц совокупности при отсутствии каких-либо сведений о дисперсии принимается максимальное значение , равное 0,25.

На основании сравнения двух выборочных средних (или долей) делается вывод о случайности или существенности их расхождений. Для этого сопоставляется со средней ошибкой разности . Если при n>20 результат этого соотношения t<3, то делается вывод о случайности расхождений. Если n<20, то полученное значение t сравнивают с табличным, определяемым по таблицам t-распределений Стьюдента при заданном числе свободы и уровне значимости. И если , то расхождения можно считать случайными. (Число степеней свободы определяется, как ).

При n<20 средняя ошибка разности более точно определяется по формуле

, .

Найденное , как указывалось выше сопоставляется с , определяемым по таблице для числа степеней свободы и заданного уровня значимости (0,1;0,05;0,01).

5.3 Проверка статистических гипотез

Статистической гипотезой называют, гипотезу о видах неизвестного распределения или о параметрах известного распределения.

Проверка статистической гипотезы заключается в сопоставлении некоторых статистических показателей, вычисленным по данным выборки со значениями этих же показателей, определенными теоретически в предположении, что проверяемая гипотеза верна.





Дата публикования: 2015-01-09; Прочитано: 680 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.008 с)...