Главная \| Случайная страница \| Контакты \| Мы поможем в написании вашей работы!

Уровень значимости

⇐ Предыдущая 2 3 4 5 678 9 10 11 Следующая ⇒

Выборочные параметры распределения, определяемые по серии измерений, являются случайными величинами, следовательно, и их отклонения от генеральных параметров также будут случайными. Оценка этих отклонений носит вероятностный характер — при статистическом анализе можно лишь указать вероятность той или иной погрешности.

Пусть для генерального параметра а получена из опыта несмещенная оценка а ^*. Назначим достаточно большую вероятность b (такую, что событие с вероятностью b можно считать практически достоверным) и найдем такое значение e_b = f (b), для которого

. (4.1)

Диапазон практически возможных значений ошибки, возникающей при замене а на а ^*, будет ±e_b. Большие по абсолютной величине ошибки будут появляться только с малой вероятностью

, (4.2)

называемой уровнем значимости. Иначе выражение (4.1) можно интерпретировать как вероятность того, что истинное значение параметра а лежит в пределах

. (4.3)

Вероятность b называется доверительной вероятностью и характеризует надежность полученной оценки. Интервал I _b = a ^* ± e_b называется доверительным интервалом. Границы интервала a ¢ = a ^* - e_b и a ¢¢ = a ^* + e_b называются доверительными границами. Доверительный интервал при данной доверительной вероятности определяет точность оценки. Величина доверительного интервала зависит от доверительной вероятности, с которой гарантируется нахождение параметра а внутри доверительного интервала: чем больше величина b, тем больше интервал I _b (и величина e_b). Увеличение числа опытов проявляется в сокращении доверительного интервала при постоянной доверительной вероятности или в повышении доверительной вероятности при сохранении доверительного интервала.

На практике обычно фиксируют значение доверительной вероятности (0,9; 0,95 или 0,99) и затем определяют доверительный интервал результата I _b. При построении доверительного интервала решается задача об абсолютном отклонении:

. (4.4)

Таким образом, если бы был известен закон распределения оценки а ^*, задача определения доверительного интервала решалась бы просто. Рассмотрим построение доверительного интервала для математического ожидания нормально распределенной случайной величины Х с известным генеральным стандартом s по выборке объемом n. Наилучшей оценкой для математического ожидания m является среднее выборки со стандартным отклонением среднего

Используя функцию Лапласа, получаем

. (4.5)

Задавшись доверительной вероятностью b, определим по таблице функции Лапласа (приложение 1) величину . Тогда доверительный интервал для математического ожидания принимает вид

, (4.6)

или

. (4.7)

Из (4.7) видно, что уменьшение доверительного интервала обратно пропорционально корню квадратному из числа опытов.

Знание генеральной дисперсии позволяет оценивать математическое ожидание даже по одному наблюдению. Если для нормально распределенной случайной величины Х в результате эксперимента получено значение х ₁, то доверительный интервал для математического ожидания при выбранной b имеет вид

, (4.8)

где U _{1- p /2} — квантиль стандартного нормального распределения (приложение 2).

Закон распределения оценки а ^* зависит от закона распределения величины Х и, в частности, от самого параметра а. Чтобы обойти это затруднение, в математической статистике применяют два метода:

1) приближенный — при n ³ 50 заменяют в выражении для e_b неизвестные параметры их оценками, например:

;

2) от случайной величины а ^* переходят к другой случайной величине Q^*, закон распределения которой не зависит от оцениваемого параметра а, а зависит только от объема выборки n и от вида закона распределения величины Х. Такого рода величины наиболее подробно изучены для нормального распределения случайных величин. В качестве доверительных границ Q¢ и Q¢¢ обычно используются симметричные квантили

, (4.9)

или с учетом (4.2)

. (4.10)

4.2. Проверка статистических гипотез, критерии значимости,

ошибки первого и второго рода.

Под статистическими гипотезами понимаются некоторые предположения относительно распределений генеральной совокупности той или иной случайной величины. Под проверкой гипотезы понимают сопоставление некоторых статистических показателей, критериев проверки (критериев значимости), вычисляемых по выборке, с их значениями, определенными в предположении, что данная гипотеза верна. При проверке гипотез обычно подвергается испытанию некоторая гипотеза Н ₀ в сравнении с альтернативной гипотезой Н ₁.

Чтобы решить вопрос о принятии или непринятии гипотезы, задаются уровнем значимости р. Наиболее часто используются уровни значимости, равные 0.10, 0.05 и 0.01. По этой вероятности, используя гипотезу о распределении оценки Q^* (критерия значимости), находят квантильные доверительные границы, как правило, симметричные Q _p _/2 и Q_{1- p /2}. Числа Q _p _/2 и Q_{1- p /2} называются критическими значениями гипотезы; значения Q^* < Q _p _/2 и Q^* > Q_{1- p /2} образуют критическую

область гипотезы (или область непринятия гипотезы) (рис. 12).

Рис. 12. Критическая область Рис. 13. Проверка статистических

гипотезы. гипотез.

Если найденное по выборке Q₀ попадает между Q _p _/2 и Q_{1- p /2}, то гипотеза допускает такое значение в качестве случайного и поэтому нет оснований ее отвергать. Если же значение Q₀ попадает в критическую область, то по данной гипотезе оно является практически невозможным. Но поскольку оно появилось, то отвергается сама гипотеза.

При проверке гипотез можно совершить ошибки двух типов. Ошибка первого рода состоит в том, что отвергается гипотеза, которая на самом деле верна. Вероятность такой ошибки не больше принятого уровня значимости. Ошибка второго рода состоит в том, что гипотеза принимается, а на самом деле она неверна. Вероятность этой ошибки тем меньше, чем выше уровень значимости, так как при этом увеличивается число отвергаемых гипотез. Если вероятность ошибки второго рода равна a, то величину (1 - a) называют мощностью критерия.

На рис. 13 приведены две кривые плотности распределения случайной величины Q, соответствующие двум гипотезам Н ₀ и Н ₁. Если из опыта получается значение Q > Q _p, то отвергается гипотеза Н ₀ и принимается гипотеза Н ₁, и наоборот, если Q < Q _p.

Площадь под кривой плотности вероятности, соответствующей справедливости гипотезы Н ₀ вправо от значения Q _p, равна уровню значимости р, т. е. вероятности ошибки первого рода. Площадь под кривой плотности вероятности, соответствующей справедливости гипотезы Н ₁ влево от Q _p, равна вероятности ошибки второго рода a, а вправо от Q _p — мощности критерия (1 - a). Таким образом, чем больше р, тем больше (1 - a). При проверке гипотезы стремятся из всех возможных критериев выбрать тот, у которого при заданном уровне значимости меньше вероятность ошибки второго рода.

Обычно в качестве оптимального уровня значимости при проверке гипотез используют p = 0,05, так как если проверяемая гипотеза принимается с данным уровнем значимости, то гипотезу, безусловно, следует признать согласующейся с экспериментальными данными; с другой стороны, использование данного уровня значимости не дает оснований для отбрасывания гипотезы.

Например, найдены два значения и некоторого выборочного параметра, которые можно рассматривать как оценки генеральных параметров а ₁ и а ₂. Высказывается гипотеза, что различие между и случайное и что генеральные параметры а ₁ и а ₂ равны между собой, т. е. а ₁ = а ₂. Такая гипотеза называется нулевой, или нуль-гипотезой. Для ее проверки нужно выяснить, значимо ли расхождение между и в условиях нулевой гипотезы. Для этого обычно исследуют случайную величину D = – и проверяют, значимо ли ее отличие от нуля. Иногда удобнее рассматривать величину / , сравнивая ее с единицей.

Отвергая нулевую гипотезу, тем самым принимают альтернативную, которая распадается на две: > и < . Если одно из этих равенств заведомо невозможно, то альтернативная гипотеза называется односторонней, и для ее проверки применяют односторонние критерии значимости (в отличие от обычных, двусторонних). При этом необходимо рассматривать лишь одну из половин критической области (рис. 12).

Например, р = 0,05 при двустороннем критерии соответствуют критические значения Q_0.025 и Q_0.975, т. е. значимыми (неслучайными) считаются Q^*, принявшие значения Q^* < Q_0.025 и Q^* > Q_0.975. При одностороннем критерии одно из этих неравенств заведомо невозможно (например, Q^* < Q_0.025) и значимыми будут лишь Q^* > Q_0.975. Вероятность последнего неравенства равна 0,025, и, следовательно, уровень значимости будет равен 0,025. Таким образом, если при одностороннем критерии значимости использовать те же критические числа, что и при двустороннем, этим значениям будет соответствовать вдвое меньший уровень значимости.

Обычно для одностороннего критерия берут тот же уровень значимости, что и для двустороннего, так как при этих условиях оба критерия обеспечивают одинаковую ошибку первого рода. Для этого односторонний критерий надо выводить из двустороннего, соответствующего вдвое большему уровню значимости, чем тот, что принят. Чтобы сохранить для одностороннего критерия уровень значимости р = 0,05, для двустороннего необходимо взять р = 0,10, что дает критические значения Q_0.05 и Q_0.95. Из них для одностороннего критерия останется какое-нибудь одно, например, Q_0.95. Уровень значимости для одностороннего критерия равен при этом 0.05. Этому же уровню значимости для двустороннего критерия соответствует критическое значение Q_0.975. Но Q_0.95 < Q_0.975, значит, при одностороннем критерии большее число гипотез будет отвергнуто и, следовательно, меньше будет ошибка второго рода.

⇐ Предыдущая 2 3 4 5 678 9 10 11 Следующая ⇒

Дата публикования: 2015-07-22; Прочитано: 3810 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!

studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.008 с)...