Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Тема 3. Статистическая проверка гипотез



Статистической называют гипотезу (предположение) о виде неизвестного распределения или о параметрах известных распределений.

Нулевой (основной) называют выдвинутую гипотезу Н0, которую необходимо проверить. Конкурирующей (альтернативной) гипотезой Н1 называют гипотезу, противоположную нулевой гипотезе.

Если проверяемое утверждение сводится к гипотезе о том, что значение некоторого параметра θ в точности равно заданной величине θ0, то это гипотеза называется простой, в других случаях гипотеза будет называться сложной.

Статистическим критерием называют случайную величину , которая служит для проверки гипотезы. Статистический критерий однозначно определяет правило, устанавливающее условия, при которых выдвинутую гипотезу Н0 следует либо отвергнуть, либо принять.

Наблюдаемым (эмпирическим) значением называют то значение критерия, которое вычислено по выборке.

Критической областью (W) называют совокупность значений критерия, при которых нулевую гипотезу Н0 отвергают. Областью принятия гипотезы (областью допустимых значений, Q) называют совокупность значения критерия, при которых нулевую гипотезу Н0 принимают. Критическими точками (границами) qкр называют точки, отделяющие критическую область от области принятия гипотезы.

В зависимости от содержания конкурирующей гипотезы Н1 выбирают правостороннюю, левостороннюю или двустороннюю критические области.

Правосторонней называют критическую область, определяемую неравенством > qкр, где qкр - положительное число. Левосторонней называют критическую область, определяемую неравенством < qкр, где qкр - отрицательное число. Двусторонней называют критическую область, определяемую неравенствами < q1 и > q2 , где q2 > q1 .

В частности, если критические точки симметричны относительно нуля, то двустороння критическая область определяется неравенствами (в предположении, что qкр>0): <- qкр, > qкр, или равносильным неравенством > qкр.

Основной принцип проверки статистических гипотез: если наблюдаемое значение критерия принадлежит критической области, то нулевую гипотезу отвергают; если наблюдаемое значения критерия принадлежит области принятия гипотез, то гипотезу принимают. При использовании этого принципа возможны четыре случая:

- гипотеза Н0 верна и ее принимают согласно критерию;

- гипотеза Н0 неверна и ее отвергают согласно критерию;

- гипотеза Н0 верна но ее отвергают согласно критерию, т.е. допускается ошибка, которую принято называть ошибкой первого рода.

- гипотеза Н0 неверна и ее принимают согласно критерию, т.е. допускается ошибка второго рода.

Уровнем значимости α = 1-γ называют вероятность совершить ошибку первого рода. С уменьшением α возрастает вероятность ошибки второго рода β.

Мощностью критерия (1- β) называют вероятность попадания критерия в критическую область при условии, что справедлива конкурирующая гипотеза. Другими словами, мощность критерия есть вероятность того, что нулевая гипотеза Н0 будет отвергнута, если верна конкурирующая гипотеза.

Пусть Р( W/Н) – вероятность попадания статистики критерия в критическую область W, если верна соответствующая гипотеза Н.

Тогда требования к критической области можно записать следующим образом:

(3.1)

Из условия (3.1) следует, что критическую область нужно выбирать так, чтобы вероятность попадания в нее была бы минимальной (равной α), если верна нулевая гипотеза и максимальной в противоположном случае.

Границы критической области при заданном уровне α находят из соотношений:

при правосторонней критической области: Р( > qкр) = α; (3.2)

при левосторонней критической области: Р( <qкр) = α; (3.3)

при двусторонней критической области: Р( > q кр.пр) = ;

Р( <q кр.лев) = . (3.4)

Общая логическая схема статистического критерия.

1. Выдвигается гипотеза Н0.

2. Задается величина уровня значимости критерия α. К стандартным значениям можно отнести величины α =0,1; 0,05; 0,025; 0,01; 0,005; 0,001. Особенно распространенной является величина уровня значимости α, равная 0,05. Она означает, что в среднем, в пяти случаях из ста выдвинутая гипотеза будет ошибочно отвергнута.

3. Задаются некоторым статистическим критерием, который в предположении справедливости выдвинутой гипотезы Н0 подчинен некоторому хорошо изученному (табулированному) закону распределения. Статистический критерий служит мерой расхождения имеющихся в распоряжении выборочных данных с проверяемой гипотезой Н0.

4. В зависимости от вида критической области (двусторонняя или односторонняя) по таблице плотности распределения статистического критерия находят 100(1- )% - ные точки распределения для двусторонней области или 100(1- α)% - ную точку распределения для односторонней области. Указанные токи разделяют всю область мыслимых значений на три части: область неправдоподобно малых, область неправдоподобно больших и правдоподобных значений. В терминах данных выше определений области неправдоподобно больших и неправдоподобно малых значений составляют критическую область. Область правдоподобных значений составляет область принятия гипотезы.

5. По имеющимся выборочным данным подсчитывают численное значение статистического критерия. Если вычисленное значение критерия принадлежит области правдоподобных значений (области принятия гипотезы), гипотеза Н0 считается не противоречащей выборочным данным.

К основным типам гипотез, проверяемых в ходе статистической обработки данных можно отнести следующие: гипотезы о числовых значениях параметров исследуемой генеральной совокупности; гипотезы об однородности двух или нескольких выборок или некоторых характеристик анализируемых совокупностей; гипотезы о типе закона распределения исследуемой случайной величины.

Проверка гипотезы о значении генеральной средней

Дисперсия генеральной совокупности известна.

Правило 1. Для того чтобы при заданном уровне значимости α проверить нулевую гипотезу Н0: μ= μ0 о равенстве генеральной средней μ гипотетическому значению μ0 при конкурирующей гипотезе Н1: μ μ0, надо вычислить наблюдаемое значение критерия tн = (3.5)

и по таблице функции Лапласа найти критическую точку tкр двусторонней критической области из равенства Ф(tкр) = 1-α. (3.6)

Если < tкр – нет оснований отвергнуть нулевую гипотезу. Если > tкр – нулевую гипотезу отвергают.

Правило 2. При конкурирующей гипотезе Н1: μ> μ0 критическую точку правосторонней области находят из равенства Ф(tкр) = 1-2α. (3.7)

Если tн < tкр – нет оснований отвергнуть нулевую гипотезу, если tн> tкр – нулевую гипотезу отвергают.

Правило 3. При конкурирующей гипотезе Н1: μ < μ0 сначала находят вспомогательную критическую точку tкр по правилу 2, а затем полагают границу левосторонней критической области = - tкр. Если tн > -tкр – нет оснований отвергнуть нулевую гипотезу, если tн<- tкр – нулевую гипотезу отвергают.

Дисперсия генеральной совокупности неизвестна. В качестве критерия проверки нулевой гипотезы Н0: μ= μ0 используют выборочную характеристику

tн = . (3.8)

Величина tн имеет распределение Стьюдента с ν=n-1 степенями свободы.

Правило 1. Для того чтобы при заданном уровне значимости α проверить нулевую гипотезу о равенстве генеральной средней μ гипотетическому значению μ0 при конкурирующей гипотезе Н1: μ μ0, надо вычислить наблюдаемое значение критерия и по таблице распределения Стьюдента найти критическую точку tкр(α; ν), исходя из условия St(tкр; ν)=Р( >tкр)= α. (3.9)

Если < tкр(α; ν) – нет оснований отвергнуть нулевую гипотезу. Если
> tкр(α; ν) – нулевую гипотезу отвергают.

Правило 2. При конкурирующей гипотезе Н1: μ> μ0 критическую точку правосторонней области находят из равенства St(tкр; ν)=Р( >tкр)= 2α. (3.10)

Если tн < tкр(2α; ν) – нет оснований отвергнуть нулевую гипотезу. Если tн > tкр(2α; ν) – нулевую гипотезу отвергают.

Правило 3. При конкурирующей Н1: μ < μ0 сначала находят вспомогательную критическую точку tкр по правилу 2, а затем полагают границу левосторонней критической области = - tкр. Если tн >- tкр(2α; ν) - нет оснований отвергнуть нулевую гипотезу, если tн<- tкр(2α; ν) – нулевую гипотезу отвергают.

Проверка гипотезы о значении дисперсии генеральной совокупности

В качестве критерия проверки нулевой гипотезы Н0: σ2= σ02 принимают случайную величину , (3.11)

которая имеет распределение с ν=n-1 степенями свободы.

Правило 1. Если Н1: , то строят двустороннюю критическую область. Левую () и правую () границы критической области находят из условий:

Р(χ2> (1- ; ν))=1- , (3.12)

Р(χ2> (1- ; ν))= .

В этом случае правило проверки гипотезы сводится к следующему: если , то у нас нет основания отвергнуть гипотезу. Если же < или > , то гипотезу отвергают.

Правило 2. Если Н1: , то строят правостороннюю критическую область и находят из условия: Р(χ2> (α; ν))= α. (3.13)

Если > , то нулевую гипотезу отвергают, если же < , то нулевая гипотеза не противоречит опытным данным.

Правило 3. Если Н1: , то строят левостороннюю критическую область и находят из условия: Р(χ2> (1-α; ν))= 1-α. (3.14)

Если < , то нулевую гипотезу отвергают, если же , то нулевая гипотеза не отвергается.

Сравнение наблюдаемой относительной частоты с гипотетической
вероятностью появления события

Пусть по достаточно большому числу n независимых испытаний, в каждом из которых вероятность р появления события А постоянна, но неизвестна, найдена относительная частота . Требуется при заданном уровне значимости α проверить нулевую гипотезу Н0: р= р0.

Для проверки нулевой гипотезы используется статистика

tн = , (3.15)

при больших n (n>0), имеющей приближенно нормальное распределение.

Правило 1. При конкурирующей гипотезе Н1: р р0 критическую точку tкр двусторонней критической области находят из условия: Ф(tкр)= 1- α. (3.16)

Если < tкр – нет оснований отвергнуть нулевую гипотезу, если > tкр - нулевую гипотезу отвергают.

Правило 2. При конкурирующей гипотезе Н1: р > р0 критическую точку tкр правосторонней критической области находят из условия: Ф(tкр)= 1- 2α. (3.17)

Если tн < tкр – нет оснований отвергнуть нулевую гипотезу, если tн > tкр -
нулевую гипотезу отвергают.

Правило 3. При конкурирующей гипотезе Н1: р < р0 находят критическую точку tкр по правилу 2, затем полагают границу левосторонней критической области = - tкр. Если tн >- tкр – нет оснований отвергнуть нулевую гипотезу, если tн <- tкр - нулевую гипотезу отвергают.

При использовании вышеприведенных правил следует иметь ввиду, что удовлетворительные результаты обеспечивает выполнение неравенства np0q0 >9.

Сравнение двух средних нормальных генеральных совокупностей

Дисперсии генеральных совокупностей известны. Пусть X и Y - нормальные генеральные совокупности с известными дисперсиями и и неизвестными математическими ожиданиями μх и μу.

Из генеральных совокупностей взяты две независимые выборки объемом nх и nу. Пусть - средние арифметические выборочных совокупностей. Требуется проверить нулевую гипотезу Н0: μх= μу на уровне значимости α.

Для проверки нулевой гипотезы используется следующая статистика:

tн = , (3.17)

имеющая нормальное нормированное распределение с параметрами N(0;1)

Правило 1. При конкурирующей гипотезе Н1: μх μу критическую точку tкр двусторонней критической области находят из условия: Ф(tкр)=1- α. (3.18)

Если < tкр – нет оснований отвергнуть нулевую гипотезу, если > tкр - нулевую гипотезу отвергают.

Правило 2. При конкурирующей гипотезе Н1: μх > μу критическую точку tкр правосторонней критической области находят из условия: Ф(tкр)=1- 2α. (3.19)

Если tн < tкр – нет оснований отвергнуть нулевую гипотезу, если tн > tкр -
нулевую гипотезу отвергают.

Правило 3. При конкурирующей гипотезе Н1: μх < μу находят критическую точку tкр по правилу 2, затем полагают границу левосторонней критической области = - tкр. Если tн >- tкр – нет оснований отвергнуть нулевую гипотезу, если tн <- tкр - нулевую гипотезу отвергают.

Дисперсии генеральных совокупностей неизвестны. Для проверки нулевой гипотезы Н0: μх= μу на уровне значимости α используют статистику:

tн = , (3.20)

имеющую распределение Стьюдента с числом степеней свободы ν= nх+ nу –2.

Правило 1. При конкурирующей гипотезе Н1: μх μу критическую точку tкр(α;ν) двусторонней критической области находят из условия:

St(tкр; ν)=Р( >tкр)= α (3.21)

Если < tкр(α; ν) – нет оснований отвергнуть нулевую гипотезу. Если
> tкр(α; ν) – нулевую гипотезу отвергают.

Правило 2. При конкурирующей гипотезе Н1: μх > μу критическую точку правосторонней области находят из равенства St(tкр; ν)=Р( >tкр)= 2α. (3.22)

Если tн < tкр(2α; ν) – нет оснований отвергнуть нулевую гипотезу. Если
tн > tкр(2α; ν) – нулевую гипотезу отвергают.

Правило 3. При конкурирующей гипотезе Н1: μх < μу сначала находят вспомогательную критическую точку tкр по правилу 2, а затем полагают границу левосторонней критической области = - tкр. Если tн > -tкр(2α; ν) - нет оснований отвергнуть нулевую гипотезу, если tн< -tкр(2α; ν) – нулевую гипотезу отвергают.

Проверка гипотезы о равенстве генеральных дисперсий
двух нормальных совокупностей

Пусть X и Y генеральные совокупности, значения признаков которых распределены по нормальному закону с дисперсиями и . Из этих совокупностей взяты независимые случайные выборки объемом nх и nу , и пусть и , причем > . Требуется на заданном уровне значимости α проверить нулевую гипотезу Н0: = . Для проверки нулевой гипотезы используется статистика

Fн = , (3.23)

подчиняющаяся распределению Фишера-Снедекора (F-распределение) с ν1= nх–1 и ν2= nу –1.

Правило 1. При конкурирующей гипотезе Н1: критическую точку Fкр двусторонней критической области находят из условия:

P (F> Fкр(α/2; ν1; ν2))= α/2. (3.24)

Если Fн < Fкр - нет оснований отвергнуть нулевую гипотезу, если Fн > Fкр - нулевую гипотезу отвергают.

Правило 2. При конкурирующей гипотезе Н1: > критическую точку Fкр двусторонней критической области находят из условия:

P (F> Fкр(α; ν1; ν2))= α. (3.25)

Если Fн < Fкр - нет оснований отвергнуть нулевую гипотезу, если Fн > Fкр - нулевую гипотезу отвергают.

Проверка гипотезы об однородности ряда дисперсий.

При сравнении более двух генеральных дисперсий применяют два наиболее часто употребляемых критерия: критерий Бартлета и критерий Кохрана.

Критерий Бартлета. Пусть генеральные совокупности Х1 , Х2,…, Хl распределены нормально. Из этих совокупностей извлечены независимые выборки различных объемов ni . По выборкам найдены исправленные дисперсии , ,…, . Требуется на уровне значимости α проверить нулевую гипотезу:

Н0: = =….= .

В качестве выборочной характеристики используется статистика, предложенная Бартлетом: = , (3.26)

При >3 величина приближенно имеет распределение с ν = l -1 степенями свободы, где l - число выборок; -исправленная выборочная дисперсия i – ой выборки; = - среднее значение исправленной дисперсии по всем l выборкам.

Правило. Для проверки нулевой гипотезы строят правостороннюю критическую область, границы которой находят по таблице распределения из условия: P ( > (α; ν= l -1)= α. (3.27)

Если < - нет оснований отвергнуть нулевую гипотезу, если > - нулевую гипотезу отвергают.

Критерий Кохрана. Данный критерий применяется для проверки на уровне значимости α нулевой гипотезы Н0: = =….= по выборкам разных объемов ni. В качестве выборочной характеристики используется статистика, предложенная Кохраном: G= , (3.28)

имеющая G – распределение с числом степеней свободы ν1= n –1 и ν2= l, где l – число сравниваемых совокупностей.

Для проверки нулевой гипотезы строят правостороннюю критическую область, границу которой Gкр определяют по таблице G – распределения, исходя из условия: P (Gн > Gкр (α; ν))= α. (3.29)

Если Gн < Gкр - то нулевая гипотеза не отвергается.

Гипотеза об однородности рада вероятностей

Пусть Х1 , Х2,…, Хl - l генеральных совокупностей, каждая из которых характеризуется неизвестным параметром Рi, где Рi - вероятность появления события А в соответствующей выборке. Требуется на уровне значимости α проверить нулевую гипотезу Н0: р1= p2 =… = pl.

Для проверки гипотезы используется статистика

= , (3.30)

которая имеет асимптотическое распределение с ν= l -1 степенями свободы, l - число выборок;

где = - частость появления события А в i–ой выборке;

- частота появления события А в i–ой выборке;

- объем i–ой выборки;

= – частость появления события А во всех выборках;

=(1- ) – частость появления события , противоположного событию A, во всех выборках.

Для проверки нулевой гипотезы строят правостороннюю критическую область, границу которой определяют из условия: P ( > (α; ν))= α. (3.31)

Если < - нет оснований отвергнуть нулевую гипотезу, если > - нулевую гипотезу отвергают.

Гипотезы о виде законов распределения генеральной совокупности

Проверка гипотез о виде законов распределения генеральной совокупности осуществляется с помощью критериев согласия.

Критерием согласия называется статистический критерий, предназначенный для проверки гипотезы Н0 о том, что ряд наблюдений х1, х2,…хn образует случайную выборку, извлеченную из генеральной совокупности Х с функцией распределения F(x)=F(x;θ1; θ2;… θk), где общий вид функции F(x) считается заданным, а параметры θ1; θ2;… θk, от которых она зависит могут быть, как известными, так и неизвестными. Критерии согласия основаны на использовании различных мер расстояний между анализируемой эмпирической функцией распределения Fn(x), определяемой по выборке, и функцией распределения F (x) генеральной совокупности Х.

Математически, нулевую гипотезу можно записать в следующем виде:

Н0: =р1, = р2, = р l,

- относительная частота i -го интервала вариационного ряда или i -го варианта, принимаемого случайной величиной Х;

рl – вероятность попадания случайной величины в i-тый интервала или вероятность того, что дискретная величина примет i-тое значение (Х=хi).

Критерий Пирсона (критерий - ) имеет наибольшее применение при проверке согласования теоретической и эмпирической функций распределения.

Процедура проверки статистической гипотезы о виде распределения с помощью критерия согласия Пирсона состоит из следующих этапов.

1. Весь диапазон значений исследуемой случайной величины разбивается на ряд интервалов группирования Δ1, Δ2, …,Δl, необязательно одинаковой длины.

2. Подсчитывается число точек, попавших в каждый из интервалов группирования Δi.

3. На основе сгруппированных данных вычисляются оценки k неизвестных параметров распределения θ k.

4. Вычисляется вероятность рi попадания случайной величины Х в каждый из интервалов группирования Δi.

5. Вычисляется наблюдаемое значение статистики критерия

= , (3.32)

сравнивается с табличным значением , найденным для уровня значимости α и числа степеней свободы ν = l-k-1, где l - число интервалов, k – число параметров, которыми определяется функция распределения.

Если , то гипотеза о том, что генеральная совокупность Х подчиняется закону распределения F (x) принимается.

В случае нормального закона распределения вероятность попадания случайной величины Х в соответствующие интервалы вычисляется по интегральной теореме Лапласа: рi = Р(аi<x<bi) = , (3.33)

где t 1i = , t 2i = ; аi,bi – нижняя и верхняя граница соответствующего интервала i.

Контрольные вопросы и задачи

3.1. По результатам 15 испытаний установлено, что среднее время изготовления детали = 28с. В предположении, что время изготовления детали является нормальной случайной величиной с известным генеральным средним квадратическим отклонением =1,2с, на уровне значимости =0,05 проверить гипотезу Н0: μ= 30 с против конкурирующей гипотезы Н1: μ= 25с.

3.2. На основании 20 измерений, было установлено что средняя длина трубы равна = 15,4м, а s =0,23м. В предположении о нормальном законе распределения на уровне значимости =0,05 проверить гипотезу Н0: μ= 15м против конкурирующей гипотезы Н1: μ 15м.

3.3. По данным задачи 3.2 проверить на уровне значимости =0,05 гипотезу Н0: = 0,06 м2 при конкурирующей гипотезе Н1: =0,03 м2.

3.4. По двум независимым выборкам объемом n1 =30 и n2 =15, извлеченным из нормальных генеральных совокупностей, найдены выборочные средние =25 и =27. Дисперсии генеральных совокупностей известны =1,3 и =1,6. На уровне значимости =0,1 проверить гипотезу Н0: μ1= μ2 при конкурирующей гипотезе Н1: μ1 μ2.

3.5. Для сравнения точности изготовления деталей двумя станками-автоматами взяты две выборки объемом n1 =12 и n2 =8. По результатам измерений контролируемого размера деталей вычислены средние =31,5мм и =30,2мм, а также исправленные выборочные дисперсии =1,05мм2 и =0,86мм2. Проверить на уровне значимости =0,05 гипотезу Н0: = при конкурирующей гипотезе Н1: > .

3.6. По четырем независимым выборкам объемом n1 =12, n2 =8, n3 =13, n4 =11, извлеченным из нормальных генеральных совокупностей, найдены выборочные исправленные дисперсии =2,1, =1,9, =2,2, =2,3. Проверить на уровне значимости =0,05 гипотезу об однородности дисперсий Н0: = =….= .

3.7. Для сравнения точности работы четырех станков из продукции каждого станка взято по одной выборке из 25 деталей. По результатам измерений найдены несмещенные оценки дисперсий =0,1, =0,19, =0,2, =0,13. Допустив, что погрешность есть нормальная случайная величина, проверить при уровне значимости =0,05 гипотезу о том, что точность станков одинакова.

3.8. Для сравнения качества работы четырех сборочных конвейеров из общего дневного объема продукции каждого конвейера отобрано соответственно n1 =20, n2 =26, n3 =18, n4 =24 изделий, из которых оказались дефектными m1 =2, m2 =4, m3 =1, m4 =2. На уровне значимости =0,05 проверить гипотезу о том, что вероятности появления дефектного изделия на всех станках равны, т.е. Н0: р1= p2 = p3 = p4.





Дата публикования: 2015-01-09; Прочитано: 1557 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.033 с)...