Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Проверка гипотезы о виде закона распределения вероятностей исследуемой случайной величины



(Критерий Пирсона – «критерий согласия»)

Анализ распределения значений относительных частот по интервалам построенного вариационного ряда и вида гистограммы позволяет сделать предположение о виде закона распределения вероятностей исследуемой случайной величины.

Вид гистограмм, построенных по интервальным вариационным рядам, позволяет сделать предположение, что эти гистограммы являются статистическими моделями плотностей вероятности случайных величин непрерывного типа, подчиняющихся «гамма-распределению», плотность вероятности которого имеет вид:

Здесь и - числовые параметры распределения.

В рассматриваемых примерах случайных величины и - количество слов в предложении, и - количество букв в предложении являются случайными величинами дискретного типа. То есть их возможными значениями являются натуральные числа, а законом распределения вероятностей этих возможных значений будет набор вероятностей этих возможных значений.

Известно, что «гамма-распределение» является непрерывным аналогом отрицательного биномиального распределения. Случайная величина , подчиняющаяся этому распределению, свои возможные значения k принимает с вероятностями:

, где .

Здесь и - числовые параметры распределения.

Если мы примем гипотезу о том, что построенные гистограммы являются статистическими моделями плотности вероятности «гамма-распределения», то будем считать, что рассматриваемые случайные величины и подчиняются отрицательному биномиальному распределению. При этом мы считаем, что:

.

Так как и , а и , то получаем формулы связи параметров этих распределений: и .

Формулируем гипотезу случайная величина подчиняется гамма-распределению с плотностью вероятности:

Точные значения параметров распределения и , как и значения числовых характеристик - и , случайной величины мы не знаем. Но из равенств: и мы получаем: и . Применяя метод моментов, заменим значения параметров и их точечными оценками: и .

Критерием проверки справедливости гипотезы является случайная величина , подчиняющаяся распределению Пирсона («хи-квадрат распределению») с параметром . Здесь: k – количество интервалов вариационного ряда, l – количество параметров распределения, которые заменяются их точечными оценками. Значения частот попаданий элементов выборки в интервал определяются при построении вариационного ряда. Теоретические вероятности вычисляются как приращения предполагаемой функции распределения: , где . Так как диапазон изменений возможных значений элементов выборки: , как правило, находится в области возможных значений случайной величины , то:

и .

При этом всегда должно выполняться равенство: .

В рассматриваемом примере значения проверяемой функции распределения , являющейся неполной гамма-функцией, будем определять как сумму ряда:

.

Точечные оценки параметров распределения для случайной величины равны: и . По таблицам значений гамма-функции определяем:

.

Количество членов ряда – слагаемых определяется заранее назначенной точностью вычислений.

Все промежуточные результаты при вычислении наблюдаемого значения критерия удобно записывать в таблицу:

 
  0,1512   15,12 0,548
  0,2929   29,29 0,251
  0,2394   23,94 0,361
  0,1506   15,06 0,075
  0,0836   8,36 0,666
  0,0429   4,29 0,020
  0,0211   2,11 0,375
  0,0183   1,83 0,016
       
   

Наблюдаемое значение критерия проверки гипотезы равно: . По таблицам распределения «хи-квадрат» при уровне значимости определяем критическое значение критерия . Так как наблюдаемое значение критерия оказалось меньше его критического значения: , то по правилу принятия решений делаем вывод, что у нас нет оснований отклонять гипотезу , то есть случайная величина подчиняется «гамма-распределению».

По виду гистограммы относительных частот количеств букв в предложении формулируем аналогичную гипотезу о законе распределения случайной величины .

Случайная величина подчиняется «гамма-распределению» с плотностью вероятности:

Проверяя эту гипотезу, заменяем значения параметров и точечными оценками и .

Вычисляем теоретические значения вероятностей и, как и в предыдущем случае, все промежуточные результаты при вычислении наблюдаемого значения критерия записываем в таблицу:

         
  0,0574   5,74 0,0118
  0,1640   16,40 0,0098
  0,1941   19,41 0,1302
  0,1734   17,34 0,1036
  0,1351   13,51 1,4922
  0,0969   9,69 1,4052
  0,0659   6,59 0,0528
  0,0431   4,31 1,2381
  0,0274   2,74 1,8641
  0,0171   1,71 0,2948
  0,0104   1,04 0,8862
  0,0063   0,63 0,63
  0,0036   0,36 0,36
  0,0053   0,53 0,4168
     

Наблюдаемое значение критерия проверки гипотезы равно: . По таблицам распределения «хи-квадрат» при уровне значимости определяем критическое значение критерия . Так как наблюдаемое значение критерия оказалось меньше его критического значения: , то по правилу принятия решений делаем вывод, что у нас нет оснований отклонять гипотезу , то есть случайная величина подчиняется «гамма-распределению».

Замечание. При удачно выбранной гипотезе значения относительных частот , наблюдаемых по элементам выборки, мало отличаются от теоретических значений вероятностей . Часто, особенно при выборках малого объёма, на «хвостах» области возможных значений случайной величины (на крайних интервалах), где теоретические значения вероятностей - малы, даже при относительно незначительных отклонениях наблюдаемых значений от ожидаемых теоретических значений получаются большие значения слагаемых . Получающееся наблюдаемое значение критерия оказывается большим, чем критическое , что заставляет отклонить гипотезу . При этом даже на графической иллюстрации видно, что на интервалах, находящихся в середине области возможных значений, в которых оказались почти все элементы выборки, гистограмма мало отличается от графика предполагаемого теоретического распределения. В таких случаях интервалы, в которых значения малы, объединяют в один интервал. Суммируются и значения вероятностей для этих интервалов. (Обычно предлагается объединять интервалы так, чтобы суммарное число было примерно равно 10. Но это возможно при больших объёмах выборок.) При малых объёмах выборок Рекомендуется так объединять соседние интервалы в один, чтобы получаемое значение слагаемого было величиной одного порядка с большинством слагаемых, полученных для средних интервалов. Хотя это приводит к уменьшению числа степеней свободы критерия, а следовательно, и к уменьшению критического значения критерия , влияние частот малозначительных «хвостовых» интервалов на наблюдаемое значение критерия будет сравнимым с влиянием частот средних интервалов.

В рассматриваемом примере последние пять интервалов можно объединить в один интервал . Тогда получим: и . Новое наблюдаемое значение критерия будет . Так как число интервалов сократилось до десяти, то при этом же уровне значимости по таблицам определяем . Гипотеза - принимается.

Мы получили тот же конечный результат, что и при четырнадцати интервалах, но степень уверенности в правильности вывода у нас – повысилась.





Дата публикования: 2015-01-09; Прочитано: 1343 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.008 с)...