Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Критерий Колмогорова



В качестве меры отличия распределения эмпирических данных от теоретической функции А.М. Колмогоров предложил принять наибольшее по абсолютной величине расхождение между эмпирической и P*(x) и теоретической P(x) функциями обеспеченностей:

D = max ½ P*(x) - P(x)½

Вычисления по критерию Колмогорова производятся следующим образом. Для каждого значения случайной величины в выборке вычисляются P*(x), P(x) и их разности. Затем выбирается наибольшая по модулю разность D и рассчитывается статистика

Ø

l* = DÖn, где n – объем выборки.

Колмогоров доказал, что функция обеспеченностей статистики l при достаточно большом объеме выборки (n>40) может быть аппроксимирована выражением

n

P {l*>l}» P {l} = 2 S (-1)k-1 exp(-2k2l2)

k=1

Если значение P {l} больше принятого уровня значимости, то гипотеза о соответствии эмпирической и аналитических кривых обеспеченностей не опровергается. Этот критерий имеет определенные недостатки, так, при его применении учитывается лишь наибольшее расхождение между эмпирической и теоретической функциями распределения, т.е. используется не вся информация. Оценка согласия по одной точке, особенно при небольшой длине выборки может плохо отражать соответствие эмпирических данных теоретическому закону распределения. Критерий Крамера-Мизеса-Смирнова является более мощным, чем критерий Колмогорова, т.е. если применение этих критериев дает различные результаты, то принимается результат, полученный при помощи первого критерия. Функцией мощности критерия называется функция, которая позволяет при заданной функции распределения вычислить вероятность того, что нулевая гипотеза будет отвергнута. Зная эту функцию, можно вычислить вероятности ошибок первого и второго рода. К сожалению, найти её удается крайне редко.

Проверка соответствия распределения выборки нормальному закону по критерию Колмогорова

В начале выполняются абсолютно те же операции, что и в случае применения критерия Крамера-Мизеса-Смирнова: импорт данных, определение размера выборки, оценок математического ожидания и среднего квадратического отклонения, выявление повторов, расчет эмпирических значений обеспеченности, расчет теоретических значений обеспеченности для предполагаемого закона распределения (в данном случае – нормального). Поэтому данная часть программы (рабочей области Маткада) идентична соответствующей части программы применения критерия Крамера-Мизеса-Смирнова. Далее находим максимальную разницу между эмпирической и теоретической обеспеченностями D:

Задаем уровень значимости в процентах.

Вычисляем оценку статистики .

Расчет функции "P", показывающей соответствие эмпирической и теоретической кривых обеспеченностей:

Приведённые примеры показывают, что распределение содержащихся в файле vector.xls данных не соответствует нормальному закону по критериям Крамера-Мизеса-Смирнова и Колмогорова. Это означает, что мы не имеем права для проверки принадлежности двух групп данных к одной генеральной совокупности (т.е. однородности значений) применять параметрические критерии Стьюдента и Фишера. Данный результат довольно характерен для наборов экологических параметров, поскольку меньшие значения концентрации какого-либо загрязняющего вещества в окружающей среде, к счастью, всё же встречаются чаще, чем «зашкаливающие» значения. Если в результате применения критериев согласия оказывается, что распределение натурных данных слишком сильно отличается от нормального закона, то это отнюдь не повод для паники – в нашем распоряжении непараметрические критерии, которые не требуют от набора данных соответствия нормальному закону распределения, они вообще не требуют знания закона распределения. Однако если результат применения критериев согласия позволяет считать распределение набора натурных данных достаточно близким к нормальному, то следует применять именно параметрические критерии как более мощные. Необходимо отметить, что все вышеперечисленные критерии не «ловят» различия асимметрий. Учесть это позволяет экспресс-метод. Если распределения выборок явно одномодальны и применение экспресс-метода не выявило отличий от нормального закона распределения, то применение критериев Стьюдента и Фишера может быть информативным даже при отличии распределений выборок (или хотя бы одной) от нормального по критериям согласия. Перед применением критериев однородности двух групп данных весьма полезно построение совмещенного графика частотных распределений двух сравниваемых выборок.





Дата публикования: 2014-11-03; Прочитано: 1174 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.007 с)...