Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Проверка количественных характеристик выборки



В §1 были определены характеристики генеральной совокупности, т.е. принадлежность к одной генеральной выборке, а также среднее и первый момент.

На данном этапе имеется функция распределения, которая визуально похожа на некоторое уже известное распределение. Но необходимо описать эту близость математически.

Итак, начнем с рассмотрения критериев согласия.

Критерий Согласия применяется в задаче проверки согласия, суть которой заключается в следующем. Пусть X1, Х2,..., Хn -независимые случайные величины, подчиняющиеся одному и тому же вероятностному закону, функция распределения которого F(x) неизвестна. В таком случае задача статистической проверки гипотезы Н0, согласно которой F(x) = F0(x), где F0(x) - некоторая заданная функция распределения, называемая задачей проверки согласия. Например, если F0(x) - непрерывная функция распределения, то в качестве критерия согласия для проверки гипотезы Н0 можно воспользоваться критерием Колмогорова или Смирного.

Предположим, что выборка произведена из генераль­ной совокупности с неизвестной теоретической функцией распределе­ния, относительно которой имеются две непараметрические гипотезы: простая основная : F(x) = F0(x) и сложная конкурирующая : F F , где F (x) — известная функция распределения. Иными словами, мы хотим проверить, согласуются эмпирические данные с нашим гипотетическим предположением относительно теорети­ческой функции распределения или нет. Поэтому критерии для про­верки гипотез Н и Н носят название критериев согласия.

Пример. Гипотезу о том, что числа представляют собой независимые значения случайной величины, равномер­но распределенной на отрезке , можно проверять с помощью критерия Колмогорова, основанного на ста­тистике

,

где - эмпирическая функция распределения выборки . Соответствующая детерминистическая задача: можно ли с заданной точностью оценить интеграл произвольной функ­ции f(x) из , усредняя значения . Формула

показывает, что это возможно тогда и только тогда, когда величина х достаточно мала.

Критерий согласия Колмогорова. Уже говорилось (параграф 3 гл. 1), что в силу теоремы Гливенко-Кантелли эмпирическая функция распреде­ления F*(x) представляет собой состоятельную оценку теоретической функции распределения F(x). Поэтому можно сравнить эмпирическую функцию распределения F*(x) с гипотетической F0(x) и, если мера расхождения между ними мала, то считать справедливой гипотезу H0.

Наиболее естественной и про­стой из таких мер (будем предпо­лагать, что F (x) — непрерывная функция) является равномерное расстояние

(рис. 6). Од­нако при построении критерия

Колмогорова более удобно пользоваться нормированным расстоянием .

Итак, рассмотрим статистику

Критерий Колмогорова предписывает принять гипотезу H0, если <С, и отвергнуть в противном случае, где С — критическое значение кри­терия.

Если гипотеза H справедлива, то распределение статистики не зависит от гипотетической функции распределения F0(x) (доказа­тельство этого факта следует из инвариантности статистики критерия Колмогорова относительно монотонных преобразований, в частности преобразования g(x)=F (x), где F (x) — обратная к F (x) функ­ция; преобразование g(х) приводит выборку Х ,...,Х к равномерно распределенной на отрезке (0,1)). Поэтому можно рассчитать таблицы, которые по заданному объему выборки и и критическому значению С позволяют определить уровень значимости критерия а. Поскольку на практике обычно, наоборот, считают известными уровень значимости а и объем выборки п, а затем по ним определяют критическое значе­ние С.

При —> распределение статистики сходится к распределению Колмогорова [1, табл. 6.1], и критическое значение С при большом объеме выборки практически совпадает с (1- )-квантилью рас­пределения Колмогорова.

При практической реализации критерия Колмогорова сначала по выборке Х ,...,Х составляют вариационный ряд Х ,…,Х . Затем находят F (X ) и определяют значения статистики р по формуле

Наконец, сравнивают полученное значение с критическим значени­ем С для заданного уровня значимости и принимают или отвергают гипотезу H .

Пример. Проверим с помощью критерия Колмогорова гипотезу Н о том, что проекция X вектора скорости молекулы водорода на ось координат (см. пример 1 из гл. 1) распределена по нормальному закону. Проверку про­изведем для уровня значимости = 0,05. Параметры нормального закона не заданы, значит, мы имеем дело со сложной гипотезой Н и сначала должны оценить среднее и дисперсию - Поскольку мы будем пользоваться кри­терием Колмогорова, хотелось бы оценки и неизвестных параметров и выбрать таким образом, чтобы они доставляли минимальное значение статистики критерия Колмогорова

где — вариационный ряд выборки , приведенный в табл. 3 гл. 1, а — функция распределения

нормального закона с параметрами . Однако искать минимум

как функции от и — весьма сложная в вычислительном плане

задача, так как Ф(х) даже не выражается в элементарных функциях-

Поэтому в качестве оценок и используем оценки максимального правдоподобия и (см. примеры 8 из гл. 1 и 15 из гл.2). Теперь с помощью критерия Колмогорова будем проверять простую гипотезу . Вычислив сначала и воспользовавшись равенством последовательно находим затем значения (1, c. 112-117), b (табл.2). Наконец, определяя значение статистики критерия Колмогорова

(максимальное значение равно 0,06) и сравнивая его с 0,95-квантилью распределения Колмогорова , видим, что < .Значит, мы должны принять гипотезу Н и считать распределение проекции вектора скорости молекулы водорода нормальным.

Критерий Шапиро-Уилка. Базируется на анализе линейной комбинации разностей порядковых статистик, используют при объемах выборки 8£ £50. Рекомендуют применять при отсутствии априорной информации о типе возможного отклонения от нормальности. Критерий Шапиро-Уилкаhttp://www.ami.nstu.ru/%7Eheadrd/Kurs_projekt.htm - _ftn5 используют в тех случаях, когда в качестве альтернативы можно выбрать гипотезу следующего вида: примерно симметричное распределение с <1/2 и <3 или асимметричное распределение (например, >1/2). В противном случае рекомендуют критерий Эппса-Палли. Для вариационного ряда , построенного по наблюдаемой выборке , вычисляют величину

(159)

где индекс изменяется от 1 до или от 1 до при четном и нечетном соответственно. Статистика критерия имеет вид

. (160)

Гипотеза о нормальности отвергается при малых значениях статистики .

Критерий Эппса-Палли. Базируется на сравнении эмпирической и теоретической характеристических функциях, применяют при 8 200. По наблюдаемой выборке вычисляют статистику критерия

, (161)

где , .

Гипотезу о нормальности отвергают при больших значениях статистики.

Модифицированный критерий Шапиро-Уилка. Применяется для нескольких неза­висимых выборок одинакового объема 8 50, когда отдельная выборка слишком мала, чтобы обнаружить отклонения от нормальности. Предполагается, что выборок одного и того же объема взято из одной генеральной совокупности. Для каждой выборки в соответствии с соотношением (160) подсчитывают значения , . Вычисляют значения

, (161)

где

, (162)

а коэффициенты , и табулированы. Если наблюдаемое распределение нормальное, то переменные приблизительно подчиняются стандартному нормальному закону. В качестве статистики критерия используется величина

, (163)

где

. (164)

Гипотеза о нормальности отклоняется, при уровне значимости , если

< , (165)

где – соответствующий квантиль стандартного нормального распределения.

Список литературы

1. Лемешко Б.Ю., Помадин С.С. Проверка гипотез о математических ожида­ниях и дисперсиях в задачах метрологии и контроля качества при вероят­ностных законах, отличающихся от нормального // Метрология. 2004. – № 3.- С.3-15.

2. Лемешко Б.Ю., Лемешко С.Б., Миркин Е.П. Исследование критериев про­верки гипотез, используемых в задачах управления качеством // Мате­риалы VII международной конференции “Актуальные проблемы элек­тронного приборострое­ния” АПЭП-2004. Новосибирск, 2004. – Т. 6. – С. 269-272.

3. Большев Л.Н., Смирнов Н.В. Таблицы математической статистики. – М.: Наука, 1983. – 416 с.

4. Лемешко Б.Ю., Миркин Е.П. Критерии Бартлетта и Кокрена в измеритель­ных задачах при вероятностных законах, отличающихся от нормального // Измерительная техника. 2004. № 10. – С. 10-16.

5. Орлов А.И. О проверке однородности двух независимых выборок // Заво­дская лаборатория. – 2003. – Т.69. №.1. – С.55-60.

6. Смирнов Н.В. Оценка расхождения между эмпирическими кривыми распре­деления в двух независимых выборках // Бюллетень МГУ, серия А. – 1939. – Т.2. №2. – С.3-14.

7. Боровков А.А. К задаче о двух выборках // Изв. АН СССР, серия матем., 1962. Т. 26. – С.605-624.

8. Королюк В.С. Асимптотический анализ распределений максимальных ук­лонений в схеме Бернулли // Теория вероятностей и ее применения. – 1959. – Т.4. – С. 369-397.

9. Смирнов Н.В. Вероятности больших значений непараметрических односто­ронних критериев согласия // Труды Матем. ин-та АН СССР. – 1961. – Т.64. – С. 185-210.

10. Lehmann E.L. Consistency and unbiasedness of certain nonparametric tests / Ann. Math. Statist. – 1951. V.22. № 1. – P.165-179.

11. Rosenblatt M. Limit theorems associated with variants of the von Mises statis­tic // Ann. Math. Statist. – 1952. V.23. – P.617-623.

12. Энциклопедический словарь Вероятность и математическая статистика.

13. А.Н. Ширяев Вероятность // Изд. МЦНМО – 2004. – Ч1. – С. 448-490.

Кластерный анализ





Дата публикования: 2014-11-18; Прочитано: 1458 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.007 с)...