![]() |
Главная Случайная страница Контакты | Мы поможем в написании вашей работы! | |
|
.
2. При определении стандартного отклонения результаты вспомогательных вычислений сведем в третью и четвертую графы табл. 8.
3. Больше чем на 3S = 0,098067 от среднего арифметического отличается восьмое значение. Следовательно, оно является ошибочным и должно быть отброшено.
4. Без восьмого значения (При вычислении среднего, арифметического часто приходится уменьшать или увеличивать чисто слагаемых. Для того чтобы не повторять всю процедуру суммирования и не перегружать память вычислительных устройств, удобно пользоваться формулой =
5. Результаты вспомогательных вычисления при повторном определении стандартного отклонения сведем в пятую и шестую графы табл. 8.
st = 0,016.
6. Ни одно из оставшихся значений ti, не отличается теперь от среднего арифметического больше, чем на 3 St = 0,048. Можно, следовательно, считать, что среди них нет ошибочных. Универсальный метод отыскания эффективных оценок числовых характеристик любых законов распределения вероятности случайных чисел или величин разработан Р.А. Фишером. Он называется методом максимального правдоподобия. Сущность этого метода заключается в следующем.
Многомерная плотность распределения вероятности системы случайных значений р (Q1, Q2,…,Qn) рассматривается как функция числовых характеристик закона распределения вероятности. Эта функция
,
называемая функцией правдоподобия, показывает, насколько то или иное значение каждой числовой характеристики "более правдоподобно", чем другие. Функция правдоподобия достигает максимума при значениях переменных, являющихся их наиболее эффективными оценками. Последние, следовательно, находятся из условия
=max,
что равносильно совместному решению уравнений
Для упрощения вычислений функцию правдоподобия иногда логарифмируют. Так как логарифм является монотонной функцией, то L и ln L достигают экстремума при одних и тех же значениях переменных. Наиболее эффективные оценки числовых характеристик, следовательно, могут определяться из совместного решения уравнений
Пример 16. Определить методом максимального правдоподобия эффективные оценки среднего значения и дисперсии; результата измерения, независимые равноточные значения которого подчиняются нормальному закону распределения вероятности.
Решение. I. Плотность распределения вероятности каждого отдельного значения результата измерения
Поскольку все значения независимые, плотность распределения вероятности системы случайных величин
Таким образом функция правдоподобия
2. Логарифм функции правдоподобия
3. Уравнения, из которых находятся оценки:
4. Решение первого уравнения
совпадает с результатом, полученным методом наименьших квадратов.
5. Решение второго уравнения
дает хотя и эффективную, но как мы видели, несколько смещенную оценку.К несмещенной оценке приводит введение поправочного множителя
2.6.2. ПРОВЕРКА НОРМАЛЬНОСТИ ЗАКОНА РАСПРЕДЕЛЕНИЯ ВЕРОЯТНОСТИ. РЕЗУЛЬТАТА ИЗМЕРЕНИЯ
При обработке экспериментальных данных существенное значение имеет вопрос о том, подчиняется или нет результат измерения нормальному закону распределения вероятности. Непротиворечивость такой гипотезы должна быть обязательно проверена.
Поскольку ошибки искажают эмпирический закон распределения вероятности результата измерения, постольку проверка предположения о его нормальности производится после исключения ошибок.
Правдоподобна или нет гипотеза о том, что результат измерения подчиняется нормальному закону распределения вероятности, можно определить уже по виду гистограммы, построенной на основании экспериментальных данных. Порядок ее построения рассмотрен в примере 13. Наглядность отображения гистограммой закона распределения вероятности результата измерения зависит от соблюдения следующих правил при ее построении:
1) интервалы ∆ Q, на которые разбивается ось абсцисс, следует выбирать, по возможности, одинаковыми;
2) число интервалов k устанавливать в соответствии со следующими рекомендациями:
Число измерений Рекомендуемое число интервалов 40— 100 7-9
100—500 8-12
500—1000 10-16
1000-10000 12-22
3) масштаб гистограммы выбирать таким, чтобы высота гистограммы относилась к основанию примерно, как 5 к 8;
Иногда по виду гистограммы можно с большой уверенностью заключить, что результат измерения подчиняется (или не подчиняется) нормальному закону распределения вероятности. Если, например, гистограмма имеет вид, показанный на рис. 34, а, то результат измерения определенно не подчиняется нормальному закону. Если же гистограмма имеет
Рис. 34. Гистограммы, построенные по экспериментальным данным
вид, показанный на, рис. 34, б, то возникает сомнение: достаточно ли хорошо она соответствует теоретической кривой нормального закона распределения плотности вероятности, показанной пунктиром? Для разрешения этого сомнения нужно иметь правило, руководствуясь которым можно было бы принимать то или иное решение.
Существует несколько так называемых критериев согласия, по которым проверяются гипотезы о соответствии экспериментальных данных тому или иному закону распределения вероятности результата измерения. Наиболее распространенным из них является критерий К. Пирсона. При использовании этого критерия за меру расхождения экспериментальных данных с теоретическим законом распределения вероятности результата измерения принимается сумма квадратов отклонения частостей от теоретической вероятности
попадания отдельного значения результата измерения в i -й интервал, причем каждое слагаемое берется с коэффициентом
:
Если расхождение случайно, то подчиняется
— распределению (хи — квадрат распределению К. Пирсона). Кривые интегральной функции этого распределения представлены на рис. 36.
Рис. 36. Интегральная функция распределения вероятности К. Пирсона
Интегральная функция определяет вероятность того, что случайное число примет значение, меньшее аргумента этой функции. Поэтому, задавшись значением интегральной функции распределения К. Пирсона F ( ), можно проверить, больше или меньше её аргумента
(см. рис. 36) вычисленное значение
. Если меньше, то с выбранной вероятностью
можно считать случайным числом, подчиняющимся
— распределению К.Пирсона, т.е. признать случайным расхождение между эмпирической и теоретической плотностью распределения вероятности результата измерения. Если же окажется, что
>
, то с той же вероятностью придется признать, что
не подчиняется распределению К.Пирсона, т.е. гипотеза о соответствии эмпирического закона распределения вероятности теоретическому не подтверждается.
Пример 17. 100 независимых числовых значений результата измерения напряжения цифровым вольтметром, каждое из которых повторилось т раз, приведены в первой графе табл. 9
Таблица 9
U | m | mU | U - ![]() | (U - ![]() | n(U - ![]() |
8,30 | 8,30 | -0,33 | 0,1089 | 0,1089 | |
8,35 | 16,70 | -0,28 | 0,0784 | 0,1568 | |
8,40 | 33,60 | -0,23 | 0,0529 | 0,2116 | |
8.45 | 42,25 | -0,18 | 0,0324 | 0,1620 | |
8,50 | 68,00 | -0,13 | 0,0169 | 0,1352 | |
8,55 | 85,50 | -0,08 | 0,0064 | 0,0640 | |
8,60 | 154,80 | -0,03 | 0,0009 | 0,0162 | |
8,65 | 147,05 | 0,02 | 0,0004 | 0,0068 | |
8,70 | 104,40 | 0,07 | 0,0049 | 0,0588 | |
8,75 | 78,75 | 0,12 | 0,0144 | 0,1296 | |
8,80 | 61,60 | 0,17 | 0,0289 | 0,2023 | |
8,85 | 53,10 | 0,22 | 0,0484 | 0,2904 | |
8,90 | — | ||||
8,95 | 8,95 | 0,32 | 0,1024 | 0,1024 |
Проверить гипотезу о том, что результат измерения подчиняется нормальному закону распределения вероятности.
Решение. 1. Используя результаты вспомогательных вычислений, приведенные в третьей графе, найдем среднее арифметическое значение результата измерения:
= 8,63
2. Используя результаты вспомогательных вычислений в четвертой, пятой и шестой графах, найдем стандартнее отклонение результата измерения: Su = 0,127
3. Ни одно из значений результата измерения не отличается от среднего арифметического больше чем на 3 Su = 0,381. Ошибок, следовательно, можно считать, что нет.
4. При использовании критерия К. Пирсонав каждом интервале должно быть не меньше пяти независимых значений результата измерения. В соответствии с этим образуем интервалы так, как это представлено во второй графе табл. 10.
Таблица 10
i | Интервалы | mi | ti | L(ti) | Рi | mi-nPi | ![]() | ||
(Ui-1 | Ui) | ||||||||
(-∞ | 8,425) | -1,614 | -0,4467 | 0,0533 | 1,67 | 0,523 | |||
(8,425 | 8,475) | -1,220 | -0,3888 | 0,0579 | -0,79 | 0,108 | |||
(8,475 | 8,525) | -0,827 | -0,2959 | 0,0929 | -1,29 | 0,179 | |||
(8,525 | 8,575) | -0,433 | -0,1676 | 0,1283 | -2,83 | 0,624 | |||
(8,575 | 8,625) | -0.039 | -0,0156 | 0,1520 | 2,80 | 0,516 | |||
(8,625 | 8,675) | 0,354 | 0,1383 | 0,1539 | 1,61 | 0,168 | |||
(8,675 | 8,725) | 0,748 | 0,2728 | 0,1345 | -1,45 | 0,157 | |||
(8,725 | 8,775) | 1,142 | 0,3733 | 0,1005 | -1,05 | 0,110 | |||
(8,775 | 8,825) | 1,536 | 0,4377 | 0,0644 | 0,56 | 0,048 | |||
(8,825 | +∞ | +∞ | 0.5000 | 0,0623 | 0,77 | 0,095 |
5. Определим, на сколько Su в каком направлении отстоит от среднего арифметического правая граница Ui каждого интервала:
Полученные значения параметра ti (см. разд. 2.3.4) внесем в четвертую графу табл. 10.
6. По значению ti из графика на рис. 22 можно определить, с какой вероятностью отдельное значение результата измерения, подчиняющегося нормальному, закону распределения вероятности, попадает в интервал вероятностью в два раза меньшей оно попадает в левую или правую половину этого интервала (
=2F(t)-1 = 2L(t)). Эта вероятность, как показано в данной формуле, определяется интегралом вероятности — функцией Лапласа 2L(t), так что для повышения точности расчетов можно пользоваться не графиком, а таблицами функции Лапласа. Полученные из таблиц значения L (ti) занесены в пятую графу табл. 10.
7. Теоретическая вероятность Pi, попадания в i-и интервал отдельного значения результата измерения, подчиняющегося нормальному закону распределения вероятности, очевидно равна
Принимая во внимании, что L(-∞) = -0,5, L(∞) = 0,5, поместим рассчитанные значения Pi, в шестую графу табл. 10.
8. В седьмую и восьмую графу внесены результаты остальных вспомогательных вычислений. Суммирование чисел в восьмой графе дает
9. Из графика на рис. 35 видно, что рассчитанное значение , соответствующего, например, вероятности 0,95. Таким образом, можно принять гипотезу о том, что результат измерения подчиняется нормальному закону.
Критерий согласия К.Пирсона широко применяется для проверки гипотез о том, что результат измерения подчиняется вполне определенному закону распределения вероятности. При соответствующая гипотеза принимается, при
— отвергается. Однако даже выполнение неравенства
не может служить доказательством того, что результат измерения подчиняется этому закону распределения вероятности.
При использовании критерия К. Пирсона, как и в случае применения других критериев, возможны два рода ошибок. Ошибка первого рода состоит в отклонении верной гипотезы, а ошибка второго рода — в принятии неправильной. Для иллюстрации на рис. 36 показаны кривые плотности
Рис. 36. Графики плотности распределения вероятности х2 в случаях, когда проверяемая гипотеза верна (!) и неверна (2)
распределения вероятности величины x2 в случаях, когда проверяемая гипотеза верна — кривая 1, и когда неверна — кривая 2. Если вероятности, с которой выносится решение, соответствует значение x2, то при всех гипотеза будет приниматься, а при всех
— отклоняться. Вероятности ошибок первого и второго рода при этом:
Обе они зависят от значения , которое в свою очередь определяется вероятностью P = F (
), с которой принимается решение. С повышением этой вероятности значение
увеличивается, вероятность ошибки первого рода уменьшается, а ошибки второго рода — возрастает, и наоборот. Таким образом, нецелесообразно принимать решение с очень высокой степенью вероятности. Обычно Р выбирается равной 0,9... 0,95.
При проверке нормальности закона распределения вероятности результата измерения применение критерия К. Пирсона дает хорошие результаты только, если п > 40…50. При 10...15< n <40...50 применяется так называемый составной критерий. Сначала рассчитывается
и проверяется выполнение условия
где и
зависят от вероятности Р*, с которой принимается решение, и находятся по табл. 11.
Таблица 11
n | Р*= 0,90 | Р*= 0,95 | Р*= 0,99 | |||
![]() | ![]() | ![]() | ![]() | ![]() | ![]() | |
0,7409 | 0,8899 | 0,7153 | 0,9073 | 0,6675 | 0,9359 | |
Если это условие соблюдается, то дополнительно проверяются "хвосты" теоретического и эмпирического законов распределения вероятности. При 10 < п < 20 считается допустимым отклонение одного из независимых значений результата измерения Qi от среднего арифметического больше чем на 2,5 sq, при 20 < п < 50 — двух, что соответствует доверительной вероятности Р** 0,98.
Несоблюдения хотя бы одного из двух условии достаточно для того, чтобы гипотеза о нормальности закона распределения вероятности результата измерения была отвергнута. В противном случае гипотеза принимается с вероятностью Р ≥Р* +Р**—1.
При п < 10... 15 гипотеза о том, что результат измерения подчиняется нормальному закону распределения вероятности, не проверяется. Решение принимается на основании анализа априорной информации.
2.6.3. ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ, ПОДЧИНЯЮЩИХСЯ НОРМАЛЬНОМУ ЗАКОНУ РАСПРЕДЕЛЕНИЯ ВЕРОЯТНОСТИ
Если итоги проверки большого массива экспериментальных данных по критерию x2 не противоречат гипотезе о том, что результат измерения подчиняется нормальному закону распределения вероятности, то можно считать, что среднее арифметическое значение результата измерения также подчиняется нормальному закону (см. рис. 32), а среднее значение среднего арифметического (см. разд. 2.6.1)
Как было показано в разделе 2.3.4, ни одно из случайных значений, подчиняющихся нормальному закону распределения вероятности, не может отличаться от среднего значения больше чем на половину доверительного интервала. На основании формулы (9) можно написать
Заменяя среднее квадратическое отклонение среднего арифметического его оценкой
вытекающей из выражения (11), и принимая во внимание, что, как показано в разделе 2.4, Q, получим:
где — половина доверительного интервала, а t при выбранной доверительной вероятности определяется по верхней кривой на рис. 22.
Порядок соответствующих действий показан на рис. 33. Сначала находится стандартное отклонение среднего арифметического, затем выбирается доверительная вероятность и определяется соответствующее ей значение t по верхней кривой на рис. 22. С выбранной доверительной вероятностью значение измеряемой величины Q не отличается от среднего арифметического значения результата измерения больше, чем на половину доверительного интервала .
При небольшом объеме экспериментальных данных среднее арифметическое значение результата измерения, подчиняющегося нормальному закону распределения вероятности, само подчиняется закону распределения вероятности Стьюдента (псевдоним B.C. Госсета) с тем же средним значением = Q. Графики плотности распределения вероятности, соответствующие этому закону, показаны на рис. 37. При увеличении п распределение вероятности Стьюдента быстро приближается к нормальному, становясь почти неотличимым отчего уже при п > 40... 50.
Доверительная вероятность того, что любое случайное значение среднего арифметического, подчиняющегося закону распределения вероятности Стьюдента, не отличается от среднего значения больше, чем на половину доверительного интервала,
где Sn (t) — интегральная функция распределения вероятности Стьюдента. По этой формуле на рис. 38 построены графики, показывающие, какое значение имеет объем выборки п. При п = 4, например, вероятность того, что никакое значение среднего арифметического, подчиняющегося закону распределения вероятности Стьюдента, не отличается от среднего значения больше чем , составляет 0,86; при п = 6она равна 0,9; при п = 10 получается равной 0,924; при п = 20 уже 0,94 и т.д. Верхняя кривая на рис. 38 соответствует условию п > 40... 50 и практически не отличается от верхней кривой на рис. 22.
По аналогии с предыдущим нетрудно показать, что
где по-прежнему — половина доверительного интервала, а t при выбранной доверительной вероятности определяется по графику на рис. 38.
Порядок действий при обработке небольшого объема экспериментальных данных отличается только тем, что после выбора доверительной вероятности t с учетом п определяется по графику на другом рисунке.
При совсем незначительном количестве экспериментальных данных (n < 10...15) и принятой гипотезе о том, что результат измерения подчиняется нормальному закону распределения вероятности, выявление ошибок по "правилу трех сигм" не производится. Остальной порядок действий (см. рис. 33) не отличается от предыдущего. Доверительный интервал при фиксированной доверительной вероятности, как это видно из графика на рис. 38, с уменьшением объема экспериментальных данных расширяется; точность измерения, следовательно, снижается, приближаясь к точности однократного измерения, при п → 1.
Рис. 38. Вероятность попадания среднего арифметического в окрестность среднего значения
2.6.4. ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ, НЕ ПОДЧИНЯЮЩИХСЯ НОРМАЛЬНОМУ ЗАКОНУ РАСПРЕДЕЛЕНИЯ ВЕРОЯТНОСТИ
Если гипотеза о том, что результат измерения подчиняется нормальному закону распределения вероятности, отвергается, то существует несколько возможностей.
1. При особо точных и ответственных измерениях может быть поставлена задача определения закона распределения вероятности результата измерения. Однозначного решения она не имеет, и вывод о том, что экспериментально найденное распределение вероятности подчиняется какому-то конкретному закону, может быть сделан лишь с той или иной вероятностью. Основные требования к проведению исследований, порядок математической обработки эмпирических данных и выбора математической модели распределения установлены специальным документом Госстандарта МИ199—79. Это довольно сложная и трудоемкая процедура, требующая значительных дополнительных затрат, и необходимость ее в каждом отдельном случае должна быть технико-экономнчески обоснована.
После определения с той или иной вероятностью вида закона распределения вероятности результата измерения, методом максимального правдоподобия (см. разд. 2.6.1) устанавливаются оценки его числовых характеристик, и наоснове их использования разрабатывается вся последующая процедура обработки экспериментальных данных. Такая обработка называется оптимальной и обеспечивает наивысшую точность при выбранных критериях.
2. Если закон распределения вероятности результата измерения незначительно отличается от нормального (чаще всего это отличие проявляется в повышенной вероятности больших отклонения от среднего значения), то применяются так называемые робастные (устойчивые к отклонениям от нормального закона распределения вероятности) методы обработки экспериментальных данных. Все они основаны на ослаблении влияния больших отклонении от среднего значения на его оценку.
В простейшем случае большие отклонения просто отбрасываются, что приводит к усеченному нормальному закону распределения вероятности результата измерения (см. табл. 7). В этом случае оценкой среднего значения становится медиана закона распределения вероятности результата измерения
В некоторых случаях большие отклонения не отбрасываются, а заменяются на ближайшие из оставшихся значений результата измерения, либо включаются в обработку с малыми весовыми коэффициентами. Порядок дальнейшей обработки экспериментальных данных не меняется. Предельным случаем усечения является оставление одного (при нечетном п ) или двух (при четном п ) значений результата измерения.
Среднее арифметическое не относится к устойчивым (робастным) оценкам. Объясняется это тем, что даже очень редкие большие отклонения (выбросы), не подчиняющиеся нормальному закону распределения вероятности, играют по критерию (12) существенную роль. Операция возведения в квадрат делает их доминирующими среди слагаемых, а эффективность оценки, полученной методом наименьших квадратов, резко падает.
Ослабление влияния больших отклонений на оценку среднего значения (т.е. повышение ее устойчивости) достигается при синтезе оценки по критерию эффективности, в котором квадратичная зависимость заменена на более слабую. Показателем эффективности (мерой рассеяния), в частности, может быть сумма отклонений от среднего значения или некоторая ее функция. Оценки, синтезированные по критерию
называются М-оценками. Функция при малых значениях аргумента выбирается близкой к квадратичной, а при больших — возрастающей медленнее, чем квадратичная. В зависимости от вида этой функции различают робастные оценки Хубера, Хампела, Андрюса, Тьюки и другие. Все они слабо зависят от выбросов и отклонений от нормального закона распределения вероятности, а в случае, когда результат измерения подчиняется нормальному закону, близки к оценке среднего значения, полученной методом наименьших квадратов.
Разновидностью М-оценок являются lР -оценки, получаемые при
В отличие от перечисленных М-оценок они более эффективны вблизи других законов распределения вероятности, отличных от нормального. В частности, l1 -оценка или оценка наименьших модулей, получаемая из условия
и совпадающая с медианой, оптимальна при экспоненциальном законе распределения вероятности результата измерения.
Используются и другие робастные оценки.
3. С невысокой точностью значение измеряемой величины можно установить даже не интересуясь законом распределения вероятности результата измерения. Среднее арифметическое в этом случае может оказаться неэффективной оценкой, но его все равно целесообразно использовать, так как при всех обстоятельствах дисперсия среднего арифметического согласно соотношению (11) в п раз меньше дисперсии результата измерения, оценка которой на основании пятого свойства дисперсии (см. разд. 2.2) может быть представлена в виде
Стандартное отклонение среднего арифметического при любом законе распределения вероятности
Задавшись доверительной вероятностью Р, по нижней кривой на рис. 22 можно определить, на сколько среднее арифметическое
может отличаться от среднего значения результата измерения
при любом законе распределения вероятности. С неменьшей вероятностью
где, как обычно, — половина доверительного интервала.
Соответствующий порядок действий показан на рис. 33.
Дата публикования: 2015-01-23; Прочитано: 785 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!