Главная Случайная страница Контакты | Мы поможем в написании вашей работы! | ||
|
Многие «наилучшие» оценки в статистике (например, наиболее распространенная на практике оценка среднего значения случайной величины ) обладают тем дефектом, что они являются наилучшими лишь в случае, если выборка наблюдений получена из нормально распределённой совокупности данных и быстро теряют свои оптимальные свойства по мере отклонения распределения от нормального, т.е. являются неустойчивыми к отклонениям от нормального распределения. В качестве характеристики устойчивости оценки можно предложить понятие робастности.
Определение робастности оценки. Пусть случайная величина Х имеет плотность распределения вероятностей , где вид функции f известен, а q - неизвестный параметр (может быть величиной векторной). Оценка параметра производится по n наблюдениям х1,х2,…,хn. В классической статистике качество оценки определяется её дисперсией Df , вычисленной в предположении, что выборка получена из генеральной совокупности с плотностью распределения вероятностей .
Определим понятие e-окрестности распределения f:
где 0<e<1, а h(x) – произвольная плотность распределения вероятностей.
Назовём оценку робастной, если для неё имеет место . То есть робастная оценка – это такая оценка, которая в наихудшем случае (когда достигается ) имеет наименьшую дисперсию. Нахождение робастной оценки отвечает решению, как говорят в математике, минимаксной задачи. Минимаксное значение есть гарантированный верхний порог дисперсии оценки для любого распределения f из e-окрестности.
Минимаксная стратегия широко распространена в таком разделе теории операций как теория игр. В определённом смысле робастная процедура – это «игра» исследователя с природой.
Робастная оценка среднего значения. Если параметр q играет роль центра распределения (среднего значения), то f(x,q)=f(x-q). Робастная оценка параметра q в этом случае находится по n наблюдениям х1,х2,…,хn решением следующей задачи:
Если f(x,q) – плотность вероятностей нормального распределения, то
, (8.29)
Робастная оценка в этом случае представляет собой некий гибрид оценки средней арифметической () и выборочной медианы (med{xi}). Она совмещает в себе эффективность первой оценки и устойчивость второй. Их соотношение определяется величиной степени засорения e (0<e<1) через величину к=к(e). Если e®0 (к®¥), то оценка близка к среднему арифметическому. Если e®1 (к®0), то оценка близка к выборочной медиане.
Робастная оценка имеет вид:
где - вариационный ряд выборочных значений; m=[an], a=a(k(e))=a(e). Значения a=a(e) можно найти в таблице 2 [ 6 ].
Таблица 2.
Значения уровня урезания a=a(e)
e | 0.001 | 0.005 | 0.01 | 0.05 | 0.10 | 0. 20 | 0.30 | 0.40 | 0.50 | 0.80 | ||
a | 0.004 | 0.015 | 0.026 | 0.081 | 0.127 | 0.194 | 0.247 | 0.291 | 0.332 | 0.436 | 0.5 |
Робастная регрессия. Уравнение регрессии, получаемое методом наименьших квадратов, имеет существенный дефект, заключающийся в том, что при наличии грубых ошибок в данных оценки его коэффициентов сильно искажаются, т.е. являются неустойчивыми к отклонениям от обычного предположения в регрессионном анализе, что ошибки x в модели регрессии y=a+b1x1+…+bpxp+x имеют нормальное распределение.
Коэффициенты робастной регрессии вычисляются решением задачи:
где r(t) имеет вид (8.29).
Дата публикования: 2015-01-10; Прочитано: 802 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!