Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Статистическое оценивание числовых характеристик случайной величины и закона распределения



В связи с тем, что состав выборки может быть различным, выводы, сделанные относительно генеральной совокупности по выборочным значениям могут быть различными, а иногда и ложными. Решение этой проблемы приводит к рассмотрению критериев согласия, анализ которых позволяет сделать вывод:

· имеющиеся опытные данные и избранный вид теоретического распределения не противоречат друг другу;

· избранное распределение в качестве предполагаемого теоретического для исследуемого признака отклоняется.

Статистической оценкой неизвестного параметра генеральной совокупности называется любая функция вариант выборки, которая дает представление о значении неизвестного параметра. Основной задачей статистического оценивания является получение значений неизвестных параметров на основе выборки из генеральной совокупности. Так, например, если случайная величина распределена по нормальному закону, то по выборке необходимо оценить математическое ожидание и среднеквадратическое отклонение.

Выборочная характеристика, используемая в качестве приближенного значения неизвестной генеральной характеристики, называется ее точечной статистической оценкой. Она определяется одним числом. Ранее были рассмотрены выборочные среднее и дисперсия , которые интерпретировались как приближенные значения неизвестных математического ожидания и дисперсии изучаемой случайной величины , т.е. являлись точечными оценками этих неизвестных характеристик.

Обозначим через некоторый неизвестный параметр генеральной совокупности, а через – точечную оценку этого параметра. Оценка есть функция от независимых элементов генеральной совокупности, где – объем выборки. Поэтому оценка , как функция случайных величин, также является случайной и свойства можно исследовать с использованием понятий теории вероятностей.

В общем случае точечная оценка не связана с оцениваемым параметром . Поэтому естественно потребовать, чтобы была близка к . Это требование формируется в терминах несмещенности, состоятельности и эффективности.

Статистическая оценка неизвестного параметра называется несмещенной, если математическое ожидание равно самому параметру:

.

Статистическая оценка неизвестного параметра называется эффективной, если она имеет минимальную дисперсию среди остальных оценок параметра .

Статистическая оценка называется состоятельно й, если для нее соблюдается условие:

для любого .

Это означает, что чем больше число наблюдений , тем больше уверенность (вероятность стремится к 1) в незначительном отклонении от неизвестного параметра . Очевидно, что «хорошая оценка» должна быть состоятельной, иначе эта оценка не имеет практического смысла, так как увеличение объема исходной информации не будет приближать оценку к «истинному» значению .

Теорема 4.1. В ыборочное среднее есть состоятельная и несмещенная оценка генеральной средней .

Теорема 4.2. Выборочное среднее является эффективной несмещенной оценкой для , если случайная величина имеет нормальное распределение , где – математическое ожидание, – дисперсия случайной величины .

Теорема 4.3. Выборочная дисперсия является состоятельной, но смещенной оценкой генеральной дисперсии .

Таким образом, если в качестве оценки генеральной дисперсии принимать выборочную дисперсию, то эта оценка будет приводить к систематическим ошибкам. В результате значение генеральной дисперсии будет занижаться. Легко «исправить» выборочную дисперсию так, чтобы ее математическое ожидание было равно генеральной дисперсии. Для этого достаточно умножить на дробь
п/(п —1). Сделав это, получим «исправленную» дисперсию, которую обычно обозначают через :

.

Теорема 4.4. Исправленная дисперсия является состоятельной и несмещенной оценкой для дисперсии генеральной .

Замечание: На практике пользуются исправленной дисперсией, если примерно п < 30.

Теорема 4.5. Относительная частота появления события в испытаниях является состоятельной оценкой вероятности .

Одним из первых приемов оценивания параметров является метод моментов, разработанный Пирсоном (подробно см. работу №4). На практике этот метод сравнительно прост в вычислениях, но иногда приводит к малоэффективным оценкам.

Исследуя свойства оценок, получаемых с помощью метода моментов, английский математик Р. Фишер предложил более надежный метод оценивания параметров распределения по данным выборки случайной величины X — метод максимального правдоподобия. Метод максимального правдоподобия приводит к более сложным вычислениям, но оценки, получаемые с его помощью, как правило, оказываются более надежными. Этот метод наиболее полно использует данные выборки об оцениваемом параметре, поэтому он особенно эффективен в случае малых выборок.

Пусть X — случайная величина, которая в результате n испытаний приняла значения х1,x2,…, хn c распределением, зависящим от параметра θ. Требуется найти его точечную оценку.

Функцией правдоподобия случайной величины X называют функцию аргумента θ:

а) ,

если X — непрерывная случайная величина с плотностью распределения ,

б)

если X — дискретная случайная величина, - вероятность того, что в результате испытания величина X примет значение xi.

В качестве точечной оценки параметра θ принимают такое его значение θ *= θ *(х1,x2,…, хn), при котором функция правдоподобия достигает максимума. Оценку θ * называют оценкой наибольшего правдоподобия. Функции L и LnL достигают максимума при одном и том же значении θ, поэтому вместо максимума функции L целесообразно находить максимум функции LnL, которую называют логарифмической функцией правдоподобия. Точку максимума функции LnL, аргумента θ можно найти, например, следующим образом:

1) найти производную: ;

2) приравнять производную нулю и найти критическую точку — корень полученного уравнения (уравнение правдоподобия);

3) найти вторую производную: ; при этом если вторая производная при θ = θ * отрицательна, то θ * является точкой максимума.

Найденную точку максимума θ * принимают в качестве оценки наибольшего правдоподобия параметра θ.

¨Пример 4.1. Найти оценку максимального правдоподобия для параметра распределения Пуассона.

Распределение Пуассона имеет вид

,

где принимает любые целые неотрицательные значения.

Пусть – выборка из генеральной совокупности . Тогда

.

Преобразовав произведение, получим

.

Поэтому логарифмическая функция максимального правдоподобия имеет вид

.

Находим критическую точку, решая уравнение

.

Получим

Отсюда

.

Так как

при , то найденная критическая точка есть точка максимума. Поэтому оценкой максимального правдоподобия для параметра является случайная величина

т.е. .

Для выборок малого объема точечные оценки могут значительно отличаться от оцениваемого параметра, и вопрос о точности получаемых оценок становится очень важным. В математической статистике он решается введением интервальных оценок. Общая теория построения интервальных оценок заключается в определении случайной величины, зависящей от оцениваемого параметра. Зная распределение этой случайной величины, находят соответствующие доверительные границы и сам доверительный интервал с требуемой точностью.

Интервальной оценкой для параметра θ называется такой интервал со случайными границами, что .

Вероятность называется надежностью интервальной оценки или доверительной вероятностью, случайные величины – доверительными границами, а сам интервал называют доверительным интервалом. Центром этого интервала является значение точечной оценки .

Надежность принято выбирать равной 0.95, 0.99, в этом случае событие, состоящее в том, что интервал покроет параметр , будет практически достоверным.

Например, для оценки математического ожидания генеральной совокупности нормально распределенного признака по выборочной средней и известном среднем квадратическом отклонении генеральной совокупности применяется формула:

.


Таблица 4.1.

Таблица доверительных интервалов для параметров нормального распределения

Параметр Доверительный интервал Статистическая оценка
Математическое ожидание а) при известном σ   , где - точность оценки n объем выборки t - значение аргумента функции Лапласа Ф(t) а - математическое ожидание σ -среднеквадратическое отклонение  
Математическое ожидание б) при неизвестном σ   - выборочная средняя S - исправленное средне-квадратическое отклонение n -объем выборки распределение Стьюдента, степень свободы k = n - 1  
Дисперсия (среднеквадратическое отклонение)   границы (), соответствующие надежности γ находят по таблице: (распределение Пирсона) из условия , где - случайна величина имеющая распределение Пирсона. имеет распределение -хи-квадрат с n-1 степенями свободы.

При этом t определяется по таблицам функции Лапласа из соотношения

,

где - среднеквадратическое отклонение; n - объем выборки.

Замечание 1. Оценку называют классической. Из формулы , определяющей точность классической оценки, можно сделать следующие выводы:

1) при возрастании объема выборки п число убывает и, следовательно, точность оценки увеличивается;

2) увеличение надежности оценки γ =2Ф(t) приводит к увеличению t (Ф(t) — возрастающая функция), следовательно, и к возрастанию ; другими словами, увеличение надежности классической оценки влечет за собой уменьшение ее точности.

Замечание 2. Если требуется оценить математическое ожида­ние с наперед заданной точностью и надежностью γ, то минимальный объем выборки, который обеспечит эту точность, находят по формуле

( следствие равенства ).

¨Пример 4.2. Найти доверительный интервал для оценки математического ожидания нормального распределения с надежностью 0,95, зная выборочную среднюю , объем выборки n =100 и среднеквадратическое отклонение .

Решение:

Воспользуемся данными из таблицы приложения 2. Для этого из выражения где Ф - функция Лапласа, n = 100, σ = 4, δ - точность оценки, γ =0,95, найдем t. Получаем Þ Þ t =1,96, тогда . Þ доверительный интервал будет равен .





Дата публикования: 2015-01-09; Прочитано: 1961 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.013 с)...