Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Некоторые распределения, использующиеся в мат.статистике. Нормальное распределение, гамма распределение, хи – квадрат распределение



Основные понятия математической статистики. Статистический эксперимент. Виды задач математической статистики.

Математическая статистика занимается составлением выводов об имеющихся данных (о модели эксперимента).

Базовое вероятностное пространство (Ω, ₣,Ρ)

Частный случай – распределение случайного вектора:

Ω=Х=Rn; ₣=Дn борелевская σ -алгебра; Ρ – распределение вероятностей

Получили более мелкое пространство, которое удобно использовать при работе с моделями математической статистики (Х, Дn).

Статистический эксперимент – тройка объектов (Х, Дn, Ρ), где Ρ ={Рθ,θєΘ} - семейство вероятностей.

Стандартные предположения о семействе Ρ:

(1) Рθθ1 * Рθ2 …*Рθn, т.е. результат наблюдений (Х1 … Хn) є Rn независимые случайные величины при V θєΘ

(2) Рθ1θ2=…=Рθn, т.е. результат наблюдений (Х1 … Хn) є Rn независимые одинаково распределенные случайные величины (НОРСВ).

Если (1) и (2) выполнены, то (Х1 … Хn) – выборка – набор независимых одинаково распределенных наблюдений.

В задачу математической статистики входит только анализ данных и их интерпретация.

Выбор модели определяется характером полученных данных и не входит в задачу математической статистики. Семейство вероятностей Ρ определяется целью статистических исследований (априорной информацией), поэтому Ρ может быть параметризованно по-разному.

Пусть имеется совокупность результатов эксперимента (генеральная совокупность), тогда выборка – набор элементов однородной генеральной совокупности.

Задача математической статистики – сделать выводы о характере распределения генеральной совокупности по выборке. Роль генеральной совокупности в нашей модели играет теоретическое распределение.

Рθ - теоретическое значение распределения, соответствует распределению генеральной совокупности.

Типы задач математической статистики:

1) Точное оценивание – по результатам наблюдений выбрать значение Рθє Ρ, которое оптимальным образом согласуется с данными.

2) Интервальное оценивание - по результатам наблюдений выбрать область

Θ0 (Х1 … Хn) С Θ т.ч. при V θєΘ Рθ(Θ0 (Х1 … Хn) э θ)≥1-α, где α - определенное маленькое число. Т.е. выбор такого множества, которое накрывает теоретическое значение параметра с вероятностью не меньше (1-α).

3) Проверка статистических гипотез – по результатам наблюдений выбрать из

Н1… Нn наиболее подходящую, где Нi – взаимоисключающие гипотезы (предположения о значении параметров Нi: θєΘ i; Θ i Θ i =0; UΘ i =Θ).

2+4)Выборочный метод. Эмпирическая функция распределения. Теорема Гливенко – Кантелли (план док-ва). Преобразование Смирнова. Теорема Колмогорова. Оценивание теоретической функции распределения эмпирической. Гистограмма и полигон частот.

Пусть (Х1 … Хn) выборка из распределения Рθ . Истинное значение Рθ - теоретическое распределение.

Эмпирическая функция распределения – функция следующего вида:

Fn(x) = 1/n* , где

Т.е. ее значение в точке х равно отношению числа наблюдений меньше х к общему числу наблюдений.

Теорема (Гливенко – Кантелли)

Пусть(Х1 … Хn) выборка из распределения с ф.р. F,тогда sup|Fn(x)-F(x)| почти наверное->0

План док-ва:

доказывается сходимость на ограниченном интервале (т.к. F неубывает и ограничена). Показывается, что изменение между двумя соседними точками мало. Доказывается, что сходимость на концах следует из:

-> sup|Fn(x)-F(x)|->0

Преобразование Смирнова

Пусть Х случайная величина с ф.р. F (непрерывна),тогда F(x)=Y-новая с.в. имеющая равномерное распределение U(0,1), т.е.:

Если F строго возрастает, то :

Теорема Колмогорова

Пусть (Х1 … Хn) выборка из распределения F(непрер.),тогда , где К – распр-е Колмогорова, т.е.:

, где

С ростом n, эмпирическая ф.р. приближается к теоретической. У э.ф.р. имеется -окрестность, по т. Гливенко – Кантелли вероятность того, что истинная ф.р. лежит в этой эмпирической -окрестности ->1 при .

По т. Колмогорова, вероятность того, что истинная ф.р. лежит в - окрестности эмпирической стремится к пределу K(), где К(х) – ф.р. Колмогорова.

Пусть >0 – маленькое число, F – истинная ф.р., тогда если F0=F, где F0 предполагаемая ф.р., то с вероятностью

, т.е.

- доверительный интервал для теоретической ф.р.

Гистограмма и полигон частот:

Один из способов наглядного представления статистических данных – Гистограмма частот. Область значений с.в. разбивается на равные интервалы, подсчитывается число значений с.в. попавших в интервал и на каждом интервале строится прямоугольник, с основанием на этот интервал и высотой V/(nh), где V – число выборочных точек попавших в этот интервал, n – объем выборки, h – длина интервала. Площадь каждого такого прямоугольника по т Бернулли будет сходится при n-> к вероятности попадания с.в. в интервал.

Для оценки гладких плотностей используют методику, основанную на полигоне частот – ломаной кривой, строящейся следующим образом: если построена гистограмма частот, то ординаты ее средних точек на каждом из интервалов последовательно соединяются отрезками прямых. Гистограмма и полигон – статистические аналоги теоретической плотности.

Некоторые распределения, использующиеся в мат.статистике. Нормальное распределение, гамма распределение, хи – квадрат распределение.

1) Нормальное распределение

~N( X – абсолютно непрер. и

Многомерное нормальное

Стандартное нормальное с плотностью соответствует n независимых нормальных величин с N(0,1).

Нормальное общего вида: Пусть - стандартного вида, тогда Y= имеет нормальное распределение общего вида.

где - вектор мат. ожиданий, R – матрица ковариации.

~ N(

если |R| , то - абсолютно непрерывный, причем:

2) Гамма распределение Г() – абсолютно непрер-е с плотностью

, где -гамма функция

Свойства:

Частные случаи гамма распределения:

1) ~Exp(α)

2) ~N(0,1), тогда ~Г(1/2,1/2)

Свойства Г-распределения:

1) характ-ая функция

2)Если X~ Г() и Y~ Г() X и Y независимы, то X+Y ~ Г()

3) хи-квадрат распределение

- хи-квадрат с n степенями свободы если

5) Постановка задачи точечного оценивания параметра. Функция потерь. Риск.

Пусть ()- статистический эксперимент, результатом которого является набор наблюдений X1…Xn. Задача точечного оценивания заключается в том, чтобы используя результаты наблюдений, выбрать из множества параметров θ значение, наиболее подходящее в том или ином смысле.

Пусть в качестве оценки параметра θ (или функции от пар-ра g(θ)) выбрана оценка .Для определения близости оценки к истинному значению пар-ра θ вводится функция потерь W(δ, θ) удовлетворяющая следующим условиям:

· неотрицательность W(δ, θ)

· если δ=0, то потери нулевые: W(θ, θ)=0

Наиболее употребительными функциями потерь являются W (δ, θ)=(δ - θ)2 - функция потерь Гаусса и W(δ, θ)= |δ - θ| - функция потерь Лапласа.

Функция потерь – величина случайная, зависящая от двух параметров.

Точность оценки измеряется функцией риска R(δ, θ)=Eθ W(δ , θ), где Eθ берется при условии, что распределение соответствует значению параметра θ, т.е. средними потерями при оценивании с помощью δ.

Риск в случае функции потерь Гаусса R(δ, θ)=Eθ т.н. средне квадратичное отклонение

Хотелось бы найти оценку, минимизирующую риск при каждом значении θ. Однако в такой постановке задача неразрешима. Действительно, если выбрать в качестве оценки параметра θ некоторое постоянное значение δ = θ0, θ0 , то при θ= θ0 данная оценка абсолютно точна, т.е. имеет нулевой риск. Ясно, что подобная оценка с точки зрения матстатистики абсолютно бесполезна, однако приведённый пример показывает, что, за исключением тривиальных случаев (когда параметр определяется абсолютно точно), оценки, минимизирующей риск при каждом не существует.Для преодоления этой трудности можно ограничить класс рассматриваемых оценок:

· рассматривать только состоятельные оценки





Дата публикования: 2015-01-24; Прочитано: 342 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.014 с)...