Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Эмпирическая функция распределения, полигон, гистограмма



Эмпирической функцией распределения, построенной по выборке объема , называется случайная функция , при каждом равная

Другой характеристикой распределения является таблица (для дискретных распределений) или плотность (для абсолютно непрерывных). Эмпирическим, или выборочным аналогом таблицы или плотности является так называемая гистограмма.

Гистограмма строится по группированным данным. Предполагаемую область значений случайной величины (или область выборочных данных) делят независимо от выборки на некоторое количество интервалов (не обязательно одинаковых). Пусть , , — интервалы на прямой, называемые интервалами группировки. Обозначим для через число элементов выборки, попавших в интервал :

(1)

На каждом из интервалов строят прямоугольник, площадь которого пропорциональна . Общая площадь всех прямоугольников должна равняться единице. Пусть — длина интервала . Высота прямоугольника над равна

Полученная фигура называется гистограммой.

Полигоном называют ломаную линию, отрезки которой соединяют точки с координатами по оси абсцисс, равными серединам интервалов, а по оси ординат – соответствующим частостям. Эмпирическая функция распределения отображается ступенчатой ломаной линией: над каждым интервалом проводится отрезок горизонтальной линии на высоте, пропорциональной накопленной частости в текущем интервале. Накопленная частость равна сумме всех частостей, начиная с первого и до данного интервала включительно.

Вопрос 34. Выборочные числовые характеристики. Выборочное среднее.

Основной характеристикой статистического ряда является выборочное среднее. Для дискретного статистического ряда выборочное среднее равно

Для интервального статистического ряда в качестве берутся середины интервалов группировки.

Вопрос 35. Выборочная дисперсия. Дисперсия объединённой выборки.

Выборочной дисперсией называется среднее арифметическое квадратов отклонений вариант от их выборочной средней: .

Для практических вычислений более удобной является следующая формула: ^2 – ()^2, где — среднее

арифметическое квадратов отклонений: = .

Если ряд состоит из нескольких (k) групп наблюдений, то общая дисперсия равна сумме средней арифметической

Групповых дисперсий и межгрупповой дисперсии (дисперсии средних) , т.е. + .

Вопрос 36. Выборочные числовые характеристики. Ковариация и коэффициент корреляции.

Мерой изменчивости (вариации) признака является выборочное среднее квадратичное отклонение, которое определяется как корень из выборочной дисперсии: .

Для положительных признаков определяется коэффициент вариации, являющийся процентным отношением выборочного среднего квадратичного отклонения к выборочной средней: v= 100%.

Если в выборке в каждом испытании (измерении) несколько величин измеряются совместно (в системе), то для каждой

пары имеет смысл выборочная ковариация ) = , аналогичная ковариации,

введенной в теории вероятностей.

Мерой линейной связи двух признаков X и Y является выборочный коэффициент корреляции, вычисляемый по формуле = , где — соответственно выборочное квадратичное отклонение случайных величин X и

Y; .

Вопрос 37. Виды статистических оценок. Общие требования к точечным оценкам: несмещённость, состоятельность и эффективность.

Пусть F(x, ) — функция распределения случайной величины X, содержащая один неизвестный параметр , а x1, x2,…, xn —выборка наблюдений этой случайной величины. Точечной оценкой неизвестного параметра называется приближенное значение этого параметра, полученное по выборке.

Есть два вида статистических оценок параметра. Первый вид связан с оценкой величины параметра, которая характеризуется одним числом (или вектором), которому соответствует некоторая точка на числовой оси (или в пространстве). Другой вид связан с поиском интервала (области), в котором с заданной вероятностью находится истинное значение параметра.

Одной из основных характеристик качества оценок является несмещенность. Оценка называется несмещенной оценкой параметра , если ее математическое ожидание равно оцениваемому параметру, т.е. M( = .

Оценка параметра называется состоятельной, если она сходится по вероятности к при n . Теорема. Если M( и D( при n то — состоятельная оценка параметра .

Несмещенная оценка называется эффективной в классе оценок , если D(

Выборочное среднее является несмещенной оценкой математического ожидания: M( = M(X).

Выборочная дисперсия является смещенной оценкой дисперсии: M(

Несмещенной оценкой дисперсии является уточненная выборочная дисперсия, которая определяется из формул: .

Вопрос 41. Точечные оценки параметров распределения. Метод моментов.

Имеется случайная выборка x1, x2,…, xN из генеральной совокупности X, распределение которой известно с точностью до вектора параметров . Требуется найти оценку параметра .

Пусть r — размерность вектора ( = ()). Предполагается, что у случайной величины X существуют первые r

моментов: , где k = 1, 2,…,r. Величины являются функциями неизвестного вектора параметров , т.е.

= . Рассматриваются выборочные моменты (или же выборочные центральные моменты ). В методе моментов в качестве точечной оценки вектора параметров берут статистику, значение которой получают как

решение системы уравнений = , k = 1, 2,…,r.

Вопрос 42. Точечные оценки параметров распределения. Метод максимального правдоподобия.

Имеется случайная выборка x1, x2, , xN из генеральной совокупности X, распределение которой известно с точностью до параметра (вектора параметров ). Требуется найти оценку параметра .

Метод максимального правдоподобия основан на использовании условий экстремума функции правдоподобия.

Для дискретной случайной величины функция правдоподобия определяется по формуле

L(x; = p(; , где p(; — вероятность события , зависящая от .

Для непрерывной случайной величины функция правдоподобия определяется по формуле L(x; = f(; , где f(; — заданная плотность распределения случайной величины X в точке .

Оценкой максимального правдоподобия параметра называется такая статистики , значения которой для любой выборки удовлетворяют условию L(x; = max L(x;

Оценку максимального правдоподобия находят из уравнения правдоподобия

Вопрос 43. Интервальные оценки. Доверительный интервал и доверительная вероятность. Уровень значимости.

Доверительным интервалом (интервальной оценкой) для параметра с доверительной вероятностью называется такой интервал (, для которого выполняется условие: P(.

Величина называется уровнем значимости.

Вопрос 44. Основные распределения вероятностей математической статистики.

Нормальное распределение. =

Нормальному распределению подчиняется выборочное среднее в случаях, когда в опыте мы наблюдаем случайные

величины Xi, каждая из которых подчиняется нормальному распределению . В этом случае .

Распределение (хи квадрат). Сумма квадратов независимых случайных величин, каждая из которых имеет нормальное стандартное распределение подчиняется распределению Пирсона с k степенями свободы - это число независимых слагаемых в сумме.

Распределение Стьюдента. Отношение t=Z/ стандартной нормально распределенной случайной величины Z к случайной величине подчиняется распределению Стьюдента с k степенями свободы - это число независимых слагаемых в сумме.

Распределение Фишера-Снедекора. X=F(. Частный случай — квадрат случайной величины

величины, которая имеет распределение Стъюдента с степенями свободы, совпадает с распределением Фишера-Снедекора с (1, ) степенями свободы. Распределение Фишера-Снедекора используется, например, при

 сравнении двух дисперсий

 проверке гипотезы о равенстве нулю всех или части коэффициентов линейной регрессии.

Вопрос 45. Интервальная оценка математического ожидания нормально распределённой генеральной совокупности.

Доверительный интервал для математического ожидания нормально распределенной случайной величины при известной дисперсии. Исходные данные: выборка x1, x2,…, xN объема N из нормально распределенной генеральной совокупности с известной дисперсией доверительная вероятность .

Искомый доверительный интервал (; ), где — квантиль нормального распределения уровня 1- , .

Доверительный интервал для математического ожидания нормально распределенной случайной величины при неизвестной дисперсии. Исходные данные: выборка x1, x2, , xN объема N из нормально распределенной генеральной совокупности; доверительная вероятность .

Искомый доверительный интервал (; ), где S = , — уточненная выборочная дисперсия; — квантиль распределения Стьюдента с (N-1)-й степенью свободы уровня 1- /2.

Вопрос 46. Интервальная оценка дисперсии нормально распределённой генеральной совокупности.

Доверительный интервал для дисперсии нормально распределенной случайной величины при известном математическом ожидании. Исходные данные: выборка x1, x2, , xN объема N из нормально распределенной генеральной совокупности с известным математическим ожиданием ; доверительная вероятность .

Искомый доверительный интервал (; ), где ;

— квантиль распределения хи-квадрат с N степенями свободы уровня p.

Доверительный интервал для дисперсии нормально распределенной случайной величины при неизвестном математическом ожидании. Исходные данные: выборка x1, x2, , xN объема N из нормально распределенной генеральной совокупности; доверительная вероятность .

Искомый доверительный интервал (; ), где — квантиль распределения хи-квадрат с k степенями свободы уровня p.

Доверительный интервал для среднего квадратичного отклонения нормально распределенной случайной величины.

Доверительный интервал для среднего квадратичного отклонения находится в виде , где — доверительный интервал для дисперсии.

Вопрос 47. Статистическая гипотеза и статистический критерий приемлемости гипотезы. Ошибки первого и второго рода.

Любое предположение о свойствах случайной величины, основанное на обработке выборки (серии ее наблюдений), называется статистической гипотезой.

Способ (алгоритм), позволяющий по результатам такого сопоставления прийти к выводу о приемлемости гипотезы, и называется критерием. Звучать это может примерно так: — ”Если T Tкр, то гипотеза Н0 принимается”.

В результате принятия определенного решения возможны четыре варианта — два верных и два ошибочных.

— уровень значимости (вероятность отвергнуть истину — ошибки 1-го рода).

— вероятность согласиться с ложным — ошибки 2-го рода.

Вопрос 48. Стандартные параметрические гипотезы о числовом значении математического ожидания, о равенстве математических ожиданий, о числовом значении дисперсии нормального распределения, о равенстве дисперсий двух

нормальных распределений, о числовом значении вероятности события, о равенстве вероятностей двух событий.

Статистические гипотезы, в которых делаются предположения об истинном значении неизвестного параметра , называют

параметрическими гипотезами.





Дата публикования: 2015-02-03; Прочитано: 1079 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2025 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.006 с)...