![]() |
Главная Случайная страница Контакты | Мы поможем в написании вашей работы! | |
|
«СТАТИСТИЧЕСКИЙ АНАЛИЗ ОДНОМЕРНЫХ ДАННЫХ»
Дана выборка значений случайной величины (выборка объема
из генеральной совокупности).
1. Найти выборочную оценку математического ожидания случайной величины , указать свойства этой оценки.
2. Найти выборочные оценки дисперсии и среднеквадратического отклонения случайной величины , указать свойства этих оценок.
3. Составить группированный вариационный ряд, разбив выборку на равных интервалов.
4. Построить гистограмму и полигон относительных частот. На их основе выдвинуть нулевую гипотезу о виде распределения (нормальное распределение).
5. На одном чертеже с гистограммой построить график теоретической плотности вероятностей. Сделать вывод об их визуальном совпадении.
6. Составить эмпирическую функцию распределения и построить ее график.
7. На одном чертеже с эмпирической функцией распределения построить график теоретической функции распределения. Сделать вывод об их визуальном совпадении.
8. С помощью критерия согласия Пирсона проверить гипотезу
о виде распределения генеральной совокупности для уровня значимости
. Сделать статистический вывод.
9. Построить доверительные интервалы для неизвестных математического ожидания и дисперсии нормально распределенной генеральной совокупности с параметрами и
для уровней значимости
,
и
. Сделать вывод о ширине доверительного интервала, в зависимости от уровня значимости
.
У к а з а н и е: все вычисления проводить с точностью до 0,0001
Предположим, что изучается некоторая случайная величина , закон распределения которой неизвестен. Требуется приближенно определить этот закон из опыта и проверить гипотезу о том, что случайная величина
подчинена этому закону.
Генеральной совокупностью называют всю совокупность реализации случайной величины , все возможные наблюдения некоторого показателя, все возможные исходы некоторого испытания.
Выборкой называют часть генеральной совокупности , то есть конечное подмножество значений случайной величины из множества элементов генеральной совокупности.
Объемом выборки называют количество содержащихся в ней значений случайной величины
.
Задача математической статистики состоит в исследовании свойств выборки и обобщении этих свойств на всю генеральную совокупность.
Выборка является исходной информацией для статистического анализа и принятия решений о неизвестных вероятностных характеристиках случайной величины . Для этих целей на выборку следует смотреть как на набор реализаций
независимых одинаково распределенных случайных величин
.
Для того чтобы по выборке можно было достаточно уверенно судить о генеральной совокупности, выборка должна быть представительной (репрезентативной), то есть достаточно полно представлять признаки и параметры генеральной совокупности. Репрезентативность выборки улучшается при увеличении её объема.
Пусть – выборка объема
из генеральной совокупности значений случайной величины
с математическим ожиданием
, дисперсией
и среднеквадратическим отклонением
.
Выборочным средним выборки называется среднее арифметическое
.
Согласно закону больших чисел, при увеличении объема выборки среднее арифметическое выборки сходится по вероятности к математическому ожиданию генеральной совокупности, то есть
.
Таким образом, среднее арифметическое может служить приближением (оценкой) математического ожидания генеральной совокупности.
Выборочной дисперсией называется
.
Модифицированной выборочной дисперсией называется
.
Все эти выборочные величины зависят от выборки и сами являются случайными величинами. Их значения лишь приближенно равны соответствующим числовым характеристикам генеральной совокупности.
Статистикой называется любая функция, зависящая от выборки и сама являющаяся случайной величиной. Таким образом, выборочное среднее , выборочная дисперсия
и модифицированная выборочная дисперсия
– это статистики.
Точечной оценкой неизвестного параметра
распределения случайной величины
называется такая функция от выборки (статистика)
, что ее значение от любой выборки приближенно равно истинному значению параметра, то есть
.
Оценки параметров принято обозначать символом с тильдой наверху: .
Существует несколько методов нахождения точечных оценок: метод наименьших квадратов, метод моментов, метод максимального правдоподобия и другие. Таким образом, для каждого независимого параметра может быть несколько оценок, полученных различными методами. Для того, чтобы точечная оценка давала хорошее приближение оцениваемому параметру, она должна обладать следующими свойствами:
1. Оценка параметра называется несмещенной, если ее математическое ожидание равно оцениваемому параметру
:
.
Известно, что – несмещенная оценка математического ожидания,
– смещенная оценка дисперсии и
– несмещенная оценка дисперсии.
2. Оценка параметра называется состоятельной, если она сходится по вероятности к точному значению оцениваемого параметра
, то есть
.
Состоятельной оценкой математического ожидания является выборочное среднее , а состоятельными оценками дисперсии – выборочная дисперсия
и модифицированная выборочная дисперсия
.
3. Несмещенная оценка параметра называется эффективной, если она имеет минимальную дисперсию среди всех несмещенных оценок этого параметра. Доказано, что
и
являются эффективными оценками математического ожидания и дисперсии соответственно, а так как
– смещенная оценка дисперсии, то это и неэффективная оценка.
Дана выборка значений случайной величины (выборка объема
из генеральной совокупности)
Таблица 1
-3,66 | 0,88 | 1,67 | 2,3 | 2,69 | 2,93 | 3,54 | 4,52 | 5,22 | 5,57 |
-3,32 | 0,94 | 1,73 | 2,31 | 2,71 | 2,96 | 3,62 | 4,64 | 5,24 | 6,13 |
-2,34 | 1,22 | 1,79 | 2,37 | 2,73 | 3,02 | 3,8 | 4,78 | 5,27 | 6,42 |
-1,62 | 1,29 | 1,94 | 2,42 | 2,76 | 3,09 | 3,94 | 4,8 | 5,29 | 6,48 |
-1,16 | 1,31 | 2,07 | 2,44 | 2,79 | 3,22 | 3,98 | 4,86 | 5,32 | 7,34 |
-0,36 | 1,33 | 2,15 | 2,53 | 2,86 | 3,26 | 4,23 | 4,9 | 5,33 | 7,35 |
-0,36 | 1,51 | 2,16 | 2,62 | 2,86 | 3,28 | 4,29 | 4,93 | 5,35 | 7,5 |
-0,05 | 1,56 | 2,27 | 2,64 | 2,88 | 3,36 | 4,32 | 4,94 | 5,39 | 7,54 |
0,35 | 1,58 | 2,28 | 2,67 | 2,88 | 3,51 | 4,34 | 4,99 | 5,53 | 8,2 |
0,63 | 1,64 | 2,29 | 2,68 | 2,93 | 3,52 | 4,43 | 5,18 | 5,56 | 8,46 |
Требуется найти выборочные оценки математического ожидания, дисперсии и среднеквадратического отклонения случайной величины . Указать свойства этих оценок.
Оценкой математического ожидания случайной величины служит выборочное среднее
.
Данная оценка является несмещенной, эффективной и состоятельной.
Оценкой дисперсии случайной величины служат выборочная дисперсия и модифицированная выборочная дисперсия, вычисляемые по формулам:
,
.
Оценка является несмещенной, эффективной, состоятельной, а
– смещенная, неэффективная, но состоятельная. Следовательно,
дает лучшее приближение оцениваемой дисперсии, поэтому в дальнейших расчетах в качестве оценки дисперсии используется
:
.
Оценка среднеквадратического отклонения, являющаяся несмещенной, эффективной, состоятельной:
.
Пусть – выборка объема
, содержащая
различных вариант, из генеральной совокупности случайной величины
.
Статистическим рядом называется совокупность пар , полученных в результате эксперимента. Обычно статистические ряды оформляются в виде таблицы (таблица 2), в первом столбце которой стоит номер опыта, а во втором – наблюденное значение случайной величины, которое называется вариантой.
Размахом выборки называют разность между наибольшей и наименьшей вариантами выборки:
.
Частотой
варианты
называется число повторений варианты
в выборке, причем
.
Относительной частотой или весом
варианты
называется отношение частоты варианты
к объему выборки
, то есть
, причем
.
При большом числе наблюдений простой статистический ряд перестает быть удобной формой записи статистических данных. Для придания ему большей компактности и наглядности статистический материал подвергают дополнительной обработке – строят вариационные ряды или группированные вариационные ряды.
Вариационным рядом называется упорядоченная совокупность вариант
с соответствующими им частотами
или относительными частотами
.
Для построения группированного вариационного ряда интервал изменения наблюденных значений случайной величины разбивают на
непересекающихся интервалов
,
, …,
, называемых частичными интервалами или разрядами. Число интервалов группировки зависит от объема выборки и определяется по правилу:
,
где – объем выборки, а квадратные скобки обозначают целую часть числа. Разбиение на малое число интервалов может привести к неверным статистическим выводам. Согласно этой формуле, необходимо брать не менее 8 интервалов на 100 наблюдений.
Интервалы могут быть как одинаковой длины, так и различной. Для упрощения дальнейшей обработки статистических данных интервалы желательно делать одинаковой длины:
.
Частотой
интервала
называется число вариант
, попавших в этот интервал, причем
. При группировке наблюденных значений по разрядам возникает вопрос о том, к какому интервалу отнести значение, находящееся на границе двух разрядов. В этих случаях считают данное значение принадлежащим к левому интервалу.
Относительной частотой или весом
интервала
называется отношение частоты интервала к объему выборки
:
, причем
.
Накопленной относительной частотой
интервала
называется сумма относительных частот первых
интервалов, то есть
.
Группированным вариационным рядом называется упорядоченная совокупность непересекающихся интервалов с соответствующими им частотами , относительными частотами
и накопленными относительными частотами
Требуется составить группированный вариационный ряд для выборки из генеральной совокупности значений случайной величины (таблица 1), разбив выборку на
равных интервалов.
Данная выборка имеет объем .
Определим интервал изменения случайной величины . Для этого в таблице 1 находим максимальный и минимальный элементы:
,
.
Определим размах выборки:
.
Для удобства дальнейшей обработки статистических данных округляем и
до ближайших целых чисел таких, что
и
вошли бы в новый интервал:
,
.
Тогда новый размах выборки: .
Разбиваем выборку на равных интервалов. Длина каждого частичного интервала равна
.
Найдем количество вариант, попавших в каждый частичный интервал разбиения. Сумма всех частот должна быть равна .
Найдем относительные частоты и накопленные относительные частоты
.
Таблица 2
Индекс
![]() |
Интервал
![]() | Частота
![]() | Относит.
частота
![]() | Накопл.
относит.
частота
![]() |
![]() | 0,0200 | 0,0200 | ||
![]() | 0,0200 | 0,0400 | ||
![]() | 0,0300 | 0,0700 | ||
![]() | 0,0500 | 0,1200 | ||
![]() | 0,2300 | 0,3500 | ||
![]() | 0,2700 | 0,6200 | ||
![]() | 0,1700 | 0,7900 | ||
![]() | 0,1300 | 0,9200 | ||
![]() | 0,0600 | 0,9800 | ||
![]() | 0,0200 | 1,0000 | ||
![]() | ![]() |
ГИСТОГРАММА И ПОЛИГОН ЧАСТОТ
Пусть – выборка объема
, содержащая
различных вариант, из генеральной совокупности случайной величины
с неизвестной плотностью вероятностей
. Приближением (оценкой) неизвестной плотности вероятностей могут служить гистограмма или полигон относительных частот. Гистограмма и полигон относительных частот служат для геометрического изображения группированного вариационного ряда.
Гистограмма относительных частот представляется в виде примыкающих друг к другу прямоугольников с основаниями , равными ширине интервалов группировок, и высотами
(рис. 1). Для гистограммы относительных частот площадь ступенчатой фигуры соответствует сумме вероятностей и равна
. Площадь любого прямоугольника гистограммы равна вероятности попадания значений рассматриваемой случайной величины в интервал, соответствующий основанию прямоугольника.
![]() |
Рис. 1
Дата публикования: 2014-11-18; Прочитано: 952 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!