Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Задание на расчетную работу



«СТАТИСТИЧЕСКИЙ АНАЛИЗ ОДНОМЕРНЫХ ДАННЫХ»

Дана выборка значений случайной величины (выборка объема из генеральной совокупности).

1. Найти выборочную оценку математического ожидания случайной величины , указать свойства этой оценки.

2. Найти выборочные оценки дисперсии и среднеквадратического отклонения случайной величины , указать свойства этих оценок.

3. Составить группированный вариационный ряд, разбив выборку на равных интервалов.

4. Построить гистограмму и полигон относительных частот. На их основе выдвинуть нулевую гипотезу о виде распределения (нормальное распределение).

5. На одном чертеже с гистограммой построить график теоретической плотности вероятностей. Сделать вывод об их визуальном совпадении.

6. Составить эмпирическую функцию распределения и построить ее график.

7. На одном чертеже с эмпирической функцией распределения построить график теоретической функции распределения. Сделать вывод об их визуальном совпадении.

8. С помощью критерия согласия Пирсона проверить гипотезу о виде распределения генеральной совокупности для уровня значимости . Сделать статистический вывод.

9. Построить доверительные интервалы для неизвестных математического ожидания и дисперсии нормально распределенной генеральной совокупности с параметрами и для уровней значимости , и . Сделать вывод о ширине доверительного интервала, в зависимости от уровня значимости .

У к а з а н и е: все вычисления проводить с точностью до 0,0001

Предположим, что изучается некоторая случайная величина , закон распределения которой неизвестен. Требуется приближенно определить этот закон из опыта и проверить гипотезу о том, что случайная величина подчинена этому закону.

Генеральной совокупностью называют всю совокупность реализации случайной величины , все возможные наблюдения некоторого показателя, все возможные исходы некоторого испытания.

Выборкой называют часть генеральной совокупности , то есть конечное подмножество значений случайной величины из множества элементов генеральной совокупности.

Объемом выборки называют количество содержащихся в ней значений случайной величины .

Задача математической статистики состоит в исследовании свойств выборки и обобщении этих свойств на всю генеральную совокупность.

Выборка является исходной информацией для статистического анализа и принятия решений о неизвестных вероятностных характеристиках случайной величины . Для этих целей на выборку следует смотреть как на набор реализаций независимых одинаково распределенных случайных величин .

Для того чтобы по выборке можно было достаточно уверенно судить о генеральной совокупности, выборка должна быть представительной (репрезентативной), то есть достаточно полно представлять признаки и параметры генеральной совокупности. Репрезентативность выборки улучшается при увеличении её объема.

Пусть – выборка объема из генеральной совокупности значений случайной величины с математическим ожиданием , дисперсией и среднеквадратическим отклонением .

Выборочным средним выборки называется среднее арифметическое

.

Согласно закону больших чисел, при увеличении объема выборки среднее арифметическое выборки сходится по вероятности к математическому ожиданию генеральной совокупности, то есть

.

Таким образом, среднее арифметическое может служить приближением (оценкой) математического ожидания генеральной совокупности.

Выборочной дисперсией называется

.

Модифицированной выборочной дисперсией называется

.

Все эти выборочные величины зависят от выборки и сами являются случайными величинами. Их значения лишь приближенно равны соответствующим числовым характеристикам генеральной совокупности.

Статистикой называется любая функция, зависящая от выборки и сама являющаяся случайной величиной. Таким образом, выборочное среднее , выборочная дисперсия и модифицированная выборочная дисперсия – это статистики.

Точечной оценкой неизвестного параметра распределения случайной величины называется такая функция от выборки (статистика) , что ее значение от любой выборки приближенно равно истинному значению параметра, то есть .

Оценки параметров принято обозначать символом с тильдой наверху: .

Существует несколько методов нахождения точечных оценок: метод наименьших квадратов, метод моментов, метод максимального правдоподобия и другие. Таким образом, для каждого независимого параметра может быть несколько оценок, полученных различными методами. Для того, чтобы точечная оценка давала хорошее приближение оцениваемому параметру, она должна обладать следующими свойствами:

1. Оценка параметра называется несмещенной, если ее математическое ожидание равно оцениваемому параметру :

.

Известно, что – несмещенная оценка математического ожидания, – смещенная оценка дисперсии и – несмещенная оценка дисперсии.

2. Оценка параметра называется состоятельной, если она сходится по вероятности к точному значению оцениваемого параметра , то есть

.

Состоятельной оценкой математического ожидания является выборочное среднее , а состоятельными оценками дисперсии – выборочная дисперсия и модифицированная выборочная дисперсия .

3. Несмещенная оценка параметра называется эффективной, если она имеет минимальную дисперсию среди всех несмещенных оценок этого параметра. Доказано, что и являются эффективными оценками математического ожидания и дисперсии соответственно, а так как – смещенная оценка дисперсии, то это и неэффективная оценка.

Дана выборка значений случайной величины (выборка объема из генеральной совокупности)

Таблица 1

-3,66 0,88 1,67 2,3 2,69 2,93 3,54 4,52 5,22 5,57
-3,32 0,94 1,73 2,31 2,71 2,96 3,62 4,64 5,24 6,13
-2,34 1,22 1,79 2,37 2,73 3,02 3,8 4,78 5,27 6,42
-1,62 1,29 1,94 2,42 2,76 3,09 3,94 4,8 5,29 6,48
-1,16 1,31 2,07 2,44 2,79 3,22 3,98 4,86 5,32 7,34
-0,36 1,33 2,15 2,53 2,86 3,26 4,23 4,9 5,33 7,35
-0,36 1,51 2,16 2,62 2,86 3,28 4,29 4,93 5,35 7,5
-0,05 1,56 2,27 2,64 2,88 3,36 4,32 4,94 5,39 7,54
0,35 1,58 2,28 2,67 2,88 3,51 4,34 4,99 5,53 8,2
0,63 1,64 2,29 2,68 2,93 3,52 4,43 5,18 5,56 8,46

Требуется найти выборочные оценки математического ожидания, дисперсии и среднеквадратического отклонения случайной величины . Указать свойства этих оценок.

Оценкой математического ожидания случайной величины служит выборочное среднее .

Данная оценка является несмещенной, эффективной и состоятельной.

Оценкой дисперсии случайной величины служат выборочная дисперсия и модифицированная выборочная дисперсия, вычисляемые по формулам:

,

.

Оценка является несмещенной, эффективной, состоятельной, а – смещенная, неэффективная, но состоятельная. Следовательно, дает лучшее приближение оцениваемой дисперсии, поэтому в дальнейших расчетах в качестве оценки дисперсии используется : .

Оценка среднеквадратического отклонения, являющаяся несмещенной, эффективной, состоятельной:

.

Пусть – выборка объема , содержащая различных вариант, из генеральной совокупности случайной величины .

Статистическим рядом называется совокупность пар , полученных в результате эксперимента. Обычно статистические ряды оформляются в виде таблицы (таблица 2), в первом столбце которой стоит номер опыта, а во втором – наблюденное значение случайной величины, которое называется вариантой.

Размахом выборки называют разность между наибольшей и наименьшей вариантами выборки:

.

Частотой варианты называется число повторений варианты в выборке, причем .

Относительной частотой или весом варианты называется отношение частоты варианты к объему выборки , то есть , причем .

При большом числе наблюдений простой статистический ряд перестает быть удобной формой записи статистических данных. Для придания ему большей компактности и наглядности статистический материал подвергают дополнительной обработке – строят вариационные ряды или группированные вариационные ряды.

Вариационным рядом называется упорядоченная совокупность вариант с соответствующими им частотами или относительными частотами .

Для построения группированного вариационного ряда интервал изменения наблюденных значений случайной величины разбивают на непересекающихся интервалов , , …, , называемых частичными интервалами или разрядами. Число интервалов группировки зависит от объема выборки и определяется по правилу:

,

где – объем выборки, а квадратные скобки обозначают целую часть числа. Разбиение на малое число интервалов может привести к неверным статистическим выводам. Согласно этой формуле, необходимо брать не менее 8 интервалов на 100 наблюдений.

Интервалы могут быть как одинаковой длины, так и различной. Для упрощения дальнейшей обработки статистических данных интервалы желательно делать одинаковой длины:

.

Частотой интервала называется число вариант , попавших в этот интервал, причем . При группировке наблюденных значений по разрядам возникает вопрос о том, к какому интервалу отнести значение, находящееся на границе двух разрядов. В этих случаях считают данное значение принадлежащим к левому интервалу.

Относительной частотой или весом интервала называется отношение частоты интервала к объему выборки : , причем .

Накопленной относительной частотой интервала называется сумма относительных частот первых интервалов, то есть .

Группированным вариационным рядом называется упорядоченная совокупность непересекающихся интервалов с соответствующими им частотами , относительными частотами и накопленными относительными частотами

Требуется составить группированный вариационный ряд для выборки из генеральной совокупности значений случайной величины (таблица 1), разбив выборку на равных интервалов.

Данная выборка имеет объем .

Определим интервал изменения случайной величины . Для этого в таблице 1 находим максимальный и минимальный элементы:

, .

Определим размах выборки:

.

Для удобства дальнейшей обработки статистических данных округляем и до ближайших целых чисел таких, что и вошли бы в новый интервал:

, .

Тогда новый размах выборки: .

Разбиваем выборку на равных интервалов. Длина каждого частичного интервала равна .

Найдем количество вариант, попавших в каждый частичный интервал разбиения. Сумма всех частот должна быть равна .

Найдем относительные частоты и накопленные относительные частоты .

Таблица 2

Индекс   Интервал Частота Относит. частота Накопл. относит. частота
    0,0200 0,0200
    0,0200 0,0400
    0,0300 0,0700
    0,0500 0,1200
    0,2300 0,3500
    0,2700 0,6200
    0,1700 0,7900
    0,1300 0,9200
    0,0600 0,9800
    0,0200 1,0000
     

ГИСТОГРАММА И ПОЛИГОН ЧАСТОТ

Пусть – выборка объема , содержащая различных вариант, из генеральной совокупности случайной величины с неизвестной плотностью вероятностей . Приближением (оценкой) неизвестной плотности вероятностей могут служить гистограмма или полигон относительных частот. Гистограмма и полигон относительных частот служат для геометрического изображения группированного вариационного ряда.

Гистограмма относительных частот представляется в виде примыкающих друг к другу прямоугольников с основаниями , равными ширине интервалов группировок, и высотами (рис. 1). Для гистограммы относительных частот площадь ступенчатой фигуры соответствует сумме вероятностей и равна . Площадь любого прямоугольника гистограммы равна вероятности попадания значений рассматриваемой случайной величины в интервал, соответствующий основанию прямоугольника.

 
 

Рис. 1





Дата публикования: 2014-11-18; Прочитано: 952 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2025 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.006 с)...