Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Пример выполнения статистического расчета 1 страница



Пусть в результате некоторого эксперимента получено n значений изучаемой случайной величины Х. Данные записаны в виде таблицы и составляют первичную выборку объема n =100.

81,38 66,94 88,26 72,73 65,72 109,76 88,45 96,73 85,90 66,93
61,31 86,73 89,03 65,14 80,06 93,68 69,09 57,56 74,79 77,66
83,88 54,58 58,83 78,05 67,33 70,51 60,18 67,01 52,27 50,84
63,83 72,92 69,22 71,12 88,77 45,84 98,34 76,98 57,34 79,80
63,29 66,80 78,64 74,30 56,75 77,85 71,95 67,63 69,32 58,53
58,55 39,92 73,16 96,09 70,44 67,22 73,04 59,72 72,19 65,53
86,60 65,12 74,32 77,27 79,60 79,95 61,63 45,51 104,02 84,87
71,36 68,05 51,88 81,18 75,06 85,37 50,82 87,18 64,12 86,93
71,90 30,03 49,98 42,52 60,96 99,11 78,32 44,69 43,08 79,58
60,85 64,43 95,54 89,67 57,37 98,60 80,13 67,04 77,00 69,26

1. Представим выборку в виде вариационного ряда: последовательности исходных величин, записанных в возрастающем порядке.

30,03 61,63 71,36 80,13
39,92 63,29 71,90 81,18
42,52 63,83 71,95 81,38
43,08 64,12 72,19 83,88
44,69 64,43 72,73 84,87
45,51 65,12 72,92 85,37
45,84 65,14 73,04 85,90
49,98 65,53 73,16 86,60
50,82 65,72 74,30 86,73
50,84 66,80 74,32 86,93
51,88 66,93 74,79 87,18
52,27 66,94 75,06 88,26
54,58 67,01 76,98 88,45
56,75 67,04 77,00 88,77
57,34 67,22 77,27 89,03
57,37 67,33 77,66 89,67
57,56 67,63 77,85 93,68
58,53 68,05 78,05 95,54
58,55 69,09 78,32 96,09
58,83 69,22 78,64 96,73
59,72 69,26 79,58 98,34
60,18 69,32 79,60 98,60
60,85 70,44 79,80 99,11
60,96 70,51 79,95 104,02
61,31 71,12 80,06 109,76

2. Составим группированный статистический ряд. Найдем наименьший и наибольший элемент выборки: . Разобьем отрезок на равных по длине промежутков. При объеме выборки n= 100 рекомендуется взять Число – частота попадания элементов выборки в -ый промежуток.

Таблица 1

Интервал [30; 40] (40; 50] (50; 60] (60; 70] (70; 80] (80; 90] (90; 100] (100; 110]
               

3. Для построения гистограммы дополним таблицу 1 тремя строками: , и , где длина - ого промежутка; – относительная частота попадания элементов выборки в -ый промежуток.

Таблица 2

Интервал [30; 40] (40; 50] (50; 60] (60; 70] (70; 80] (80; 90] (90; 100] (100; 110]
               
               
0,02 0,06 0,14 0,26 0,28 0,15 0,07 0,02
0,002 0,006 0,014 0,026 0,028 0,015 0,007 0,002

Последняя строка таблицы 2 определяет высоты столбцов гистограммы, приведенной на рисунке 1.

Рис. 1

Для непрерывной случайной величины гистограмма аппроксимирует плотность вероятности генеральной совокупности.

4. Для построения графика эмпирической функции распределения в таблицу 1 добавим две строки, в которых следует записать значения и .

Таблица 3

Интервал [30; 40] (40; 50] (50; 60] (60; 70] (70; 80] (80; 90] (90; 100] (100; 110]
               
               
0,02 0,08 0,22 0,48 0,76 0,92 0,98  

Значения эмпирической функции распределения равны , если принадлежит - ому промежутку; 0, если и 1, если . Получим

График эмпирической функции распределения (кумулята) имеет вид:

Рис. 2

Эмпирическая функция аппроксимирует функцию распределения генеральной совокупности.

5. Для вычисления числовых характеристик выборки построим новый вариационный ряд. Обозначим – середину - того промежутка. Это значение присваивается всем элементам выборки, попавшим в -ый интервал.

Таблица 4

Интервал
[30; 40]        
(40; 50]        
(50; 60]        
(60; 70]        
(70; 80]        
(80; 90]        
(90; 100]        
(100; 110]        
Сумма        

Для группированного ряда выборочное среднее и выборочная дисперсия вычисляются по формулам:

;

;

Подставляя величины, приведенные в таблице 4, получим:

;

Выборочное среднеквадратическое отклонение .

Замечание. При расчетах результат округляем до двух десятичных знаков.

Составим ещё одну таблицу.

Таблица 5

Интервал
[30; 40]     -35,5 -89477,75 3176460,13
(40; 50]     -25,5 -99488,25 2536950,38
(50; 60]     -15,5 -52134,25 808080,88
(60; 70]     -5,5 -4325,75 23791,63
(70; 80]     4,5 2551,50 11481,75
(80; 90]     14,5 45729,38 663075,94
(90; 100]     24,5 102942,88 2522100,44
(100; 110]     34,5 82127,25 2833390,13
Сумма       –12075 12575331,25

Коэффициенты асимметрии А и эксцесса Е вычисляются по формулам:

.

Подставляя величины, приведенные в таблице 4, получим:

.

Если коэффициенты А и Е значительно отклоняются от нулевого значения, то выборочное распределение отличается от нормального.

Замечание. При n < 30 в расчетах следует использовать исправленную оценку среднеквадратического отклонения

6. Оценку истинного значения параметра а (математического ожидания) дает доверительный интервал, который для случая большой выборки определяется формулой

,

где значение находится из условия .

Для доверительной вероятности (надежности) по таблице значений функции Лапласа , приведенной в приложении 2, находим число 0,4505, наиболее близкое к . Это число расположено в строке, именованной «1,6», и столбце с названием «5». Искомое значение = 1,6 + 0,05 = 1,65, так как (1,65)» 0,9. При 70,5 и точности оценки 2,61 с надежностью 0,9 доверительный интервал для математического ожидания равен (68,12; 72,88).

7. Оценку истинного значения параметра дает доверительный интервал для среднеквадратического отклонения, который для случая большой выборки определяется по формуле

.

По заданной доверительной вероятности по таблице значений функции Лапласа, находим , следовательно, . Тогда с надежностью 0,95 доверительный интервал для среднеквадратического отклонения имеет вид (12,78; 16,99).

8. Проверка нулевой гипотезы по критерию Пирсона состоит из следующих этапов.

a) По выборке вычисляются точечные оценки математического ожидания и среднеквадратического отклонения .

b) В каждом промежутке определяются эмпирические частоты и теоретические вероятности.

c) Для данной выборки вычисляется наблюдаемое значение критерия Пирсона.

d) Задается уровень значимости и подсчитывается количество степеней свободы.

e) По таблице приложения 3 определяется значение .

f) Если , то гипотеза отвергается как маловероятная.

Значения коэффициентов асимметрии А и эксцесса Е, близкие к нулю, а также вид гистограммы позволяют выдвинуть гипотезу о том, что генеральная совокупность распределена по нормальному закону. Проверим эту гипотезу с помощью критерия Пирсона.

а) Этот этап проделан в пункте 5.

b) Используя таблицу приложения 2, найдем теоретические вероятности попадания варианты в каждый промежуток по формуле

,

и вычислим

Вычисления удобно проводить по таблице 6. Предварительно следует изменить таблицу 1, объединив первый интервал со вторым и седьмой интервал с восьмым, так как в критерии Пирсона предполагается, что количество вариант в каждом интервале не меньше пяти. Крайние интервалы расширяются влево и вправо до бесконечности, причем


Таблица 6

Интервал   (– ¥; 50]   (50; 60]   (60; 70]   (70; 80]   (80; 90]   (90; ¥)  
Граница                          
                         
    – 1,42   – 0,73   – 0,03   0,66   1,35    
– 0,5   – 0,42   – 0,27   – 0,01   0,25   0,41   0,5
  0,08   0,15   0,26   0,26   0,17   0,09  
                         
                         
      0,07       0,15   0,24      

Сначала в граничных точках вычисляем аргументы функции Лапласа. Например, для промежутка (70; 80] имеем

,

.

По таблице приложения 2 вычисляем теоретическую вероятность попадания варианты в промежуток (70; 80]

.

Функция является нечетной, следовательно,

.

В последней строке таблицы 6 помещены значения . Для промежутка [70; 80) эта величина принимает значение

.

c) Суммируя все числа последней строки, получаем . Полученное число необходимо сравнить с величиной .

d) Количество интервалов вариационного ряда, приведенного в таблице 6, равно шести. Число степеней свободы .

e) Выбираем уровень значимости . В таблице приложения 3 параметрам и соответствует значение .

f) При выбранной надежности 0,95 . Следовательно, отвергать гипотезу оснований нет. Предположение о том, что исследуемая физическая величина распределена по нормальному закону с параметрами ; не противоречит результатам измерений.

Значит, можно считать, что функция плотности вероятности изучаемой физической величины имеет вид.

.

Значения функции приведены в таблице приложения 1, а график изображен на рисунке 3 сплошной линией. Отдельные точки на том же рисунке последней строке таблицы 1, по которой строилась гистограмма. Очевидно, что теоретическое распределение вполне согласуется с результатами выборки.

Рис. 3


ВАРИАНТЫ ДЛЯ САМОСТОЯТЕЛЬНОЙ РАБОТЫ

Вариант 1 Вариант 2 Вариант 3





Дата публикования: 2015-03-26; Прочитано: 273 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.018 с)...