Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Построение эмпирической функции распределения



При большом объеме выборки (порядка сотен) простая статистическая совокупность престает быть удобной формой записи статистического материала - она становится громоздкой и мало наглядной. Для придания большей компактности элементы выборки объединяют в группы (интервалы), число которых колеблется от 5 до 40, в зависимости от объема выборки.

Гост II.006-74 по правилам согласия опытного распределения с теоретическим рекомендует следующее число интервалов К в зависимости от объема выборки n:

при n = 200 K = 18 ¸ 20,
при n = 400 K = 25 ¸ 30,
при n = 1000 K = 35 ¸ 40.

Некоторые авторы для определения числа интервалов рекомендуют пользоваться эмпирическими формулами:

или .

Просматривая результаты испытаний, выбираем наибольшее и наименьшее наблюдаемые значения признака X (x max, x min) и находим величину размаха варьирования

.

Зная число интервалов и размах варьирования R, находим длину каждого интервала h по формуле

.

При этом не рекомендуется, чтобы значение признака попадало на границу интервала. Чтобы избежать этого, длину интервала увеличивают или уменьшают, изменяя число интервалов.

В рассмотренном примере:

х min = 99,5; x max = 280,5; R = xmax – хmin = 181,0.

Значение К =12 подсчитано по формуле .

Тогда h = 15,5.

Далее приступают к заполнению таблицы 1.

В колонке 1 записаны полученные интервалы, расположенные в порядке возрастания значений признака.

В колонке 2 отмечено наличие признака, попавшего в рассматриваемый интервал (для облечения подсчета количества значений признака их группируют по 5). Количество m (абсолютная частота признака) записывают в колонку 3.

В колонке 4 записывают относительные частоты значений признака.

Таблица 1.

Интервалы Наличие признака в интервале Абсолютные частоты Относительные частоты
1 2 3 4
99,0 - 114,5 III   0,015
114,5 - 130,0 IIII IIII IIII II   0,085
130,0 - 145,5 IIII IIII IIII IIII IIII IIII   0,145
145,5 - 161,0 IIII IIII IIII IIII IIII IIII III   0,165
161,0 - 176,5 IIII IIII IIII IIII IIII IIII IIII   0,170
176,5 - 192,0 IIII IIII IIII IIII IIII IIII III   0,165
192,0 - 207,5 III III III III I   0,105
207,5 - 223,0 III III III   0,065
223,0 - 238,5 III III II   0,060
238,5 - 254,0 III   0,015
254,0 - 269,5 I   0,005
269,5 - 285,0 I   0,005

Данные таблицы 1 используют для графического изображения статистического ряда либо в виде гистограммы, либо в виде эмпирической функции распределения. Это графическое изображение позволяет представить в наглядной форме закономерности, присущие генеральной совокупности.

Для построения гистограммы (рисунок 1) на оси абсцисс последовательно откладываются интервалы изменения значения признака. На этих отрезках, как на основании, строят прямоугольники с высотами, равными соответствующего интервала. Полученная ступенчатая фигура называется гистограммой.

 
 

Рисунок 1 – Гистограмма

График эмпирической функции распределения (рисунок 2) строят в координатах (х, ) либо (х, ),

где x – значения признака;

- накопленная абсолютная частота.

Под значением признака понимают середины рассматриваемых интервалов, а под накопительной частотой – сумму частот всех предшествующих и рассматриваемого интервалов.

x 106,75 122,25 137,75 153,25 168,75 184,25
           
х 199,75 215,25 230,75 246,25 261,75 277,25
           

Рисунок 2 –
Вычисление точных оценок параметров распределения

Статистический ряд – первый шаг к осмыслению ряда наблюдений. Однако на практике этого недостаточно. Статистические ряды, имеющие похожие графические изображения, могут различаться:

1. Эмпирической средней – значением признака, вокруг которого группируются наблюдения;

2. Средним квадратическим отклонением S - рассеянием наблюдения вокруг эмпирической средней;

3. Показателем ассиметрии Аs, характеризующим скошенность гистограммы;

4. Показателем эксцесса Es, характеризующим островершинность гистограммы.

Перечисленные числовые характеристики называют статистическими. По ним судят о характерных особенностях статистического ряда.

Эти характеристики вычисляются по формулам:

, (2)

где ximi – середина и абсолютная частота i - го интервала;

k – число интервалов.

Для удобства вычислений , S, As, Es иногда используют метод ложного нуля, которым и воспользуемся. Для этого выбираем значения ха, около которого наиболее часто встречается значение признака, тогда

.

Обозначим ,

где h – длина интервала, и подставим в последнюю формулу

(3)

Для вычисления эмпирической дисперсии S2 используют формулу

. (4)

Показатель асимметрии вычисляют по формуле

. (5)

Показатель эксцесса находят по формуле:

. (6)

Для удобства вычислений , S, As, Es составляют таблицу 2.

Таблица 2.

x i mi ei eimi ei2mi ei3mi ei4mi
106,75 122,25 137,75 153,25   -4 -3 -2 -1 -12 -51 -58 -33   -192 -459 -232 -33  
168,75            
184,25 199,75 215,25 230,75 246,25 261,75 277,25            
å            

Подставляя данные таблицы 2 в формулы (3) – (6), находим:

= 171б54 S2 = 1122,197 S = 33,50
As = 0,413 Es = – 0,27  

Заметим что для нормального распределения As = Es =0.





Дата публикования: 2015-03-26; Прочитано: 372 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.01 с)...