Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

I. Первичная обработка статистических данных



Первичная обработка статистических данных заключается в построении вариационных рядов, построении геометрической иллюстрации вариационных рядов – гистограмм и определении точечных оценок числовых характеристик исследуемых случайных величин и .

Определяем размах выборок, то есть в каждом наборе данных и находим, соответственно, максимальный и минимальный элементы и, по выбранному нами числу интервалов вариационного ряда, определяем границы интервалов.

В первом наборе данных – количество слов в ста предложениях – находим: и , во втором наборе – количество букв в этих предложениях: и . Выберем для первого набора число интервалов, равное восьми (), а для второго набора – число интервалов, равное четырнадцати (). В этом случае длина каждого интервала для первого набора данных будет равна трём, а для второго набора длина интервала будет равна десяти.

Составляем две таблицы – интервальные вариационные ряды для каждого набора данных. В первой строке таблицы записываем интервалы , , а во второй строке – значения относительных частот , где – количество элементов анализируемой выборки, попавших в интервал , n – объём выборки.

Вариационный ряд, построенный по выборке значений случайной величины – количество слов в предложении.

Вариационный ряд, построенный по выборке значений случайной величины – количество букв в предложении.

 

Ясно, что сумма значений полученных относительных частот должна быть равна единице, то есть: .

Гистограмма является геометрической иллюстрацией построенного вариационного ряда.

 
 


0,32 –

0,28 –

0,24 –

0,20 –

0,16 –

0,12 –

0,08 –

0,04 –

0,00 –

0 3 6 9 12 15 18 21 24 27

Гистограмма относительных частот выборки значений случайной величины - количество слов в предложении.

0,24 -

-

0,20 -

-

0,16 -

-

0,12 -

-

0,08 -

-

0,04 -

-

0,00 -

0 10 20 30 40 50 60 70 80 90 100 110 120 130 140

Гистограмма относительных частот выборки значений случайной величины - количество букв в предложении.

Гистограмма является статистической моделью теоретического закона распределения вероятностей исследуемой случайной величины.

Ясно, что рассматриваемые в примере случайные величины и являются случайными величинами дискретного типа. Но так как возможные значения этих случайных величин были объединены в группы, определяемые границами интервалов вариационного ряда, то можно говорить, что сделанная гистограмма является моделью графика плотности вероятности теоретического распределения вероятностей дискретной случайной величины, имеющей достаточно большое число возможных значений.





Дата публикования: 2015-01-09; Прочитано: 2745 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.011 с)...