Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Первичная обработка выборки



Пусть из ГС извлекли выборку, причем разные объекты имеют разные числовые значения (xi) изучаемого параметра.

О. 1. Наблюдаемые значения изучаемого параметра (количественного либо качественного признака) называются вариантами (xi).

О. 2. Последовательность вариант, записанная в порядке возрастания (убывания), называется вариационным рядом.

есть вариационный ряд,

если (или х 1 х 2 х 3 ≥ … ≥ хn).

О. 3. Число, показывающее, сколько раз данная варианта xi встречается в совокупности, называется частотой варианты (ni).

Очевидно, что для любой выборки .

О. 4. Отношение называется относительной частотой варианты (, т. к. ).

О. 5. Статистическим распределением выборки (или статистическим рядом) называется перечень вариант xi вариационного ряда и соответствующих им частот ni (либо относительных частот ω i).

xi x 1 x 2 xk либо xi x 1 x 2 xk
ni n 1 n 2 nk w i w1 w2 w k

При большом объеме выборки или при незначительных отклонениях вариант строят интервальный статистический ряд: интервал, содержащий все значения выборки, разбивают на k равных интервалов и подсчитывают частоты интервалов.

О. 6. Размахом выборки называют расстояние между наименьшим и наибольшим значением вариант этой выборки.

Расчет длины и границ интервалов проводится по следующим формулам:

,

где k – количество задаваемых интервалов;

= х 1; ;

остальные границы рассчитываются по формуле xi = xi –1 + ∆x.

О. 7. Частотой интервала называется количество всех вариант, попавших в данный интервал.

Интервальный статистический ряд имеет вид

(xi, xi +1) ni
  (x 1, x 2) n 1
  (x 2, x 3) n 2
k (xk –1, xk) nk

____________

– середина интервала (xi, xi +1).

Геометрической интерпретацией статистического ряда являются полигон и гистограмма частот.

О. 8. Полигоном частот называют ломаную на координатной плоскости, отрезки которой соединяют последовательно точки
(x 1, n 1), (x 2, n 2), …, (xk, nk) (рис. 3).

О. 9. Полигоном относительных частот называют ломаную на координатной плоскости, отрезки которой последовательно соединяют точки (x 1, ω1), (x 2, ω2), …, (xk, ω k) (рис. 4).


ni

nk

n 2

n 1

x 1 x 2 x 3 xk xi

Рис. 3. Полигон частот

 
 


ω i

ω2

ω1

x 1 x 2 x 3 xk xi

Рис. 4. Полигон относительных частот

Если статистический ряд интервальный, то для него строят гистограмму частот (либо относительных частот).

О. 10. Гистограммой частот (рис. 5) называется ступенчатая фигура, состоящая из прямоугольников, основаниями которых служат частичные интервалы (xi, xi +1) длиной Δ х, а высоты равны отношению

.

Площадь i -го прямоугольника равна сумме частот вариант, попавших в i- й интервал:

.

Тогда площадь всей гистограммы частот равна сумме всех частот, т. е. объему выборки n:

.

Рис. 5. Гистограмма частот

На гистограмме частот строят эмпирическую функцию плотности распределения f *(x).

По виду f *(x) можно выдвинуть гипотезу о виде распределения изучаемого признака, который можно рассматривать как случайную величину Х (с.в. Х). Например, можно предположить, что
на рис. 6 признак Х распределен равномерно, на рис. 7 – нормально, на рис. 8 – по показательному закону.

Аналогично строят гистограмму относительных частот (рис. 9).


x 1 x 2 x 3 xk –1 xk xi

Рис. 9. Гистограмма относительных частот

Площадь гистограммы определяется по формуле

.

На основании статистического ряда строится эмпирическая (полученная опытным путем) функция распределения.

О. 11. Эмпирической функцией распределения (обозначается F*(x)) называют функцию, определяющую для каждого числа x относительную частоту события X < x:

,

где nx – число вариант, меньших х; n – объем выборки.





Дата публикования: 2015-01-09; Прочитано: 1746 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.009 с)...