Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Глава 3. Выборочный метод



Пусть требуется изучить некоторую совокупность объектов. Множество всех изучаемых объектов называется генеральной совокупностью. Выборочной совокупностью (или просто выборкой) называется совокупность объектов, отобранных для исследования из генеральной совокупности. Объемом совокупности (генеральной или выборочной) называют число объектов этой совокупности.

Для того чтобы по данным выборки можно было достаточно уверенно судить об интересующем нас признаке генеральной совокупности, необходимо, чтобы объем выборки был достаточно велик, и, кроме того, объекты выборки должны правильно представлять генеральную совокупность (т.е. выборка должна быть репрезентативной).

Выборки подразделяются на повторные (отобранный объект перед отбором следующего возвращается в генеральную совокупность) и бесповторные (отобранный объект не возвращается в генеральную совокупность).

Пусть из генеральной совокупности извлечена выборка объемом n. Упорядоченная выборка, записанная в порядке возрастания, называется вариационным рядом.

Разность между крайними членами вариационного ряда (наибольшим и наименьшим значениями выборки) называется размахом вариационного ряда. Вариационный ряд называется дискретным, если значения признака отличаются друг от друга на некоторую постоянную величину (например, ряд распределения рабочих по тарифному разряду). Вариационный ряд называется непрерывным, если значения признака могут отличаться один от другого на сколь угодно малую величину (например, ряд распределения рабочих по уровню заработной платы).

Наблюдаемые значения называются вариантами. Число повторений наблюдаемых значений называется частотой варианты или весом. Относительной (эмпирической) частотой значения называется отношение , где – число повторения значения в выборке объема n.

Наряду с понятием частоты существует понятие накопленной частоты , которая показывает, в скольких наблюдениях признак принял значения меньше значения х:

, где , , …, < .

При большом числе наблюдений статистическое распределение выборки можно задать в виде последовательности интервалов, обычно равной длины и соответствующих им частот (в качестве частоты интервалов принимают сумму частот вариант, попавших в этот интервал).

При построении интервального вариационного ряда распределения необходимо определить:

1) число групп k по формуле Стерджесса

,

где n – объем выборки;

2) длину интервала

;

3) за начало первого интервала рекомендуется брать величину

xнач = хmin 0,5× h.

Для наглядного представления статистического распределения пользуются графическим изображением вариационных рядов (полигоном, гистограммой и кумулятой).

Полигоном частот называют ломанную, отрезки которой соединяют точки (xi; mi), где xi – варианты выборки, mi – соответствующие им частоты или точки (xi; ), где – относительные частоты.

Кумулята – графическое изображение накопленных частот. Кумулята строится по точкам (xi; ). Для интервального ряда распределения в качестве xi принимают середины интервалов.

Гистограмма строится только для интервального вариационного ряда. На каждом из интервалов значений как на основании, строят прямоугольник с высотой, пропорциональной частоте mi.

Для оценки интегральной функции распределения генеральной совокупности служит эмпирическая функция распределения. Эмпирической функцией распределения называют функцию , определяющую для каждого значения х относительную частоту события Х < х, то есть относительную накопленную частоту

,

где – число вариант, меньших х, n – объем выборки.

Эмпирическая функция распределения обладает всеми свойствами интегральной функции распределения :

1) ;

2) – неубывающая функция;

3) если х 1 – наименьшая варианта, а хk – наибольшая, то при и при .

Примеры

73. В случайном порядке было отобрано 25 студентов экономического факультета и выписан их возраст:

19 17 22 18 17

17 23 21 18 19

17 22 18 18 18

20 17 19 21 17

21 17 18 23 18

Составить статистическое распределение студентов по возрасту. Построить полигон и кумуляту. Найти эмпирическую функцию распределения и дать ее графическое изображение.

Решение.

1. По исходным данным составим статистическое распределение выборки.

xi              
mi              

2. Вычислим относительные частоты, и результаты вычислений внесем в третий столбец таблицы. Относительные частоты находим по формуле

.

В данном случае объем выборки . Относительные частоты: ; ; ; ; ; .

.

3. Вычислим накопленные частоты и результаты внесем в четвертый столбец таблицы.

; ; ;

; ;

; .

Вычисленные относительные накопленные частоты указаны в пятом столбце таблицы.

варианты xi частоты mi относительные частоты, накопленные частоты, относительные накопленные частоты
    0,28   0,28
    0,28   0,56
    0,12   0,68
    0,04   0,72
    0,12   0,84
    0,08   0,92
    0,08    

4. Для построения полигона распределения отложим на оси абсцисс варианты xi, на оси ординат – частоты mi.

Для построения кумуляты отложим на оси абсцисс варианты xi, на оси ординат – накопленные частоты.

5. Найдем эмпирическую функцию F *(x) по данному распределению выборки.

Объем выборки .

Наименьшая варианта , следовательно , при . Значение , а именно наблюдалось 7 раз, следовательно , при . Значения , а именно , наблюдались раз, следовательно , при . Аналогично, при ; , при ; , при ; , при . Так как – наибольшая варианта, следовательно , при .

Эмпирическая функция имеет вид

Построим график этой функции

74. Наблюдения за жирностью молока у 50 коров дали следующие результаты (в %).

3,86 3,84 3,69 4,00 3,81 3,73 4,14 3,76

4,06 3,94 3,76 3,46 4,02 3,52 3,72

3,67 3,98 3,71 4,08 4,17 3,89 4,33

3,97 3,57 3,94 3,88 3,72 3,92 3,82

3,61 3,87 3,82 4,01 4,09 4,18 4,03

3,96 4,07 4,16 3,93 3,78 4,26 3,46

4,04 3,99 3,76 3,71 4,02 4,03 3,91

По этим данным построить интервальный вариационный ряд с равными интервалами и изобразить его графически (построить полигон, гистограмму, кумуляту).

Решение. 1. Выполним разбиение данного ряда на интервалы:

, ; .

Число интервалов ;

длина каждого интервала ;

за начало первого интервала примем величину .

жирность молока, интервал середина интервала, хi частота, mi относительная частота, накопленная частота, относительная накопленная частота
3,40–3,54 3,47   2/50=0,04   0,04
3,54–3,68 3,61   4/50=0,08 6 (2+4) 0,12
3,68–3,82 3,75   13/50=0,26 19 (6+13) 0,38
3,82–3,96 3,89   11/50=0,22 30 (19+11) 0,60
3,96–4,10 4,03   14/50=0,28 44 (30+14) 0,88
4,10–4,24 4,17   4/50=0,08 48 (44+4) 0,96
4,24–4,38 4,31   2/50=0,04 50 (48+2)  

2. Для построения гистограммы откладываем на оси абсцисс интервалы длинной . На этих интервалах построим прямоугольники высотой, пропорциональной частоте. Для построения полигона середины верхних оснований соединим ломаной линией.

Для построения кумуляты на оси абсцисс отложим середины интервалов, а на оси ординат – накопленные частоты.





Дата публикования: 2015-10-09; Прочитано: 560 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.011 с)...