Главная Случайная страница Контакты | Мы поможем в написании вашей работы! | ||
|
Итак, мы хотим знать распределение признака Х в генеральной совокупности, нореально исследуем лишь некоторую выборку из нее.
В серии экспериментов, проводимых с выборкой, величина Х принимает определенные значения. Эти значения записанные для всех элементов выборки в том порядке, в котором они были получены в опытах, представляет собой простой статистический ряд. Каждое значение Х в полученном числовом ряду называют вариантой. Полученные данные и подлежат статистической обработке, статистическому анализу.
Первый шаг при обработке этого материала – наведение в нем определенного порядка, ведущего к получению статистического распределения выборки. Здесь возможны два основных способа: создание вариационного ряда или интервального ряда.
Рассмотрим вариационный ряд. Пусть некоторая выборка исследуется по количественному признаку Х, который представляет собой дискретную случайную величину. В имеющемся у нас простом статистическом ряду варианта х 1 встречается (повторяется) m 1 раз, х 2 – m 2 раза, … х к – m к раз, при этом , т.е. равна объему выборки. Далее по данным простого статистического ряда строится статистическое распределение (в медицинской литературе – вариационный ряд), которое удобно представить в виде таблицы, включающей в себя:
различные по значению варианты xi, расположенные в определенной, ранжированной *, заранее выбранной последовательности (обычно в порядке возрастания);
mi – частоты вариант, т.е. числа наблюдений (повторений) варианты х i в простом статистическом ряду;
pi*= mi /n – относительные частоты вариант, т.е. отношения частот mi к объему выборки n; они являются выборочными (эмпирическими) оценками вероятностей появления значений хi.
Каждая относительная частота указывает долю общего объема выборки, приходящуюся на данное значение варианты хi.
Итак, для дискретной величины Х вариационный ряд – статистическое распределение выборки – имеет следующий вид (табл. 1).
Таблица 1.
Варианта хi (х1< х2< х3 … < хk) | х1 | х2 | х3 | … | xk | Контроль |
Частота mi | m1 | m2 | m3 | … | mk | |
Относительная частота | … |
Напомним, что под распределением дискретной случайной величины в теории вероятностейпонимается соответствие между возможными значениями случайной величины и их вероятностями; в математической статистике – соответствие между наблюдаемыми вариантами х i и их частотами или относительными частотами.
Пример 1. Анализируемый показатель Х – срок лечения больного при некотором заболевании. Вариационный ряд – распределение больных по срокам лечения (объем выборки n = 26 больных) – имеет вид:
Таблица 2.
хi – число дней лечения | контроль | ||||||
mi – число больных с данным сроком лечения (частота) | |||||||
рi* = – относительная частота | 0,08 | 0,19 | 0,15 | 0,30 | 0,19 | 0,08 |
Полезность подобного представления данных очевидна по следующей причине: мы получаем практически важный результат – возможность оценить более и менее вероятные значения признака.
Интервальный ряд удобен тогда, когда количественный признак Х, характеризующий выборку, непрерывен, т.е. может принимать любые значения в некотором интервале. В этом случае статистическое распределение выборки (интервальный ряд) строится следующим образом. Область изменения признака (х макс – х мин) разбивают на несколько интервалов обычно равной ширины. Число интервалов k, как правило, не менее 5 и не более 25 и приближенно определяется следующими эмпирическими формулами:
k = , или k» 1 + 3,32 lg n,
где n – объем выборки.
Ширина интервалов одинакова и равна:
Δ x= h = .
Затем вычисляют границы интервалов: х мин = х0, х1=х0 + h, х2=х1 + h, х3=х2 + h,…., х макс = хk. Поскольку некоторые варианты могут являться границей двух соседних интервалов, то, во избежание недоразумений, придерживаются следующего правила: к интервалу (a,b) относят варианты, удовлетворяющие неравенству a £ х < b.
Затем для каждого интервала подсчитывают частоты m i и (или) относительные частоты рi*=mi/n попадания вариант в данный интервал. Нередко используют также плотность относительной частоты:
= .
Данную величину можно считать выборочной (эмпирической) оценкой плотности вероятности.
Рассмотренное выборочное распределение непрерывной случайной величины Х – интервальный ряд – обычно представляется в виде таблицы, имеющей, в частности, следующий вид (табл. 3).
Таблица 3.
Интервал | х0–х1 | х1–х2 | х2– х3 | ... | хk-1 – хk |
Частота m i | m1 | M2 | m3 | ... | mk |
Относительная частота pi*=mi/n | m1/n | m2/n | m3/n | ... | mk/n |
Пример 2. Анализируемый показатель Х – массы тела новорожденного. Определение массы тела 100 новорожденных показало, что минимальная масса составляет 2,7 кг, максимальная – 4,4 кг. Интервал (2,7 – 4,4) кг разбиваем на 10 равных интервалов (k = =10) шириной h = = 0,17 кг и строим интервальный ряд (табл. 4):
Таблица 4.
Номер интервала | ||||||||||
Интервал, масса тела, кг | 2,7–2,87 | 2,87–3,04 | 3,04–3,21 | 3,21–3,38 | 3,38–3,55 | 3,55–3,72 | 3,72–3,89 | 3,89–4,06 | 4,06–4,23 | 4,23–4,4 |
Частота m i | ||||||||||
mi/n = pi * | 0,04 | 0,08 | 0,12 | 0,16 | 0,21 | 0,15 | 0,11 | 0,07 | 0,04 | 0,02 |
mi/nh | 0,235 | 0,47 | 0,7 | 0,94 | 1,235 | 0,88 | 0,65 | 0,41 | 0,235 | 0,118 |
Контроль: k =10, mi =4+8+12+16+21+15+11+7+4+2=100= n (объем выборки), = 0,04+0,08+0,12+0,16+0,21+0,15+0,11+0,07+0,04+0,02 = 1.
Обобщим изложенный выше материал.
Если выборка исследуется по количественному признаку Х, который представляет собой дискретную случайную величину, то статистическим распределением выборки является вариационным статистический ряд – полученные значения признака, записанные в упорядоченном виде с указанием их частот и относительных частот.
Если выборка исследуется по количественному признаку Х, который представляет собой непрерывную случайную величину, то статистическим распределением выборки является интервальный статистический ряд. Он включает в себя интервалы вариант, частоты попадания вариант в эти интервалы, относительные частоты, при необходимости – плотности относительных частот для этих интервалов.
Дата публикования: 2015-01-09; Прочитано: 554 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!