![]() |
Главная Случайная страница Контакты | Мы поможем в написании вашей работы! | |
|
При большом объеме выборки (порядка сотен) простая статистическая совокупность престает быть удобной формой записи статистического материала - она становится громоздкой и мало наглядной. Для придания большей компактности элементы выборки объединяют в группы (интервалы), число которых колеблется от 5 до 40, в зависимости от объема выборки.
Гост II.006-74 по правилам согласия опытного распределения с теоретическим рекомендует следующее число интервалов К в зависимости от объема выборки n:
при n = 200 | K = 18 ¸ 20, |
при n = 400 | K = 25 ¸ 30, |
при n = 1000 | K = 35 ¸ 40. |
Некоторые авторы для определения числа интервалов рекомендуют пользоваться эмпирическими формулами:
или
.
Просматривая результаты испытаний, выбираем наибольшее и наименьшее наблюдаемые значения признака X (x max, x min) и находим величину размаха варьирования
.
Зная число интервалов и размах варьирования R, находим длину каждого интервала h по формуле
.
При этом не рекомендуется, чтобы значение признака попадало на границу интервала. Чтобы избежать этого, длину интервала увеличивают или уменьшают, изменяя число интервалов.
В рассмотренном примере:
х min = 99,5; x max = 280,5; R = xmax – хmin = 181,0.
Значение К =12 подсчитано по формуле .
Тогда h = 15,5.
Далее приступают к заполнению таблицы 1.
В колонке 1 записаны полученные интервалы, расположенные в порядке возрастания значений признака.
В колонке 2 отмечено наличие признака, попавшего в рассматриваемый интервал (для облечения подсчета количества значений признака их группируют по 5). Количество m (абсолютная частота признака) записывают в колонку 3.
В колонке 4 записывают относительные частоты значений признака.
Таблица 1.
Интервалы | Наличие признака в интервале | Абсолютные частоты | Относительные частоты |
1 | 2 | 3 | 4 |
99,0 - 114,5 | III | 0,015 | |
114,5 - 130,0 | 0,085 | ||
130,0 - 145,5 | 0,145 | ||
145,5 - 161,0 | 0,165 | ||
161,0 - 176,5 | 0,170 | ||
176,5 - 192,0 | 0,165 | ||
192,0 - 207,5 | 0,105 | ||
207,5 - 223,0 | 0,065 | ||
223,0 - 238,5 | 0,060 | ||
238,5 - 254,0 | III | 0,015 | |
254,0 - 269,5 | I | 0,005 | |
269,5 - 285,0 | I | 0,005 |
Данные таблицы 1 используют для графического изображения статистического ряда либо в виде гистограммы, либо в виде эмпирической функции распределения. Это графическое изображение позволяет представить в наглядной форме закономерности, присущие генеральной совокупности.
Для построения гистограммы (рисунок 1) на оси абсцисс последовательно откладываются интервалы изменения значения признака. На этих отрезках, как на основании, строят прямоугольники с высотами, равными соответствующего интервала. Полученная ступенчатая фигура называется гистограммой.
![]() |
Рисунок 1 – Гистограмма
График эмпирической функции распределения (рисунок 2) строят в координатах (х, ) либо (х,
),
где x – значения признака;
- накопленная абсолютная частота.
Под значением признака понимают середины рассматриваемых интервалов, а под накопительной частотой – сумму частот всех предшествующих и рассматриваемого интервалов.
x | 106,75 | 122,25 | 137,75 | 153,25 | 168,75 | 184,25 |
![]() | ||||||
х | 199,75 | 215,25 | 230,75 | 246,25 | 261,75 | 277,25 |
![]() |
Рисунок 2 –
Вычисление точных оценок параметров распределения
Статистический ряд – первый шаг к осмыслению ряда наблюдений. Однако на практике этого недостаточно. Статистические ряды, имеющие похожие графические изображения, могут различаться:
1. Эмпирической средней – значением признака, вокруг которого группируются наблюдения;
2. Средним квадратическим отклонением S - рассеянием наблюдения вокруг эмпирической средней;
3. Показателем ассиметрии Аs, характеризующим скошенность гистограммы;
4. Показателем эксцесса Es, характеризующим островершинность гистограммы.
Перечисленные числовые характеристики называют статистическими. По ним судят о характерных особенностях статистического ряда.
Эти характеристики вычисляются по формулам:
, (2)
где ximi – середина и абсолютная частота i - го интервала;
k – число интервалов.
Для удобства вычислений , S, As, Es иногда используют метод ложного нуля, которым и воспользуемся. Для этого выбираем значения ха, около которого наиболее часто встречается значение признака, тогда
.
Обозначим ,
где h – длина интервала, и подставим в последнюю формулу
(3)
Для вычисления эмпирической дисперсии S2 используют формулу
. (4)
Показатель асимметрии вычисляют по формуле
. (5)
Показатель эксцесса находят по формуле:
. (6)
Для удобства вычислений , S, As, Es составляют таблицу 2.
Таблица 2.
x i | mi | ei | eimi | ei2mi | ei3mi | ei4mi |
106,75 122,25 137,75 153,25 | -4 -3 -2 -1 | -12 -51 -58 -33 | -192 -459 -232 -33 | |||
168,75 | ||||||
184,25 199,75 215,25 230,75 246,25 261,75 277,25 | ||||||
å |
Подставляя данные таблицы 2 в формулы (3) – (6), находим:
![]() | S2 = 1122,197 | S = 33,50 |
As = 0,413 | Es = – 0,27 |
Заметим что для нормального распределения As = Es =0.
Дата публикования: 2015-03-26; Прочитано: 423 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!