Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Вариационные ряды и их графическая интерпретация



Элементы математической статистики

Математическая статистика – это наука, занимающаяся получением, описанием и обработкой опытных данных или наблюдений с целью изучения закономерностей массовых явлений.

Вариационные ряды и их графическая интерпретация

В практике статистических наблюдений различают два вида наблюдений: сплошное, когда изучаются все объекты (элементы) и выборочное, когда изучается часть объектов. Вся изучаемая совокупность объектов называется «генеральной совокупностью». Простейший пример генеральной совокупности – материалы переписи населения той или иной страны, в которых имеются сведения о всех ее гражданах. Понятие генеральной совокупности аналогично понятию всей совокупности значений случайной величины.

Как правило, для обработки наблюдений или опыта удается использовать только часть генеральной совокупности – так называемую «выборочную совокупность» или «выборку».

Сущность выборочного метода в статистике состоит в том, чтобы по свойствам выборки сделать вывод о свойствах всей генеральной совокупности.

На начальном этапе данные выборки заносятся в таблицу, где записываются номера и результаты измерений или опросов. Различные значения случайной величины, наблюдаемые в результате эксперимента, называются вариантами (обозначаются через x). В таблице варианты располагаются в порядке их возрастания.

Пример. Генеральная совокупность – N ящиков с приборами;

Выборочная совокупность – n = 10 выбранных для контроля ящиков.

Подсчитывается число пострадавших при транспортировке ящиков деталей. Результаты подсчета представлены в таблице:

№ ящ.                    
Кол. д.                    

Если количество пострадавших деталей – это изучаемая случайная величина X, то полученные данные о ней можно представить в виде «статистического ряда распределения»:

Х            
0,2 0,3 0,2 0,1 0,1 0,1

Здесь, как для любой дискретной случайной величины, перечислены все возможные значения, принимаемые величиной Х, но вместо вероятностей этих значений во второй строке записаны их относительные частоты . Например, пострадавших деталей нет только в двух ящиках (в первом и девятом) из десяти, поэтому и . Заметим, что вместо относительных частот можно использовать также число , которое показывает, сколько раз данная варианта встречается в выборке; это число называют частотой варианты.

Расположенный в порядке возрастания (или убывания) ряд вариант с соответствующими им частотами или относительными частотами называется вариационным рядом.

Возможен и другой способ описания статистических данных. Пусть мы опять имеем «статистический ряд», но достаточно длинный. Чтобы сделать результаты опыта более обозримыми, весь диапазон наблюденных значений величины разобьем на разряды (интервалы) и подсчитаем частоту попадания значений в соответствующий интервал. Рассмотрим опять наш пример.

Интервал значений Х 0 Х < 2 2 Х 3 3 Х 5
Частота попаданий в интервал 5 (0,5) 2 (0,2) 2 (0,2)

В скобках указаны относительные частоты.

При составлении вариационного ряда по интервалам следует иметь ввиду, что число интервалов следует брать не очень большим, чтобы после группировки ряд не был громоздким, и не очень малым, чтобы не потерять особенности распределения признака. Все интервалы желательно выбирать одинаковой длины, при этом начало интервала включается в него, а конец – нет. Согласно формуле Стерджеса рекомендуемое число интервалов , а величина (ширинаинтервала ) , где – разность между наибольшим и наименьшим значениями признака.

При изучении вариационных рядов наряду с понятием частоты используется понятие накопленной частоты (обозначение ). Накопленная частота показывает, сколько наблюдалось вариантов со значением признака, меньшим . Отношение накопленной частоты к общему числу наблюдений называют накопленной частоты .

Накопленные частоты для каждого интервала находятся последовательным суммированием частот всех предшествующих интервалов, включая данный.

Для графического изображения вариационных рядов используются два вида графиков: полигон частот или относительных частот и гистограмма.

Полигон частот (относительных частот) представляет собой ломаную, отрезки которой соединяют точки с координатами (или координатами ()), где –значения исследуемой случайной величины.

Для рассмотренного выше вариационного ряда полигон относительных частот имеет следующий вид:

 
 


 
 

Полигон частот является аналогом многоугольника распределений дискретной случайной величины.

Гистограммы служат только для изображения интервальных вариационных рядов.

Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат интервалы значений признака, а высоты равны отношению (то есть определяются количеством значений измеряемой величины, попадающих в соответствующий интервал). Площадь i-го прямоугольника равна – сумме частот вариант, попавших в i-й интервал.

Гистограммой относительных частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат интервалы значений признака, а высоты равны отношению . Площадь i-го прямоугольника равна – относительной частоте вариант, попавших в i-й интервал.

 
 

Гистограмма нашего интервального вариационного ряда изображена ниже.

Если соединить середины верхних оснований прямоугольников отрезками, то получится полигон того же распределения.

Еще одним важным понятием служит понятие эмпирической функции распределения.

Эмпирической функцией распределения называется относительная частота того, что признак (случайная величина ) примет значение, меньшее заданного , то есть

.

Согласно этому определению, для данного эмпирическая функция распределения представляет накопленную частость :

.

6.2. Количественные характеристики вариационного ряда

1. Средняя арифметическая вычисляется по формуле

,

где – варианты ряда, – соответствующие им частоты или середины отрезков интервалов интервального вариационного ряда, – число неповторяющихся вариант или число интервалов, .

Для несгруппированного ряда все частоты (), а есть «невзвешенная» средняя арифметическая.

2. С редняя геометрическая .

Эти средние величины называют аналитическими. В статистическом анализе используются также структурные или порядковые средние. Из них наиболее широко используются медиана и мода

3. Медиана это варианта (значение величины, признака), приходящаяся на середину ранжированного ряда наблюдений.

Для дискретного вариационного ряда с нечетным числом членов медиана равна серединной варианте, а для ряда с четным числом членов – полусумме двух серединных вариант.

Достоинство медианы как меры центральной тенденции заключается в том, что на нее не влияет изменение крайних членов вариационного ряда. Медиана предпочтительнее средней арифметической для ряда, у которого крайние варианты по сравнению с остальными оказались чрезмерно большими или малыми.

4. Мода вариационного рядаэто варианта, которой соответствует наибольшая частота.

Особенность моды как меры центральной тенденции состоит в том, что она не изменяется при изменении крайних членов ряда, т. е. обладает определенной устойчивостью к вариации признака.

Средние величины, рассмотренные выше, не отражают изменчивости (вариации) значений признака.

К показателям вариации относятся следующие характеристики.

5. Вариационный размах разность между наибольшей и наименьшей вариантами ряда:

.

6. Среднее линейное отклонение – это средняя арифметическая абсолютных величин отклонений вариант от их средней арифметической:

7. Дисперсия вариационного ряда – это средняя арифметическая квадратов отклонений вариант от их средней арифметической:

.

Дисперсию часто называют эмпирической (или выборочной), подчеркивая, что она находится по опытным или статистическим данным.

8. Среднее квадратическое отклонение – это арифметическое значение корня квадратного из дисперсии:

.

Вычисление средней арифметической и дисперсии можно упростить, если использовать не первоначальные варианты , а новые (обозначим их через ): .

В последней формуле и – специально подобранные постоянные.

Средняя арифметическая вариационного ряда , состоящего из вариант , согласно свойствам средней арифметической, вычисляется по формуле:

.

Обозначим дисперсию этого ряда символом . Тогда из свойств дисперсии случайной величины следует, что (Здесь случайная величина связана со случайной величиной формулой ). Отсюда и .

Заменяя в этих формулах и их выражениями через варианты и упрощая полученные при этом формулы, будем иметь

и .

В этих формулах в качестве постоянной берут ширину интервала по , а в качестве – середину серединного интервала. Если серединных интервалов два (при четном числе интервалов), то в качестве следует взять середину одного из этих интервалов, например, имеющего большую частоту.

Задачи

1. Постройте полигон частот для данных вариационных рядов:

а) ; б) .

2. Постройте полигон относительных частот:

а) ; б) .

3. Постройте гистограмму частот и относительных частот по данному распределению выборки:

a)

Номер интервала Частичный интервал Сумма частот вариант интервала Плотность частоты
  [2, 7]    
  [7, 12]    
  [12, 17]    
  [17, 22]    
  [22, 27]    

b)

Номер интервала Частичный интервал Сумма частот вариант интервала Плотность частоты
  [3, 5]    
  [5, 7]    
  [7, 9]    
  [9, 11]    
  [11,13]    
  [13,15]    
  [15,17]    

с)

Интервал 1< <5 5< <9 9< <13 13< <17 17< <20
         

4. Найдите выборочные средние для данных распределений выборки:

а) ; b) .

5. Найдите выборочную среднюю и выборочную дисперсию для данных выборки:

         
         

6. Дано распределение 50 рабочих механического цеха по тарифному разряду:

Тарифный разряд            
Частота (кол. раб.)              

а) Постройте полигон распределения рабочих по тарифному разряду;

б) Найдите медиану и моду данного распределения рабочих.

в) Найдите выборочную среднюю и выборочную дисперсию для данных выборки:

7. По заданным выборкамрешите следующие подзадачи:

а) составьте вариационный ряд;

б) вычислите относительные частоты (частости) и накопленные частости;

в) постройте полигон и гистограмму вариационного ряда;

г) составьте эмпирическую функцию распределения;

д) постройте график эмпирической функции распределения;

е) найдите числовые характеристики вариационного ряда:

– среднее арифметическое,

– дисперсию,

– среднеквадратическое (стандартное) отклонение,

– моду,

– медиану.

7. 1. 2 4 2 4 3 3 3 2 0 6 1 2 3 2 2 4 3 3 5 1

0 2 4 3 2 2 3 3 1 3 3 3 1 1 2 3 1 4 3 1

7 4 3 4 2 3 2 3 3 1 4 3 1 4 5 3 4 2 4 5

3 6 4 1 3 2 4 1 3 1 0 0 4 6 4 7 4 1 3

. Начало первого интервала – 0. Длина интервалов – 1.

7.2. 0 4 2 0 5 1 1 3 0 2 2 4 3 2 3 3 0 4 5 1

3 1 5 2 0 2 2 3 2 2 2 6 2 1 3 1 3 1 5 4

5 5 3 2 2 0 2 1 1 3 2 3 5 3 5 2 5 2 1 1

2 3 4 3 2 3 2 4 2

. Начало первого интервала – 0. Длина интервалов – 1.

7.3. 3 7 4 6 1 4 2 4 6 5 3 2 9 0 5 6 7 7 3 1

5 5 4 2 6 2 1 5 3 3 1 5 6 4 4 3 4 1 5 5

3 4 3 7 4 5 6 7 5 2 4 6 6 7 7 3 5 4 4 3

5 5 7 6 6 1

. Начало первого интервала – 0. Длина интервалов – 1.





Дата публикования: 2015-01-14; Прочитано: 1312 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.024 с)...