Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Тема 6. Вариационные ряды распределения и их статистические показатели



Общие положения

Вариационные ряды распределения – это статистические ряды, сгруппированные по количественному признаку.

Вариационный ряды могут быть дискретными и интервальными.

Используемые обозначения в вариационном ряду:

«х» – значение признака;

«n» – количество значений признака x (в дискретном ряду) или число закрытых интервалов (в интервальном ряду);

«х′» – середина интервала;

«хmin» – нижняя граница интервала;

«хmax» – верхняя граница интервала;

«k» – величина интервала;

«f» – частота распространения признака;

«∑» – сумма накопленных частот;

«St»- кумулятивное накопление (распределение) – операция последовательного суммирования частот, начиная с первой и заканчивая каждой данной;

«W» – частность, то есть относительный показатель, характеризующий долю (вес) отдельных значений вариант общей суммы частот ().

Кумулятивное накопление по восходящей – показывает то, какое число единиц, обладает значением признака не более данного.

Кумулятивное накопление по нисходящей - показывает то, какое число единиц, обладает значением признака не менее данного.

При построении вариационного интервального ряда существуют некоторые особенности, связанные с типом интервала.

Разновидности интервальных рядов:

ü интервальный ряд с равными интервалами (например: 25-30, 30-35, 35-40…)

ü интервальный ряд с неравными интервалами (20-25, 25-30, 30-40, 40-50…);

ü интервальный ряд с открытыми (неполными) границами (до 10, свыше 50);

ü интервальный ряд с закрытыми (полными) границами (от 5 – до 10).

Прежде, чем проводить исчисления в интервальном вариационном ряду, имеющем открытые границы, необходимо закрыть границы открытых интервалов: интервал закрывается с ориентацией на последующий (для первого интервала) или предыдущий (для последнего интервала) интервал.

Выделяют 3 основные группы аналитических показателей вариационных рядов распределения:

1. Средние величины – характеризуют общую тенденцию развития явления.

2. Показатели вариации – исследуется степень однородности (гомогенности) или разнородности (гетерогенности) исследуемой совокупности.

3. Показатели корреляционной связи – показатели, выявляющие наличие взаимосвязи между явлениями и степень ее тесноты (интенсивности).

При изучении особенностей статистического ряда распределения используют средние величины, которые характеризуют общую тенденцию проявления признака.

Все средние величины делятся на два класса: степенные (арифметическая, гармоническая, геометрическая, квадратическая) и структурные (мода, медиана). Наиболее часто для анализа используется средняя арифметическая.

Средняя арифметическая в атрибутивном ряду () рассчитывается по формуле средней арифметической простой:

,

где xi – значение i - признака;

f i – частота i - признака

n – количество значений признака x.

Средняя арифметическая в дискретном ряду () рассчитывается по формуле средней арифметической взвешенной:

,

где xi – значение i - признака;

f i – частота i - признака.

Средняя арифметическая в интервальном ряду () рассчитывается по формуле средней арифметической взвешенной:

, ,

где – середина i - интервала;

f i – частота i - интервала;

хmin – нижняя граница интервала;

хmax – верхняя граница интервала.

Кроме того, среднюю арифметическую в интервальном ряду с равными интервалами можно определить способом моментов.

,

, ,

где – середина i - интервала;

f i – частота i - интервала;

k – величина интервала;

а – центр середин интервалов (если четный, то берется с большей частотой);

хmin – нижняя граница интервального ряда;

хmax – верхняя граница интервального ряда.

Структурные средние – применяется для изучения внутреннего строения рядов распределения значений признака, а также для оценки средней величины (степенного типа), если по имеющимся статистическим данным ее расчет не может быть выполнен.

Мода (Мо) – это значение признака х, которое наиболее часто встречается в исследуемой совокупности.

Мода в дискретном ряду – вариант признака х с наибольшей частотой.

Мода в интервальном ряду определяется по формуле:

,

где xМо – нижняя граница модального интервала;

k – величина модального интервала;

fМо – частота модального интервала;

fМо -1 – частота интервала, предшествующего модальному интервалу;

fМо+ 1 – частота интервала, следующего за модальным интервалом.

Медиана (Ме) – это значение признака х, которое находится в середине ранжированного ряда, рассекая совокупность на две равные группы.

Медиана в дискретном ряду определяется в ходе реализации следующих шагов:

1). Определение порядкового номера медианы

NМе = åf / 2 – при нечетной сумме,

NМе = (åf +1) / 2 – при четной сумме,

где åf – сумма частот.

2). Построить кумулятивное накопление – St.

3). Определить, к какому значение признака х относится порядковый номер медианы, соотнеся его с кумулятивным накоплением.

Медиана в интервальном ряду определяется в ходе реализации следующих шагов:

1). Определить медианный интервал

- определить порядковый номер медианы

NМе = åf / 2 – при нечетной сумме,

NМе = (åf +1) / 2 – при четной сумме,

где åf – сумма частот.

- построить кумулятивное накопление – St.

- выбрать тот интервал, в который входит порядковый номер медианы, соотнеся с кумулятивным накоплением.

2). Подставить данные в формулу:

,

где xМе – нижняя граница медианного интервала;

k – величина медианного интервала;

NМе – порядковый номер медианы;

StМе –1 – сумма накопленных частот перед медианным интервалом;

fМе – частота медианного интервала.

В некоторых случаях возникает необходимость определять моду и медиану графически.

Графическое определение моды в дискретном ряду осуществляется в ходе реализации следующих шагов:

1). На основании данных строится полигон распределения (по оси абсцисс помещаются значения признака (x), а по оси ординат – соответствующие им частоты (f)).

2). Опускается перпендикуляр на ось абсцисс из верхней точки графика. Значение абсциссы, соответствующее наибольшей вершине полигона – мода.

Графическое определение моды в интервальном ряду осуществляется в ходе реализации следующих шагов:

1). На основании данных строится гистограмма (на оси абсцисс значения границ интервалов (x), на оси ординат – соответствующие им частоты (f)).

2). Определяется модальный интервал, который будет иметь наибольшую высоту столбца.

3). Внутри модального интервала проводятся пересекающиеся линии, соединяющие вершины модального столбца с прилегающими вершинами соседних столбцов.

4). Из точки пересечения этих линий опускается перпендикуляр на ось абсцисс. Абсцисса точки пересечения будет значением моды.

Графическое определение медианы в дискретном и интервальном ряду осуществляется в ходе реализации следующих шагов:

1). Строится график кумуляты (на оси ординат откладываются накопленные частоты (St), а оси абсцисс – значения признака (x)).

2). Из конечной точки графика опускается перпендикуляр на ость абсцисс.

3). Опущенный перпендикуляр визуально делится пополам и из этой точки опускается перпендикуляр до пересечения с кривой кумуляты.

4). Из точки пересечения перпендикуляра и кривой кумуляты опускается перпендикуляр на ось абсцисс – полученное значение и есть медиана.

Вариацией называется изменчивость значений признака (x) у единиц статистической совокупности.

Показатели вариации – это статистические показатели, характеризующие исследуемую совокупность с точки зрения ее гомогенности или гетерогенности.

Показатели вариации:

1. Размах вариации (R) – представляет собой разность между максимальной и минимальной величиной признака.

R = xmax – xmin,

где xmax – максимальное значение признака;

xmin – минимальное значение признака.

2. Среднее линейное отклонение () – представляет собой среднюю арифметическую величину из абсолютных отклонений значений признака от их средней.

,

где xii- значение показателя ряда;

– среднее арифметическое значение признака;

fi – частота i- признака.

3. Среднее квадратическое отклонение () – представляет собой стандартное отклонение значений признака от их средней.

В дискретном вариационном ряду:

Для несгруппированных данных:

Для сгруппированных данных:

,

где n – число единиц в группе;

xi – значение i- показателя ряда;

– среднее арифметическое значение признака;

fi – частота i- признака.

В интервальном вариационном ряду за x принимают середину интервала х′:

.

4. Дисперсия () – средняя арифметическая величина, полученная из квадратов отклонений значения признака от их средней.

В дискретном вариационном ряду:

Для несгруппированных данных:

,

Для сгруппированных данных:

,

где n – число единиц в группе;

xi – значение i- показателя ряда;

– среднее арифметическое значение признака;

fi – частота i- признака.

В интервальном вариационном ряду за x принимают середину интервала х′:

.

В вариационном ряду с равными интервалами дисперсию можно рассчитать способом моментов:

,

,

где k – величина интервала;

– среднее арифметическое значение признака;

a – центр середин интервалов (если четный, то берется с большей частотой);

– середина i - интервала;

fi – частота i - интервала.

В статистическом исследовании очень часто бывает необходимо не только изучить вариации признака по всей совокупности, но и проследить количественные изменения признака по однородным группам совокупности, а также и между группами. Следовательно, помимо общей средней для всей совокупности необходимо просчитывать и частные средние величины по отдельным группам.

Различают три вида дисперсий:

- общая;

- средняя внутригрупповая;

- межгрупповая.

Общая дисперсия () характеризует вариацию признака всей совокупности под влиянием всех тех факторов, которые обусловили данную вариацию. Эта величина определяется по формуле, которая была рассмотрена выше.

Средняя внутригрупповая дисперсия () свидетельствует о случайной вариации, которая может возникнуть под влиянием каких-либо неучтенных факторов и которая не зависит от признака-фактора, положенного в основу группировки. Данная дисперсия рассчитывается следующим образом: сначала рассчитываются дисперсии по отдельным группам (), затем рассчитывается средняя внутригрупповая дисперсия ():

, ,

где – внутригрупповая дисперсия i- группы;

ni – число единиц в i- группе;

– среднее арифметическое значение признака по i- группе;

fi – частота признака по i- группе.

Межгрупповая дисперсия () (дисперсия групповых средних) характеризует систематическую вариацию, т. е. различия в величине исследуемого признака, возникающие под влиянием признака-фактора, который положен в основу группировки. Эта дисперсия рассчитывается по формуле:

,

где – среднее арифметическое значение признака по i- группе;

– среднее арифметическое значение признака по всем группам (общая);

ni – число единиц в i- группе.

Все три вида дисперсии связаны между собой: общая дисперсия равна сумме средней внутригрупповой дисперсии и межгрупповой дисперсии:

.

Данное соотношение отражает закон, который называют правилом сложения дисперсий.

Правило сложения дисперсий применяется в аналитических группировках и позволяет проследить наличие или отсутствие связи между двумя признаками.

Отношение межгрупповой дисперсии к общей называется коэффициентом детерминации ().

,

где – межгрупповая дисперсия;

– общая дисперсия.

Квадратный корень из коэффициента детерминации – эмпирическое корреляционное отношение ().

,

По значению эмпирического корреляционного отношения судят о тесноте связи между признаками. Обычно придерживаются следующей шкалы[5]:

h £ 0,3 – связь слабая;

0,3 < h £ 0,5 – связь заметная;

0,5 < h £ 0,7 – связь умеренно тесная;

0,7 < h £ 0,9 – связь тесная;

h > 0,9 – связь очень тесная.

К относительным показателям вариации относят коэффициент осцилляции (), относительное линейное отклонение (), коэффициент вариации ().

Относительные показатели вариации применяются для сравнения величины колебаний различных признаков одной и той же совокупности или для сравнения величины колебаний одного и того же признака в нескольких совокупностях.

Коэффициент осцилляции () – отношение размаха вариации к средней величине признака и отражает относительную величину колебаний крайних значений признака вокруг средней.

,

где R – размах вариации;

– среднее арифметическое значение признака.

Чем больше коэффициент приближен к нулю, тем меньше вариация значений признака.

Относительное линейное отклонение () – отношение среднего линейного отклонения к средней величине признака и характеризует долю усредненного значения признака абсолютных отклонений от средней величины.

,

где – размах вариации;

– среднее арифметическое значение признака.

Чем больше коэффициент приближен к нулю, тем меньше вариация значений признака.

Коэффициент вариации () – отношение среднего квадратического отклонения к средней величине признака и используется для оценки типичности средних величин.

,

где – среднее квадратическое отклонение;

– среднее значение признака.

Совокупность считается:

- однородной, если коэффициент вариации не превышает 10%;

- достаточно однородной, если коэффициент вариации 10-20%;

- достаточно разнородной, если коэффициент вариации 20-33%;

- разнородной, если коэффициент вариации свыше 33%.

Вопросы для обсуждения

1. Что такое вариационные ряды распределения и для чего их строят?

2. Что такое степенные средние показатели вариационного ряда и для чего их рассчитывают? Назвать степенные средние.

3. Что такое структурные средние показатели вариационного ряда и для чего их рассчитывают? Назвать структурные средние.

4. В каких случаях используют графическое определение структурных средних?

5. Что такое показатели вариации и для чего они вычисляются?

6. Что такое относительные показатели вариации и какова их область применения?





Дата публикования: 2015-01-09; Прочитано: 4949 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.024 с)...