Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Задание 4. Для построения ряда распределения по объему валового сбора, необходимо определить число групп и величину интервала



Для построения ряда распределения по объему валового сбора, необходимо определить число групп и величину интервала. Для определения количества групп группировки с равными интервалами можно воспользоваться формулой Стерджесса:

n = 1+3,322lg N, (6)

где N – число единиц совокупности.

В нашем случае:

n = 1+3,322lg 35 = 6 групп

Определим величину интервала:

2011 год:

Если определенная верхняя граница последнего интервала будет меньше максимального значения величины признака в совокупности, то это может привести к потере данных. В таком случае последний интервал можно принять открытым. Если значение признака совпадает со значением границы интервала, то обычно его включают в интервал, для которого это значение совпадает с нижней границей.

По каждой группе подсчитаем число регионов, результаты заносим в таблицу 3.

Таблица 3

Распределение субъектов РФ по объему валового сбора

сахарной свеклы за 2011 г.

№ п/п Группы регионов, тыс. тонн
  0-1550       -974,3 24357,1 949232,7 23730816,3
  1550-3100       575,7 2302,9 331446,9 1325787,8
  3100-4650       2125,7 6377,1 4518661,2 13555983,7
  4650-6200       3675,7 3675,7 13510875,5 13510875,5
  6200-7750       5225,7 5225,7 27308089,8 27308089,8
  7750-9300       6775,7 6775,7 45910304,1 45910304,1
Итого     48714,3 92528610,2 125341857,1

За принимаем середину интервала, условно считая, что она будет равна средней по интервалу.

Средняя по вариационному интервальному ряду рассчитывается по средней арифметической взвешенной:

Мода – наиболее часто встречающееся значение признака. Для определения моды в интервальном ряду вначале необходимо определить модальный интервал – интервал с наибольшей частотой, а затем значение модального признака. Из табл. 3 видно, что (0-1550) – модальный интервал. В этом случае моду (МО) рассчитывают по следующей формуле:

, (7)

где – нижняя граница модального интервала;

– величина модального интервала;

– частота модального интервала;

– частота интервала, предшествующая модальному;

– частота интервала, следующего за модальным.

Подставив значения в формулу, получаем:

Медиана – значение признака, которое делит численность ранжированного ряда на две равные части. Для интервального вариационного ряда конкретное значение медианы вычисляется по формуле:

, (8)

где – нижняя граница медианного интервала;

– величина медианного интервала;

– сумма частот ряда;

– накопленная частота интервала, предшествующего медианному;

– частота медианного интервала.

В нашем случае медианный интервал совпал с модальным (0-1550):

Для расчета показателей вариации используем вспомогательную таблицу 3. Для характеристики размера вариации признака используются абсолютные и относительные показатели. К абсолютным показателям вариации относятся:

Размах вариации (размах колебаний признака) определяется как разность между наибольшим (YMAX) и наименьшим (YMIN) значениями вариантов:

Среднее линейное отклонение () и среднее квадратическое отклонение () показывают, на сколько в среднем отличаются индивидуальные значения признака от среднего его значения. Среднее линейное отклонение для сгруппированных данных определяется по формуле:

Дисперсия () и среднее квадратическое отклонение ():

;

=

Квартильное отклонение () применяется вместо размаха вариации, чтобы избежать недостатков, связанных с использование крайних значений:

, (9)

где и – соответственно третья и первая квартили распределения.

Квартиль – это значения признака, которые делят ранжированный ряд на четыре равные части. Первая квартиль – значение соответствует величине признака, который совпадает с 25-тым процентом, вторая квартиль – медиана – 50-тый процент, третья квартиль – 75%, четвертая – 100%. Вычисление квартилей аналогично вычислению медианы. Сначала определяем положение и место квартили:

Затем по накопленным частотам в дискретном ряду определяют численное значение. Для расчета квартилей по интервальному вариационному ряду используют следующие формулы:

, (10)

, (11)

где – нижняя граница интервала, содержащая нижний квартиль;

– нижняя граница интервала, содержащая верхний квартиль;

– величина интервала;

– накопленная частота интервала, предшествующего интервалу, содержащему нижний квартиль;

– накопленная частота интервала, предшествующего интервалу, содержащему верхний квартиль;

– частота интервала, содержащего нижний квартиль;

– частота интервала, содержащего верхний квартиль.

В нашем случае:

первая квартиль находится в интервале (0-1550)

;

третья квартиль находится в интервале (1550-3100)

;

квартильное отклонение:

При сравнении колеблемости различных признаков в одной и той же совокупности или же при сравнении колеблемости одного и того же признака в нескольких совокупностях с различной величиной средней арифметической используются относительные показатели вариации к средней арифметической (или медиане) и чаще всего выражаются в процентах. Наиболее часто с этой целью используют коэффициент вариации:

V=

Коэффициент вариации больше 33%. Таким образом, данная совокупность неоднородна по объему валового сбора.

Выяснение общего характера распределения предполагает оценку степени его однородности, а также исчисление показателя асимметрии. Для сравнительного анализа степени асимметрии рассчитывается относительный показатель асимметрии:

. (12)

Величина показателя асимметрии может быть положительной и отрицательной. Положительная величина данного показателя указывает на наличие правосторонней асимметрии. Отрицательный знак показателя асимметрии говорит о наличии левосторонней асимметрии.

Чем больше абсолютная величина коэффициента, тем больше степень скошенности. Принято считать, что если коэффициент асимметрии меньше 0,25, то асимметрия незначительная, если выше 0,5, то асимметрия значительная.

В нашем случае можно говорить о значительной правосторонней асимметрии, так как значение данного коэффициента приближается к 0,5; её наличие может быть объяснено влиянием различных случайных обстоятельств.

Графически интервальный вариационный ряд может быть представлен в виде гистограммы, полигона, кумуляты. Гистограмма строиться в прямоугольной системе координат. По оси абсцисс откладываются интервалы значений вариационного признака. На отрезках (интервалах) строятся прямоугольники, высота которых соответствует частоте.

На основе построенной гистограммы можно графически определить значение моды. Для этого правую вершину модального прямоугольника соединяют прямой с правым верхним углом предыдущего прямоугольника, а левую вершину модального прямоугольника соединяют с левым верхним углом последующего прямоугольника. Абсцисса точки пересечения этих прямых и будет модой распределения. На рис. 2 эти прямые линии, соединяющие вершины прямоугольников, и перпендикуляр из точки их пересечения показаны пунктирной линией.

На рис. 3 представлена кумулятивная кривая (кумулята). Кумулята может быть использована для графического определения медианы. Для этого последнюю ординату делят пополам. Через полученную точку проводят прямую, параллельную оси Х, до пересечения её с кумулятой. Из точки пересечения опускается перпендикуляр до оси абсцисс. Абсцисса точки пересечения является медианой. Линии, определяющие медиану, на рис. 3 показаны пунктирными линиями.

Рис. 2. Гистограмма распределения регионов РФ

по объему валового сбора сахарной свеклы

Рис. 3. Кумулята распределения регионов РФ

по объему валового сбора сахарной свеклы

Выводы:

1. В результате исследования выявлено, что данная совокупность может рассматриваться как неоднородная, так как значение коэффициента вариации больше 33% и составляет 108,2%.

2. Медианное значение объема валового сбора сахарной свеклы в отчетном году составляет 1085 тыс. тонн, то есть половина регионов России имеет объем меньше 1085 тыс. тонн, а другая половина – больше. Наиболее часто встречающее значение объема валового сбора (модальное) – 842,4 тыс. тонн.

3. Среднее линейное и среднее квадратическое отклонения соответственно равны 1391,8 тыс. тонн и 1892,4 тыс. тонн. Эти величины показывают, насколько индивидуальные значения признака отличаются от среднего его значения. Стандартное отклонение по своей величине всегда превышает значение среднего линейного отклонения в соответствии со свойством мажорантности средних.

4. Четверть регионов России (25%) имеет объем валового сбора сахарной свеклы менее 542,5 тыс. тонн, 25% регионов – свыше 2034,4 тыс. тонн, остальные в пределах 542,5-2034,4 тыс. тонн. Квартильное отклонение, которое определяют вместо размаха вариации, чтобы избежать недостатков, связанных с использование крайних значении, составляет 746 тыс. тонн.

5. Асимметрия правосторонняя, значительная.





Дата публикования: 2014-11-29; Прочитано: 267 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.013 с)...