Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Этапы построения статистической группировки



Построение статистических группировок осуществляется по сле­дующим этапам:

1. Выбор группировочного признака.

2. Определение числа групп.

3. Расчет ширины интервала группировки.

4. Определение признаков, которые в комбинации друг с другом будут характеризовать каждую выделенную группу.

Построение группировки начинается с определения группировочного признака. Группировочным называется признак, по которому осуществляется разбиение единиц совокупности на отдельные группы. В качестве группировочного могут выступать как количественные, так и качественные признаки (альтернативные, атрибутивные или порядковые).

Следующим этапом построения статистической группировки яв­ляется определение числа групп, на которые небходимо разбить исследуемую совокупность единиц наблюдения.

Число групп зависит от:

- задач статистического исследования;

- вида показателя, положенного в основание группировки;

- объема изучаемой совокупности;

- степени вариации признака.

При решении задачи выбора числа групп очень важно учитывать вид показателя, по которому осуществляется разбиение единиц совокупности на группы, особенно если в качестве группировочных признаков выступают качественные признаки. Так, например, группировка учащихся группы по успеваемости по предмету учитывает только две градации: «успевает» и «не успевает».

В случае построения группировки единиц совокупности по количественному признаку особое внимание необходимо обратить на объем изучаемой совокупности и степень вариации признака, положенного в основание группировки. При небольшом объеме совокупности не следует образовывать большого количества групп, так как группы будут включать недостаточное число единиц объекта. Показатели, рассчитанные для таких групп, не будут представительными.

Если статистическая группировка по количественному признаку имеет задачу отразить распределение единиц совокупности по этому признаку, то количество групп, в этом случае, зависит от степени вариации группировочного признака. При этом можно предположить следующее: чем больше изменяемость значений признака, тем больше можно образовать групп. Поэтому при определении числа групп необходимо принять во внимание размах вариации признака (К), который определяется по следующей формуле:

(1)

Чем больше размах вариации признака, положенного в основание группировки, тем, как правило, может быть образовано большее число групп. При этом может возникнуть проблема образования пустых групп, т. е. групп, не содержащих ни одной единицы наблюдения. Кроме того слишком большое число групп затрудняет выявление закономерностей при исследовании социально-экономических явле­ний и процессов. Поэтому в каждом конкретном случае при определении числа групп следует исходить не только из степени вариации признака, но и из особенностей объекта и показателей, его характеризующих, а также цели исследования.

Определение числа групп можно осуществить несколькими спо­собами. Формально-математический способ предполагает использо­вание формулы Стерджесса

(2)

где к — число групп;

n — число единиц совокупности.

Согласно этой формуле выбор числа групп зависит только от объема изучаемой совокупности.

Число групп также может быть определено с использованием среднего квадратического отклонения. При этом существует следующая примерная зависимость между числом групп и значением среднего квадратического отклонения:

- если величина интервала равна 0,5а, то совокупность разбива­ется на 12 групп;

- если величина интервала равна 2/з s (т, то совокупность делится на 9 групп; «

- если величина интервала равна s, то совокупность делится на 6 групп.

- Недостатком применения данного метода определения числа групп является наличие достаточно большой вероятности получения «пустых» или малочисленных групп, которые будут недостаточно ти­пичными для изучаемой совокупности в целом.

Важным этапом построения статистической группировки является определение интервалов статистической группировки.

Интервал — это значения варьирующего признака, лежащие в определенных границах. Каждый интервал имеет верхнюю и нижнюю границы или одну из них. Нижней границей интервала называется наименьшее значение признака в интервале. Верхней границей интервала называется наибольшее значение признака в интервале. Величина интервала представляет собой разность между верхней и нижней границами интервала.

В зависимости от величины интервалы группировки бывают:

- равные;

- неравные.

В свою очередь неравные интервалы подразделяются на:

- прогрессивно — возрастающие;

- прогрессивно — убывающие;

- произвольные;

- специализированные.

В зависимости от наличия границ интервалы группировки бывают:

- открытые;

- закрытые.

Равные интервалы применяются в случае, если изменение количественного признака внутри изучаемой совокупности происходит равномерно и его вариация проявляется в сравнительно узких границах.

Ширина равного интервала определяется по следующей формуле:

(3)

где - максимальное и минимальное значения признака в совокупности;

к — число групп.

Если максимальные или минимальные значения сильно отличаются от смежных с, ними значений вариантов в упорядоченном ряду значений группировочного признака, то для определения величины интервала следует использовать не максимальное или минимальное значения, а значения, несколько превышающие минимум, и несколько меньшие, чем максимум.

Полученную по формуле 3 величину округляют и она будет яв­ляться шириной интервала.

Существуют следующие правила определения ширины интервала:

- Если величина интервала, рассчитанная по формуле 3 представляет собой величину, которая имеет один знак до запятой (например: 0,58; 1,582; 3,91), то округление целесообразно производить до десятых и полученное значение использовать в качестве ширины интервала (0,6; 1,6; 3,9).

- Если величина интервала имеет две значащие цифры до запя­той и несколько после запятой (например 16,234), то это значе­ние необходимо округлить до целого числа (до 16).

- В случае, когда рассчитанная величина интервала представляет собой трехзначное, четырехзначное и т. д. число, то эту величи­ну следует округлить до ближайшего числа, кратного 100 или 50. Например, 662 следует округлить до 650 или до 700.

- Если размах вариации признака в совокупности велик и значе­ния признака варьируют неравномерно, то надо использовать группировку с неравными интервалами.

Неравные интервалы могут быть прогрессивно возрастающие или прогрессивно убывающие в арифметической или геометрической прогрессии. Величина интервалов, изменяющихся в арифметической прогрессии определяется следующим образом:

(4)

а в геометрической прогрессии

(5)

где а — константа: для прогрессивно-возрастающих интервалов имеет знак «+», а при прогрессивно-убывающих – знак «—».

q — константа: для прогрессивно-возрастающих — больше «1»; для прогрессивно-убывающих – меньше «1».

Применение неравных интервалов обусловлено тем, что в первых группах небольшая разница в показателях имеет большое значение, а в последних группах эта разница несущественна. Например, при по­строении группировки строительных компаний города по показателю численности работающих, который варьирует от 600 чел. до 3500 чел., нецелесообразно рассматривать равные интервалы, т. к. учитываются как небольшие, так и крупные строительные фирмы города. Поэтому следует образовывать неравные интервалы, например: 600—1200, 1200—2400, 2400—4200, т. е. величина каждого последую­щего интервала больше предыдущего на 600 чел. и увеличивается в арифметической прогрессии. Если величина интервала существенна и содержит большое число единиц совокупности, то эти интервалы необходимо дробить, а в противном случае — объединять.

Закрытыми называются интервалы, у которых имеются и верхняя, и нижняя границы.

Открытыми называются интервалы, у которых указана только одна граница: как правило, верхняя – у первого интервала и нижняя — у последнего. Например, группы инвестиционных компаний по числу работающих в них сотрудников (чел.): до 100, 100—150, 150—200, 200 и более. Применение открытых интервалов целесообразно в тех случаях, когда в совокупности встречается незначительное число единиц наблюдения с очень малыми или очень большими значения­ми вариантов, которые в несколько раз отличаются от всех остальных значений изучаемого признака.

При группировке единиц совокупности по количественному признаку обозначение границ интервалов зависит от того, непрерывный или дискретный признак положен в основание группировки.

Если основанием группировки служит непрерывный признак (например, группы сотрудников страховых компаний по уровню до­хода (тыс. руб.): 10—15,15—20, 20—25, 25—30), то одно и то же значе­ние признака выступает и верхней и нижней границами двух смеж­ных интервалов. В данном случае доход 15 тыс. руб. составляет верх­нюю границу первого интервала и нижнюю границу второго, 20 тыс. руб. — соответственно второго и третьего и т. д., т. е. верхняя граница /'-го интервала равна нижней границе (/ + 1)-го интервала.

При таком обозначении границ может возникнуть вопрос, в ка­кую группу включать единицы наблюдения, значения признака у ко­торых совпадают с границами интервалов. Например, во вторую или третью группу должен войти сотруднике уровнем дохода 20 тыс. руб.? Если верхняя граница формируется по принципу «исключительно», то сотрудник должен быть отнесен к третьей группе, в противном случае – ко второй. Для того, чтобы правильно отнести к той или иной группе единицу совокупности, значение признака которой совпадает с границами интервалов, можно использовать открытые интервалы (по нашему примеру группы сотрудников страховых компаний по уровню дохода (тыс. руб.) преобразуются в следующие: до 15, 15—20, 20—25, 25 и более). В данном случае, вопрос отнесения отдельных единиц совокупности, значения которых являются граничными, к той или иной группе решается на основе анализа последнего открытого интервала. Возможны два случая обозначения последнего открытого интервала: 1) 25 тыс. руб. и более; 2) более 25 тыс. руб. В пер­вом случае, сотрудники страховых компаний с уровнем дохода 20 тыс. руб. попадут в четвертую группу; во втором случае — в третью группу. И данный подход будет распространен на все предшествующие группы.

Если в основании группировки лежит дискретный признак, то нижняя граница /-го интервала равна верхней границе /-1-го интерва­ла, увеличенной на 1. Например, группы коммерческих банков по

численности работающих (чел.) будут иметь вид: 100—160, 161—220, 221-280.

Если изменение количественного признака приводит к появлению нового качества, то граница интервала устанавливается там, где происходит переход от одного качества к другому. Строя такую группировку, следует дифференцированно устанавливать границы интервалов для разных отраслей экономики. Это достигается путем использования группировок со специализированными интервалами. Специализированными называются интервалы, которые применяются для выделения из совокупности одних и тех же типов по одному и тому же признаку для явлений, находящихся в различных условиях.

При изучении социально-экономических явлений на макроуровне часто применяют группировки, интервалы которых не будут ни прогрессивно возрастающими, ни прогрессивно убывающими. Такие интервалы называются произвольными и, как правило, используются при группировке предприятий различных отраслей промышленности.





Дата публикования: 2015-10-09; Прочитано: 532 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.007 с)...