Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Техника построения статистических группировок



После выбора группировочного признака встает вопрос о распределении единиц совокупности по группам. Основным требованием является адекватность такого распределения. Каждая из выделенных групп должна быть качественно однородна. Одновременно малочисленные группы (содержащие менее 5 единиц) не позволяют достичь репрезентативной характеристики всего явления или процесса в целом.

При построении группировки по атрибутивному признаку число групп, как правило, равно количеству типов признака. Необходимой предпосылкой подобной группировки является теоретический анализ состояния изучаемого признака в совокупности. Группировка по количественному признаку подразделяется на два вида.

В основу группировки может быть положен прерывный признак — признак, изменяющийся дискретно, т.е. принимающий только целые значения в пределах определенной совокупности. Количество групп при этом соответствует числу возможных градаций признака. Применение подобного вида группировок ограничено совокупностями, в которых количество возможных дискретных значений невелико. Характерным примером является группировка семей по числу детей.

Основанием группировки может служить и непрерывный признак, т.е. признак, принимающий любые значения в определенной совокупности. Задачей каждой выделенной группы в таком случае становится отражение перехода конкретного количественного изменения в новое качество.

Число групп обычно определяется по правилу: чем выше колеблемость группировочного признака, тем больше групп. Достаточно большое количество групп позволяет точнее воспроизвести специфику исследуемой совокупности. Одновременно необоснованно большое число групп затрудняет выявление единых закономерностей изменения искомой совокупности. В связи с этим в каждом конкретном случае вопрос об окончательном количестве групп должен решаться в зависимости от задач исследования. Однако в качестве ориентира для определения оптимального числа групп может быть использована формулаамериканского ученого Стерджесса

,

где n — число групп; N — число единиц совокупности.

После нахождения оптимального числа групп необходимо определить интервал группировки, т.е. значения группировочного признака, лежащие в определенных пределах. Величину, или шаг, интервала задают его нижняя и верхняя границы. Нижняя граница интервала — это минимальное значение группировочного признака в интервале, верхняя граница — его максимальное значение. Разница между верхней и нижней границами интервала называется шириной интервалаили интервальной разностью.

Если колеблемость группировочного признака невысока, то предпочтительно построение группировки с равными интервалами. Величина или шаг интервала определяется в таком случае по формуле

,

где h — величина (шаг) интервала; — размах вариации; x max, x min — максимальное и минимальное значения признака в совокупности; n — число групп.

В случае присутствия в совокупности аномальных значений признака, т.е. величин, намного больших либо меньших значений других единиц наблюдения, перед определением интервальной разности их следует исключить.

Полученный шаг интервала всегда должен подлежать процедуре округления. Значение величины интервала округляется до десятых долей, если имеется один знак до запятой, до целого числа — при двух знаках до запятой[v]. Трехзначное, четырехзначное и так далее число округляется до ближайшего числа, кратного 50 или 100.

Шаг интервала прибавляется к минимальному значению признака в совокупности, образуя верхнюю границу первого интервала, затем — к нижней границе второго интервала, процедура повторяется до получения максимального значения признака — верхней границы последнего интервала.

Возможно построение открытых и закрытых интервалов. Открытые интервалы это интервалы, у которых указана только одна граница: верхняя — у первого, нижняя — у последнего. Величина открытого интервала приравнивается к величине смежного с ним интервала. У закрытых интервалов указаны обе границы.

Если за основу группировки принят прерывный признак, то верхняя граница первого интервала равна нижней границе второго интервала плюс один.Если в основании группировки лежит непрерывный признак, то верхняя граница первого интервала соответствует нижней границе второго. В таком случае возникает вопрос учета пограничных значений признака. В случае, когда нижняя граница формируется по принципу «включительно», верхняя формируется по принципу «исключительно».

У группировки с открытыми интервалами индикатором правильного отнесения единицы наблюдения в ту или иную группу выступает последний интервал. Так, если заключительный интервал обозначен как «n и более», то пограничное значение учитывается в последнем интервале, при обозначении «более n» — в предпоследнем интервале.

Необходимость использования открытых интервалов обусловлена высокой колеблемостью значений признака в исследуемой совокупности. Однако на практике при анализе многих социально-экономических явлений и процессов построение группировки даже с открытыми интервалами оказывается нецелесообразным в силу значительных размеров вариации признака. В таких случаях прибегают к неравным интервалам. Эти интервалы подразделяются на прогрессивно возрастающие или убывающие в арифметической либо геометрической прогрессии. Их шаг определяется по следующим формулам:

а) при арифметической прогрессии

,

где a — константа (для прогрессивно возрастающих интервалов a > 0, для прогрессивно убывающих a < 0);

б) при геометрической прогрессии

,

где q — константа (для прогрессивно возрастающих интервалов q > 1, для прогрессивно убывающих q < 1; всегда положительное число).

В специальных статистических исследованиях возможно построение неравных интервалов, не изменяющихся ни в арифметической, ни в геометрической прогрессиях. Подобные интервалы называются произвольными.





Дата публикования: 2014-10-20; Прочитано: 1639 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.006 с)...