Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Правило сложения дисперсий.Если данные представлены в виде аналитической группировки, то можно вычислить дис­персию общую, межгрупповую и внутригрупповую



Общая дисперсия измеряет вариацию признака во всей со­вокупности под влиянием всех факторов, обусловливающих эту вариацию:

Межгрупповая дисперсия характеризует систематическую вариацию, т.е. различия в величине изучаемого признака, возни­кающие под влиянием признака-фактора, положенного в основа­ние группировки. Она рассчитывается по формуле:

,

где хi и ni – соответственно средние и численности по отдельным группам

Внутригрупповая дисперсия отражает случайную вариацию, т.е. часть вариации, происходящую под влиянием неучтенных факторов и не зависящую от признака-фактора, положенного в основание группировки. Она исчисляется следующим образом:

Средняя из внутригрупповых дисперсий

.

Существует закон, связывающий три вида дисперсий. Общая дисперсия равна сумме средней из внутригрупповых и межгруп­повых дисперсий:

.

Данное соотношение называют правилом сложения диспер­сий. Согласно этому правилу общая дисперсия, возникающая под влиянием всех факторов, равна сумме дисперсий, возникающих под влиянием всех прочих факторов, и дисперсии, возникающей за счет группировочного признака.

Зная любые два вида дисперсий, можно определить или про­верить правильность расчета третьего вида.

Пример. Определим групповые дисперсии, среднюю из груп­повых дисперсий, межгрупповую дисперсию, общую дисперсию по данным табл. 7.4.

Таблица 7.4

Производительность труда двух бригад рабочих-токарей

1-я бригада 2-я бригада
№ п/п   Изготовлено деталей за час, шт. хi № п/п   Изготовлено деталей за час, шт. хi
    -2       -3  
    -1       -2  
               
            -1  
               
               
           

Решение. Для расчета групповых дисперсий вычислим сред­ние по каждой группе:

Промежуточные расчеты дисперсий по группам представле­ны в табл. 7.4. Подставив полученные значения в формулу, по­лучим:

;

.

Средняя из групповых дисперсий

Затем рассчитаем межгрупповую дисперсию. Для этого предварительно определим общую среднюю как среднюю взвешен­ную из групповых средних:

Теперь определим межгрупповую дисперсию:

Таким образом, общая дисперсия по правилу сложения дис­персий

.

Проверим полученный результат, исчислив общую дисперсию обычным способом:

На основании правила сложения дисперсий можно опреде­лить показатель тесноты связи между группировочным (фактор­ным) и результативным признаками. Он называется эмпиричес­ким корреляционным отношением, обозначается η («эта») и рассчитывается по формуле . Для нашего примера эмпирическое корреляционное отношение .

Величина 0,86 характеризует существенную связь между группировочным и результативным признаками.

Наряду с вариацией индивидуальных значений признака вок­руг средней может наблюдаться и вариация индивидуальных долей признака вокруг средней доли. Такое изучение вариа­ции достигается посредством вычисления и анализа следующих видов дисперсий.

Внутригрупповая дисперсия доли определяется по формуле

.

Средняя из внутригрупповых дисперсий

Формула межгрупповой дисперсии имеет вид:

где ni – численность единиц в отдельных группах;

р – доля изучаемого признака во всей совокупности, которая определяет­ся по формуле

Общая дисперсия имеет вид:

Три вида дисперсии связаны между собой следующим образом:

Данное соотношение дисперсий называется теоремой сложе­ния дисперсии доли признака. Эта теорема широко используется в изучении колеблемости качественных признаков.

Пример. Определим групповые дисперсии, среднюю из груп­повых, межгрупповую и общую дисперсии по данным табл. 7.5.

Таблица 7.5

Численность и удельный вес одной из категорий крупного рогатого скота фермерских хозяйств района

Хозяйство   Удельный вес дойных коров, % pi Всего коров ni
     
     
     
Итого    

Решение. Определим долю дойных коров в целом по трем хозяйствам:

Общая дисперсия доли дойных коров:

Внутригрупповые дисперсии:

Средняя из внутригрупповых дисперсий:

Межгрупповая дисперсия:

Используя правило сложения дисперсий, получаем: 0,1025 + 0,0031 = 0,1056. Пример решен правильно.

Выяснение общего характера распределения предполагает не только оценку степени его однородности, но и оценку его симметричности, остро- или плосковершинности. Симметричным называется распределение, в котором частоты любых двух вариантов, равноотстоящих в обе стороны от центра распределения, равны между собой. В статистике для характеристики асиммет­рии пользуются несколькими показателями.

Показатели асимметрии и эксцесса. Степень асимметрии может быть определена с помощью коэффициента асимметрии:

,

где – средняя арифметическая ряда распределения,

Мо – мода;

σ – среднее квадратическое отклонение

При симметричном (нормальном) распределении = Мо, следовательно, коэффициент асимметрии равен нулю. Если As > 0, то больше моды, следовательно, имеется правосторонняя асиммет­рия.

Если As < 0, то меньше моды, следовательно, имеется ле­восторонняя асимметрия. Коэффициент асимметрии может из­меняться от -3 до +3.

В практических расчетах часто в качестве показателя асим­метрии применяется отношение центрального момента третьего порядка к среднему квадратическому отклонению данного ряда в кубе, т.е. .

Это дает возможность определить не только величину асим­метрии, но и проверить наличие асимметрии в генеральной сово­купности. Принято считать, что асимметрия выше 0,5 (независи­мо от знака) считается значительной. Асимметрия меньше 0,25 – незначительная.

Пример. Рассчитаем коэффициент асимметрии по дан­ным о распределении фирм по стоимости основных фондов (табл. 7.6).

Таблица 7.6

Расчет коэффициента асимметрии

Группы фирм по стоимости основных фондов, млн. руб. х Количество фирм fi     Середина интервала xi k = 0,5 x’fi (x’)2fi (x’)3fi (x’)4fi
0,5-1,0   0,75 -2 -40   -160  
1,0-1,5   1,25 -1 -40   -40  
1,5-2,0   1,75          
2,0-2,5   2,25          
Итого   - - -60   -180  

Решение. Определяем условные моменты m1, m2 и m3, а так­же центральные моменты μ2 и μ3, необходимые для вычисления коэффициента асимметрии:

Коэффициент асимметрии для данного ряда

Полученный результат свидетельствует о наличии незначи­тельной правосторонней асимметрии.

Для симметричных распределений может быть также рассчи­тан показатель эксцесса:

.

При симметричном распределении Ek = 0. Если Ek > 0, рас­пределение является островершинным; если Ek < 0 - плосковер­шинным.

Вычислим Ek по данным табл. 7.6, определив вначале вели­чину четвертого центрального момента: . Тогда . Таким образом, исследуемое распределе­ние является островершинным.

Оценка существенности показателей асимметрии и эксцесса позволяет сделать вывод о том, можно ли отнести данное эмпи­рическое распределение к типу нормального распределения.

Построение нормального распределения по эмпирическим данным.Имея дело с эмпирическим распределением, можно предположить, что данному распределению соответствует опре­деленная, характерная для него теоретическая кривая. Выдвинув гипотезу о той или иной форме распределения, стремятся опи­сать эмпирический ряд с помощью математической модели, выражающей некоторый теоретический закон распределения. Среди различных кривых распределения особое место занимает нормальное распределение.

Нормальное распределение чаще всего выражается следую­щей стандартизованной кривой нормального распределения:

,

где уt – ордината кривой нормального распределения;

– стандартизованная (нормированная) величина;

е и π – математические постоянные:

хi – значения изучаемого признака,

– средняя арифметическая ряда,

σ – среднее квадратическое отклонение изучаемого признака.

Как видно из уравнения, два параметра – средняя арифмети­ческая () и среднее квадратическое отклонение (σ) - определя­ют черты симметричной кривой нормального распределения. В зависимости от их значения она может иметь разный центр груп­пирования, быть более удлиненной или сжатой.

Пример. Рассчитаем значения частот теоретического ряда распределения на основании эмпирических данных об урожай­ности зерна в 500 фермерских хозяйствах, представленных в табл. 7.7.

Таблица 7.7

Расчет теоретических частот нормального распределения

Урожай­ность, ц/га Сере­дина интер- вала xi Кол-во хоз-в fi xifi Теоретические частоты
А                  
До 38,25 38,0   76,0     -3 -3 0,004  
38,25-38,75 38,5   115,0     -2,5 -2,5 0,017  
38,75-39,25 39,0   390,0     -2,0 -2,0 0,054  

Продолжение таблицы 7.7

А                  
39,25-39,75 39,5   1224,5     -1,5 - 1,5 0,130  
39,75-40,25 40,0   2880,0     -1,0 -1,0 0,242  
40,25-40,75 40,5   3442,5     -0,5 -0,5 0,352  
40,75-41,25, 41,0   3854,0         0,399  
41,25-41,75 41,5   3652,0     0,5 0,5 0,352  
41,75-42,25 42,0   2604,0     1,0 1,0 0,242  
42,25-42,75 42,5   1572,5     1,5 1,5 0,130  
42,75-43,25 43,0   516,0     2,0 2,0 0,054  
43,25-43,75 43,5   130,5     2,5 2,5 0,017  
Свыше 43,75 44,0   44,0     3,0 3,0 0,004  
Итого -   20501,5 -       -  

Для данного эмпирического распределения находим сначала значения = 41 ц/га и σ = 1,0 (они рассчитаны обычным спосо­бом и не воспроизведены в табл. 7.7).

Затем находим отклонения хi (табл. 7.7 гр. 6) и стандар­тизованные отклонения (табл. 7.7 гр. 7) для данного варианта. Значения же теоретической частоты для нее исчисляются по известной уже формуле: .

Так как величина остается одной и той же для всего распределения с равными интервалами, в частности в нашем примере , то достаточно ее найти один раз и умножить на величину φ(t) при данном t, тогда получим искомую теоретическую частоту (табл. 7.7 гр. 9).

Критерии согласия. Количественная характеристика соответ­ствия может быть получена с помощью особых статистических показателей-критериев согласия. Известны критерии согласия К. Пирсона (хи-квадрат), В.И. Романовского, Б.С. Ястремского и А.Н. Колмогорова.

Критерий согласия Пирсона2) вычисляется по формуле

,

где fЭ и fT – эмпирические и теоретические частоты соответственно.

С помощью величины χ2 по специальным таблицам прило­жения определяется вероятность Р (χ2). Входами в таблицу явля­ются значения χ2 и число степеней свободы γ = n – 1. На основе Р выносится суждение о существенности расхождения между эм­пирическим и теоретическим распределениями. При Р > 0,5 счи­тается, что эмпирическое и теоретическое распределения близ­ки. При РÎ(0,2; 0,5) совпадение между ними удовлетворитель­ное, в остальных случаях недостаточное.

Критерий Романовского (С), также используемый для про­верки близости эмпирического и теоретического распределений, определяется следующим образом:

,

где χ2 – критерий Пирсона:

γ – число степеней свободы.

При С < 3 различие несущественно, что позволяет считать эмпирическое распределение близким к нормальному.

Критерий Ястремского (L) может быть найден на основе следующего соотношения:

,

где N – объем совокупности:

pq – дисперсия альтернативного признака;

k – число вариантов или групп;

Q – принимает значение 0,6, при числе вариантов или групп от 8 до 20.

Если L < 3, то эмпирическое распределение соответствует теоретическому.

Критерий Колмогорова (λ) вычисляется по формуле

,

где D – максимальное значение разности между накопленными эмпиричес­кими и теоретическими частотами;

Σf – сумма эмпирических частот.

Необходимым условием использования этого критерия явля­ется достаточно большее число наблюдений (не меньше ста).

Пример. Рассчитаем критерии Колмогорова и Пирсона по данным табл. 7.8.

Таблица 7.8

Расчет критерия Колмогорова по данным об урожайности зерновых

в 500 фермерских хозяйствах

Урожайность, ц/га xi   Частоты ряда распределения Накопленные частоты |fЭ – fT|
эмпирические fЭ теоретические fT эмпирические fЭ теоретические fT
До 38,25          
38,25-38,75          
38,75-39,25          
39,25-39,75          
39,75-40,25          
40,25-40,75          
40,75-41,25          
41,25-41,75          
41,75-42,25          
42,25-42,75          
42,75-43,25          
43,25-43,75          
Свыше 43,75          
Итого     - -

Как видно из табл. 7.8, максимальное значение разности между эмпирическими и теоретическими частотами составляет 7, т.е. D=7.

Следовательно, в нашем примере величина критерия Колмо­горова

.

По таблицам вероятностей Р (λ) определяем, что λ = 0,31 соответствует Р(х), близкая к 1,00. Это означает, что с вероятно­стью, близкой к 1, можно утверждать, что отклонения фактичес­ких частот от теоретических в нашем примере являются случай­ными. Следовательно, можно считать, что в основе фактического распределения фермерских хозяйств по урожайности лежит нормальное распределение.

Этот же вывод подтверждается расчетом χ2-критерия Пирсо­на (табл. 7.9).

Таблица 7.9

Расчет критерия Пирсона по данным об урожайности зерновых

в 500 фермерских хозяйствах

Урожайность, ц/ га хi   Частоты распределения ряда fЭ – fТ    
эмпирические fЭ теоретические fТ
До 38,25 2 1    
         
38,25-38,75        
38,75-39,25       1,70
39,25-39,75       0,03
39,75-40,25       2,00
40,25-40,75       0,05
40,75-41,25       0,16
41,25-41,75       0,01
41,75-42,25       0,02
42,25-42,75       0,78
42,75-43,25       0,10
43,25-43,75 3 4   0,20
         
Свыше 43,75        
Итого     - 5,05

Из данных табл. 7.9 видно, что χ2 = 5,05. По таблицам веро­ятностей Р(χ2) = 0,9834. Таким образом, эмпирическое и теоре­тическое распределения близки.

Критерий Романовского . Следовательно, теоретическое распределение эмпирического ряда удов­летворительное.

Для характеристики структуры вариационных рядов приме­няются показатели особого рода, которые можно назвать струк­турными средними.





Дата публикования: 2015-01-09; Прочитано: 1290 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.02 с)...