Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

И ОСОБЕННОСТИ РАСЧЕТа



Дисперсия обладает рядом математических свойств. Их использование значительно упрощает и облегчает её вычисление. Рассмотрим основные свойства дисперсии.

1. Величина дисперсии не зависит от начала отсчета признака, т.е. все индивидуальные значения Х можно увеличить (или уменьшить) на одно и то же число А. Это свойство формулируется так:

е сли все значения признака уменьшить или увеличить на какое-либо постоянное число а, то дисперсия от этого не изменится.

Это свойство легко доказывается с учётом того, что при увеличении (уменьшении) значений признака Х аналогично изменяется и показатель его среднего уровня.

Следовательно, дисперсию можно исчислить не только по вариантам, но и по их отклонениям от какого-то постоянного числа а.

2. Числовое значение дисперсии зависит от масштаба измерения признака Х. При увеличении (уменьшении) всех значений признака в С раз показатель дисперсии нового (измененного) признака будет больше (меньше) дисперсии значений прежнего признака в Р раз.

Если все значения признака уменьшить или увеличить в К раз, то дисперсия от этого изменится К2 раз.

Это свойство также доказывается достаточно легко, если в формуле расчета дисперсии вместо величины Х применить величину С·Х.

Следовательно, при исчислении дисперсии можно все значения признака уменьшить в К раз, исчислить дисперсию, а затем умножить её на это постоянное число в квадрате (К2).

3. Сумма квадратов отклонений индивидуальных значений признака от их средней меньше суммы квадратов отклонений индивидуальных значений признака от любого данного числа, а при условии, что а :

< .

Это свойство даёт возможность упрощать расчёты среднего квадратического отклонения путём замены громоздких вычислений реальных отклонений индивидуальных значений признака от средней вычислением отклонений от любого произвольно взятого числа, удобного для проведения расчётов с последующей поправкой.

4. Дисперсия признака равна разности между средним квадратом значений признака и квадратом их средней, т.е.

σ2 = .

5. Если дисперсия признака оценивается по небольшому числу наблюдений, взятых из достаточно большой или неограниченной генеральной совокупности, то даже при совпадении среднего значения признака по генеральной и выборочной совокупностям дисперсия признака в генеральной совокупности будет отличаться от дисперсии признака в выборочной совокупности.

При небольшом объеме выборочной совокупности расчетная величина дисперсии оказывается чаще смещенной в меньшую сторону по сравнению с генеральной дисперсией. Это объясняется тем, что в выборку вероятней всего не попадут наблюдения (или их будет недостаточно) с уровнями, значительно отличающимися от средней величины.

Рассмотрим вычисление дисперсии с применением её свойств.

▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼

 
 
  │►7. Допустим, что генеральная совокупность включает 10 объектов с уровнями некоторого признака: 100, 90, 80, 70, 60, 50, 40, 30, 20, 10. Среднее значение признака в генеральной совокупности равно (100 + 90 + 80 + 70 + 60 + 50 + 40 + 30 + 20 + 10) / 10 = 55. Выберем случайным образом 4 объекта и рассчитаем соответствующее среднее значение (90 + 60 + 50 + 20) / 4 = 55. Дисперсия признака для генеральной совокупности (генеральная дисперсия) равна (1002 + 902 + 802 + 702 +602 +502 + 402 + 302 + 202 + 102)/ 10 – 52= =825. Дисперсия признака по данным выборки равна (902 + 602 + 502 + 202) / 4 – 552 = 625. Разница в значениях достаточно велика, оценки получились смещёнными, что обусловлено небольшим объёмом совокупности и малой выборкой. Для этого случая существуют определённые рекомендации, приведенные ниже. ◄


▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲

Для получения несмещенной оценки дисперсию, полученную по результатам выборки и приведенным формулам, умножают на величину n / (n – 1), где n – объем выборочной совокупности. В итоге при малом числе наблюдений (менее 30) дисперсию признака (выборочную дисперсию) рекомендуется вычислять по формуле

σ2выб = . (12)

Выборочная дисперсия применяется как оценка дисперсии признака в генеральной совокупности.

Для нашего примера (7) несмещенной оценкой дисперсии будет

σ 2 = 625 · 4/3 = 833,3, что гораздо ближе к генеральной дисперсии.

Обычно уже при выборках объемом n > 15 – 20 расхождение смещенной и несмещенной оценок становится несущественным.

Надо учитывать и тот факт, что смещение дисперсии при небольшом объеме отдельной выборки наблюдается лишь в тенденции, т.е. при достаточно большом числе выборочных обследований среднее значение дисперсий, определяемых в этих выборках по общим формулам, смещается в меньшую сторону. Вводить ли поправку на смещённость для отдельного конкретного выборочного исследования, даже и небольшого по объему, – предмет специального исследования.

6. Если единицы наблюдения статистически независимы, то для одного и того же признака дисперсия его суммарной величины равна сумме дисперсий признака в отдельных наблюдаемых единицах. Поясним это свойство на примере.

▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼

 
 
│►8. Допустим, в результате выборочного обследования было установлено, что средняя урожайность зерновых культур ожидается на уровне 20 ц/га, а дисперсия показателя урожайности равна 22,5 (ц)2, т.е. среднее квадратическое отклонение урожайности оценивается величиной 4,743 ц. Тогда при 2000 га посевной площади общий сбор зерновых ожидается на уровне 20 · 2000 = 40000 ц. Для этого ожидаемого сбора величина дисперсии определится как 22,5 · 2000 = 45 000 (ц)2. Среднее квадратическое отклонение для показателя сбора зерновых культур составит = 212 ц. Так, можно сделать вывод, что фактическая величина общего сбора с вероятностью 0,997 ожидается в интервале от (40 000 – 3·212) = 39 364 до (40 000 + 3·212) = 40 636 ц. Для большей надежности можно принять доверительную вероятность Р на уровне 0,9995. Коэффициент доверия в этом случае будет равен 3,5. Валовой сбор зерна ожидается в интервале от (40 000 – 3,5·212) = 39 258 до (40 000 + 3,5·212) = 40 742 ц. ◄


▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲

Для рассмотренного примера (4) о заработной плате рабочих одной бригады такой способ оценки возможной суммы общего заработка будет неверен, так как в одной бригаде заработки рабочих взаимно зависимы. В этих ситуациях суммирование дисперсий применяют с поправкой на ковариацию (учет согласованности вариации признака у разных объектов).

7. Если первичные данные об уровне изучаемого показателя на отдельных объектах перевести в так называемую стандартизованную форму Z, т.е. вычесть из каждого уровня среднее значение и полученную разность разделить на величину среднего квадратического отклонения

Z = ,

то дисперсия стандартизованных уровней Z будет равна единице, а среднее значение равно нулю.

По стандартизованным данным отчетливо видно, на какое количество собственных средних квадратических отклонений (σ) конкретное значение признака отличается от своего среднего уровня. Таким образом, процедура стандартизации – это переход к другой единице измерения.

Для стандартизованных данных не существует относительных показателей вариации.

Рассмотрим более подробно особенности оценки вариации показателем дисперсии.

Существует способ упрощённого исчисления дисперсии - метод моментов (или способ отсчёта от условного нуля).

Этот способ основан на использовании следующего свойства: дисперсия равна среднему квадратическому отклонению от произвольной величины за вычетом квадрата отклонения средней арифметической от той же величины .

. (13)

Из этого свойства вытекает следующая теорема:

Средняя арифметическая квадратов отклонений вариант от любой постоянной принимает наименьшее значение, равное дисперсии, когда = .

Если в выражении (13) принять = 0 (т.е. оценивать вариацию относительно нулевой точки), то получаем формулу дисперсии, известную под названием формулы метода моментов:

σ2 = . (14)

Здесь

– среднее значение квадратов признака или начальный момент первого порядка (квадрат момента первого порядка);

– среднее значение признака или начальный момент второго порядка.

Величину называют условным нулём, в качестве которого удобно использовать середину интервала, обладающего наибольшей частотой.

Показатель дисперсии методом моментов определяется как разность начального момента второго порядка и квадрата начального момента первого порядка.

Величина дисперсии признака σ2 носит еще название центрального момента второго порядка.

Формула метода моментов (14) используется довольно часто. Этим способом определяется дисперсия, например, в методах статистического имитационного моделирования.

Метод моментов позволяет также ускорить расчет дисперсии, если первичные данные представлены вариационным рядом распределения.

Рассмотрим пример.

▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼

 
 
  │►9. В таблице 2 содержатся данные о возрасте рабочих Таблица2 Распределение рабочих по возрасту  
Возраст, лет,(х) Число рабочих(f)   xf (x-a) (a=35)   (x-a)2     (x-a)2f     x2   x2f
      -17        
      -10        
               
      +10        
      +20        
Итого              

Рассчитаем дисперсию способом моментов. В качестве постоянной величины а возьмём один из вариантов (обычно берётся среднее значение варьирующего признака). В нашем примере а = 35.

Определим средний возраст рабочих 28,6 года;

= = 155,7 - 40,96 = = 114,74 года.

Значительно упрощаются расчёты при использовании зависимости (14).

σ2 = = - (28,6)2 = 932,7 - 817,96 =114,74 года. ◄


▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲

Центральные моменты более высоких порядков (третьего и четвертого) применяют для оценки асимметрии (несимметричности разброса данных относительно среднего уровня) и эксцесса (степени концентрации первичных данных около среднего уровня), которые характеризуют особенности вариации (более подробно см. параграф 1.6).

В ряде случаев возникает необходимость измерить вариацию альтернативного признака. Для этой цели рассчитывается дисперсия альтернативного признака.

Под альтернативным понимается такой статистический показатель, который принимает одно из двух взаимно исключающих значений. Так, изделие – годное или негодное; заказ на выпуск продукции – выполнен или не выполнен; заказ – выполнен менее чем на 90% или более чем на 90% и т.д.

Как видно, конкретное содержание альтернативного признака определяется непосредственно исследователем. Обычно считают, что если признак Х принял интересующее нас значение, то его величина равна 1, в противном случае – 0.

Итак, обозначим отсутствие интересующего нас признака через 0, его наличие – через 1, долю единиц, обладающих данным признаком – через р, не обладающих - через q. Вычислим среднее значение альтернативного признака и его дисперсию.

Среднее значение альтернативного признака равно

,

так как (сумма долей единиц, обладающих и не обладающих данным признаком, равна единице).

Дисперсия альтернативного признака определяется следующим образом:

.

Подставим в формулу дисперсии вместо () значение и получим:

.

Таким образом, , т.е. дисперсия альтернативного признака равна произведению доли единиц, обладающих данным признаком, на долю единиц, им не обладающих.

▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼

 
 
  │►10. Так, если 0,88 общего числа работающих на предприятии имеют высшее и среднее образование (р), то дисперсия альтернативного признака в этом случае будет равна: = 0,88 · (1 – 0,88) = 0,1056 ◄


▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲

Некоторые особенности имеются при оценке вариации таких показателей, как доля годной продукции, доля брака, удельный вес продукции определенного качества, доля населения с определенным мнением по данному вопросу и т.д.

Показатель доли или удельного веса можно рассматривать как среднее значение альтернативного признака. В результате получаем в n наблюдениях появление n1 раз интересующего нас значения (Х = 1) и в n2 = (n – n1) случаях значения Х= 0.

Таким образом, средняя величина альтернативного признака равна частоте появления интересующего нас значения Х. Средняя величина альтернативного показателя может обозначаться через w (удельный вес или доля), w = n1 / n.

Соответственно определяется и величина дисперсии альтернативного показателя:

. (15)

▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼

 
 
  │►11. В результате обхода работниками отдела кадров 100 рабочих мест оказалось, что только на 56 из них присутствуют работники. В данном случае коэффициент присутствия на рабочих местах составляет 0,56, или 56%. Дисперсия коэффициента определилась как =0,56 (1 – 0,56) = 0,2464. Интервал возможного точного значения коэффициента использования рабочих мест уточняется на основе теории выборочного наблюдения. ◄


▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲





Дата публикования: 2015-01-09; Прочитано: 526 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.012 с)...