Главная Случайная страница Контакты | Мы поможем в написании вашей работы! | ||
|
Дисперсия обладает рядом математических свойств. Их использование значительно упрощает и облегчает её вычисление. Рассмотрим основные свойства дисперсии.
1. Величина дисперсии не зависит от начала отсчета признака, т.е. все индивидуальные значения Х можно увеличить (или уменьшить) на одно и то же число А. Это свойство формулируется так:
е сли все значения признака уменьшить или увеличить на какое-либо постоянное число а, то дисперсия от этого не изменится.
Это свойство легко доказывается с учётом того, что при увеличении (уменьшении) значений признака Х аналогично изменяется и показатель его среднего уровня.
Следовательно, дисперсию можно исчислить не только по вариантам, но и по их отклонениям от какого-то постоянного числа а.
2. Числовое значение дисперсии зависит от масштаба измерения признака Х. При увеличении (уменьшении) всех значений признака в С раз показатель дисперсии нового (измененного) признака будет больше (меньше) дисперсии значений прежнего признака в Р раз.
Если все значения признака уменьшить или увеличить в К раз, то дисперсия от этого изменится К2 раз.
Это свойство также доказывается достаточно легко, если в формуле расчета дисперсии вместо величины Х применить величину С·Х.
Следовательно, при исчислении дисперсии можно все значения признака уменьшить в К раз, исчислить дисперсию, а затем умножить её на это постоянное число в квадрате (К2).
3. Сумма квадратов отклонений индивидуальных значений признака от их средней меньше суммы квадратов отклонений индивидуальных значений признака от любого данного числа, а при условии, что а :
< .
Это свойство даёт возможность упрощать расчёты среднего квадратического отклонения путём замены громоздких вычислений реальных отклонений индивидуальных значений признака от средней вычислением отклонений от любого произвольно взятого числа, удобного для проведения расчётов с последующей поправкой.
4. Дисперсия признака равна разности между средним квадратом значений признака и квадратом их средней, т.е.
σ2 = .
5. Если дисперсия признака оценивается по небольшому числу наблюдений, взятых из достаточно большой или неограниченной генеральной совокупности, то даже при совпадении среднего значения признака по генеральной и выборочной совокупностям дисперсия признака в генеральной совокупности будет отличаться от дисперсии признака в выборочной совокупности.
При небольшом объеме выборочной совокупности расчетная величина дисперсии оказывается чаще смещенной в меньшую сторону по сравнению с генеральной дисперсией. Это объясняется тем, что в выборку вероятней всего не попадут наблюдения (или их будет недостаточно) с уровнями, значительно отличающимися от средней величины.
Рассмотрим вычисление дисперсии с применением её свойств.
▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼
|
▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲
Для получения несмещенной оценки дисперсию, полученную по результатам выборки и приведенным формулам, умножают на величину n / (n – 1), где n – объем выборочной совокупности. В итоге при малом числе наблюдений (менее 30) дисперсию признака (выборочную дисперсию) рекомендуется вычислять по формуле
σ2выб = . (12)
Выборочная дисперсия применяется как оценка дисперсии признака в генеральной совокупности.
Для нашего примера (7) несмещенной оценкой дисперсии будет
σ 2 = 625 · 4/3 = 833,3, что гораздо ближе к генеральной дисперсии.
Обычно уже при выборках объемом n > 15 – 20 расхождение смещенной и несмещенной оценок становится несущественным.
Надо учитывать и тот факт, что смещение дисперсии при небольшом объеме отдельной выборки наблюдается лишь в тенденции, т.е. при достаточно большом числе выборочных обследований среднее значение дисперсий, определяемых в этих выборках по общим формулам, смещается в меньшую сторону. Вводить ли поправку на смещённость для отдельного конкретного выборочного исследования, даже и небольшого по объему, – предмет специального исследования.
6. Если единицы наблюдения статистически независимы, то для одного и того же признака дисперсия его суммарной величины равна сумме дисперсий признака в отдельных наблюдаемых единицах. Поясним это свойство на примере.
▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼
|
▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲
Для рассмотренного примера (4) о заработной плате рабочих одной бригады такой способ оценки возможной суммы общего заработка будет неверен, так как в одной бригаде заработки рабочих взаимно зависимы. В этих ситуациях суммирование дисперсий применяют с поправкой на ковариацию (учет согласованности вариации признака у разных объектов).
7. Если первичные данные об уровне изучаемого показателя на отдельных объектах перевести в так называемую стандартизованную форму Z, т.е. вычесть из каждого уровня среднее значение и полученную разность разделить на величину среднего квадратического отклонения
Z = ,
то дисперсия стандартизованных уровней Z будет равна единице, а среднее значение равно нулю.
По стандартизованным данным отчетливо видно, на какое количество собственных средних квадратических отклонений (σ) конкретное значение признака отличается от своего среднего уровня. Таким образом, процедура стандартизации – это переход к другой единице измерения.
Для стандартизованных данных не существует относительных показателей вариации.
Рассмотрим более подробно особенности оценки вариации показателем дисперсии.
Существует способ упрощённого исчисления дисперсии - метод моментов (или способ отсчёта от условного нуля).
Этот способ основан на использовании следующего свойства: дисперсия равна среднему квадратическому отклонению от произвольной величины за вычетом квадрата отклонения средней арифметической от той же величины .
. (13)
Из этого свойства вытекает следующая теорема:
Средняя арифметическая квадратов отклонений вариант от любой постоянной принимает наименьшее значение, равное дисперсии, когда = .
Если в выражении (13) принять = 0 (т.е. оценивать вариацию относительно нулевой точки), то получаем формулу дисперсии, известную под названием формулы метода моментов:
σ2 = . (14)
Здесь
– среднее значение квадратов признака или начальный момент первого порядка (квадрат момента первого порядка);
– среднее значение признака или начальный момент второго порядка.
Величину называют условным нулём, в качестве которого удобно использовать середину интервала, обладающего наибольшей частотой.
Показатель дисперсии методом моментов определяется как разность начального момента второго порядка и квадрата начального момента первого порядка.
Величина дисперсии признака σ2 носит еще название центрального момента второго порядка.
Формула метода моментов (14) используется довольно часто. Этим способом определяется дисперсия, например, в методах статистического имитационного моделирования.
Метод моментов позволяет также ускорить расчет дисперсии, если первичные данные представлены вариационным рядом распределения.
Рассмотрим пример.
▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼
|
▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲
Центральные моменты более высоких порядков (третьего и четвертого) применяют для оценки асимметрии (несимметричности разброса данных относительно среднего уровня) и эксцесса (степени концентрации первичных данных около среднего уровня), которые характеризуют особенности вариации (более подробно см. параграф 1.6).
В ряде случаев возникает необходимость измерить вариацию альтернативного признака. Для этой цели рассчитывается дисперсия альтернативного признака.
Под альтернативным понимается такой статистический показатель, который принимает одно из двух взаимно исключающих значений. Так, изделие – годное или негодное; заказ на выпуск продукции – выполнен или не выполнен; заказ – выполнен менее чем на 90% или более чем на 90% и т.д.
Как видно, конкретное содержание альтернативного признака определяется непосредственно исследователем. Обычно считают, что если признак Х принял интересующее нас значение, то его величина равна 1, в противном случае – 0.
Итак, обозначим отсутствие интересующего нас признака через 0, его наличие – через 1, долю единиц, обладающих данным признаком – через р, не обладающих - через q. Вычислим среднее значение альтернативного признака и его дисперсию.
Среднее значение альтернативного признака равно
,
так как (сумма долей единиц, обладающих и не обладающих данным признаком, равна единице).
Дисперсия альтернативного признака определяется следующим образом:
.
Подставим в формулу дисперсии вместо () значение и получим:
.
Таким образом, , т.е. дисперсия альтернативного признака равна произведению доли единиц, обладающих данным признаком, на долю единиц, им не обладающих.
▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼
|
▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲
Некоторые особенности имеются при оценке вариации таких показателей, как доля годной продукции, доля брака, удельный вес продукции определенного качества, доля населения с определенным мнением по данному вопросу и т.д.
Показатель доли или удельного веса можно рассматривать как среднее значение альтернативного признака. В результате получаем в n наблюдениях появление n1 раз интересующего нас значения (Х = 1) и в n2 = (n – n1) случаях значения Х= 0.
Таким образом, средняя величина альтернативного признака равна частоте появления интересующего нас значения Х. Средняя величина альтернативного показателя может обозначаться через w (удельный вес или доля), w = n1 / n.
Соответственно определяется и величина дисперсии альтернативного показателя:
. (15)
▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼
|
▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲
Дата публикования: 2015-01-09; Прочитано: 526 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!