Главная Случайная страница Контакты | Мы поможем в написании вашей работы! | ||
|
Пример 1. По 30 территориям России имеются данные, представленные табл. 3.1. Требуется:
1. Построить уравнение множественной регрессии в стандартизованной и естественной форме; рассчитать частные коэффициенты эластичности, сравнить их с b1 и b2, пояснить различия между ними.
2. Рассчитать линейные коэффициенты частной корреляции и коэффициент множественной корреляции, сравнить их с линейными коэффициентами парной корреляции, пояснить различия между ними.
3. Рассчитать общий и частные F-критерии Фишера.
Таблица 3.1
Признак | Среднее значение | Среднее квадратическое отклонение | Линейный коэффициент парной корреляции |
Среднедневной душевой доход, руб., y | 86,8 | 11,44 | – |
Среднедневная заработная плата одного работающего, руб., x1 | 54,9 | 5,86 | |
Средний возраст безработного, лет, x2 | 33,5 | 0,58 |
Решение:
1. Линейное уравнение множественной регрессии y от x1 и x2 имеет вид: y=a+b1x1+b2x2. Для расчета его параметров применим метод стандартизации переменных и построим искомое уравнение в стандартизованном масштабе: .
Расчет b-коэффициентов выполним по формулам:
;
.
Получим уравнение .
Для построения уравнения в естественной форме рассчитаем b1 и b2, используя формулы для перехода от bi к bi:
; ; ; .
Значение a определим из соотношения
,
тогда получим .
Для характеристики относительной силы влияния x1 и x2 на y рассчитаем средние коэффициенты эластичности:
; ; .
С увеличением средней заработной платы x1 на 1% от ее среднего уровня средний душевой доход y возрастает на 1,02% от своего среднего уровня; при повышении среднего возраста безработного x2 на 1% среднедушевой доход y снижается на 0,87% от своего среднего уровня. Очевидно, что сила влияния средней заработной платы x1 на средний душевой доход y оказалась большей, чем сила влияния среднего возраста безработного x2. К аналогичным выводам о силе связи приходим при сравнении модулей значений b1 и b2:
.
Различия в силе влияния фактора на результат, полученные при сравнении и bj, объясняются тем, что коэффициент эластичности исходит из соотношения средних отклонений , а b-коэффициент – из соотношения средних квадратических отклонений :
2. Линейные коэффициенты частной корреляции здесь рассчитываются по рекуррентной формуле:
;
;
.
Если сравнить значения коэффициентов парной и частной корреляции, то приходим к выводу, что из-за слабой межфакторной связи коэффициенты парной и частной корреляции отличаются незначительно: выводы о тесноте и направлении связи на основе коэффициентов парной и частной корреляции совпадают: ; ; ; ; ; .
Расчет линейного коэффициента множественной корреляции выполним с использованием коэффициентов и bj:
Зависимость y от x1 и x2 характеризуется как тесная, в которой 72% вариации среднего душевого дохода определяются вариацией учтенных в модели факторов: средней заработной платы и среднего возраста безработного. Прочие факторы, не включенные в модель, составляют соответственно 28% от общей вариации y.
3. Общий F-критерий проверяет гипотезу H0 о статистической значимости уравнения регрессии и показателя тесноты связи (R2=0):
;
Fтабл=3,4; a=0,05.
Сравнивая Fтабл и Fфакт, приходим к выводу о необходимости отклонить гипотезу H0, так как Fтабл =3,4< Fфакт =34,6. С вероятностью 1 – a = 0,95 делаем заключение о статистической значимости уравнения в целом и показателя тесноты связи , которые сформировались под неслучайным воздействием факторов x1 и x2 .
Частные F-критерии – и оценивают статистическую значимость присутствия факторов x1 и x2 в уравнении множественной регрессии, оценивают целесообразность включения в уравнение одного фактора после другого фактора, т.е. оценивает целесообразность включения в уравнение фактора x1 после того, как в него был включен фактор x2. Соответственно указывает на целесообразность включения в модель фактора x2 после фактора x1:
; Fтабл=4,21; a=0,05.
Сравнивая Fтабл и Fфакт, приходим к выводу о целесообразности включения в модель фактора x1 после фактора x2, так как . Гипотезу H0 о несущественности прироста за счет включения дополнительного фактора x1 отклоняем и приходим к выводу о статистически подтвержденной целесообразности включения фактора x1 после фактора.
Целесообразность включения в модель фактора x2 после фактора x1 проверяет :
.
Низкое значение (немногим больше 1) свидетельствует о статистической незначимости прироста за счет включения в модель фактора x2 после фактора x1. Следовательно, подтверждается нулевая гипотеза H0 о нецелесообразности включения в модель фактора x2 (средний возраст безработного). Это означает, что парная регрессионная модель зависимости среднего дохода от средней заработной платы является достаточно статистически значимой, надежной и что нет необходимости улучшать ее, включая дополнительный фактор x2 (средний возраст безработного).
Пример 2. По территориям России изучаются следующие данные (табл. 3.2): зависимость среднегодового душевого дохода y (тыс. руб.) от доли занятых тяжелым физическим трудом в общей численности занятых x1 (%) и от доли экономики активного населения в численности всего населения x2 (%).
Таблица 3.2
Признак | Среднее значение | Среднее квадратическое отклонение | Характеристика тесноты связи | Уравнение связи |
y | 112,76 | 31,58 | ||
x1 | 5,40 | 3,34 | ||
x2 | 50,88 | 1,74 |
Требуется:
1. Составить таблицу дисперсионного анализа для проверки при уровне значимости a=0,05 статистической значимости уравнения множественной регрессии и его показателя тесноты связи.
2. С помощью частных F-критериев Фишера оценить, насколько целесообразно включение в уравнение множественной регрессии фактора x1 после фактора x2 и насколько целесообразно включение x2 после x1.
3. Оценить с помощью t-критерия Стьюдента статистическую значимость коэффициентов при переменных x1 и x2 множественного уравнения регрессии.
Решение:
1. Задача дисперсионного анализа состоит в проверке нулевой гипотезы H0 о статистической незначимости уравнения регрессии в целом и показателя тесноты связи.
Анализ выполняется при сравнении фактического и табличного (критического) значений F-критерия Фишера Fтабл и Fфакт. Fфакт определяется из соотношения значений факторной и остаточной дисперсий, рассчитанных на одну степень свободы:
,
где n – число единиц совокупности;
m – число факторов в уравнении линейной регрессии;
– фактическое значение результативного признака;
– расчетное значение результативного признака.
Результаты дисперсионного анализа представлены в табл. 3.3:
Таблица 3.3
Вариация результата, y | Число степеней свободы | Сумма квадратов отклонений, S | Дисперсия на одну степень свободы, s2 | Fфакт | Fтабл a =0,05 k1 =2, k2 =17 |
Общая | df =n-1=19 | 19945,9 | – | – | – |
Факторная | k1=m=2 | 11918,3 | 5959,15 | 12,62 | 3,59 |
Остаточная | k2=n-m-1=17 | 8027,6 | 472,21 | – | – |
; ;
; .
Сравнивая Fтабл и Fфакт, приходим к выводу о необходимости отклонить гипотезу H0 и сделать вывод о статистической значимости уравнения регрессии в целом и значения , так как они статистически надежны и сформировались под систематическим действием неслучайных причин. Вероятность того, что допускаются ошибки при отклонении нулевой гипотезы, не превышает 5%, и это является достаточно малой величиной.
2. Частный F-критерий Фишера оценивает статистическую целесообразность включения фактора x1 в модель после того, как в нее включен фактор x2. Частный F-критерий Фишера строится как отношение прироста факторной дисперсии за счет дополнительно включенного фактора (на одну степень свободы) к остаточной дисперсии (на одну степень свободы), подсчитанной по модели с включенными факторами x1 и x2:
.
Результаты дисперсионного анализа представлены в табл. 3.4:
Таблица 3.4
Вариация результата, y | Число степеней свободы | Сумма квадратов отклонений, S | Дисперсия на одну степень свободы, s2 | Fфакт | Fтабл a =0,05 k1 =2, k2 =17 |
Общая | df =n-1=19 | 19945,9 | – | – | – |
Факторная В том числе: · за счет · за счет дополнительно включенного | k1=m=2 | 11918,3 5127,1 6791,2 | 5959,15 5127,1 6791,2 | 12,62 10,86 14,38 | 3,59 4,45 4,45 |
Остаточная | k2=n-m-1=17 | 8027,6 | 472,21 | – | – |
;
;
; ; .
Включение фактора x1 после фактора x2 оказалось статистически значимым и оправданным: прирост факторной дисперсии (в расчете на одну степень свободы) оказался существенным, т.е. следствием дополнительного включения в модель систематически действующего фактора x1, так как .
Аналогично проверим целесообразность включения в модель дополнительного фактора x2 после включенного ранее фактора x1. Расчет выполним с использованием показателей тесноты связи и :
.
В силу того что , приходим к выводу, что включение x2 после x1 оказалось бесполезным: прирост факторной дисперсии в расчете на одну степень свободы был несуществен, статистически незначим, т.е. влияние x2 не является устойчивым, систематическим. Вполне возможно было ограничиться построением линейного уравнения парной регрессии y от x1.
3. Оценка с помощью t-критерия Стьюдента значимости коэффициентов b1 и b2 связана с сопоставлением их значений с величиной их случайных ошибок: и . Расчет значений случайных ошибок достаточно сложен и трудоемок. Поэтому предлагается более простой способ: расчет значения t-критерия Стьюдента для коэффициентов регрессии линейного уравнения как квадратного корня из соответствующего частного F-критерия Фишера:
; .
Табличные (критические) значения t-критерия Стьюдента зависят от принятого уровня значимости a (обычно это 0,1; 0,05 или 0,01) и от числа степеней свободы (n-m-1), где n – число единиц совокупности, m – число факторов в уравнении.
В нашем примере при a =0,05; df =20-3=17; tтабл =2,10. Сравнивая tтабл и tфакт, приходим к выводу, что так как , коэффициент регрессии b1 является статистически значимым, надежным, на него можно опираться в анализе и в прогнозе. Так как , приходим к заключению, что величина b2 является статистически незначимой, ненадежной в силу того, что она формируется преимущественно под воздействием случайных факторов. Еще раз подтверждается статистическая значимость влияния x1 (доли занятых тяжелым физическим трудом) на y (среднедушевой доход) и ненадежность, незначимость влияния x2 (доли экономически активного населения в численности всего населения).
Дата публикования: 2014-10-19; Прочитано: 7157 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!