Главная Случайная страница Контакты | Мы поможем в написании вашей работы! | ||
|
43. Содержательная интерпретация коэффициентов регрессии множественной линейной регрессии. Линейная модель множественной регрессии имеет вид:
Yi = α0 + α1 xi 1 + α2 xi 2 +... + α mxim + ε i (4.1)
Коэффициент регрессии α j показывает, на какую величину в среднем изменится результативный признак Y, если переменную xj увеличить на единицу измерения, т.е. α j является нормативным коэффициентом. Обычно предполагается, что случайная величина ε i имеет нормальный закон распределения с математическим ожиданием равным нулю и с дисперсией σ2.
Анализ уравнения (4.1) и методика определения параметров становятся более наглядными, а расчетные процедуры существенно упрощаются, если воспользоваться матричной формой записи уравнения (4.2):
Y = X α + ε
Таким образом,
Уравнение (4.1) содержит значения неизвестных параметров α0, α1, α2,..., α m. Эти величины оцениваются на основе выборочных наблюдений, поэтому полученные расчетные показатели не являются истинными, а представляют собой лишь их статистические оценки. Модель линейной регрессии, в которой вместо истинных значений параметров подставлены их оценки (а именно такие регрессии и применяются на практике), имеет вид:
, (4.3)
Формулу для вычисления параметров регрессионного уравнения приведем без вывода:
а = (Х Т Х)-1 X T Y. (4.4)
Одним из условий регрессионной модели является предположение о линейной независимости объясняющих переменных, т.е., решение задачи возможно лишь тогда, когда столбцы и строки матрицы исходных данных линейно независимы. Для экономических показателей это условие выполняется не всегда. Линейная или близкая к ней связь между факторами называется мультиколлинеарностью и приводит к линейной зависимости нормальных уравнений, что делает вычисление параметров либо невозможным, либо затрудняет содержательную интерпретацию параметров модели. Мультиколлинеарность может возникать в силу разных причин. Например, несколько независимых переменных могут иметь общий временной тренд, относительно которого они совершают малые колебания. В частности, так может случиться, когда значения одной независимой переменной являются датированными значениями другой. Считают явление мультиколлинеарности в и сходных данных установленным, если коэффициент парной корреляции между двумя переменными больше 0,8. Чтобы избавиться от мультиколлинеарности, в модель включают лишь один из линейно связанных между собой факторов, причем тот, который в большей степени связан с зависимой переменной.
В качестве критерия мультиколлинеарности может быть принято соблюдение следующих неравенств:
ryxi > rxixk, ryxk > rxixk, rxixk < 0,8.
Если приведенные неравенства (или хотя бы одно из них) не выполняются, то в модель включают тот фактор, который наиболее тесно связан с Y.
Анализ статистической значимости параметров модели. Значимость отдельных коэффициентов регрессии проверяется по t -статистике путем проверки гипотезы о равенстве нулю j -го параметра уравнения (кроме свободного члена):
Taj = aj / Saj, (4.5)
где Saj — стандартное (среднеквадратическое) отклонение коэффициента уравнения регрессии aj.
Величина Saj представляет собой квадратный корень из произведения несмещенной оценки дисперсии и j -го диагонального элемента матрицы, обратной матрице системы нормальных уравнений.
(4.6)
где bjj — диагональный элемент матрицы (Х Т Х)-1.
Если расчетное значение t -критерия с (n - k -1) степенями свободы превосходит его табличное значение при заданном уровне значимости, коэффициент регрессии считается значимым. В противном случае фактор, соответствующий этому коэффициенту, следует исключить из модели (при этом ее качество не ухудшится).
Проверка значимости модели регрессии. Для проверки значимости модели регрессии используется F -критерий Фишера, вычисляемый по формуле (3.14).
Дата публикования: 2014-11-29; Прочитано: 440 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!