Главная Случайная страница Контакты | Мы поможем в написании вашей работы! | ||
|
Установите флажок, чтобы построить диаграмму нормальной вероятности.
Эти графики (пп.11,12,13) в рамках данного исследования строить не нужно.
Итак, приступаем к анализу.
I ЭТАП РЕГРЕССИОННОГО АНАЛИЗА.
В модель включены все факторные признаки (X1, X2, X3, X4).
Результаты регрессионного анализа выдаются в следующем виде (в скобках указаны принятые у нас обозначения):
ВЫВОД ИТОГОВ | |||||||||||||
Регрессионная статистика | |||||||||||||
Множественный R | 0,75322 | ||||||||||||
R-квадрат | 0,56735 | ||||||||||||
Нормированный R-квадрат | 0,49812 | ||||||||||||
Стандартная ошибка | 4,09622 | ||||||||||||
Наблюдения | |||||||||||||
Дисперсионный анализ | |||||||||||||
df (число степеней свободы ν) | SS (сумма квадратов отклонений Q) | MS (средний квадрат MS=SS/ν) | F (Fнабл= MSR/MSост) | Значимость F | |||||||||
Регрессия | 550,065 (QR) | 137,5163 | 8,195725 | 0,000229 | |||||||||
Остаток | 419,476 (Qост) | 16,77902 | |||||||||||
Итого | 969,541 (Qобщ) | ||||||||||||
Коэффи-циенты (bi) | Стандартная ошибка (Ŝbi) | t-ста-тистика (tнабл) | P-Значение | Нижние 95% (βimin) | Верхние 95% (βimax) | Нижние 98% (βimin) | Верхние 98% (βimax) | ||||||
Y-пересечение | 17,28356 | 6,62546 | 2,6087 | 0,0151 | 3,6382 | 30,9290 | 0,8186 | 33,7485 | |||||
Переменная X1 | -0,50132 | 0,14108 | -3,5534 | 0,0015 | -0,7919 | -0,2108 | -0,8519 | -0,1507 | |||||
Переменная X2 | 6,22430 | 2,20638 | 2,8210 | 0,0092 | 1,6802 | 10,7684 | 0,7412 | 11,7074 | |||||
Переменная X3 | -0,21218 | 0,47694 | -0,4449 | 0,6602 | -1,1945 | 0,7701 | -1,3974 | 0,9731 | |||||
Переменная X4 | -0,05118 | 0,02013 | -2,5423 | 0,0176 | -0,0926 | -0,0097 | -0,1012 | -0,0012 | |||||
В регрессионной статистике указываются множественный коэффициент корреляции (Множественный R) и детерминации (R-квадрат) между Y и массивом факторных признаков (что совпадает с полученными ранее значениями в корреляционном анализе).
Средняя часть таблицы (Дисперсионный анализ) необходима для проверки значимости уравнения регрессии.
Нижняя часть таблицы – точечные оценки bi генеральных коэффициентов регрессии βi, проверка их значимости и интервальная оценка.
Оценка вектора коэффициентов b (столбец Коэффициенты):
Тогда оценка уравнения регрессии имеет вид:
Необходимо проверить значимость уравнения регрессии и полученных коэффициентов регрессии.
Проверим на уровне α =0,05 значимость уравнения регрессии, т.е. гипотезу H0: β1=β2=β3=…=βk =0. Для этого рассчитывается наблюдаемое значение F -статистики:
Excel выдаёт это в результатах дисперсионного анализа:
В столбце F указывается значение Fнабл .
По таблицам F -распределения (см. Приложение, таб. П.2.3) или с помощью встроенной статистической функции FРАСПОБР для уровня значимости α =0,05 и числа степеней свободы числителя ν1 = k =4 и знаменателя ν2=n-k- 1=25 находим критическое значение F -статистики, равное
F кр = 2,75871
Так как наблюдаемое значение F -статистики превосходит ее критическое значение 8,1957 > 2,7587, то гипотеза о равенстве вектора коэффициентов отвергается с вероятностью ошибки, равной 0,05. Следовательно, хотя бы один элемент вектора β=(β1,β2,β3,β4)T значимо отличается от нуля.
Проверим значимость отдельных коэффициентов уравнения регрессии, т.е. гипотезу .
Проверку значимости регрессионных коэффициентов проводят на основе t -статистики для уровня значимости .
Наблюдаемые значения t -статистик указаны в таблице результатов в столбце t-статистика.
Коэффициенты (bi) | t-статистика (tнабл) | ||
Y-пересечение | b0 = 17,28356 | 2,6087 | |
Переменная X1 | b1 = -0,50132 | -3,5534 | |
Переменная X2 | b2 = 6,22430 | 2,8210 | |
Переменная X3 | b3 = -0,21218 | -0,4449 | |
Переменная X4 | b4 = -0,05118 | -2,5423 |
При отсутствии пакета анализа данных, t-статистики можно получить, исходя из результатов оценки коэффициентов модели и их стандартных ошибок:
Их необходимо сравнить с критическим значением tкр, найденным для уровня значимости α =0,05 и числа степеней свободы ν=n – k - 1.
Для этого используем встроенную статистическую функцию Excel СТЬЮДРАСПОБР, введя в предложенное меню вероятность α=0,05 и число степеней свободы ν= n–k-1 =30-4-1=25. (Можно найти значения tкр по таблицам математической статистики (см. Приложение, таб. П.2.2)).
Получаем tкр =2,05953854.
Для наблюдаемое значение t -статистики больше критического по модулю
Следовательно, гипотеза о равенстве нулю этих коэффициентов отвергается с вероятностью ошибки, равной 0,05, т.е. соответствующие коэффициенты значимы.
Для наблюдаемое значение t -статистики меньше критического значения по модулю , следовательно, гипотеза H0 не отвергается, т.е. - незначим.
Значимость регрессионных коэффициентов проверяют и следующие столбцы результирующей таблицы:
Столбец p -значение показывает значимость параметров модели граничным 5%-ым уровнем, т.е. если p ≤0,05, то соответствующий коэффициент считается значимым, если p >0,05, то незначимым.
И последние столбцы – нижние 95% и верхние 95% и нижние 98% и верхние 98% -это интервальные оценки регрессионных коэффициентов с заданными уровнями надёжности для γ= 0,95 (выдаётся всегда) и γ= 0,98 (выдаётся при установке соответствующей дополнительной надёжности).
Если нижние и верхние границы имеют одинаковый знак (ноль не входит в доверительный интервал), то соответствующий коэффициент регрессии считается значимым, в противном случае – незначимым..
Как видно из таблицы, для коэффициента β3 p- значение p= 0,6602 >0,05 и доверительные интервалы включают ноль, т.е. по всем проверочным критериям этот коэффициент является незначимым.
Согласно алгоритму пошагового регрессионного анализа с исключением незначимых регрессоров, на следующем этапе необходимо исключить из рассмотрения переменную X3 (фондовооруженность труда), имеющую незначимый коэффициент регрессии .
В случае, когда при оценке регрессии выявлено несколько незначимых коэффициентов, первым из уравнения регрессии исключается регрессор, для которого t -статистика () минимальна по модулю.
II ЭТАП РЕГРЕССИОННОГО АНАЛИЗА.
В модель включены факторные признаки X1, X2, X4, исключён X3.
ВЫВОД ИТОГОВ | ||||||||||||||||||||
Регрессионная статистика | ||||||||||||||||||||
Множественный R | 0,7509 | |||||||||||||||||||
R-квадрат | 0,5639 | |||||||||||||||||||
Нормированный R-квадрат | 0,5136 | |||||||||||||||||||
Стандартная ошибка | 4,0325 | |||||||||||||||||||
Наблюдения | ||||||||||||||||||||
Дисперсионный анализ | ||||||||||||||||||||
df (число степеней свободы ν) | SS (сумма квадратов отклонений Q) | MS (средний квадрат MS=SS/ν) | F (Fнабл= MSR/MSост) | Значимость F | ||||||||||||||||
Регрессия | 546,745 (QR) | 182,2482 | 11,20741 | 6,66E-05 | ||||||||||||||||
Остаток | 422,796 (Qост) | 16,2614 | ||||||||||||||||||
Итого | 969,541 (Qобщ) | |||||||||||||||||||
Коэффи-циенты (bi) | Стандартная ошибка (Ŝbi) | t-ста-тистика (tнабл) | P-Значение | Нижние 95% (βimin) | Верхние 95% (βimax) | Нижние 98% (βimin) | Верхние 98% (βimax) | |||||||||||||
Y-пересечение | 14,87814 | 3,7694151 | 3,94707 | 0,00054 | 7,1300 | 22,6263 | 5,5352 | 24,2211 | ||||||||||||
Переменная X1 | -0,492621 | 0,137547 | -3,58147 | 0,00138 | -0,7754 | -0,2099 | -0,8335 | -0,1517 | ||||||||||||
Переменная X2 | 6,852785 | 1,6684311 | 4,10732 | 0,00035 | 3,4233 | 10,2823 | 2,7174 | 10,9882 | ||||||||||||
Переменная X4 | -0,050967 | 0,0198121 | -2,57253 | 0,01616 | -0,0917 | -0,0102 | -0,1001 | -0,0019 | ||||||||||||
Оценка коэффициентов в случае трех объясняющих переменных имеет вид:
,
а уравнение регрессии имеет вид:
Проверим на уровне α =0,05 значимость уравнения регрессии, т.е. гипотезу H0: β1=β2=β4 =0. Для этого в результатах дисперсионного анализа находим наблюдаемое значение F -статистики Fнабл =11,20741.
С помощью встроенной статистической функции FРАСПОБР или по таблицам F -распределения (см. Приложение, таб. П.2.3) для уровня значимости α =0,05 и числа степеней свободы числителя ν1 = k =3 и знаменателя ν1=n-k- 1=26 находим критическое значение F -статистики, равное
F кр = 2,975154
Так как наблюдаемое значение F -статистики превосходит ее критическое значение 11,207> 2,975, то гипотеза о равенстве вектора коэффициентов отвергается с вероятностью ошибки, равной 0,05. Следовательно, хотя бы один элемент вектора β=(β1,β2,β4)T значимо отличается от нуля.
Проверим значимость отдельных коэффициентов уравнения регрессии, т.е. гипотезу .
Наблюдаемые значения t -статистик указаны в таблице результатов в столбце t-статистика.
Коэффициенты (bi) | t-статистика (tнабл) | ||
Y-пересечение | b0 =14,87814 | 3,94707 | |
Переменная X1 | b1 =-0,492621 | -3,58147 | |
Переменная X2 | b2 =6,852785 | 4,10732 | |
Переменная X4 | b4 =-0,050967 | -2,57253 |
Их необходимо сравнить с критическим значением tкр, найденным для уровня значимости α =0,05 и числа степеней свободы ν=n – k - 1.
Для этого используем встроенную статистическую функцию Excel СТЬЮДРАСПОБР, введя в предложенное меню вероятность α=0,05 и число степеней свободы ν= n–k-1 =30-3-1=26. (Можно найти значения tкр по таблицам математической статистики (см. Приложение, таб. П.2.2)).
Получаем tкр =2,0555294.
Для всех рассматриваемых коэффициентов β0,β1,β2,β4 наблюдаемое значение t -статистики больше критического по модулю
Следовательно, гипотеза о равенстве нулю коэффициентов отвергается с вероятностью ошибки, равной 0,05, т.е. соответствующие коэффициенты значимы.
Также для всех этих коэффициентов p- значения не превышают 0,05 и доверительные интервалы не включают ноль, т.е. по всем проверочным критериям эти коэффициенты являются значимыми.
Т.к. в данном случае все коэффициенты оказались значимыми, процесс исключения переменных прекращается
Важное замечание.
Если бы какие-то из коэффициентов регрессии при факторных признаках оказались незначимыми, необходимо было бы продолжить процесс пошагового регрессионного анализа с последовательным исключением незначимых факторных признаков Xi до тех пор, пока все регрессионные коэффициенты не окажутся значимыми.
Если на последнем этапе, когда в регрессионной модели все коэффициенты регрессии при всех факторных признаках Xi значимы, оказывается незначимым только коэффициент b0 (const), регрессионный анализ проводят ещё раз, убирая из анализа эту незначимую константу (см. п.3.2).
Количество этапов регрессионного анализа индивидуально для каждого варианта данных.
Окончательная оценка регрессии со значимыми коэффициентами имеет вид:
Для значимых коэффициентов регрессии можно найти с заданной доверительной вероятностью γ интервальные оценки.
Как уже обсуждалось выше, доверительные интервалы для регрессионных коэффициентов выдаются Excel в последних столбцах таблицы результатов – нижние 95% и верхние 95% и нижние 98% и верхние 98% -с заданными уровнями надёжности для γ= 0,95 (выдаётся всегда) и γ= 0,98 (выдаётся при установке соответствующей дополнительной надёжности).
Коэффициенты (bi) | Нижние 95% (βimin) | Верхние 95% (βimax) | Нижние 98% (βimin) | Верхние 98% (βimax) | |
Y-пересечение | b0 =14,87814 | 7,1300 | 22,6263 | 5,5352 | 24,2211 |
Переменная X1 | b1 =-0,492621 | -0,7754 | -0,2099 | -0,8335 | -0,1517 |
Переменная X2 | b2 =6,852785 | 3,4233 | 10,2823 | 2,7174 | 10,9882 |
Переменная X4 | b4 =-0,050967 | -0,0917 | -0,0102 | -0,1001 | -0,0019 |
Таким образом, интервальные оценки значимых генеральных коэффициентов регрессии имеют вид:
При отсутствии пакета анализа данных, интервальные оценки коэффициентов регрессионной модели можно найти о формуле:
,
Для определения используем встроенную статистическую функцию Excel СТЬЮДРАСПОБР, введя в предложенное меню вероятность α=1- γ =0,05 и число степеней свободы ν=n–k-1 =30-3-1=26. (Можно найти значения tγ по таблицам математической статистики (см. таб. П.2.2)).
Получаем tγ =2,0555294. Следовательно, для надежности γ=0,95:
Аналогичные расчёты проводятся и для любого другого заданного уровня надёжности γ.
Дата публикования: 2015-10-09; Прочитано: 865 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!