Главная \| Случайная страница \| Контакты \| Мы поможем в написании вашей работы!

График нормальной вероятности

⇐ Предыдущая 11 12 13 14 151617 18 19 20 Следующая ⇒

Установите флажок, чтобы построить диаграмму нормальной вероятности.

Эти графики (пп.11,12,13) в рамках данного исследования строить не нужно.

Итак, приступаем к анализу.

I ЭТАП РЕГРЕССИОННОГО АНАЛИЗА.

В модель включены все факторные признаки (X₁, X₂, X_3,X₄).

Результаты регрессионного анализа выдаются в следующем виде (в скобках указаны принятые у нас обозначения):

ВЫВОД ИТОГОВ

Регрессионная статистика
Множественный R	0,75322
R-квадрат	0,56735
Нормированный R-квадрат	0,49812
Стандартная ошибка	4,09622
Наблюдения

Дисперсионный анализ
	df (число степеней свободы ν)	SS (сумма квадратов отклонений Q)	MS (средний квадрат MS=SS/ν)	F (F_набл= MS_R/MS_ост)	Значимость F
Регрессия		550,065 (Q_R)	137,5163	8,195725	0,000229
Остаток		419,476 (Q_ост)	16,77902
Итого		969,541 (Q_общ)

	Коэффи-циенты (b_i)	Стандартная ошибка (Ŝ_bi)	t-ста-тистика (t_набл)	P-Значение	Нижние 95% (βi_min)	Верхние 95% (βi_max)	Нижние 98% (βi_min)	Верхние 98% (βi_max)
Y-пересечение	17,28356	6,62546	2,6087	0,0151	3,6382	30,9290	0,8186	33,7485
Переменная X₁	-0,50132	0,14108	-3,5534	0,0015	-0,7919	-0,2108	-0,8519	-0,1507
Переменная X₂	6,22430	2,20638	2,8210	0,0092	1,6802	10,7684	0,7412	11,7074
Переменная X₃	-0,21218	0,47694	-0,4449	0,6602	-1,1945	0,7701	-1,3974	0,9731
Переменная X₄	-0,05118	0,02013	-2,5423	0,0176	-0,0926	-0,0097	-0,1012	-0,0012

В регрессионной статистике указываются множественный коэффициент корреляции (Множественный R) и детерминации (R-квадрат) между Y и массивом факторных признаков (что совпадает с полученными ранее значениями в корреляционном анализе).

Средняя часть таблицы (Дисперсионный анализ) необходима для проверки значимости уравнения регрессии.

Нижняя часть таблицы – точечные оценки b_i генеральных коэффициентов регрессии β_i, проверка их значимости и интервальная оценка.

Оценка вектора коэффициентов b (столбец Коэффициенты):

Тогда оценка уравнения регрессии имеет вид:

Необходимо проверить значимость уравнения регрессии и полученных коэффициентов регрессии.

Проверим на уровне α =0,05 значимость уравнения регрессии, т.е. гипотезу H₀: β₁=β₂=β₃=…=β_k =0. Для этого рассчитывается наблюдаемое значение F -статистики:

Excel выдаёт это в результатах дисперсионного анализа:

В столбце F указывается значение F_набл _.

По таблицам F -распределения (см. Приложение, таб. П.2.3) или с помощью встроенной статистической функции FРАСПОБР для уровня значимости α =0,05 и числа степеней свободы числителя ν₁ = k =4 и знаменателя ν₂=n-k- 1=25 находим критическое значение F -статистики, равное

F _кр= 2,75871

Так как наблюдаемое значение F -статистики превосходит ее критическое значение 8,1957 > 2,7587, то гипотеза о равенстве вектора коэффициентов отвергается с вероятностью ошибки, равной 0,05. Следовательно, хотя бы один элемент вектора β=(β₁,β₂,β₃,β₄)^T значимо отличается от нуля.

Проверим значимость отдельных коэффициентов уравнения регрессии, т.е. гипотезу .

Проверку значимости регрессионных коэффициентов проводят на основе t -статистики для уровня значимости .

Наблюдаемые значения t -статистик указаны в таблице результатов в столбце t-статистика.

	Коэффициенты (b_i)	t-статистика (t_набл)
Y-пересечение	b₀ = 17,28356	2,6087
Переменная X₁	b₁ = -0,50132	-3,5534
Переменная X₂	b₂ = 6,22430	2,8210
Переменная X₃	b₃ = -0,21218	-0,4449
Переменная X₄	b₄ = -0,05118	-2,5423

При отсутствии пакета анализа данных, t-статистики можно получить, исходя из результатов оценки коэффициентов модели и их стандартных ошибок:

Их необходимо сравнить с критическим значением t_кр, найденным для уровня значимости α =0,05 и числа степеней свободы ν=n – k - 1.

Для этого используем встроенную статистическую функцию Excel СТЬЮДРАСПОБР, введя в предложенное меню вероятность α=0,05 и число степеней свободы ν= n–k-1 =30-4-1=25. (Можно найти значения t_кр по таблицам математической статистики (см. Приложение, таб. П.2.2)).

Получаем t_кр =2,05953854.

Для наблюдаемое значение t -статистики больше критического по модулю

Следовательно, гипотеза о равенстве нулю этих коэффициентов отвергается с вероятностью ошибки, равной 0,05, т.е. соответствующие коэффициенты значимы.

Для наблюдаемое значение t -статистики меньше критического значения по модулю , следовательно, гипотеза H₀ не отвергается, т.е. - незначим.

Значимость регрессионных коэффициентов проверяют и следующие столбцы результирующей таблицы:

Столбец p -значение показывает значимость параметров модели граничным 5%-ым уровнем, т.е. если p ≤0,05, то соответствующий коэффициент считается значимым, если p >0,05, то незначимым.

И последние столбцы – нижние 95% и верхние 95% и нижние 98% и верхние 98% -это интервальные оценки регрессионных коэффициентов с заданными уровнями надёжности для γ= 0,95 (выдаётся всегда) и γ= 0,98 (выдаётся при установке соответствующей дополнительной надёжности).

Если нижние и верхние границы имеют одинаковый знак (ноль не входит в доверительный интервал), то соответствующий коэффициент регрессии считается значимым, в противном случае – незначимым..

Как видно из таблицы, для коэффициента β₃p- значение p= 0,6602 >0,05 и доверительные интервалы включают ноль, т.е. по всем проверочным критериям этот коэффициент является незначимым.

Согласно алгоритму пошагового регрессионного анализа с исключением незначимых регрессоров, на следующем этапе необходимо исключить из рассмотрения переменную X₃ (фондовооруженность труда), имеющую незначимый коэффициент регрессии .

В случае, когда при оценке регрессии выявлено несколько незначимых коэффициентов, первым из уравнения регрессии исключается регрессор, для которого t -статистика () минимальна по модулю.

II ЭТАП РЕГРЕССИОННОГО АНАЛИЗА.

В модель включены факторные признаки X₁, X_2,X₄, исключён X₃.

ВЫВОД ИТОГОВ

	Регрессионная статистика
	Множественный R	0,7509
	R-квадрат	0,5639
	Нормированный R-квадрат	0,5136
	Стандартная ошибка	4,0325
	Наблюдения

	Дисперсионный анализ
		df (число степеней свободы ν)	SS (сумма квадратов отклонений Q)	MS (средний квадрат MS=SS/ν)	F (F_набл= MS_R/MS_ост)	Значимость F
	Регрессия		546,745 (Q_R)	182,2482	11,20741	6,66E-05
	Остаток		422,796 (Q_ост)	16,2614
	Итого		969,541 (Q_общ)

		Коэффи-циенты (b_i)	Стандартная ошибка (Ŝ_bi)	t-ста-тистика (t_набл)	P-Значение	Нижние 95% (βi_min)	Верхние 95% (βi_max)	Нижние 98% (βi_min)	Верхние 98% (βi_max)
	Y-пересечение	14,87814	3,7694151	3,94707	0,00054	7,1300	22,6263	5,5352	24,2211
	Переменная X₁	-0,492621	0,137547	-3,58147	0,00138	-0,7754	-0,2099	-0,8335	-0,1517
	Переменная X₂	6,852785	1,6684311	4,10732	0,00035	3,4233	10,2823	2,7174	10,9882
	Переменная X₄	-0,050967	0,0198121	-2,57253	0,01616	-0,0917	-0,0102	-0,1001	-0,0019

Оценка коэффициентов в случае трех объясняющих переменных имеет вид:

а уравнение регрессии имеет вид:

Проверим на уровне α =0,05 значимость уравнения регрессии, т.е. гипотезу H₀: β₁=β₂=β₄ =0. Для этого в результатах дисперсионного анализа находим наблюдаемое значение F -статистики F_набл =11,20741.

С помощью встроенной статистической функции FРАСПОБР или по таблицам F -распределения (см. Приложение, таб. П.2.3) для уровня значимости α =0,05 и числа степеней свободы числителя ν₁ = k =3 и знаменателя ν₁=n-k- 1=26 находим критическое значение F -статистики, равное

F _кр= 2,975154

Так как наблюдаемое значение F -статистики превосходит ее критическое значение 11,207> 2,975, то гипотеза о равенстве вектора коэффициентов отвергается с вероятностью ошибки, равной 0,05. Следовательно, хотя бы один элемент вектора β=(β₁,β₂,β₄)^T значимо отличается от нуля.

Проверим значимость отдельных коэффициентов уравнения регрессии, т.е. гипотезу .

Наблюдаемые значения t -статистик указаны в таблице результатов в столбце t-статистика.

	Коэффициенты (b_i)	t-статистика (t_набл)
Y-пересечение	b₀ =14,87814	3,94707
Переменная X₁	b₁ =-0,492621	-3,58147
Переменная X₂	b₂ =6,852785	4,10732
Переменная X₄	b₄ =-0,050967	-2,57253

Для этого используем встроенную статистическую функцию Excel СТЬЮДРАСПОБР, введя в предложенное меню вероятность α=0,05 и число степеней свободы ν= n–k-1 =30-3-1=26. (Можно найти значения t_кр по таблицам математической статистики (см. Приложение, таб. П.2.2)).

Получаем t_кр =2,0555294.

Для всех рассматриваемых коэффициентов β₀,β₁,β₂,β₄ наблюдаемое значение t -статистики больше критического по модулю

Следовательно, гипотеза о равенстве нулю коэффициентов отвергается с вероятностью ошибки, равной 0,05, т.е. соответствующие коэффициенты значимы.

Также для всех этих коэффициентов p- значения не превышают 0,05 и доверительные интервалы не включают ноль, т.е. по всем проверочным критериям эти коэффициенты являются значимыми.

Т.к. в данном случае все коэффициенты оказались значимыми, процесс исключения переменных прекращается

Важное замечание.

Если бы какие-то из коэффициентов регрессии при факторных признаках оказались незначимыми, необходимо было бы продолжить процесс пошагового регрессионного анализа с последовательным исключением незначимых факторных признаков X_i до тех пор, пока все регрессионные коэффициенты не окажутся значимыми.

Если на последнем этапе, когда в регрессионной модели все коэффициенты регрессии при всех факторных признаках X_i значимы, оказывается незначимым только коэффициент b₀ (const), регрессионный анализ проводят ещё раз, убирая из анализа эту незначимую константу (см. п.3.2).

Количество этапов регрессионного анализа индивидуально для каждого варианта данных.

Окончательная оценка регрессии со значимыми коэффициентами имеет вид:

Для значимых коэффициентов регрессии можно найти с заданной доверительной вероятностью γ интервальные оценки.

Как уже обсуждалось выше, доверительные интервалы для регрессионных коэффициентов выдаются Excel в последних столбцах таблицы результатов – нижние 95% и верхние 95% и нижние 98% и верхние 98% -с заданными уровнями надёжности для γ= 0,95 (выдаётся всегда) и γ= 0,98 (выдаётся при установке соответствующей дополнительной надёжности).

	Коэффициенты (b_i)	Нижние 95% (βi_min)	Верхние 95% (βi_max)	Нижние 98% (βi_min)	Верхние 98% (βi_max)
Y-пересечение	b₀ =14,87814	7,1300	22,6263	5,5352	24,2211
Переменная X₁	b₁ =-0,492621	-0,7754	-0,2099	-0,8335	-0,1517
Переменная X₂	b₂ =6,852785	3,4233	10,2823	2,7174	10,9882
Переменная X₄	b₄ =-0,050967	-0,0917	-0,0102	-0,1001	-0,0019

Таким образом, интервальные оценки значимых генеральных коэффициентов регрессии имеют вид:

При отсутствии пакета анализа данных, интервальные оценки коэффициентов регрессионной модели можно найти о формуле:

Для определения используем встроенную статистическую функцию Excel СТЬЮДРАСПОБР, введя в предложенное меню вероятность α=1- γ =0,05 и число степеней свободы ν=n–k-1 =30-3-1=26. (Можно найти значения t_γ по таблицам математической статистики (см. таб. П.2.2)).

Получаем t_γ =2,0555294. Следовательно, для надежности γ=0,95:

Аналогичные расчёты проводятся и для любого другого заданного уровня надёжности γ.

⇐ Предыдущая 11 12 13 14 151617 18 19 20 Следующая ⇒

Дата публикования: 2015-10-09; Прочитано: 865 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!

studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.014 с)...