Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

График нормальной вероятности



Установите флажок, чтобы построить диаграмму нормальной вероятности.

Эти графики (пп.11,12,13) в рамках данного исследования строить не нужно.

Итак, приступаем к анализу.


I ЭТАП РЕГРЕССИОННОГО АНАЛИЗА.

В модель включены все факторные признаки (X1, X2, X3, X4).

Результаты регрессионного анализа выдаются в следующем виде (в скобках указаны принятые у нас обозначения):

ВЫВОД ИТОГОВ            
             
Регрессионная статистика          
Множественный R 0,75322        
R-квадрат 0,56735        
Нормированный R-квадрат 0,49812        
Стандартная ошибка 4,09622        
Наблюдения          
             
Дисперсионный анализ          
  df (число степеней свободы ν) SS (сумма квадратов отклонений Q) MS (средний квадрат MS=SS/ν) F (Fнабл= MSR/MSост) Значимость F
Регрессия   550,065 (QR) 137,5163 8,195725 0,000229  
Остаток   419,476 (Qост) 16,77902      
Итого   969,541 (Qобщ)        
             
  Коэффи-циенты (bi) Стандартная ошибка bi) t-ста-тистика (tнабл) P-Значение Нижние 95% (βimin) Верхние 95% (βimax) Нижние 98% (βimin) Верхние 98% (βimax)
Y-пересечение 17,28356 6,62546 2,6087 0,0151 3,6382 30,9290 0,8186 33,7485
Переменная X1 -0,50132 0,14108 -3,5534 0,0015 -0,7919 -0,2108 -0,8519 -0,1507
Переменная X2 6,22430 2,20638 2,8210 0,0092 1,6802 10,7684 0,7412 11,7074
Переменная X3 -0,21218 0,47694 -0,4449 0,6602 -1,1945 0,7701 -1,3974 0,9731
Переменная X4 -0,05118 0,02013 -2,5423 0,0176 -0,0926 -0,0097 -0,1012 -0,0012
                           

В регрессионной статистике указываются множественный коэффициент корреляции (Множественный R) и детерминации (R-квадрат) между Y и массивом факторных признаков (что совпадает с полученными ранее значениями в корреляционном анализе).

Средняя часть таблицы (Дисперсионный анализ) необходима для проверки значимости уравнения регрессии.

Нижняя часть таблицы – точечные оценки bi генеральных коэффициентов регрессии βi, проверка их значимости и интервальная оценка.

Оценка вектора коэффициентов b (столбец Коэффициенты):

Тогда оценка уравнения регрессии имеет вид:

Необходимо проверить значимость уравнения регрессии и полученных коэффициентов регрессии.

Проверим на уровне α =0,05 значимость уравнения регрессии, т.е. гипотезу H0: β123=…=βk =0. Для этого рассчитывается наблюдаемое значение F -статистики:

Excel выдаёт это в результатах дисперсионного анализа:

В столбце F указывается значение Fнабл .

По таблицам F -распределения (см. Приложение, таб. П.2.3) или с помощью встроенной статистической функции FРАСПОБР для уровня значимости α =0,05 и числа степеней свободы числителя ν1 = k =4 и знаменателя ν2=n-k- 1=25 находим критическое значение F -статистики, равное

F кр = 2,75871

Так как наблюдаемое значение F -статистики превосходит ее критическое значение 8,1957 > 2,7587, то гипотеза о равенстве вектора коэффициентов отвергается с вероятностью ошибки, равной 0,05. Следовательно, хотя бы один элемент вектора β=(β1234)T значимо отличается от нуля.

Проверим значимость отдельных коэффициентов уравнения регрессии, т.е. гипотезу .

Проверку значимости регрессионных коэффициентов проводят на основе t -статистики для уровня значимости .

Наблюдаемые значения t -статистик указаны в таблице результатов в столбце t-статистика.

  Коэффициенты (bi)   t-статистика (tнабл)
Y-пересечение b0 = 17,28356   2,6087
Переменная X1 b1 = -0,50132   -3,5534
Переменная X2 b2 = 6,22430   2,8210
Переменная X3 b3 = -0,21218   -0,4449
Переменная X4 b4 = -0,05118   -2,5423

При отсутствии пакета анализа данных, t-статистики можно получить, исходя из результатов оценки коэффициентов модели и их стандартных ошибок:

Их необходимо сравнить с критическим значением tкр, найденным для уровня значимости α =0,05 и числа степеней свободы ν=n – k - 1.

Для этого используем встроенную статистическую функцию Excel СТЬЮДРАСПОБР, введя в предложенное меню вероятность α=0,05 и число степеней свободы ν= n–k-1 =30-4-1=25. (Можно найти значения tкр по таблицам математической статистики (см. Приложение, таб. П.2.2)).

Получаем tкр =2,05953854.

Для наблюдаемое значение t -статистики больше критического по модулю

Следовательно, гипотеза о равенстве нулю этих коэффициентов отвергается с вероятностью ошибки, равной 0,05, т.е. соответствующие коэффициенты значимы.

Для наблюдаемое значение t -статистики меньше критического значения по модулю , следовательно, гипотеза H0 не отвергается, т.е. - незначим.

Значимость регрессионных коэффициентов проверяют и следующие столбцы результирующей таблицы:

Столбец p -значение показывает значимость параметров модели граничным 5%-ым уровнем, т.е. если p ≤0,05, то соответствующий коэффициент считается значимым, если p >0,05, то незначимым.

И последние столбцы – нижние 95% и верхние 95% и нижние 98% и верхние 98% -это интервальные оценки регрессионных коэффициентов с заданными уровнями надёжности для γ= 0,95 (выдаётся всегда) и γ= 0,98 (выдаётся при установке соответствующей дополнительной надёжности).

Если нижние и верхние границы имеют одинаковый знак (ноль не входит в доверительный интервал), то соответствующий коэффициент регрессии считается значимым, в противном случае – незначимым..

Как видно из таблицы, для коэффициента β3 p- значение p= 0,6602 >0,05 и доверительные интервалы включают ноль, т.е. по всем проверочным критериям этот коэффициент является незначимым.

Согласно алгоритму пошагового регрессионного анализа с исключением незначимых регрессоров, на следующем этапе необходимо исключить из рассмотрения переменную X3 (фондовооруженность труда), имеющую незначимый коэффициент регрессии .

В случае, когда при оценке регрессии выявлено несколько незначимых коэффициентов, первым из уравнения регрессии исключается регрессор, для которого t -статистика () минимальна по модулю.


II ЭТАП РЕГРЕССИОННОГО АНАЛИЗА.

В модель включены факторные признаки X1, X2, X4, исключён X3.

ВЫВОД ИТОГОВ              
               
  Регрессионная статистика          
  Множественный R 0,7509        
  R-квадрат 0,5639        
  Нормированный R-квадрат 0,5136        
  Стандартная ошибка 4,0325        
  Наблюдения          
               
  Дисперсионный анализ          
    df (число степеней свободы ν) SS (сумма квадратов отклонений Q) MS (средний квадрат MS=SS/ν) F (Fнабл= MSR/MSост) Значимость F
  Регрессия   546,745 (QR) 182,2482 11,20741 6,66E-05  
  Остаток   422,796 (Qост) 16,2614      
  Итого   969,541 (Qобщ)        
               
    Коэффи-циенты (bi) Стандартная ошибка bi) t-ста-тистика (tнабл) P-Значение Нижние 95% (βimin) Верхние 95% (βimax) Нижние 98% (βimin) Верхние 98% (βimax)
  Y-пересечение 14,87814 3,7694151 3,94707 0,00054 7,1300 22,6263 5,5352 24,2211
  Переменная X1 -0,492621 0,137547 -3,58147 0,00138 -0,7754 -0,2099 -0,8335 -0,1517
  Переменная X2 6,852785 1,6684311 4,10732 0,00035 3,4233 10,2823 2,7174 10,9882
  Переменная X4 -0,050967 0,0198121 -2,57253 0,01616 -0,0917 -0,0102 -0,1001 -0,0019
                                         

Оценка коэффициентов в случае трех объясняющих переменных имеет вид:

,

а уравнение регрессии имеет вид:

Проверим на уровне α =0,05 значимость уравнения регрессии, т.е. гипотезу H0: β124 =0. Для этого в результатах дисперсионного анализа находим наблюдаемое значение F -статистики Fнабл =11,20741.

С помощью встроенной статистической функции FРАСПОБР или по таблицам F -распределения (см. Приложение, таб. П.2.3) для уровня значимости α =0,05 и числа степеней свободы числителя ν1 = k =3 и знаменателя ν1=n-k- 1=26 находим критическое значение F -статистики, равное

F кр = 2,975154

Так как наблюдаемое значение F -статистики превосходит ее критическое значение 11,207> 2,975, то гипотеза о равенстве вектора коэффициентов отвергается с вероятностью ошибки, равной 0,05. Следовательно, хотя бы один элемент вектора β=(β124)T значимо отличается от нуля.

Проверим значимость отдельных коэффициентов уравнения регрессии, т.е. гипотезу .

Наблюдаемые значения t -статистик указаны в таблице результатов в столбце t-статистика.

  Коэффициенты (bi)   t-статистика (tнабл)
Y-пересечение b0 =14,87814   3,94707
Переменная X1 b1 =-0,492621   -3,58147
Переменная X2 b2 =6,852785   4,10732
Переменная X4 b4 =-0,050967   -2,57253

Их необходимо сравнить с критическим значением tкр, найденным для уровня значимости α =0,05 и числа степеней свободы ν=n – k - 1.

Для этого используем встроенную статистическую функцию Excel СТЬЮДРАСПОБР, введя в предложенное меню вероятность α=0,05 и число степеней свободы ν= n–k-1 =30-3-1=26. (Можно найти значения tкр по таблицам математической статистики (см. Приложение, таб. П.2.2)).

Получаем tкр =2,0555294.

Для всех рассматриваемых коэффициентов β0124 наблюдаемое значение t -статистики больше критического по модулю

Следовательно, гипотеза о равенстве нулю коэффициентов отвергается с вероятностью ошибки, равной 0,05, т.е. соответствующие коэффициенты значимы.

Также для всех этих коэффициентов p- значения не превышают 0,05 и доверительные интервалы не включают ноль, т.е. по всем проверочным критериям эти коэффициенты являются значимыми.

Т.к. в данном случае все коэффициенты оказались значимыми, процесс исключения переменных прекращается

Важное замечание.

Если бы какие-то из коэффициентов регрессии при факторных признаках оказались незначимыми, необходимо было бы продолжить процесс пошагового регрессионного анализа с последовательным исключением незначимых факторных признаков Xi до тех пор, пока все регрессионные коэффициенты не окажутся значимыми.

Если на последнем этапе, когда в регрессионной модели все коэффициенты регрессии при всех факторных признаках Xi значимы, оказывается незначимым только коэффициент b0 (const), регрессионный анализ проводят ещё раз, убирая из анализа эту незначимую константу (см. п.3.2).

Количество этапов регрессионного анализа индивидуально для каждого варианта данных.

Окончательная оценка регрессии со значимыми коэффициентами имеет вид:

Для значимых коэффициентов регрессии можно найти с заданной доверительной вероятностью γ интервальные оценки.

Как уже обсуждалось выше, доверительные интервалы для регрессионных коэффициентов выдаются Excel в последних столбцах таблицы результатов – нижние 95% и верхние 95% и нижние 98% и верхние 98% -с заданными уровнями надёжности для γ= 0,95 (выдаётся всегда) и γ= 0,98 (выдаётся при установке соответствующей дополнительной надёжности).

  Коэффициенты (bi) Нижние 95% (βimin) Верхние 95% (βimax) Нижние 98% (βimin) Верхние 98% (βimax)
Y-пересечение b0 =14,87814 7,1300 22,6263 5,5352 24,2211
Переменная X1 b1 =-0,492621 -0,7754 -0,2099 -0,8335 -0,1517
Переменная X2 b2 =6,852785 3,4233 10,2823 2,7174 10,9882
Переменная X4 b4 =-0,050967 -0,0917 -0,0102 -0,1001 -0,0019

Таким образом, интервальные оценки значимых генеральных коэффициентов регрессии имеют вид:

При отсутствии пакета анализа данных, интервальные оценки коэффициентов регрессионной модели можно найти о формуле:

,

Для определения используем встроенную статистическую функцию Excel СТЬЮДРАСПОБР, введя в предложенное меню вероятность α=1- γ =0,05 и число степеней свободы ν=n–k-1 =30-3-1=26. (Можно найти значения tγ по таблицам математической статистики (см. таб. П.2.2)).

Получаем tγ =2,0555294. Следовательно, для надежности γ=0,95:

Аналогичные расчёты проводятся и для любого другого заданного уровня надёжности γ.





Дата публикования: 2015-10-09; Прочитано: 865 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.014 с)...