Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Модель регрессии 3 страница



, (5.49)

имеющая F-распределение с степенями свободы и степенями свободы. Разность показывает, как влияют на переменную y дополнительные m-m1 параметров регрессии в совокупности по отношению к той неопределенности, которая заложена в регрессии с m объясняющими переменными. Чем больше разность, тем больше влияние дополнительных параметров регрессии.

По заданному уровню значимости и известным степеням свободы и f2 находится критическое значение по таблицам распределения Фишера. Критической областью (область отклонения гипотезы Н0) будут все значения F, удовлетворяющие неравенству . В этом случае следует считать, что дополнительные параметры регрессии оказывают существенное влияние на линию регрессии и ими пренебрегать нельзя.

В противном случае () гипотеза Н0 не отвергается и параметрами можно пренебречь. Значимость ошибки (вероятность отвергнуть гипотезу Н0 в то время, как она верна) составляет или в 100 случаях из 100 будет принята гипотеза Н1, в то время как верна гипотеза Н0.

Возможна такая ситуация, когда необходимо проверить равенство коэффициентов регрессии в регрессионной модели

,

построенной по выборке . В этом случае выдвигается относительно параметров генеральной совокупности гипотеза Н0: , против альтернативной гипотезы Н1: .В данном случае гипотеза Н1 будет двусторонней гипотезой. Однако, если известны соотношения, что или , гипотеза Н1 может быть трансформирована в гипотезу Н11: для построения односторонней критической области по заданному уровню значимости, или в гипотезу Н12: для построения односторонней критической области в зависимости от дополнительной информации относительно параметров .

Для проверки гипотезы Н0 используется статистика [9, стр. 208]

(5.50)

с степенями свободы.

Оценки дисперсий оценок параметров регрессии имеют вид

где – элементы обратной матрицы .

По заданному уровню значимости и числу степеней свободы определяется (в зависимости от типа гипотезы Н1) критическое значение по таблицам t – распределения. Критическая область (область значений t) определяется неравенством , т.е. если выполняется это неравенство то гипотеза Н0 отвергается.

Следующий интересный случай, который часто встречается на практике, заключается в следующем.

Исследуются два процесса. Для первого процесса производится выборка объема n1. Для второго – n2. Результаты эксперимента и взаимно независимы. По результатам эксперимента строятся две линии регрессии

, ,

отражающие одно и то же физическое явление.

Следует дать заключение - применима ли линия регрессии для описания второго процесса и применима ли линия регрессии для описания первого процесса. По всей видимости, эти линии регрессии и взаимозаменяемы, если их параметры регрессии и соответствующих генеральных совокупностей незначимо отличаются друг от друга. Таким образом, возникает задача проверки нулевой гипотезы Н0: , против альтернативной гипотезы Н1: , .

Альтернативная гипотеза Н1 может быть построена как для двусторонней критической области, так и для односторонней критической области.

Задача проверки гипотезы Н0 разбивается на несколько этапов.

1. Выдвигается гипотеза Н01: , т.е. остаточные дисперсии двух исследуемых процессов равны.

Альтернативная гипотеза Н11: .

Для проверки гипотезы Н01 используется статистика

, (5.51)

имеющая F – распределение с и степенями свободы. Причем предполагается, что . Если , используется статистика

. . (5.52)

По заданному уровню и степеням свободы и f2 определяется критическое значение . Если , гипотеза Н0 отклоняется. Ошибка отклонить правильную гипотезу Н0 будет в 100 случаях из 100 серий испытаний.

Если гипотеза Н0 не отклоняется, вычисляется сводная оценка остаточной дисперсии

. (5.53)

2. Второй этап вычислений проводится, если принята гипотеза Н0, и проверяется гипотеза : , против альтернативной двусторонней гипотезы :

Для проверки гипотезы используется статистика

(5.54)

имеющая t – распределение с f=n1+n2-4 степенями свободы.

Оценки дисперсии вычисляются по формуле (5.33).

По заданному уровню значимости и числу степеней свободы f из таблиц t – распределения находится критическое значение порога .

Если , гипотеза Н0 отвергается и можно утверждать, что разница между и значима.

Если , гипотеза Н0 принимается и можно утверждать, что расхождение между и незначительно и существующее расхождение определяется шумами измерения. Если хотя бы для одного параметра гипотеза Н0 отвергается, считается, что генеральная совокупность с параметром для первого процесса не идентична генеральной совокупности с для второго процесса.

Положим, все гипотезы Н01: приняты. Тогда вычисляется оценка коэффициентов регрессии, как среднее взвешенное

(5.55)

В качестве уравнения регрессии по х можно принять величину

, (5.56)

где - средневзвешенная оценка параметра регрессии.

Предложенная методика может быть применена для уточнения параметров регрессии по серии выборок ,..., из одной и той же генеральной совокупности. Серии имеют различные количества наблюдений из-за потери части наблюдений.

Пример 5.1.

П 1. Оценка параметров регрессии

Рассмотрим модель применения регрессионного анализа к восстановлению логистической кривой по экспериментальным данным при , . Логистическая кривая отображена на рисунке П 1 сплошной кривой. Шум имитировался псевдослучайной независимой последовательностью, распределенной по нормальному закону с математическим ожиданием, равным нулю, и средне квадратичным отклонением, равным 0.08. Выбрано 20 точек отсчета и значения складывались со значениями шума . В результате образовались значения, отображенные на рисунке П 1 точками. Значения результатов эксперимента для полученной реализации приведены в таблице П 5.1.

Таблица П 5.1

x y(x) x y(x) x y(x) x y(x)
  -0.03072   0.109802   0.590109   0.840467
  -0.02847   0.081143   0.879917   0.995829
  0.052456   0.206593   0.890103   0.866193
  0.164612   0.213295   0.815493   0.982444
  0.159817   0.546995   0.830255   1.043403

Положение точек на рисунке П1 зависит от значений реализации шума и может изменяться от эксперимента к эксперименту.

Модель регрессии:

.

В качестве примера выберем функции в виде степенного

ряда[1], наиболее часто применяемого на практике, и остановимся на m=5:

.

В результате регрессионная модель примет вид

.

Коэффициенты регрессии определяются по критерию минимума среднеквадратичной ошибки.

Матрица имеет размерность . Значения функции вычислены в дискретных точках , 0.6

В результате решения системы нормальных уравнений имеем оценки коэффициентов регрессии , которые приведены в таблице П 5.2:

Таблица П 5.2

-0.35296 0.650084 -0.34293 0.077623 -0.007172 0.000231

По найденным коэффициентам регрессии на рисунке П 2 нанесены точки, вычисленные по кривой регрессии . На этом же рисунке для сравнения изображена кривая f(x).

П 2. Анализ ошибок

2.1 Выборочная дисперсия вычисляется по формуле (5.17) и равна =DY = 0.159084.

2.2 Оценка дисперсии шума (остаточная дисперсия) производится по формуле (5.22) и равна = 0.0058723.

2.2 Дисперсия , обусловленная регрессией, вычисляется по формуле (5.22) и равна =DY1 = 0.153212.

2.3 Коэффициент детерминации вычисляется по формуле (5.23) и равен Byx = 0.963088.

2.4 Мера неопределённости, содержащаяся в остаточном шуме, вычисляется по формуле и равна Uyx = 0.0369119.

2.5 Запишем ковариационную матрицу , определяющую статистическую связь между параметрами , и вычисленную по формуле (5.32):

2.6 Оценка среднеквадратического отклонения оцениваемого параметра равна корню квадратному от диагональных элементов матрицы , (Таблица П 5.3):

Таблица П 5.3

0.205901 0.301040 0.139341 0.027261 0.002361 0.000074

П 3. Значимость коэффициента детерминации

Проверим гипотезу о том, что коэффициенты регрессии не оказывают влияние на кривую . Значение статистики определяется по формуле(5.43) и равно F= 73.05.

Положим уровень значимости 0.05. Для данного уровня значимости по таблицам распределения Фишера с числом степеней свободы =5 и =14 определим критическое значение .

Из сравнения статистики F и критического значения гипотезу следует отвергнуть, т. е. один или несколько параметров оказывают существенное влияние на функцию .

П 4. Значимость оценок параметров регрессии

Произведем проверку значимости каждого коэффициента регрессии по уровню значимости =0.05. Если коэффициент не влияет на функцию , то можно принять его значение равным нулю. Поэтому проверяется гипотеза : =0, против двусторонней альтернативой гипотезы : ¹0. Считаем, что распределено по закону Стьюдента с числом степеней свободы, равной n-m-1=14. По таблицам t-распределения определим критическое значение = 1.76131

Статистика для проверки гипотезы имеет вид ,

где - дисперсия, равная диагональным элементам матрицы S.

Ниже приведена таблица П 5.4 значений , , .

Таблица П 5.4

-0.35296 0.650084 -0.34293 0.07762 -0.007172 0.000231
0.205901 0.30104 0.13934 0.02726 0.002361 0.000074
-1.71422 2.15946 -2.46113 2.84742 -3.03727 3.10137

Как видно из таблицы, для всех значений соблюдается соотношение , то есть гипотеза для этих значений отвергается. Так как , параметр регрессии не оказывает существенного влияния на кривую регрессии и её можно исключить.

На рисунке П 3 изображена кривая y(x) с исключенным коэффициентом . Как видно из этого рисунка, аппроксимация логистической кривой степенным полиномом y(x) дает не очень хорошее приближение. В то же время кривая регрессии y(x) без учета значимости коэффициентов регрессии позволило построить кривую y(x), изображенную на рисунке П4.

Как видно, эта кривая «ближе» к кривой f(x). Ожидать совпадения кривой f(x) и полинома y(x) не приходится, т.к. даже в отсутствии шума среднеквадратическое приближение полинома y(x) к логистической кривой имеет вид, изображенный на рисунке П 5. Поэтому необходимо более аккуратно подходить к выбору функции .

Пример 5.2.

Рассмотрим сумму двух гармонических сигналов

(П 1)

с параметрами , , 5, 8, , , заданных на интервале наблюдения Т=2. Все величины представлены в относительных единицах. На рисунке П 6 представлена реализация сигнала .

Предположим, амплитуды и фазы составляющих сигнала неизвестны, измерения значений сигнала производятся с интервалом 0.03125 на фоне нормального не коррелированного шума с дисперсией, равной 1. Число точек отсчета 64.





Дата публикования: 2015-03-26; Прочитано: 224 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.016 с)...