Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Построение доверительных интервалов



Конечной целью моделирования является оценка или прогнозирование показателя Y в зависимости от значений X.

Прогноз подразделяется на точечный и интервальный и обычно осуществляется не более чем на одну треть размаха:

, (91)

где - точка прогноза.

В точечном прогнозе показателя Y для определяется лишь одно число, которое представляет условное среднее и (при выполнении предпосылок регрессионного анализа) наиболее вероятное значение с точки зрения закономерности, отраженной в модели. В таком прогнозе не учитываются отклонения от закономерностей в результате воздействия случайных и неучтенных факторов.

В интервальном прогнозе отклонения от закономерностей в результате случайных воздействий определяются границами доверительных интервалов.

Доверительным интервалом называется такой интервал, которому с заданной степенью вероятности (называемой доверительной) принадлежат истинные значения показателя при условии, что закономерности, отраженные в модели, не противоречат развитию как на участке наблюдения, так и на участке оценки (или в периоде упреждения прогноза).

Случайные отклонения от модели проявляются в виде ошибок. Поэтому при определении границ, доверительных интервалов необходимо определить из чего складываются возможные ошибки моделирования, оценки и прогнозирования. При условии, что модель адекватна, и возможные ошибки носят случайный характер, следует различать два основных источника ошибок:

1. ошибки аппроксимации (рассеяние наблюдений относительно модели);

2. ошибки оценок параметров модели.

Наличие ошибок первого типа очевидно даже визуально. На рис. 17 видно рассеяние исходных данных относительно модели, и конечно, нельзя предположить, что за границами периода наблюдений фактические значения вдруг подтянуться к модели. Величина ошибок аппроксимации характеризуется остаточной дисперсией или средней квадратической ошибкой . Распределение этих ошибок для адекватных моделей – нормально (нормальность ошибок – одно из условий адекватности).

Ошибки оценок параметров модели обусловлены тем, что их параметры, фиксированные в модели как однозначные, в действительности являются случайными величинами, так как они оцениваются на основе фактических данных, в которых присутствует как закономерная, так и случайная составляющие. Средние значения этих оценок при выполнении предпосылок регрессионного анализа соответствует истинным значениям параметров, а их дисперсии зависят от остаточной дисперсии, числа наблюдений и вида модели.

Общее среднее квадратическое отклонение истинных значений от расчетных может быть представлено как:

(92)

а в точке прогноза:

(93)

Исходя из предпосылки нормального распределения остатков границы доверительных интервалов определяются по формулам:

(94)

Анализ выражений (92, 93) позволяет для моделей парной регрессии сделать вывод, что доверительные интервалы тем шире, чем:

· больше остаточная дисперсия (менее точна модель);

· значение больше удалено от среднего значения ;

· сложнее форма модели;

· больше заданная доверительная вероятность.

Реализацию изложенного алгоритма осуществим с помощью режима «Регрессия». В диалоговом окне данного режима (рис. 18) задаются следующие параметры:

Рисунок 18

1. Входной интервал У – вводится ссылка на ячейки, содержащие данные по результативному признаку. Диапазон должен состоять из одного столбца.

2. Входной интервал Х – вводится ссылка на ячейки, содержащие факторные признаки. Максимальное число входных диапазонов (столбцов) 16.

3. Метки в первой строке/метки в первом столбце - флажок устанавливается в активное состояние, если первая строка (столбец) во входном диапазоне содержит заголовки. Если заголовки отсутствуют, флажок следует дезактивировать. В этом случае автоматически будут созданы стандартные названия для данных входного диапазона.

4. Уровень надежности – установите данный флажок в активное состояние, если в поле, расположенное напротив флажка, необходимо ввести уровень надежности, отличный от уровня 95%, применяемого по умолчанию. Установленный уровень надежности используется для проверки значимости коэффициента детерминации и коэффициентов .

5. Константа-ноль – установите данный флажок в активное состояние, если требуется, чтобы линия регрессии прошла через начало координат (т. е. ).

6. Выходной интервал/ Новый рабочий лист/ Новая рабочая книга. Переключатель в положении Выходной интервал активизирует поле, в которое необходимо ввести ссылку на левую верхнюю ячейку выходного диапазона. Размер выходного диапазона будет определен автоматически, и на экране появится сообщение в случае возможного наложения выходного диапазона на исходные данные.

В положении Новый рабочий лист открывается новый лист, в который начиная с ячейки А1 вставляются результаты анализа. Если необходимо задать имя открываемого листа, введите его в поле напротив соответствующего положения переключателя. В положении Новая рабочая книга открывается новая книга, на первом месте которой, начиная с ячейки А1, вставляются результаты анализа.

7. Остатки – установите данный флажок в активное состояние, если требуется включить в выходной диапазон столбец остатков.

8. Стандартные остатки – установите данный флажок в активное состояние, если требуется включить в выходной диапазон столбец стандартных остатков.

9. График остатков – установите данный флажок в активное состояние, если требуется вывести на рабочий лист точечные графики зависимости остатков от факторного признака.

10. График подбора – установите данный флажок в активное состояние, если требуется вывести на рабочий лист точечные графики зависимости теоретических результативных значений от факторных признаков .

11. График нормальной вероятности – установите флажок в активное состояние, если требуется вывести на рабочий лист точечный график зависимости наблюдаемых значений У от автоматически формируемых интервалов персентилей. График строится на основе генерируемой таблицы «Вывод вероятности».

Рассчитанные в данном режиме показатели представлены в табл. 11-14.

В табл. 11 сгенерированы результаты по регрессионной статистике. Эти результаты соответствуют следующим статистическим показателям:

· множественный R – линейному коэффициенту корреляции (ячейка D86):

· R-квадрат – коэффициенту детерминации ;

· Нормированный R-квадрат - скорректированное значение , вычисляемое по формуле:

·

· стандартная ошибка – остаточному среднему квадратическому отклонению (78):

· наблюдения – числу наблюдений.

В табл. 12 сгенерированы результаты дисперсионного анализа, которые используются для проверки значимости коэффициента детерминации .

Столбцы табл. 12 имеют следующую интерпретацию:

1. Столбец - число степеней свободы.

Для строки Регрессия число степеней свободы определяется количеством факторных признаков в уравнении регрессии .

Для строки Остаток число степеней свободы определяется числом наблюдений n и количеством переменных в уравнении регрессии .

Для строки Итого число степеней свободы определяется суммой

2. Столбец SS - сумма квадратов отклонений.

Для строки Регрессия – это сумма квадратов отклонений теоретических значений зависимой переменной от ее среднего значения

Для строки Остаток – это сумма квадратов отклонений эмпирических данных от теоретических

Для строки Итого – это сумма квадратов отклонений эмпирических данных от среднего:

или .

3. Столбец MS – дисперсии, рассчитываемые по формуле .

Для строки Регрессия – это факторная дисперсия .

Для строки Остаток – это остаточная дисперсия .

4. Столбец F – расчетное значение F -критерия Фишера , вычисляемое по формуле

5. Столбец Значимость F -значение уровня значимости, соответствующее вычисленному значению . Определяется с помощью функции =FРАСП(; ).

В табл. 13 сгенерированы значения параметров регрессии и их статистические оценки.

Столбцы табл. 13 имеют следующую интерпретацию:

1. Коэффициенты – значения параметров .

2. Стандартная ошибка – средние ошибки параметров .

3. t-статистика – расчетные значения t- критерия, вычисляемые по формуле

4. Р-значение – значения уровней значимости, соответствующие вычисленным значениям . Определяется с помощью функции СТЬЮДРАСП (, n-m1-1).

5. Нижние 95% и Верхние 95% - соответственно нижние и верхние границы доверительных интервалов для параметров регрессии . Для нахождения границ доверительных интервалов с помощью функции = СТЬЮДРАСПОБР (, n-m1-1) рассчитывается критическое значение t- критерия , а затем по формулам

Нижние 95%=Коэффициент - Стандартная ошибка* ;

Верхние 95%=Коэффициент+Стандартная ошибка*

вычисляются соответственно нижние и верхние границы доверительных интервалов.

Перейдем к анализу сгенерированных таблиц.

Рассчитанные в табл. 13 (ячейки ВF18, ВF19) коэффициенты регрессии позволяют построить уравнение, выражающее зависимость прибыли банков от суммы их активов:

Значение множественного коэффициента детерминации (ячейка ВF6 в табл. 11) показывает, что 95,8% общей вариации результативного признака у объясняется вариацией факторного признака x. Следовательно, выбранный фактор существенно влияет на прибыль банков. Рассчитанный уровень значимости (ячейка F13 в табл. 12) подтверждает значимость .

Другой подход основан на проверке попадания (формула (85), показатель F в табл. 12) в критическую область . Для рассматриваемого примера =4,05 (ячейка D98), которое рассчитывается по формуле = FРАСПОБР(0,05; В13; В14).

Так как попадает в критический интервал , т.е. , то гипотеза отвергается, т.е. множественный коэффициент детерминации является значимым и, следовательно, построенное уравнение адекватно генеральным данным и также является значимым.

Ошибка аппроксимации (79) составляет 3,6% (ячейка D97), следовательно, модель является достаточно точной.

Относительные показатели асимметрии и эксцесса (ячейки D106:D107) меньше 1,5, что позволяет сделать вывод о том, что эмпирическое распределение остатков не противоречит нормальному.

В табл.14 приведены значения параметров и и их средние ошибки. Сравнивая попарно значения параметров и их ошибок можно констатировать, что величина ошибок меньше значений параметров. К тому же эти параметры являются значимыми, о чем можно судить по значениям показателя P – значение в табл. 14, которые меньше заданного уровня значимости .

В генерируемых таблицах режима не приводится значение распределения Стьюдента, но его можно вычислить по формуле:

=СТЬЮДРАСПОБР (0,05; 48-1-1)

где 0,05 – заданный уровень значимости;

48 – число наблюдений;

1 – число факторов в уравнении регрессии;

1 – число свободных членов в уравнении регрессии.

Для рассматриваемого примера значение | |=2,01 (ячейка D90). Так как и попадают в критический интервал , то параметры регрессии и являются значимыми.

Среднее значение ряда остатков (ячейка D99) достаточно близко к нулю, т.е. модель не содержит постоянной систематической ошибки и адекватна по критерию нулевого среднего.

Проверка случайности ряда остатков дала положительные результаты. Значения приведены в ячейках D101:D104. В связи с тем, что выполняется система неравенств (89).

, модель признается адекватной по критерию случайности.

Значение коэффициента Дарбина-Уотсона вычислено в ячейке D100 по формуле = СУММКВРАЗН (BG27:BG73; BG26:BG72)/ СУММКВ (BG26:BG73) и равно 1,66.

Значение и определяются по табл. 2. Приложения 2. Для n=48 и они составляют и . Учитывая выполнение условия 2>1,66>1,50, модель признается адекватной по критерию независимости последовательных остатков.

Стандартные остатки вычисляются по формулам:

График стандартных остатков, построенный по данным табл. 14, приведен на рис. 19.

Рисунок 19

Как видно из рисунка стандартные остатки укладываются в симметричную относительно нулевой линии полосу и не имеют как отрицательной, так и положительной тенденций. Модуль стандартных остатков меньше 3. Следовательно, дисперсии ошибок наблюдений можно считать постоянными. Визуальный вывод подтверждается результатами теста Голдфельда – Квандта: , следовательно, .

Обобщая полученные результаты, можно сделать вывод, что построенная модель обладает хорошим качеством, т.е. она достаточно точна и адекватна исследуемому процессу по всем перечисленным ранее критериям. Учитывая еще и нормальность ряда остатков можно осуществлять точечный и интервальный прогнозы. В связи с этим табл. 15 приведены данные для построения доверительных интервалов.

Таблица 15
601,31 11,15 12,90 14,64 12,61 1,745
605,33 11,30 13,05 14,79 12,39 1,742
606,44 11,34 13,09 14,83 12,75 1,741
654,38 13,11 14,82 16,53 16,29 1,712
667,08 13,57 15,28 16,98 16,25 1,705
676,48 13,92 15,62 17,32 16,43 1,701
691,87 14,48 16,17 17,87 15,73 1,695
698,34 14,72 16,41 18,10 15,47 1,692
701,66 14,84 16,53 18,22 15,84 1,691
702,64 14,87 16,56 18,25 18,18 1,691
715,98 15,36 17,05 18,73 17,12 1,687
718,89 15,46 17,15 18,84 17,12 1,686
719,17 15,47 17,16 18,85 17,11 1,686
723,75 15,64 17,33 19,01 16,80 1,685
724,47 15,67 17,35 19,04 17,14 1,685
726,04 15,72 17,41 19,09 18,06 1,684
738,63 16,18 17,86 19,55 17,05 1,682
759,80 16,95 18,63 20,31 18,90 1,679
769,92 17,32 19,00 20,67 18,07 1,678
770,06 17,32 19,00 20,68 19,19 1,678
771,75 17,38 19,06 20,74 19,06 1,678
772,57 17,41 19,09 20,77 19,24 1,678
780,21 17,69 19,37 21,05 18,64 1,678
780,61 17,70 19,38 21,06 18,62 1,678
782,82 17,78 19,46 21,14   1,678
783,75 17,82 19,50 21,17 18,79 1,678
784,06 17,83 19,51 21,18 20,95 1,678
792,40 18,13 19,81 21,49 20,34 1,678
794,06 18,19 19,87 21,55 20,55 1,678
798,18 18,34 20,02 21,70 20,35 1,678
800,33 18,42 20,10 21,77 20,27 1,678
809,99 18,77 20,44 22,12 19,86 1,679
812,53 18,86 20,54 22,22 19,99 1,679
814,74 18,94 20,62 22,30 19,94 1,680
822,23 19,21 20,89 22,57 20,93 1,681
840,66 19,87 21,55 23,24 20,77 1,685
849,41 20,18 21,87 23,56 22,18 1,687
849,93 20,20 21,89 23,58 22,63 1,687
853,55 20,33 22,02 23,71 23,10 1,688
864,82 20,74 22,43 24,12 22,22 1,692
865,90 20,77 22,47 24,16 22,26 1,692
866,07 20,78 22,47 24,16 22,56 1,692
874,74 21,09 22,79 24,48 22,19 1,695
883,32 21,40 23,10 24,79 22,84 1,699
912,23 22,43 24,14 25,85 22,59 1,712
928,64 23,01 24,73 26,46 24,92 1,721
934,51 23,22 24,95 26,67 26,17 1,725
941,07 23,45 25,18 26,91 25,47 1,729
1020,83 26,28 28,07 29,86 28,26 1,792
1160,67 31,17 33,12 35,08   1,952

Массив дополнен двумя значениями: и , которые выделены жирным шрифтом. Значения вычислены по формулам (92-94) с доверительной вероятностью 0,975 и соответствующим ей коэффициентом доверия Стьюдента 2,315. Выбор распределения Стьюдента обусловлен достаточно большим значением относительного показателя асимметрии остатков.

График доверительных интервалов приведен на рис. 20.

Рисунок 20

Ряды: 1- , 2- , 3- , 4-

С учетом нормального распределения остатков при среднем значении стоимости активов банков равном 1160,67 млн. руб. с вероятностью 0,975 прогнозируемая прибыль составит от 31,17 до 35,08 млн. руб., при этом условное среднее (наиболее вероятный объем прибыли) ожидается 33,12 млн. руб.

ЛИТЕРАТУРА

1. Андронов А.М., Копытов Е.А., Гринглаз Л.Я. Теория вероятностей и математическая статистика: Учебник для вузов. – СПб: Питер. 2004. – 461 с.: ил. – (серия «Учебник для вузов»).

2. Боровиков В. STATISTICA. Искусство анализа данных на компьютере: Для профессионалов. 2-е изд. (+ CD). – СПб.: Питер. 2003. – 688 с.: ил.

3. Вуколов Э.А. Основы статистического анализа. Практикум по статистическим методам и исследованию операций с использованием пакетов STATISTICA и ECXEL: Учебное пособие. – М.: Форум: ИНФРА – М, 2004. – 464 с. – Профессиональное образование.

4. Громыко Г.Л. Теория статистики: Практикум. – 3-е изд., доп. и перераб. – М.: ИНФРА – М, 2006. – 205 с. – (Высшее образование).

5. Елисеева И.И., Юзбашев М.М. Общая теория статистики: Учебник/ Под ред. И.И. Елисеевой. – 5-е изд., перераб. и доп. – М.: Финансы и статистика. 2004. – 656 с.: ил.

6. Ефимова М.Р., Петрова Е.В., Румянцев В.Н. Общая теория статистики: Учебник. – 2-е изд., испр. и доп. – М.: ИНФРА – М, 2005. – 416 с. – (Высшее образование).

7. Макарова Н.В., Трофимец В.Я. Статистика в Excel: Учебное пособие. – М.: Финансы и статистика, 2002. – 368 с.: ил.

8. Салманов О.Н. Математическая экономика с применением Mathcad и Ecxel. – СПб.: БХВ – Петербург, 2003. – 464 с.: ил.

9. Скучалина Л.М., Павлова С.А. Статистические методы анализа, моделирования и прогнозирования внешнеторговых потоков на основе данных таможенной статистики: Учеб. пособие. – Люберцы: РИО РТА, 2000. – 67 с.: ил.

10. Сигел, Эндрю. Практическая бизнес-статистка: Пер с англ. – М.: Издательский дом «Вильямс», 2004. – 1056 с.: ил. – Парал. Тит. англ.





Дата публикования: 2014-11-18; Прочитано: 1422 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.022 с)...