Главная Случайная страница Контакты | Мы поможем в написании вашей работы! | ||
|
Правило сложения дисперсий заключается в равенстве общей дисперсии сумме средней из внутригрупповых и межгрупповой дисперсий, т.е.:
, (42)
где общая дисперсия; (43)
внутригрупповые дисперсии; (44)
средняя из внутригрупповых дисперсий; (45)
межгрупповая дисперсия; (46)
внутригрупповые средние; (47)
общая средняя. (48)
Значение общей средней приведено в ячейке D65, а в ячейках D66 и D67 – среднее квадратическое отклонение и дисперсия зависимой переменной. Групповые средние приведены в ячейках АУ3:АУ7. Внутригрупповые дисперсии вычисляются с использованием функции ДИСПР, например, в ячейке АК3 записана формула = ДИСПР (С10:С15). Средняя из внутригрупповых дисперсий отображена в ячейке D68, в которой записана формула:
= СУММПРОИЗВ (АК3:АК7;Х3:Х7).
Для вычисления межгрупповой дисперсии в ячейку D69 записана формула = СУММПРОИЗВ (СТЕПЕНЬ(AJ3:АJ7-$D$65;2);X3:X7).
Как следует из данных табл. 2 правило сложения дисперсий выполняется, т.к. 11,25=1,62+9,63.
Для того, чтобы выяснить влияет ли контролируемый фактор на результативный признак, а при наличии такого влияния оценить его степень можно применить однофакторный дисперсионный анализ. Его логика рассуждений сводится к следующему:
Пусть - математическое ожидание результативного признака, соответственно в группах . Если при изменении уровня фактора групповые математические ожидания не изменяются, то результативный признак не зависит от фактора А, в противном случае такая зависимость имеется.
В связи с тем, что числовые значения математических ожиданий неизвестны, то возникает задача проверки гипотезы
Проверить данную гипотезу можно при соблюдении следующих требований при каждом значении уровня фактора:
1) наблюдения независимы и проводятся в одинаковых условиях;
2) результативный признак имеет нормальный закон распределения с постоянной для различных уровней генеральной дисперсией.
Для ответа на второй вопрос вычислим значения относительных показателей асимметрии и эксцесса (ячейки В71, В72). Учитывая, что каждый из них меньше 1,5 эмпирическое распределение прибыли банков не противоречит нормальному. Проверим выполнение гипотезы:
(49)
с помощью критерия Бартлетта:
(50)
где ; (51)
l=n-m; ; (52)
; (53)
; (54)
k=m-1; (55)
- дисперсия в j-ой группе;
-выборочная дисперсия в j-ой группе. (56)
При выполнении гипотезы о равенстве дисперсий, величина w имеет распределение близкое к с к=m- степенями свободы.
При соблюдении условия
гипотеза (49) подтверждается.
Здесь - правосторонняя критическая точка при заданном уровне значимости , определяющая критический интервал ().
Проверка гипотезы о равенстве математических ожиданий основывается на сравнении оценок и . В математической статистике доказывается, что если гипотеза о равенстве математических ожиданий подтверждается, то величина
(57)
имеет F – распределения с числом свободы k=m-1 и =n-m, т.е.
При использовании F – критерия строится правосторонняя область (), т.к. обычно . Если расчетное значение F – критерия попадает в указанный интервал, то гипотеза о равенстве групповых математических ожиданий отвергается, т.е. считаем, что фактор А влияет на результативный признак Y и можно измерить степень этого влияния с помощью выборочного коэффициента детерминации.
Рассчитаем значение перечисленных показателей. В ячейке D72 записана формула = n-m, т.е. вычисляется значение ;
Ячейка D73 содержит формулу =СУММПРОИЗВ(СТЕПЕНЬ(W3:W7-1;(-1))) – вычисляется значение ;
Ячейка D74: =1/D72 – вычисляется значение ;
Ячейка D75: =СУММПРОИЗВ(W3:W7;AK3:AK7)*D74 – вычисляется значение ;
Ячейка D76: =1+(D73-D74)/(3*4) – вычисляется значение q;
Ячейка D77: =СУММПРОИЗВ(W3:W7-1;LN($D$75/AZ6:AZ10))/D76 – вычисляется значение критерия Бартлетта;
Ячейка D78: =ХИ20БР(0,05;4) – определяется значение правосторонней критической точки .
В связи с тем, что =4,18 не попадает в критическую область (9,49; ), то гипотеза принимается и можно приступить к проверке гипотезы . Для этого сформируем массив значений результативного признака по группам (табл. 8).
Обратимся к режиму работы «Однофакторный дисперсионный анализ». Значения параметров, установленные в одноименном диалоговом окне, показаны на рис. 15.
Рисунок 15
Показатели, рассчитанные в ходе проверки гипотезы приведены в табл. 9 и 10.
Как видно из табл. 10 расчетное значение F – критерия , а критическая область образуется правосторонним интервалом (2,59: ). Так как попадает в критическую область, то гипотеза о равенстве групповых математических ожиданий отвергается, т.е. считаем, что прибыль банков зависит от их группы.
Рассмотрим более подробно алгоритм расчета основных показателей, представленных в табл. 10.
В ячейке AW15 (показатель SS между группами) рассчитывается взвешенная сумма квадратов отклонений групповых средних от общей выборочной средней:
.
В ячейке AW16 (показатель SS внутри групп) вычисляется остаточная сумма квадратов отклонений наблюдаемых значений уровня от своей выборочной средней:
.
В ячейке AW18 (показатель SS итого) общая сумма квадратов отклонений наблюдаемых значений от общей выборочной средней: или
В ячейках АХ15, АХ16 и АХ17 (показатель df) определяются степени свободы:
;
;
.
В ячейках AY15:AY16 (показатель MS) вычисляются несмещенные оценки и
В ячейке AZ15 (показатель F) вычисляется расчетное значение критерия :
.
В ячейке ВА15 (показатель Р – значение) определяется Р – значение, соответствующее расчетному значению критерия , с помощью формулы
=FРАСП(AZ15;AX15;AX16)
В ячейке ВВ15 (показатель F критическое) рассчитывается значение правосторонней критической точки с помощью формулы:
=FРАСПОБР(0,05;АХ15;АХ16).
Разделив левую и правую части выражения (42) на общую дисперсию получим следующее равенство:
. (58)
Т.е. доли средней из внутригрупповых и межгрупповой дисперсий в сумме равны единице. Второе слагаемое именуется эмпирическим коэффициентом детерминации
. (59)
Он характеризует долю объясненной дисперсии в общей. Следовательно, 86% (ячейка D70) вариации прибыли банков объясняются величиной их активов. Для оценки тесноты зависимости используется эмпирическое корреляционное отношение
. (60)
Учитывая, что (ячейка D71) теснота зависимости (по шкале Чеддока) весьма высокая.
При недостаточном количестве данных в выделенных группах к рассчитанной величине корреляционного отношения водится поправка на группировку:
, (61)
откуда (ячейки D81 и D82).
Таким образом можно сделать вывод, что эмпирический коэффициент детерминации является значимым и его можно применять для оценки влияния суммы активов банков на величину их прибыли.
Оценка степени взаимной согласованности между суммой активов банков и величиной их прибыли с помощью линейного коэффициента корреляции. Проверка его значимости и возможности использования линейной функции в качестве формы уравнения.
Линейный коэффициент корреляции в EXCEL можно вычислить используя режим «Корреляция» только для несгруппированных данных. Поэтому в ячейке D83 записана формула =(СУММПРОИЗВ(V3:V7:AJ3:AJ7;X3:X7)-B84*D65)/(B89*D66) или в принятых обозначениях . (61)
Значение коэффициента детерминации () приведено в ячейке D84. Для сравнения в ячейке D86 и D87 приведены значения перечисленных показателей для несгруппированных данных, вычисленные с использованием функции ПИРСОН (В10: В57; С10:С57), диалоговое окно которого приведено на рис. 16.
Рисунок 16
Из приведенных результатов следует, что степень взаимной согласованности между суммой активов банков и величиной их прибыли весьма высокая.
В связи с тем, что линейный коэффициент корреляции определен по выборочным данным, то его значение может существенно отличаться от аналогичного показателя в генеральной совокупности. Поэтому необходимо определить значимость выборочного линейного коэффициента корреляции. При наличии значимости определяются границы доверительного интервала линейного коэффициента корреляции и его можно использовать для оценки степени тесноты связи.
Оценку значимости линейного коэффициента корреляции выполним на основе t – критерия Стьюдента
, (62)
где - стандартная ошибка линейного коэффициента корреляции (ячейка D96) (63)
При этом проверяется гипотеза о равенстве нулю коэффициента корреляции (:r=0). Если гипотеза подтверждается, то t – статистика имеет распределение Стьюдента с выходными параметрами и k ( - уровень значимости; k=n-2 – число степеней свободы).
Так как рассчитанное значение , гипотеза :r=0 отвергается, что свидетельствует о значимости линейного коэффициента корреляции, а следовательно, и о статистической существенности зависимости между суммой активов банков и величиной их прибыли.
При недостаточном объеме выборки для построения доверительного интервала коэффициент корреляции преобразуют в величину , имеющую приблизительно нормальное распределение и рассчитываемую по формуле
(64)
Данное выражение имеет название «z – преобразование Фишера».
Интервальная оценка для z определяется из выражения
(65)
где - табулированые значения для стандартного нормального распределения, зависимые от . На основе обратного преобразования Фишера определяется интервальная оценка линейного коэффициента корреляции.
Приведем реализацию изложенного алгоритма.
· ячейке D91 содержится формула =ФИШЕР(D83) – вычисляется значение ;
· в ячейках D92 и D93 содержатся формулы
=D91-НОРМСТОБР((0,95+1)/2)*КОРЕНЬ(1/45) и
=D91+НОРМСТОБР((0,95+1)/2)*КОРЕНЬ(1/45) – рассчитываются интервальные оценки z;
· ячейки D94 и D95 содержатся формулы =ФИШЕРОБР(D92) и ФИШЕРОБР(D93).
Таким образом, с вероятностью 0,95 линейный коэффициент корреляции заключен в интервале от 0,87 до 0,96 со стандартной ошибкой 0,06.
Проверка возможности использования линейной функции в качестве формы уравнения заключается в определении разности квадратов , если она меньше 0,1, то считается возможным использовать линейное уравнение корреляционной зависимости. В данном случае эта разность составляет 0,004 (ячейка D85).
Дата публикования: 2014-11-18; Прочитано: 940 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!