Главная \| Случайная страница \| Контакты \| Мы поможем в написании вашей работы!

Тренировочный пример

⇐ Предыдущая 6 7 8 9 10 111213 14 15 Следующая ⇒

Пусть имеются показатели работы предприятия за 4 года по кварталам: у – рост производительности труда (%), х₁ – отношение фонда зарплаты к затратам рабочего времени (руб./чел.-ч.), х₂ – коэффициент текучести кадров ((%) и х₃ – энерговооружённость производства (кВт./чел.). Провести корреляционно-регрессионный анализ этой информации для чего:

1) проанализировать матрицу парных коэффициентов корреляции;

2) составить уравнение множественной регрессии и дать экономическую интерпретацию его коэффициентов;

3) исследовать уравнение регрессии на точность;

4) сравнить по точности второй вариант модели с первым (после исключения из уравнения незначимого показателя);

5) для второго варианта модели составить стандартизованное уравнение регрессии и сравнить по нему степень влияния независимых переменных на моделируемый показатель, рассчитать для этого уравнения коэффициенты эластичности;

При решении этой задачи воспользуемся готовыми результатами расчётов на основе стандартных статистических ППП STATGRAPHICS Pius и STATISTICA. Сами статистические данные здесь не приводятся.

Приведём описательные статистики для переменных (см. рис.4.2)

Рис. 4.2 Описательные статистики

Здесь в первом столбце перечислены изучаемые переменные, во втором – объём выборки для каждой переменной, в третьем (mean) – выборочные средние значения переменных, в четвёртом и пятом, соответственно, минимальные и максимальные значения переменных в выборке, а в последнем – выборочные стандартные отклонения для соответствующих переменных.

1. Проанализируем матрицу парных коэффициентов корреляции.

В силу симметрии будем анализировать только её верхнюю часть (рис. 4.3). Как видно из рис. 4.3, все коэффициенты корреляции значимы на 5 процентном уровне значимости (все р-величины < 0.05). Следовательно, незначимых переменных нет. Переменные х₁ и х₃ коллинеарны (коэффициент корреляции между ними > 0,7). В уравнение регрессии эти две переменные одновременно включать не рекомендуется.

Рис. 4.3. Матрица парных коэффициентов корреляции

Далее приводится отчет о множественной регрессии (рис. 4.4).

Рис. 4.4. Отчёт о множественной регрессии

2. Выпишем уравнение регрессии. Во второй строке заголовке отчёта о регрессии указывается, что зависимой переменной является переменная у. Далее приводятся заголовки столбцов. В столбцах Parameter и Estimate отражены перечень зависимых переменных и оценок коэффициентов при них в уравнении регрессии (в первой строке – свободный член уравнения).

Следовательно, в нашем случае уравнение регрессии имеет вид (с округлением во втором знаке):

= 41,09 + 0,19х₁ + 1,01х₂ + 0,23х₃.

Если подходить формально, то коэффициенты при переменных в уравнении показывают, что если, например, изменить х₁ на 1 руб./чел.-ч., то рост производительности труда изменится на 0,19%, а изменение х₃ на 1 кВт./ч. приведёт к росту производительности труда на 0,23%. Однако наличие коллинеарных переменных искажает смысл этих коэффициентов, о чём речь ниже.

3. Исследуем уравнение регрессии на точность.

Сначала проанализируем таблицу дисперсионного анализа (средняя часть отчёта – Analysis of Variance). Как известно, при таком анализе проверяется нулевая гипотеза о том, что все коэффициенты регрессии равны нулю. Эта проверка проводится на основе статистики Фишера. Для нашей задачи табличное (критическое) значение критерия Фишера (F_0.025:3:12) равно 4,47. Как известно, оно определяется при фиксированном уровне значимости и известных числе степеней свободы числителя и знаменателя (у нас они соответственно равны 0,05, 3 и 12). Сравнивая критическое значение со значением, вычисленным в таблице дисперсионного анализа (как видно, оно равно 80,07), получаем, что F_0.025:3:12< F =80,07. Следовательно, нулевая гипотеза отклоняется. Этот же вывод можно сделать на основе р-величины, указанной в последнем столбце таблицы дисперсионного анализа. Р-величина < 0,05, что снова говорит в пользу альтернативной гипотезы, а именно: не все коэффициенты регрессии равны нулю.

На следующем этапе анализа точности уравнения регрессии необходимо выяснить, какие из коэффициентов регрессии равны нулю, а какие значимо отличны от нуля. Как известно, осуществляется это на основе статистик Стьюдента, рассчитанных для каждого коэффициента регрессии. В нашем случает табличное значение статистики Стьюдента t_0,025;15 = 2,13. Сравнивая его с вычисленными значениями для каждого коэффициента (в столбце T statistic отчета о регрессии) видим, что только для коэффициента при х₃ статистика Стьюдента больше табличного (3,17 > 2.13). Значит, в нашем уравнении только один коэффициент регрессии не равен нулю (при х₃). Т.е. формально на рост производительности труда значимо влияет только один показатель – энерговооружённость производства, а два других показателя – не влияют. Однако при анализе матрицы парных коэффициентов корреляции мы сделали другой вывод. Объясняется это наличием коллинеарности.

Аналогичный вывод о значимости коэффициентов регрессии можно сделать, опираясь на р-величины, указанные в последнем столбце анализируемой таблицы (столбце p-Value). Только для коэффициента при х₃ р-величина меньше 0,05 (свободный член уравнения регрессии мы не анализируем)

Продолжим анализ точности уравнения регрессии по другим критериям, указанным в конце отчёта о регрессии.

Коэффициент множественной детерминации (R-squared) равен 95,24 %. Это означает, что изменение показателя роста производительности труда на 95,24 % зависит от изменения включённых в регрессию переменных.

Исправленный коэффициент множественной детерминации (R-squared (adjusted for d.f.)) несколько меньше неисправленного (равен 94,05 %), что подтверждает ранее сделанный вывод о наличии в уравнении незначимых переменных.

Стандартная ошибка оценки регрессии (Standard Error of Est.), равная 1,605, показывает, что, оценивая показатель роста производительности труда по данному уравнению регрессии, мы будем в среднем ошибаться на 1,605 %, т.к. этот показатель измеряется в процентах.

Следующий показатель точности уравнения регрессии имеет тот же смысл, что и предыдущий, но рассчитывается по несколько другой формуле и всегда меньше предыдущего.

Статистика Дарбина – Уотсона в нашем случае равна 1,8. Табличные значения для нашей задачи равны: d_l = 0.86, d_u = 1.73 (чтобы их найти, необходимо знать объём выборки и число переменных в модели), следовательно, механизм проверки гипотезы о наличии автокорреляции остатков следующий:

Есть автокорр. Обл. неопр. Нет автокорр. Обл. неопр. Есть автокорр.

-------------0,86-----------1,73---------------2,27-----------3,14------------------

В нашем случае d = 1,8 и вошла в область, указывающую, что автокорреляция остатков отсутствует. Следовательно, спецификация уравнения была проведена верно.

4. Исключим из уравнения незначимый фактор х₂ (с наименьшей t-статистикой, равной 1,69). После пересчёта имеем новое уравнение регрессии (см рис. 4.5).

Проанализируем это уравнение.

Оно по-прежнему значимо (р-величина в дисперсионном анализе < 0,05). Все коэффициенты уравнения регрессии стали значимыми (р-величины для коэффициентов стали < 0,05). Коэффициент множественной детерминации изменился незначимо (стал = 94,1%). Стандартная ошибка оценки почти не изменилась (равна 1,7).

Проверим остатки на автокорреляцию. Статистика Дарбина –Уотсона равна 1,9. Поскольку изменилось число объясняющих переменных (стало = 2), изменились и табличные значения этой статистики. Табличные значения в этом случае равны: d_l = 0,98, d_u = 1,54. Механизм проверки гипотезы о наличии автокорреляции остатков теперь следующий:

Есть атокорр. Обл. неорпред. Нет автокорр. Обл. неопред. Есть автокорр.

-------------0,98------------1,54------------2,46--------------3,02----------------

d = 1,9 снова попало в область, указывающую на отсутствие автокорреляции, т.е. спецификация и этого уравнения верна.

Рис. 4.5. Отчёт о регрессии (исключена незначимая переменная)

О смысле коэффициентов регрессии и здесь надо говорить осторожно, т.к. переменные х₁ и х₃ также коллинеарны (коэффициент корреляции для них равен 0,93).

5. Рассчитаем для второго уравнения b-коэффициенты и коэффициенты эластичности. Имеем: b₁ = 0,25, b₃ = 0,22, =84,7, = 198,4, S= 12,4, S= 15,25, = 112,04, S_y = 6,58.(см. рис. 4.5).

Тогда b₁ = 0,25 (12,4/6,58) = 0,47, b₃ = 0,22 (15,25/6,58) = 0,51, Э₁ = 0,25 (84,7/112,04) = 0,2, Э₃ = 0,22 (198,4/112,04) = 0,4.

На основе b-коэффициентов заключаем, что в нашем примере энерговооружённость производства сильнее влияет на рост производительности труда, чем показатель отношения фонда зарплаты рабочих к затратам рабочего времени (b₂ > b₁).

На основе коэффициентов эластичности заключаем, что при изменении энерговооруженности производства на 1 % рост производительности труда изменится на 0,4 %, а при изменении показателя отношения фонда зарплаты рабочих к затратам рабочего времени на 1 % рост производительности труда изменится на 0,2 %.

⇐ Предыдущая 6 7 8 9 10 111213 14 15 Следующая ⇒

Дата публикования: 2015-10-09; Прочитано: 595 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!

studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.008 с)...