Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Парная регрессия



Парная регрессия характеризует связь между двумя признаками: результативным и факторным. Аналитически связь между ними описывается уравнениями:

прямой

параболы

гиперболы — и т.д.

Определить тип уравнения можно, исследуя зависимость графически. Однако существуют более общие указания, позволяющие выявить уравнение связи, не прибегая к графическому изображению. Если результативный и факторный признаки возрастают одинаково, примерно в арифметической прогрессии, то это свидетельствует о наличии линейной связи между ними, а при обратной связи — гиперболической. Если результативный признак увеличивается в арифметической профессии, а факторный значительно быстрее, то используется параболическая или степенная функции.

Оценка параметров уравнения регрессии а012 - в уравнении параболы второго порядка) осуществляется методом наименьших квадратов, в основе которого лежит предположение о независимости наблюдений исследуемой совокупности и нахождении параметров модели (а0 и а1), при котором минимизируется сумма квадратов отклонений эмпирических (фактических) значений результативного признака от теоретических, полученных по уравнению регрессии:

Система нормальных уравнений для нахождения параметров линейной парной регрессии методом наименьших квадратов имеет следующий вид:

где п - объем исследуемой совокупности (число единиц наблюдения).

В уравнениях регрессии параметр а0 показывает усредненное влияние на результативный признак неучтенных (не выделенных для исследования) факторов; параметр а1 (а в уравнении параболы и а2)— коэффициент регрессии показывает, насколько изменяется в среднем значение результативного признака при изменении факторного на единицу его собственного измерения.

Пример. По данным о сумме активов и кредитных вложений коммерческих банков одного из регионов РФ (цифры условные) необходимо определить направление и тесноту связи между признаками. Данные представлены после предварительной их обработки методом приведения параллельных данных. Сопоставив полученные ряды данных х и у, можно наблюдать наличие прямой зависимости между признаками, когда увеличение кредитных вложений увеличивает сумму активов коммерческих банков. Исходя из этого можно сделать предположение, что связь между признаками прямая и ее можно описать уравнением прямой. Этот же вывод подтверждается и на основе графического анализа

Анализ показывает наличие близкой к прямолинейной зависимости, так как точки расположены практически по прямой линии.

Определим параметры уравнения прямой на основе метода наименьших квадратов, решив систему нормальных уравнений. Исходные данные и расчетные показатели представим в таблице.

Отсюда: .

Табл. 9.1, Расчетная таблица для определения параметров уравнения регрессии зависимости суммы активов и кредитных вложений коммерческих банков одного из регионов РФ

Номер банка Кредитные вложения, млн. руб. x Сумма активов, млн. руб. y х2 ху
          1140,6
          1502,5
          1632,9
          2007,3
          2191,9
          2862,4
          3419,4
Итого         14757,0

Следовательно, с увеличением кредитных вложений на 1 млн руб. сумма активов возрастет в среднем на 1,0429 млн руб.

Модель регрессии может быть построена как по индивидуальным значениям признака (табл. 9.1), так и по сгруппированным данным (табл. 9.2). Для выявления связи между признаками по достаточно большому числу наблюдений используется корреляционная таблица. В корреляционной таблице можно отобразить только парную связь, т. е. связь результативного признака с одним фактором, и на ее основе построить уравнение регрессии и определить показатели тесноты связи. Само уравнение регрессии может иметь линейную, параболическую и другие формы.

При определении параметров модели регрессии и коэффициентов связи по корреляционной таблице не теряется информация о связи, обусловленная усреднением данных. Для составления корреляционной таблицы парной связи статистические данные необходимо предварительно сгруппировать по обоим признакам (х и у),затем построить таблицу, по строкам в которой отложить группы результативного, а по столбцам — группы факторного признаков.

Корреляционная таблица (пример табл. 9.2) дает общее представление о направлении связи. Если оба признака (х и у)располагаются в возрастающем порядке, а частоты (fxy)сосредоточены по диагонали сверху вниз направо, то можно судить о прямой связи между признаками. В противном случае — об обратной. О тесноте связи между признаками х и у по корреляционной таблице можно судить по кучности расположения частот вокруг диагонали (насколько заполнены клетки таблицы в стороне от нее). Если клетки заполнены большими цифрами, то связь слабая. Чем ближе частоты (fxy)располагаются к одной из диагоналей, тем теснее связь. Если в расположении частот (fxy)нет системности, то можно судить об отсутствии связи.

Рассмотрим анализ статистических данных по корреляционной таблице на следующем примере.

Пример. По данным группировки 40 предприятий легкой промышленности по величине балансовой прибыли и объему произведенной продукции (цифры условные) построим уравнение связи (см. табл. 9.2).

Решение. Анализ таблицы показывает, что частоты (fxy)расположены по диагонали сверху вниз, что свидетельствует о наличии прямой связи между объемом произведенной продукции и балансовой прибылью. Также наблюдаются концентрация частот (fxy) вокруг главной диагонали и незаполненность оставшихся клеток, поэтому можно предположить достаточно тесную связь между рассматриваемыми признаками.

Расчет и анализ средних значений по группам факторных признаков jc подтверждает наличие прямолинейной зависимости между хиу.

Таблица 9.2

Расчетная таблица для определения параметров уравнения регрессии по данным группировки предприятий легкой промышленности по величине балансовой прибыли

Балансовая прибыль, млн. руб., y Объем произведенной продукции, млн руб., х
    300-400 400-500 500-600 600-700 700-800
         
10-20                  
20-30                  
30-40                  
40-50                  
50-60                  
               
            - -
            - -
- 25,0 37,2 42,6 51,7 55,0 - - -

Считая, что зависимость описывается уравнением прямой, коэффициенты а0 и а1 определим из системы нормальных уравнений вида:

Так как значения признаков у их заданы в определенных интервалах, то для каждого интервала сначала необходимо определить середину интервала и у), а затем уже по ним строить уравнение регрессии. Покажем промежуточные расчеты:

по первой группе

по второй группе

Аналогичным образом получены все остальные расчетные значения в таблице.

Таким образом, подставив в систему уравнений итоговые значения из табл. 9.2, получим:

Отсюда: а0 = -03; а1 = 0,08.

Следовательно: .

Параметр уравнения регрессии а1 = 0,08 показывает, что с увеличением объема выпускаемой продукции на 1 млн. руб. балансовая прибыль в среднем возрастает на 80 тыс. руб.

Если связь между признаками у и х криволинейная и описывается уравнением параболы второго порядка:

то система нормальных уравнений имеет вид:

Оценка обратной зависимости между х и у, когда с увеличением (уменьшением) х уменьшается (увеличивается) значение результативного признака у, может быть осуществлена на основе уравнения гиперболы вида:

Система нормальных уравнений для нахождения параметров гиперболы следующая:

Множественная (многофакторная) регрессия. Изучение связи между тремя и более связанными между собой признаками носит название множественной (многофакторной) регрессии, описываемой функцией вида:

Построение моделей множественной регрессии включает этапы:

1) выбор формы связи (уравнения регрессии);

2) отбор факторных признаков;

3) обеспечение достаточного объема совокупности для получения несмещенных оценок.

Выбор типа уравнения затрудняется тем, что для любой формы зависимости можно выбрать целый ряд уравнений, которые в определенной степени будут описывать эти связи. Поскольку уравнение регрессии строится главным образом для объяснения и количественного выражения взаимосвязей, оно должно хорошо отражать сложившиеся между исследуемыми факторами фактические связи.

Практика построения многофакторных моделей взаимосвязи показывает, что все реально существующие зависимости между социально-экономическими явлениями можно описать, используя пять типов моделей:

1) линейную:

2) степенную:

3) показательную:

4) параболическую:

5) гиперболическую:

Основное значение имеют линейные модели в силу простоты и логичности их экономической интерпретации. Нелинейные формы зависимости приводятся к линейным путем линеаризации.

Важным этапом построения уже выбранного уравнения множественной регрессии являются отбор и последующее включение факторных признаков.

Проблема отбора факторных признаков для построения моделей взаимосвязи может быть решена на основе эвристических (интуитивно-логических) или многомерных статистических методов анализа.

Наиболее приемлемым способом отбора факторных признаков является шаговая регрессия (шаговый регрессионный анализ). Сущность метода шаговой регрессии заключается в последовательном включении факторов в уравнение регрессии и последующей проверке их значимости. Факторы поочередно вводятся в уравнение так называемым «прямым методом». При проверке значимости введенного фактора определяется, насколько уменьшается сумма квадратов остатков и увеличивается величина множественного коэффициента корреляции (R2). Одновременно используется и обратный метод, т. е. исключение факторов, ставших незначимыми на основе t -критерия Стьюдента.

При построении моделей регрессии студент может столкнуться и с проблемой мультиколлинеарности, под которой понимается тесная зависимость между факторными признаками, включенными в модель. Мультиколлинеарность существенно искажает результаты исследования.

Одним из индикаторов определения наличия мультиколлинеарности между факторными признаками является превышение величины парного коэффициента корреляции 0,8 (rxiyi > 0,8).

Устранение мультиколлинеарности может реализовываться через исключение из корреляционной модели одного или нескольких линейно-связанных факторных признаков или преобразование исходных факторных признаков в новые, укрупненные факторы.

Пример. По данным о сумме активов (у),кредитных вложений (x1) и величине собственного капитала (х2)коммерческих банков одного из регионов РФ построить множественное уравнение связи. Связь предполагается линейной. Расчетная таблица для определения параметров уравнения регрессии представлена в табл. 9.3

Номер банка Сумма активов, млн руб. y Кредитные вложения, млн руб.,x1 Собственный капитал, млн руб.,x2 yx1 x2 y2 x1x2 x22 ух2
        7 927 296 6 230 016 10 086 976   43 681 663 784 3 153
        6 015 492 3 849 444 9 400 356 394 362 40 401 616 266 3 000
        2 302 803 613 089 8 649 481 138 591   520 557 2 554
        2 634 043 1739 761 3 988 009 179 384 18 496 271 592  
        2 129 830 1 304 164 3 478 225 199 850 30 625 326 375 2 533
        785 652 432 964 1 425 636 57 904 7 744 105 072  
        161 098 96 721 268 324 18 660 3 600    
Итого 14 757     21956 214 14 266 159 37 297 007 1510 415 175 876 2 534726 14 757

Решение

Система нормальных уравнений имеет вид:

Расчеты показали, что с увеличением кредитных вложений на 1 млн. руб. и собственного капитала коммерческих банков на 1 млн. руб. стоимость их активов возрастает соответственно в среднем на 0,0368 и 16,77 млн. руб.

Оценка существенности связи. Принятие решений на основе уравнения регрессии. Проверка адекватности моделей, построенных на основе уравнений регрессии, начинается с проверки значимости каждого коэффициента регрессии.

Значимость коэффициента регрессии осуществляется с помощью t-критерия Стьюдента:

где — дисперсия коэффициента регрессии.

Параметр модели признается статистически значимым, если tp > tkp (α; v = п - к - 1),

где α — уровень значимости;

v = п — к— 1 — число степеней свободы.

Величина может быть определена по выражению

где — дисперсия результативного признака;

к - число факторных признаков в уравнении.

Более точную оценку величины дисперсии можно получить по формуле

где Ri — величина множественного коэффициента корреляции по фактору х, с остальными факторами.

Проверка адекватности всей модели осуществляется с помощью расчета F-критерия и величины средней ошибки аппроксимации ().

Значение средней ошибки аппроксимации, определяемой по формуле

не должно превышать 12—15%.

Интерпретация моделей регрессии и регрессии осуществляется методами той отрасли знаний, к которой относятся исследуемые явления. Но всякая интерпретация начинается со статистической оценки уравнения регрессии в целом и оценки зависимости входящих в модель факторных признаков, т. е. с выяснения, как они влияют на величину результативного признака. Чем больше величина коэффициента регрессии, тем значительнее влияние данного признака на моделируемый. Особое значение при этом имеет знак перед коэффициентом регрессии. Знаки коэффициентов регрессии говорят о характере влияния на результативный признак. Если факторный признак имеет знак плюс, то с увеличением данного фактора результативный признак возрастает. Если факторный признак имеет знак минус, то с его увеличением результативный признак уменьшается. Анализ модели по данным табл. 9.3 свидетельствует о том, что увеличение кредитных вложений и собственного капитала влечет рост стоимости активов коммерческих банков.

С целью расширения возможностей экономического анализа используются частные коэффициенты эластичности, определяемые по формуле

где — среднее значение соответствующего факторного признака;

- среднее значение результативного признака;

аi - — коэффициент регрессии при соответствующем факторном признаке.

Коэффициент эластичности показывает, на сколько процентов в среднем изменится значение результативного признака при изменении факторного признака на 1%.

Пример. Рассчитаем коэффициент эластичности по данным табл. 9.3:

Это означает, что при увеличении кредитных вложений и собственного капитала на 1% стоимость активов в среднем возрастает соответственно на 0,02 и 1,19%.

Частный коэффициент детерминации показывает, на сколько процентов вариация результативного признака объясняется вариацией /-го признака, входящего в множественное уравнение регрессии. Он рассчитывается по формуле

где — парный коэффициент корреляции между результативным и i-м факторным признаком;

— соответствующий коэффициент уравнения множественной регрессии в стандартизованном масштабе.

Пример. По данным табл. 9.3 рассчитаем частный коэффициент детерминации для фактора х1 - кредитные вложения (млн руб.):

, что свидетельствует о том, что 2% вариации стоимости активов объясняются изменением величины кредитных вложений.

Для фактора х2 (собственный капитал)

На 88% изменение стоимости активов объясняется изменением собственного капитала рассмотренных коммерческих банков РФ.

Множественный коэффициент детерминации (R2),представляющий собой множественный коэффициент корреляции в квадрате, показывает, какая доля вариации результативного признака обусловлена изменением факторных признаков, входящих в многофакторную регрессионную модель.

Для более точной оценки влияния каждого факторного признака на моделируемый используется Q-коэффициент, определяемый по формуле

где — коэффициент вариации соответствующего факторного признака.

Пример. По данным табл. 9.3 рассчитаем Q-коэффициент. Qx1 для фактора х1 — кредитные вложения равен:

Qx2 - для фактора х2 — собственный капитал равен:

.

Вывод: наиболее существенно влияние фактора х2.

Собственно-корреляционные параметрические методы изучения связи. Оценка существенности корреляции. Изменение тесноты и направления связи является важной задачей изучения и количественного измерения взаимосвязи социально-экономических явлений.

Теснота связи при линейной зависимости измеряется с помощью линейного коэффициента корреляции.

В статистической теории разработаны и на практике применяются различные модификации формул расчета данного коэффициента:

Производя расчет по итоговым значениям исходных переменных, линейный коэффициент корреляции можно вычислить по формуле:

Линейный коэффициент корреляции может быть также выражен через дисперсии слагаемых:

Между линейным коэффициентом корреляции и коэффициентом регрессии существует определенная зависимость, которую можно математически выразить следующей формулой:

где аi — коэффициент регрессии в уравнении связи;

— среднее квадратическое отклонение соответствующего факторного признака.

Линейный коэффициент корреляции изменяется в пределах от- 1 до 1. Знаки коэффициентов регрессии и корреляции совпадают.

Значение коэффициента связи Характер связи Интерпретация связи
г=0 Отсутствует -
0<г<1 Прямая С увеличением х увеличивается у
-1<г<0 Обратная С увеличением х уменьшается у, и наоборот
r=1 Функциональная Каждому значению факторного признака строго соответствует одно значение результативного признака

Значимость линейного коэффициента корреляции проверяется на основе t-критерия Стьюдента:

Если расчетное значение tр > tkp (табличное), то это свидетельствует о значимости линейного коэффициента корреляции, а следовательно, и о статистической существенности зависимости между х и у.

Пример. По данным табл. 9.3 оценить тесноту связи между Стоимостью активов (у) и кредитными вложениями (x1), используя различные модификации расчета линейного коэффициента корреляции. Проверить его значимость.

Решение

Связь прямая, сильная.

По другой формуле:

Результаты идентичны. Проверим значимость

а = 0,05; v = п -k- 1 = 7-2-1=4; tkp = 2,776.

Так как tp - 7,92 > tkp = 2,776, то коэффициент корреляции значим.

С целью расширения возможностей экономического анализа используются частные коэффициенты эластичности, определяемые по формуле

где — среднее значение соответствующего факторного признака;

— среднее значение результативного признака;

ai — коэффициент регрессии при соответствующем факторном признаке.





Дата публикования: 2015-11-01; Прочитано: 2003 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.036 с)...