Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Алгоритм корреляционно-регрессионного анализа парной связи



Алгоритм расчета при корреляционно-регрессионном анализе связи парной корреляции состоит из ряда этапов.

Этап 1. Производится отбор наиболее важных существенных факторов, влияющих на результативный показатель.

При отборе факторов учитываются причинно-следственные связи между показателями, причем все факторы должны быть количественно измеримы.

При отборе факторов для корреляционной модели используют аналитические группировки, способ сравнения параллельных и динамических рядов, линейные графики. Они позволяют определить наличие, направление и форму зависимости между изучаемыми показателями.

Отобранные для анализа показатели и результаты наблюдений за их изменением помещаются в таблицу, в которой факторные признаки располагаются в порядке возрастания или убывания, то есть ранжируются.

Этап 2. Данные из таблицы наносятся на плоскость координат – строится корреляционное поле (график).

Этап 3. Производится обоснование формы связи между факторами и результативным показателем:

по форме корреляционного поля (размещению точек на графике);

путем визуального анализа ранжированного ряда.

Форма связи определяет дальнейшие действия корреляционного анализа.

Этап 4. Выбор и решение уравнения регрессии.

В условиях использования ПЭВМ выбор модели (уравнения), описывающего зависимость между показателями, осуществляется перебором решений, наиболее часто применяемых в анализе парной корреляции уравнений регрессии.

Если связь носит прямолинейный характер, то наиболее простым уравнением, характеризующим зависимость между двумя показателями, является уравнение прямой:

,

где х – факторный показатель;

у – результативный признак;

а и b – параметры уравнения регрессии.

Прямолинейное уравнение парной регрессии показывает равномерное возрастание или убывание результативного признака с изменением факторного.

Коэффициент регрессии b показывает, на сколько единиц в среднем изменяется результативный признак у с изменением на одну единицу факторного признака х. Эта величина на графике показывает угол наклона прямой.

Свободный член а показывает начальную ординату, то есть расстояние от начала координат до пересечения прямой с осью у.

Значения коэффициентов определяются методом наименьших квадратов (МНК). В соответствии с этим методом регрессионная зависимость определяется так, чтобы сумма квадратов отклонений вычисляемых значений от полученных опытным путем была минимальной, то есть:

;

где – число опытов.

Q принимает минимальное значение, если частные производные

и .

После дифференцирования получим:

Полученные уравнения называются нормальными уравнениями МНК для прямой линии.

Приравняв обе части к 0 и умножив их на , получим:

Суммируя каждый член уравнения в отдельности, получим:

Система нормальных уравнений будет иметь вид:

Таким образом, при решении этой системы уравнений могут быть вычислены оба параметра уравнения линейной регрессии.

Для измерения тесноты связи между показателями используется коэффициент корреляции.

При прямолинейной форме связи коэффициент корреляции рассчитывается по формуле:

.

Коэффициент корреляции может быть представлен и как среднее значение произведений нормированных отклонений .

.

Нормированные отклонения определяются по формулам:

; ,

где – средние квадратичные отклонения:

; .

Коэффициент корреляции может принимать значения от 0 до 1:

если , то связь между показателями отсутствует;

если , то связь между показателями – функциональная, то есть более тесная;

если – отрицательная величина, то связь между показателями обратная, то есть параметры х и у связаны убывающей зависимостью.

Применение корреляционно-регрессионного анализа рассмотрим на примере прямолинейной зависимости между фактором х и результативным признаком у.

Пример №1: Имеются данные по фирме (таблица 5.1). Провести корреляционно-регрессионный анализ зависимости суммы прибыли (Yi,) от объема выручки (Xi).

Таблица 5.1

Исходные данные

Год/квартал      
                   
Выручка (Xi), млн. р.                    
Прибыль (Yi,) млн.р. 11,8 12,9   13,7 14,1 15,4 15,8 15,1   16,5

1. На основе исходных данных строим корреляционное поле (рисунок 4.1).

Рис. 5.1 Корреляционное поле зависимости прибыли от выручки

Расположение точек позволяет предположить, что связь между показателями линейная, и за уравнение регрессии принимаем уравнение прямой:

.

2. Определим тесноту связи между исследуемыми показателями.

Для этого рассчитываем коэффициент корреляции:

Результаты промежуточных расчетов представлены в таблице 5.2.

Таблица 5.2

№ n/n
    11,8 -8,9 -2,63 79,21 6,9169   212,4 139,24
    12,9 -5,9 -1,53 34,81 2,3409   270,9 166,41
      -6,9 -1,43 47,61 2,0449      
    13,7 -0,9 -0,73 0,81 0,5329   356,2 187,69
    14,1 1,1 -0,33 1,21 0,1089   394,8 198,81
    15,4 3,1 0,97 9,61 0,9409     237,16
    15,8 4,1 1,37 16,81 1,8769   489,8 249,64
    15,1 2,1 0,67 4,41 0,4489   437,9 228,01
      5,1 1,57 26,01 2,4649      
    16,5 7,1 2,07 50,41 4,2849     272,25
Σ   144,3 - - 270,9 21,961     2104,2
  26,9 14,43 - - 27,09 2,1961 750,7 395,7 210,42

Тогда

.

Коэффициент корреляции r > 0, то есть связь между параметрами X и Y прямая (чем больше выручка, тем больше прибыль).

Коэффициент корреляции r = 0,978 входит в интервал (0,9 – 0,99), что по справочной шкале говорит о том, что сила связи между показателями весьма высокая.

3. Проверим значимость коэффициента корреляции.

Проверка осуществляется с помощью случайной величины T (T -критерий Стьюдента):

Найдем по таблице Tкр для числа степеней свободы n – 2 = 8 и уровня значимости a = 0,05:

Tкр = 2,3060.

Тнабл .> Tкр, следовательно, коэффициент корреляции значим, то есть корреляция имеет место.

4. Для того чтобы провести регрессионный анализ показателей, составим уравнение регрессии

Параметры уравнения определяются методом наименьших квадратов, то есть решается система уравнений:

Для данной задачи получаем:

Решая систему уравнений, получим коэффициенты: , .

Тогда уравнение регрессии:

Из уравнения регрессии следует, что при увеличении выручки на 1 млн. руб, прибыль возрастет на 0,28 млн.р.

Полученный результат может быть использован для прогноза дальнейшей деятельности фирмы.

На рис. 5.2 построен график этой зависимости и получено уравнение регрессии в Excel с использованием линии тренда.

Рис. 5.2. График зависимости суммы прибыли от выручки.

Если связь между показателями криволинейная, то прежде всего определяются теоретические значения ух с помощью уравнения регрессии, которое описывает связь между изучаемыми показателями.

Нелинейная форма связи может быть представлена уравнением гиперболы, параболы, логарифмической функцией и т.д.

Если при увеличении одного показателя значения другого возрастают до определенного уровня, а потом начинают снижаться (например, зависимость производительности труда рабочих от их возраста), то для записи такой зависимости лучше всего подходит уравнение параболы второго порядка:

В соответствии с требованиями метода наименьших квадратов для определения параметров а, b и c необходимо решить систему трех уравнений:

Если при увеличении одной переменной значения другой увеличиваются до определенного уровня, а потом прирост снижается, то для записи криволинейной зависимости используется уравнение гиперболы:

Для определения ее параметров необходимо решить следующую систему:

При более сложном характере зависимости между показателями используются более сложные функции.

Таким образом, используя тот или иной тип математического уравнения, можно определить степень зависимости между изучаемыми явлениями, то есть узнать, на сколько единиц изменяется величина результативного показателя с изменением факторного на единицу.

Для измерения тесноты связи при криволинейной форме зависимости используется корреляционное отношение. Корреляционное отношение, или коэффициент корреляции, дает количественную оценку тесноты связи, характеризует силу влияния факторных признаков на результативные.

Количественная оценка тесноты связи в зависимости от корреляционного отношения приведена в табл. 4.3

Таблица 4.3

Количественная оценка тесноты связи при различных значениях корреляционного отношения

Величина корреляционного отношения 0,1 – 0,3 0,3 – 0,5 0,5 – 0,7 0,7 – 0,9 0,9 – 0,99
Теснота связи Слабая Умеренная Заметная Высокая Весьма высокая

Общая формула корреляционного отношения:

,

где – среднее квадратичное отклонение у от теоретических значений ух, а ух определяется на основе уравнений регрессии;

– среднее квадратичное отклонение фактических значений у от среднего .

; .

Если коэффициент корреляции возвести в квадрат, то получим коэффициент (индекс) детерминации, который показывает, чему равна доля влияния изучаемого фактора на совокупный показатель.

При значениях тесноты связи меньше 0,7 величина индекса детерминации d всегда будет меньше 50%. Это означает, что на долю вариации факторного признака х приходится меньшая доля по сравнению с другими признаками, влияющими на изменение результативного показателя.

Если значения показателей тесноты связи более 0,7, выбирается уравнение регрессии, с помощью которого описывается форма связи между показателями.

Пример №2: Провести корреляционно-регрессионный анализ зависимости производительности труда (у) от возраста работников (х).

Исходные данные приведены в таблице 4.4.

Таблица 4.4

Средний возраст по группе() Среднемесячная выработка()
  4,2
  4,8
  5,3
  6,0
  6,2
  5,8
  5,3
  4,4
  4,0

1. На основе исходных данных строим корреляционное поле (рис4.3)

По расположению точек можно предположить, что данная зависимость криволинейная. Следовательно, для определения связи между показателями будем использовать уравнение параболы второго порядка:

Рис. 4.3. Корреляционное поле зависимости среднемесячной выработки от возраста рабочих

2. Составим уравнение регрессии.

Необходимо решить систему трех уравнений:

Для этого находим значения на основании исходных данных. Результаты расчета представим в табл. 4.5.

Таблица 4.5

Зависимость производительности труда (у) от возраста работников (х)

  4,2 2,0 8,4 4,00 16,8 8,00   3,93
  4,8 2,5 12,0 6,25 30,0 15,62   4,90
  5,3 3,0 15,9 9,00 47,7 27,00   5,55
  6,0 3,5 21,0 12,25 73,5 42,87   5,95
  6,2 4,0 24,8 16,00 99,2 64,00   6,05
  5,8 4,5 26,1 20,25 117,4 91,13   5,90
  5,3 5,0 26,5 25,00 132,5 125,00   5,43
  4,4 5,5 24,2 30,25 133,1 166,40   4,78
  4,0 6,0 24,0 36,00 144,0 216,00   3,70
Всего: 46,0 36,0 183,0 159,00 794,0 756,00   46,00

Подставив полученные значения в систему уравнений, получим:

Параметры а, b и c находятся с помощью определителей.

Сначала находим общий определитель:

затем частные определители :

Отсюда

Тогда уравнение регрессии будет иметь вид:

Если подставить в данное уравнение соответствующие значения х, то получим выравненные значения производительности труда в зависимости от возраста рабочих. Результаты приведены в последней графе табл. 2.

Из таблицы видно, что производительность труда рабочих повышается до 40-летнего возраста, после чего начинает снижаться. Значит, те предприятия, которые имеют больше работников 30 – 40-летнего возраста, будут иметь и более высокие показатели производительности труда при прочих равных условиях. Этот фактор необходимо учитывать при планировании уровня производительности труда и при подсчете резервов ее роста.

3. Для определения тесноты связи между показателями используем корреляционное отношение, которое находим по формуле:

где ,

Расчет исходных данных для определения корреляционного отношения представлены в таблице 4.6.

Таблица 4.6

Исходные данные для определения корреляционного отношения

4,2 3,93 -0,9 0,81 +0,27 0,073
4,8 4,90 -0,3 0,09 -0,10 0,010
5,3 5,55 +0,2 0,04 -0,25 0,062
6,0 5,95 +0,9 0,81 +0,05 0,003
6,2 6,05 +1,1 1,21 +0,15 0,022
5,8 5,90 +0,7 0,49 -0,10 0,010
5,3 5,43 +0,2 0,04 -0,13 0,017
4,4 4,78 -0,7 0,49 -0,38 0,144
4,0 3,70 -1,1 1,21 +0,30 0,090
46,0 46,0 5,19 0,431

Подставив полученные значения в формулу корреляционного отношения, получим:

Следовательно, зависимость между показателями весьма высокая.

На рис. 4.4 построен график этой зависимости и получено уравнение регрессии в Excel с использованием линии тренда.

Рис. 4.4. График зависимости производительности труда от возраста рабочих.





Дата публикования: 2015-01-09; Прочитано: 1571 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.021 с)...