Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Оцінка зв’язку між факторами і критерії адекватності економетричної моделі



Для оцінки зв’язку між факторами економітеричної моделі використовують критерії: коефіцієнт кореляції і коефіцієнт детермінації.

Коефіцієнт кореляції показує ступінь впливу незалежних факторів (х) і залежну змінну (у). Цей критерій використовують в парних економетричних моделях – коефіцієнт парної кореляції, і в багатофакторних економетричних моделях – коефіцієнт множинної кореляції.

Коефіцієнт кореляції показує, на яку частину середнього квадратичного відхилення змінюється функція у, якщо аргумент х збільшується (зменшується) на своє середньоквадратичне відхилення σх. Знак коефіцієнта парної кореляції співпадає із знаком коефіцієнта регресії, а його чисельне значення коливається в межах

-1≤ry/х≤1. (9.4)

Коефіцієнт парної кореляції може бути визначений наступним чином [18]:

ry/х = , (9.5)

де ry/х – коефіцієнт парної кореляції;

- середнє значення незалежної змінної Х;

- середнє значення залежної змінної У;

- середнє квадратичне відхилення показника Х;

- середнє квадратичне відхилення показника У.

Середнє квадратичне відхилення визначається за формулою

, (9.6)

де Dу - дисперсія (середній квадрат відхилення).

Відповідно дисперсія:

, (9.7)

де - середній квадрат показника У;

- квадрат середнього для показника У.

Аналогічні формули використовують і для показника х.

Приклад. Розрахуйте коефіцієнти кореляції і детермінації на основі представлених в табл. 9.1 спостережень.

Таблиця 9.1 - Таблиця вихідних даних для проведення розрахунків

Спостереження х у
     
     
     
Сума    
Середнє   4,667

Вирішення

1. Визначимо дисперсію для факторів у і х. Для цього складемо табл. 9.2.

Таблиця 9.2 – Розрахунок середніх значень показників у і х

Спостереження х у х2 у2
         
         
         
Сума        
Середнє   4,667 4,667 23,33
Квадрат середнього   21,78  

Використовуючи формулу (9.7) знайдемо дисперсію для у і х:

= 23,33 – 21,78 = 1,55;

= 4,667 – 4 = 0,667.

2. Визначимо середнє квадратичне відхилення показників у і х, використовуючи формулу (9.6):

= = 1,24;

= = 0,82.

3. Використовуючи формулу (9.5) визначимо коефіцієнт парної кореляції для у і х:

ry/х = = = 0,98.

Значення коефіцієнта парної кореляції, що характеризують силу впливу показника х на у, наводимо в табл. 9.3.

Таблиця 9.3 - Значення коефіцієнта парної кореляції

Значення коефіцієнта кореляції Сила впливу показника х на у
0,85 - 1 сильний
0,55 – 0,84 помірний
0,25 – 0,54 слабкий
0 – 0,24 дуже слабкий

Знак значення коефіцієнта парної кореляції вказує на напрямок зв’язку. Якщо знак «+», то це вказує на прямо пропорційний зв’язок між факторами, якщо навпаки – то обернений.

Коефіцієнт множинної кореляції використовують в багатофакторному економетричному аналізі. Його значення знаходиться в проміжку між 0 і 1. Сила впливу показників х на результуючий фактор у характеризується значеннями, представленими в табл. 9.3.

Коефіцієнт детермінації визначається як квадрат коефіцієнту кореляції:

Dy/x = r2y/x (9.8)

або Dy/xі= R2y/xi. (9.9)

Основними напрямками оцінки адекватності економетричної моделі є:

1. Перевірка за допомогою F-тесту (F-критерій Фішера);

2. Використання t-розподілу Ст`юдента для оцінки надійності коефіцієнта кореляції;

3. Перевірка моделі на гомо-гетескедастичність;

4. Перевірка факторів економетричної моделі на мультиколінеарність.

F-тест використовують для оцінки того, чи важливе пояснення, яке дає рівняння в цілому. Цей тест заснований на порівнянні залишкової теоретичної дисперсії 2y/х і загальної дисперсії σy2. Розглядають відношення і порівнюють з табличним (для % Фішера знайдено розподіл і складена спеціальна таблиця) при заданому рівні значущості й різних ступенях свободи.

Загальну дисперсію σy2 досліджених даних від їх середнього значення встановлюють з урахуванням числа ступенів свободи :

, (9.8)

де К – число інтервалів у вибіркових даних.

Залишкову теоретичну дисперсію 2y/х встановлюють як різниця розрахункових i і середніх інтервальних значень i з урахуванням числа ступенів свободи d1=K-P і d2=n-K,

де Р – число параметрів управління.

Якщо рас табл, то при заданому рівні значущості складене рівняння регресії використовується. Вірогідність помилки тим менше, чим більше рівень значущості α%.

У разі, коли чисельник 2y/х менше знаменника σy2, то міняємо їх місцями разом з відповідними ступенями свободи d1=K-P і d2=n-K.

Приклад. Загальна дисперсія σy2=41,5 при n=154 і К=12.

Залишкова дисперсія 2y/х=34,44 при К=12 і Р=3 (Р=3 в квадратному рівнянні регресії).

Вирішення

, оскільки σy2> 2y/х, переходимо до відношення із ступенями свободи D1=154-12=142, d2=12-3=9 розр.= =1,21,

за таблицею 5%(142,9)=2,75 20%(142,9)=1,7.

Отже, знайдене квадратне рівняння регресії з високою надійністю узгоджується з вихідними даними.

Зазначимо, що в регресійному аналізі побудова F -статистики здійснюється шляхом відношення дисперсії залежної змінної на “пояснювальні” й “непояснювальні” складові:

F = (ESS / k) / RSS / (n-k-1), (9.11)

де ESS - пояснювальна сума квадратів відхилень;

RSS – залишкова (непояснювальна) сума квадратів;

к – кількість ступенів свободи;

n – кількість значень факторів моделі.

При здійсненні F-тесту для рівняння перевіряємо, чи перевищує r2 те значення, яке може бути отримано випадково. Для розрахунку F-статистики для рівняння в цілому формулу (9.9) можна трасформувати шляхом ділення чисельника і знаменника рівняння на TSS (загальну суму квадратів), відмічаючи, що ESS/TSS дорівнює r2, а RSS/TSS дорівнює (1 - r2). У результаті отримуємо наступне рівняння:

F= r2 / к / (1 - r2) / (n – k - 1). (9.12)

Розрахунковий F-критерій визначаємо при відповідному рівні значущості і ступенях свободи і порівнюємо з критичним F-критерієм Фішера. Значення останнього критерію представлені у спеціальних таблицях. Якщо розрахунковий F-критерій перевищує його критичне значення, то можна стверджувати, що пояснення, яке дає рівняння, в цілому, важливе, а економетрична модель адекватна. У протилежному разі – модель вважається неадекватною, а пояснення неважливим.

Іншим важливим статистичним параметром для перевірки адекватності економетричної моделі є t-розподіл Ст’юдента. Він використовується для оцінки надійності коефіцієнта кореляції. У цьому випадку t-статистика для r розраховується наступним чином:

 
 

t = √n-2/1-r2. (9.13)

Вибравши рівень значущості в 5% дослідним знаходить критичне значення t з (n - 2) ступенями свободи. Якщо значення t перевищує його критичне значення (позитивний або негативний бік), то нульову гіпотезу відхиляють про те, що коефіцієнт кореляції дорівнює нулю. У цьому випадку роблять висновок про лінійний зв’язок (позитивний або негативний).

Якщо нульова гіпотеза підтверджується, то значення t буде перевищувати його критичне значення (в позитивний або негативний бік) тільки в 5% випадках. Це означає, що при виконанні перевірки ймовірності допущення помилки, що відхиляє нульову гіпотезу, коли вона фактично вірна, складає 5%.

Ймовірно, що ризик допущення такої помилки в 5% випадків досить великий для дослідника. Тоді можна скоротити ступінь ризику, здійснюючи розрахунки при рівні значущості в 1%. Критичне значення t тепер буде вище, ніж до цих пір, тому необхідна більш висока (позитивна або негативна) t- статистика для відхилення нульової гіпотези, а це означає, що потрібне більше значення коефіцієнта кореляції.

Слід вказати і на те, що t-статистика може бути розрахована як співвідношення оцінки коефіцієнта регресії на стандартну помилку.

Розглянемо методику розрахунку F-критерію і t- статистики на прикладі.

Приклад. Виконайте відповідні t -тести для багатофакторної моделі. Розрахуйте F-критерій, якщо відомо, що кількість спостережень дорівнює 25, коефіцієнт детермінації (R2) дорівнює 88%. Багатофакторна економетрична модель має вигляд

у = 55,3 + 0,093х1 + 0,087х2. (9.14)

Стандартні помилки дорівнюють: постійний член – 2,4, х1 – 0,003, х2 – 0,002.

Вирішення

Для t -тест необхідно визначити розрахунковий t-критерій. Для кожного із члену економетричного рівняння він розраховується окремо як співвідношення оцінки коефіцієнта регресії на стандартну помилку. Таким чином розрахункові t-критерій наступні:

tр1 = 55,3/2,4 = 23,04;

tр2 = 0,092/0,003 = 30,67;

tр3 = 0,067/0,002 = 43,5.

Наступним кроком проведення t -теста є порівняння розрахункових значень з табличними. Табличне значення t-критерію визначається на основі спеціальних таблиць при відповідних рівнях значущості (5% або 1%) і ступенях свободи, які визначаються (n – k – 1), де n – кількість спостережень; k – кількість факторів моделі, включаючи постійний параметр).

У нашому випадку ступені свободи дорівнюють – 25 – 4 – 1 = 20.

Табличне значення t-критерію при рівні значущості в 5% дорівнює 1,725; при 1% - 2,528.

Як бачимо розрахункові значення t-критеріїв усіх факторів моделі значно перевищують його табличні значення. Це означає, що всі фактори економетричної моделі суттєво впливають на змінний показник (у).

F-критерій визначаємо за формулою (9.10). Для розробленої економетричної моделі розрахункових F-критеріїв має наступне значення: Fр = (0,88/4) / ((1 – 0,88) / (20)) = 36,7.

Потім розрахункове значення F-критерію порівнюємо з його табличним значенням при відповідному рівні значущості й кількості спостережень.

При 5% рівні значущості для 25 спостережень табличний F-критерій дорівнює 2,99, при 1% - 29,46.

Таким чином, розрахункові значення F-критерію більше табличних, що вказує на суттєвий рівень пояснення причинно-наслідкових зв’язків економітричної моделі.

Наступним етапом оцінки адекватності економетричної моделі є перевірка її на гетеро- або гомоскедастичність. Гомоскедастичність означає однаковий розподіл фактичних значень вибірки змінних. Тобто фактичні значення спостережень іноді будуть позитивними, іноді негативними, іноді – відносно близькими до нуля, проте в апріорі відсутні причини появи великих відхилень між спостереженнями.

Разом з тим для деяких вибірок, можливо, більш доцільно припустити, що теоретичний розподіл випадкового члену є різним для різних спостережень. Це не означає, що випадковий член обов’язково матиме особливо більші (позитивні або негативні) значення в кінці вибірки, але це означає, що апріорна ймовірність отримання більш відхилених значень буде відносно висока. Це є прикладом гетероскедастичності, що означає “неоднаковий розподіл”.

Гетероскедастичність стає проблемою, коли значення змінних, які включаються в рівняння регресії, значно відрізняються в різних спостереженнях. Якщо залежність може буде описана рівнянням, в якому економічні показники змінюють свій масштаб одночасно, то зміна значень невключених змінних і помилок виміру, впливаючи разом на випадковий член, роблять його порівняно незначними при незначних у і х і порівняно великими – при великих у і х.

Досить часто можна виявити проблему гетероскедастичності. У таких умовах можна здійснити відповідні дії з виключення цього ефекту на етапі специфікації моделі регресії, це дозволить зменшити або, можливо, усунути необхідність формальної перевірки. У даний час запропонована значна кількість тестів (і, відповідно, критеріїв для них). Найбільш поширеними з них є: тест рангової кореляції Спірмена.

При виконання тесту рангової кореляції Спірмена припускається, що дисперсія випадкового члену буде або збільшуватися, або зменшуватися відповідно до збільшення змінної х, тому в регресії абсолютні значення залишків і значення х будуть корельовані. Дані по х і залишки впорядковуються, і коефіцієнт рангової кореляції визначається як

rx,e = 1 – (6ΣD2i/n(n2 - 1)), (9.15)

де Di – різниця між рангом х і рангом помилки е;

е – залишки.

Коли припускати, що відповідний коефіцієнт кореляції для генеральної сукупності дорівнює нулю, то коефіцієнт рангової кореляції має нормальний розподіл з математичним очікуванням 0 і дисперсією 1/(n - 1) в більших вибірках. Таким чином, відповідна тестова статистика дорівнює rx,e , при використанні двобокового критерію нульова гіпотеза про відсутність гетероскедастичності буде відхилена при рівні значущості в 5%, якщо вона перевищує 1,96, і при рівні значущості в 1%, якщо вона перевищує 2,58. Якщо в моделі регресії знаходиться більше однієї пояснювальної змінної, то перевірка гіпотези може здійснюватися з використанням іншої з них.

Використовують й інші критерії для оцінки гетероскдастичності. Зокрема, критерій, запропонований С. Голдфелдом і Р. Квандтом та критерій Глейзера.

У цьому розділі представлені основні критерії і тести щодо оцінки адекватності моделі. В економетричних дослідженнях можна використовувати й інші тести та критерії. Представлені критерії оцінки адекватності економетричної моделі дають змогу отримати більш ґрунтовні й, насамперед, об’єктивні результати тих економічних процесів, які відбуваються на підприємстві для прийняття ефективних управлінських рішень.





Дата публикования: 2014-11-02; Прочитано: 3966 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.014 с)...