Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Тема 5. Статистичні методи вивчення взаємозв'язків



При вивченні цієї теми насамперед потрібно добре засвоїти по­няття про види і форми існуючих зв'язків між суспільно-економічними явищами. Необхідно знати, що ознака, яка характеризує причину чи умову, є факторною (х), а ознака, яка характеризує наслідок — результативною (у).

Основною характеристикою кореляційного зв'язку є лінія регресії, тобто функція, що зв'язує середні значення ознаки „у” зі значеннями ознаки „ х”. У статистиці найпоширенішими методами вивчення кореляційних зв'язків є метод аналітичного групування та кореляційно-регресійний метод. Процес реалізації цих двох методів включає такі етапи: 1) теоретичне обгрунтування моделі; 2) оцінка лінії регресії; 3) вимірювання тісноти зв'язку між ознаками, що вивчаються; 4) перевірка істотності зв'язку.

Суть аналітичного групування полягає в тому, що одиниці сукуп­ності групують за факторною ознакою „х”, а потім для кожної виділеної групи підраховують число одиниць сукупності і обчислюють середнє значення результативної ознаки „ у”. Якщо залежно від зміни значень фак­торної ознаки змінюються якимось чином і середні значення результа­тивної ознаки, то робиться висновок про наявність і напрям зв'язку між ними: зв'язок прямий — збільшення „ х” приводить до збільшення „ у”; зв'я­зок зворотній — зі збільшенням „ х” зменшується „ у”; відсутність будь-якої систематичності у зміні „ у” зі зміною „ х” свідчить про відсутність зв'язку між ними.

На першому етапі побудови аналітичного групування розв'язу­ються два питання: вибір факторної і результативної ознаки та визна­чення числа груп та їх меж для кожної з ознак. Слід пам'ятати, що типовість та сталість групових середніх залежить від числа одиниць сукупності у кожній групі.

На другому етапі проводиться оцінка лінії регресії - у кожній групі, виділеній за факторною ознакою, обчислюються середні значення результативної ознаки.

Третій етап аналітичного групування, який полягає у вимірюванні тісноти зв’язку між факторною і результативною ознаками та грунтується на правилі складання дисперсій (),передбачає розрахунок показників η2 та η .

Для оцінки щільності криволінійного зв’язку слугує емпіричний коефіцієнт детермінації η2:

де d2 – міжгрупова дисперсія;

sо2 – загальна дисперсія результативної ознаки у сукупності.

Загальна дисперсія :

де - середня з квадратів індивідуальних значень “у” в сукупності;

- квадрат загальної середньої із індивідуальних значень “у” в сукупності.

Міжгрупова дисперсія d2:

де – середнє значення результативної ознаки у відповідних групах;

– загальна середня для всієї сукупності;

nj – число спостережень у j-й групі, j=1,2,… k;

k – число виділених груп.

η2 коливається в межах від 0 до 1 і характеризує частку варіації резуль­тативної ознаки, поясненої варіацією факторної ознаки. Другим показником, який використовується для оцінки криволінійного зв’язку є емпіричне кореляційне відношення η, яке визначається як корінь квадратний з η2.

На останньому етапі для перевірки істотності зв'язку слід викори­стати критичні значення η2 або критичні значення F-критерію.

Розрахункові значення F-критерію обчислюють за формулами

або

де k1, k2 - число ступенів вільності;

k1 = m - 1, m—число груп;

k2 = n - m, n—число одиниць сукупності.

Розрахункові значення η2 і F-критерію необхідно порівняти з критич­ними для рівнів істотності або . Якщо фактичні значення η2 і F-критерію перевищують відповідні критичні, то зв'язок між ознаками визнається істотним. Якщо фактичні значення η2 і F-критерію менше відповідних критичних, то висновок залишається невизначеним, а наявність або відсутність зв'язку - не доведеною.

В основі кореляціино-рсгресійного аналізу лежить припущення, що залежність між факторною і результативною ознаками може бути виражена функцією Υ=f(x), яка називається рівнянням регресії.

3а аналітичним виразом залежність може бути лінійною і нелінійною. Найбільш поширені такі рівняння регресії:

Y = a+bx – лінійне;

Y = abx – показникове;

Y = axb – степеневе;

Y = a+bx+cx2 – параболічне;

- гіперболічне,

де Y – теоретичні значення результативної ознаки; a, b і с — параметри рівняння регресії, які називаються коефіцієнтами регресії.

При обгрунтуванні моделі, як і в аналітичному групуванні, розв'язуються два пи­тання: вибір факторної і результативної ознаки та вибір виду рівняння регресії.

Правильний вибір ознак і виду рівняння регресії потребує теоре­тичного аналізу взаємозв'язку між ознаками. Для підтвердження правильності вибору виду рівняння регресії часто застосовується графічне зображення зв'язку у вигляді кореляційного поля. При його побудові на осі абсцис треба відкласти значення факторної ознаки „ х”, а на осі ординат — результа­тивної ознаки „ у”. Кожній одиниці сукупності на графіку відповідає окре­ма точка. За формою розміщення точок на кореляційному полі робиться висновок відносно виду регресійного рівняння. При великому обсязі су­купності доцільно на графіку зображати групові середні попередньо по­будованого аналітичного групування. Лінію групових середніх називають емпіричною лінією регресії.

Для визначення виду рівняння регресії застосовується також спосіб перебору функцій, коли обчислюють рівняння регресії різних видів і з них на основі статистико-математичних критеріїв вибирають найкраще.

На етапі оцінки лінії регресії визначають параметри обраного рівняння методом найменших квадратів на основі побудови і розв'язу­вання відповідної системи нормальних рівнянь. Лінійній функції відповідає систем таких рівнянь з двома невідомими:

Особливу увагу слід звернути на інтерпретацію параметрів лінійного рівняння регресії а і b. Параметр b, що називається коефіцієнтом регресії, показує на скільки одиниць власного виміру змінюється середнє значення результативної ознаки зі збільшенням факторної ознаки на одиницю власного вимірювання. Па­раметр а — теоретичне значення „ у” для x = 0, якщо 0 знаходиться в ме­жах фактичної варіації ознаки „ x”. У іншому разі параметр „а” не має реального змісту.

Тісноту лінійного зв'язку можна виміряти за допомогою лінійного коефіцієнта кореляції r, що може бути визначений за однією з формул:

або:

де і - середні значення факторної і результативної ознаки;

σx і σу — середні квадратичні відхилення відповідних ознак;

xi – значення факторної ознаки, і=1,2,…n;

уi – значення результативної ознаки, і=1,2,…n;

n – кількість пар ознак xi та уi у досліджуваній сукупності.

Цей показник коливається в межах від -1 до +1 і характеризує не тільки тісноту, але і напрям зв'язку. Чим ближчим до ±1 є значення лінійного коефіцієнта кореляції, тим тіснішим є зв’язок, знак при цьому вказує його напрям: „-„ – зворотній, „+” – прямий зв’язок.

Для якісної характеристики тісноти зв'язку використовуються такі характеристики:

Значення r 0,1—0,3 0,3—0,5 0,5—0,7 0,7—0,9 0,9—0,99
Оцінка тісно­ти зв'язку Слаба Помірна Помітна Значна Дуже значна

Крім того, існують і інші способи оцінки суттєвості лінійного коефіцієнта кореляції.

Приклад № 3. За даними про витрати на рекламу та кількість туристів, що звернулися до туристичних фірм, необхідно визначити наявність та щільність зв’язку між ознаками, а також рівняння регресії у випадку, якщо такий зв’язок існує.

Таблиця 7

Дані про витрати фірм на рекламу та кількість туристів

№ фірми Витрати на рекламу, тис. грн. Кількість туристів, чол. Xi·Yi Xi2 Yi2
n Xi Yi
           
           
           
           
           
           
           
           
           
           
           
           
           
           
           
           
           
           
           
           
           
Разом          

Лінійний коефіцієнт кореляції r:

t-критерій Стьюдента використовується як один із критеріїв оцінки істотності лінійного коефіцієнта кореляції:

5,871>tтабл= 2,878 для к=20-2=18 (ступенів свободи)

Емпіричний коефіцієнт детермінації η2:

де d2 – міжгрупова дисперсія;

sо2 – загальна дисперсія результативної ознаки у сукупності.

Загальна дисперсія :

де - середня з квадратів індивідуальних значень “у” в сукупності;

- квадрат загальної середньої із індивідуальних значень “у” в сукупності.

Обидві середні величини та :

Загальна дисперсія :

Міжгрупова дисперсія d2:

де – середнє значення результативної ознаки у відповідних групах;

– загальна середня для всієї сукупності;

nj – число спостережень у j-й групі, j=1,2,… k;

k – число виділених груп.

Дані, необхідні для обчислення міжгрупової дисперсії (табл.2):

Коефіцієнт детермінації h2 та емпіричне кореляційне відношення h:

та

Таблиця 8

Розрахунково-аналітичні дані вивчення взаємозв’язку між показником витрат на рекламу та кількістю туристів, які звернулися до фірм

Групи за факторною ознакою, хі Число фірм у групі, nj Середнє значення результативної ознаки у групі,    
      79218,75
      42781,25
      911,25
      48400,0
      62268,75
fy   952,5 236580,0

Оскільки (h2-r2) <0,1 – форма залежності між “х” та “у” – лінійна.

Коефіцієнт регресії (параметр „b”) та параметр „а” для лінійної залежності визначаються відповідно за формулами:

та

Визначимо параметри „b” та „а” за даними табл.1:

Тоді рівняння регресії набуває вигляду:

Коефіцієнт еластичності показує на скільки % змінюється результативна ознака при зміні факторної ознаки на 1%:

Індекс кореляції використовується для оцінки адекватності обраного рівняння регресії:

де - індекс кореляції.

Індекс кореляції:

Оскільки індекс кореляції →1, то параметри рівняння регресії обрано вірно.





Дата публикования: 2014-11-29; Прочитано: 949 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.014 с)...