![]() |
Главная Случайная страница Контакты | Мы поможем в написании вашей работы! | |
|
|
1. Основні задачі теорії кореляції.
2. Побудова прямої лінії регресії.
3. Нелінійна кореляція.
1. Нехай задано дві випадкові величини – X і Y. Можливі такі ситуації.
1) X та Y – незалежні величини: зміна Х не впливає на розподіл Y.
2) X та Y пов’язані функціональною залежністю.
3) Між X та Y існує статистична (стохастична) залежність: одному й тому ж значенню величини X відповідає статистична сукупність значень величини Y. Якщо, зокрема, при зміні однієї величини (X) змінюється середнє значення другої (
), то статистична залежність називається кореляційною. Таким чином, кореляційна залежність – це функціональна залежність між значеннями величини X та умовними середніми значеннями випадкової величини Y.
Кореляція називається неповною, коли одній величині (наприклад, X) надаються певні фіксовані значення х1, х2,…,хк і для кожного з них шляхом експерименту знаходять сукупність значень величини Y. Кореляція називається повною, коли кожен із відібраних елементів статистичної сукупності об’єктів досліджується відразу і по Х, і по Y.
а) питання про форму кореляційного зв’язку між Х і Y;
б) оцінка тісноти кореляційного зв’язку між Х і Y.
Розв’язання задачі а) зводиться до підбору певного виду функціональної залежності, а задачі б) – визначення того, наскільки близька досліджувана залежність до вибраної функціональної.
Задача а) розв’язується за допомогою регресій. Емпірична лінія регресії – це ламана лінія, яка з’єднує точки з координатами Aі (xі,
) (тут
– умовна середня (і=1,2,…,n)). Теоретично лінією регресії Y по Х називається лінія, яка “згладжує” емпіричну лінію регресії. Рівняння цієї лінії дає наближений аналітичний вираз регресії.
Кореляційна залежність між випадковими величинами Х та Y називається лінійною кореляцією, якщо теоретичні рівняння регресії Y по Х та Х по Y лінійні. В противному випадку кореляційна залежність називається нелінійною.
2. Параметри теоретичного рівняння прямої лінії регресії Y по Х знаходять у такий спосіб.
А) Якщо дано n точок (
) (і=1,2,…, n), шукають рівняння виду
. Згідно з методом найменших квадратів, мінімізують суму квадратів відхилень виду
. Виходячи з цієї вимоги, одержують:
.
Аналогічно можна знайти рівняння прямої лінії регресії Х по Y:
Зауважимо, що коефіцієнт
можна представити у вигляді
де σх та σу – вибіркові середні квадратичні відхилення, а R вибірковий коефіцієнт кореляції:

Цей коефіцієнт – статистична оцінка теоретичного коефіцієнта кореляції p, який визначається за формулою: 
Б) Якщо дані спостереження над випадковими величинами Х і Y задані кореляційною таблицею розмір n х m з рівновіддаленими варіантами, то рівняння прямої лінії регресії Y по Х зручно шукати у формі
де
та
– вибіркові середні випадкових величин Х і Y відповідно, а rху – вибірковий коефіцієнт кореляції, представлений у вигляді
причому wij – емпірична ймовірність появи значення (хі,
), n – кількість спостережених варіант випадкової величини X, m – кількість спостережених варіант випадкової величини Y.
Нехай результати спостережень задані кореляційною таблицею з рівновіддаленими варіантами, причому h1 – крок варіант випадкової величини Х, а h2 – крок варіант випадкової величини Y. Для полегшення розрахунків переходять до умовних варіант U і V, користуючись співвідношенням
де C1 і C2 – “хибні нулі” варіант випадкових величин Х і Y. Вибірковий коефіцієнт кореляції
=
, де
причому

У рівняння прямої регресії виходять величини
які обчислюють за допомогою формул 
ПРИКЛАД. Знайти вибіркове рівняння прямої регресії Y по Х за даними кореляційної таблиці 1.
Таблиця 1
| Х | Y | nx | ||||
| - - - | - - | - - | - - | - - - | ||
| ny |
Розв’язування. Перетворимо кореляційну таблицю 1, ввівши умовні варіанти
Замінимо частоти емпіричними ймовірностями. Отримаємо таблицю 2.
Таблиця 2
| U | V | wu | ||||
| -2 | -1 | |||||
| -2 -1 | 0,09 0,02 - - - | 0,09 0,10 0,03 - - | - 0,11 0,15 0,06 - | - - 0,12 0,10 0,01 | - - - 0,07 0,05 | 0,18 0,23 0,30 0,23 0,06 |
| wv | 0,11 | 0,22 | 0,32 | 0,23 | 0,12 |
Визначимо
:
;

Знайдемо
:
;

Обчислимо
:

Далі знайдемо суму

Знайдемо вибірковий коефіцієнт кореляції:

Звідси маємо:
,
Обчислюємо середні квадратичні відхилення:

Таким чином, вибіркове рівняння регресії має вигляд
або 
3. Припустимо, що точки кореляційного поля ґрупуються навколо деякої кривої лінії. У цьому випадку графік емпіричної лінії регресії співставляють з графіками відомих функцій. Невідомі параметри рівнянь регресії шукають методом найменших квадратів, провівши попередньо лінеаризацію (“випрямлення”) кривих. Так, наприклад, щоб піібрати параметри a і a 1 степеневої залежності
, лінеаризуємо це рівняння за допомогою логарифмування:

Якщо позначити
то останнє рівняння набуває виду

Параметри
і
можна визначити методом найменших квадратів.
Оцінка точності апроксимації криволінійною залежністю проводиться за допомогою кореляційного відношення
:

Якщо при цьому
, то крива точніше апроксимує залежність, ніж пряма. При
лінійна кореляція буде точнішою. Зауважимо, що для прямої лінії
.
Важливе значення у прогнозуванні має логістична залежність
,
причому B, k – сталі числа.
Якщо відомі результати n спостережень (ti, yi) (i=1,2,…,n), то ця залежність будується, як кореляційна. Заміною змінних

Вона лінеаризується у залежність
де
.
З використанням методу найменших квадратів для середніх значень параметрів В і k отримуємо формули:


ПРИКЛАД. За щоденними даними першої декади червня рівня забезпеченості y населення послугою туристичного агентства (таблиця 1) встановити логістичну залежність.
Таблиця 1
| t (дні) | ||||||||||
| y | 0,195 | 0,200 | 0,205 | 0,210 | 0,220 | 0,230 | 0,240 | 0,255 | 0,270 | 0,285 |
Розв’язування. Обчислимо такі суми:


З використанням одержаних сум знаходимо: 
Відповідь: логістична залежність має вигляд 
Дата публикования: 2015-03-26; Прочитано: 297 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!
