Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Криві розподілу. Перевірка статистичних гіпотез про відповідність емпіричного та теоретичного розподілів



Аналіз закономірностей розподілу можна поглибити, якщо описати його певною функцією, яка називається теоретичною кривою. Теоретична крива описує закономірність співвідношення варіант та частот Найпоширенішою є нормальна крива. Вона використовується як стандарт, з яким порівнюють інші розподіли. Деякі розподіли, які не є нормальними, приводять до такого вигляду перетворенням змінної величини х (наприклад, заміною значень х їх логарифмами lgх).

Нормальний закон розподілу має місце у разі, коли діє велике число дрібних незалежних або слабо залежних випадкових величин (причин), які грають в загальній сумі приблизно однакову роль та серед них не можна виділити головних.

Найважливішою задачею наукового дослідження є встановлення зв'язків між двома величинами або економічними явищами. В економічних явищах часто доводиться розглядати зв'язки як між випадковими, так і зв'язки між випадковими й невипадковими величинами (оскільки не всі чинники, що впливають на економічні процеси – випадкові величини). Вивчення таких зв'язків здійснюється за допомогою кореляційно-регресійного аналізу. Зокрема, даний розділ статистики розглядає стохастичні зв'язки між величинами, коли одна з них у, будучи випадковою величиною, реагує на зміну іншої величини х (як випадкової, так і невипадкової) зміною свого закону розподілу.

Кореляційний аналіз (вивчаючий зв'язки між випадковими величинами) пред'являє жорсткі вимоги до початкової інформації. Зокрема він припускає, що розподіл випадкової величини повинен підпорядковувати нормальному закону.

Регресійний аналіз (вивчаючий зв'язки між випадковими і невипадковими величинами) пред'являє менш жорсткі вимоги. Його проведення можливо навіть у разі деякої відмінності розподілу випадкової величини від нормальної, що особливо важливо в економічних дослідженнях, де розподіл показників часто ассиметрично.

Проте, у будь-якому випадку, як правило, вимагається оцінити ступінь близькості закону розподілу випадкової величини до нормального.

Якщо безперервна випадкова величина підкоряється закону нормального розподілу, то вона має наступну щільність розподілу

)

У цьому випадку для неї справедлива функція

(5.17)

Ця функція називається нормованою функцією Лапласа, значення якої табульовані. Вона характеризує площу під кривою в проміжку від 0 до t.

Щоб оцінити вірогідність попадання в інтервал від до х розраховують F(x).

(5.18)

де F(X) – функція нормального розподілу.

Очевидно, що F(Х)= 1/2 + Ф(t). Для визначення вірогідності попадання нормально розподіленої випадкової величини х в заданий інтервал 12) знаходять різницю F(Х2) - F(Х1), тобто

Р(х1<x<x2 ) = F(Х2) - F(Х1) = (1/2 + Ф(t2 )) - (1/2 + Ф(t1)) = Ф(t 2 ) - Ф(t1 ) (5.19)

Функції F) й Ф(t) базуються на стандартизованих відхиленнях

(5.20)

де x1,x2 – відповідно нижня та верхня межа інтервалу,

х - середньоарифметичне значення х,

s - середнє квадратичне відхилення.

Тоді

Значення функцій табульовані (додатки 5 і 12), наприклад:

t 0 0,33 0,72 1,00 1,38 1,78 2,83
F(Х) 0,500 0,628 0,764 0,841 0,916 0,962 0,997 1

При негативних значеннях t функція складає (1 - F(Х)). Наприклад, F(-1,38)= 1 - 0,916 = 0,084.

Частоти, відповідні теоретичній кривій, називають теоретичними. Для нормального розподілу їх визначають за формулою

f' = npj =n (F(Xi) - F(Xi-1)) (5.21)

де n - обсяг сукупності,

pj - оцінка вірогідності попадання в j -й інтервал (p можна знайти використовуючи також значення функції Ф(t) (див. формулу 5.17)).

Приклад. Для визначення теоретичних частот використовуємо дані таблиці 5.6

х = 3940/80 = 49,25; s = [ (195200:80) - 49,252 ] 1/2 = 3,8

t1 = (44 - 49,25)/ 3,8 = -1,38 F(-1,38)=0,084

t4 = (56 - 49,25)/ 3,8 = 1,78 F(1,78)=0,962.

Теоретичні частоти складають, наприклад, для першої групи f'1 = 80*0,076=6,08, для другої f'2 = 80*0,288=23,04.

Таблиця 5.6 - Обчислення теоретичних частот нормальної кривої.

Інтер- вал Час-то-та х хf х2f ti-1 ti F(Xi-1) F(Xi) p=F(Xi) - F(Xi-1) f'
40-44         -2,43 -1,38 0,008 0,084 0,076 6,08
44-48         -1,38 -0,33 0,084 0,372 0,288 23,04
48-52         -0,33 0,72 0,372 0,764 0,392 31,36
52-56         0,72 1,78 0,764 0,962 0,198 15,84
56-60         1,78 2,83 0,962 0,998 0,036 2,88
Разом   х     х х x x х 79,2

Між теоретичними та емпіричними частотами є відхилення, які можуть мати випадковий характер або бути результатом невідповідності теоретичної кривої реальному характеру розподілу. Для об'єктивної оцінки істотності відхилень f-f' використовують критерії згоди, частіше всього критерій Пірсона c2 та Колмогорова .

Статистичну характеристику критерію c2 визначають за формулою

(5.22)

Розрахунок критерію для вищезгаданого прикладу наведено у таблиці 5.7. Тобто c2 складає 1,53

Таблиця 5.7- Розрахунок критерію

Номер групи Частота Відхилення f - f' (f - f')2
f f'
    6,08 -1,08 1,166 0,19
    23,04 2,96 8,762 0,38
    31,36 0,64 0,410 0,01
    15,84 -2,84 8,066 0,51
    2,88 1,12 1,254 0,44
Разом   79,2 0,8 х 1,53

Існує два способи оцінки близькості емпіричного розподілу до теоретичного:

1. За першим визначається вірогідність Р(c2) досягнення критерієм даної величини. Якщо ця вірогідність перевищує 0,05, то відхилення фактичних частот від теоретичних вважаються випадковими. Якщо ж Р(c2)<0,05, то відхилення вважаються істотними, а емпіричний розподіл - відмінним від теоретичного.

2. За іншим способом фактичні значення c2 порівнюються з критичними для вірогідності 1-a (де a - достатньо мала величина, наприклад 0,01; 0,05; 0,1) та числа ступенів свободи k. Критичне значення c21- (k) - максимально можливе значення c2 за умови випадкового походження відхилень f - f'. Якщо фактичне значення перевищує критичне c2>c21- a(k), то відхилення між емпіричними та теоретичними частотами слід вважати істотними. В протилежному випадку, істотність відхилень залишається недоведеною.

Величина c2 залежить від числа груп, з яких складається сукупність. Тому значення вірогідності Р(c2) та критичні значення c2 табульовані (див. додаток 11 та додаток 1 відповідно) в залежності від числа ступенів свободи k, яке є різницею між зменшеним на одиницю числом груп в сукупності й числом загальних характеристик теоретичного розподілу. Для нормального розподілу число ступенів свободи k=m-3, де m - число груп.

Для нашого прикладу при c2=1,53 і k=2 визначимо, що Р( c2>1,53) = 0,487. Тобто, вірогідність отримати при двох ступенях свободи c2>1,53 значно перевищує 0,05. Значить, відхилення фактичних частот від теоретичних можна вважати випадковими, а сам розподіл - нормальним.

Критичні значення c2 для вірогідності 0,9 (1-0,1) складають (додаток 1):

Число ступенів c20,9(k)

свободи

2 4,6

3 6,3

4 7,8

5 9,2

В нашому прикладі критичне значення c20,9(2)=4,6. Фактичне значення c2=1,53 менше критичного, тобто з вірогідністю 0,9 можна затверджувати, що емпіричний розподіл відповідає теоретичному нормальному закону.

Критерій згоди Пірсона є дуже строгою математичною оцінкою ступеня згоди емпіричного та теоретичного розподілів. Звичайно він застосовується для кількісної оцінки збігу теоретичного й емпіричного розподілу в сукупностях, що містять не менше 50 ознак та при числі ознак в інтервалі не менше 5.

Визначення критерію l засновано на зіставленні сум накопичених емпіричних та теоретичних частот й проводиться за формулою

(5.23)

де D - максимальне (по абсолютній величині) значення різниці між накопиченими емпіричними та теоретичними частотами,

n= f - обсяг сукупності або сума емпіричних частот (сума теоретичних частот може дещо відрізнятися від даної величини за рахунок точності обчислень).

Для нашого прикладу =0,281 або 2,52:Ö80 (див. табл. 5.8).

Таблиця 5.8 - Розрахунок критерію .

Номер групи Накопичені частоти Відхилення ½Sf - Sf'½
емпіричні, Sf теоретичні, Sf'
    6,08 1,08
    29,12 1,88
    60,48 2,52
    76,32 0,32
    79,2 0,8

Далі за допомогою спеціальних таблиць (див. табл.5.9) визначається вірогідність близькості між емпіричним та теоретичним розподілом при знайденому значенні l

Можливо також порівняння l з критичним значенням для вірогідності Р(l). Якщо критичне значення більше розрахункового, то емпіричний розподіл відповідає теоретичному.

Таблиця 5.9- Таблиця вірогідності для

P() P() P()
0,30 1,000 1,00 0,270 1,70 0,006
0,40 0,999 1,10 0,178 1,80 0,003
0,50 0,964 1,20 0,112 1,90 0,002
0,60 0,864 1,30 0,068 2,00 0,0007
0,70 0,711 1,40 0,040 2,10 0,0003
0,80 0,544 1,50 0,022 2,20 0,0001
0,90 0,393 1,60 0,012 2,31 0,0000

Як видно з таблиці 5.9 вірогідність близькості між теоретичним та емпіричним розподілами (або вірогідність того, що l не перевищить 0,281) близька до одиниці.

В загальному випадку слід заздалегідь упевнитися в тому, що аналізований розподіл за природою своєї тотожний нормальному. Тільки при цій умові критерій Колмогорова дає об'єктивну оцінку ступеню їх близькості. Критерій згоди Пірсона c2 використовують для оцінки близькості емпіричних та теоретичних частот при аналізі як нормального, так й інших видів розподілів (наприклад тоді, коли випадкова величина має розподіл Пуассона).

Величини c2 і k використовуються також для обчислення критерію згоди Романовського

(5.24)

Якщо величина цього критерію менше 3, розбіжність між емпіричним та теоретичним розподілом можна вважати неістотною. Якщо ж цей критерій виявляється більше 3, то слід вважати, що теоретичний розподіл не може служити моделлю для емпіричного, що вивчається.

Розглянуті вище критерії згоди дають загальну оцінку ступеню близькості емпіричного розподілу до нормального, але не містять ніякої інформації про характер розбіжностей між ними. Тому при істотних відхиленнях f-f' аналіз розподілу слідує доповнювати характеристиками ассиметрии та ексцесу.





Дата публикования: 2014-11-04; Прочитано: 2566 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.011 с)...