Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Статистичні гіпотези та їх перевірка



При вибіркових обстеженнях допускаються різного роду похибки, при цьому розрізняють грубі, систематичні й випадкові помилки.

Грубі помилки за абсолютними величинами значно відрізняються від всього ряду помилок і підлягають виключенню з ряду спостережень.

Систематичні помилки є наслідком впливу певних чинників, що спотворюють результати вимірювань за певним законом у відомому напрямі. Вони викликані зносом засобів вимірювання, їх неправильною установкою, дією зовнішнього середовища і т.п.

Випадковими називають такі помилки, характер зміни яких не володіє видимою закономірністю. Кожна подальша помилка за абсолютним значенням може бути більше або менше попередньої.

Аналіз випадкових похибок ґрунтується на теорії випадкових помилок, яка дає змогу з певною гарантійною вірогідності обчислити дійсне значення досілдженої величини.

В основі теорії випадкових помилок лежать такі підтверджені досвідом висновки:

1. Різниця у значеннях характеристики вибіркової і генеральної сукупності складе помилку вибірки =eх, і т.п. Ці помилки є випадковими величинами. Тому необхідно в кожному конкретному випадку визначити не тільки розмір помилки, але і надійність або гарантію того, що цей розмір не буде перевищений.

2. Вибіркові середні також симетрично розподіляються навколо генеральної середньої, незалежно від характеру розподілу випадкової величини в генеральній сукупності.

Закономірність розподілу випадкових помилок спостережень описується нормальною кривою (рис. 1.2). К. Гаусс (1777-1855 р. р.) використовував її як основу для теорії випадкових помилок вимірювань.

 
 


Рис. 1.2. Крива розподілу випадкових помилок спостережень

Вся площа під кривою дорівнює 1. Основна маса випадкових помилок групується навколо середнього значення, яке дорівнює 0.

На ділянці, обмеженій х, знаходиться 68,3% всіх спостережень; на ділянці, обмежений +2σх і –2σх –95,3%; на ділянці, обмеженій +3σх і
–3σх –99,7%.

На основі характерних властивостей розподілу випадкових помилок спостережень можна зробити висновок, що при достатньо великому обсязі вибірки n її кількісні характеристики за ймовірністю наближаються до відповідних значень характеристики генеральної сукупності.

Рівень значущості звичайно вимірюється у відсотках та їх чисельне значення засноване на так званому принципі незалежності маловірогідних подій. На практиці звичайно приймають рівні значущості, що знаходяться між 0,01-0,05. Відповідно їх називають одновідсотковими, двовідсотковими і т.п.

З принципу неможливості маловірогідних подій випливає наступний висновок: якщо випадкова подія має вірогідність дуже близьку до одиниці, то практично можна вважати, що в одиничному випробуванні ця подія наступить (P³0,99).

Припущення щодо закономірностей, які мають місце в генеральній сукупності, називається статистичною гіпотезою, а критерій її перевірки - статистичною характеристикою.

Як критерій перевірки вибирають деяку статистичну характеристику. Припущення, що висувається, може бути помилковим, внаслідок вибіркової помилки, і має назву нульової гіпотези Но .

Конкуруюча (протипожежна) гіпотеза означає, що має місце суттєва відмінність між вибірковими значеннями в генеральній сукупності. Сформулювавши гіпотезу Но, можна зіткнуться з чотирма ситуаціями:

- гіпотеза Но правильна, а її забракували, оскільки характеристика потрапила в критичну область, тобто допущена помилка першого роду, вірогідність якої відповідає рівню значущості α;

- гіпотеза правильна та її прийняли, оскільки характеристика потрапила в допустиму область, тобто рішення правильне;

- гіпотеза неправильна та її прийняли, оскільки характеристика потрапила в критичну область, тобто рішення правильне;

- гіпотеза неправильна, а її відкинули, оскільки характеристика потрапила в допустиму область. Допущена помилка другого роду, тобто прийнята невірна гіпотеза.

Як видно, рівень значущості можна тлумачити як ризик вчинити помилку першого роду, тобто відкинули правильну гіпотезу. В зв'язку з цим для ухвалення гіпотези рівень значущості призначають п'ятивідсотковий (α=0,05), а для бракування гіпотези - одновідсотковий (α=0,01).

Довірчі межі та критична область ряду розподілу представлена в
рис. 1.3.


       
 
   
 
 


Рис. 1.3. Довірчі межі й критична область ряду розподілу

Областю ухвалення гіпотези називають сукупність значень вибраного критерію, при яких гіпотезу приймають, критичною областю - при значеннях критеріях, коли нульову гіпотезу відкидають (див. рис. 1.3).

Вибіркова середня є певне число, яке можна розглядати як випадкову величину. Отже можна говорити про її розподіл і про числові характеристики цього розподілу ( σх2, σх та ін.).

Двостороння область, в яку повинна потрапити середня генеральної сукупності, визначається довірчими межами при певному рівні значущості 2Ф(t)=0,95 або за інтегральною функцією Лапласа t=1,96.

Інтервал Х±1,96 означає, що з вірогідністю P=0,95 генеральна середня потрапляє в довірчі межі, а з вірогідністю P=0,05 лежить зовні цих меж, тобто потрапляє у критичну область. Міра можливої відмінності між вибірковою середньою і середньою генеральної сукупності має назву стандартної помилки.

Слід зазначити, що вибіркові середні, як і випадкові помилки спостережень, симетрично розподіляються навколо генеральної середньої за умови, що обсяг вибірки складає n≥30 спостережень. При малому обсязі вибіркових даних n≥30 розподіл вибіркових середніх відрізняється від нормального тим більше, чим менше обсяг вибірки.

Межі довірчого інтервалу при малих вибірках n≥30 обмежується коефіцієнтом tα, який був запропонований в 1908 р. англійським математиком і хіміком В.С. Госсетом, який публікував свої роботи під псевдонімом "Ст’юдент" - студент. Надалі цей коефіцієнт отримав назву коефіцієнту Ст’юдента (це спеціально розроблені таблиці з урахуванням обсягу вибірки).

Доцільно дотримуватися такої послідовності попередньої обробки результатів спостережень при n≥30:

1. Результати спостережень записують в таблицю.

2. Визначають середнє значення з n спостережень:

i. (1.19)

3. Визначають похибки окремих спостережень:

ΔХi= –Xi та їх квадрати (ΔХi)2.

4. Відсіюють спостереження, різко відмінні від інших. Для цього знаходять:

4.1. Записують середню квадратичну похибку:

. (1.20)

4.2. Задаються значенням похибки α =0,95.

4.3. Визначають коефіцієнт Ст’юдента tα=(n) для заданої надійності P і кількості спостережень n.

4.4. Знаходять межі довірчого інтервалу (похибки результатів спостережень):

ΔХ= tα(n) Δσх, Х= ± ΔХ.

4.5. Обчислюють відносну похибку вибіркових даних:

. (1.21)





Дата публикования: 2014-11-02; Прочитано: 559 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.007 с)...