Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Рівняння регресії



Рівняння y=f(x1, x2, …xk), яке описує залежність між вихідним параметром y та вхідними чинниками xk називається рівнянням регресії. Якщо досліджується вплив на функцію відгуку тільки одного фактора, то шукають рівняння y=f(x), яке називають рівнянням парної регресії, а модель – однофакторною регресійною моделлю. Вибір виду моделі залежить від наших знань про об’єкт досліджень та мети дослідження. Часто, коли говорять про вид обраної моделі, мають на увазі вид функції y=f(x). Вид цієї функції досліднику наперед невідомий. У такій ситуації корисним є представлення функції
y=f(x1, x2, …xk) у вигляді алгебраїчних поліномів (многочленів) типу:

(9.19)

де - вільний член;

, - лінійні коефіцієнти;

- коефіцієнти взаємодії факторів (і¹u);

- квадратичні коефіцієнти.

Вираз 9.19 є поліномом другого порядку. У технології деревооброблення саме такі многочлени використовують найчастіше, хоча може використовуватись як лінійні моделі, так і моделі, залежності у яких описують многочленном n-го порядку.

Точність, з якою потрібно визначити вихідну величину згідно рівняння регресії у кожній точці, – це деяка величина δ (рис. 9.2).

Рис. 9.2. Апроксимація довільної неперервної функції

Будь-яка крива, що розміщена у інтервалі y± δ, наприклад f1(x), з точністю δ відрізняється від f(x). Тобто, якщо функцію немає необхідності знати точно, її завжди можна замінити близькою до неї, але більш простою функцією. Точність залежатиме від умов задачі, можливостей і бажань дослідника. Отже, після проведення експерименту, дослідник у своєму розпорядженні матиме значення відгуку , що обчислюється із рівняння регресії та експериментальні значення відгуку y (у випадку проведення дубльованих спостережень у кожній серії дослідів - ).

Оцінки коефіцієнтів рівняння регресії, як правило, отримують за допомогою методу найменших квадратів (рис. 9.3). Нехай = f(x) – це графік, отриманий за рівнянням регресії. Тоді y1, y2, …, y14 – експериментальні значення відгуку, що з’єднані з кривою відрізками, паралельними осі ординат.

Рис. 9.3. Візуалізація методу найменших квадратів

Всі відрізки (yi - ) разом у деякій мірі відображають те, наскільки крива відповідає експериментальним точкам. Зручною мірою відповідності є сума квадратів довжин відрізків. Тоді можна зробити висновок про те, що вибирають таке рівняння регресії (такі значення коефіцієнтів), при яких сума квадратів довжин цих відрізків буде мінімальною. Метод вибору коефіцієнтів моделі, що ґрунтується на мінімізації суми квадратів відхилень, називають методом найменших квадратів (МНК).

До недоліків МНК відносять його нестійкість до викидів (грубих промахів), при наявності яких модель «перетягується» у сторону значень, що суттєво відрізняються від інших спостережень. Загалом, оцінки згідно з методом найменших квадратів співпадають з правдивими оцінками тільки у випадку нормального розподілу помилок. В іншому випадку ефективнішим є застосування інших методів, наприклад методу найменших модулів.

Перевірка адекватності математичної моделі дає можливість оцінити здатність отриманої моделі описувати значення вихідної величини з такою ж точністю, як і результати експерименту. Для цього розраховують дисперсію адекватності математичної моделі за формулою:

(9.20)

де n - число дубльованих спостережень;

f - число степенів волі дисперсії адекватності, fад=N-P;

N - кількість дослідів;

Р - кількість оцінюваних коефіцієнтів рівняння регресії;

- середнє значення результатів експерименту в j -ому досліді;

()- розраховане за рівнянням регресії значення вихідної величини y в j -ому досліді.

Перевірка адекватності математичної моделі проводиться за F ‑критерієм Фішера, з допомогою якого порівнюють дисперсії адекватності та відтворюваності . Розрахункове значення критерію Фішера визначають за формулою:

, (9.21)

де S2 більша та S2 менша – дисперсії адекватності та відтворюваності, при чому більша з них повинна бути у чисельнику, а менша – у знаменнику.

Дисперсію відтворюваності розраховують за формулою:

, (9.22)

де S2j – дисперсія дубльованих спостережень у кожній серії дослідів.

Табличне значення критерію Фішера Fmабл . залежить від рівня значущості q,числа ступенів вільності дисперсії адекватності f та числа незалежних оцінок дисперсії відтворюваності fy=N (n-1). Якщо Fрозр<Fтабл ., то модель вважається адекватною і може бути використана для опису об'єкта. У протилежному випадку - модель неадекватна.

Таким чином, у процесі статистичного аналізу, адекватною вважається модель, у якій однорідні дисперсії адекватності і відтворюваності. Згідно із статистичною оцінкою, якщо розсіювання значень дубльованих спостережень у кожній серії дослідів (дисперсія відтворюваності) суттєво відрізняється від розсіювання, що визначаються відхиленням експериментальних значень від значень, отриманих за рівнянням регресії (дисперсія адекватності), то роблять висновок про неадекватність моделі об’єкту досліджень. У даній ситуації користуються наступною логікою: якщо розсіювання експериментальних значень відгуку навколо середнього значення у серії дубльованих спостережень є незначне, а відхилення ( - ) суттєво більші (імовірний варіант, коли навпаки перше розсіювання є більшим за друге), то це означає, що допущені системні помилки при виборі і обґрунтуванні області експерименту, а значить побудована модель є неадекватною.

У процесі аналізу результатів досліджень необхідно пам’ятати про те, що модель може бути адекватною за критерієм Фішера, але не задовольняти вимоги дослідника за величиною відхилень експериментальних значень від значень, отриманих за рівнянням регресії і навпаки: модель може дуже близько до експерименту описувати об’єкт досліджень, але не відповідати критерію адекватності Фішера.

Математичне планування експерименту

Досвід використання математичної статистики призвів до усвідомлення того, що моделі складних об’єктів, які визначаються багатьма змінними, не завжди можна успішно аналізувати. Якщо сам експеримент організований невдало, вибірка погано структурована і містить недостатню кількість спостережень, то на етапі оброблення даних методи математичної статистики не допомагають врятувати ситуацію. Справедливо виникає питання: навіщо добре обробляти дані, якщо сам експеримент організований невдало? Р. Фішер започаткував теорію математичного планування експерименту, запропонувавши активне втручання дослідника у сам процес постановки експерименту. Однією із принципово нових ідей у цій теорії – оптимальне використання простору незалежних вхідних факторів. Використовуючи теорію математичного планування експерименту, дослідник отримує відповіді на питання про те, скільки дослідів, яких саме і в якому порядку необхідно здійснити для вирішення поставленого завдання. При цьому досягається певна збалансованість між необхідністю мінімізувати кількість дослідів і забезпечити достатню точність і надійність результатів.

Повний факторний план

Повний факторний план (ПФП) є однією зі стратегій багатофакторних експериментів. ПФП – це плани, в яких кількість рівнів зміни всіх факторів є однаковою, і будь-які можливі комбінації цих рівнів зустрічаються однакову кількість разів. За умов, коли k вхідних факторів змінюються у ході досліджень лише на двох рівнях, план називають ПФП 2k, а кількість дослідів, які необхідно провести, дорівнює N= 2 к. Досліди реалізуються за певним планом, який називається матрицею планування. Матриці ПФП 2k будують з дотриманням таких правил:

· рівні зміни першого фактора чергуються в кожному досліді, починаючи з нижнього;

· частота зміни рівня кожного наступного фактора удвічі менша, ніж у попереднього.

За результатами ПФП 2k одержують лінійну регресійну модель, яка описується такою залежністю вихідної величини від змінних факторів:

, (9.23)

де - вільний член;

- коефіцієнти при факторах;

- коефіцієнти при факторних взаємодіях, , при чому і≠и.

Лінійні моделі, зазвичай, наближено описують об’єкти дослідження у деревообробленні. Тому їх доцільно застосовувати на перших етапах дослідження, коли про об’єкт дослідження є мало інформації; у ситуаціях, коли за результатами теоретичних досліджень експериментатор виявив лінійний вплив вхідних факторів або ж його задовольняє точність лінійного наближення; у дослідженнях, коли кількість дослідів обмежена, зокрема у виробничих умовах.

У ході вирішення проблеми дослідник вивчає літературні джерела, а далі на основі теоретичного аналізу та практичного досвіду визначає мету та задачі досліджень. Потім, керуючись поставленою метою, дослідник вибирає область експерименту: змінні фактори та інтервали їх зміни, а також встановлює постійні фактори та їх фіксовані значення. Вибравши стратегію експерименту, розробляють матрицю планування.

З метою спрощення матриці планування та статистичної обробки результатів експериментальних даних проводять кодування змінних факторів. Зберігаючи послідовність, кожному фактору присвоюють кодоване значення, відповідно, х1, х2, х3 і т.д. Верхню межу кожного фактора позначають х (+1) (верхній рівень), нижню межу - х (-1) (нижній рівень), а середнє значення фактора - х (0) (основний рівень). З метою спрощення записів приймають позначення рівнів факторів х (+1), х (0), х (-1) відповідно +1, 0, -1 (або -, 0, +) – нормалізовані значення рівнів факторів.

Зв'язок між натуральними і кодованими значеннями факторів визначається за формулою:

, (9.24)

де хі - кодоване значення фактора;

хі - натуральне значення фактора;

хоі - натуральне значення середнього рівня фактора;

D хі - інтервал зміни фактора - визначається як половина різниці між натуральними значеннями верхнього і нижнього рівнів.

Матриця ПФП 22 містить чотири досліди та у нормалізованих позначеннях факторів має вигляд, наведений у таблиці 9.1.

Таблиця 9.1

Матриця ПФП 2к, при к=2

№ досліду Значення вхідних факторів Значення вихідного параметру
х1 х2
  -1 +1 -1 +1 -1 -1 +1 +1 у1 у2 у3 у4

Широке застосування ПФП 2к зумовлене їхніми перевагами: незалежність коефіцієнтів рівняння регресії один від одного, мінімальні дисперсії коефіцієнтів, простота статистичної обробки результатів експериментальних досліджень. Переваги даних планів пов’язані з характерними властивостями матриць у нормалізованих позначеннях:

· симетричність відносно центру плану – алгебраїчна сума елементів стовпців будь-якого фактору дорівнює нулю , при чому ;

· нормованість – сума квадратів елементів стовпця будь-якого фактору дорівнює кількості дослідів ;

· ортогональність – сума по членних добутків будь-яких двох стовпців матриці дорівнює нулю .

Загалом процес досліджень включає такі етапи виконання.

1. Збір і аналіз апріорної інформації.

2. Вибір області експерименту.

3. Вибір математичної моделі для представлення експериментальних даних.

4. Вибір плану експерименту.

5. Визначення методу аналізу даних.

6. Проведення експерименту.

7. Обробка даних.

8. Інтерпретація даних.

Процес статистичного аналізу експериментальних даних, як правило, включає:

· виявлення та виключення грубих промахів з вибірок дубльованих спостережень у кожній серії дослідів згідно з методикою описаною в розділі 2.2.1;

· визначення статистичних показників для кожної серії дослідів, вважаючи дубльовані спостереження вибірковими сукупностями за допомогою виразів 2.8…2.18;

· перевірку однорідності дисперсій (кількість дисперсій відповідає кількості основних дослідів) згідно з методикою описаною в розділі 2.2.2;

· розрахунок коефіцієнтів рівняння регресії:

коефіцієнти рівняння регресії для випадку використання ПФП розраховуються за формулами:

а) вільний член: ; (9.25)

б) коефіцієнти при факторах: ; (9.26)

в) коефіцієнти при взаємодіях: , (9.27)

де - середнє значення j -ого досліду, визначене для n дубльованих спостережень;

· перевірку коефіцієнтів рівняння регресії на значущість: незначущими є ті коефіцієнти, які в математичній моделі можна прирівняти до нуля (тобто ними можна знехтувати).

Коефіцієнт вважається значущим, якщо виконується умова:

, (9.28)

де - абсолютне значення коефіцієнта рівняння регресії;

- табличне значення критерію Стьюдента, який залежить від рівня значущості q і числа незалежних оцінок дисперсій fy=N (n-1);

- середньоквадратичне відхилення коефіцієнтів рівняння регресії, яке визначається як (9.29).

За допомогою t -критерію Стьюдента знаходимо достовірний інтервал для будь-якого коефіцієнта рівняння регресії bi. Позначивши істинну величину цього коефіцієнта через bi, розраховують межі інтервалу за формулою:

(9.30)

· перевірку адекватності математичної моделі;

· статистичний аналіз рівняння регресії;

· побудову рівняння регресії для натуральних значень;

· інтерпретацію впливу вхідних факторів на функцію відгуку за допомогою сімейства графіків.

9.5. Завдання для самостійної роботи до розділу 9

1) Вибрати завдання згідно з варіантом з таблиці 9.2.

Таблиця 9.2

Результати експериментальних досліджень при реалізації ПФП типу 23

№ досліду y1 y2 y3 № досліду y1 y2 y3
Варіант №1 Варіант №2
  7,05 7,80 6,91   7,24 7,10 6,70
  17,70 17,72 17,00   18,55 15,81 15,76
  14,79 12,79 13,30   14,89 12,71 13,01
  26,77 26,08 26,04   23,40 25,75 27,37
  5,16 5,96 5,41   5,58 5,49 5,42
  15,12 15,02 15,35   16,38 15,50 15,64
  10,76 12,24 11,53   10,60 11,61 11,34
  21,95 23,27 22,46   22,66 21,57 22,25
Варіант №3 Варіант №4
  11,39 10,33 11,55   23,80 23,85 24,42
  24,68 21,14 22,87   5,53 5,73 5,55
  10,99 11,37 11,80   16,51 16,82 14,73
  22,73 22,95 20,85   11,10 10,84 11,38
  11,66 10,91 11,45   24,77 25,12 22,93
  18,84 19,90 17,72   11,48 11,42 10,23
  16,72 17,03 18,00   21,45 22,55 20,57
  14,66 14,82 15,17   10,88 11,27 11,00

2) Відкинути грубі промахи, провести перевірку однорідності дисперсій і визначити дисперсію відтворюваності.

3) Визначити коефіцієнти рівняння регресії.

4) Оцінити значущість коефіцієнтів рівняння регресії.

5) Провести перевірку адекватності моделі.

6) Представити рівняння регресії у натуральному вигляді.

7) Охарактеризувати залежність вихідної величини від змінних факторів на основі рівняння регресії та графіків.

Питання для самоконтролю до розділу 9

1. Проаналізуйте завдання регресійного аналізу.

2. Проаналізуйте завдання кореляційно-регресійного аналізу.

3. Охарактеризуйте поняття «об’єкт досліджень» та проаналізуйте особливості вибору об’єкту досліджень у технології деревооброблення.

4. Проаналізуйте вимоги до вихідного параметру.

5. Проаналізуйте вимоги до незалежного вхідного фактору.

6. Проаналізуйте вимоги до групи вхідних незалежних факторів.

7. Проаналізуйте вимоги до об’єкту досліджень.

8. Проаналізуйте особливості використання технологічних критеріїв для оцінки ефективності процесів у технології деревооброблення.

9. Проаналізуйте особливості використання економічних критеріїв для оцінки ефективності процесів у технології деревооброблення.

10. Проаналізуйте особливості використання комплексних критеріїв для оцінки ефективності процесів у технології деревооброблення.

11. Обґрунтуйте необхідність використання екологічних критеріїв для оцінки ефективності процесів у технології деревооброблення.

12. Охарактеризуйте сутність методу найменших квадратів.

13. Дайте визначення поняттю «рівняння регресії».

14. Які плани називаються повними факторними і чому?

15. Чому дорівнює кількість дослідів для ПФП 2к, якщо кількість змінних факторів дорівнює 4, 5, 6?

16. Проаналізуйте порядок дій дослідника у процесі математичного планування експерименту.

17. Проаналізуйте методику статистичної обробки результатів експериментальних досліджень в процесі реалізації ПФП.

18. Обґрунтуйте доцільність кодування факторів.

19. Від чого залежить величина довірчого інтервалу для коефіцієнтів рівняння регресії?

20. Обґрунтуйте доцільність застосування процедури перевірки коефіцієнтів рівняння регресії на значимість.

21. Проаналізуйте причини необов’язкового використання процедури перевірки коефіцієнтів рівняння регресії на значимість.





Дата публикования: 2015-04-07; Прочитано: 3738 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.018 с)...