Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Коефіцієнти кореляції



Для прийняття правильного рішення у будь-якому виді діяльності необхідно встановити (ідентифікувати) взаємозв’язок між різними чинниками. Якщо знання про такий вплив відсутні, то прийняте рішення, як правило, виявляється хибним.

Прийнято вважати що взаємозв’язок може бути функціональним, статистичним або стохастичним. При функціональній (детермінованій) залежності кожному значенню одного чинника відповідає єдине значення іншого чинника. Прикладом функціонального зв’язку є визначення величини прикладеної сили в залежності від маси і прискорення. Якщо зміна значення одного чинника призводить до зміни закону розподілу іншого, тоді цей взаємозв’язок називають стохастичним. Вважають також що, якщо величина одного фактору змінюється в середньому в залежності від того, які значення приймає інший – йде мова про статистичний вплив одного фактору на інший.

У процесах технології деревооброблення часто необхідно ідентифікувати наявність саме статистичного зв’язку, оскільки у системах із великою кількістю випадкових величин наявність чіткого функціонального зв’язку малоймовірна. Відсутність детермінованого впливу, наприклад між двома досліджуваними параметрами, у цій царині обумовлена присутністю інших, інколи суттєвих впливів.

У процесі визначення взаємозв’язку між висотою мікронерівностей оброблюваної поверхні і швидкістю різання при виконанні робіт на рейсмусному верстаті логічно припустити існування власне статистичного впливу. Змінюючи величину швидкості різання, необхідно виключити вплив інших режимних факторів. Для цього в експериментальних дослідженнях змінюють лише швидкість різання, а величини інших режимних факторів (швидкість подачі і товщина матеріалу, який знімається за один прохід тощо) залишають постійними. Але у цій ситуації неможливо ліквідувати вплив на шорсткість інших випадкових неконтрольованих чинників: товщини заготовок на вході; природних вад деревини; розкиду вологості тощо.

Якщо необхідно встановити наявність залежності між деякими випадковими величинами, то у такому випадку використовують методи кореляційного аналізу. У технології деревооброблення за допомогою кореляційного аналізу можна дослідити залежність, наприклад, між товщиною матеріалу до оброблення і шорсткістю оброблюваної поверхні, міцністю деревини на статичний згин та стискання вздовж волокон, початковою і кінцевою вологістю деревини у процесі сушіння.

Між двома випадковими величинами існує статистичний зв’язок, якщо зміна однієї з них призводить до зміни розподілу іншої. Для оцінки статистичного зв’язку за даними спостережень широко використовують вибірковий коефіцієнт кореляції. Нехай проведено N спостережень і у кожному з них визначали значення двох випадкових величин X та Y. Таким чином, отримано дві вибіркових сукупності однакового обсягу.

Вибірковий коефіцієнт кореляції r розраховують з наступного виразу, попередньо обчисливши середні вибірок та і середні квадратичні відхилення Sx та Sy:

(8.1)

Значення коефіцієнту вибіркової кореляції завжди знаходяться в межах інтервалу -1 ≤ r ≤ 1. Слід зазначити, що вибірковий коефіцієнт кореляції r характеризує тільки лінійну залежність між випадковими величинами. У випадку, якщо r>0, то можна припустити, що із збільшенням однієї із випадкових величин, інша, в середньому, теж збільшується. Якщо ж r<0, тоді припускають, що із збільшенням однієї випадкової величини, інша, в середньому зменшується. Чим ближче величина r до значень (+1) або (-1), тим більший ступінь лінійної залежності між випадковими величинами, що досліджуються. У випадку, якщо r=0, то вважають, що лінійна залежність між двома випадковими величинами відсутня і їх називають некорельованими.

Як правило, величина r не рівна нулю і для встановлення факту некорельованості величин обчислюють значення розрахункового критерію Стьюдента:

(8.2)

Обчислене значення tрозр порівнюють із табличним значенням критерію Стьюдента tтабл, що вибране для рівня значущості q і числа ступенів волі f=N-2. Якщо tрозр < tтабл, то гіпотеза про некорельованість випадкових величин приймається. Якщо ж tрозр > tтабл, то вважають, що вибірковий коефіцієнт кореляції значущо відрізняється від нуля, тобто між двома випадковими величинами існує лінійний статистичний зв’язок.

Величина половини довірчого інтервалу для коефіцієнту кореляції визначається з виразу:

(8.3)

Необхідно при використанні вибіркового коефіцієнту кореляції пам’ятати, що він показує щільність тільки лінійного взаємозв’язку. Тому, якщо залежність насправді не є лінійною, величина r буде вказувати на відсутність кореляційного впливу. У такій ситуації застосовують інші статистичні методи досліджень, наприклад регресійний аналіз.

У випадку, якщо вибіркова сукупність буде нерепрезентативною, то величина вибіркового коефіцієнту кореляції також буде близька до нуля, але це не дає підставу стверджувати, що кореляційний зв’язок між досліджуваними чинниками відсутній.

І ще одна вкрай важлива умова використання вибіркового коефіцієнту кореляції – розподіл випадкових величин, між якими встановлюється наявність кореляційного зв’язку, повинен відповідати нормальному закону розподілу.

Приклад 8.1. У процесі досліджень товщини деревинностружкової плити після пресування отримали 10 спостережень товщини плити, виміряної у поздовжньому і поперечному напрямках (табл. 8.1).

Таблиця 8.1

Дані вимірювань товщини ДСП

Товщина ДСП у поздовжньому напрямку (X) 17,18 17,29 17,24 17,26 17,26 17,42 17,38 17,21 17,05 17,09
Товщина ДСП у поперечному напрямку (Y) 16,59 16,80 16,91 17,27 17,04 17,39 17,41 17,44 16,97 16,96

Необхідно встановити наявність кореляційного зв’язку між цими двома випадковими величинами.

Визначаємо середні значення вибірок:

Визначаємо середні квадратичні відхилення вибірок:

Sx = 0,115; Sy = 0,288.

Визначаємо вибірковий коефіцієнт кореляції:

Визначаємо розрахунковий критерій Стьюдента:

Для q=0,05 і f=8 з таблиць визначаємо tтабл = 2,31. Оскільки tрозр > tтабл, то вважають, що вибірковий коефіцієнт кореляції значимо відрізняється від нуля, тобто між двома випадковими величинами існує лінійний статистичний зв’язок, причому цей зв’язок ближчий до прямопропорційної залежності.

Якщо необхідно дослідити статистичний зв’язок між трьома і більше випадковими величинами, користуються коефіцієнтом множинної кореляції. Так, для оцінки ступеня статистичного зв’язку випадкової величини Z з величинами X та Y вибірковий сукупний коефіцієнт кореляції ρ визначають з виразу:

(8.3)

де rxy, ryz, rxz – коефіцієнти кореляції відповідно між величинами
X і Y, Y і Z, X і Z.

Величина ρ лежить в інтервалі 0 ≤ ρ ≤ 1 і слугує також для оцінки лінійного статистичного зв’язку.

Інколи потрібно встановити наявність взаємозв’язку між двома якісними випадковими величинами, які визначаються рангами чи оцінками. Наприклад, якісними ознаками є фракційний склад технологічної тріски, фракційний склад лакофарбового матеріалу, сорт якості деревини чи деревного матеріалу, здатність лакового покриття відбивати проміння світла. У даному випадку досліджувані величини можна проранжувати, себто пронумерувати у порядку зростання чи спадання. Номер, який присвоєно кожному значенню величини, називають рангом. Якщо досліджуються дві випадкові якісниі величини X та Y, то у результаті спостережень отримують дві вибіркові сукупності рангів:
x1, x2, x3,…xn і y1, y2, y3,…yn. Одним із способів встановлення наявності статистичного зв’язку між двома випадковими якісними величинами є обчислення коефіцієнту рангової кореляції Спірмена R за формулою:

(8.4)

де di = xi - yi.

Коефіцієнт рангової кореляції використовують також у тому випадку, якщо закон розподілу випадкових величин не відповідає нормальному (гаусівському) закону.

Значущість коефіцієнту рангової кореляції R, якщо N>9, визначається аналогічно до вибіркового коефіцієнту кореляції r. Коефіцієнт R можна використовувати і тоді, коли досліджувані випадкові величини є кількісними, але їх для виконання завдань дослідження можна проранжувати.

Приклад 8.2. Необхідно визначити наявність взаємозв’язку між прибутком і якістю виробів десяти малих меблевих підприємств (табл. 8.2).

Таблиця 8.2

Дані про собівартість та якість меблевих виробів

Прибуток меблевих підприємств (X) 1 2 3 4 5 6 7 8 9 10
Якість меблевих виробів (Y) 8 6 9 10 7 3 4 2 1 5

У першому рядку меблеві підприємства пронумеровані у порядку зростання прибутку (у якості виробу розглядалась дводверна шафа, виготовлена з ламінованої ДСП). Якість меблевого виробу визначалась комплексно для кожного підприємства і фіксувалась у балах. У другому рядку табл. 8.2. наведені ранги якості продукції підприємств, що відповідають пронумерованим підприємствам за собівартістю (наприклад, підприємству із найменшою собівартістю (1) відповідає показник якості із рангом 8).

Визначаємо величину коефіцієнту рангової кореляції:

Від’ємне значення коефіцієнта рангової кореляції свідчить про те, що із збільшенням прибутку якість меблевих виробів, у середньому, погіршується (слід зазначити, що така ситуація характерна для ринків, які розвиваються, де попит на меблеву продукцію більше визначається ціною, ніж якістю). З метою оцінки значущості обчисленого значення R визначають tрозр за формулою 8.2: tрозр = 2,93. Оскільки tрозр > tтабл (2,93>2,31), то коефіцієнт рангової кореляції значущо відрізняється від нуля, тобто між двома випадковими величинами існує лінійний статистичний зв’язок, причому оберненопропорційний.

Якщо необхідно встановити взаємозв’язок між декількома якісними чинниками використовують коефіцієнт конкордації Кендала. Доцільно таке завдання розглядати на прикладі оцінки узгодженості думок експертів. Коефіцієнт конкордації Кендала визначають за формулою:

, (8.5)

де n – кількість чинників, що аналізуються;

m – кількість експертів;

Rij – ранг, що присвоєний i-му фактору j-им експертом.

Величина W може приймати значення в інтервалі 0 ≤ W ≤ 1. Якщо думки експертів суттєво розходяться, то коефіцієнт конкордації W=0, і чим ближче ця величина до 1, тим більше узгодженості між експертами. Для оцінки значущості коефіцієнту конкордації (якщо n>7) обчислюють розрахункове значення критерію Пірсона за формулою:

χ2розр = m (n - 1) W (8.6)

Якщо χ2розр > χ2табл, то фіксують узгодженість експертів за прийнятого рівня значущості q.

Приклад 8.3. Для участі у програмі Європейського Союзу, яка передбачає у результаті просування на міжнародні ринки, відібрали сім меблевих підприємств України. Три незалежні експерти проранжували ці підприємства з огляду на відповідність якості виробів вимогам стандарту
ISO 2000 (табл. 8.3). Необхідно визначити ступінь узгодженості експертів.

Таблиця 8.3

Оцінки експертів щодо визначення якості виробів

меблевих підприємств України

Меблеві підприємства Рангові оцінки експертів
Експерт №1 Експерт №2 Експерт №3
№1 5 2 5
№2 6 6 7
№3 7 7 3
№4 3 1 6
№5 4 5 4
№6 2 4 1
№7 1 3 2

З рис. 8.1, що побудований на основі таблиці 8.3, важко визначити узгодженість експертів.

Рис. 8.1 Порівняння рангових оцінок експертів

Для спрощення обчислень спочатку знаходимо величину S (табл. 8.4):

(8.7)

Для цього спочатку у стовпцях 5, 6 і 7 табл. 8.4. обчислюємо значення . Потім у кожному рядку сумуємо значення, отримані у цих стовпцях і підносимо до квадрату, знайшовши таким чином величину . Просумувавши дані стовпця 8 табл. 8.4, отримуємо S=140.

Таблиця 8.4

Розрахунок коефіцієнту конкордації Кендала

Меблеві підпр. Рангові оцінки експертів Експерт №1 Експерт №2 Експерт №3
Експерт №1 Експерт №2 Експерт №3
               
№1 5 2 5 1 -2 1 0
№2 6 6 7 2 2 3 49
№3 7 7 3 3 3 -1 25
№4 3 1 6 -1 -3 2 4
№5 4 5 4 0 1 0 1
№6 2 4 1 -2 0 -3 25
№7 1 3 2 -3 -1 -2 36
Сума 28 28 28       140

І в результаті остаточно отримуємо:

Таким чином можна зробити висновок, що узгодженість між експертами існує, але не дуже суттєва.





Дата публикования: 2015-04-07; Прочитано: 3104 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.011 с)...