Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Розрахунок показників асиметрії та ексцесу



Номер дос ліджу ваного Резуль тат тесту (•*,■) хі - X 0, -х)2 (*, - *)3 (*,. -х)4
    -7,3 53,3 -389 2839,82
    8,7 75,7 658,5 5728,98
    -5,3 28,1 -148,9 789,048
    -3,3 10,9 -35.9 1 18,592
    3,7 13,7 50,66 187,416
    -4,3 18,5 -79,5 341,88
    -0,3 0,1 -0,03 0,0081
    7,7 59,3 456,5 3515,3
    2,7 7,3 19,7 53,1441
    -2,3 5,3 -12,2 27,9841
п = 10 X = 21,3 £(*,. -х) = 0 X (*,-*)2 = 272,2 Х(*.- -*) = 519,8 -*)4 = 13602,2

У таблиці 34 ми визначили середнє арифметичне (х), котре дорівнює 21,3. Результат обчислення середнього квадратичного відхилення (о) поданий у формулі (5) і дорівнює ±5,5. Показники асиметрії та ексцесу обчислюємо за формулами (7) і (8).

Помилки репрезентативності для показників асиметрії (т А) та ексцесу (/и/;) визначаються за допомогою формул:

тА‘І ї (9)

де п - кількість досліджуваних.

У тому випадку, якщо показники асиметрії та ексцесу перевищують за абсолютною величиною власну помилку репрезентативності у 3 і більше разів, то це свідчить про достовірні відмінності емпіричних розподілів від нормального:

(П)

(12)

У даному випадку:

Оскільки обидва показники не перевищують у три рази власну помилку репрезентативності, то можна зробити висновок про нормальний розподіл даної ознаки за формулами М.О.Пло- хинського [207|.

Здійснимо перевірку за формулами Є.І.Пустильніка [228]. Якщо емпіричні значення показників асиметрії і ексцесу будуть нижчими за критичні, то можна казати про нормальний розподіл ознаки.

Обчислимо критичні значення для показників Л і Е.

(14)

Таким чином, обидва варіанти перевірки, за М.О.Плохинсь- ким та Є.І.Пустильніком, привели до однакового результату: розподіл результативної ознаки у даному прикладі є нормальним.

Очевидно, що наведені вище обчислення є достатньо громіздкими навіть для невеликої за обсягом вибірки, тому на практиці психологи досить часто працюють із “сирими” балами, не перевіряючи ступінь збігу отриманого емпіричного розподілу з нормальним. З математичної точки зору це, звичайно, припустимо, але разом з тим необхідно підкреслити, що при подальшій статистичній обробці таких даних дослідник має користуватися виключно непараметричними критеріями. І лише у випадку доведення нормальності розподілу можливе застосування параметричних статистичних критеріїв.

Статистичні гіпотези та статистичні критерії

• Як уже зазначалося вище, під час проведення психологічного дослідження психолог має справу з обмеженою частиною

генеральної сукупності - вибіркою, за наслідками дослідження якої він робить певні висновки (часто щодо всієї генеральної сукупності). Математичним підґрунтям для такого роду висновків є висування та наступна перевірка дослідником статистичних гіпотез.

Традиційно у математичній статистиці виокремлюють два види гіпотез нульову та альтернативну.

Нульова гіпотеза (І1 0) є гіпотезою про відсутність відмінності або зв’язку між змінними. Інакше кажучи, нульова гіпотеза

• це припущення про наявність доказів для анулювання основної (альтернативної) гіпотези. Наприклад: “Кореляція між змінними А і Б не відрізняєт ься від нуля”.

Альтернативна (експериментальна) гіпотеза (Н,) - це гіпотеза про значущість відмінностей або зв’язку між змінними. Наприклад: “Кореляція між змінними А і Б достовірно відрізняється від нуля”. Гіри цьому одночасно з Н„ може бути висунута одна або декілька альтернативних гіпотез (//,. Н2,., //*).

Для перевірки статистичної гіпотези у кожному окремому випадку визначається статистичний критерій - правило, що з високою ймовірністю забезпечує прийняття істинної та відхилення хибної гіпотези.

Як зазначає О.В.Сидоренко [244], статистичні критерії позначають також і метод обчислення певного числа та саме це число. Коли ми говоримо, що достовірність відмінностей обчислювалася за критерієм х”, то маємо на увазі, що використовували метод %2 для обчислення певного числа. Коли ми говоримо далі, що %2=12,676, то маємо на увазі певне число, отримане методом х. Це число позначається як емпіричне значення критерію.

Статистичний критерій будується на основі порівняння отриманої емпіричної величини з критичною (табличною, теоретичною) величиною. Звичайно у випадку, якщо обчислене значення критерію більше критичного, то приймається альтернативна

гіпотеза, якщо менше - то нульова.

Хоча існують критерії (наприклад, критерій Манна-Уітні), у яких необхідно дотримуватися зворотного правила.

Розрахункова формула критерію може містити або параметри розподілу (середні та дисперсії), або частоти і ранги. У першому випадку говорять про параметричні (наприклад, /-критерій Ст’юдента, Р-критерій Фішера, гху-критерій Пірсона), а у другому про непараметричні статистичні критерії (наприклад, ф*-критерій Фішера, х2-кРитеРІй Пірсона, г5-критерій Спір- мена).

Параметричні критерії передбачають наявність нормального розподілу психологічних змінних, котрі вимірюються в інтерваль- ній шкалі, а непараметричні критерії не передбачають попереднього обчислення параметрів розподілу.

Рівень статистичної значущості

Будь-яка статистична гіпотеза (. Н0 або //,) характеризується кількісною мірою ймовірності її істинності - рівнем статистичної значуіцості, тобто імовірність помилки при статистичному обчисленні.

У літературі описано 2 види помилок: помилка першого роду (а) та помилка другого роду ((>). Помилка першого роду полягає у відхиленні //«, коли вона є істинною, а помилка другого роду - у прийнятті Н0, коли істинною є Н,.

З метою уникнення помилки першого роду вводиться правило відхилення гіпотези про відсутність відмінностей (Н 0) та прийняття гіпотези про статистичну достовірність відмінностей (II,) на основі порівняння емпіричного значення критерію з критичним (табличним) значенням критерію. При цьому останнє може досягати (не досягати) нижчого, 5%-го (р<0,05 або а<0,05), достатнього - 1%-го (р<0,01 або а<0,01) або високого - 0,1%-го (р<0,001 або а<0,001) рівня статистичної значущості. Відповідно, якщо емпіричне значення критерію є рівним критичному значенню. що відповідає р<0,05 або перевищує його, то //«відхиляється, проте II, ще не може бути прийнята. Якщо ж емпіричне значення критерію є рівним критичному значенню, що відповідає р<0,01 або перевищує його, то IIи відхиляється та приймається Н,т.

З метою зниження ризику помилки другого роду, виходячи зі специфіки емпіричних даних (обсяг вибірки, характер розподілу, застосовані вимірювальні шкали тощо), обирають той статистичний критерій, який краще за інші дозволяє виявити відмінності (відхилити Н0 про відсутність відмінностей, якщо вона хибна), тобто є потужнішим. Так, наприклад, якщо значення ознаки виміряні в інтервальній шкалі та її розподіл є нормальним, то більш потужними є параметричні критерії, і, навпаки, якщо значення ознаки репрезентовано в будь-якій іншій шкалі, а нормальність розподілу не доведена, тоді непараметричні критерії є потужнішими.

Класифікація статистичних завдань та методів їхнього розв ’язання

Основними завданнями, котрі вирішує психодіагност під час математико-статистичної обробки даних емпіричного дослідження, є:

• зіставлення ознак з метою виявлення міри зв’язку (кореляції) між ними;

• виявлення відмінностей у розподілі ознаки.

Зіставлення ознак з метою виявлення міри зв’язку між ними

В практиці психодіагностичних досліджень часто виникають випадки, коли необхідно виявити міру статистичного зв'язку двох або декількох змінних. Такий зв’язок зазвичай називають кореляцією або сполученістю.

1111 Винятками з цього правилу є С-критерій знаків, Т-критерій Вілкоксона та II- кригерій Манна-Уітні, для яких встановлюються зворотні відношення.

У науковій літературі [42], [44], [57], [99], [100], [225], [244] під кореляцією (від лат. соггеїаііо - співвідношення) розуміють статистичну залежність між■ випадковими величинами, при якій зміна однієї з випадкових величин призводить до зміни математичного очікування іншої.

На відміну від детермінованих, або функціональних зв’язків, коли одному значенню ознаки завжди відповідає певне значення іншої (зв’язок площі трикутника з його висотою та основою), кореляційний зв’язок є імовірнісним (стохастичним) - кожному значенню однієї ознаки може відповідати певний розподіл значень іншої ознаки. В зв’язку з цим підкреслюється, що кореляційна залежність не є причинною, а відображає лише міру впливу значення однієї змінної на ймовірності появи різних значень іншої [244].

З метою вивчення статистичних зв'язків між психологічними змінними застосовують кореляційний аналіз, основним завданням якого є кількісний опис форми, тісноти та спрямованості зв’язку між ознаками, виражений у коефіцієнті кореляції.

За формою кореляційний зв’язок може бути лінійним або нелінійним. Якщо статистичний зв’язок між ознаками може бути виражений рівнянням прямої лінії, то його називають лінійним. Наприклад, лінійна залежність виявляється у зростанні значень однієї ознаки (кількість тренувань) при збільшенні іншої ознаки (кількість правильно розв’язаних контрольних завдань). Якщо статистичний зв’язок виражається рівнянням будь-якої кривої лінії (параболи, гіперболи тощо), то його називають нелінійним. Наприклад, нелінійним може вважатись зв'язок між рівнем мотивації та ефективністю виконання завдань, що описується законом Иеркса-Додсона.

Тіснота (сила) кореляційного зв’язку характеризує ступінь обумовленості змін X значеннями У, або, навпаки, У значеннями X. Вона визначається за числовим значенням коефіцієнту кореляції у діапазоні від 0 до 1. У психологічних дослідженнях заведено вважати, що при значенні коефіцієнту кореляції 0,3-0,5 зв’язок є помірним, 0,5-0,7 - значущим, 0,7—0,9 - сильним [44].

Мри цьому будь-яке обчислене (емпіричне) значення коефіцієнту кореляції має бути перевірено на статистичну значущість. Для цього використовують спеціально розроблені таблиці критичних значень. Якщо емпіричне значення більше або дорівнює табличному для р<0,05, то кореляція є значущою. Якщо обчислене значення коефіцієнта відповідає рівню статистичної значущості р<0,01, то кореляційний зв’язок вважається високим значущим.

За напрямком кореляційний зв’язок може бути позитивним (прямим) та негативним (зворотнім). При позитивній кореляції (коефіцієнт є позитивним) із більш високою ймовірністю можна передбачити збільшення (зменшення) однієї ознаки в зв’язку зі збільшенням (зменшенням) іншої. При негативній кореляції (коефіцієнт має негативний знак) високим значенням однієї ознаки відповідають низькі значення іншої, а низьким значенням більш високі.

У психологічних дослідженнях використовують в основному 4 різновиди коефіцієнтів кореляції:

• Коефіцієнт кореляції для аналізу залежності змінних, виміряних за допомогою номінативної шкали (шкали найменувань):

ф-коефіцієнт асоціації Пірсона.

• Коефіцієнти кореляції для аналізу залежності змінних, виміряних за допомогою рангової (ординальної) шкали:

коефіцієн т рангової кореляції гх Спірмена.

• Коефіцієнт кореляції для аналізу залежності змінних, виміряних у метричних шкалах (шкалі інтервалів та відношень):

• коефіцієнт кореляції гху Пірсона.

• Коефіцієнт кореляції для аналізу залежності даних, виміряних у різних шкалах:

точково-бісеріальний коефіцієнт кореляції Грь,

коефіцієнт рангово-бісеріальної кореляції ггЬ.

Розглянемо процедуру обчислення вказаних коефіцієнтів кореляції детальніше.

Одним із коефіцієнтів кореляції для аналізу залежності змінних, виміряних за допомогою номінативної шкали (шкали найменувань), є (р-коефіцієнт Пірсона, котрий застосовується у ви

падку, коли ознаки виміряні за дихотомічною шкалою найменувань - за наявності певної ознаки у досліджуваного йому приписують 1, а за її відсутності - 0.

Цей коефіцієнт є параметричним критерієм та обчислюється за формулою:

Р -Р Р

Ф = -^4^, (15)

^хЯхРуЯу

де Рк, /\ частка випадків з одиницею для ознак X та У:

• частка випадків з нулем для ознак X та У, д = 1 -Р\ Р *у частка випадків з одиницею як по X, так і по У. Наприклад, у таблиці 36 наведені дані спостереження за 12 студентами п’ятого курсу психолого-педагогічного факультету за параметрами “сімейний стан” (X) та “успішність складання сесії”’ (У).

Коли немає необхідності обчислювати частки Рх та Ру, а більш зручним є розташування дихотомічних двовимірних даних у таблиці зв’язаності ознак (таблиці, що вказує на спільні прояви пар значень за двома змінними в групі), ^-коефіцієнт можна обчислити за допомогою алгебраїчно еквівалентної рівнянню (1) формули:

асі - Ьс

о -,—- . (16)

,/(а + Ь)(с + сІ)(а + с)(Ь + сі)

Номер студента X Сімейний стан (одружений -1; недруже- ний - 0) У (здав сесію -1; не здав сесію - 0) Обчислення
      Рх = 5:12 = 0,4167; <7Х=1-РХ = 0,5833; Ру = 6:12 =0,5000; с/у = 1- Ру = 0.5000; Рху -4:12 - 0,3333; ір - 0,507
     
     
     
     
     

Таблиця 36

       
       
       
       
       
       

Для цього трансформуємо попередню таблицю у схему:

Значення ознак Сімейний стан Підсумок
Неодружені Одружені
Не здали сесію 5 (а) 1 (Ь) 6 (а+Ь)
Здали сесію 2 (с) 4 (сі) 6 (с+сі)
Підсумок 7 (а+с) 5 (Ь+сі')  

Схема 3. Загальна форма таблиці зв ’язаності 2 у- 2

Дана схема містить частоти об’єктів, які вичерпують 4 можливі пари зі схеми 3. Якщо замінити літери відповідними числами та підставити їх у формулу (16), от римаємо:

5-4 — 1 - 2 18

= 0,51.

35,5

^(5 +1X2+ 4X5+ 2X1+4)

Значущість отриманого ср-коефіцієнта може бути оцінена за критерієм %2, котрий у даному випадку обчислюється за формулою:

X = 2 х/і, (17)

де її - загальна кількість досліджуваних.

У даному прикладі ^ = 0,512х 12 = 3,12. Якщо порівняти отриманий коефіцієнт із теоретичним табличним значенням (див.

табл. [223, с. 625 -626]), то з’ясується, що отримана величина %2 недостатня для відхилення Ни. Відповідно гіпотеза про зв'язок сімейного стану досліджуваних та успішності здачі ними сесії має бути відкинута.

Серед різновидів кореляційного аналізу залежності змінних, виміряних за допомогою ординальної шкали, широко використовують коефіцієнт рангової кореляції г, Спірмена. Він дозволяє виміряти тісноту та спрямованість зв’язків між двома ознаками або двома профілями (ієрархіями) за умов можливості впорядкування (ранжування) значень за ступенем їхнього збільшення або зменшення.

Коефіцієнт рангової кореляції г$ Спірмена обчислюється за допомогою рівняння:

ьУсҐ: г.=1- ,2 • 08) п(п -1)

де й?, - різниця між рангами кожної змінної з пар значень X та У; п - кількість пар рангів, що зіставляються.

Для прикладу наведемо впорядковані групові (я = 10) показники за тестами А і Б (див. нижче табл. 37).

Таблиця 3 7





Дата публикования: 2015-09-18; Прочитано: 1393 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.017 с)...