Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Сравнение эмпирического распределения с теоретическим



В разных задачах подсчет теоретических частот осуществляется по-разному. Рассмотрим примеры задач, иллюстрирующих различ­ные варианты подсчета теоретических частот. Начнем с равноверо­ятного распределения теоретических частот. В задачах такого типа

(8.1, 8.2 и 8.3) в силу требования равномерности распределения все теоретические частоты должны быть равны между собой.

Задача 8.1. Предположим, что в эксперименте психологу не­обходимо использовать шестигранный игральный кубик с цифрами на гранях от 1 до 6. Для чистоты эксперимента необходимо получить «идеальный» ку­бик, т.е. такой, чтобы при достаточно большом чис­ле подбрасываний, каждая его грань выпадала бы при­мерно равное число раз. Задача состоит в выяснении того, будет ли данный кубик близок к идеальному?

Решение, Для решения этой задачи, психолог подбрасывал кубик 60 раз, при этом количество выпадений каждой грани (эмпирические частоты f}) распре­делилось следующим образом:

Таблица 8.1

Грани кубика            
f, — эмпирические частоты            
1т теоретические частоты            

В «идеальном» случае необходимо, чтобы каждая из 6 его гра­ней (теоретические частоты) выпадала бы равное число раз:

60:6 = 10. Величина60:6 = 10 и будет, очевидно, теоретической час-тотой (fm), одинаковой для каждой грани кубика.

Согласно данным таблицы 8.1 легко подсчитать величину

Х2эмп (хи- квадрат эмпирическое) по формуле (8.1).

Теперь, для того чтобы найти х2кр, необходимо обратиться к таблице 12 Приложения 1, определив, предварительно число степеней свободы v. В нашем случае k (число граней) = б, следом вательно v = 6 - 1 = 5. По таблице 12 Приложения 1 находим ве­личины х2кр для уровней значимости 0,05 и 0,01:

х2кр = 11,070 для Р< 0,05 х2кр = 5,086 для Р< 0,01


Строим «ось значимости»

В нашем случае х2эмп попало в зону незначимости и оказалось

равным 4,2, что гораздо меньше 11,070 — критической величи­ны для 5% уровня значимости. Следовательно, можно принимать гипотезу Н0 о том, что эмпирическое и теоретическое распреде­ления не различаются между собой. Таким образом, можно ут­верждать, что игральный кубик «безупречен».

Понятно, также, что если бы х2эмп попало в зону значимос­ти, то следовало бы принять гипотезу Н1 о наличии различий и тем самым утверждать, что наш игральный кубик был бы далеко не «безупречен».

Задача 8.2. В эксперименте испытуемый должен произвести выбор левого или правого стола с заданиями. В инструкции психолог подчеркивает, что задания на обоих столах одинаковы. Из 150 испытуемых правый стол выбрали 98 человек, а левый 52. Можно ли утверждать, что подобный выбор ле­вого или правого стола равновероятен или он обусловлен какой-либо причиной, неизвестной психологу?

Решение. Подчеркнем, что данная задача вновь на сопос­тавление экспериментального распределения с теоретическим. Каковы в этом случае параметры теоретического распределения? Предполагается, что выбор должен быть равновероятным, т.е. пра­вый и левый стол должны выбрать одинаковое количество испытуемых, а это 150:2 =75человек.

Проверим совпадение эмпирического распределения с теоре­тическим по критерию хи -квадрат. Лучше всего для расчета кри­терия использовать таблицу 8.2, последовательность вычислений в которой соответствует формуле (8.1).

Таблица 8.2

№ 1 №2 №3 № 4 № 5 № 6
Альтернативы выбора стола fэ fm (fэ-fm) (fэ-fm)2  
1 (правый)   75     7,05
2 (левый)   75 -23   7,05
Суммы         х2эмп = 14, 1

В таблице 8.2 альтернатива 1 соответствует выбору правого стола, а альтернатива 2 — выбору левого. Второй и третий столб­цы таблицы соответственно эмпирические и теоретические час­тоты. Следует просуммировать эти два столбца, чтобы проверить равенство сумм эмпирических и теоретических частот. Четвертый столбец соответствует разности между эмпирическими и теоре­тическими частотами (fэ - fm). В нижней строчке столбца эти раз­ности просуммированы. Полученная сумма равна 0. В дальнейших расчетах величина этой суммы не используется, но ее обязатель­но следует каждый раз вычислять, поскольку се равенство нулю гарантирует правильность вычислений на этом этапе. Если же сумма элементов четвертого столбца не равна нулю, это означа­ет, что в расчеты вкралась ошибка.

В нашем случае эмпирическая величина xw-квадрат, вычис­ленная по формуле (8.1), равна 14,1 и является суммой чисел в

шестом столбце. Для того чтобы найти табличные значения х 2кр

следует определить число степеней свободы по формуле: v = k - 1, где k — количество альтернатив (строк). В нашем случае k = 2, следовательно v = 2 - 1 = 1. По таблице 12 Приложения 1 нахо­дим:

х 2кр = 3,841 для Р< 0,05

х 2кр = б,635для Р< 0,01

Строим «ось значимости»:

Полученные различия оказались значимыми на уровне 1%. Иными словами, испытуемые статистически значимо предпочи­тают выбор правого стола. В терминах статистических гипотез этот вывод звучит так: выбор направления оказался не случай­ным, поэтому нулевая гипотеза Н0 о сходстве отклоняется и на высоком уровне значимости принимается альтернативная гипоте­за Н1 о различии. Если психологу интересны причины подобного выбора, то их следует выяснять в специальном эксперименте.

Задача 8.3. Психолог решает задачу: будет ли удовлетворен­ность работой на данном предприятии распреде­лена равномерно по следующим альтернативам (градациям):

1 —Работой вполне доволен;

2 — Скорее доволен, чем не доволен;

3 —Трудно сказать, не знаю, безразлично;

4 — Скорее недоволен, чем доволен;

5 — Совершенно недоволен работой.

Решение. Для решения этой задачи производится опрос случайной выборки из 65 респондентов (испыту­емых) об удовлетворенности работой: «В какой степени Вас устраивает Ваша теперешняя рабо­та?», причем ответы должны даваться согласно вышеозначенным альтернативам.

Полученные ответы (эмпирические частоты) представлены в таблице 8.3 в столбце № 2. В этой же таблице в третьем столбце даны теоретические частоты для данной выборки испытуемых, которые, согласно предположению психолога, должны быть

одинаковы и равняться: — = 13. В следующих столбцах таблицы 8.3 приведены необходимые расчеты по формуле (8.1).

Таблица 8.3

№ 1 №2 № 3 №4 N° 5 №6
Альтернативы. fэ fm (fэ-fm) (fэ-fm)2
      -5   1,92
2     +9   6,23
3     + 1   0,08
      -4   1,23
      -1   0,08
Суммы         х2эмп = 9,54

Напомним, что сумма величин (fэ - fm) в столбце № 4 долж­на равняться нулю. Это показатель правильности вычислений.

В шестом столбце таблицы подсчитана величина х2эмп равная

9,54. Для того чтобы найти табличные значения х 2кр для двух

Уровней значимости, следует вначале определить число степеней свободы по формуле: v = k - 1, где k — количество альтернатив

(строк). В нашем случае k = 5, следовательно v = 5 - 1 = 4. По таб­лице 12 Приложения 1 находим:

х 2кр = 9,488 для Р< 0,05

х 2кр = 13,277 для Р< 0,01


Строим «ось значимости»:

Величина х 2 эмп попала в зону неопределенности. Можно счи­тать, однако, что полученные различия значимы на уровне 5% и принять гипотезу Н1 о различии теоретического и эмпирическо­го распределений. Психолог может предположить, что на 5% уровне значимости выбор альтернатив респондентами не равно­вероятен. Таким образом, можно сказать, что эмпирическое рас­пределение выбора альтернатив значимо отличается от теорети­чески предположенного равномерного выбора альтернатив. При­чину этого, а также степень отвержения или предпочтения рабо­ты на данном предприятии психолог может выяснить в специ­альном исследовании.

При решении приведенных выше трех задач с равновероят­ным распределением теоретических частот не было необходимо­сти использовать специальные процедуры их подсчета. Однако на практике чаще возникают задачи, в которых распределение тео­ретических частот не имеет равновероятного характера. В этих случаях для подсчета теоретических частот используются специ­альные формулы или таблицы. Рассмотрим задачу, в которой в качестве теоретического будет использоваться нормальное рас­пределение.

Задача 8.4. У 267 человек был измерен рост. Вопрос состоит в том, будет ли полученное в этой выборке распре-

деление роста близко к нормальному? (Задача взя­та из учебника Г.Ф. Лакина «Биометрия», 1990). Решение. Измерения проводились с точностью до 0,1 см и все полученные величины роста оказались в диапа­зоне от 156,5 до 183,5 см. Для расчета по критерию хи -квадрат целесообразно разбить этот диапазон на интервалы, величину интервала удобнее всего взять равной 3 см, поскольку 183,5 - 156,5 = 27 и

27 делится нацело на 3 [27: 3=9]. Таким образом,

все экспериментальные данные будут распреде­лены по 9 интервалам. При этом центрами интер­валов будут следующие числа: 158 (поскольку

156,5 + 159,5 = 316 и 316:2 = 158), 161

(поскольку 159,5+ 162,5 = 322 и 322:2 = 161), 164 и т.д. до 182.

При измерении роста в каждый из этих интервалов попало какое-то количество людей — эта величина для каждого интер­вала и будет эмпирической частотой, обозначаемой в дальней­шем как fэi..

Чтобы применить расчетную формулу 8.1 необходимо прежде всего вычислить теоретические частоты. Для этого по всем полу­ченным значениям эмпирических частот (по всем выборочным данным) нужно вычислить:

1) среднее X

2) и среднеквадратическое отклонение (а).

Для наших выборочных данных величина среднего X оказа­лась равной 166,22 и среднеквадратическое а = 4,06.


Затем для каждого выделенного интервала следует подсчитать величины оi по формуле (8.3) (где индекс i изменяется от 1 до 9, т.к. у нас 9 интервалов):

(8.3)

Величины oi называются нормированными частотами. Удоб­нее производить их расчет в приведенной ниже таблице 8.4. Под­считав эти величины, необходимо занести их в соответствующую строчку третьего столбца таблицы 8.4.

Затем по величинам нормированных частот по таблице 11 Приложения 1 находятся величины f(oi), которые называются ординатами нормальной кривой для каждой oi. Величины f(oi), полученные из таблицы 11 Приложения 1, заносятся в соответ­ствующую строчку четвертого столбца таблицы 8.4. Величины, полученные в третьем и четвертом столбцах таблицы 8.4, позво- ляют вычислить по соответствующей формуле необходимые нам теоретические частоты (обозначаемые как fmi) и также занести их в пятый столбец таблицы 8.4.

Расчет теоретических частот осуществляется для каждого ин­тервала по следующей формуле


(8.4)

где п = 267 (общая величина выборки), λ = 3 (величина интервала) и а — среднеквадратичное отклонение.

Напомним, что после подсчета эти величины заносятся в со­ответствующую строчку пятого столбца таблицы 8.4.

Таблица 8.4

№1 №2 №3 №4 №5
Центры интервалов хi Эмпирические частоты fэi     Ординаты нормальной кривой f(oi) Расчетные теоретические частоты fmi
    -2,77 0,0086 1,6
    -2,03 0,0508 10,0
    -1,29 0,1736 34,3
    -0,55 0,3429 67,8
    +0,19 0,3918 77,6
    +0,93 0,2589 51,2
Продолжение таблица 8.4  
    + 1,67 0,0989 19,5  
    +2,41 0,0219 4,4  
    +3,15 0,0028 0,6  
Суммы   - 267,0  
                   

Рассмотрим более детально, как получаются необходимые нам показатели на примере первой строчки таблицы 8.4.

Так, согласно экспериментальным данным в первый интер­вал, т.е. в интервал от 156,5 см до 159,5 см, попало 3 человека (или соответствующая эмпирическая частота fэi= 3). Мы по­мним, что величина средней X для данной выборки равна 169,22 см, а величина а = 4,06.


Проведем расчет величины o l для первого интервала по фор­муле (8.3):

Подставляем полученную величину в первую строчку третье­го столбца таблицы 8.4. Дальнейший расчет производится с мо­дулями этих чисел.

Величину f(oi) = 0,0086 находим в таблице 11 Приложения 1 на пересечении строчки с числом 2,7 (десятые доли) и столбца с числом 7 (сотые доли). Заносим эту величину в первую строчку четвертого столбца таблицы 8.4.


Теоретическую частоту fmi, получаем в соответствии с форму­лой (8.4):

Заносим полученное число в первую строчку пятого столбца таблицы 8.4. Подобная процедура повторяется далее для каждого

интервала.

Теперь у нас все готово для работы с критерием хи -квадрат по формуле 8.1 на основе стандартной таблицы. В целях упроще­ния расчетов сократим число интервалов до 7. Это делается сле­дующим образом: складываем две верхние частоты и две ниж-

ние, т.е: 3 + 9=12 и 1+5 = 6. Тогда стандартная таблица для] вычисления хи -квадрат выглядит так:

Таблица 8.5

№ 1 № 2 № 3 № 4 №5 №6
Альтернативы fэ   fm   (fэ - fm) (fэ - fm)2  
    11,6 + 0,4 0,16 0,01
    34,3 -3,3 10,89 0,32
    67,8 + 3,2 10,24 0,15
    77,6 + 4,4 19,36 0,25
    51,2 -5,2 27,04 0,53
    19,5 -0,5 0,25 0,01
    5,0 + 1,0 1,00 0,20
Суммы         х 2 эмп = 1,47

В случае оценки равенства эмпирического распределения нормальному число степеней свободы определяется особым об­разом: из общего числа интервалов вычитают число 3. В данном случае: 7-3 = 4. Таким образом, число степеней свободы v в на­шем случае будет равно v = 4. По таблице 12 Приложения I на­ходим:

х 2кр= {9,488 для Р< 0,05 х 2кр = {13,277 для Р< 0,01

Строим «ось значимости»:

Полученная величина эмпирического значения хи -квадрат попала в зону незначимости, поэтому, необходимо принять ги­потезу Н0 об отсутствии различий. Следовательно, существуют все основания утверждать, что наше эмпирическое распределе­ние близко к нормальному.

В заключении подчеркнем, что, несмотря на некоторую «гро­моздкость» вычислительных процедур, этот способ расчета дает наиболее точную оценку совпадения эмпирического и нормаль­ного распределений.





Дата публикования: 2015-01-09; Прочитано: 2339 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2026 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (1.224 с)...