Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Множественные сравнения средних

Множественные сравнения средних

Под термином “множественные сравнения” понимается одновременное сравнение более чем двух средних, характеризующих несколько подвыборок. Эта задача значительно более сложная и решается с помощью методов однофакторного дисперсионного анализа.

С математической точки зрения задача формулируется следующим образом. Имеется несколько средних , полученных по k подвыборкам объемом nj. Требуется выяснить, являются ли числа оценками одной и той же генеральной средней. Этой формулировке соответствует нулевая гипотеза

H 0: m1 = m2=... = m k, (1.8)

где m1 ,... m k – генеральные средние подвыборок.

Совершенно недопустимо задачу сравнения нескольких средних решать изложенными в предыдущем разделе методами, применимыми только для сравнения двух средних. Казалось бы, можно, пользуясь t -критерием, сначала сравнить первые две средние, затем первую и вторую и т.д. Однако такой способ сравнения может привести к ошибочному выводу – сравнивая в один прием лишь две средние, мы лишаем себя всей информации об остальных средних: то, что невозможно на двух случайных выборках, может стать вполне возможным на большем их числе (чем больше проводится испытаний, тем более редкие события могут произойти). Кроме того, незначимые различия, накапливаясь от пары к паре, могут стать вполне значимыми, хотя мы этого не замечаем. Конечно, такой ошибки можно избежать, сравнивая самую большую и самую маленькую среднюю – если уж они различаются незначимо, то и между промежуточными средними различий нет. Но и этот вывод справедлив лишь в случае подвыборок одинаковых объемов.

Широко применяемый в математической статистике критерий Фишера (F -критерий) позволяет сравнить средние в своей совокупности. При этом изменчивость между выборочными средними (межгрупповой средний квадрат) сравнивается с изменчивостью внутри выборок (внутригрупповой средний квадрат):

F = MSF / s 2, (1.9)

где MSF – межгрупповой средний квадрат (дисперсия, обусловленная влиянием изучаемого фактора, который определяет группировку подвыборок); s 2 – внутригрупповой средний квадрат (остаточная дисперсия). Каждый из средних квадратов имеет соответствующее число степеней свободы f: fF = k -1 – для межгруппового среднего квадрата и fR = N - k – для остаточной дисперсии, где N – общий объем выборки (сумма объемов подвыборок). Отсюда следует, что чем больше число сравниваемых средних, тем более обоснованными могут быть выводы о их различии или сходстве, или, иными словами, о степени влияния изучаемого фактора, определяющего группировку подвыборок, на изменчивость переменной.

Однако по величине F -критерия можно выявить только незначимость или значимость различий. Если F -критерий отклоняет гипотезу о том, что все средние равны, то мы сталкиваемся с необходимостью указать, какие подмножества средних можно рассматривать как однородные и какие нет.

Самой простой является процедура, состоящая в применении t -критерия для двух выборок к каждой из k (k -1)/2 возможных пар средних , с учетом принципа Бонферрони при расчете уровня статистической значимости. Кроме этого подхода, предлагались и многие другие: критерий минимальной значимой разности (МЗР-критерий) в модификации Фишера; критерий Тьюки, основанный на понятии стьюдентизированного размаха; одновременная процедура Габриэля, использующая не размах, а суммы квадратов; критерий Дункана; критерий Шеффе и другие.

В программе статистического анализа в общественных науках программы SPSS Base используются до 20 процедур множественного сравнения, учитывающих число сравниваемых пар. Различают процедуры, проверяющие разности между каждой парой средних, с одной стороны, и выделяющие однородные подмножества средних, не отличающихся значимо друг от друга, с другой. Последние называются множественные критерии размаха. Метод Бонферрони и метод Тьюки относятся к методам парных сравнений; кроме того, метод Тьюки позволяет также решить задачу выделения однородных подмножеств средних. Полагают, что при большом числе сравниваемых средних более чувствительным является метод Тьюки, а при малом – метод Бонферрони.

Большинство методов требует равенства групповых дисперсий (в статистическом смысле), таковы методы Тьюки и Бонферрони, и лишь в некоторых методах допускается их неравенство (метод Геймса-Хоуэлла, Т2 Тахмана, Т3 Даннета и С Даннета). Непременным условием применения всех методов множественного сравнения является близость распределения переменной к нормальному и независимость наблюдений. Среди критериев, предполагающих равенство дисперсий – метод Шеффе, Стьюдента-Ньюмана-Келса (S-N-K) и Дункана. Последние два критерия авторами руководства по применению пакета SPSS не рекомендуются к использованию, что касается метода Шеффе, то он позволяет выполнить проверку не только различий средних, но и любых их комбинаций (метод контрастов).

Проиллюстрируем возможности методов множественного сравнения на следующем примере: необходимо сравнить уровень экономической активности разных категорий населения регионов ЦФОв 2009 г.

Рассмотрим вначале графическое представление распределений переменной “Уровень экономической активности населения в регионах ЦФОв 2009 г., %” для мужчин, женщин, городского и сельского населения приведено на рис. 1.5 в виде ящичковых диаграмм (г. Москва исключена из выборки ввиду отсутствия в ней сельского населения).

Рис. 1.5. Распределение переменной “Уровень экономической активности населения в регионах ЦФОв 2009 г., %” в зависимости от категории населения
Однако по рис. 1.5 нельзя дать однозначного ответа на поставленный вопрос: диаграммы показывают сильное перекрытие распределений. Можно лишь отметить, что наблюдается тенденция увеличения экономической активности мужчин по сравнению с женщинами.

Множественное сравнение средних осуществляли с помощью процедуры “ One-Way ANOVA ” (однофакторный дисперсионный анализ) программы SPSS Base. Результаты дисперсионного анализа, приведены в табл. 1.8.

Таблица 1.8

ANOVA для переменной “Уровень экономической активности населения в регионах ЦФОв 2009 г., %”

Источник изменчивости Сумма квадратов Ст. св. Средний квадрат F Знч.
Между группами 944,112   314,704 35,887 0,000
Внутри групп 561,240   8,769    
Итого 1505,352        
Как следует из таблицы однофакторного дисперсионного анализа, изменчивость переменной “Уровень экономической активности населения в регионах ЦФОв 2009 г., %”, вызванная различием категорий населения, намного больше изменчивости внутри выборок: величине F -критерия отвечает уровень значимости менее 0,0005. Это означает, что различие в средних установлено с высокой надежностью: если средние подвыборок равны, то такое большое значение F -критерия можно было бы ожидать не чаще, чем в пяти случаях из 10000, что крайне маловероятно.

Для выявления различия средних воспользуемся многоранговым тестом Дункана, предварительно проверив групповые дисперсии переменной нам однородность по критерию Ливиня – табл. 1.9.

Таблица 1.9

Критерий однородности дисперсии для переменной “Уровень экономической активности населения в регионах ЦФОв 2009 г., %”

Статистика Ливиня Ст. св.1 Ст. св.2 Знч.
0,455     0,715
Значимость статистики Ливиня (F -критерия) составляет величину 0,715, т.е. вероятность появления такой величины статистики (0,455) при равенстве дисперсий достаточно велика, поэтому нами принимается гипотеза о равенстве групповых дисперсий, и метод Дункана может быть применен.

Результатом процедуры множественного сравнения по методу Дункана является таблица “Множественные сравнения” (табл. 1.10).

Таблица 1.10

Гомогенные подгруппы населения для переменной “Уровень экономической активности населения в регионах ЦФОв 2009 г., %”

Категория населения N Подгруппа для alpha = 0.05
1
     
Женщины
  61,994      
Село
    64,971    
Город
      67,400  
Мужчины
        72,171
Значимость
1,000 1,000 1,000 1,000
Из табл. 1.11 следует, что все четыре категории населения образуют самостоятельнее подгруппы (значимость равна 1,000), при этом меньше всего уровень экономической активности женщин, затем следует сельское и городское население, а завершают ранжированную линейку категории населения мужчины, которые характеризуются наибольшим уровнем экономической активности населения регионов ЦФО.

В процедуре “ One-Way ANOVA ” предусмотрено построение диаграммы для средних; эта диаграмма представлена на рис. 1.6.

Поскольку многоранговый тест Дункана показал статистически значимое различие всех четырех средних, на этом однофакторный анализ завершается; в противном случае можно было бы выполнить анализ средних по более сложному алгоритму, применив сравнение контрастов.

Рис. 1.6. Распределение средних переменной “Уровень экономической активности населения в регионах ЦФОв 2009 г., %” по категориям населения
В заключение отметим, что, к сожалению, методы множественного сравнения, как и вообще методы дисперсионного анализа, еще недостаточно применяются в практике анализа данных эмпирических исследований.

Литература

1. Бююль, А., Цёфель, П. SPSS: Искусство обработки информации. Анализ статистических данных и восстановление скрытых закономерностей [Текст]. – СПб.: ООО «ДиаСофтЮП», 2002. – 608 с.

2. Кремер, Н.Ш. Теория вероятностей и математическая статистика [Текст]: Учебник для вузов. – М.: ЮНИТИ-ДАНА, 2000. – 543 с.

3. Мартынов, А.Ф., Шуметов, В.Г. Информатика для менеджеров. [Текст]: Курс лекций. – М.: Открытый институт МГУДТ, 2002. – 160 с.

4. Шуметов, В.Г. Кластерный анализ в региональном управлении [Текст]: учебное пособие. – Орел: ОРАГС, 2001. – 120 с.

5. SPSS Base 8.0 для Windows. Руководство по применению. [Текст] Перевод–Copyright 1998 СПСС Русь. – 397 с.

Контрольные вопросы

1. Какая связь между сравнением нескольких средних и однофакторным дисперсионным анализом?

2. Что такое критерий Фишера (F -критерий)?

3. В каких случаях множественные сравнения проводятся по методу Тьюки и в каких – по методу Бонферрони?


Дата публикования: 2014-11-02; Прочитано: 2698 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.01 с)...