Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Дисперсионный анализ. Дисперсионный анализ определяется как статистический метод, предназначенный для оценки влияние различных факторов на результат эксперимента



Дисперсионный анализ определяется как статистический метод, предназначенный для оценки влияние различных факторов на результат эксперимента, а также для последующего планирования аналогичных экспериментов.

Однофакторная дисперсионная модель имеет вид:

(1) где - значение исследуемой переменной, полученной на i- том уровне фактора (i=1,2,…,m) с j-м порядковым номером (j=1,2,…,n);

Fi – эффект, обусловленный влиянием i –того уровня фактора;

- случайная компонента, или возмущение вызванное влиянием неконтролируемых факторов, тю е. вариацией переменной внутри отдельного уровня.

Под уровнем фактора понимается некоторая его мера или состояние, например, количество вносимых удобрений, вид плавки металла или номер партии деталей и т.п. Основные предпосылки дисперсионного анализа:

1. Математическое ожидание возмущения равно нулю.для любых i, т.е. (2)

2. Возмущения взаимно независимы.

3. Дисперсия возмущения (или переменной ) постоянна для любых i, j, т.е.

(3)

4. Возмущение (или переменная ) имеет нормальный закон распределения N(0; ).

Влияние уровней фактора может быть как фиксированным, или систематическим (модель I), так и случайным (модель II).

Пусть, например, необходимо выяснить, имеются ли существенные различия между партиями изделий по некоторому показателю качества, т.е. проверить влияние на качество одного фактора партии изделий. Если включить в исследование все партии сырья, то влияние уровня такого фактора систематическое (модель I), а полученные выводы применимы только к тем отдельным партиям, которые привлекались при исследовании; если же включить только отобранную случайно часть партий, то влияние фактора случайное (модель II). В многофакторных комплексах возможна смешанная модель III, в которой одни факторы имеют случайные уровни, а другие — фиксированные.

Рассмотрим эту задачу подробнее. Пусть имеется m партий изделий. Из каждой партии отобрано соответственно n1,n2,…,nm изделий (для простоты полагаем, что n1=n2=…=nm=n). Значения показателя качества этих изделий представим в виде матрицы наблюдений

Необходимо проверить существенность влияния партий из­делий на их качество.

Если полагать, что элементы строк матрицы наблюдений — это численные значения (реализации) случайных величин X1,X2,…,Xn выражающих качество изделий и имеющих нор­мальный закон распределения с математическими ожиданиями соответственно a1, a2,…,am и одинаковыми дисперсиями s2, то данная задача сводится к проверке нулевой гипотезы H0: a1= a2=…=am осуществляемой в дисперсионном анализе.

Обозначим усреднение по какому-либо индексу звездочкой (или точкой) вместо индекса, тогда средний показатель качества изделий i-й партии, или групповая средняя для i-го уровня факто­ра, примет вид:

,(4)

А общая средняя - (5)

Рассмотрим сумму квадратов отклонений наблюдений от общей средней :

(6)

Или Q=Q1 +Q2+Q3.

Последнее слагаемое , так как Как сумма отклонений значения переменной от ее средней.

Первое слагаемое можно записать в виде:

(7)

В результате получим следующее тождество:

Q=Q1+Q2, (8)

где общая, или полная, сумма квадратов отклонений;

- сумма квадратов отклонений групповых средних от общей средней, или межгрупповая (факторная) сумма квадратов отклонений.

- сумма квадратов отклонений наблюдений от групповых средних, или внутригрупповая (остаточная) сумма квадратов отклонений.

В разложении (8) заключена основная идея дисперсионного анализа. Если поделить обе части равенства (8) на число наблюдений, то получим правило сложения дисперсий. Применительно к рассматриваемой задаче равенство (8) показывает, что общая вариация показателя качества, измеренная суммой Q, складывается из двух компонент — Q1 и Q2, характеризующих изменчивость этого показателя между партиями Q1 и изменчивость «внутри» партий Q2, характеризующих одинаковую (по условию) для всех партий вариацию под воздействием неучтенных факторов.

В дисперсионном анализе анализируются не сами суммы квадратов отклонений, а так называемые средние квадраты, являющиеся несмещенными оценками соответствующих дисперсий, которые получаются делением сумм квадратов отклонений на соответствующее число степеней свободы.

Напомним, что число степеней свободы определяется как общее число наблюдений минус число связывающих их уравнений. Поэтому для среднего квадрата s12, являющегося несмещенной, оценкой межгрупповой дисперсии, число степеней свободы k1=m-1, так как при его расчете используются т групповых средних, связанных между собой одним уравнением (5). А для среднего квадрата s22, являющегося несмещенной оценкой внутригрупповой дисперсии, число степеней свободы k2 =mn-m, ибо при ее расчете используются все mn наблюдений, связанных между собой т уравнениями (4). Таким образом,

Найдем математические ожидания средних квадратов s12 и s22, подставив в их формулы выражение хij (1) через парамет­ры модели.

(ибо с учетом свойств математического ожидания, а

Для модели I с фиксированными уровнями фактора F(i=1,2,...,m) — величины неслучайные, поэтому

Гипотеза H0 примет вид Hi = F*(i=1,2,..,m), т.е. влияние всех уровней фактора одно и то же. В случае справедливости этой гипотезы M()= M() = .

Для случайной модели II слагаемое Fi в выражении (1) — величина случайная. Обозначая ее дисперсию

получим из (9)

(11)

и, как и в модели I, M() = .В случае справедливости нулевой гипотезы H0> которая для модели II принимает вид =0, имеем: M()= M() = .

Итак, в случае однофакторного комплекса как для модели I, так и модели II средние квадраты и являются несмещенными и, как можно показать, независимыми оценками одной и той же дисперсии .

Следовательно, проверка нулевой гипотезы H0 свелась к проверке существенности различия несмещенных выборочных оценок и и дисперсии .

Пример. Имеются четыре партии сырья для текстиль­ной промышленности. Из каждой партии отобрано по пять об­разцов и проведены испытания на определение величины раз­рывной нагрузки. Результаты испытаний приведены в табл. 1.

Таблица 11.2

Номер партии Разрывная нагрузка (кг/см2)
1 2 3 4 200 190 230 150 140 150 190 170 210 200 150 145 150 190 170 165 150 200 180

Необходимо выяснить, существенно ли влияние различных партий сырья на величину разрывной нагрузки. Принять a = 0,05.

Решение. Имеем m=4, n=5. Найдем средние значения разрывной нагрузки для каждой партии по формуле (4):

=(200+140+170+145+165)/5 = 164 (кг/см2)

и аналогично

= 170, =2О2 и = 164 (кг/см2).

Среднее значение разрывной нагрузки всех отобранных образцов по формуле (5):

=(200+140 +... + 170+180)/20=175 (кг/см2)

(или, иначе, через групповые средние,

=(164+170+202+164)/4=175 (кг/см2)).

Вычислим суммы квадратов отклонений по формулам (6), (7):

Соответствующее число степеней свободы для этих сумм m-1=3; mn-n =5 • 4-4=16; nm-1=5 • 4-1=19.

Результаты расчета сведем в табл. 2.

табл. 2.

Компоненты дисперсии Суммы квадратов Число степеней свободы Средние квадраты
Межгрупповая Внутригрупповая Общая 7270 12250   1660,0 454,4

Фактически наблюдаемое значение статистики По таблицам приложений критическое значение F-критерия Фишера-Снедекора на уровне значимости a=0,05 при k1=16 степенях свободы F0,05;3;16=3,24. Так как F> F0,05;3;16, то нулевая гипотеза отвергается, т. е. на уровне значимости a=0,05 (с надежностью 0,95) различие между партиями сырья оказывает существенное влияние на величину разрывной нагрузки.

5.4 Многомерный статистический анализ

Многомерный статистический анализ определяется как раз­дел математической статистики, посвященный математическим методам построения оптимальных планов сбора, систематизации и обработки многомерных статистических данных, направленных на выявление характера и структуры взаимосвязей между компо­нентами исследуемого признакам предназначенных для получения научных и практических выводов.

Многомерные статистические методы среди множества воз­можных вероятностно-статистических моделей позволяют обос­нованно выбрать ту, которая наилучшим образом соответствует исходным статистическим данным, характеризующим реальное поведение исследуемой совокупности объектов, оценить надеж­ность и точность выводов, сделанных на основании ограничен­ного статистического материала.





Дата публикования: 2015-01-09; Прочитано: 718 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.012 с)...