Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Дисперсионный анализ



1)Модели эксперимента дисперсионного анализа

2) Однофакторный анализ при полностью случайном плане эксперимента

3) Однофакторный анализ при группировке по случайным блокам

4) Двухфакторный анализ при полностью случайном плане эксперимента

1) Методы статистикинаходятприменения в различного рода экспериментальных исследованиях. Методы статистики не ограничиваются пассивной обработкой результата, они играют активную роль при планировании эксперимента и при анализе, полученных при его проведении результатов.

В результате планирования эксперимента получается больший объем информации при тех же материальных затратах, чем при применении обычных методов.

Собранные в ходе контрольного эксперимента данные подвергаются специальному статистическому анализу, который называется дисперсионный анализ.

Суть этого анализа сводится к разложению общей дисперсии признака на компоненты, обусловленные влиянием конкретных факторов и проверки гипотезы в значимости их влияния.

В основе дисперсионного анализа лежит предложение, согласно которому значения результата эксперимента можно представить в виде суммы ряда компонентов (влияние сорта пшеницы на урожай, т.е. исследуется влияние одного фактора).

Тогда модель, описывающая структуру результата эксперимента, будет выглядеть так:

Где xij – значение признака полученное на i уровне фактора наблюдений (урожайность пшеницы i сорта j делянке).

- общая средняя (средняя урожайность на всех делянках)

Li – эффект фактора на i уровне (эффект i сорта пшеницы)

Eij – случайная компонента, вызванная влиянием прочих факторов (климатические условия).

В расчетах делается жесткое предположение, что Eij имеет нормальное распределение со средней, равной 0. Эта модель самая простая.

Сначала рассматривается наиболее простая схема опыта – полностью случайный план эксперимента. Далее изучается влияние на значение признака х только одного фактора. Затем разбиваются результаты наблюдений на P групп (выборок), различающихся между собой по уровню фактора. Количество элементов в группах может быть различным, поэтому следует обозначить число наблюдений в j группе (j=1, 2, …., p) через nj.

Значение признака в j группе обозначается через xij (где i=1,2,…,nj) i порядке номер наблюдений в j группе.

Результаты наблюдений удобно представить в упорядоченном виде таблицы:

№ выборки Наблюдаемое Значение признака V выборки Групповая средняя
  х11,х21,х31,..,хn11 n1
…. ……. ….. …… …..
J X1j, x2j,x3j,…,xnjj nj
….. …… …. …… …..
P x1p, x2p,x3p,…,xnpp np
  итого

В итоговой строке представлены общий объем совокупности N, сумма всех наблюдений G и общая средняя .

Для выполнения дисперсионного анализа необходимо определить 2 дисперсии:

1) межгрупповая (дисперсия групповых средний; обусловленная влиянием изучаемого фактора;

2) внутригрупповая, величина которой рассматривается как случайная;

Введем обозначения:

Тогда разложение можно представить виде:

Q0=Q1+Q2, где

Q0- общая сумма квадратов отклонений

Q1 – сумма квадратов отклонений от групповых средних или сумма квадратов остаточных отклонений

Q2 - взвешенная сумма квадратов отклонений групповых средних от общей средней

Для получения несмещенных оценок дисперсии необходимо каждую сумму квадратов разделить на число степеней свободы.

Пусть V0 – число степеней свободы, учитываются при расчете общей дисперсии.

V1 – число степеней свободы при расчете внутригрупповой дисперсии.

V2 – число степеней свободы при расчете межгрупповой дисперсии.

При расчете несмещенной оценки дисперсии число степеней свободы равно N-1,так как одна степень свободы теряется при определении средней величины. Тогда:V0= N-1, V1=N-P, так как используется P групповых V2=P-1, так как групповые средние варьируют вокруг одной общей величины.

В итоге V1+V2=N-p+p-1=N-1=V0.

Используя полученные значения сумм квадратов и чисел степей свободы, можно рассчитать несмещенные оценки

S0 2 =Q0/(N-1)

S1 2 =Q1/(N-P)

S22 =Q2/(P-1)

Если P групп на которые разбита вся совокупность результатов наблюдений, соответствуют P уровням воздействующего фактора, то:

остаточная дисперсия).

S22- характеризует рассеяние групповых средних – систем аттическая вариация.

Задачи проверки в существенности различия между выборками можно конкретизировать и представить как задачу о различии дисперсий.

Если влияние фактора отсутствует, то S22 S1 2можно рассматривать как независимые оценки дисперсий совокупности G2.

Если фактор оказывает заметное влияние S22 /S1 2превзайдет критический предел, и следует считать, что выборки взяты из совокупностей, т.е. наличие влияния факторов.

Задача проверки гипотезы о равенстве 2 дисперсий возникает очень часто:

1) при анализе стабильности производственного процесса до и после введения технического новшества

2) при изучении качества измерительных приборов

3) при изучении степени однородности к-л признака

4) необходимость проверки равенства дисперсии возникает при сравнении средних величин совокупности, при этом предполагается, что дисперсии генеральных совокупностей одинаковы.

Пусть имеются 2 нормально распределенных совокупности, дисперсии которых G12 и G22. В этом случае необходимо проверить гипотезу, которая называется «Но: G12 = G22»

Т.К. дисперсии генеральных совокупностей неизвестны, то проверку гипотезы осуществляют на основе сопоставления выбора дисперсий (S22 иS1 2):

– если отношение S22 /S1 2 близко к1, тонет основания для отклонений от гипотенузы;

– если отклонение отличается от 1, то возможно отклонение от гипотенузы.

Для этого необходимо рассмотреть отношение:

F= S22 /S1 2, где S22 >S1

Данное распределение F называется распределение Фишера-Снедекора, оно зависит от 2 параметров:

– Степень свободы числителя и знаменателя

V1=n1-1 V2 n2-1, где n1, n2-объем выборки

Рассмотрим отношение F= S22 /S1 2

{V1=n1-1 V2=n2-1}

Для проверки гипотезы «Но:» необходимо определить:

1) Если отношение выборочных дисперсий F окажется больше критического, то гипотеза «Но:» отклоняется.

2) Если оно меньше либо равно, то «Но:» не отклоняется

3) Если альтернативная гипотеза формулируется как «Н1: G12 G22, то используется двухсторонний критерий.

4) Если известно, что одна из дисперсий больше другой G12 G22, то используется односторонний критерий.

Оценка дисперсий:

Характер вариации Сумма квадратов Число степень свободы Оценка дисперсий
Систематическая (межгрупповая) P-1 S22=Q2/p-1
Остаточная (Внутригрупповая) N-P S12=Q1/N-P
Итого Q0=Q1+Q2= N-1  

Fx= S22 /S1 2; {P-1/N-p}

3) Предположим, что необходимо определить и решить задачу: проверить различия в урожайности нескольких сортов с/х культур, если все участки земли по плодородию примерно одинаковы, то лучше всего прибегнуть к полностью случайному плану размещения сортов по участникам. На практике участки чаще всего различают между собой, что будет вызывать дополнительный разброс в экспериментальных данных.

Для устранения влияния неоднородности выделенную для эксперимента площадь делят на участки, которые называются блоками, с примерно одинаковым качеством земли в пределах каждого блока. Затем каждый блок делят на столько делянок, сколько испытывается сортов культуры. Распределение сортов по делянкам производится в случайном порядке. Такой метод планирования эксперимента называется метод случайных блоков. В отличие от случайного плана числа единиц наблюдения, для каждого уровня фактора должно быть одинаково:

n1=n2=….=nj=…=np=n

Модель экспериментального результата в этом случае можно записать:

Xij= +Li+Bj+Eij, где

- общая средняя

Li – эффект блоков

Bj – эффект уровня факторов (эффект сорта культуры)

Eij – случайная компонента

Используя метод случайных блоков, изменяется разброс данных наблюдений

№ блока Результат наблюдений по блокам Сумма по строкам Средняя по уровню фактора
      …. i …. n    
  x11 x21 …. xi1 …. xn1 T1 X сред. 1
  x12 x22 …. xi2 …. xn2 T2 X Сред2
…. …. …. …. …. …. …. …. ….
…. x1j x2j …. xij …. xnj Tj X сред. J
…. …. …. …. …. …. …. …. ….
P x1p x2p …. xip …. xnp Tp X сред. P
Сумма по вертикале B1 B2 …. Bi …. Bn G X сред.
Сред. по блокам Bсред.1 Bсред.2 …. Bсред.i …. Bсред. N - -

Таблица дисперсионного анализа

Характер вариации Сумма квадратов Число степеней свободы Оценка дисперсии
Систематическая (межгрупповая) P-1 S32=Q3/P-1
Между блоками n-1 S22=Q2/n-1
Остаточная Q1=Q0-(Q2+Q3) (n-1)(p-1) S12=Q1/(n-1)(p-1)
Итого: N-1  

Для проверки значимости влияния фактора используют критерий отношения дисперсии:

Fрис =S22/S12 {n-1/(n-1)*(p-1)}

Если Fрис Fкр, то возникает гипотеза о влиянии фактора, который не отклоняется.

Если Fрис Fкр, то гипотеза отклоняется.

4) Рассмотрим влияние двух факторов (А и В) и их взаимодействия на некоторый результативный признак.

Модель имеет следующий вид:

Xijk= +Li+Bi+Jij+Eijk

Xijk- результат эксперимента в К наблюдениях, на котором уровне фактора А и на j-ом факторе В.

-общая средняя

Li – эффект фактора А

Bi- эффект фактора В

Jij-эффект, вызванный совместным влиянием обоих факторов

Eijk-случайная компонента

Опыт проводится при фиксированных уровнях факторов опыт повторяется n раз, то соответственно получим n признаков.

Данные эксперимента представим в таблице:

Уровень фактора В Уровень фактора А Сумма
А1 А2 …. Аpi
В1 х111,х11211n Х211,х21221n …. Хp11,хp12p1n
В2 х121,х12212n Х221,х22222n …. Хp21,хp22p2n
…. …. …. …. …. ….
Вq х1q1,х1q21qn Х2q1,х2q22qn …. Хpq1,хpq2pqn
Сумма ….

Оценим следующие показатели:

Общая средняя:

Средние по строкам:

Среднее по столбцам:

Средние для каждого сочетания уровня факторов (для каждой отдельной клетки таблицы)

Таблица дисперсионного анализа

Источник вариации Сумма квадратов Число степеней свободы Оценка дисперсии
Фактор А p-1 S42=Q4/p-1
Фактор В q-1 S32=Q3/q-1
Взаимодействие АиВ (p-1)(q-1) S22=Q2/(p-1)(q-1)
Остаточная вариация N-pq S12=Q1/N-pq
Итого: N-1  

Влияние каждого фактора и влияние их взаимодействия

Найдем 3 значения Fp

1) Fp для фактора А:

FpA=S42/ S12{p-1/N-pq}

2) FpB=S32/ S12{q-1/N-pq}

3) FpAB=S22/ S22{(p-1)(q-1)/N-pq}

Необходимо отметить следующее:

1) при применении дисперсионного анализа исследуемая совокупность данных расчленяется на группы, отличающиеся по уровню фактора.

2) предполагается, что распределение признаков является нормальными, а дисперсия в каждой отдельной группе данных одинакова.

Рассмотрим очень важную в теоретическом и практическом отношении и наиболее простую схему опыта – полностью случайный план – эксперимент.

Пусть подлежит изучению влияния на значение признака х только одного фактора. Разобьем результаты наблюдения на p групп (выборок), различающихся между собой по уровню факторов. Численность этих групп может быть различной.

Обозначим число наблюдений в j группе через nj, xij, где i=1,2,…,nj, и i-порядковый номер наблюдений в j группе. Результаты наблюдений:

Номер выборки Наблюдаемые Значения выборки Объем выборки Сумма Групповая средняя
  x11,x21,…,xi1,…xni1 n1
…. …. …. ….  
J x1j,x2j,…,xij,…xnjj n2
…. …. …. ….  
P x1p,x2p,…,xip,…xnpp nn
Итого  

Для выполнения дисперсионного анализа необходимо определить 2 дисперсии:

1) межгрупповая (дисперсия групповых средний; обусловленная влиянием изучаемого фактора;

2) внутригрупповая, величина которой рассматривается как случайная;





Дата публикования: 2015-01-09; Прочитано: 446 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.015 с)...