Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Двух- и многофакторный анализ



Если на результативный признак влияют несколько факторов одновременно, то имеет место многофакторный анализ. Дисперсионный анализ в этом случае имеет свои особенности, так как необходимо учитывать взаимодействие между факторами.

Предположим, что имеется несколько однотипных станков и несколько видов сырья. Требуется выяснить, значимо ли влияние различных станков и качество сырья в партиях на качество обрабатываемых деталей. Это типичная задача двухфакторного дисперсионного анализа.

Считаем, что предпосылки дисперсионного анализа выполнены, то есть результаты наблюдений есть независимые случайные величины, имеющие нормальное распределение и одинаковую дисперсию.

Пусть фактор А – влияние настройки станка, фактор В – влияние качества сырья. Имеем r станков, следовательно, r уровней фактора А, v партий сырья, следовательно, v уровней фактора В. Матрицу наблюдений можно представить в виде таблицы 4.18.

Пересечение i-го уровня фактора А с j-м уровнем фактора В образует ij-ую ячейку, в которую записывают наблюдения, полученные при одновременном исследовании факторов А и В на i-м и j-м уровнях.

Таблица 4.18.

Партии сырья j Станки i B1 B2 Bj Bv
А1 x11 x12 x1j x1v
А2 x21 x22 x2j x2v
Аi xi1 xi2 xij xiv
Аr xr1 xr2 x2j xrv

Для простоты можно предположить, что имеем в ячейке только одно наблюдение xij. Предположим также, что между факторами А и В нет взаимодействия и что на i-м уровне фактора А наблюдения имеют среднюю βiA, а на j-м уровне фактора В наблюдения – среднюю βjB. Тогда одно наблюдение можно представить в виде

xij = μ + γi + δj + εij, (4.42)

где μ - общая средняя,

γi - эффект, обусловленный влиянием i-го уровня фактора А,

δj - эффект, обусловленный влиянием j-го уровня фактора В,

εij - вариация результатов внутри отдельной ячейки (в случае одного наблюдения вариация равна нулю).

Оценками μ, βiA, βjB являются, соответственно

- общая средняя

- средние по уровням , .

Оценки общей дисперсии можно получать из основного тождества дисперсионного анализа. В двухфакторном анализе общая сумма квадратов отклонений от общей средней раскладывается согласно формуле (4.40) не на две, а на три составляющие:

- часть общей суммы квадратов, обусловленную фактором А;

- часть общей суммы квадратов, обусловленную фактором В;

- часть общей суммы квадратов, обусловленную влиянием неучтенных факторов.

С помощью дисперсионных отношений можно выяснить, насколько существенно влияние каждой из этих частей. Действительно,

(4.43)

где Q1 - сумма квадратов разностей между средним по строкам и общим средним, характеризующая изменение признака по фактору А;

Q2 - сумма квадратов разностей между средним по столбцам и общим средним, характеризующая изменение признака по фактору В;

Q3 – остаточная сумма квадратов отклонений отдельных наблюдений от общей средней.

Оценки дисперсий соответственно равны:

- между средними по строкам (4.44)

- между средними по столбцам (4.45)

- остаточная (4.46)

- общая (полная) (4.47)

В двухфакторном анализе для выяснения значимости влияния факторов А и В на исследуемый признак сравнивают дисперсии по факторам с остаточной дисперсией. Вычисляют статистики

,

Сравнение вычисленных статистик с табличными значениями и выводы о существенности влияния факторов производят так же, как и в однофакторном дисперсионном анализе.

Двухфакторный дисперсионный анализ (также как и однофакторный) удобно представлять в виде таблицы 4.19.

Рассмотрим на примере построение двухфакторного комплекса с одним наблюдением в ячейке.

Таблица 4.19.

Компоненты дисперсии Сумма квадратов Число степеней свободы Оценки дисперсии
Между средними по строкам r-1
Между средними по столбцам v-1
Остаточная (r-1)·(v-1)
Полная (общая) r·v-1
Таблица 4.20.
В А B1 B2 B3
А1        
А2        
    6,5 4,5
 

Пример 4.27. Имеем три уровня фактора В: В1, В2 и В3 и два уровня фактора А: А1 и А2. Для данного комплекса r=2, v=3 и n=r·v=6. В нижней строке таблицы 4.20 и в правом крайнем столбце приведены средние значения по строкам и столбцам, то есть по уровням факторов. Так, среднее по уровню фактора В1 равно ; среднее по уровню фактора А1 равно . Общее среднее

Решение 4.27. Используя формулу (4.43), получаем суммы квадратов, а оцен­ки дисперсий находим по формулам (4.44) - (4.47). Результаты заносим в таблицу 4.21.

Таблица 4.21.
Компоненты дисперсии Сумма квадратов Число степеней свободы Оценки дисперсии
Между средними по строкам (фактор А) 37,5   37,5
Между средними по столбцам (фактор В) 13,0   6,5
Остаточная 3,0   1,5
Полная (общая) 53,5   10,7
 

Вычисляем статистики

Для уровня значимости α=0,05 и ν1=1, ν2=2, ν3=2 имеем F1;2;0,05=18,51 и F2;2;0,05=19,0.

Сравнивая табличные значения с вычисленными статистиками, имеем =25 > F1;2;0,05=18,51 и =4,3 > F2;2;0,05=19,0.

Полученные результаты позволяют сделать выводы: нулевая гипотеза о равенстве средних по строкам не подтверждается, то есть влияние фактора А на исследуемый признак значимо. Нулевая гипотеза о равенстве средних по столбцам не опровергается, то есть влияние фактора В на исследуемый признак незначимо.

Мы рассмотрели частный случай двухфакторного дисперсионного анализа при классификации по двум признакам: в ячейке одно наблюдение, взаимодействие между факторами отсутствует. В общем случае в ячейке может и должно быть несколько наблюдений (как равное, так и неравное количество), между факторами может иметь место взаимодействие. Лучше, когда в ячейке равное количество наблюдений, так как при этом упрощаются вычисления.

Для общего случая двухфакторного анализа одно наблюдение можно представить в виде

xijk = μ + γi + δj + ηij + εijk,

где μ - общее среднее,

γi - эффект, обусловленный влиянием i-го уровня фактора А,

δj - эффект, обусловленный влиянием j-го уровня фактора В,

ηij - эффект взаимодействия факторов А и В;

εijk - вариация результатов внутри отдельной ячейки.

Основное тождество двухфакторного дисперсионного анализа с одинаковым количеством наблюдений в ячейке (n) имеет вид

Здесь Q1 и Q2 имеют тот же смысл, что и в формуле (4.43), то есть

Q1 – сумма квадратов разностей между средними по строкам и общим средним, характеризующая изменение признака по фактору А;

Q2 – сумма квадратов разностей между средними по столбцам и общим средним, характеризующая изменение признака по фактору В;

Q3 – сумма квадратов, оценивающая взаимодействие факторов А и В;

Q4 – сумма квадратов, оценивающая вариацию внутри ячейки.

Для оценки Q1, Q2, Q3 и Q4 находим:

- среднее значение в ячейке ;

- среднее значение по строке ;

- среднее значение по столбцу ;

- общее среднее ; (4.48)

где r - число уровней фактора А и v - число уровней фактора В.

Порядок проведения дисперсионного анализа в этом случае такой же, как и прежде: сначала вычисляют суммы квадратов, оценки дисперсий, затем отношение дисперсий сравнивают с табличным.

Схема анализа и порядок вычислений сумм приведены в таблице 4.22.

Как видно из таблицы 4.22, в схеме анализа появляется новая сумма квадратов Q4 и несколько меняется структура суммы Q3 (вместо xijk берется ). Появление суммы Q4 обусловлено наличием нескольких наблюдений в ячейке. В предыдущей схеме эта сумма отсутствовала, так как при одном наблюдении в ячейке разность (xijk - ) равна нулю. Сумма Q4 характеризует влияние прочих случайных факторов (кроме факторов А, В и их взаимодействия), поэтому для определения значимости влияния факторов А и В величину дисперсии, обусловленную влиянием этих факторов, сравнивают с дисперсией, обусловленной влиянием прочих факторов. При этом вычисляют следующие статистики:

Таблица 4.22.

Компоненты дисперсии Сумма квадратов Число степеней свободы Оценки дисперсии
Между средними по строкам (по фактору А) v-1
Между средними по столбцам (по фактору В) r-1
Взаимодей-ствие (r-1)·(v-1)
Остаточная r·v·(n-1)
Полная (общая) r·v·n-1

Вычисленные значения сравниваются с табличными значениями , которые получены для заданного уровня значимости и соответствующих чисел степеней свободы.

Рассмотрим пример построения двухфакторного комплекса по приведенной схеме.

Пример 4.28. В текстильной промышленности важным является выявление факторов, влияющих на качество пряжи, с тем, чтобы в дальнейшем их было можно регулировать. В таблице 4.23 приведены данные о величинах разрывной нагрузки в зависимости от наладки машины и партии сырья.

Таблица 4.23.
Партии сырья   Уровень наладки B1 B2
А1                    
А2                    
А3                    
 
Таблица 4.24.
Партии сырья   Уровень наладки B1 B2
А1
А2
А3
 

При каждом уровне наладки машины исследованы по пять образцов из каждой партии сырья для определения разрывной нагрузки. Требуется выяснить, значимо ли влияют наладка машины и партии сырья на величину разрывной нагрузки.

Решение 4.28. По формулам (4.48) определяем средние значения, которые заносим в таблицу 4.24. Из нее находим Q1=2686,7; Q2=480; Q3=1860; Q4=22360; Q=Q1+Q2+Q3+Q4=27386,7.

Отсюда оценки дисперсий:

Таким образом, получаем таблицу 4.25.

Таблица 4.25.

Компоненты дисперсии Сумма квадратов Число степеней свободы Оценки дисперсии
Между средними по строкам (по фактору А) 2686,7   2686,7
Между средними по столбцам (по фактору В) 480,0   240,0
Взаимодействие 1860,0   930,0
Остаточная 22360,0   931,7
Полная (общая) 27386,7   944,4

Вычисляем отношения дисперсий:

При уровне значимости α=0,05, k4=24 и k1=1 для FA;(1;24;0,05)=4,26 и k4=24, k3=2 для FВ;(2;24;0,05)=3,40. Сравнивая табличные значения с вычисленными, имеем < FA;(1;24;0,05) и < FB;(1;24;0,05). Следовательно, нулевая гипотеза о ра­вен­ст­ве средних на отвергается, то есть влияние фактора А (уровня наладки машины) и фактора В (партии сырья) на величину разрывной нагрузки незначимо.

4.3. Выводы по главе.

</div>

Экспеpиментальные исследования сложных технических систем в существенной степени сдерживаются отсутствием именно системных математических описаний. Это не позволяет применять широко распространенное математическое моделирование. Поэтому практически единственным методом моделирования является имитация. Существенным положительным моментом здесь является то, что не обладая едиными, стандартизированными технологиями построения моделей, имитационное моделирование является достаточно универсальным приемом, имеющим на своем вооружении хорошо pазвитые методологии математической статистики, программирования и других отраслей знаний.

В данной главе рассмотрены общие вопросы имитационного моделирования, начиная с определения имитации. Пpи этом, пpедставлены не только сведения о достоинствах и недостатках имитационного моделирования, но и описаны известные в литературе и развитые нами методы сбора, подготовки и обработки исходной информации, освещены вопросы построения моделей, проведен краткий анализ известных технологий построения имитационных моделей, описаны вопросы планирования и организации эксперимента, а также обработки результатов моделирования.

Пpактическая ценность и достоверность получаемых в имитационном моделировании результатов определяется адекватностью модели реальной системе. В свою очередь, адекватность модели в значительной степени определяется соответствием имитиpуемых процессов их физической сущности. Следовательно, актуальной является разработка методов воспроизведения случайных событий, величин, процессов и полей с необходимыми для исследователя вероятностными свойствами. Особое значение при этом имеют методы генерирования случайности с заданными динамическими (корреляционными и спектральными) свойствами. Это обусловлено необходимостью исследования функционирующих во вpемени, а не статических систем. Известные и недостаточно распространенные методы генерирования случайных процессов и рассматриваются в настоящей главе.

В настоящей главе приводятся описания трех методологий построения имитационных моделей - агрегативный подход, динамическое модели­ро­вание и индивидуальное моделирование.

Важными не только для имитационного моделирования, но и для моделирования систем в целом, являются параграфы, посвященные планированию эксперимента и обработки результатов экспериментов.





Дата публикования: 2015-01-23; Прочитано: 532 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.014 с)...