Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Однофактный дисперсионный анализ



Однофактный дисперсионный анализ заключается в разделении совокупно­сти из n замеров изучаемого свойства объекта на Р группы по какому либо фактору. После разделения производится расчет оценок дисперсии между группами

и внутри групп

; -по группам

Если фактор, по которому было произведено группирование, не влияет на из­менчивость, то отношение дисперсий и распределено по закону Фи­шера c р-1 и р-2 степенями свободы. Гипотеза о влиянии данного фактора на из­менчивость свойства отвергается, если .

При двухфактном дисперсионном анализе рассматривается влияние двух фак­торов, например, влияют ли на содержание полезного компонента в р.т. состав вме­щающих пород и гипсометрическое положение места отбора пробы. По результатам опробования составляются таблицы, где по строкам сгруппированы данные опробо­вания по одному гипсометрическому уровню, а в столбцах – среднее содержание по разновидностям пород. Компоненты дисперсии рассчитываются по формулам:

- среднее по строкам

- среднее по столбцам

q и p количество столбцов и строк

Проверка гипотезы о влиянии данных факторов на изменчивость содержа­ния производится по критериям

и ;

Если FА и Fв не превышают табличные, то гипотеза о влиянии данных факто­ров на изменчивость данного свойства отвергается.

Пример стр. (К-45)

Двумерные статистические модели

При решении разнообразных геологических задач часто необходимо совмест­ное рассмотрение не одной, а нескольких случайных величин. Например, при изуче­нии пи – одновременно определяют m и c в ней полезных компонентов и другие свойства пород и руд. В одних случаях изучаемые свойства геологических объектов проявляются независимо друг от друга, а в других между ними могут быть выяв­лены более или менее отчетливые взаимосвязи.

Изучение взаимозависимостей между значениями свойств геологических об­разований способствуют более глубокому пониманию особенностей геологических процессов и выявлению факторов, влияющих на эффективность методов исследова­ния геологических объектов. В ряде случаев оно позволяет получить количествен­ные оценки свойств по значениям других, легко определяемых свойств.

В двумерной статистической модели объект исследования рассматривается как двумерная статистическая совокупность, а ее основной характеристикой явля­ется двумерная функция распределения случайных величин X и Y. Между ними проявляются вероятные связи, когда заданному значению случайных величин Х = х соответсвует не определенное значение величины Y1, а некоторый набор ее значе­ний Y1, Y 2 …. Yn, каждое из которых характеризуется определенной вероятностью

Р 1, Р 2 ….Рn.

Функция распределеия величины Y, соответствует значению Х = х, характери­зуется математическим ожиданием , дисперсией .

Распределение величины Y, соответствующие выбранным значениям вели­чины Х, называется условиями распределениями, а дисперсии - условными дис­персиями. Геометрическое место точек, соответствующих центрам условных распределений , называется линией регрессии, а уравнение этой линии – уравне­нием регрессии.

Система из двух случайных величин всегда будут соответствовать две линии регрессии:

- регрессия y по x

- регрессия x по y

Если линии регрессии прямые, то регрессия двух величин называется линей­ной.

В прямоугольной системе координат линии регрессии могут быть заданы ана­литически. Имеем следующую пару уравнений.

- регрессия y по x

- регрессия x по y

Уравнения нелинейной регрессии зависят от вида кривой.

Например, для параболической регрессии

Регрессия может быть однозначно описана, если известен вид уравнения и значения коэффициент а, в, с и т.д.

В системе двух уравнений линейной регрессии коэффициент а1 и а2 опреде­ляют положения начальных точек линии регрессии.

; ;

; ;

При а1 и а2 = 0, линии проходят через начало координат. Степень зависимо­сти случайных величин определяется коэффициент в1 и в2, которые называются ко­эффициент линейной регрессии.

Они представляют собой tg углов наклона прямых регрессии к осям абсцисс и ординат. Координаты точки пересечения равны математическим ожиданиям вели­чин х и у. Угол между ними изменяется от 0 до 90 чем меньше этот угол тем силь­нее связь между величинами..

Основными числовыми характеристиками двумерного распределения случай­ных величин являются показатели их связи:

1.Ковариация или корреляционный момент (момент связи)

2. Коэффициент корреляции

3. Корреляционное отношение

1. Ковариация или корреляционный момент – представляют собой математи­ческое ожидание произведения отклонений двух случайных величин от их матема­тического ожидания.

2. Коэф. корреляции представляет собой ковариацию, нормализованную по стандартам:

Приведем изменения = -1 до + 1.

Значения +_ 1 соответствуют функциональной связи, р=0, отсутствие связи, знак (+) – прямая связь, (-) – обратная связь.

Если оба уравнения регрессии – линейное

, то коэф. корреляции

3. Корреляционным отношением называется отношение дисперсии (стан­дартов) центров условных распределений к общей дисперсии (стандарту) величины.

Таких отношений в двумерном распределении два: ;

В случае линейности обоих уравнений они совпадают, т.е.

Величины корреляционных отношений меняются от 0 до 1: = 0- свидетельствует о независимости величин.

Выявление корреляционной связи между различными свойствами геологиче­ских объектов способствуют решению многих геологических задач.

Например, наличие корреляционных связей между петрогенными и редкими элементами способствует оценке роли процессов дифференциации магмы и ассиме­ляции ею вмещающих пород; между концентрацией рудных элементов в породах и рудах – выяснению источников рудного вещества; между физическими свойствами и минеральным составом пород – демифрированию геофизических аномалий при геологическом картировании и т.д.

При отсутствии корреляционной связи коэф. корреляции, условные коэф. ли­нейной регрессии и корреляционные отношения равны нулю.

Поэтому проверка гипотезы о наличии корреляционной связи заключается в расчете выборочных оценок этих характеристик и оценке значимости их отличия от «0».

Выборочная оценка коэф. корреляции вычитается по формуле:

;

При расчете вручную удобнее пользоваться формулой:

Когда математическое ожидание выборочного коэф. корреляции = 0, величина

,

имеет распределение Стьюдента с n – 2 степенями свободы если t расч. > t табл. то гипотеза об отсутствии корреляционной связи отвергается, т.е. связь суще­ственная

Приблиз. Оценка коэф. корреляции – графическим путем строим точки по значению х и у в системе координат х и у

Следует помнить, что при проверке гипотез корреляционной связи случайных величин по коэф. корреляции необходимо учитывать функцию их эммирических распределений.

(пример стр. 53

Если не удается) проверить гипотезу о соответствии эмпирического распреде­ления определенному закону, то для проверки гипотезы о наличии корреляционной связи используют ранговый коэффициент корреляции Спирмена.

Его расчет основан на замене выборочных значений случайных величин их рангами.

При этом предполагается, что если между значениями случайных величин нет корреляции, то и ранги их будут независимыми.

Ранговый коэф. корреляции вычисляется по формуле:

,

di - разность рангов,

n – количество пар

Для проверки значимости рангового коэффициент корреляции можно исполь­зовать величину:

- значение обратной функции нормального распределения при довери­тельной вероятности . (Шарапов прил. 29)

Если то гипотеза о независимости исследуемой величины отверга­ется.

Пример (К - стр. 54)

Результаты вычисления рангового коэффициента корреляции заносятся в след.

Таблицу:

№№ пп mr рк di di
Знач. ранг Знач. ранг
               
               
               
               
               
               

Использование корреляционных связей для предсказания свойств геоло­гических объектов.

Если для двух величин га основании представительной выборки доказано на­личие корреляционной связи, определен ее вид и подробно описывающее его урав­нение, то создается возможность прогноза значений одной из случайных величин по значениям другой. Подобные задачи часто возникают в геологической практике. Например: определение Сср. сопутствующих компонентов по содержанию главной или прогнозной оценке содержаний металла в р.т. в связи с изменением m.

В геологической практике широко распространен случай, эмпирическое рас­пределение одной из случайных величин не противоречит нормальному закону, а значения другой случайной величины могут выбираться произвольно. Для получе­ния связей между такими величинами используются методы регрессионного ана­лиза, позволяющие установить влияние произвольно выбранных значений одной ве­личины (х) на значение другой (у) нормально распределенной случайной величины.

В отличии от корреляционного анализа, здесь анализируется только регрессия y и x, но не обратно.

Основные предпосылки регррессионого анализа – одна переменная (х) рас­сматривается как независимая, а вторая (у) – как зависимая от первой и имеющая нормальное распределение. С математически ожидаемой дисперсией, не независи­мой от х.

РЕГРЕССИОННЫЙ АНАЛИЗ ПРИМЕНЕН ДЛЯ:

1. Оценка содержания сопутствующих компонентов по содержанию основ­ных компонентов в рудах.

Например: Сd в полиметаллических рудах входит в состав сфалерита; Re в Mе - содержащих Си – порфировых рудах в составе молибденита.

Определение содержания редких и рассеянных элементов в рудах затрудне­ного ввиду их низких концентраций, сопоставленных с точностью анализа.

Надежные данные о содержании этих элементов получаются только при ана­лизе мономинеральных фракций, отбор которых весьма трудоемок. Поэтому, по ог­раниченному количеству мономинеральных проб рассчитываются характеристики корреляционной зависимости между содержанием основного и попутного компо­нента, которые в дальнейшем используются для определения среднего содержания попутного компонента в каждом подсчетном блоке.

2. Определение объемной массы руды.

На месторождениях Fe, Pb, Cr, барита (всех тяжелых руд), где руды характе­ризуются высоким содержанием полезного минерала, наблюдается зависимость ме­жду объемной массой руды и содержанием. Объемная масса определяется корреля­ционным методом.

3.Интерпретации результатов геофизических методов опробования.

4.Уточнение оценок параметров р.т по результатам отработки.

Опыт эксплуатации месторождений свидетельствует о том, что среднее со­держание полезных ископаемых в блоках богатых руд по данным разведки оказы­ваются завышенными, а в бедных – заниженными.

По отработанным блокам могут быть рассчитаны уравнения регрессии истин­ных средних содержаний и содержаний определенных по данным разведки. Эти уравнения можно использовать для уточнения оценок средних содержаний в ос­тавшихся блоках.

Решение задач данного типа основано на построении эмпирических линий регрессии или расчете их аналитических выражений – уравнений регрессии. Для правильного решения таких задач необходимо не только оценить силу корреляци­онной связи, но и выявить ее характер.

Пример расчета уравнения регрессии для содержания Аи и Рв во вкрапленных рудах (К- стр. 67).

i xi yi xi-x yi-y yi-y xi-x yi-y xi-x
  0.8            
  0.31            
  0.77            
  1.11            
               
…..              
  0.67 0.98 -0.28 -0.63 0.397 0.176 0.078

= 28.39 48.35 32.036 6.66 3.900

Кроме этого отмечается не линейная связь – аналитически может быть выра­жена уравнением параболы (см. К – стр. 66)

Многомерные статистические модели.

Каждое геологическое явление или объект характеризуется множеством при­знаков, которые можно наблюдать и измерять. Наблюдаемые значения признаков обязаны в большинстве случаев действию не одного, а целого ряда причин, находя­щихся друг с другом в различных временных и пространствееных взаимоотноше­ниях.





Дата публикования: 2014-11-29; Прочитано: 269 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.013 с)...