![]() |
Главная Случайная страница Контакты | Мы поможем в написании вашей работы! | |
|
Однофактный дисперсионный анализ заключается в разделении совокупности из n замеров изучаемого свойства объекта на Р группы по какому либо фактору. После разделения производится расчет оценок дисперсии между группами
и внутри групп
;
-по группам
Если фактор, по которому было произведено группирование, не влияет на изменчивость, то отношение дисперсий и
распределено по закону Фишера c р-1 и р-2 степенями свободы. Гипотеза о влиянии данного фактора на изменчивость свойства отвергается, если
.
При двухфактном дисперсионном анализе рассматривается влияние двух факторов, например, влияют ли на содержание полезного компонента в р.т. состав вмещающих пород и гипсометрическое положение места отбора пробы. По результатам опробования составляются таблицы, где по строкам сгруппированы данные опробования по одному гипсометрическому уровню, а в столбцах – среднее содержание по разновидностям пород. Компоненты дисперсии рассчитываются по формулам:
- среднее по строкам
- среднее по столбцам
q и p количество столбцов и строк
Проверка гипотезы о влиянии данных факторов на изменчивость содержания производится по критериям
и
;
Если FА и Fв не превышают табличные, то гипотеза о влиянии данных факторов на изменчивость данного свойства отвергается.
Пример стр. (К-45)
Двумерные статистические модели
При решении разнообразных геологических задач часто необходимо совместное рассмотрение не одной, а нескольких случайных величин. Например, при изучении пи – одновременно определяют m и c в ней полезных компонентов и другие свойства пород и руд. В одних случаях изучаемые свойства геологических объектов проявляются независимо друг от друга, а в других между ними могут быть выявлены более или менее отчетливые взаимосвязи.
Изучение взаимозависимостей между значениями свойств геологических образований способствуют более глубокому пониманию особенностей геологических процессов и выявлению факторов, влияющих на эффективность методов исследования геологических объектов. В ряде случаев оно позволяет получить количественные оценки свойств по значениям других, легко определяемых свойств.
В двумерной статистической модели объект исследования рассматривается как двумерная статистическая совокупность, а ее основной характеристикой является двумерная функция распределения случайных величин X и Y. Между ними проявляются вероятные связи, когда заданному значению случайных величин Х = х соответсвует не определенное значение величины Y1, а некоторый набор ее значений Y1, Y 2 …. Yn, каждое из которых характеризуется определенной вероятностью
Р 1, Р 2 ….Рn.
Функция распределеия величины Y, соответствует значению Х = х, характеризуется математическим ожиданием , дисперсией
.
Распределение величины Y, соответствующие выбранным значениям величины Х, называется условиями распределениями, а дисперсии - условными дисперсиями. Геометрическое место точек, соответствующих центрам условных распределений
, называется линией регрессии, а уравнение этой линии – уравнением регрессии.
Система из двух случайных величин всегда будут соответствовать две линии регрессии:
- регрессия y по x
- регрессия x по y
Если линии регрессии прямые, то регрессия двух величин называется линейной.
В прямоугольной системе координат линии регрессии могут быть заданы аналитически. Имеем следующую пару уравнений.
- регрессия y по x
- регрессия x по y
Уравнения нелинейной регрессии зависят от вида кривой.
Например, для параболической регрессии
Регрессия может быть однозначно описана, если известен вид уравнения и значения коэффициент а, в, с и т.д.
В системе двух уравнений линейной регрессии коэффициент а1 и а2 определяют положения начальных точек линии регрессии.
;
;
;
;
При а1 и а2 = 0, линии проходят через начало координат. Степень зависимости случайных величин определяется коэффициент в1 и в2, которые называются коэффициент линейной регрессии.
Они представляют собой tg углов наклона прямых регрессии к осям абсцисс и ординат. Координаты точки пересечения равны математическим ожиданиям величин х и у. Угол между ними изменяется от 0 до 90 чем меньше этот угол тем сильнее связь между величинами..
Основными числовыми характеристиками двумерного распределения случайных величин являются показатели их связи:
1.Ковариация или корреляционный момент (момент связи)
2. Коэффициент корреляции
3. Корреляционное отношение
1. Ковариация или корреляционный момент – представляют собой математическое ожидание произведения отклонений двух случайных величин от их математического ожидания.
2. Коэф. корреляции представляет собой ковариацию, нормализованную по стандартам:
Приведем изменения = -1 до + 1.
Значения +_ 1 соответствуют функциональной связи, р=0, отсутствие связи, знак (+) – прямая связь, (-) – обратная связь.
Если оба уравнения регрессии – линейное
, то коэф. корреляции
3. Корреляционным отношением называется отношение дисперсии (стандартов) центров условных распределений к общей дисперсии (стандарту) величины.
Таких отношений в двумерном распределении два: ;
В случае линейности обоих уравнений они совпадают, т.е.
Величины корреляционных отношений меняются от 0 до 1: = 0- свидетельствует о независимости величин.
Выявление корреляционной связи между различными свойствами геологических объектов способствуют решению многих геологических задач.
Например, наличие корреляционных связей между петрогенными и редкими элементами способствует оценке роли процессов дифференциации магмы и ассимеляции ею вмещающих пород; между концентрацией рудных элементов в породах и рудах – выяснению источников рудного вещества; между физическими свойствами и минеральным составом пород – демифрированию геофизических аномалий при геологическом картировании и т.д.
При отсутствии корреляционной связи коэф. корреляции, условные коэф. линейной регрессии и корреляционные отношения равны нулю.
Поэтому проверка гипотезы о наличии корреляционной связи заключается в расчете выборочных оценок этих характеристик и оценке значимости их отличия от «0».
Выборочная оценка коэф. корреляции вычитается по формуле:
;
При расчете вручную удобнее пользоваться формулой:
Когда математическое ожидание выборочного коэф. корреляции = 0, величина
,
имеет распределение Стьюдента с n – 2 степенями свободы если t расч. > t табл. то гипотеза об отсутствии корреляционной связи отвергается, т.е. связь существенная
Приблиз. Оценка коэф. корреляции – графическим путем строим точки по значению х и у в системе координат х и у
Следует помнить, что при проверке гипотез корреляционной связи случайных величин по коэф. корреляции необходимо учитывать функцию их эммирических распределений.
(пример стр. 53
Если не удается) проверить гипотезу о соответствии эмпирического распределения определенному закону, то для проверки гипотезы о наличии корреляционной связи используют ранговый коэффициент корреляции Спирмена.
Его расчет основан на замене выборочных значений случайных величин их рангами.
При этом предполагается, что если между значениями случайных величин нет корреляции, то и ранги их будут независимыми.
Ранговый коэф. корреляции вычисляется по формуле:
,
di - разность рангов,
n – количество пар
Для проверки значимости рангового коэффициент корреляции можно использовать величину:
- значение обратной функции нормального распределения при доверительной вероятности
. (Шарапов прил. 29)
Если то гипотеза о независимости исследуемой величины отвергается.
Пример (К - стр. 54)
Результаты вычисления рангового коэффициента корреляции заносятся в след.
Таблицу:
№№ пп | mr | рк | di | di | |||
Знач. | ранг | Знач. | ранг | ||||
Использование корреляционных связей для предсказания свойств геологических объектов.
Если для двух величин га основании представительной выборки доказано наличие корреляционной связи, определен ее вид и подробно описывающее его уравнение, то создается возможность прогноза значений одной из случайных величин по значениям другой. Подобные задачи часто возникают в геологической практике. Например: определение Сср. сопутствующих компонентов по содержанию главной или прогнозной оценке содержаний металла в р.т. в связи с изменением m.
В геологической практике широко распространен случай, эмпирическое распределение одной из случайных величин не противоречит нормальному закону, а значения другой случайной величины могут выбираться произвольно. Для получения связей между такими величинами используются методы регрессионного анализа, позволяющие установить влияние произвольно выбранных значений одной величины (х) на значение другой (у) нормально распределенной случайной величины.
В отличии от корреляционного анализа, здесь анализируется только регрессия y и x, но не обратно.
Основные предпосылки регррессионого анализа – одна переменная (х) рассматривается как независимая, а вторая (у) – как зависимая от первой и имеющая нормальное распределение. С математически ожидаемой дисперсией, не независимой от х.
РЕГРЕССИОННЫЙ АНАЛИЗ ПРИМЕНЕН ДЛЯ:
1. Оценка содержания сопутствующих компонентов по содержанию основных компонентов в рудах.
Например: Сd в полиметаллических рудах входит в состав сфалерита; Re в Mе - содержащих Си – порфировых рудах в составе молибденита.
Определение содержания редких и рассеянных элементов в рудах затрудненого ввиду их низких концентраций, сопоставленных с точностью анализа.
Надежные данные о содержании этих элементов получаются только при анализе мономинеральных фракций, отбор которых весьма трудоемок. Поэтому, по ограниченному количеству мономинеральных проб рассчитываются характеристики корреляционной зависимости между содержанием основного и попутного компонента, которые в дальнейшем используются для определения среднего содержания попутного компонента в каждом подсчетном блоке.
2. Определение объемной массы руды.
На месторождениях Fe, Pb, Cr, барита (всех тяжелых руд), где руды характеризуются высоким содержанием полезного минерала, наблюдается зависимость между объемной массой руды и содержанием. Объемная масса определяется корреляционным методом.
3.Интерпретации результатов геофизических методов опробования.
4.Уточнение оценок параметров р.т по результатам отработки.
Опыт эксплуатации месторождений свидетельствует о том, что среднее содержание полезных ископаемых в блоках богатых руд по данным разведки оказываются завышенными, а в бедных – заниженными.
По отработанным блокам могут быть рассчитаны уравнения регрессии истинных средних содержаний и содержаний определенных по данным разведки. Эти уравнения можно использовать для уточнения оценок средних содержаний в оставшихся блоках.
Решение задач данного типа основано на построении эмпирических линий регрессии или расчете их аналитических выражений – уравнений регрессии. Для правильного решения таких задач необходимо не только оценить силу корреляционной связи, но и выявить ее характер.
Пример расчета уравнения регрессии для содержания Аи и Рв во вкрапленных рудах (К- стр. 67).
i | xi | yi | xi-x | yi-y | yi-y | xi-x yi-y | xi-x |
0.8 | |||||||
0.31 | |||||||
0.77 | |||||||
1.11 | |||||||
….. | |||||||
0.67 | 0.98 | -0.28 | -0.63 | 0.397 | 0.176 | 0.078 |
= 28.39 48.35 32.036 6.66 3.900
Кроме этого отмечается не линейная связь – аналитически может быть выражена уравнением параболы (см. К – стр. 66)
Многомерные статистические модели.
Каждое геологическое явление или объект характеризуется множеством признаков, которые можно наблюдать и измерять. Наблюдаемые значения признаков обязаны в большинстве случаев действию не одного, а целого ряда причин, находящихся друг с другом в различных временных и пространствееных взаимоотношениях.
Дата публикования: 2014-11-29; Прочитано: 282 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!