Главная \| Случайная страница \| Контакты \| Мы поможем в написании вашей работы!

Метод наименьших квадратов. Метод наименьших квадратов заключается в том, что сумма квадратов отклонений теоретических данных от экспериментальных

⇐ Предыдущая 8 9 10 11 12 13 141516 17 Следующая ⇒

Метод наименьших квадратов заключается в том, что сумма квадратов отклонений теоретических данных от экспериментальных, должна быть наименьшей.

Будем искать уравнение регрессии в виде у = f(x).

Предположим, что имеет место линейная зависимость φ(х)= а₀ +а₁ х

а₀, а₁ – коэффициенты линейной зависимости

φ(х) – предполагаемая теоретическая зависимость

Используя метод наименьших квадратов построим функцию равную сумме квадратов отклонений экспериментальных данных от теоретических данных:

По методу наименьших квадратов для нахождения коэффициентов а₀, а₁, необходимо составить систему двух уравнений, для этого необходимо взять частные производные от функции S и приравнять их к нулю.

Учитывая число функций φ(х)= а₀ +а₁ х

Окончательной системой уравнений по методу наименьшего квадрата имеет вид

Решая полученную систему найдем неизвестные коэффициенты а₀ и а, запишем уравнение регрессии в виде φ(х) = а₀ + а₁ х

Для того чтобы найти погрешность данного метода необходимо вычислить

Если предположили нелинейную корреляцию, то уравнение связи пытаемся искать в виде

φ(х)=а₀+а₁ х+а₂

х², то аналогично по методу наименьших квадратов найдем функцию

Находим частные производные данной функции

Запишем систему уравнений

Аналогично находим а₀, а₁, а₂ и записываем уравнение регрессии в виде φ(х)=а₀+а₁ х+а₂ х²

Определяем погрешность с помощью ε.

Заключение о реальной зависимости между случайными величинами Х и Y делаем путем графического представления.

5.4.2 Методы шкалирования

Показатели тесноты связи между признаками называют коэффициентами корреляции. Их выбор зависят от того, в каких шкалах измерены признаки. Основными шкалами являются:

1) номинальная шкала (наименований) предназначена для описания принадлежности объектов к определенным социальным группам. Эти наименования могут быть как смысловыми(ИТР, рабочий...), так и кодовыми (цифровыми, буквенными). При этом числа в них имеют только два отношения: = и;

2) шкала порядка (ординальная) применяется для измерения упорядоченности объектов по одному или нескольким признакам. Типичным примером признаков, измеренных в порядковых шкалах являются экзаменационные оценки, тестовые баллы при изучении социальных и психофизических параметров человека. Отношения между признаками, измеренными в порядковых шкалах: <, >, =;

3) количественная шкала используется для описания количественных показателей (заработная плата, численность группы, демографические характеристики, стоимость потребительской корзины и т.п.).

Большая часть множества коэффициентов корреляции изображена на рис. 4.

Выявление связи между признаками осуществляется следующим образом: выдвигается нулевая статистическая гипотеза об отсутствии

Рис. 4

связи между признаками, рассчитывается соответствующий коэффициент корреляции k проверяется, превосходит ли он некоторое критическое значение k_крит. Если k>k_крит,то гипотеза об отсутствии связи отвергается.

Для каждого показателя корреляции определение критических значений обосновывается в соответствующем разделе математической статистики.

Расчет линейного коэффициента корреляции для не сгруппированных данных можно производить по следующим формулам.

1.

где х и у- значения признаков, и — их средние значения.

2. где х и у — значения признаков, между которыми определяется коэффициент корреляции; n — объем выборки.

3.

Линейный коэффициент корреляции . Знак коэффициента характеризует направление взаимосвязи. Абсолютная величина R характеризует степень тесноты рассматриваемой взаимосвязи.

Значимость линейного коэффициента корреляции определяется по Таблицам критических значений , где a — уровень значимости, (чаще всего 0.05), N - объем выборки. Можно воспользоваться упрощенным правилом: если < 0.3, то связь практически отсутствует, если 0.3< <0.5, то связь слабая, если 0:5< <0.7, то связь достаточно сильная, если >0.7, то имеется высокая степень зависимости между признаками.

ПРИМЕР 14. Имеются данные по 10 заводам отрасли. Определить, существует ли корреляционная зависимость между стоимостью основных фондов (факторный признак) и объемом выпуска продукции (результативный признак).

завода Стоимость основных фондов (млн. руб.) Объем выпуска продукции (млн. руб.)

2.0

1.2

3.6

6.8

4.4

3.8

0.8

2.2

5.0

4.6

Выдвинем гипотезу H₀ - связь между признаками отсутствует. Признаки - количественные, измерены в количественной шкале, поэтому воспользуемся для определения степени корреляции линейным коэффициентом корреляции. При этом для представленных данных удобно пользоваться формулой:

Подставив данные в формулу, получим: R = 0.95. Рассчитанный коэффициент положителен и близок к 1, следовательно, нулевая гипотеза об отсутствии связи отвергается. Связь существует и она положительна, то есть с увеличением стоимости основных фондов увеличивается объем выпуска продукции.

Для анализа связей между признаками, измеренными в порядковых шкалах, применяют так называемые ранговые коэффициенты корреляции, в основе своей использующие понятие ранга показателя. Рангом называется номер наблюдения в упорядоченной совокупности.

Расчет коэффициента Спирмена производится по формуле:

где - ранг k-го наблюдения по показателю x; - ранг k-го наблюдения по показателю y; n – число наблюдений.

Проверка статистической существенности показателя осуществляется по таблицам критических значений.

Расчет коэффициента корреляции Кенделла производится до формуле:

, где S — сумма балов, если баллом +1 оценивается пара рангов, имеющих по обоим показателям одинаковый порядок, а баллом -1 — пара рангов с разным порядком.

Упрощение расчетов показателя Кенделла достигается следующим образом:

1) ряд рангов по показателю х располагается в возрастающем порядке с указанием соответствующих наблюдениям рангов по показателю у; в результате имеем по признаку х ряд рангов 1, 2, 3и т.д., а по признаку у - ряд i1, i2,... и т.д.

2) подсчитываются баллы для всех рангов по показателю у. Для этого находится, сколько рангов, предшествующих каждому рангу и последующим за ним, превышают его величину. Число предшествующих превышений записывается со знаком «-», а число последующих превышений — со знаком «+»;

3) находится сумма положительных и отрицательных баллов по каждому рангу и итоговое число баллов S.

При достаточно больших n имеет место соотношение: .

Значительная часть признаков, измеренная с помощью номинальных шкал составляет дихотомические признаки, т.е. признаки, принимающие 2 и более альтернативных значения.

Для анализа 2-дихотомических признака составляется таблица 4-х полей:

X Y

а b a+b

с d c+d

а+с b+d N

и рассчитывают коэффициенты ассоциации и контингенции. Коэффициент ассоциации:

'

Предельным для коэффициента ассоциации является 0.5, то есть, если к_a > 0.5, то между признаками имеется существенная взаимосвязь.

Коэффициент контингенции: .

Решение принимается следующим образом: если к_k ³ 0.3, то это свидетельствует о наличии связи между качественными признаками.

ПРИМЕР 15. Были обследованы 1000 женщин с целью исследования зависимости между цветом глаз матерей и дочерей и получены следующие данные:

Цвет глаз матери Цвет глаз дочери

Итого по строке

Итого по столбцу

Рассчитаем значение коэффициента контингенции: к_k = 0.365, следовательно, между признаками существует корреляционная связь.

Если признаки имеют несколько возможных значений, то используются коэффициенты сопряженности Чупрова или Пирсона. Расчет коэффициента Пирсона производится по формуле

При этом i=1,…,m1; j=1,…,m2,

Где - доля объектов, имеющих i-тое значение и j-го значения другого признака; m1 - количество градаций первого признака; m2 – количество градаций второго признака.

Коэффициент Чупрова определяется следующим образом:

Коэффициент Пирсона статистически существенен, если где - табличное значение критерия Хи-квадрат с (m1-1)(m2-1) степенями свободы; N- количество наблюдений.

Исследование многомерных взаимосвязей – типичная задача в социологии.

Один из наиболее наглядных приемов анализа связей – метод отображения взаимосвязей в корреляционном графе, предложенном эстонским математиком Л. Выханду.

Граф – это фигура, состоящая из точек (вершин) и отрезков, соединяющих эти вершины (ребра графа).

Для построения корреляционного графа измеряют парные связи между всеми переменными.

ПРИМЕР 16. Пример построения корреляционного графа. Пусть 3 переменных А, В, С, Д. Строится матрица парных коэффициентов корреляции (матрица интеркорреляций). Это симметричная матрица:

A B C D

A 0,7 0,95 0,6

B 0,7 0,13 0,3

C 0,95 0,13 0,75

D 0,6 0,3 0,75

Корреляционный граф выглядит следующим образом:

Связь ВС можно опустить, так как она намного слабее, чем связь ВС через вершину D.

Замечание. В корреляционном графе отображаются лишь те связи между вершинами, которые являются наиболее тесными.

⇐ Предыдущая 8 9 10 11 12 13 141516 17 Следующая ⇒

Дата публикования: 2015-01-09; Прочитано: 687 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!

studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.011 с)...

завода	Стоимость основных фондов (млн. руб.)	Объем выпуска продукции (млн. руб.)
		2.0
		1.2
		3.6
		6.8
		4.4
		3.8
		0.8
		2.2
		5.0
		4.6

Цвет глаз матери	Цвет глаз дочери
		Итого по строке


Итого по столбцу