Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Метод наименьших квадратов. Метод наименьших квадратов заключается в том, что сумма квадратов отклонений теоретических данных от экспериментальных



Метод наименьших квадратов заключается в том, что сумма квадратов отклонений теоретических данных от экспериментальных, должна быть наименьшей.

Будем искать уравнение регрессии в виде у = f(x).

Предположим, что имеет место линейная зависимость φ(х)= а01 х

а0, а1 – коэффициенты линейной зависимости

φ(х) – предполагаемая теоретическая зависимость

Используя метод наименьших квадратов построим функцию равную сумме квадратов отклонений экспериментальных данных от теоретических данных:

По методу наименьших квадратов для нахождения коэффициентов а0, а1, необходимо составить систему двух уравнений, для этого необходимо взять частные производные от функции S и приравнять их к нулю.

Учитывая число функций φ(х)= а01 х

 
 


Окончательной системой уравнений по методу наименьшего квадрата имеет вид

 
 


Решая полученную систему найдем неизвестные коэффициенты а0 и а, запишем уравнение регрессии в виде φ(х) = а0 + а1 х

Для того чтобы найти погрешность данного метода необходимо вычислить

 
 


Если предположили нелинейную корреляцию, то уравнение связи пытаемся искать в виде

φ(х)=а01 х+а2

х², то аналогично по методу наименьших квадратов найдем функцию

Находим частные производные данной функции

 
 


Запишем систему уравнений

 
 


Аналогично находим а0, а1, а2 и записываем уравнение регрессии в виде φ(х)=а01 х+а2 х²

Определяем погрешность с помощью ε.

Заключение о реальной зависимости между случайными величинами Х и Y делаем путем графического представления.

5.4.2 Методы шкалирования

Показатели тесноты связи между признаками называют коэф­фициентами корреляции. Их выбор зависят от того, в каких шка­лах измерены признаки. Основными шкалами яв­ляются:

1) номинальная шкала (наименований) предназначена для описа­ния принадлежности объектов к определенным социальным груп­пам. Эти наименования могут быть как смысловыми(ИТР, ра­бочий...), так и кодовыми (цифровыми, буквенными). При этом числа в них имеют только два отношения: = и;

2) шкала порядка (ординальная) применяется для измерения упо­рядоченности объектов по одному или нескольким признакам. Типичным примером признаков, измеренных в порядковых шка­лах являются экзаменационные оценки, тестовые баллы при изу­чении социальных и психофизических параметров человека. От­ношения между признаками, измеренными в порядковых шка­лах: <, >, =;

3) количественная шкала используется для описания количествен­ных показателей (заработная плата, численность группы, де­мографические характеристики, стоимость потребительской корзины и т.п.).

Большая часть множества коэффициентов корреляции изобра­жена на рис. 4.

Выявление связи между признаками осуществляется следующим образом: выдвигается нулевая статистическая гипотеза об отсутствии

Рис. 4

связи между признаками, рассчитывается соответствующий коэффициент корреляции k проверяется, превосходит ли он некоторое критическое значение kкрит. Если k>kкрит, то гипотеза об отсутствии связи отвергается.

Для каждого показателя корреляции определение критических значений обосновывается в соответствующем разделе математической статистики.

Расчет линейного коэффициента корреляции для не сгруппированных данных можно производить по следующим формулам.

1.

где х и у- значения признаков, и — их средние значения.

2. где х и у — значения признаков, между которыми определяется коэффициент корреляции; n — объем выборки.

3.

Линейный коэффициент корреляции . Знак коэффициента характеризует направление взаимосвязи. Абсолютная величина R характеризует степень тесноты рассматриваемой взаимосвязи.

Значимость линейного коэффициента корреляции определяется по Таблицам критических значений , где a — уровень значи­мости, (чаще всего 0.05), N - объем выборки. Можно восполь­зоваться упрощенным правилом: если < 0.3, то связь практичес­ки отсутствует, если 0.3< <0.5, то связь слабая, если 0:5< <0.7, то связь достаточно сильная, если >0.7, то имеется высокая сте­пень зависимости между признаками.

ПРИМЕР 14. Имеются данные по 10 заводам отрасли. Опреде­лить, существует ли корреляционная зависимость между сто­имостью основных фондов (факторный признак) и объемом вы­пуска продукции (результативный признак).

завода Стоимость основных фондов (млн. руб.) Объем выпуска продукции (млн. руб.)
    2.0
    1.2
    3.6
    6.8
    4.4
    3.8
    0.8
    2.2
    5.0
    4.6

Выдвинем гипотезу H0 - связь между признаками отсутствует. Признаки - количественные, измерены в количественной шка­ле, поэтому воспользуемся для определения степени корреляции линейным коэффициентом корреляции. При этом для представ­ленных данных удобно пользоваться формулой:

Подставив данные в формулу, получим: R = 0.95. Рассчитанный коэффициент положителен и близок к 1, следова­тельно, нулевая гипотеза об отсутствии связи отвергается. Связь существует и она положительна, то есть с увеличением стоимос­ти основных фондов увеличивается объем выпуска продукции.

Для анализа связей между признаками, измеренными в поряд­ковых шкалах, применяют так называемые ранговые коэффициен­ты корреляции, в основе своей использующие понятие ранга по­казателя. Рангом называется номер наблюдения в упорядоченной совокупности.

Расчет коэффициента Спирмена производится по формуле:

где - ранг k-го наблюдения по показателю x; - ранг k-го наблюдения по показателю y; n – число наблюдений.

Проверка статистической существенности показателя осуществ­ляется по таблицам критических значений.

Расчет коэффициента корреляции Кенделла производится до формуле:

, где S — сумма балов, если баллом +1 оценивается пара рангов, имеющих по обоим показателям одинаковый порядок, а баллом -1 — пара рангов с разным порядком.

Упрощение расчетов показателя Кенделла достигается следую­щим образом:

1) ряд рангов по показателю х располагается в возрастающем по­рядке с указанием соответствующих наблюдениям рангов по по­казателю у; в результате имеем по признаку х ряд рангов 1, 2, 3и т.д., а по признаку у - ряд i1, i2,... и т.д.

2) подсчитываются баллы для всех рангов по показателю у. Для этого находится, сколько рангов, предшествующих каждому рангу и последующим за ним, превышают его величину. Число предшествующих превышений записывается со знаком «-», а число последующих превышений — со знаком «+»;

3) находится сумма положительных и отрицательных баллов по каждому рангу и итоговое число баллов S.

При достаточно больших n имеет место соотношение: .

Значительная часть признаков, измеренная с помощью номи­нальных шкал составляет дихотомические признаки, т.е. призна­ки, принимающие 2 и более альтернативных значения.

Для анализа 2-дихотомических признака составляется таблица 4-х полей:

X Y
     
  а b a+b
  с d c+d
  а+с b+d N

и рассчитывают коэффициенты ассоциации и контингенции. Коэффициент ассоциации:

'

Предельным для коэффициента ассоциации является 0.5, то есть, если кa > 0.5, то между признаками имеется существенная взаимосвязь.

Коэффициент контингенции: .

Решение принимается следующим образом: если кk ³ 0.3, то это свидетельствует о наличии связи между качественными признаками.

ПРИМЕР 15. Были обследованы 1000 женщин с целью исследова­ния зависимости между цветом глаз матерей и дочерей и получе­ны следующие данные:

Цвет глаз матери Цвет глаз дочери
    Итого по строке
       
       
Итого по столбцу      

Рассчитаем значение коэффициента контингенции: кk = 0.365, следовательно, между признаками существует корреляционная связь.

Если признаки имеют несколько возможных значений, то используются коэффициенты сопряженности Чупрова или Пирсона. Расчет коэффициента Пирсона производится по формуле

При этом i=1,…,m1; j=1,…,m2,

Где - доля объектов, имеющих i-тое значение и j-го значения другого признака; m1 - количество градаций первого признака; m2 – количество градаций второго признака.

Коэффициент Чупрова определяется следующим образом:

Коэффициент Пирсона статистически существенен, если где - табличное значение критерия Хи-квадрат с (m1-1)(m2-1) степенями свободы; N- количество наблюдений.

Исследование многомерных взаимосвязей – типичная задача в социологии.

Один из наиболее наглядных приемов анализа связей – метод отображения взаимосвязей в корреляционном графе, предложенном эстонским математиком Л. Выханду.

Граф – это фигура, состоящая из точек (вершин) и отрезков, соединяющих эти вершины (ребра графа).

Для построения корреляционного графа измеряют парные связи между всеми переменными.

ПРИМЕР 16. Пример построения корреляционного графа. Пусть 3 переменных А, В, С, Д. Строится матрица парных коэффициентов корреляции (матрица интеркорреляций). Это симметричная матрица:

  A B C D
A   0,7 0,95 0,6
B 0,7   0,13 0,3
C 0,95 0,13   0,75
D 0,6 0,3 0,75  

Корреляционный граф выглядит следующим образом:

Связь ВС можно опустить, так как она намного слабее, чем связь ВС через вершину D.

Замечание. В корреляционном графе отображаются лишь те связи между вершинами, которые являются наиболее тесными.





Дата публикования: 2015-01-09; Прочитано: 684 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.011 с)...