Главная Случайная страница Контакты | Мы поможем в написании вашей работы! | ||
|
Метод наименьших квадратов заключается в том, что сумма квадратов отклонений теоретических данных от экспериментальных, должна быть наименьшей.
Будем искать уравнение регрессии в виде у = f(x).
Предположим, что имеет место линейная зависимость φ(х)= а0 +а1 х
а0, а1 – коэффициенты линейной зависимости
φ(х) – предполагаемая теоретическая зависимость
Используя метод наименьших квадратов построим функцию равную сумме квадратов отклонений экспериментальных данных от теоретических данных:
По методу наименьших квадратов для нахождения коэффициентов а0, а1, необходимо составить систему двух уравнений, для этого необходимо взять частные производные от функции S и приравнять их к нулю.
Учитывая число функций φ(х)= а0 +а1 х
Окончательной системой уравнений по методу наименьшего квадрата имеет вид
Решая полученную систему найдем неизвестные коэффициенты а0 и а, запишем уравнение регрессии в виде φ(х) = а0 + а1 х
Для того чтобы найти погрешность данного метода необходимо вычислить
Если предположили нелинейную корреляцию, то уравнение связи пытаемся искать в виде
φ(х)=а0+а1 х+а2
х², то аналогично по методу наименьших квадратов найдем функцию
Находим частные производные данной функции
Запишем систему уравнений
Аналогично находим а0, а1, а2 и записываем уравнение регрессии в виде φ(х)=а0+а1 х+а2 х²
Определяем погрешность с помощью ε.
Заключение о реальной зависимости между случайными величинами Х и Y делаем путем графического представления.
5.4.2 Методы шкалирования
Показатели тесноты связи между признаками называют коэффициентами корреляции. Их выбор зависят от того, в каких шкалах измерены признаки. Основными шкалами являются:
1) номинальная шкала (наименований) предназначена для описания принадлежности объектов к определенным социальным группам. Эти наименования могут быть как смысловыми(ИТР, рабочий...), так и кодовыми (цифровыми, буквенными). При этом числа в них имеют только два отношения: = и;
2) шкала порядка (ординальная) применяется для измерения упорядоченности объектов по одному или нескольким признакам. Типичным примером признаков, измеренных в порядковых шкалах являются экзаменационные оценки, тестовые баллы при изучении социальных и психофизических параметров человека. Отношения между признаками, измеренными в порядковых шкалах: <, >, =;
3) количественная шкала используется для описания количественных показателей (заработная плата, численность группы, демографические характеристики, стоимость потребительской корзины и т.п.).
Большая часть множества коэффициентов корреляции изображена на рис. 4.
Выявление связи между признаками осуществляется следующим образом: выдвигается нулевая статистическая гипотеза об отсутствии
Рис. 4
связи между признаками, рассчитывается соответствующий коэффициент корреляции k проверяется, превосходит ли он некоторое критическое значение kкрит. Если k>kкрит, то гипотеза об отсутствии связи отвергается.
Для каждого показателя корреляции определение критических значений обосновывается в соответствующем разделе математической статистики.
Расчет линейного коэффициента корреляции для не сгруппированных данных можно производить по следующим формулам.
1.
где х и у- значения признаков, и — их средние значения.
2. где х и у — значения признаков, между которыми определяется коэффициент корреляции; n — объем выборки.
3.
Линейный коэффициент корреляции . Знак коэффициента характеризует направление взаимосвязи. Абсолютная величина R характеризует степень тесноты рассматриваемой взаимосвязи.
Значимость линейного коэффициента корреляции определяется по Таблицам критических значений , где a — уровень значимости, (чаще всего 0.05), N - объем выборки. Можно воспользоваться упрощенным правилом: если < 0.3, то связь практически отсутствует, если 0.3< <0.5, то связь слабая, если 0:5< <0.7, то связь достаточно сильная, если >0.7, то имеется высокая степень зависимости между признаками.
ПРИМЕР 14. Имеются данные по 10 заводам отрасли. Определить, существует ли корреляционная зависимость между стоимостью основных фондов (факторный признак) и объемом выпуска продукции (результативный признак).
завода | Стоимость основных фондов (млн. руб.) | Объем выпуска продукции (млн. руб.) |
2.0 | ||
1.2 | ||
3.6 | ||
6.8 | ||
4.4 | ||
3.8 | ||
0.8 | ||
2.2 | ||
5.0 | ||
4.6 |
Выдвинем гипотезу H0 - связь между признаками отсутствует. Признаки - количественные, измерены в количественной шкале, поэтому воспользуемся для определения степени корреляции линейным коэффициентом корреляции. При этом для представленных данных удобно пользоваться формулой:
Подставив данные в формулу, получим: R = 0.95. Рассчитанный коэффициент положителен и близок к 1, следовательно, нулевая гипотеза об отсутствии связи отвергается. Связь существует и она положительна, то есть с увеличением стоимости основных фондов увеличивается объем выпуска продукции.
Для анализа связей между признаками, измеренными в порядковых шкалах, применяют так называемые ранговые коэффициенты корреляции, в основе своей использующие понятие ранга показателя. Рангом называется номер наблюдения в упорядоченной совокупности.
Расчет коэффициента Спирмена производится по формуле:
где - ранг k-го наблюдения по показателю x; - ранг k-го наблюдения по показателю y; n – число наблюдений.
Проверка статистической существенности показателя осуществляется по таблицам критических значений.
Расчет коэффициента корреляции Кенделла производится до формуле:
, где S — сумма балов, если баллом +1 оценивается пара рангов, имеющих по обоим показателям одинаковый порядок, а баллом -1 — пара рангов с разным порядком.
Упрощение расчетов показателя Кенделла достигается следующим образом:
1) ряд рангов по показателю х располагается в возрастающем порядке с указанием соответствующих наблюдениям рангов по показателю у; в результате имеем по признаку х ряд рангов 1, 2, 3и т.д., а по признаку у - ряд i1, i2,... и т.д.
2) подсчитываются баллы для всех рангов по показателю у. Для этого находится, сколько рангов, предшествующих каждому рангу и последующим за ним, превышают его величину. Число предшествующих превышений записывается со знаком «-», а число последующих превышений — со знаком «+»;
3) находится сумма положительных и отрицательных баллов по каждому рангу и итоговое число баллов S.
При достаточно больших n имеет место соотношение: .
Значительная часть признаков, измеренная с помощью номинальных шкал составляет дихотомические признаки, т.е. признаки, принимающие 2 и более альтернативных значения.
Для анализа 2-дихотомических признака составляется таблица 4-х полей:
X | Y | ||
а | b | a+b | |
с | d | c+d | |
а+с | b+d | N |
и рассчитывают коэффициенты ассоциации и контингенции. Коэффициент ассоциации:
'
Предельным для коэффициента ассоциации является 0.5, то есть, если кa > 0.5, то между признаками имеется существенная взаимосвязь.
Коэффициент контингенции: .
Решение принимается следующим образом: если кk ³ 0.3, то это свидетельствует о наличии связи между качественными признаками.
ПРИМЕР 15. Были обследованы 1000 женщин с целью исследования зависимости между цветом глаз матерей и дочерей и получены следующие данные:
Цвет глаз матери | Цвет глаз дочери | ||
Итого по строке | |||
Итого по столбцу |
Рассчитаем значение коэффициента контингенции: кk = 0.365, следовательно, между признаками существует корреляционная связь.
Если признаки имеют несколько возможных значений, то используются коэффициенты сопряженности Чупрова или Пирсона. Расчет коэффициента Пирсона производится по формуле
При этом i=1,…,m1; j=1,…,m2,
Где - доля объектов, имеющих i-тое значение и j-го значения другого признака; m1 - количество градаций первого признака; m2 – количество градаций второго признака.
Коэффициент Чупрова определяется следующим образом:
Коэффициент Пирсона статистически существенен, если где - табличное значение критерия Хи-квадрат с (m1-1)(m2-1) степенями свободы; N- количество наблюдений.
Исследование многомерных взаимосвязей – типичная задача в социологии.
Один из наиболее наглядных приемов анализа связей – метод отображения взаимосвязей в корреляционном графе, предложенном эстонским математиком Л. Выханду.
Граф – это фигура, состоящая из точек (вершин) и отрезков, соединяющих эти вершины (ребра графа).
Для построения корреляционного графа измеряют парные связи между всеми переменными.
ПРИМЕР 16. Пример построения корреляционного графа. Пусть 3 переменных А, В, С, Д. Строится матрица парных коэффициентов корреляции (матрица интеркорреляций). Это симметричная матрица:
A | B | C | D | |
A | 0,7 | 0,95 | 0,6 | |
B | 0,7 | 0,13 | 0,3 | |
C | 0,95 | 0,13 | 0,75 | |
D | 0,6 | 0,3 | 0,75 |
Корреляционный граф выглядит следующим образом:
Связь ВС можно опустить, так как она намного слабее, чем связь ВС через вершину D.
Замечание. В корреляционном графе отображаются лишь те связи между вершинами, которые являются наиболее тесными.
Дата публикования: 2015-01-09; Прочитано: 685 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!