Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Корреляционно-регрессионный анализ математических моделей



2.1. Понятия корреляции и регрессии

Корреляция в переводе с латинского обозначает соответствие или взаимосвязь. Корреляционная зависимость отражает связь между величинами, когда определенным значениям факториальных величин соответствует много значений зависимой величины.

Корреляционный анализ в задачах моделирования транспортных процессов и систем имеет фундаментальное значение, так как теснота корреляционной связи определяет структуру модели. Высокая и полная корреляционная связь требует объединения величин. Отсутствие или слабость корреляционных связей позволяют рассматривать величину как независимую.

Во многих случаях выбор независимых величин на базе исследования их корреляционных связей требует дополнительного экспертного исследования и решения.

Например, при формировании имитационной модели (см. пример 1.2 и рис. 1.1) независимость источников грузопотоков между собой, а также и получателей грузов между собой требует корреляционного анализа. При наличии зависимости (например, дополнительных перевозок грузов между источниками грузопотоков) требуются изменение структуры имитационной модели, учет этих связей.

Корреляционная связь между двумя переменными изучается с помощью парной корреляции. О тесноте корреляционной связи можно судить по характеру расположения точек на графике, связующем переменные х и у. Такой график называется полем корреляции (рис. 2.1). Разброс точек по всему полю свидетельствует об отсутствии корреляции (рис. 2,а), рис. 2,б свидетельствует о слабой умеренной корреляции, рис. 2,в - о полной корреляции.

Численное значение корреляционной связи оценивается коэффициентом корреляции r.

Задачей регрессионного анализа является установление вида зависимости (1.2) (зависимости параметра оптимизации у от факториальных величин х1, х2…хn). Указанная зависимость называется уравнением регрессии. Корреляционно-регрессионный анализ позволяет прогнозировать развитие рассматриваемого явления и решать задачу построения модели и ее оптимизации. Регрессионный анализ введен в практику расчетов английским математиком и механиком У.Р. Гамильтоном в 1840-х годах.

При проведении регрессионного анализа применяются понятия парных и множественных коэффициентов регрессии. На рис. 2.2 показано корреляционное поле парной линейной зависимости, отказов автомобилей в эксплуатации от числа капитальных ремонтов. Рассмотрение расположения точек на поле рис. 2.2 позволяет говорить о слабой корреляционной зависимости, разброс точек на рис. 2.2 примерно соответствует рис. 2.1,б. Из рис. 2.2 видно, что если для каждой величины х найти средние значения у и соединить эти точки, то получится ломанная линия, называемая опытнойлинией регрессии. Очевидно, что полученная линия является следствием ошибок замеров, недостаточного их количества, дискретности графика. По мере увеличения числа данных (увеличения объема выборки) ломаная линия асимптотически приближается к какой-то плавной кривой. Поскольку объем данных всегда ограничен, то возникает задача аппроксимации опытной линии регрессии теоретической функцией. Функция, аппроксимирующая опытную ломаную линию, называется теоретической линией регрессии.

При парной зависимости опытная линия регрессии может быть аппроксимирована с помощью следующих функций:

у = а + b х – прямая линия;

у = а х2 + b х + с – парабола второго порядка;

у = – гипербола;

у = а + b lg х – логарифмическая функция.

Используются также показательная и степенная функции, арифметическая и геометрическая прогрессии, алгебраический полином, тригонометрический ряд (ряд Фурье) и другие функции.

В общем случае для n переменных уравнение регрессии приобретает более сложный вид.

2.2. Вычисления парной корреляции и линейной регрессии

Простейшим уравнением, описывающим зависимость между двумя переменными Х и У, является линейное уравнение (уравнение регрессии)

у = а + b х, (2.1)

где а – начальная координата; b – тангенс угла наклона прямой к оси абсцисс, называемый коэффициентом регрессии.

Координаты средней арифметической точки на графике определяются из уравнений, где n – число точек:

, .

Общая колеблемость значений, вызванная действующими на нее факторами, включая исследуемый, характеризуется общей дисперсией σ 2у, которая представляет собой средний квадрат отклонений фактических значений признака y от их средней арифметической:

.

Колеблемость фактических значений около теоретической линии регрессии (линии, связующей переменные y и x), вызванная влиянием других факторов кроме исследуемого, характеризуется дисперсией σ 2ух,1, или средним квадратом отклонений фактических значений признака y от теоретических, рассчитанных по уравнению регрессий:

.

Отклонения расчетных значений признака , вызванных непосредственно фактором x, характеризуется дисперсией σ2 ух точек теоретической линии регрессии вокруг средней арифметической:

.

Общая дисперсия соответствует сумме частных дисперсий:

.

Следовательно, чем теснее корреляционная связь между признакам y и переменной x, тем больше дисперсия σ 2ух будет стремиться к значению общей дисперсии, а частная дисперсия σ 2ух1 будет стремиться к нулю.

Коэффициент корреляции r рассчитывается по следующему выражению:

, (2.2)

где σ ух - среднее квадратичное отклонение теоретических значений у, вычисленных по уравнению регрессии, от средней арифметической; σ у – среднее квадратичное отклонение фактических значений у от средней арифметической.

Коэффициент корреляции r количественно характеризует тесноту связи и изменяется в пределах от нуля до единицы (знаки «+» или «-» значений не имеют). Теснота связи оценивается следующим образом.

Теснота (сила) корреляционной связи Величины коэффициента корреляции r или корреляционного отношения ή
Слабая Умеренная Заметная Высокая Полная 0,1…0,3 0,3…0,5 0,5…0,7 0,7…0,9 0,9…0,99

Обычно считают тесноту связи удовлетворительной при величинах r ≥ 0,5. Различают также коэффициент множественной корреляции между одной зависимой переменной у и несколькими независимыми х1, х2…хn.

Квадрат коэффициента корреляции называют коэффициентом детерминации ∂:

∂ = r2. (2.3)

Коэффициент детерминации ∂ показывает, какая часть вариации зависимой переменной у обусловливается независимой переменной x.

С коэффициентом корреляции связан коэффициент парной регрессии, вычисляемый по формуле

ρ xy .(2.4)

Рассмотрим применение корреляционно-регрессионного анализа в решении транспортных задач на конкретных примерах.

Пример 2.1. На автотранспортном предприятии (АТП) эксплуатируется парк - 18 автомобилей конкретной марки. Все автомобили прошли капитальные ремонты: треть парка – один ремонт, треть – два и треть – три ремонта. За время эксплуатации в течение одного года поквартально было зарегистрировано следующее число отказов (выходов из строя) автомобилей в эксплуатации. При фиксации и анализе для облегчения выполнения расчетов используется понятие частость событий, что является общепринятым при расчетах.

В группе автомобилей после первого капитального ремонта всего 28 отказов, из них поквартально: в 1-м 2 отказа один раз; во 2-м по 4 отказа два раза; в 3-м по 6 отказов 3 раза; в 4-м отказов не было. Среднее арифметическое число отказов по этой группе

.

В группе автомобилей после второго капитального ремонта были 21 отказ, из них поквартально: в 1-м по 2 отказа 2 раза; во 2-м по 1 отказу 3 раза; в 3-м по 2 отказа 4 раза; в 4-м 6 отказов 1 раз.

Среднее арифметическое число отказов по этой группе составило

.

В группе автомобилей после третьего ремонта были 37 отказов в эксплуатации, из них поквартально: в 1-м по 3 отказа 1 раз; во 2-м по 6 отказов 1 раз; в 3-м по 7 отказов 2 раза; в 4-м по 8 отказов 2 раза.

Среднее число отказов по группе составило

.

Всего в АТП были зафиксированы 88 случаев отказов автомобилей в эксплуатации.





Дата публикования: 2015-04-10; Прочитано: 796 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.009 с)...