![]() |
Главная Случайная страница Контакты | Мы поможем в написании вашей работы! | |
|
Регрессионный и корреляционный анализ позволяет установить и оценить зависимость изучаемой случайной величины Y от одной или нескольких других величин X, и делать прогнозы значений Y. Параметр Y, значение которого нужно предсказывать, является зависимой переменной. Параметр X, значения которого нам известны заранее и который влияет на значения Y, называется независимой переменной. Например, X – количество внесенных удобрений, Y – снимаемый урожай; X – величина затрат компании на рекламу своего товара, Y – объем продаж этого товара и т.д.
Корреляционная зависимость Y от X – это функциональная зависимость
![]() | (9.1) |
где – среднее арифметическое (условное среднее) всех возможных значений параметра Y, которые соответствуют значению
. Уравнение (9.1) называется уравнением регрессии Y на X, функция
– регрессией Y на X, а ее график – линией регрессии Y на X.
Основная задача регрессионного анализа – установление формы корреляционной связи, т.е. вида функции регрессии (линейная, квадратичная, показательная и т.д.).
Метод наименьших квадратов позволяет определить коэффициенты уравнения регрессии таким образом, чтобы точки, построенные по исходным данным , лежали как можно ближе к точкам линии регрессии (9.1). Формально это записывается как минимизация суммы квадратов отклонений (ошибок) функции регрессии и исходных точек
,
где – значение, вычисленное по уравнению регрессии;
– отклонение
(ошибка, остаток) (рис.9.1); n – количество пар исходных данных.
Рис.9.1. Понятие отклонения для случая линейной регрессии
В регрессионном анализе предполагается, что математическое ожидание случайной величины равно нулю и ее дисперсия одинакова для всех наблюдаемых значений Y. Отсюда следует, что рассеяние данных возле линии регрессии должно быть одинаково при всех значениях параметра X. В случае, показанном на рис.9.2 данные распределяются вдоль линии регрессии неравномерно, поэтому метод наименьших квадратов в этом случае неприменим.
Рис.9.2. Неравномерное распределение исходных точек вдоль линии регрессии
Основная задача корреляционного анализа – оценка тесноты (силы) корреляционной связи. Теснота корреляционной зависимости Y от X оценивается по величине рассеяния значений параметра Y вокруг условного среднего . Большое рассеяние говорит о слабой зависимости Y от X, либо об ее отсутствии и, наоборот, малое рассеяние указывает на наличие достаточно сильной зависимости.
Коэффициент детерминации показывает, на сколько процентов (
) найденная функция регрессии описывает связь между исходными значениями параметров X и Y
![]() | (9.2) |
где – объясненная вариация;
– общая вариация (рис.9.3).
Рис.9.3. Графическая интерпретация коэффициента детерминации
для случая линейной регрессии
Соответственно, величина показывает, сколько процентов вариации параметра Y обусловлены факторами, не включенными в регрессионную модель. При высоком (
) значении коэффициента детерминации можно делать прогноз
для конкретного значения
.
Для проведения регрессионного анализа и прогнозирования необходимо:
1) построить график исходных данных и попытаться зрительно, приближенно определить характер зависимости;
2) выбрать вид функции регрессии, которая может описывать связь исходных данных;
3) определить численные коэффициенты функции регрессии;
4) оценить силу найденной регрессионной зависимости на основе коэффициента детерминации ;
5) сделать прогноз (при ) или сделать вывод о невозможности прогнозирования с помощью найденной регрессионной зависимости. При этом не рекомендуется использовать модель регрессии для тех значений независимого параметра X, которые не принадлежат интервалу, заданному в исходных данных.
Дата публикования: 2015-04-10; Прочитано: 800 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!