Главная Случайная страница Контакты | Мы поможем в написании вашей работы! | ||
|
Множественной регрессией называют уравнение связи с несколькими независимыми переменными:
. (2.1)
Множественная регрессия применяется, когда из множества факторов, влияющих на результативный признак, нельзя выделить один доминирующий фактор и необходимо учитывать влияние нескольких факторов.
Построение уравнения множественной регрессии осуществляется в два этапа [3, с. 13]:
1) спецификация модели;
2) оценка параметров выбранной модели.
В свою очередь, спецификация модели включает выполнение двух этапов:
– отбор р факторов , подлежащих включению в модель;
– выбор вида аналитической зависимости .
Для оценки параметров уравнения множественной регрессии обычно применяется метод наименьших квадратов.
Для оценки качества полученного уравнения множественной регрессии (2.1) можно использовать коэффициент детерминации . Низкое значение (близкое к 0) коэффициента (индекса) детерминации означает, что в регрессионную модель не включены существенные факторы, с одной стороны, а с другой – рассматриваемая форма связи не отражает реальные соотношения между переменными, включенными в модель.
Значимость уравнения множественной регрессии в целом так же, как и в парной регрессии, оценивается с помощью F -критерия Фишера.
Оценка значимости коэффициентов регрессии осуществляется с помощью t -критерия Стьюдента.
Пример – Данные о сменной добыче торфа на одного рабочего в тоннах (переменная у), удельном весе рабочих с технической подготовкой в процентах (переменная ) и удельным весом механизированных работ в процентах (переменная ), характеризующие процесс добычи торфа на 12 предприятиях, приведены на рисунке 2.1. Необходимо построить линейную множественную регрессию вида и экспоненциальную множественную регрессию вида и выбрать модель
регрессии, наилучшим образом описывающую исходные данные.
Полученное уравнение линейной множественной регрессии имеет вид (рисунок 2.2).
Рисунок 2.1 – Исходные данные к задаче и применение режима Регрессия модуля Анализ данных надстройки «Пакет анализа» табличного процессора MS Excel
Рисунок 2.2 – Вывод итогов к расчету
Формулу функции ЛГРФПРИБЛ() (рисунок 2.3) необходимо ввести как формулу массива. Следует выделить диапазон размером 3 столбца и 5 строк, начиная с ячейки, содержащей формулу и нажать клавишу F2, а затем одновременно клавиши CTRL+SHIFT+ENTER. Диапазон размером 3 столбца и 5 строк выделяется, т. к. в исходных данных две переменные х, следовательно, в регрессии будет 3 коэффициента, и дополнительная статистика функции выводится в пяти строках.
Рисунок 2.3 – Ввод аргументов функции ЛГРФПРИБЛ()
На приведенном ниже рисунке 2.4 показано, в каком порядке возвращается дополнительная регрессионная статистика функции ЛГРФПРИБЛ().
|
Рисунок 2.4 – дополнительная регрессионная статистика функции ЛГРФПРИБЛ()
На рисунке 2.4 приняты следующие обозначения: – коэффициенты регрессии; – стандартная ошибка для оценки y; – степени свободы, . Для данного примера , ; – остаточная сумма квадратов (сумма квадратов разностей между фактическим значением y и прогнозируемым значением ): ; – регрессионная сумма квадратов: = – . Чем меньше , тем больше значение коэффициента детерминации , который показывает, насколько хорошо уравнение, полученное с помощью регрессионного анализа, объясняет взаимосвязи между переменными.
Полученное уравнение экспоненциальной множественной регрессии имеет вид . Значения , и следует сравнивать с , и , а не с , и .
Выбор наилучшей из построенных моделей регрессий осуществляется по значениям коэффициента (индекса) множественной детерминации , который рассчитывается как квадрат индекса множественной корреляции. Сравнив значение = 0,9078 для уравнения линейной регрессии и = 0,9015 для уравнения экспоненциальной регрессии, можно сделать вывод, что наилучшей является линейная множественная регрессия.
Дата публикования: 2015-02-18; Прочитано: 341 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!