Главная Случайная страница Контакты | Мы поможем в написании вашей работы! | ||
|
Работаем в модуле Multiple Regression (множественная регрессия).
Ввод данных. Образуем таблицу 6v ´ 20c с 6 столбцами (variables - переменными) и 20 строками (cases). Столбцы назовем y, x 1, x 2 ,..., x 5. Введем в таблицу исходные данные.
Предварительный просмотр. Предварительно визуально оценим имеющиеся данные, построив несколько диаграмм рассеяния:
Graphs - Stats 2 D Graphs - Scatterplots - Variables - X: x 1, Y: y, Graph Type: Regular, Fit (подбор): Linear - OK.
Наблюдаем диаграмму рассеяния с подобранной прямой парной регрессии, параметры которой отражены в заголовке. Повторим это еще 4 раза, заменяя х1 на другие факторы: х 2 ,..., х 5. Иногда такой просмотр позволяет увидеть основную зависимость. В нашем примере этого нет.
Выполнение регрессионного анализа:
Analysis - Startup Panel - кнопка Variables: - отбираем зависимую переменную Dependent var: y и независимые переменные Independent var: x 1 ¸ x 5(при нажатой клавише Ctrl) - OK - Input file (входной файл): Raw Data (необработанные файлы) - OK - в окне Model Definition (уточнения) Metod: Standart, Intercept: Include in model (постоянную составляющую включить в модель) - ОК..
В окне Mult. Regr. Results имеем основные результаты: коэффициент детерминации (19) R 2 = 0.517; для проверки гипотезы Н 0об отсутствии какой бы то ни было линейной связи между переменной y и совокупностью факторов определена статистика (24) F = 3.00; это значение соответствует уровню значимости р = 0.048 (эквивалент (25) согласно распределению F (5,14) Фишера с df = 5 и 14 степенями свободы. поскольку значение р весьма мало, гипотеза Н 0 отклоняется.
Кнопка Regression summary - имеем таблицу результатов:
Regression Summary for Dependent Variable: Y | ||||
R =.71923865 RІ =.51730424 Adjusted RІ =.34491290 F(5,14) = 3.0008 p <.04787 Std. Error of estimate: 1.5990 | ||||
B | St. Err of B | t (14) | p-level | |
Intercpt | 3.51460 | 5.41853 | .648625 | .527078 |
X1 | -.00613 | .93167 | -.006580 | .994843 |
X2 | 15.54246 | 21.50311 | .722800 | .481704 |
X3 | .10990 | .83254 | .132004 | .896859 |
X4 | 4.47458 | 1.54345 | 2.899065 | .011664 |
X5 | -2.93251 | 3.08833 | -.949546 | .358448 |
В ее заголовке повторены результаты предыдущего окна; в столбце В указаны оценки неизвестных коэффициентов по (14). Таким образом, оценка (x) неизвестной функции регрессии f (x) в данном случае:
(x) = 3.51 - 0.06 x 1 + 15.5 x 2 + 0.11 x 3 + 4.47 x 4 - 2.93 x 5(26)
В столбце St. Err. of B указаны стандартные ошибки sj оценок коэффициентов (по (21)); видно, что стандартные ошибки в оценке всех коэффициентов, кроме b4, превышают значения самих коэффициентов, что говорит о статистической ненадежности последних. В столбце t (14) -значение статистики Стьюдента (22) для проверки гипотезы о нулевом значении соответствующих коэффициентов; в столбце p-level -уровень значимости отклонения этой гипотезы; достаточно малым (0.01) этот уровень является только для коэффициента при x 4. Только переменная x 4- количество удобрений, подтвердила свое право на включение в модель. В то же время проверка гипотезы об отсутствии какой бы то ни было линейной связи между y и (х 1 ,..., х 5) с помощью статистики (24) (об этом сказано выше)
F = 3.00, p = 0.048,
говорит о том, что следует продолжить изучение линейной связи между y и (х 1 ,..., х 5), анализируя как их содержательный смысл, так и матрицу парных корреляций, которая определяется так:
возврат в окно Multi. Regr. Results - кнопка Correlations and desc. Stats - Correlations. Из матрицы видно, что х 1, х 2и х 3(оснащенность техникой)
Correlations (harvest2.sta) | ||||||
X 1 | X 2 | X 3 | X 4 | X 5 | Y | |
X 1 | 1.000 | .854 | .978 | .110 | .341 | .430 |
X2 | .854 | 1.000 | .882 | .027 | .460 | .374 |
X 3 | .978 | .882 | 1.000 | .030 | .278 | .403 |
X 4 | .110 | .027 | .030 | 1.000 | .571 | .577 |
X 5 | .341 | .460 | .278 | .571 | 1.000 | .332 |
Y | .430 | .374 | .403 | .577 | .332 | 1.000 |
сильно коррелированы (парные коэффициенты корреляции 0.854, 0.882 и 0.978), т.е. имеет место дублирование информации, и потому, по-видимому, есть возможность перехода от исходного числа признаков (переменных) к меньшему.
Дата публикования: 2014-11-03; Прочитано: 372 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!