Главная Случайная страница Контакты | Мы поможем в написании вашей работы! | ||
|
В таблице 1.1 приводятся данные о заработной плате (, долл.) и возрасте (, лет) по 20 рабочим.
Табл. 1.1
Требуется:
1. Построить поле корреляции и сформулировать гипотезу о форме связи и .
2. Построить линейную регрессионную модель зависимости заработной платы от возраста рабочего, вычислить средний коэффициент эластичности, определить коэффициент детерминации и среднюю относительную ошибку аппроксимации и оценить точность модели.
3. Оценить статистическую значимость параметров регрессии и модели в целом, а также построить интервальную оценку коэффициентов линейной регрессии с надежностью 0,95.
4. Выполнить прогноз заработной платы для 33-летнего рабочего, оценить точность прогноза, рассчитав стандартную ошибку прогноза и его доверительный интервал.
Решение выполним в среде MS Excel.
1. Сформируем расчетную таблицу следующей структуры:
№ п/п | |||||||||
Сумма | |||||||||
Среднее |
Введем исходные данные , в таблицу по столбцам.
Построим поле корреляции при помощи Мастера диаграмм (тип – Точечная диаграмма) и выполним визуальный анализ типа зависимости.
Рис. 1.1. Поле корреляции
По виду поля корреляции можно сделать вывод о том, что форма связи переменных и может быть как линейной, так и нелинейной.
2. Рассчитаем колонки , , расчетной таблицы. Вычисляем суммы и средние значения столбцов с помощью функций СУММ(…) и СРЗНАЧ(…).
Выполним расчет параметров уравнения регрессии по формулам 1.1:
, .
В итоге линейная модель имеет вид:
.
Коэффициент регрессии показывает, что в среднем заработная плата растет на доллара при увеличении возраста рабочего на 1 год.
Найдем значения выборочных дисперсий и СКО по формулам 1.2:
, , , .
Определим выборочный коэффициент корреляции по одной из формул 1.3: .
Коэффициент парной корреляции по шкале Чеддока является высоким, что свидетельствует о существенной зависимости з/п от возраста рабочего.
Вычислим средний коэффициент эластичности по формуле 1.4:
.
Он показывает, что при увеличении возраста рабочего на 1 % от среднего значения з/п в среднем возрастает на 0,799%.
Рассчитаем коэффициент детерминации по формуле 1.5:
.
также близок к единице и по нему следует, что з/п на 72% объясняется таким фактором, как возраст рабочего.
Вычислим предсказанные моделью значения з/п по формуле
и тем самым заполним колонку расчетной таблицы. Далее вычисляются остатки и их квадраты . В итоге в строке "Сумма" таблицы определится остаточная сумма квадратов .
Проверим качество модели по средней относительной ошибке аппроксимации, вычислив по формуле 1.8. Для этого в первой строке колонки набираем с использованием функции ABS (…) формулу: =ABS()*100. После протяжки по всему столбцу вычисляем среднее значение данного столбца:
= .
По видно, что в среднем расчетные значения отклоняются от фактических на 10,2%, что говорит о допустимом качестве модели по этому критерию.
Далее построим график линейной функции на поле корреляции с помощью Мастера диаграмм и убедимся, что МНК дал хорошие результаты аппроксимации.
Рис. 1.2. Поле корреляции с линейной регрессией
3. По формулам 1.9 и 1.10 найдем стандартные ошибки уравнения регрессии и его параметров:
, ,
, .
Рассчитаем статистики Стьюдента по формулам 1.11:
, , .
Обратим внимание на то, что , а .
Найдем с помощью функции СТЬЮДРАСПОБР (…) табличное значение по уровню значимости и числу степеней свободы . Сравнение расчетных значений с табличным указывает на статистическую значимость параметров и . Параметр же не является значимым, поскольку .
Доверительные интервалы строим только для коэффициентов модели, точечные оценки которых являются статистически значимыми. В нашем случае – только для коэффициента регрессии :
; ; ;
.
Рассчитаем критерий Фишера по формуле 1.6:
.
Табличное значение = определяем с помощью встроенной статистической функции FРАСПОБР по уровню значимости и числам свободы и . Поскольку , то можно сделать вывод об адекватности построенной модели.
4. Получим прогнозную заработную плату для 33-летнего рабочего по найденной линейной модели:
(долл.).
Вычислим стандартную ошибку прогнозного значения по формуле 1.14:
.
Находим 95% доверительный интервал для прогнозного значения з/п 33-летнего рабочего с использованием формулы 1.15:
,
.
Таким образом, заработная плата 33-летнего рабочего с вероятностью 0,95 находится в пределах от 220,38 до 382,27 долларов.
Дата публикования: 2015-04-10; Прочитано: 779 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!