![]() |
Главная Случайная страница Контакты | Мы поможем в написании вашей работы! | |
|
В таблице 1.1 приводятся данные о заработной плате (, долл.) и возрасте (
, лет) по 20 рабочим.
Табл. 1.1
![]() | ||||||||||
![]() |
![]() | ||||||||||
![]() |
Требуется:
1. Построить поле корреляции и сформулировать гипотезу о форме связи и
.
2. Построить линейную регрессионную модель зависимости заработной платы от возраста рабочего, вычислить средний коэффициент эластичности, определить коэффициент детерминации и среднюю относительную ошибку аппроксимации и оценить точность модели.
3. Оценить статистическую значимость параметров регрессии и модели в целом, а также построить интервальную оценку коэффициентов линейной регрессии с надежностью 0,95.
4. Выполнить прогноз заработной платы для 33-летнего рабочего, оценить точность прогноза, рассчитав стандартную ошибку прогноза и его доверительный интервал.
Решение выполним в среде MS Excel.
1. Сформируем расчетную таблицу следующей структуры:
№ п/п | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() |
![]() | |||||||||
Сумма | |||||||||
Среднее |
Введем исходные данные ,
в таблицу по столбцам.
Построим поле корреляции при помощи Мастера диаграмм (тип – Точечная диаграмма) и выполним визуальный анализ типа зависимости.
Рис. 1.1. Поле корреляции
По виду поля корреляции можно сделать вывод о том, что форма связи переменных и
может быть как линейной, так и нелинейной.
2. Рассчитаем колонки ,
,
расчетной таблицы. Вычисляем суммы и средние значения столбцов с помощью функций СУММ(…) и СРЗНАЧ(…).
Выполним расчет параметров уравнения регрессии по формулам 1.1:
,
.
В итоге линейная модель имеет вид:
.
Коэффициент регрессии показывает, что в среднем заработная плата растет на
доллара при увеличении возраста рабочего на 1 год.
Найдем значения выборочных дисперсий и СКО по формулам 1.2:
,
,
,
.
Определим выборочный коэффициент корреляции по одной из формул 1.3: .
Коэффициент парной корреляции по шкале Чеддока является высоким, что свидетельствует о существенной зависимости з/п от возраста рабочего.
Вычислим средний коэффициент эластичности по формуле 1.4:
.
Он показывает, что при увеличении возраста рабочего на 1 % от среднего значения з/п в среднем возрастает на 0,799%.
Рассчитаем коэффициент детерминации по формуле 1.5:
.
также близок к единице и по нему следует, что з/п на 72% объясняется таким фактором, как возраст рабочего.
Вычислим предсказанные моделью значения з/п по формуле
и тем самым заполним колонку расчетной таблицы. Далее вычисляются остатки
и их квадраты
. В итоге в строке "Сумма" таблицы определится остаточная сумма квадратов
.
Проверим качество модели по средней относительной ошибке аппроксимации, вычислив по формуле 1.8. Для этого в первой строке колонки
набираем с использованием функции ABS (…) формулу: =ABS(
)*100. После протяжки по всему столбцу вычисляем среднее значение данного столбца:
=
.
По видно, что в среднем расчетные значения отклоняются от фактических на 10,2%, что говорит о допустимом качестве модели по этому критерию.
Далее построим график линейной функции на поле корреляции с помощью Мастера диаграмм и убедимся, что МНК дал хорошие результаты аппроксимации.
Рис. 1.2. Поле корреляции с линейной регрессией
3. По формулам 1.9 и 1.10 найдем стандартные ошибки уравнения регрессии и его параметров:
,
,
,
.
Рассчитаем статистики Стьюдента по формулам 1.11:
,
,
.
Обратим внимание на то, что , а
.
Найдем с помощью функции СТЬЮДРАСПОБР (…) табличное значение по уровню значимости
и числу степеней свободы
. Сравнение расчетных значений с табличным
указывает на статистическую значимость параметров
и
. Параметр же
не является значимым, поскольку
.
Доверительные интервалы строим только для коэффициентов модели, точечные оценки которых являются статистически значимыми. В нашем случае – только для коэффициента регрессии :
;
;
;
.
Рассчитаем критерий Фишера по формуле 1.6:
.
Табличное значение =
определяем с помощью встроенной статистической функции FРАСПОБР по уровню значимости
и числам свободы
и
. Поскольку
, то можно сделать вывод об адекватности построенной модели.
4. Получим прогнозную заработную плату для 33-летнего рабочего по найденной линейной модели:
(долл.).
Вычислим стандартную ошибку прогнозного значения по формуле 1.14:
.
Находим 95% доверительный интервал для прогнозного значения з/п 33-летнего рабочего с использованием формулы 1.15:
,
.
Таким образом, заработная плата 33-летнего рабочего с вероятностью 0,95 находится в пределах от 220,38 до 382,27 долларов.
Дата публикования: 2015-04-10; Прочитано: 778 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!