Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Решение типовой задачи. В таблице 1.1 приводятся данные о заработной плате ( , долл.) и возрасте ( , лет) по 20 рабочим



В таблице 1.1 приводятся данные о заработной плате (, долл.) и возрасте (, лет) по 20 рабочим.

Табл. 1.1

                   
                   
                   
                   

Требуется:

1. Построить поле корреляции и сформулировать гипотезу о форме связи и .

2. Построить линейную регрессионную модель зависимости заработной платы от возраста рабочего, вычислить средний коэффициент эластичности, определить коэффициент детерминации и среднюю относительную ошибку аппроксимации и оценить точность модели.

3. Оценить статистическую значимость параметров регрессии и модели в целом, а также построить интервальную оценку коэффициентов линейной регрессии с надежностью 0,95.

4. Выполнить прогноз заработной платы для 33-летнего рабочего, оценить точность прогноза, рассчитав стандартную ошибку прогноза и его доверительный интервал.

Решение выполним в среде MS Excel.

1. Сформируем расчетную таблицу следующей структуры:

№ п/п
                   
                 
                   
Сумма                  
Среднее                  

Введем исходные данные , в таблицу по столбцам.

Построим поле корреляции при помощи Мастера диаграмм (тип – Точечная диаграмма) и выполним визуальный анализ типа зависимости.

Рис. 1.1. Поле корреляции

По виду поля корреляции можно сделать вывод о том, что форма связи переменных и может быть как линейной, так и нелинейной.

2. Рассчитаем колонки , , расчетной таблицы. Вычисляем суммы и средние значения столбцов с помощью функций СУММ(…) и СРЗНАЧ(…).

Выполним расчет параметров уравнения регрессии по формулам 1.1:

, .

В итоге линейная модель имеет вид:

.

Коэффициент регрессии показывает, что в среднем заработная плата растет на доллара при увеличении возраста рабочего на 1 год.

Найдем значения выборочных дисперсий и СКО по формулам 1.2:

, , , .

Определим выборочный коэффициент корреляции по одной из формул 1.3: .

Коэффициент парной корреляции по шкале Чеддока является высоким, что свидетельствует о существенной зависимости з/п от возраста рабочего.

Вычислим средний коэффициент эластичности по формуле 1.4:

.

Он показывает, что при увеличении возраста рабочего на 1 % от среднего значения з/п в среднем возрастает на 0,799%.

Рассчитаем коэффициент детерминации по формуле 1.5:

.

также близок к единице и по нему следует, что з/п на 72% объясняется таким фактором, как возраст рабочего.

Вычислим предсказанные моделью значения з/п по формуле

и тем самым заполним колонку расчетной таблицы. Далее вычисляются остатки и их квадраты . В итоге в строке "Сумма" таблицы определится остаточная сумма квадратов .

Проверим качество модели по средней относительной ошибке аппроксимации, вычислив по формуле 1.8. Для этого в первой строке колонки набираем с использованием функции ABS (…) формулу: =ABS()*100. После протяжки по всему столбцу вычисляем среднее значение данного столбца:

= .

По видно, что в среднем расчетные значения отклоняются от фактических на 10,2%, что говорит о допустимом качестве модели по этому критерию.

Далее построим график линейной функции на поле корреляции с помощью Мастера диаграмм и убедимся, что МНК дал хорошие результаты аппроксимации.

Рис. 1.2. Поле корреляции с линейной регрессией

3. По формулам 1.9 и 1.10 найдем стандартные ошибки уравнения регрессии и его параметров:

, ,

, .

Рассчитаем статистики Стьюдента по формулам 1.11:

, , .

Обратим внимание на то, что , а .

Найдем с помощью функции СТЬЮДРАСПОБР (…) табличное значение по уровню значимости и числу степеней свободы . Сравнение расчетных значений с табличным указывает на статистическую значимость параметров и . Параметр же не является значимым, поскольку .

Доверительные интервалы строим только для коэффициентов модели, точечные оценки которых являются статистически значимыми. В нашем случае – только для коэффициента регрессии :

; ; ;

.

Рассчитаем критерий Фишера по формуле 1.6:

.

Табличное значение = определяем с помощью встроенной статистической функции FРАСПОБР по уровню значимости и числам свободы и . Поскольку , то можно сделать вывод об адекватности построенной модели.

4. Получим прогнозную заработную плату для 33-летнего рабочего по найденной линейной модели:

(долл.).

Вычислим стандартную ошибку прогнозного значения по формуле 1.14:

.

Находим 95% доверительный интервал для прогнозного значения з/п 33-летнего рабочего с использованием формулы 1.15:

,

.

Таким образом, заработная плата 33-летнего рабочего с вероятностью 0,95 находится в пределах от 220,38 до 382,27 долларов.





Дата публикования: 2015-04-10; Прочитано: 778 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.01 с)...