Главная Случайная страница Контакты | Мы поможем в написании вашей работы! | ||
|
На первом этапе проведем вычисление традиционным, а потому и самым утомительным способом, т.е. «вручную». Здесь нам в лучшем случае может помочь лишь калькулятор.
Рис.1. Графическое изображение исследуемой зависимости y = f (x)
Вычисление коэффициентов регрессии удобнее проводить в табличной форме. Для этого заполним табл.5, в которой, помимо исходных данных (их мы расположим по столбцам), в графах 4-8 укажем вспомогательные расчетные данные.
Для проверки правильности вычисления в таблице можно использовать следующее выражение: Σ(х+у)2 = Σ х 2 + 2Σ ху + Σ у 2.
1. Определим среднее арифметическое для каждого ряда − для х и у. Они составят соответственно: ⎯ х = 59,5/8 = 7,44 ч и у = 61,5/8 = 7,69 кг. Значения полученных сумм подставляем в формулу для последующейпроверки. Получим:
2072,00 = 541,75 + 2×510,25 + 509,75;
2072,00 = 2072,00.
Следовательно, вычисления выполнены правильно.
Таблица 5
Вспомогательная таблица для расчета коэффициентов регрессии
№ п/п | x | y | x2 | y2 | xy | x+y | (x+y)2 |
1,5 | 5,0 | 2,25 | 25,00 | 4,5 | 6,5 | 42,25 | |
4,0 | 4,5 | 16,0 | 20,25 | 18,0 | 8,5 | 72,25 | |
5,0 | 7,0 | 25,0 | 49,0 | 35,0 | 12,0 | 144,0 | |
7,0 | 6,5 | 49,0 | 42,25 | 45,5 | 13,5 | 182,25 | |
8,5 | 9,5 | 72,25 | 90,25 | 80,75 | 18,0 | 324,0 | |
10,0 | 9,0 | 100,0 | 81,0 | 90,0 | 19,0 | 361,0 | |
11,0 | 11,0 | 121,0 | 121,0 | 121,0 | 22,0 | 484,0 | |
12,5 | 9,0 | 156,25 | 81,00 | 112,5 | 21,5 | 462,25 | |
Итого | Σ=59,5 | Σ=61,5 | Σ=541,75 | Σ=509,75 | Σ=510,25 | Σ=121,00 | Σ=2072,00 |
2. Рассчитаем теперь коэффициенты и по известным формулам:
, кг
, кг/ч
Следовательно, уравнение регрессии, т.е. формула, с некоторой вероятностью отображающая зависимость у от х, имеет следующий вид:
ŷ = 3,73 + 0,53 х.
3. Для проверки значимости (пригодности) полученного уравнения регрессии применяют специальные приемы. Такую проверку называют проверкой адекватности модели.
Для количественной проверки гипотезы об адекватности можно использовать так называемый F − критерий (критерий Фишера):
где − остаточная дисперсия, или дисперсия адекватности.
Она характеризует величину среднего разброса экспериментальных точек Δ у относительно линии регрессии, т.е. Δ у = yi - ŷi (Δ у есть ошибка в предсказании экспериментального результата на основании математической модели).
Остаточная дисперсия, таким образом, позволяет оценить ошибку, с которой уравнение регрессии предсказывает фактический результат. Следовательно, минимальная величина остаточной дисперсии должна свидетельствовать о более удачном выборе линии регрессии.
Вообще в статистике принято считать, что применение критерия минимальности остаточной дисперсии является вполне надежным способом отбора адекватных экономико-математических моделей.
Чтобы определить, велика или мала ошибка в предсказании эмпирических результатов, ее нужно сопоставить с некоторой статистической величиной (эталоном), принимаемой в качестве критической. Вот почему используется расчетный F-критерий, который затем сравнивают с F крит.
Если F расч < F крит, то модель признается адекватной, т.е. с заданной степенью достоверности (надежности) она верно предсказывает реальный результат. Если же F расч > F крит, то вывод обратный: данное уравнение не может с заданной надежностью прогнозировать эмпирические данные.
Проверка адекватности модели по критерию Фишера дает возможность ответить на вопрос, во сколько раз хуже по сравнению с опытом предсказывает результат модель.
Остаточная дисперсия рассчитывается путем деления остаточной суммы квадратов на число степеней свободы f по следующей формуле:
Здесь число степеней свободы f = n − (k + 1), где n − число опытов в эксперименте (т.е. объем случайной выборки); k − число изучаемых факторов.
Для однофакторного эксперимента имеем f = n − 2 и тогда
Вторая характеристика в формуле для расчета F -критерия (знаменатель) − это так называемая усредненная, или общая дисперсия. В качестве таковой принимается квадрат стандартной ошибки . Этот показатель фактически характеризует случайную ошибку для всей выборки, т.е. оценивает несоответствие между конкретными (текущими) значениями результата эксперимента и средним арифметическим.
Общая дисперсия рассчитывается так:
Вернемся к нашему примеру. Оценим статистическую пригодность полученного линейного уравнения. Показатель удобно вычислять в табличной форме (табл.6). Расчет проведем по формулам:
, и
Таблица 6
Вспомогательная таблица для проверки уравнения на адекватность
№ п/п | xi | yi | |||||
1.5 | 5.0 | 4.53 | 0.47 | 0.221 | 2.69 | 7.24 | |
4.0 | 4.5 | 5.85 | -1.35 | 1.822 | 3.19 | 10.18 | |
5.0 | 7.0 | 6.36 | 0.62 | 0.384 | 0.69 | 0.48 | |
7.0 | 6.5 | 7.44 | -0.94 | 0.884 | 1.19 | 1.42 | |
8.5 | 9.5 | 8.24 | 1.26 | 1.588 | 1.81 | 3.28 | |
10.0 | 9.0 | 9.03 | -0.03 | 0.001 | 1.31 | 1.72 | |
11.0 | 11.0 | 9.53 | 1.44 | 2.074 | 3.31 | 10.96 | |
12.5 | 9.0 | 10.35 | -1.35 | 1.882 | 1.31 | 1.72 | |
Σ=59,5 | Σ=61,5 | Σ=0,12 | Σ=8,86 | Σ=15,51 | Σ=36,3 |
Определим величину критерия Фишера:
Определим табличное значение для α = 0,05, а также степеней свободы для числителя f 1 () и знаменателя f 2 (). Они составят соответственно f 1 = n −2, т.к. f =n −(k+ 1), где n − число опытов в эксперименте (т.е. составляет объем случайной выборки); k −число изучаемых факторов. Для однофакторного эксперимента имеем f=n −2.
Для второго показателя f 2= n − m, где m −количество вычисленных констант для переменной у, которая соответствует среднемарифметическому ⎯ у (т.е. m= 1). Тогда f 2= n −1,а F крит (0,05; f 1; f 2) = 3,87 (прил.3).
Поскольку 0,24<3,87, то с вероятностью 95% можно утверждать, что рассматриваемое уравнение адекватно и способно с указанной достоверностью предсказывать экспериментальные результаты.
Если теперь возвратиться к самому обсуждаемому заданию, то можно заметить, что смышленый студент Боб Деканкин вполне управился с порученным делом. Он сообщил пытливому г-ну Тютякину, что на основании имеющихся опытных данных можно уверенно спрогнозировать (с надежностью 95%) результат сбора медного лома: за 8 часов работы это составит почти 8 кг (3,7 + 0,53×8=7,97).
Примечание. В литературе по статистике обычно используются дваподхода к оценке F расч: либо как отношение / , либо как / . Соответственно и статистический вывод на основании сравнения вычисленного F- критерия и эталонного F крит дается с учетом принятого соотношения. Нами рассматривается версия, когда F расч = / ; в то же время в компьютерной программе используется обратное отношение, т.е. F расч= / . Это различие не носит принципиального характера. Важно только помнить, какой прием для анализа используется и, следовательно, каким образом дается надлежащее заключение.
Дата публикования: 2014-11-04; Прочитано: 594 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!