Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Подбор эмпирической[1] формулы методом наименьших квадратов



Между различными физическими величинами существуют связи и зависимости. Независимыми называются те величины, которые варьируются, задаются исследователем, тогда как зависимые - это величины, которые определяются в эксперименте. Опытным путем могут быть получены пары значений: независимой физической величины (например, x) и другой зависимой от нее (например, y). Пусть выполнены измерения скорости тела v в различные моменты времени t при равноускоренном движении и получены пары значений:

(28)

Мы можем допустить, и это известно из школьного курса физики, что скорость v должна быть линейной функцией времени t:

. (29)

Если построить эти точки на листе графика, то может оказаться, что соединив их мы получим не прямую, а ломаную линию.

В случае произвольных величин x и y зададим N значений x, измерим значения y, получим набор экспериментальных точек:

(30)

Задача состоит в том, чтобы дать связи y=y(x) количественную оценку, то есть найти математическую зависимость между величинами x и y. Предположим, что они связаны линейной зависимостью, вида:

, (31)

где A и B – некоторые постоянные. В идеальном случае отсутствия погрешностей все экспериментальные точки должны точно лечь на одну прямую. Однако, этого не произойдет. В реальной жизни всегда существуют погрешности, поэтому точки с координатами будут отклоняться от линейной зависимости. В таких случаях рассчитывают коэффициенты прямой, наилучшим образом проходящей вблизи экспериментальных точек. Ее проводят так, чтобы расстояния от точек до искомой линии оказались как можно меньшими. На первых порах студенты решают эту задачу графически - проводят по линейке линию вблизи точек, так, чтобы по возможности она проходила через штрихи, длина которых равна доверительным интервалам величин.

Аналитический способ позволяет найти наилучшую прямую более точно. Его часто называют линейной регрессией или методом наименьших квадратов. Он состоит в расчете таких постоянных A и B, чтобы для любого xi можно было найти истинное значение величины y, равное Yi:

. (32)

Значения Yi называются теоретическими значениями величины y, а yi – экспериментальными значениями. Из квадратов разностей экспериментальных и теоретических значений составляют сумму:

(33)

и подбирают коэффициенты A и B, так, чтобы сумма (33) была как можно меньше. Чтобы этого добиться, выполняют дифференцирование функции S по переменным A и B, а затем приравнивают производные и к нулю, получают систему из двух линейных алгебраических уравнений с двумя неизвестными A и B, решают ее и находят коэффициенты прямой (31). Приведем окончательные формулы для расчета параметров A и B:

, (34)

где . (35)

Когда коэффициент A посчитан, для B можно применить простую формулу:

. (36)

Получившаяся линия называется линией аппроксимации методом наименьших квадратов для этих данных или линией регрессии y от x. Чтобы выяснить погрешности в расчете постоянных A и B, сначала определим погрешность в измерении y. Числа y1, y2,, …, yN не представляют собой N результатов измерений одной и той же величины, поэтому, используя разброс в их значениях, мы не получим никакого представления о надежности результатов. Если предположить, что значения yi распределены нормально относительно истинных значений с квадратичным отклонением , то можно найти погрешность в расчете коэффициентов прямой. Отклонения также будут распределены по нормальному закону, центральным значением этого распределения будет ноль. Квадратичное отклонение величины y можно рассчитать по формуле:

. (37)

Очень часто в литературе встречается другая оценка, в которой знаменатель N заменяется на (N-2). Она имеет вид:

. (38)

Приводя такую оценку, авторы исходят из следующих соображений: если число точек N велико, то между N и (N-2) существенной разницы нет. Если же рассмотреть случай (37) при N=2, когда известны две экспериментальные точки, тогда точно через эти точки мы всегда можем провести прямую. Такая же прямая получится с помощью метода наименьших квадратов, поэтому каждая из сумм в (37) и (38) имеет по два слагаемых, равных нулю, а значит, обратится в ноль и . Все выглядит так, как будто и погрешность будет нулевой. Однако, в случае двух точек никакого заключения о надежности измерений дать нельзя. Если придерживаться первой оценки, то получается, что погрешность в измерении величины y равна нулю. Во втором случае получается ноль в знаменателе, поэтому стандартное отклонение имеет вид неопределенности . Это указывает на то, что после проведения только двух измерений нельзя сделать оценку погрешности расчета прямой.

Для коэффициентов A и B ошибки рассчитываются по формулам:

, (39)

где определяется по формуле:

. (40)

Метод наименьших квадратов используется не только для построения прямых. Он позволяет по экспериментальным данным находить зависимости между величинами x и y в виде многочленов, экспоненциальных функций, тригонометрических функций, а также выполнять построение многомерных графиков для функций двух или нескольких переменных.

Поскольку значения физических величин x и y получают в результате прямых или косвенных измерений, а затем по ним, методом наименьших квадратов, рассчитывают величины A и B, то вычисление коэффициентов A и B является примером совместных измерений.

Рис. 4. Экспериментальные точки на графике с учетом погрешностей.

Пусть в некотором эксперименте получены значения физических величин x и y. Набор экспериментальных точек не ложится на прямую; это видно по рис. 4. Найдем наилучшую прямую с коэффициентами A и B по формулам (34) и (36). Расчет приведен в таблице 3.

Таблица 3

n x xi-xср (xi-xср)2 y yi-yср (yi-yср)2 (xi-xср) (yi-yср)
  0,2 -0,9 0,81 0,33 -1,382 1,909924 1,24
  0,4 -0,7 0,49 0,67 -1,042 1,085764 0,73
  0,6 -0,5 0,25 0,99 -0,722 0,521284 0,36
  0,8 -0,3 0,09 1,23 -0,482 0,232324 0,14
  1,0 -0,1 0,01 1,47 -0,242 0,058564 0,02
  1,2 0,1 0,01 1,81 0,098 0,009604 0,01
  1,4 0,3 0,09 2,31 0,598 0,357604 0,18
  1,6 0,5 0,25 2,44 0,728 0,529984 0,36
  1,8 0,7 0,49 2,71 0,998 0,996004 0,70
  2,0 0,9 0,81 3,16 1,448 2,096704 1,30
  Xср= 1,1   Σ=3,30 Yср= 1,712     Σ=5,06

Рис. 5. Экспериментальные точки , обозначенные крестами - Ряд 2, рассчитанные точки наилучшей прямой , обозначенные точками - Ряд 3 и наилучшая прямая - линия, рассчитанная методом наименьших квадратов.

.

Наилучшая прямая показана на рис. 5. Найдем погрешности в расчетах коэффициентов A и B:

,

, .

Контрольные вопросы:

1) Предположим, есть три точки: (1; 2), (2; 3), (2; 3). Найти уравнение наилучшей прямой методом наименьших квадратов.

2) Рассчитать погрешности коэффициентов наилучшей прямой для трех точек: (1,1; 2,3), (2,4; 3,5), (2,2; 3,3).

3) Найти наилучшую прямую, удовлетворяющую экспериментальным точкам: (1; 12), (2; 13), (3; 18), (4; 19).

4) Рассчитать погрешности коэффициентов наилучшей прямой для четырех точек (1,1; 12,6), (2,2; 13,2), (3,1; 18,2), (4,2; 19,1)

5) Вывести формулу (25).

6) Получить формулу (27).

7) Из формулы (33) получить выражения (34) и (36) для МНК.

8) Убедиться в справедливости формулы (23) для расчета случайной, систематической и полной погрешностей.

9) Как зависит стандартное отклонение среднего от числа опытов?

10) Внимательно изучите таблицу в Приложении. Каким образом меняются коэффициенты Стьюдента с ростом надежности? С ростом числа опытов? Как вы думаете, почему?

11) Построить график функции плотности распределения для нормального распределения при σ =1. При σ =2.

12) Пусть f(x) – функция плотности нормального распределения. Что означает формула ?





Дата публикования: 2015-02-20; Прочитано: 845 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.011 с)...