Главная \| Случайная страница \| Контакты \| Мы поможем в написании вашей работы!

Метод сопряженных градиентов

⇐ Предыдущая 28 29 30 31 323334 35 36 37 Следующая ⇒

До сих пор в итерационной процедуре (3.48) в качестве направления убывания функции f(х) мы использовали направление антиградиента: ¢(х ^k) . Однако такой выбор направления убывания не всегда бывает удачным. В частности, для плохо обусловленных задач минимизации направление антиградиента в точке х ^k может значительно отличаться от направления к точке минимума х^*. В результате траектория приближения к точке минимума имеет зигзагообразный характер (см. пример 3.10).

В разд. 3.5.6 был описан метод сопряженных направлений, позволяющий найти точку минимума квадратичной функции за конечное число шагов. Опишем метод, позволяющий получить сопряженные направления для квадратичной функции f(х) с использованием ее производных. В этом методе используется итерационный процесс

х ^k ⁺¹= х ^k + a _k р ^k, k = 0, 1, …; x⁰Î E _n, p⁰ = -f ¢(х⁰), (3.55)

в котором величина шага находится из условия исчерпывающего спуска по направлению р ^k. После вычисления очередной точки х ^k ⁺¹, k = 0, 1,… новое направление поиска р ^k ⁺¹ находится по формуле

р ^k ⁺¹=-f ¢(х ^k ⁺¹) + b _k p ^k, k = 0, 1, …, (3.56)

где коэффициенты b _k выбираются так, чтобы при минимизации квадратичной функции f(х) с положительно определенной матрицей A получалась последовательность А -ортогональных векторов р⁰, р¹,… Из условия < A р ^k ⁺¹,р ^k ⁺¹>=0 имеем:

. (3.57)

Напомним, что для квадратичной функции шаг исчерпывающего спуска по направлению р ^k равен

. (3.58)

Можно показать, что процесс (3.55)-(3.58) минимизации квадратичной функции с положительно определенной симметрической матрицей A дает точки х⁰,.., х^k и векторы р⁰, …, р ^k такие, что если f ¢(x ⁱ) при 0 £ i < k £ n- 1, то векторы р⁰, …, р ^k A -ортогональны, а градиенты f '(x⁰),.., f '(x ⁱ) взаимно ортогональны.

Обращение градиента в нуль в очередной точке х ^k итерационного процесса свидетельствует о достижении точки глобального минимума. Так как направления р ^k в (3.55) являются A -ортогональными, рассматриваемый метод гарантирует нахождение точки минимума сильно выпуклой квадратичной функции не более чем за п шагов (см. теорему 3.9).

С учетом взаимной ортогональности градиентов f' (x ⁱ) и условий исчерпывающего спуска по направлениям р ^k можно упростить выражения (3.57) и (3.58). Выразим числитель дроби (3.58):

<f¢(x ^k),p ^k >= <f ¢(x ^k), -f ¢(x ^k) + b _k _-1p ^k ^-1> = -||f ¢(x ^k)||² +b _k _-1<f ¢(x ^k), p ^k ^-1> =-||f¢(x ^k)||².

(3.59)

Умножив обе части равенства (3.55) слева на матрицу A и прибавив к ним по вектору b, получим

f ¢(x ^k ⁺¹)= f ¢(x ^k)+ a _k A р ^k. (3.60)

С учетом формулы (3.60) упростим числитель в выражении (3.57) для b _k следующим образом:

< A f ¢(x ^k ⁺¹), р ^k > = <f ¢(x ^k ⁺¹), A р ^k > = <f ¢(x ^k ⁺¹), > = . (3.61)

В результате выражения для a _k и b _k примут вид

; (3.62)

. (3.63)

Выражение (3.63) для коэффициента b _k не содержит в явном виде матрицу A квадратичной функции. Поэтому метод сопряженных градиентов может применяться и для минимизации неквадратичных функций. В этом случае итерационный процесс метода описывается соотношениями:

x ^k ⁺¹ =x ^k + a _k p ^k, x⁰Î E _n, p⁰ = -f ¢(x⁰), k= 0, 1, …; (3.64)

f(x ^k + a _k p ^k) = , k= 0, 1, …; (3.65)

p ^k ⁺¹= -f ¢(x ^k ⁺¹) + b _k p ^k, k= 0, 1, …; (3.66)

, k= 0, 1, …; (3.67)

Разумеется, процесс (3.64)—(3.65) может не приводить к точке минимума функции f(х), отличной от квадратичной, за конечное число итераций. Далее, точное определение a _k из условия (3.65) возможно лишь в редких случаях. Поэтому реализация каждой итерации метода будет сопровождаться неизбежными погрешностями. Эти погрешности, накапливаясь, могут привести к тому, что векторы р ^k перестанут указывать направление убывания функции и сходимость метода может нарушиться. Поэтому на практике в методе сопряженных градиентов через N шагов производят обновление метода, полагая b _mN = 0, m = 1, 2,.. Номера mN называются моментами обновления метода (реcтарта). Часто полагают N=n — размерности пространства E _n. Если N = 1, то получается частный случай метода сопряженных градиентов — метод наискорейшего спуска.

Опишем алгоритм метода сопряженных градиентов.

Шаг 0. Задать параметр точности e > 0, выбрать x⁰Î E _n, найти f ¢(х⁰).

Шаг 1. Положить k= 0, р⁰ =-f ¢(х⁰).

Шаг 2. Решить задачу одномерной минимизации f(х ^k + aр ^k)®min, a > 0, т.е. найти a = a _k.

Шаг 3. Положить х ^k ⁺¹ = х ^k + aр ^k и вычислить f '(х ^k ⁺¹). Проверить условие достижения точности: || f '(х ^k ⁺¹)|| < e. Если оно выполняется, то положить х⁰=х ^k ⁺¹, f '(x⁰)= f '(х ^k ⁺¹) и закончить поиск, иначе — перейти к шагу 4.

Шаг 4. Проверить условие k+ 1 = n. Если оно выполняется, то положить х⁰=х ^k ⁺¹, f '(x⁰)= f '(х ^k ⁺¹) и перейти к шагу 1 (рестарт), иначе — перейти к шагу 5.

Шаг 5. Вычислить коэффициент b _k = || f '(х ^k ⁺¹)||²/ || f '(х ^k)||² и найти новое направление поиска р ^k ⁺¹ =- f '(х ^k ⁺¹)+ b _k р ^k. Положить k=k+ 1 и перейти к шагу 2.

Замечание. Вблизи точки минимума дважды дифференцируемая функция с положительно определенной матрицей Гессе f ''(х^*), как правило, достаточно хорошо аппроксимируется квадратичной функцией. Поэтому можно надеяться на хороший результат применения этого метода для таких функций.

Пример 3.12. Методом сопряженных градиентов найти точку минимума функции f(x)=4x²₁ + 3x²₂ – 4 x₁x₂ + x₁ из начальной точки x⁰ = (0, 0).

⇐ Предыдущая 28 29 30 31 323334 35 36 37 Следующая ⇒

Дата публикования: 2015-04-07; Прочитано: 628 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!

studopedia.org - Студопедия.Орг - 2014-2026 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.175 с)...