Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Метод Ньютона



Пусть функция f(x) дважды дифференцируема в E n. Тогда для нее можно записать разложение по формуле Тейлора в окрестности точки x k:

f(x) = fk) + < f '(х k), x-x k > + < f ¢¢(х k)(x-x k), x-x k > + o (|| x-x k ||2)

Отсюда видно, что поведение функции f(x) с точностью до величины порядка o (|| x-x k ||2) может быть описано квадратичной функцией

Ф k (x) = < f ¢¢(х k)(x-x k), x-x k > + < f '(х k), x-x k > + fk). (3.68)

Минимизируем функцию Ф k (x) вместо f(x). Найдем ее точку минимума x k +1 из условия Ф¢ k (x) = 0:

Ф¢ k (x) = f ¢¢(х k)(x-x k) + f ¢(х k) = 0. (3.69)

Пусть матрица Гессе f ¢¢(х k) положительно определена при всех xÎ E n и, следовательно, невырождена (det f ¢¢(х k) > 0). Тогда существует обратная матрица [ f ¢¢(х k)]-1. Отметим, что квадратичная функция (3.68) с положительно определенной матрицей f ¢¢(х k) сильно выпукла и уравнение (3.69) определяет единственную точку глобального минимума функции Ф k (x). Умножим слева обе части равенства (3.69) на матрицу [ f ¢¢(х k)]-1 и найдем точку минимума x k +1 квадратичной функции (3.68), аппроксимирующей f(x) в окрестности точки

x=x k:

x k +1 = x k - [ f ¢¢(х k)]-1× f ¢(х k), k = 0, 1, … (3.70)

Итерационный процесс --, начатый из произвольной точки x0Î E n, называется методом Ньютона минимизации функции многих переменных и является обобщением метода Ньютона в одномерном случае (см. разд. 2.3.3).

Очевидно, для квадратичной функции с положительно определенной матрицей A применение метода Ньютона обеспечивает получение точки глобального минимума ровно за один шаг из любой точки x0Î E n.

Для выпуклой функции, отличной от квадратичной, применение этого метода обеспечивает, как правило, быструю сходимость. Дело в том, что на каждом шаге итерационного процесса (3.70) используется информация о поведении функции f(x) в окрестности точки x k, содержащаяся не только в значениях первых, но и вторых ее частных производных. Поэтому при прочих равных условиях следует ожидать более быструю сходимость метода Ньютона по сравнению с градиентными методами.

При выборе достаточно хорошего начального приближения x0Î E n минимизирующая последовательность {x k } для сильно выпуклой дважды дифференцируемой функции f(x) сходится к точке минимума с квадратичной скоростью r(x k, x*, q Î(0, 1). Если же точка x0 выбрана недостаточно близкой к точке х*, то последовательность (3.70) может расходиться (см. разд. 2.3.3).

Отметим, что даже сходящаяся последовательность {x k } метода Ньютона не всегда обеспечивает монотонное убывание f(x), т.е. нера­венство f(x k +1) < f(x k) для некоторых k= 0,1,.. может нарушаться Этот недостаток устранен в обобщенном методе Ньютонa:

x k +1 = x k - a k [f ¢¢(x k)]-1×f¢(x k),

где величина a k > 0 находится на каждом шаге из условия исчерпыва­ющего спуска по направлению р k = -[f ¢¢(x k)]-1×f ¢(x k).

Недостатком метода Ньютона является необходимость вычисле­ния и обращения матрицы Гессе на каждой итерации.

Пример 3.13. Найти точку минимума функции f(x)=4x21 + 3x22 – 4 x1x2 + x1,методом Ньютона из начальной точки х0 = (0,0).

Градиент (x0)=(-1,0), матрица Гессе f "(х0)=А= . Найдем обратную матрицу [f¢¢(х0)]-1 = . С помощью формулы (3.70) получаем x1=x0-a k [f¢¢(х0)]-1× f ¢(x0)=(-3/16, -1/8). Так как f '(x1)=(0,0), то задача решена: х* = х1. Целевая функция квадратична, поэтому решение задачи по­лучено за одну итерацию.





Дата публикования: 2015-04-07; Прочитано: 399 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.009 с)...