Главная Случайная страница Контакты | Мы поможем в написании вашей работы! | ||
|
Пусть функция f(x) дважды дифференцируема в E n. Тогда для нее можно записать разложение по формуле Тейлора в окрестности точки x k:
f(x) = f (х k) + < f '(х k), x-x k > + < f ¢¢(х k)(x-x k), x-x k > + o (|| x-x k ||2)
Отсюда видно, что поведение функции f(x) с точностью до величины порядка o (|| x-x k ||2) может быть описано квадратичной функцией
Ф k (x) = < f ¢¢(х k)(x-x k), x-x k > + < f '(х k), x-x k > + f (х k). (3.68)
Минимизируем функцию Ф k (x) вместо f(x). Найдем ее точку минимума x k +1 из условия Ф¢ k (x) = 0:
Ф¢ k (x) = f ¢¢(х k)(x-x k) + f ¢(х k) = 0. (3.69)
Пусть матрица Гессе f ¢¢(х k) положительно определена при всех xÎ E n и, следовательно, невырождена (det f ¢¢(х k) > 0). Тогда существует обратная матрица [ f ¢¢(х k)]-1. Отметим, что квадратичная функция (3.68) с положительно определенной матрицей f ¢¢(х k) сильно выпукла и уравнение (3.69) определяет единственную точку глобального минимума функции Ф k (x). Умножим слева обе части равенства (3.69) на матрицу [ f ¢¢(х k)]-1 и найдем точку минимума x k +1 квадратичной функции (3.68), аппроксимирующей f(x) в окрестности точки
x=x k:
x k +1 = x k - [ f ¢¢(х k)]-1× f ¢(х k), k = 0, 1, … (3.70)
Итерационный процесс --, начатый из произвольной точки x0Î E n, называется методом Ньютона минимизации функции многих переменных и является обобщением метода Ньютона в одномерном случае (см. разд. 2.3.3).
Очевидно, для квадратичной функции с положительно определенной матрицей A применение метода Ньютона обеспечивает получение точки глобального минимума ровно за один шаг из любой точки x0Î E n.
Для выпуклой функции, отличной от квадратичной, применение этого метода обеспечивает, как правило, быструю сходимость. Дело в том, что на каждом шаге итерационного процесса (3.70) используется информация о поведении функции f(x) в окрестности точки x k, содержащаяся не только в значениях первых, но и вторых ее частных производных. Поэтому при прочих равных условиях следует ожидать более быструю сходимость метода Ньютона по сравнению с градиентными методами.
При выборе достаточно хорошего начального приближения x0Î E n минимизирующая последовательность {x k } для сильно выпуклой дважды дифференцируемой функции f(x) сходится к точке минимума с квадратичной скоростью r(x k, x*)£ , q Î(0, 1). Если же точка x0 выбрана недостаточно близкой к точке х*, то последовательность (3.70) может расходиться (см. разд. 2.3.3).
Отметим, что даже сходящаяся последовательность {x k } метода Ньютона не всегда обеспечивает монотонное убывание f(x), т.е. неравенство f(x k +1) < f(x k) для некоторых k= 0,1,.. может нарушаться Этот недостаток устранен в обобщенном методе Ньютонa:
x k +1 = x k - a k [f ¢¢(x k)]-1×f¢(x k),
где величина a k > 0 находится на каждом шаге из условия исчерпывающего спуска по направлению р k = -[f ¢¢(x k)]-1×f ¢(x k).
Недостатком метода Ньютона является необходимость вычисления и обращения матрицы Гессе на каждой итерации.
Пример 3.13. Найти точку минимума функции f(x)=4x21 + 3x22 – 4 x1x2 + x1,методом Ньютона из начальной точки х0 = (0,0).
Градиент f¢ (x0)=(-1,0), матрица Гессе f "(х0)=А= . Найдем обратную матрицу [f¢¢(х0)]-1 = . С помощью формулы (3.70) получаем x1=x0-a k [f¢¢(х0)]-1× f ¢(x0)=(-3/16, -1/8). Так как f '(x1)=(0,0), то задача решена: х* = х1. Целевая функция квадратична, поэтому решение задачи получено за одну итерацию.
Дата публикования: 2015-04-07; Прочитано: 399 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!