Главная Случайная страница Контакты | Мы поможем в написании вашей работы! | ||
|
1. Установить, являются ли выпуклыми следующие множества:
a) U ={(x 1, x 2)ú 2 x 1 + x 2 £ 2, 2 x 1 – x 2 ³ -2, x 2 ³ 0};
b) U ={(x 1, x 2)ú x 2 > x 21};
c) U ={(x 1, x 2)ú x 1 x 2 < 1, x 1 > 0, x 2 > 0};
d) U ={(x 1, x 2)ú x 1 - x 2 £ 2, x 21 + x 22 £ 4};
e) U ={(x 1, x 2, x 3)ú x 3 ³ x 21 + x 22}.
3.3. ОБЩИЕ ПРИНЦИПЫ n -МЕРНОЙ МИНИМИЗАЦИИ
Для численного решения задач безусловной минимизации:
f (x)® min, x Î E n разработано много алгоритмов, использующих итерационные процедуры вида
x k +1 =Ф(x k, x k -1,…, x0), x0 Î E n, (3.25)
позволяющие при определенных условиях построить последовательность {х k } такую, что
где U * — множество точек глобального минимума функции f(х). Последовательность {х}, удовлетворяющая требованию (3.26), называется минимизирующей для функции f(х). Если, кроме того, для случая U*¹ Æ дополнительно выполняется условие
, (3.27)
то говорят, что минимизирующая последовательность сходится к множеству U *. Если множество U * состоит из единственной точки х*, то для сходящейся к U * минимизирующей последовательности .
Замечание. Минимизирующая последовательность может не сходиться к точке минимума. Например, для f(x) =х 2/(1 + х 4), x Î E 1, последовательность xk=k является минимизирующей, но не сходится к единственной точке минимума х* = 0.
Вопрос о существовании точки минимума обычно решается с помощью теоремы Вейерштрасса, которая гласит: если функция f(х) непрерывна в E n и множество U a= {х |f(х) £ a} для некоторого a непусто и ограничено, то f(х) достигает глобального минимума в E n.
Отметим, что если множество U a— выпукло, а функция f (х) строго выпукла, то точка ее минимума единственна (см. теорему 3.5).
Среди итерационных процедур (3.25) можно условно выделить такие, которые гарантируют отыскание решения задачи за конечное число итераций (шагов). Однако их удается построить лишь для некоторых специальных типов задач минимизации. Как правило, приходится иметь дело с бесконечными последовательностями {х k }, поэтому говорить о достижении решения можно лишь в пределе.
Важной характеристикой сходящихся минимизирующих последовательностей является скорость сходимости. Говорят, что последовательность {х k } сходится к точке х* линейно (со скоростью геометрической прогрессии), если существует такое число q Î (0; 1), что выполняется неравенство
r(х k, х*) £ qr(х k-1, х*), т. e. р(х k, х*) £ q k (х0, х*).
Сходимость называют сверхлинейной (т.е. более быстрой, чем определяемая любой геометрической прогрессией), если r(х k, х*) £ qr(х k-1, х*), qk ® +0 при k ® .
Наконец, термин квaдрaтичнaя сходимость используется, если справедлива оценка: r(х k, х*) £ [ c r(х k- 1, х*)]2, c > 0 или r(х k, х*) £ , где q = r(х0, х*).
Для многих алгоритмов скорость сходимости последовательности {х k } из (3.25) характеризуется и другими неравенствами, например r(х k, х*) £ c / ka, при с > 0, a > 0.
Установление факта сходимости последовательности {х k } из (3.25) и оценка скорости сходимости дают существенную информацию об итерационном процессе (3.25).
Конкретный вычислительный алгоритм на основе (3.25), в котором может получаться бесконечная последовательность {х k }, необходимо дополнять условием остановки (критерием окончания счета). На практике часто пользуются следующими условиями:
r(х k+ 1, х k) < e1; (3.28)
|f(x k +1)-f(x k)| < e2; (3.29)
|| f ¢(x k)|| < e3, (3.30)
где e i — заранее заданные параметры точности.
Ниже будут рассмотрены вычислительные алгоритмы простейших процедур (3.25), как правило, основанные на рекуррентных формулах вида
x k +1= x k + a k p k, k = 0, 1, …, (3.31)
где р k — направление поиска точки x k +1 из точки x k, а число a k — величина шага, которая выбирается так, чтобы выполнялось условие
f(x k +1) < f(x k). (3.32)
Эти алгоритмы различаются способом построения вектора р k и выбора шага a k.
Будем говорить, что в итерационном процессе (3.31) производится исчерпывающий спуск, если величина шага a k находится из решения одномерной задачи минимизации
Ф k (a)® min, Ф k (a) = f(x k + a р k). (3.33)
Таким образом, при исчерпывающем спуске на каждом шаге полостью реализуется возможность уменьшить значение целевой функции f(х) при перемещении из точки x k в направлении, коллинеарном вектору р k. Величина шага a k может быть найдена, например, с помощью методов, описанных в гл. 2.
Теорема 3.6. Для дифференцируемой в Еn функции f(x) в итерационном процессе (3.31) с выбором шага ak в соответствии с (3.33) для всех k³ 1 выполняется условие
< f ¢(x k +1), р k > = 0. (3.34)
Запишем необходимое условие минимума функции одной переменной Ф k (a) из (3.33), используя правило дифференцирования сложной функции:
.
Учитывая, что xj k +1= xj k + a р j k получаем условие (3.34).
Дадим геометрическую иллюстрацию соотношения (3.34) пространстве Е2. При перемещении из точки x k вдоль прямой, задаваемой вектором p k в направлении убывания функции, происходит пересечение линий уровня функции f(х) до тех пор, пока либо не будет достигнута стационарная точка f ¢(x k +1) = 0, либо прямая не коснется в точке x k +1 некоторой линии уровня функции f (x). Равенство (3.34) и есть условие касания (рис. 3.2).
Свойство (3.34) позволяет в явном виде найти величину a k для квадратичной функции.
Теорема 3.7. Для квaдрaтичной функции f(х) = 1/2 < Aх,х>+<b,x>+ c величинa a k исчерпывaющего спускa в итерaционном процессе (3.31) будет равна
. (3.35)
Умножив равенство (3.31) слева на матрицу А квадратичной функции f(х) и прибавив к обеим частям вектор b, получим: A xk+1 + b = A xk + b + ak A pk. Учитывая, что градиент квадратичной функции равен f ¢(x) = A x + b, имеем:
f ¢(xk+1) = f ¢(xk)+ ak A pk. Подставляя выражение для f ¢(xk+1) в равенство (3.34), получаем формулу (3.35).
Определение 3.6. Направление вектора рk называется направлением убывания функции f (х) в точке хk, если при всех достаточно малых положительных a выполняется неравенство f (хk +apk) < f (хk).
В итерационном процессе (3.31) используются, как правило, направления убывания. Сформулируем признак направления убывания.
Теорема 3.8. Пусть функция f(x) дифференцируема в точке хk. Если вектор pk удовлетворяет условию
, (3.36)
то направление вектора р является направлением убывания.
Из свойства дифференцируемой функции (3.8) и условия (3.36) следует, что = <f¢(x k), ap k > + o (a) = < 0 при всех достаточно малых a > 0, т.е. вектор р k задает направление убывания функции f (х) в точке х k.
Геометрически условие (3.36) означает, что вектор р k составляет тупой угол с градиентом f¢(x k).
Дата публикования: 2015-04-07; Прочитано: 643 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!