Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Output Summary 10 страница



Выполнение алгоритма начинается с произвольного выбора начального неотри­цательного значения t. Начальная точка Х° выбирается в качестве первого пробного решения. Эта точка должна быть внутренней точкой области допустимых решений, т.е. не должна находиться на ее границе. При заданном значении t оптимальное реше­ние (точка максимума) функции р(Х, t) находится методом наискорейшего подъема.

Точка, представляющая новое решение, всегда будет внутренней, ибо если ре­шение находится близко к границе области, то по крайней мере одна из функций l/g,(X) или -1/Xj примет очень большое отрицательное значение. Поскольку рас­сматривается задача максимизации р(Х, t), то такие решения автоматически ис­ключаются. Основной результат состоит в том, что последовательно получаемые решения всегда будут внутренними точками допустимой области. Следовательно, исходная задача может всегда рассматриваться как задача без ограничений.

Когда получено оптимальное решение, соответствующее заданному значению t, выбирается новое значение t, и процесс вычислений (методом наискорейшего подъ­ема) повторяется. Если t' — текущее значение t, то следующее значение t" необхо­димо выбирать так, чтобы выполнялись неравенства 0 < /* < t'.

Литература 833

Решение задачи методом последовательной безусловной максимизации завер­шается, когда для двух последовательных значений t соответствующие оптималь­ные решения X, полученные в результате максимизации функции р(Х, t), пример­но совпадают. В этом случае дальнейшие вычисления лишь незначительно улучшат полученное решение.

Практическая реализация алгоритма последовательной безусловной максими­зации имеет ряд нюансов, которые здесь не рассматриваются. В частности, сущест­венным фактором является выбор начального значения параметра t, который мо­жет повлиять на скорость сходимости алгоритма. Далее для определения начальной внутренней точки области допустимых решений могут потребоваться специальные алгоритмы. Соответствующие детали можно найти в книге [3].

ЛИТЕРАТУРА

1. Bazaraa М., Sherall Н. and Shetty С. Nonlinear Programming, Theory and Algorithms, 2nd ed.,Wiley, New York, 1993. (Русский перевод первого издания: Базара М., Шетти К. Нелинейное программирование. Теория и алгоритмы. — М.:Мир, 1982.)

2. Beightler С, Phillips D. and Wilde D. Foundations of Optimization, 2nd ed., Pren­tice Hall, Upper Saddle River, N. J., 1979.

3. Fiacco A. and McCormick G. Nonlinear Programming: Sequential Unconstrained Minimization Techniques, Wiley, New York, 1968. (Русский перевод: Фиакко A., Мак-Кормик Г. Нелинейное программирование. Методы последовательной без­условной минимизации. — М.: Мир, 1972.)

4. Rardin D. Optimization in Operations Research, Prentice Hall, Upper Saddle River, N. J., 1998.

Литература, добавленная при переводе

1. Банди Б. Методы оптимизации. Вводный курс. — М.: Радио и связь, 1988.

2. Гилл Ф., Мюррей У., Райт М. Практическая оптимизация. — М.: Мир, 1985.

3. Зангвилл У. И. Нелинейное программирование. — М.: Сов. радио, 1973.

4. Сухарев А. Г., Тимохов А. В., Федоров В. В. Курс методов оптимизации. — М.: Наука, 1986.

5. Химмельблау Д. Прикладное нелинейное программирование. — М.: Мир, 1975.

ПРИЛОЖЕНИЕ А

КРАТКИЙ ОБЗОР ТЕОРИИ МАТРИЦ

А1. ВЕКТОРЫ

А.1.1. Определение вектора

Пусть pv р2, р„ — произвольные действительные числа. Обозначим через Р упорядоченное множество этих чисел: Р = {pv рг,...,р„). В этом случае Р называется 71-мерным вектором (или просто вектором), apt — t-м элементом вектора Р. Напри­мер, Р = (2, 4) — 2-мерный вектор, у которогор, = 2 ир2 = 4.

А.1.2. Сложение и вычитание векторов

Пусть Р = (р12,...,р„) и Q = (grI, q2,qn) — два n-мерных вектора. Тогда элементы вектора R = (ri; r2, г„), равного R = Р ± Q, определяются соотношениями г, =р, ± q,.

В общем случае для любых векторов Р, Q и S, имеющих одинаковую размер­ность, выполняются следующие соотношения.

А.1.3. Умножение вектора на скаляр

Для произвольного вектора Р и скаляра 6 (произвольного действительного чис­ла) произведение вектора Р на скаляр 6 определяет новый вектор Q, задаваемый со­отношением

В общем случае для любых векторов Р и S, имеющих одинаковую размерность, и произвольных скалярных величин в и у выполняются следующие соотношения. 6(Р + S) = 6Р + 6S (свойство дистрибутивности)

P±Q=Q±P

(P + Q) + S = P + (Q + S)

Р + (-Р) = О

(свойство коммутативности) (свойство ассоциативности) (существование нулевого вектора)

Q = eP = (ePl,ep2,...,6р„).

6(уР) = (ву)Р

(свойство ассоциативности)

Приложение А. Краткий обзор теории матриц

А. 1.4. Линейная независимость векторов

Векторы Р,, Р2, Р„ называются линейно независимыми, если равенство

выполняется тогда и только тогда, когда все 6; равны нулю (Qj — произвольные действительные числа). Если указанное равенство выполняется при некоторых 6^0, то векторы Р,, Р2, Р„ называются линейно-зависимыми. Например, векто­ры Р1 = (1,2) и Р2 = (2, 4) линейно зависимы, поскольку существуют ненулевые числа б, = 2 и 92 = -1, при которых выполняется равенство

в.р. + вл-о.

А.2. МАТРИЦЫ

А.2.1. Определение матриц

Матрицей называется прямоугольный массив элементов, структурированный строками и столбцами. В матрице А элемент ац расположен на пересечении i-й строки и у'-го столбца массива. Говорят, что матрица имеет порядок (размерность) тхп, если она состоит из т строк и п столбцов. Например, матрица

имеет размерность 4x3. А.2.2. Типы матриц

1. Квадратная матрица — это матрица, имеющая одинаковое количество строк и столбцов (т.е. т = п).

2. Единичная матрица — квадратная матрица, у которой все диагональные

элементы равны 1, а все недиагональные матрица порядка 3x3 имеет вид

'\ О О

I

нулю. Например, единичная

О 1 О

10 0 1,

3. Вектор-строка — матрица, имеющая одну строку и п столбцов.

4. Вектор-столбец — матрица, имеющая т строк и один столбец.

5. Матрица Аг называется транспонированной к матрице А, если элемент atj матрицы Ат равен элементу ар матрицы А. Например,

(\ 4\

и АГ:

2 5

3 6

1 2 3 4 5 6

А.2. Матрицы

6. Матрица В называется нулевой (В = 0), если все ее элементы равны нулю.

7. Две матрицы А = ||а,у|| и В = ||^|| равны тогда и только тогда, когда они имеют одинаковую размерность и atj = Ъц для всех i и j.

А.2.3. Арифметические операции над матрицами

Для матриц определены только операции сложения (вычитания) и умножения. Операция деления матриц не определена, но в некоторых случаях ее может заме­нить операция обращения матриц (см. раздел А.2.6).

Сложение и вычитание матриц. Сложение (вычитание) двух матриц А = |e,J|

иВ = возможно только тогда, когда они имеют одинаковую размерность. Мат­рица суммы получается путем сложения элементов матриц А и В, т.е.

D=A+B=IKL=K+^L-

Для произвольных матриц А, В и С, имеющих одинаковую размерность, спра­ведливы следующие соотношения.

А ± В = В ± А (свойство коммутативности)

А ± (В ± С) = (А ± В) ± С (свойство ассоциативности)

(А±В)Г = АГ±ВТ

Произведение матриц. Произведение АВ матриц А= ||а,у| и В = ||^|| определено

тогда и только тогда, когда количество столбцов матрицы А равно количеству строк матрицы В. Таким образом, если матрица А имеет размерность тхг, матри­ца В должна иметь размерность г х п, где тип — произвольные положительные целые числа. Пусть D = АВ. Тогда матрица D имеет размерность т х п, и ее элемен­ты dtj для всех i и j определяются формулой

Например, если

А =

1 3

2 4

и В =

5 7 9\

6 8 0

то

D =

7 9

8 0

((1x5 + 3x6) (1x7+3x8) (1x9 + 3x0) (2x5 + 4x6) (2x7 + 4x8) (2x9 + 4xO)J~

_'23 31 9' ~ ч34 46 18)

В общем случае АВ Ф ВА, даже если произведение ВА определено. Произведение матриц обладает следующими свойствами.

ImA = А1„ = А, где Im и 1„ — единичные матрицы,

(АВ)С = А(ВС),

С(А + В) = СА + СВ,

(А+В)С = АС + ВС,

ос(АВ) = (аА)В = А(аВ), а — скаляр.

Приложение А. Краткий обзор теории матриц

Умножение блочных матриц. Пусть матрицы А и В имеют размерности тхг и rx п соответственно. Предположим, что эти матрицы представимы в виде сово­купности подматриц (блоков):

А =

  А12 А„  
  А 22 А23  
     
и В =   в22
  Iе»  
           

причем для всех I и j число столбцов в блоке А,у равно числу строк в блоке В/(. Тогда

А„В,212В22+А,зВ3Л

АхВ =

АцВ,, + А12В2, + А13В3|

Например,

А21В„+А22В2123В3

0)(4) + (2 3)

A21B1J + А22В22 + АИВ32

(\   3) чч  
        =
,2   6, ,8,  

\\ (0 5

orb«.

4 + 2 + 24)

4) (40

+

'30> 44 61

А.2.4. Определитель квадратной матрицы

Для квадратной матрицы

А =

порядка п рассмотрим произведение ее элементов

где каждый столбец и каждая строка матрицы А представлены в точности одним элементом. Определим величину еЛЛ и, равную +1, если множество индексов /',, j2,

jn получено из множества натуральных чисел 1, 2, п четным числом парных перестановок, и равную -1 — в противном случае. Тогда скалярная величина

~^dhk-i. Pj,h--J. ' р

где суммирование ведется по всем л! перестановкам индексов /„)г, jn, называет­ся определителем (детерминантом) матрицы А. Определитель матрицы обычно обозначается как detA или |А|.

  ч «12
А = «21 Я22 «23
  ,Я31 аъг аээ,

Например, если

то |А| = ап22а33 - а23а32) - а1221а33 - а31а23) + а1321а32 - а22а31). Определители обладают следующими свойствами.

1. Если все элементы какого-нибудь столбца или строки матрицы равны нулю, то определитель этой матрицы равен нулю.

2. Определитель транспонированной матрицы равен определителю исходной матрицы, т.е. |АГ| = |А|.

А.2. Матрицы

3. Если матрица В получена из матрицы А путем перестановки двух каких-либо строк (или двух столбцов), тогда |В| = -|А|.

4. Если две строки (или два столбца) в матрице одинаковы, то ее определитель равен нулю.

5. Значение определителя не изменится, если какую-либо строку матрицы (столбец) умножить на скаляр и затем прибавить ее к другой строке (столбцу).

6. Если каждый элемент какой-либо строки (столбца) умножить на скаляр а, то значение определителя также будет умножено на это число а.

7. Если А и В — две квадратные матрицы порядка п, то

|АВ| = |А| |В|.

Определение минора. Минором Mtj элемента atj в определителе n-го порядка |А| называется определитель (n-l)-ro порядка, получаемый после вычеркивания в матрице А i-й строки и /'-го столбца. Например, в определителе матрицы

имеем миноры

      \
  ч,    
А =      
    а32 аээ,
«23 , м 22 = «и
Д33   «31

Присоединенная матрица. Обозначим через Atj = (-1)'+'М,у алгебраическое до­полнение элемента atj квадратной матрицы А. Тогда матрица, присоединенная к матрице А, определяется соотношением

(\\ Ai Аг Аг

adjA = ||A,f =

А,2

Например, если

А = (\ 2 з"

2 3 2 13 3 4,

тоА„ = (-1/(3 х 4 - 2 х 3) = 6, А12 = (-1/(2 х 4 - 3 х 2) = -2, и т.д. Отсюда получаем

adjA =

6 1 -5 -2 -5 4 -3 3 -1

А.2.5. Невырожденная матрица

Рангом матрицы называется порядок наибольшей квадратной подматрицы, оп­ределитель которой отличен от нуля. Квадратная матрица, определитель которой отличен от нуля, называется матрицей полного ранга или невырожденной матри­цей. Например, матрица

Приложение А. Краткий обзор теории матриц

А =

1 2

2 3 4

3 5 7

является вырожденной, поскольку

|А| = 1х(21 - 20) - 2х(14 - 12) + Зх(10 - 9) = 0. Вместе с тем матрица А имеет ранг г =2, так как

(\ 2\

2 3

= -1*0.

А.2.6. Обратная матрица

Если В и С — две квадратные матрицы порядка п, причем такие, что ВС = СВ = I, тогда матрица В называется обратной к матрице С, при этом матрица С также будет обратной к матрице В. Обратные матрицы обозначаются как В-1 и С"1.

Теорема. Если ВС = I и В — невырожденная матрица, тогда С = В"1, причем матрица С определяется единственным образом.

Доказательство. По условию теоремы ВС = I. Тогда, умножая это равенство справа на В"1, получим В"'ВС = В_11, откуда следует, что 1С = В"1 или С = В"1. Теорема доказана.

Для невырожденных матриц справедливы также следующие результаты.

1. Если А и В невырожденные квадратные матрицы одинаковой размерности, то (АВ)"1 = В'А1.

2. Если А — невырожденная матрица, то из равенства АВ = АС вытекает, что В = С.

Обратные матрицы находят применение при решении систем линейных уравне­ний. Рассмотрим систему из п линейных независимых уравнений

' и ai2 ••• хЛ fV

21 «22 аъ, *2 _ ь1

«„2 •■• «,JUJ U/

где xt — неизвестные, а, и bt — заданные константы. Эта система в матричной фор­ме запишется

АХ = Ь.

Поскольку уравнения системы линейно независимы, матрица А будет невырож­денной, и, следовательно, будет существовать обратная к ней матрица. Таким обра­зом, имеем

А 'АХ = A 'b, откуда получаем решение системы: X = А_1Ь.

А.2. Матрицы

А.2.7. Методы вычисления обратных матриц

Метод присоединенной матрицы. Для невырожденной матрицы А порядка п справедлива формула

A"1=AadjA = rL; А А

Аг

Л

Например, для матрицы

А =

(\ 2 3

имеем adjA =

f 6 2 •3

-5 3 и |А| = -7. Поэтому

А"'=-

-7

6 -2 -3

-5^ 4

' 1 1 2 7 3 7

Я

1_

Метод последовательных исключений (метод Гаусса-Жордана). Рассмотрим блочную матрицу (А 11), где А — невырожденная матрица. Умножая слева эту матрицу на матрицу А1, получим

(А""1 А | A"'I) = (I | А"1).

Таким образом, при последовательном преобразовании строк исходной матри­цы, обеспечивающем преобразование матрицы А в I, одновременно матрица I пре­образуется в матрицу А"1.

Рассмотрим систему линейных уравнений

(\ 2 3^ 2 3 2 Ъ 3 4,

Вектор решений X и матрицу, обратную к матрице данной системы, можно по­лучить из соотношения

А"'(А 111 b) = (I | А"11 A~'b).

Реализация метода последовательных исключений приводит к следующей после­довательности действий. Исходная матрица имеет вид

V   f3>  
х1 =    
       
            3N
             
          \
                 

Приложение А. Краткий обзор теории матриц

Итерация 1

Итерация 2

Итерация 3

f\ О О

<\ о

О 1

о о

-5 4 7

-2 -3

-3 2 3

О О

о о

О 1 о

О 0 1

7 2 7 3 7

О

2 -1 -3

7 5 7 3 7

3>| -2 -4

Таким образом, получили решение системы х, = 3/7, х2 = 6/7 и х3 = 2/7. Обрат­ная матрица А"' приведена справа от единичной матрицы и совпадает с обратной матрицей, полученной методом присоединенной матрицы.

Мультипликативное представление обратной матрицы. Предположим, что две невырожденные матрицы в и вслед различаются только одним вектор-столбцом. Пусть также дана обратная матрица в1. Имея матрицу в-1, можно вычислить мат­рицу BjCJJ с помощью формулы

в1 =ев"'.

след

Матрица е находится следующим образом. Обозначим через р. вектор-столбец матрицы в, который в матрице вслед заменен на вектор-столбец рг. Тогда матрицу е можно определить как m-мерную единичную матрицу, у которой r-й столбец заме­нен следующим столбцом.

^-(в-'р,.),

-(в-'р,).

(в"рд

+1 <— г-и элемент

-(в~'р,),„

Здесь предполагается, что (в"'р)г*0, в противном случае обратной матрицы В~л'сд не существует.

Докажем справедливость формулы в^'сд = ев-1. Обозначим через F лг-мерную

единичную матрицу, у которой r-й столбец заменен столбцом в_1р;, т.е.

F-(e1,...,e_1,B-,P|, егп,...,ет).

Поскольку матрица вмед отличается от матрицы в только r-м столбцом, который в матрице вс1ед совпадает с вектором р;, то легко проверить равенство

в„

BF.

А.2. Матрицы

Отсюда получаем

*С =(BF)'=F,B1.

Теперь осталось положить Е = F~.

Мультипликативная форма используется для вычисления матрицы, обратной к любой невырожденной матрице В. Вычисления начинаются с матрицы В0 = I = В„'. Далее строится матрица В, как единичная матрица, у которой первый столбец совпадает с первым столбцом матрицы В. Тогда

В~' =£,80' =Е,1 = Е,.

Далее подобным образом строится матрица В2 и вычисляется В;'. На i-м шаге,

если на основе единичной матрицы путем замены ее первых i столбцов столбцами матрицы В построена матрица В,, то

В,1 = EjB(_!j ==EiEi_1B(^T =... — Е(Е^Г..Е,.

Это означает, что для исходной матрицы В обратную к ней можно вычислить по формуле В;' =Е,„Е,„-,-Е1

Следующий пример иллюстрирует применение мультипликативного представ­ления обратной матрицы. Пусть дана следующая матрица, для которой надо вы­числить обратную.

r2 1 ОЛ

В = 0 2 0 4 0 1

Шаг О

вп=в;' =

(\ о ол 0 1 о 0 0 I

Шаг!

В, =

(2 0 0^ 0 1 о 4 0 1,

BP =Р

Е, =

1 >* +-0 0 2

1 0 0 1 в'

(1    
     
     
     
,-2   I

Шаг 2

В2 =

{г 1 о) о 1 о

v

4 0 1 в, в-'р.

о о

(I

0 1 о -2 0 1 2

2 2

-2

V

Приложение А. Краткий обзор теории матриц

е, =

2 О

_1 2

+ 1/2 О [О -(-1)12 1

\ -I о'

О I О 2

О 1 1

в = в;' =е,в,' =

1 — о

о I О

О 1 1

о о

О 1 о -2 О 1

)

2 О -2

— О

О 1

Метод блочных матриц. Пусть две невырожденные матрицы А и В представимы в следующем блочном виде, причем подматрица Ап невырожденная.

А„     Гв„ в,:
(рхр) (Р*а) и в = (рхр) (pxq)
А31 А 22 В2, В22
(ахр) (qxq) ^   y(qxp) (qxq)

А =

Пусть В будет матрицей, обратной к матрице А. Тогда из равенства АВ = 1л сле­дует, что

AnBu+A12B21=I,, А„В12 + А12В22 = 0. Аналогично из равенства ВА = 1п получаем

В21Ап22А21=0,

В212 + В22А22 = 1?.

Так как подматрица А„ невырожденная, то |АИ| * О, и существует обратная мат­рица А,,1. Тогда из приведенных уравнений получаем

В„- A"' +(A„'A12)D-1(A21A„I), B12 = -(A-'AI2)D-1, B.^-D-'CA^A-'),

B!2 = D', гдеБ = A22-A2,(A-'A12).

Для иллюстрации применения этих формул разобьем матрицу

на блоки Ап = (1), А12 = (2, 3), А21 =

  2 ЪЛ
  3 2
  3 4J
Чз

Здесь А",' = 1 и

D = 3 2^ 3 4 (0(2, 3) = -1 -4Ч

-3 -5,

А.З. Квадратичные формы

D'=--

Г-5 4) 3 -1

(5 _4)

7 7

3 1_

1 1

Далее вычисляем

~i,в,2=В1,В2,:

Г2>   ' 5 _4Ч
7 3 и В22 =   7 1
,7,   . 7 7,

Теперь нетрудно получить матрицу В = А"1.

А.З. КВАДРАТИЧНЫЕ ФОРМЫ

Пусть X = (xv х2.....хп) и

Тогда функция

2(Х) = ХгАХ = ££асЛ

называется квадратичной формой. Всегда можно считать, что матрица А симмет­рическая. В самом деле, значение квадратичной формы не изменится, если каждый коэффициент из пары ац и ajt (i Ф j) заменить на (ati + а)/2. В дальнейшем свойство симметричности матрицы А будет предполагаться. Для примера приведем квадратичную форму

  \ 0 Г V
<2(Х) = и„х,,;Сз) 2 7    
  ч3 0 2,  

которая совпадает с формой

  'l 1 2^ (х \
  1 7   X,
  ,2 3 2, \хъ)

Отметим, что во второй квадратичной форме матрица симметрическая. Различают следующие типы квадратичных форм.

1. Квадратичная форма называется положительно определенной, если Q(X) > О для всех X * О.

2. Квадратичная форма называется положительно полуопределенной, если Q(X) > 0 для всех X и существует такой вектор X * О, что Q(X) = 0.

3. Квадратичная форма Q(X) называется отрицательно определенной, если квадратичная форма -Q(X) является положительно определенной.

Приложение А. Краткий обзор теории матриц

4. Квадратичная форма Q(X) называется отрицательно полуопределенной, ес­ли квадратичная форма -Q(X) является положительно полуопределенной.

5. Во всех остальных случаях квадратичная форма называется неопределенной.

Можно доказать, что необходимыми и достаточными условиями того, что квад­ратичная форма будет принадлежать одному из перечисленных выше типов, явля­ются следующие утверждения.

1. Квадратичная форма Q(X) будет положительно определенной (полуопределенной), если значения всех угловых миноров определителя |А| положительны (неотрицательны).[5] В этом случае матрица А называется по­ложительно определенной (полуопределенной). [6]

2. Квадратичная форма Q(X) является отрицательно определенной, если значения fc-x угловых миноров определителя |А| отличны от нуля и имеют знак (-1)*, k = 1, 2,п. В этом случае матрица А называется отрицательно определенной.

3. Квадратичная форма Q(X) является отрицательно полуопределенной, если значения fc-x угловых миноров определителя |А| равны нулю либо имеют знак (-1)*, ft-1,2,..., в.

А.4. ВЫПУКЛЫЕ И ВОГНУТЫЕ ФУНКЦИИ

Функция /(X) называется строго выпуклой, если для произвольных двух раз­личных точек X, и Х2 выполняется неравенство

«АХ, + (1 - Х)Х2) < X ДХ,) + (1 - X)f(X2),

где О <Х< 1. Функция /(X) называется строго вогнутой, если функция -/(X) — строго выпукла.

Специальным случаем выпуклой (вогнутой) функции является квадратич­ная форма[7]

/(X) = СХ + ХГАХ,

где С — вектор констант, а А — симметрическая матрица. Можно показать, что функция /(X) будет строго выпуклой, если матрица А положительно определенная, и строго вогнутой, если А — отрицательно определенная матрица.

Литература 847

ЛИТЕРАТУРА

1. Hadley G. Matrix Algebra, Addison-Wesley, Reading, Mass., 1961.

2. HohnF. Elementary Matrix Algebra, 2nded., Macmillan, New York, 1964.

3. Press W., Flannery В., Teukolsky A. and Vettering W. Numerical Recipes: The Art of Scientific Computing, Cambridge University Press, Cambridge, England, 1986.

Литература, добавленная при переводе

1. Ефимов Н. В. Квадратичные формы и матрицы. — М.: Наука, 1967.

2. Ланкастер П. Теория матриц. — М. Наука, 1978.





Дата публикования: 2014-11-18; Прочитано: 358 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.048 с)...