Главная \| Случайная страница \| Контакты \| Мы поможем в написании вашей работы!

Снижение размерности с помощью множителей Лагранжа

⇐ Предыдущая 2 3 4 5 6 7 8 91011 Следующая ⇒

Покажем на примере задачи 1, каким образом введение множителей Лагранжа позволяет заменить исходную задачу рядом задач с меньшей размерностью вектора состояния.

В задаче 1 состояние описывалось двумя параметрами, что обусловливалось наличием двух ограничений. Для уменьшения размерности на 1 достаточно из модели (9.40)-(9.43) убрать одно из ограничений, что можно сделать, если удаляемое ограничение включить в критерий задачи с неопределенным множителем Лагранжа l. Тогда модель измененной задачи примет вид:

(9.52)

(9.53)

(9.54)

Как будет доказано ниже, задача (9.52)-(9.54) при определенных условиях эквивалентна исходной задаче (9.40)-(9.43). Так как ограничения (9.53), (9.54) не связывают между собой переменные y_j, то есть они стали независимыми, то справедлива следующая цепочка равенств:

где

. (9.55)

Функции h_j (x_j) имеют смысл, если максимум в (9.55) достигается при конечных значениях y_j, что всегда будет, когда

. (9.56)

Это условие ограничивает применение данного способа, но в рассматриваемой задаче оно, очевидно, выполняется, так как при неограниченном возрастании ресурса y рост прибыли будет замедляться.

Как видно из (9.55), вычисление функции h_j (x_j) при фиксированном значении заключается в нахождении максимума функции одной переменной для всех возможных значений x_j, что не вызывает особых затруднений (для дифференцируемых R_j (x_j, y_j) максимум можно найти аналитически). При известных h_j (x_j), j =1, N задача (9.52)-(9.54) сводится к следующей:

(9.57)

(9.58)

(9.59)

Получили уже знакомую нам задачу распределения одного ресурса. Для решения ее методом ДП введем последовательность функций

где V - параметр состояния, значения которого не превосходят X. Для них справедливо рекуррентное соотношение:

f_k (V) = max[ h_k (x_k)+ f_k _-1(V - x_k)], (9.60)

в котором f ₁(V)= h ₁(V), = V.

Вычисления по формуле (9.60) проводятся, как обычно, от f ₁ к f_N, затем в обратном порядке - безусловная оптимизация, начиная с V = X, которая дает значения . По последним из функций h_j (x_j) находятся значения . Теперь следует вспомнить об условии (9.42), которое не вошло в измененную задачу. Если å = Y, то найденное решение , является оптимальным решением задачи (9.40)-(9.43). В противном случае придется продолжить расчеты.

Нетрудно увидеть, что оптимальное решение измененной задачи зависит от принятого значения множителя . Поэтому при невыполнении условия (9.42) нужно изменить значение и повторить весь расчет, начиная с вычисления функций h_j (x_j). В данной задаче при изменении можно воспользоваться очевидным свойством: с увеличением будет монотонно убывать å и наоборот. В более сложных ситуациях можно воспользоваться одним из методов одномерного поиска нелинейного программирования. Таким образом, равенство (9.42) может быть выполнено с любой заданной точностью.

Чтобы нагляднее представить весь расчет с использованием множителей Лагранжа, приведем его алгоритм в виде блок-схемы (рис.9.11). Как видно из алгоритма, функции f_k (V) и h_j (x_j), участвующие в расчете, зависят от одного параметра состояния, и, следовательно, поставленная цель достигнута.

Рис.9.11

Теперь покажем эквивалентность задач (9.40)-(9.43) и (9.52)-(9.54), понимая под этим совпадение решений. Следуя Беллману, доказательство проведем от противного. Имея оптимальное решение измененной задачи , , предположим, что оптимальное решение исходной задачи иное, а именно, , . Тогда для критерия исходной задачи должно выполняться неравенство

. (9.61)

Так как е = Y по условию исходной задачи, а е = Y по алгоритму решения измененной задачи, то е =е . Вычитание одной и той же величины, умноженной на , из левой и правой частей выражения (9.61) не меняет знак неравенства:

. (9.62)

Но здесь и слева, и справа имеем выражение критерия измененной задачи, по которому оптимальным является решение , . Таким образом, неравенство (9.62), вытекающее из допущения существования разных решений, противоречит исходной посылке и потому такое допущение неверно, что доказывает совпадение решений исходной и измененной (эквивалентной) задач.

Для задачи 2 применение метода множителей Лагранжа реализуется проще. Модель измененной задачи можно записать по аналогии с вышеприведенным случаем в виде:

Для функций последовательности, определенных как

справедливо следующее рекуррентное соотношение

(9.63)

Как видно, здесь нет дополнительных функций h_j и вычисления можно проводить сразу по рекуррентной формуле (9.63), задавшись предварительно значением . После нахождения решения проверяется условие (9.48) - е )Ј B и, если оно не выполняется, то необходимо изменить значение и повторить расчет. Таким способом достигается эквивалентность исходной и измененной задач и получение оптимального решения с помощью последовательности функций, зависящих только от одного параметра состояния.

В общем случае, когда вектор состояния исходной задачи имеет размерность m, можно использовать q множителей Лагранжа (q < m), что позволит снизить размерность вектора состояния измененной задачи до m-q. При этом выполнение исключенных из условий исходной задачи q ограничений может быть обеспечено управлением таким же числом множителей Лагранжа. Однако увеличение размерности вектора состояния и соответственно числа множителей Лагранжа ведет к значительно более быстрому росту трудоемкости решения измененной задачи. Поэтому проблема "проклятия размерности" остается, ограничивая применение метода ДП задачами с небольшим числом параметров состояния.

Несмотря на указанный недостаток метод динамического программирования находит широкое применение для решения многих задач исследования операций, в том числе задач распределения, замены, кратчайшего пути, упорядочения и др.

⇐ Предыдущая 2 3 4 5 6 7 8 91011 Следующая ⇒

Дата публикования: 2015-01-23; Прочитано: 244 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!

studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.009 с)...