Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Задачи динамического программирования



Условность задач линейного программирования применительно к управлению состоит в оптимизации только для какой–то стационарной ситуации. В действительности задачи управления динамичны, поэтому точнее определять оптимум не для одного момента времени, а последовательно на протяжении длительного периода.

Например, недостаточно определить оптимальный план производства на месяц, вполне вероятно, что в последующие месяцы производство может быть неоптимальным, так как возможности дальнейшего развития не учитывались. Составление ежемесячных оптимальных планов более эффективно с учетом предшествующих периодов, так как годовой оптимальный план будет результатом оптимальных решений, принятых для каждого месяца; причем план каждого последующего месяца должен учитывать решения, принятые в предыдущих.

Динамическое программирование дает возможность принять ряд последовательных решений (многошаговый процесс), обеспечивающих оптимальность развития процесса в целом.

Предположим, что есть некоторые ресурсы x, которые распределяются на два предприятия: на первое y, на второе xy. Пусть в течение определенного периода (например, года) количество y приносит доход (прибыль) g (y), а количество xy доход h (xy). Общий доход от вложенных ресурсов составит

R 1(x, y) = g (y) + h (xy).

Обозначим через F 1(x) наибольший доход, который могут принести ресурсы x при оптимальном распределении их между предприятиями.

Тогда

Теперь рассмотрим двухшаговый процесс, состоящий из двух периодов (этапов). Так как доход получается вследствие выпуска и реализации продукции, что связано с определенными издержками (затратами ресурсов), то к началу второго периода первоначальная сумма y уменьшится до величины a . y (0£ a £1), а сумма xy до величины b .(xy) (0£ b £1). Наибольший доход, который можно получить от суммарного остатка a . y + b .(xy) в течение второго этапа, равен F 1[ a . y + b .(xy)].

Обозначим через F 2(x) наибольший доход, который может быть получен от суммы x за оба периода. Этот доход равен максимальному значению суммы доходов первого и второго периодов при условии, что начальные для каждого периода ресурсы распределялись наилучшим образом. Иначе

Равенство (2) устанавливает связь между функциями F 1(x) и F 2(x).

Рассматривая n –шаговый процесс, приходим к основному функциональному уравнению Беллмана, устанавливающему связь между Fn (x) и Fn –1(x):

Определив по равенству (1) F 1(x), пользуясь (2), вычисляем F 2(x), затем F 3(x) и т.д. Значение Fn (x) является доходом, полученным за n шагов.

Основное функциональное уравнение Беллмана является математической формулировкой принципа оптимального динамического программирования.

n Оптимальное поведение (управление) обладает свойством – каковы бы ни были первоначальное состояние и решение в начальный момент, последующие решения должны составлять оптимальное поведение относительно состояния, полученного в результате предыдущего решения.

Это означает, как следует из уравнения Беллмана, что максимальный доход от n –шагового процесса равен сумме доходов от 1-го и (n –1) последующих шагов при условии наилучшего распределения в последующих шагах оставшихся после 1-го шага ресурсов.





Дата публикования: 2015-01-10; Прочитано: 366 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.006 с)...