Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Постановка задачи. Представим себе некоторую операцию Q, распадающуюся на ряд последовательных шагов, - например, деятельность предприятия в течении нескольких хозяйственных



Представим себе некоторую операцию Q, распадающуюся на ряд последовательных шагов, - например, деятельность предприятия в течении нескольких хозяйственных лет; поэтапное планирование инвестиций, управление производственными мощностями в течении длительного срока и т.п. Некоторые операции расчленяются на шаги естественно, другие же требуют искусственного членения. Например, процесс наведения ракеты на цель модно условно разбить на этапы, каждый из которых занимает какое-то время Dt.

Рассмотрим управляемый процесс. Предположим, что управление можно разбить на n шагов, т.е. решение принимается последовательно на каждом шаге, а управление, переводящее систему из начального состояния в конечное, представляет собой совокупность n пошаговых управлений. В результате управления система переходит из состояния x0 в xn.

Обозначим через ukЄUk управление на k-ом шаге (k=1,2,…,n). Uk – множество допустимых управлений на k-ом шаге.

Пусть u=(u1,u2,…,un)- управление, переводящее систему из состояния x0 в состояние xn. Обозначим через xk состояние системы после k-го шага управления. Получаем последовательность состояний x0, x1, …, xk-1, xk, xk+1, …, xn (рис.5).


u1 u2 uk-1 uk uk+1 uk+2 un

… …

рис.5.

Показатель эффективности рассматриваемой управляемой операции зависит от начального состояния и управления: Z = F(x0,u) (1)

uÎU – множество возможных управлений.

Сделаем несколько предположений:

1. Состояние XK системы на k-ом шаге зависит только от предшествующего состояния Хk-1 и управления на k-ом шаге uk и управлений (свойство отсутствия последействия): Xk = jk(xk-1, uk), k = 1, n – уравнения состояний (20), jk – оператор перехода.

2. Целевая функция (1) является аддитивной от показателя эффективности каждого шага, т.е. выигрыш за всю операцию складывается из выигрышей на отдельных шагах.

Z = F(x0, u) = fk(xk-1, uk) (3)

fk(xk-1, uk) = Zk – показатель эффективности шага k (4).

Общая постановка задачи ДП. Определить такое допустимое управление uÎU, переводящее систему из состояния x0 в состояние хn, при котором целевая функция (3) принимает максимальное значение.

Любую многошаговую задачу можно решать по разному: либо искать сразу все элементы решения на всех n шагах, либо же строить оптимальное управление шаг за шагом, на каждом этапе расчета оптимизируя лишь один шаг. Обычно второй способ оказывается проще, чем первый, особенно при большом числе шагов.

Пусть, например, планируется работа группы промышленных предприятий, из которых часть занята выпуском предметов потребления, а остальные производят для них машины. Задача – получить за n лет максимальный объем выпуска предметов потребления. Допустим планируются капиталовложения на первый год. Исходя из узких интересов этого шага, мы должны были бы все наличные средства вложить в производство предметов потребления. Это решение недальновидное. Имея в виду будущее, надо выделить какую-то часть средств и на производство машин. От этого объем продукции за первый год, конечно, снизится, зато будут созданы условия для его увеличения в последующие годы.

Управление на i-ом шаге выбирается не так чтобы выигрыш именно на данном шаге был максимален, а так, чтобы была максимальна сумма выигрышей на всех оставшихся до конца шагах плюс данный.

Однако из этого правила есть исключение. Среди всех шагов есть один, который может планироваться попросту, без оглядки на будущее. Какой это шаг? Очевидно последний! Этот шаг, единственный из всех, можно планировать так, чтобы он сам, как таковой, принес наибольшую выгоду.

Поэтому процесс ДП обычно разворачивается от конца к началу: прежде всего планируется последний, n-ый шаг.

Планируя последний шаг, нужно сделать разные предположения о том, чем кончился предпоследний, (n-1)-ый шаг, и для каждого из этих предположений найти условное оптимальное управление на n-м шаге. «Условное» потому, что оно выбирается исходя из условия, что предпоследний шаг кончился определенным образом.

Далее, «пятясь» назад, оптимизируем управление на (n-2)-м шаге и т.д., пока не дойдём до первого.

Предположим, что все условия оптимальные управления и условные оптимальные выигрыши за весь «хвост» процесса нам известны. Это значит: мы знаем, что надо делать, как управлять на данном шаге и что мы за это получим на «хвосте», в каком бы состоянии ни был процесс к началу шага. Теперь мы можем построить уже не условно оптимальное, а просто оптимальное управление U* и найти не условно оптимальный, а просто оптимальный выигрыш Z*.

Таким образом, в процессе оптимизации управления методом ДП многошаговый процесс «проходится» дважды: первый раз – от конца к началу, в результате чего находится условные оптимальные управления и условные оптимальные выигрыши за оставшийся «хвост» процесса; второй раз - от начала к концу, когда нам остаётся только «прочитать» уже готовое управления U*, состоящее из оптимальных шаговых управлений u1*, u2*, …, un*.

Предположим, что задача

Z = F(x0, u) = fk(xk-1, uk) max

xk=jk(xk-1, uk), k=1,5

ukÎUk, k=1, n

xkÎXk, k=0, n имеет решение.

Тогда справедлив принцип оптимальности Беллмана: оптимальное управление

u* = (u1*, u2*, …, un*) обладает тем свойством, что каковы бы ни были состояния системы

x*k-1 на любом шаге и управление uk*, принимаемое в этом состоянии; последующие управляющие решения u*k+1, …, u*n должны составлять оптимальную стратегию относительно состояния х*k, полученного в результате управляющего решения uk*, т.е. состояния, к которому придёт система в конце данного шага.

На основании принципа оптимальности Беллмана можно получить основное уравнение ДП, или уравнение Беллмана.

Рассмотрим n-ый шаг: xn-1 – состояние системы к началу n-ого шага, xn – конечное состояние, un – управление на шаге n, а fn(xn-1, un) – целевая функция шага n.

Согласно принципу оптимальности, un нужно выбирать так, чтобы для любых состояний xn-1 получить максимум целевой функции на этом шаге.

Обозначим через Zn*(xn-1) максимум показателя эффективности шага n при условии, что к началу последнего шага система была в произвольном состоянии xn-1, а на последнем шаге управление было оптимальным.

Zn*(xn-1) = max fn(xn-1, un) (5)

 
 


Решив задачу (5), найдём для всех возможных состояний xn-1 две функции: Zn*(xn-1) и Un*(xn-1) – условное оптимальное управление.

Рассмотрим двухшаговую задачу: присоединим к n-му шагу (n-1)-ый (рис.6.)

Для любых состояний xn-2, произвольных управлений Un-1 и оптимального управления на шаге n значение целевой функции на двух последних шагах равно fn-1(xn-2, Un-1) + Zn*(xn-1) (6).

Согласно принципу оптимальности необходимо искать максимум (6) по всем допустимым un-1.

Z*n-1(xn-2) = max { fn-1(xn-2, un-1) + Zn*(xn-1) }, k = n-1, 1 (7)

В результате максимизации получаем две функции: u*n-1(xn-2) и Z*n-1(xn-2)

Далее рассматривается трёхшаговая задача: к двум последним добавляется (n-2)-ой и т.д.

Так для произвольного k получим:

Zk*(xk-1) = max { fk(xk-1, uk) + Z*k+1(j(xk-1, uk)}, k = n-1, 1

Уравнение (8) называются уравнениями Беллмана, позволяющими найти предыдущие значения функции, зная последующие. Процесс решения уравнений (5) и (8) называется условной оптимизацией.

В результате условной оптимизации получаем две последовательности:

Zn*(xn-1), Z*n-1(xn-2), …, Z1*(x0) и un*(xn-1), u*n-1(xn-2), …, u1*(x0)

Используя эти последовательности, можно найти решение задачи ДП при данных n и x0:

Zmax = Z1*(x0)

5.2. Элементы теории управления запасами.

В развитых странах управление товарами запасами базируется на использовании мощных информационных технологий, позволяющих практически ежедневно отслеживать их состояние и динамику, автоматически осуществлять размещение заказов через компьютерную сеть и пополнение запасов до оптимального уровня. При этом, полнота и достоверность информационной базы обеспечивается за счет автоматизации учета и использования международной системы кодирования товаров.

Общий принцип, на котором основаны все системы управления запасами, взаимосвязь входных и выходных параметров, представлены на рис.7.


рис.7.

Одним из распространенных видов систем контроля уровня запасов является система, основанная на применении метода красной точки. Суть метода состоит в фиксации предельной границы, ниже которой уровень запасов не должен опускаться. При достижении этой границы происходит автоматическое размещение нового заказа.

Второй тип системы контроля основан на использовании двухсекторного метода, в соответствии с которым запасы для хранения размещаются в двух секторах – рабочем и резервном. Когда запасы рабочего сектора истощены, включаются два процесса – пополнение рабочего сектора за счет резервного, и размещается новый заказ.

Широкое распространение в развитых странах получил классификационный подход к управлению запасами (АВС System). Его идея заключается в использовании классификации запасов и выделении трех групп – А, В, С, в зависимости от степени влияния данного вида запасов на рост товарооборота предприятия. К группе А относят запасы, реализация которых вносит наибольший вклад в объем товарооборота в денежном выражении.

Группы запасов Доля в объеме товарооборота в денежном выражении Доля в объеме запасов в натуральном выражении Следует ли использовать сложные количественные методы управления
А 70% 10% Да  
В 20% 20% В некоторых случаях
С 10% 70% Нет

Относительно новым подходом к управлению запасами, является принцип управления Just-In-Time (JIT). Этот подход впервые был использован японскими корпорациями. Основная идея заключается в том, что запасы практически не создаются, а процесс доставки товаров поставщиками жестко согласован с технологическим процессом на предприятии. В настоящее время такой подход эффективно используется компаниями Toyota, General Motors и многими другими. Заказы размещаются с интервалом 3-4 часа и немедленно реализуются поставщикам. Эта система позволяет получить экономический эффект порядка миллиона долларов за счет сведения издержек хранения к нулю.

Наиболее распространенной является базовая модель EOQ (Economic Ordering Quantity), то есть, модель оптимального уровня запасов, заключающаяся в определении такого уровня запасов, поддержание которого минимизирует совокупные издержки управления ими. При этом, совокупные издержки разбиваются на три однородные группы: издержки хранения, издержки, связанные с формированием запасов и издержки, которые возникают вследствие недостатка товарных запасов.

В модели оптимального уровня запасов EOQ используются следующие обозначения:

S – объем реализации товаров в год;

N – количество заказов в год;

Q – размер одного заказа;

T – период реализации партии товаров;

A – средний размер имеющихся запасов в течении года;

P – цена закупки единицы товара у поставщиков;

C – средние издержки хранения (в % от стоимости товара);

T1 – совокупные издержки хранения;

F – издержки размещения одного заказа и его транспортировка;

T2 – совокупные издержки размещения и транспортировки запасов;

T – совокупные издержки управления запасами.

Размер одного заказа определяется прогнозируемым объемом реализации товаров в год и количеством заказов:

Средний размер имеющихся запасов в течении периода t, где, составляет

 
 


Тогда, совокупные издержки хранения могут быть рассчитаны следующим образом:

 
 


, а совокупные издержки размещения и транспортировки:

       
 
   
 


В этом случае совокупные издержки управления запасами T = T1+T2 =

Оптимальный уровень запасов Q*, минимизирующий совокупные издержки, является решением уравнения:

Теперь становится возможным определения оптимального количества заказов в год N* и оптимальное количество дней между заказами t*:

Следующим важным вопросом является вычисление точки заказа Q0, то есть, такого уровня запасов, после достижения которого следует размещать заказ.

Q0=tn·q, где q – объем реализации товаров в день (коэффициент спроса).

5.3. Теория массового обслуживания.

1. Часто приходится сталкиваться с системами, предназначенными для многоразового использования при решении схожих задач. возникающие при этом процессы получили названия процессов обслуживания, а системы – систем массового обслуживания (СМО).

· Случайный процесс, протекающий в системе, называется Марковским, если для любого момент времени to вероятностные характеристики процесса в будущем зависит только от его состояния в данный момент to и не зависит от того, когда и как система пришла в это состояние.

· Потоком событий называется последовательность однородных событий, следующих одно за другим в какие-то случайные моменты времени.

· Интенсивность потока λ – среднее число событий приходящиеся на единицу времени.

Интенсивность потока может быть как постоянной, так и переменной, зависящей от времени.

Для простейшего потока с интенсивностью λ интервал Т между соседними событиями имеет показательное распределение с плотностью: f(t)= λ·e- λt, t > 0.

2. Рассмотрим математическую модель изменения численности популяции – процесс гибели и размножения. Граф состояний процессы гибели и размножения представлен на рис.8.

 
 


Найдём все финальные вероятности системы.

Рассмотрим упорядоченное множество состояний системы S0, S1, …, Sn. Из любого состояния переходы могут осуществляется только в состоянии с соседними номерами. Предположим, что все потоки событий, переводящие систему по стрелкам графа, простейшие с соответствующими интенсивностями. Тогда для первого состояния S0 имеем: λ01·p0= λ10·p1 (*)

Для второго состояния S1: (λ1210) ·p1= λ01·p0 + λ21·p1

В силу (*) имеем: λ12·p1= λ21·p2.

Далее, записывая уравнения для предельных вероятностей других состояний, получается система:

λ01·p0= λ10·p1

λ12·p1= λ21·p2

........

λn-1 n pn-1= λn n-1 pn

Учтем нормировочное условие: p0+ p1+…+pn =1

Решим систему уравнений:

p1= ·p0

       
   
 


p2= ·p1= ·p0

........

 
 


pn= ·p0

Подставляя равенства в нормировочное условие, получаем

           
     
 
 


P 0 = (1+ + +… +)-1

3. Рассмотрим любую систему массового обслуживания и связанные с него два потока событий: поток заявок, прибывающих в СМО, и поток заявок, покидающих СМО. Если в системе устанавливается стационарный режим, то среднее число заявок, прибывающих в СМО за единицу времени, равно среднему числу заявок, покидающих ее: оба потока имеют одну и ту же интенсивность.

Пусть, Х(t) – число заявок, прибывших в СМО до момента t; Y(t) – число заявок покинувших СМО до момента t.

Обе функции являются случайными и меняются скачком в моменты переходов и уходов заявок. Функция Z(t)=X(t)-Y(t) – число заявок, находящихся в очереди. Рассмотрим очень большой промежуток времени Т и вычислим для него среднее число заявок, находящихся

в СМО:

Этот интеграл представляет собой площадь фигуры состоящей из прямоугольников, каждый из которых имеет высоту, равную единице, и основание, равное времени пребывания в системе соответствующей заявки. Обозначим эти времена t1, t2,….

Таким образом, при достаточно больших Т, можно считать что

, где сумма распространяется на все заявки, пришедшие за время Т.

Тогда, L сист = ti = · ti·λ

Величина Tλ есть среднее число заявок, пришедших за время Т. Если разделить сумму всех времен ti на среднее число заявок, то получится среднее время пребывания заявки в системе Wсист.

Получаем, что Lсист = λ·Wсист

 
 


Откуда. Wсист = ·Lсистформула Литтла.

Таким же образом получается вторая формула Литтла: среднее время пребывания заявки в очереди равно отношению среднего числа заявок в очереди к интенсивности потока заявок:

4. Пусть имеется одноканальная СМО с очередью.

Предположим, что на очередь не наложено никаких либо ограничений (по длине, по времени ожидания).

На СМО поступает поток заявок с интенсивностью λ; поток обслуживаний имеет интенсивность m, обратную среднему времени обслуживания заявки tоб. Найдем финальные вероятности состояний СМО, а также характеристики ее эффективности: Lсист (среднее число заявок в системе), Wсист (среднее время пребывания заявки в очереди), Lor (среднее число заявок в системе), Wor (среднее время пребывания заявки в очереди), Pзан (вероятность того, что канал занят).

Абсолютная пропускная способность А СМО равна интенсивности потока заявок λ в силу того, что очередь неограниченна и все заявки будут обслужены. Откуда относительная пропускная способность СМО равна единице.

рис.9.

Состояния системы: So – канал свободен;

S1 – канал занят, очереди нет;

S2 – канал занят, одна заявка;

Sn – канал занят, n-1 заявок

Схема СМО с неограниченной очередью есть схема гибели и размножения с бесконечным числом состояний. Финальные вероятности для такой СМО существуют только тогда, когда система не перегружена (ρ < 1). Если приведенная интенсивность потока заявок больше либо равно единице (ρ ≥ 1), при t → ∞ очередь неограниченно растет.

Ряд в формуле представляет сбой геометрическую прогрессию и при ρ < 1 сходится

, , …,

Вероятности образуют геометрическую прогрессию. Самое вероятное состояние – канал свободен.

Найдем среднее число заявок в очереди

По формуле Литтла:

По правилу сложений математических ожиданий среднее число заявок в очереди равно разности среднего числа заявок в системе и их среднего обслуживанием. Число заявок под обслуживанием может быть либо нулем, либо единицей. Причем вероятность такой случайной величины равно вероятности того, что канал занят.

, ,

По формуле Литтла:

5. Рассмотрим многократную СМО с неограниченной очередью.

Состояния системы: So – все каналы свободны;

S1 – занят один канал;

S2 – занято два канала;

Sn – все каналы заняты;

Sn+1 – заняты все каналы, одна заявка в очереди;

Sn + r – заняты все каналы, r заявок в очереди.

 
 


Рис10

Финальные вероятности существуют, если В противном случае очередь растет до бесконечности.

Пусть

, , …, , , …,

Среднее число занятых каналов:

Замечания: Допущение при котором анализировались рассмотрение выше СМО.

Состоит в том, что все потоки событий, переводящие их из состояния в состояние, были простейшими. При нарушении этого требования общих аналитических методов для таких систем не существует.

Вопросы для самоконтроля по главе

1. От чего зависит показатель эффективности управляемой операции?

2. Какой из путей решения многошаговой задачи считается проще – искать сразу все элементы решения на всех n шагах. Либо строить оптимальное управление шаг за шагом, на каждом этапе расчета оптимизируя лишь один шаг?

3. Сформулируйте принцип оптимальности Беллмана.

4. Какие подходы к управлению запасами существуют? Какие из них более распространены?

5. Какой случайный процесс называется Марковским?





Дата публикования: 2014-11-03; Прочитано: 583 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.029 с)...