Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

3 страница. где — множество допустимых альтернатив; — множество исходных отношений предпочтения;



где — множество допустимых альтернатив; — множество исходных отношений предпочтения; — множество правил согласований отношений предпочтения.Конечной целью исследования задач векторной оптимизации обычно является отыскание некоторой наилучшей (оптимальной, эффективной) альтернативы, принадлежащей множеству допустимых альтернатив .

20. 1. Альтернативы удовлетворяют отношению доминирования по Парето , тогда и только тогда, когда хотя бы по одному входному отношению предпочтения имело место доминирование (, где ‑ отношение строгого порядка), а по остальным ‑ безразличие или доминирование.

Данное определение можно задать в виде единого соотношения вида:

.

2.. Альтернативы удовлетворяют отношению сильного доминирования по Парето тогда и только тогда, когда по каждому входному отношению предпочтения имеет место доминирование: .

Данное определение также можно задать с использованием единого соотношения вида:

.

Замечательное свойство множества Парето состоит в том, что если это множество не пусто, то всякая альтернатива, лежащая вне множества Парето, доминируется альтернативой, принадлежащей последнему множеству. Следовательно, рационально поиск наилучших, в том или ином смысле, альтернатив сосредоточить именно в области Парето.

Таким образом, окончательный выбор во множестве Парето связан с достижением определенного компромисса. Поэтому данное множество получило также название множества (области) компромиссов.

3. Альтернатива называется эффективной (недоминируемой), если во множестве допустимых альтернатив не существуют решения, которое доминирует по Парето альтернативу .Важным практическим результатом выделения области компромиссов (множества Парето) является существенное сужение области поиска оптимальных решений. При этом, как и ранее будем предполагать, что все целевые функции максимизируются. 1. Никакие альтернативы, принадлежащие множеству допустимых альтернатив , не доминируют (не превосходят) альтернативы, принадлежащие множеству Парето. 2. При переходе от одной точки (альтернативы) множества Парето к другой точке множества Парето происходит увеличение значений одних критериальных функций и уменьшение значений других критериальных функций. 3. Множеству Парето принадлежат все альтернативы , при которых достигается единственные (или глобальные) экстремумы значений хотя бы одной из критериальных функций , как при отсутствии ограничений на значения остальных критериальных функций, так и при вводе (частичном вводе) таких ограничений. Другими словами, множеству Парето принадлежат альтернативы , для которых . 4. Множеству Парето принадлежат все точки , в которых достигается единственный (или глобальный) экстремум линейных форм. 5. Если множество альтернатив является выпуклым компактом и соответствующим требованиям вогнутости (выпуклости) удовлетворяют непрерывные функции , то решение совокупности указанных выше экстремальных задач вида (4.8) в принципе определяет все точки множества Парето. 6. Любая точка множества Парето, расположенного в строго положительном варианте, может быть представлена как решение задачи

,

для графического представления пространства критериальных функций широко используют полярные и линейные диаграммы.

21. В работах предлагается различать классы: априорных, апостериорных и адаптивных методов и моделей многокритериальной оптимизации. В априорных методах требуемой дополнительной информацией является непосредственно принцип оптимальности. Вторая группа априорных методов решения многокритериальных задач основана на покомпонентном построении результирующих отношений предпочтения. При этом различают паретовские, лексикографические, мажоритарные результирующие отношения предпочтения, первые два из которых в свою очередь подразделяются на классические, интервальные и пороговые, а последнее — на безынтервальное и интервальное результирующие отношения предпочтения. К многоэтапным методам могут быть отнесены адаптивные методы многокритериальной оптимизации, в которых не предполагается введение или полное восстановление принципа оптимальности в явном виде. Возможны различные сочетания (комбинации) перечисленных методов многокритериальной оптимизации: априорно-апостериорные методы, апостериорно-адаптивные методы и т.п. Теоретическая и практическая ценность различных методов многокритериального выбора определяется:— обоснованностью принципов их построения и широтой класса задач принятия решений, в которых эти принципы реализуемы;— возможностью выявления у ЛПР требуемой дополнительной информации;— свойствами альтернатив и критериальных функций, степенью их соответствия целевой установке задачи.

22. На практике осуществляют переход к лексикографическим методам построения результирующих отношений предпочтения. Данное отношение предпочтения часто называют лексикографическим, а многокритериальные задачи со строго упорядоченными по важности критериями — лексикографическими задачами. Главное из этих отличий состоит в том, что в определении множества Парето и его последующих сужений обычно участвуют все отношения предпочтения , а при применении лексикографических методов предпочтения постепенно нарастает, и вся последовательность шагов направлена на отыскание ядра отношения предпочтения . В общем случае процедура лексикографической оптимизации может оказаться неустойчивой. Для расширения возможностей применения лексикографических методов многокритериальной оптимизации вводится интервальный лексикографический порядок. Метод последовательных уступок. Целесообразно применять для решения тех задач, в которых все показатели качества естественным образом упорядочены по важности, причем каждый показатель настолько более важен, чем последующий, что можно ограничиться только их попарной связью и выбирать величину допустимого снижения очередного показателя с учетом поведения лишь одного следующего показателя.

23. Сущность данных методов многокритериальной оптимизации состоит в построении такого результирующего отношения предпочтения, на основе которого возможно прямое выделение во множестве оптимальной в некотором смысле альтернативы . В связи с этим данные методы называют еще и прямыми методами векторной оптимизации. Принцип равномерной оптимальности. Основными недостатками данного варианта свертки являются:1) слабая связь весовых коэффициентов с действительной ролью частных критериальных функций при обобщенной оценке альтернатив с использованием . 2) трудность отыскания объективного способа нормирования частных критериальных функций для приведения их к безразмерному виду, т.к. значимость каждой определяется величинами и ;3) возможность компенсации недопустимо малых значений оценок альтернатив по некоторым критериальным функциям большими значениями по другим критериальным функциям. Выражение представляет собой свертку‑произведение оценок альтернатив по всем критериальным функциям. Принцип оптимальности, реализуемый с использованием данного варианта свертки, называется принципом справедливого компромисса и формулируется следующим образом: справедливым следует считать такой компромисс, когда суммарный уровень относительного снижения одной или нескольких критериальных функций не превышает суммарного уровня относительного увеличения остальных критериальных функций.При использовании (априорных) методов многокритериального принятия решений выбор соответствующего принципа оптимальности существенно зависит от типа и структуры конкретно решаемой задачи.

24. Решение задач выбора в реальных системах всегда связано с необходимостью учета факторов н е о п р е д е л е н н о с т и, в знании среды, которая влияет на формализованное описание системы (модель) и на способы принятия решений.В зависимости от степени имеющихся знаний о среде используется та или иная форма ее описания, при этом различают следующие варианты:- д е т е р м и н и р о в а н н а я среда, действие которой на систему полностью определено;- с т о х а с т и ч е с к а я среда, действие которой подчиняется известным (или неизвестным) вероятностным законам;- ц е л е н а п р а в л е н н а я среда, действие которой подчинено определенным целям;- н е и з в е с т н а я среда - среда, о которой в той или иной степени отсутствует информация.Последние три формы используются для описания среды с неопределенностью.Принятие решений в условиях с т о х а с т и ч е с к о й среды основывается на том, что объективно существующая неопределенность достаточно точно описывается вероятностными законами. Выбор в условиях ц е л е н а п р а в л е н н о г о воздействия среды связан с ситуациями, в которых сталкиваются интересы нескольких оперирующих сторон, преследующих различные цели. Н е и з в е с т н а я среда характеризуется индифферентным поведением по отношению к системе. Пути организации процесса принятия решения в случае неизвестной среды: а) ввод гипотез о направленности воздействия внешней среды на экономическую систему и, соответственно, на основе взаимодействия с лицом, принимающим решение, введение аксиом поведения (аксиом пессимизма, оптимизма, минимума риска и др.); б) использование экспертных знаний о возможных состояниях среды и формализация их в той или иной форме в моделях принятия решений. Для снятия неопределенности в моделях принятия решений широко используются д е к о м п о з и ц и я и а г р е г и р о в а н и е. Выделяется несколько взаимосвязанных управленческих задач. Прежде всего это задачи п е р с п е к т и в н о г о планирования,задача д о л г о с р о ч н о г о планирования, задача о п е р а т и в н о г о планирования. Развиваются многошаговые методы принятия решений для снятия неопределенности за счет сокращения интервала управления и, следовательно, сокращения времени поступления возмущений.

25. Постановка задач принятия решений в условиях стохастической среды имеет вид(D(w), f(w)), wÎW, где D(w) - множество допустимых альтернатив, f(w) - целевая функция. Методы решения задач выбора в условиях стохастической среды можно разделить на две большие группы: методы детерминизации и методы имитационной оптимизации.М е т о д ы д е т е р м и н и з а ц и и (непрямые методы) основаны на построении детерминированных эквивалентов задачи стохастического выбора. Исходной информацией для такого построения являются известные законы распределения случайных величин (состояний среды).М е т о д ы и м и т а ц и о н н о й о п т и м и з а ц и и (прямые методы) основаны на имитации случайных изменений среды в соответствии с известными законами распределения. Для фиксированного набора случайных параметров, характеризующих состояние среды, решается оптимизационная задача.

26. Принятие решений в условиях целенаправленной среды связано с тем, что известна цель среды, в соответствии с которой она выбирает свои состояния и которую преследует в своих действиях. Эти действия могут вступать в противоречия с нашими действиями, т.е. формируется конфликтная ситуация.К о н ф л и к т н о й с и т у а ц и е й назовем ситуацию, в которой сталкиваются интересы нескольких оперирующих сторон, преследующих различные цели.Конфликтная ситуация характеризуется: составом оперирующих сторон; целями, которые преследует каждая из сторон; способами участия оперирующих сторон в конфликте; возможными результатами разрешения (исходами) конфликта.Формализованную модель некоторой конфликтной ситуации называют и г р о й. Теория игр является математической теорией моделей принятия решений при целенаправленном воздействии среды. Эта теория создает формальную основу для анализа конфликтных и противоречивых ситуаций и, в конечном итоге, позволяет формулировать рекомендации о наилучшем поведении в таких ситуациях. Ее предназначение - выработка рекомендаций по рациональному поведению участников конфликта (оперирующих сторон - игроков). Теория игр является математической теорией моделей принятия решений при целенаправленном воздействии среды. Эта теория создает формальную основу для анализа конфликтных и противоречивых ситуаций и, в конечном итоге, позволяет формулировать рекомендации о наилучшем поведении в таких ситуациях. Ее предназначение - выработка рекомендаций по рациональному поведению участников конфликта (оперирующих сторон - игроков). П р а в и ла игры: - возможные действия игроков;- состав информации о действиях других игроков и об условиях, в которых происходит игра;- оценки качества действий каждого из игроков в ходе конфликта.Игры с различными правилами можно классифицировать: 1. Количество участников игры. По этому признаку различают игры двух игроков и игры n лиц.2. Мощность множеств выбора игроков (количество возможных вариантов действий каждого участника). Различают игры конечные и бесконечные.3. Суммарный выигрыш игроков: игры с нулевой (ненулевой) суммой.4. Количество розыгрышей игры. Различают одношаговые, многошаговые и дифференциальные (непрерывные) игры. 5. Информированность игроков Различают игры с полной информацией и игры с неполной информацией.6. Математико-психологические аспекты игры:- угрозы - информированность противника о возможных последствиях его хода;- блеф - ложная информация, сообщаемая противнику;- рефлексия - постановка себя на место противника.А н т а г о н и с т и ч е с к о й и г р о й называется игра n лиц (игроков) с нулевой суммой.

Игры n лиц в зависимости от характера взаимоотношений игроков могут быть б е с к о а л и ц и о н н ы м и и к о а л и ц и о н н ы м и. П а р т и я и г р ы представляет из себя фиксированный вариант реализации игры при неизменных правилах и складывается из отдельных х о д о в - решений, принимаемых противоположными сторонами.С т р а т е г и е й игрока называется совокупность правил, определяющих выбор варианта действий (принятия решения) при каждом личном ходе игрока в зависимости от ситуации, сложившейся в процессе игры. О п т и м а л ь н о й с т р а т е г и е й игрока принято называть такую стратегию, которая при многократном повторении партий игры обеспечивает ему максимально возможный выигрыш (или соответственно минимально возможный проигрыш). О с н о в н о й ц е л ь ю изучения игр является выявление оптимальной стратегии, приводящей к максимальному выигрышу игрока. М а т р и ч н о й и г р о й называется конечная игра двух лиц с нулевой суммой. В матричных играх, под стратегией понимается ход, приводящий к наибольшему выигрышу. Множество таких ходов у первого игрока равно X и его часто называют множеством ч и с т ы х с т р а т е г и й первого игрока. max min Это для первого игрока гарантированный выигрыш (при рациональном его поведении меньше этого значения он выиграть не может), который называется н и ж н е й ц е н о й и г р ы.min max,который называется в е р х н е й ц е н о й и г р ы. О с н о в н а я т е о р е м а т е о р и и и г р (теорема о минимаксе). Любая матричная игра разрешима в смешанных стратегиях. Процедура нахождения оптимальных чистых или смешанных стратегий соответствует выявлению рациональной линии поведения противников в конфликтной ситуации, описываемой игровой моделью. Поэтому такую процедуру часто называют р е ш е н и е м и г р ы (интерпретируя ее как процесс), а пару оптимальных стратегий (чистых или смешанных) называют решением игры, рассматривая ее как результат.Принятие решений в условиях неизвестной среды.1) для сбора и обработки статистики необходим ресурс времени, который на практике довольно часто отсутствует;2) изменение состояний среды должно обладать свойством статистической устойчивости. Модели типа "игра с природой". В этих играх в качестве второго игрока выступает "природа", которая не заинтересована в результатах игры и, следовательно, действует по своим законам, не противодействуя сознательно другой оперирующей стороне. К прикладным проблемам, использующим модели типа "игра с природой", можно отнести многие экономические задачи разработки систем, задачи планирования хозяйственных действий в различных условиях. Принцип равновероятных состояний среды (критерий Лапласа).Принцип гарантированного результата (критерий пессимизма, критерий Вальда).Принцип максимального оптимизма.Принцип пессимизма-оптимизма (критерий Гурвица).Принцип минимума максимальных потерь

(критерий минимизации риска, критерий Сэвиджа).

27. Обобщенную модель выбора, которая может быть представлена как(Q(s), D, { ri, iÎC}, f). Q(s) — исходная структура выбора (модель) типа s. D — пространство альтернатив (решений). {ri, iÎС} — множество отношений, ограничивающих выбор; С — множество индексов отношений, ограничивающих выбор.

f — отношение предпочтения, задаваемое на множестве альтернатив D и отражающее требования, предъявляемые к оптимальному решению.Для задач оптимального управления исходная структура выбора Q(s) задается системой дифференциальных уравнений = j (t, x, u),Пространство альтернатив D представляет собой декартово произведение базовых множеств D = T´X´U, где T — множество моментоввремени; X — множество состояний системы; U — множество управлений.

В постановке задачи оптимального управления присутствует четыре элемента.1) Функционал: J (x, u) ® min.2) Дифференциальные связи (динамическая система):

= j (t, x, u).3) Ограничения вдоль траектории: (t,x,u) Î G = Gt´Gx´Gu.4) Краевые условия: x(to) Î Eo, x(tf) Î Ef. Способы задания функционала. З а д а ч а Л а г р а н ж а (интегральный функционал), качество управления характеризуется некоторыми интегральными на всем интервале управления характеристиками, тогда функционал имеет вид J(x,u) = F(t,x,u) dt ® min,где F — некоторая дифференцируемая функция своих аргументов. Простейшим видом задачи Лагранжа является задача, в которой F(t,x,u) = 1. ТогдаJ(x,u) = tf – to ® min,т.е. задача становится задачей м а к с и м а л ь н о г о б ы с т р о д е й с т в и я.З а д а ч а М а й е р а (терминальный функционал), качество управления определяется значением фазовых переменных, которые достигаются на концах траектории.J(x,u) = Ф(to, x(to), tf, x(tf)) ® min. З а д а ч а Б о л ь ц а (смешанный функционал), качество управления определяется функционалом смешанного типа, который имеет интегральную и терминальную составляющиеJ(x,u) = Ф(to, x(to), tf, x(tf)) + F(t,x,u) dt ® min. Виды дифференциальных связей. Основные виды дифференциальных уравнений, соответственно, динамических систем (моделей). Ограничения вдоль траектории. Принято различать следующие способы задания ограничений вдоль траектории:а) Ограничения на управление. б) Ограничения на фазовые переменные. в) Совместные ограничения на управление и фазовые переменные. г) Интегральные ограничения (изопериметрические). Краевые условия. Содержание задач оптимального управления, как правило, состоит в переводе динамической системы из некоторого начального состояния в конечное при достижении определенных качественных характеристик управления. В этой связи для постановки задачи весьма важны начальное и конечное состояния системы, которые задаются краевыми условиями.а). Задача с ф и к с и р о в а н н ы м и концами

б). Задача со с в о б о д н ы м и концамив). Задача с п о д в и ж н ы м и концами

28. Программное управление ресурсами. Управление ресурсами заключается в изменении количества и скорости поступления ресурсов. В этих условиях необходимо найти управление, позволяющее изменить состояние ресурсов за минимальное время.Цель проводимой операции — изменение количества ресурсов. Задача 1. Функционал dt ® min.2. Дифференциальные связи = x2, = u.3. Ограничения вдоль траектории u(t) Î [-Uo,+Uo] или ôu (t)ô £ Uo, tÎ(0,T].4. Краевые условия x(0) = ║ro voт ; x(T) = ║ 0 0 ║т . Оптимальное управление производством. необходимо найти программу управления выполнения операций, позволяющую минимизировать расход ресурсов. 1. Функционал uт(t) R(t) u(t)dt ® min.2.Дифференциальные связи = eij(t) dij uij(t) Г1i(t) Г2i(t), i = 1,…,n.3. Ограничения вдоль траектории uij(t) Î [0, 1], i = 1,…,n, j = 1,…, m.4. Краевые условия xi(0) = 0; xi(T) = xiзад, i = 1,…,n.

29. Исследование принципиальной разрешимости задачи оптимального управления, доказательство существования и единственности решения и является предметом качественного анализа. Основные группы вопросов.1. Исследование принципиальной возможности перевода динамической системы из одного заданного состояния в другое за конечное время с использованием некоторого программного управления, принадлежащего заданному классу функций (управляемость динамической системы).2. Анализ существования допустимого управления — управления, принадлежащего заданному классу функций, удовлетворяющего заданным ограничениям и переводящего динамическую систему из заданного начального состояния в заданное конечное состояние (достижимость состояний).3. Анализ существования в классе допустимых управлений оптимального управления и его единственность. Управляемость динамической системы. Динамическая система (t) = j (x, u) называется у п р а в л я е м о й в состоянии x1=x(t1) относительно состояния x2=x(t2), если существует кусочно-непрерывное управление u(t), tÎ(t1,t2], позволяющее перевести систему из состояния x1 в состояние x2.Если существует кусочно-непрерывное управление, позволяющее перевести динамическую систему из любого заданного состояния в любое желаемое состояние за конечное время, то система называется в п о л н е (полностью) управляемой.

30. Вопрос достижимости заданного состояния динамической системы из некоторого начального состояния заключается в существовании допустимого управления — управления, принадлежащего заданному классу функций и удовлетворяющего заданным ограничениям.Анализ достижимости состояний динамической системы задачи — построения областей достижимости или их аппроксимаций. Существование и единственность оптимального управления. В настоящее время отсутствуют универсальные критерии для оценки единственности решения в задачах оптимального управления динамическими системами.

31. Основное содержание этих условий заключается в формулировании свойств, присущих оптимальному управлению, т.е. свойств, которые имеют место, если оптимальное управление существует. Необходимые условия довольно часто используются при качественном анализе существования оптимального управления. Они позволяют выявить множество экстремальных управлений, т.е. подмножество допустимых управлений, содержащее оптимальное управление. Функция Гамильтона. H(t, ,u, ) = (, j) = jт = т j = yj jj(t,x,u).. Принцип максимума Л.С.Понтрягина. Задачей Лагранжа со свободным временем и фиксированными концами. J(x,u) = F(t,x,u) dt ® min, (t) = j (t, x, u),

u(t) Î Gu Í Rm, tÎ(to, tf],x(to) = xo, x(tf) = xf.

Функция Гамильтона для задачи будет иметь вид H(t, ,u, ) = yoF(t,x,u) + yтj (t,x,u).

Утверждение (Принцип максимума Л.С.Понтрягина). Если управление u*(t) является оптимальным управлением в задаче, то существует ненулевая непрерывная векторная функция (yo(t),y1(t),...,yn(t)), удовлетворяющая сопряженной системе дифференциальных уравнений и такая, что выполняются условия1) Для любого момента времени tÎ(to,tf] функция Гамильтона (6.21) достигает максимума по u(t), т.е.

H(t, ,u*, ) = max H(t, ,u, ).uÎGu2) Выполняются соотношенияyo(tf) £ 0; H(tf, ,u*, ) = 0.Замечание 1.Условие 1 принципа максимума может служить основой для вычисления оптимального управления на основе решения некоторой специализированной краевой задачи. Замечание 2.Формулировки принципа максимума для различных задач оптимального управления отличаются видом функции Гамильтона (т.к. могут использоваться разные функционалы) и условиями 2 в формулировке принципа максимума. 2¢). yо(tf) < 0; yi(tf) = 0, i=1,...,n.





Дата публикования: 2014-12-08; Прочитано: 408 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.009 с)...