Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Стохастичні системи і ідеї розрахунку оптимального управління в них



Если в общесистемной модели функционирования MF операторы G и H каждой паре (z(t0), Xt0t) ставят в соответствие единственные, вполне определенные значение y(t) и z(t), то система детерминированная, в противном случае система называется стахостической и y(t) и z(t) - случайные величины с заданными законами распределения.

В такой системе каждой паре (z(t0), Xt0t) могут отвечать любой значение y(t) Î Y і z(t) Î Z с вероятностями:

P y|zx = P (y(t)|z(t0), Xt0t),

P z|zx = P (z(t)|z(t0), Xt0t).

Условные вероятности P у|zx, P z|zx, определенные для каждой пары (z(t0), Xt0t) задают вероятностные меры PY = {P y|zx}, PZ = {P z|zx}, соответственно которым реализуются конкретные значения выхода и состояния. Поэтому модель стохастической системы имеет вид:

CTMF = <T, X Í XN, Y Í YM, Z Í ZK, PY, PZ>,)(1)

с который выплывает, что эта модель устанавливает для конкретных y(t) и z(t) лишь вероятные их реализации.

Анализ таких систем может быть проведен аналитически с использованием теории случайных процессов (если это позволит сложность системы), методом имитационного или моделирование посредством анализа поведения математических ожиданий случайных величин y(t) и z(t)

, (2)

вычисленной для каждой пары (z(t0), Xt0t).

Последний метод не всегда может обеспечить достаточную точность расчетов и поэтому его применения ограничено.

Для дискретных систем беспрестанные распределения вероятностей замещаются на дискретные и интегралы в(2) замещаются соответствующими суммами.

В реальных системах всегда внешние случайные воздействияи ее состояние z(t) является случайной величиной. Кроме того и при оценке этого состояния налагаются препятствия и на процесс "измерения" z(t). Тогда задачу синтеза оптимального управления для линейной системы с квадратичным критерием можно записать в следующем виде:

Найти оптимальное управление для системы

(t) = A(t)z + B(t) + V0, z(t0) = z0, (3)

y(t) = C(t)z + VH, (4)

где в - выход системы, что наблюдаются, V0, VH - шумы объекта и наблюдения, что обычно является белыми гауссовскими с характеристиками:

MV0 = MVH = 0

M[V0(t)V0T(t`)] = Q0(t)d(t-t`), (5)

M[VH(t)VHT(t`)] = R0(t)d(t-t`),

и пусть шумы не коррелируют, то есть

M[V0(t)VHT(t`)] =0,

z0 - тоже случайная гауссовская величина с характеристиками:

Mz0 = 0, M[(z0- 0)(z0 - 0)T] = P0 (6)

де Q0 0, P0 0, a R0>0. (7)

Критерий оптимума в этом случае имеет вид:

J =M[ T(tf)Fz(tf) + [zTQz + uTRu)dt], (8)

который нужно минимизировать.

Во всех последних выражениях М[.] помечает отыскивание математического ожидания случайной величины.

Потому что z,u и y является в общем случае векторами, то, B, C, F, Q, R, R0, Q0, P0 является матрицами и условия (7) являются условиями негативной и позитивной определенности матриц.

Если ввести в рассмотрение функционал

S[z(t),t] = min {J[z(t),u(t),t]}, uÎU,t0 t tf ,

то он будет функцией Беллмана и можно воспользоваться идеями вывода функционального равнения метода динамического программирования с учетом случайного характера исследуемых величин.

Расчеты для оптимального управления:

, (9)

u*= -R-1BT . (10)

Существенным отличием от детерминированного случая является тот факт, что действительное значение z(t) неизвестно, а можно получить только лишь статистическую оценку состояния z(t).

Тогда в представлении функции Беллмана мы можем записать

(11)

где - оценка состояния

Подставив (11) в (9) получим оптимальный закон управления.

u* = -R-1BTK (t), (12)

где - оценка состояния, а К - матрица

Проблема определения оценки заключается в том, чтоб на основании знания исходного вектора в(t) на интервале [t0,t] найти несмещенную оценку, что обеспечивает минимум средней квадратической ошибки

J0= M{(z(t) - )T(z(t)- )}®min (13)

Если шумы, которые влияют на состояние системы и изменение исходного вектора (то есть V0 и VH) не коррелированны, то нелинейная оценка, что удовлетворяет (5.59) определяется из равнения

, (14)

де матрица коэффициентов ДО0 определяется из равнений

(5.61)(15)

где дисперсионная матрица Р есть симметричной положительно определенной.

Таким образом, статистическая задача управления при неполной информации разбивается на двух задач:

1 формирование оптимальной оценки состояния системы по равенства (14) - (15);

2 расчет оптимального управления по формуле (12)

3 Такой подход к решению задачи называется принципом разделимости.





Дата публикования: 2015-02-18; Прочитано: 252 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.009 с)...