![]() |
Главная Случайная страница Контакты | Мы поможем в написании вашей работы! | |
|
Если в общесистемной модели функционирования MF операторы G и H каждой паре (z(t0), Xt0t) ставят в соответствие единственные, вполне определенные значение y(t) и z(t), то система детерминированная, в противном случае система называется стахостической и y(t) и z(t) - случайные величины с заданными законами распределения.
В такой системе каждой паре (z(t0), Xt0t) могут отвечать любой значение y(t) Î Y і z(t) Î Z с вероятностями:
P y|zx = P (y(t)|z(t0), Xt0t),
P z|zx = P (z(t)|z(t0), Xt0t).
Условные вероятности P у|zx, P z|zx, определенные для каждой пары (z(t0), Xt0t) задают вероятностные меры PY = {P y|zx}, PZ = {P z|zx}, соответственно которым реализуются конкретные значения выхода и состояния. Поэтому модель стохастической системы имеет вид:
CTMF = <T, X Í XN, Y Í YM, Z Í ZK, PY, PZ>,)(1)
с который выплывает, что эта модель устанавливает для конкретных y(t) и z(t) лишь вероятные их реализации.
Анализ таких систем может быть проведен аналитически с использованием теории случайных процессов (если это позволит сложность системы), методом имитационного или моделирование посредством анализа поведения математических ожиданий случайных величин y(t) и z(t)
, (2)
вычисленной для каждой пары (z(t0), Xt0t).
Последний метод не всегда может обеспечить достаточную точность расчетов и поэтому его применения ограничено.
Для дискретных систем беспрестанные распределения вероятностей замещаются на дискретные и интегралы в(2) замещаются соответствующими суммами.
В реальных системах всегда внешние случайные воздействияи ее состояние z(t) является случайной величиной. Кроме того и при оценке этого состояния налагаются препятствия и на процесс "измерения" z(t). Тогда задачу синтеза оптимального управления для линейной системы с квадратичным критерием можно записать в следующем виде:
Найти оптимальное управление для системы
(t) = A(t)z + B(t) + V0, z(t0) = z0, (3)
y(t) = C(t)z + VH, (4)
где в - выход системы, что наблюдаются, V0, VH - шумы объекта и наблюдения, что обычно является белыми гауссовскими с характеристиками:
MV0 = MVH = 0
M[V0(t)V0T(t`)] = Q0(t)d(t-t`), (5)
M[VH(t)VHT(t`)] = R0(t)d(t-t`),
и пусть шумы не коррелируют, то есть
M[V0(t)VHT(t`)] =0,
z0 - тоже случайная гауссовская величина с характеристиками:
Mz0 = 0, M[(z0-
0)(z0 -
0)T] = P0 (6)
де Q0 0, P0
0, a R0>0. (7)
Критерий оптимума в этом случае имеет вид:
J =M[ T(tf)Fz(tf) +
[zTQz + uTRu)dt], (8)
который нужно минимизировать.
Во всех последних выражениях М[.] помечает отыскивание математического ожидания случайной величины.
Потому что z,u и y является в общем случае векторами, то, B, C, F, Q, R, R0, Q0, P0 является матрицами и условия (7) являются условиями негативной и позитивной определенности матриц.
Если ввести в рассмотрение функционал
S[z(t),t] = min {J[z(t),u(t),t]}, uÎU,t0 t
tf ,
то он будет функцией Беллмана и можно воспользоваться идеями вывода функционального равнения метода динамического программирования с учетом случайного характера исследуемых величин.
Расчеты для оптимального управления:
, (9)
u*= -R-1BT . (10)
Существенным отличием от детерминированного случая является тот факт, что действительное значение z(t) неизвестно, а можно получить только лишь статистическую оценку состояния z(t).
Тогда в представлении функции Беллмана мы можем записать
(11)
где - оценка состояния
Подставив (11) в (9) получим оптимальный закон управления.
u* = -R-1BTK (t), (12)
где - оценка состояния, а К - матрица
Проблема определения оценки заключается в том, чтоб на основании знания исходного вектора в(t) на интервале [t0,t] найти несмещенную оценку, что обеспечивает минимум средней квадратической ошибки
J0= M{(z(t) - )T(z(t)-
)}®min (13)
Если шумы, которые влияют на состояние системы и изменение исходного вектора (то есть V0 и VH) не коррелированны, то нелинейная оценка, что удовлетворяет (5.59) определяется из равнения
, (14)
де матрица коэффициентов ДО0 определяется из равнений
(5.61)(15)
где дисперсионная матрица Р есть симметричной положительно определенной.
Таким образом, статистическая задача управления при неполной информации разбивается на двух задач:
1 формирование оптимальной оценки состояния системы по равенства (14) - (15);
2 расчет оптимального управления по формуле (12)
3 Такой подход к решению задачи называется принципом разделимости.
Дата публикования: 2015-02-18; Прочитано: 252 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!