Главная \| Случайная страница \| Контакты \| Мы поможем в написании вашей работы!

Стохастичні системи і ідеї розрахунку оптимального управління в них

⇐ Предыдущая 26 27 28 29 303132 33 34 35 Следующая ⇒

Если в общесистемной модели функционирования MF операторы G и H каждой паре (z(t0), Xt0t) ставят в соответствие единственные, вполне определенные значение y(t) и z(t), то система детерминированная, в противном случае система называется стахостической и y(t) и z(t) - случайные величины с заданными законами распределения.

В такой системе каждой паре (z(t0), Xt0t) могут отвечать любой значение y(t) Î Y і z(t) Î Z с вероятностями:

P y|zx = P (y(t)|z(t₀), X_t0t),

P z|zx = P (z(t)|z(t₀), X_t0t).

Условные вероятности P у|zx, P z|zx, определенные для каждой пары (z(t0), Xt0t) задают вероятностные меры P_Y= {P y|zx}, P_Z= {P z|zx}, соответственно которым реализуются конкретные значения выхода и состояния. Поэтому модель стохастической системы имеет вид:

CTMF = <T, X Í X^N, Y Í Y^M, Z Í Z^K, P_Y, P_Z>,)(1)

с который выплывает, что эта модель устанавливает для конкретных y(t) и z(t) лишь вероятные их реализации.

Анализ таких систем может быть проведен аналитически с использованием теории случайных процессов (если это позволит сложность системы), методом имитационного или моделирование посредством анализа поведения математических ожиданий случайных величин y(t) и z(t)

, (2)

вычисленной для каждой пары (z(t0), Xt0t).

Последний метод не всегда может обеспечить достаточную точность расчетов и поэтому его применения ограничено.

Для дискретных систем беспрестанные распределения вероятностей замещаются на дискретные и интегралы в(2) замещаются соответствующими суммами.

В реальных системах всегда внешние случайные воздействияи ее состояние z(t) является случайной величиной. Кроме того и при оценке этого состояния налагаются препятствия и на процесс "измерения" z(t). Тогда задачу синтеза оптимального управления для линейной системы с квадратичным критерием можно записать в следующем виде:

Найти оптимальное управление для системы

(t) = A(t)z + B(t) + V₀, z(t₀) = z₀, (3)

y(t) = C(t)z + V_H, (4)

где в - выход системы, что наблюдаются, V0, VH - шумы объекта и наблюдения, что обычно является белыми гауссовскими с характеристиками:

MV₀= MV_H = 0

M[V₀(t)V₀^T(t`)] = Q₀(t)d(t-t`), (5)

M[V_H(t)V_H^T(t`)] = R₀(t)d(t-t`),

и пусть шумы не коррелируют, то есть

M[V₀(t)V_H^T(t`)] =0,

^{z0 - тоже случайная}^{гауссовская}^{величина с характеристиками:}

Mz₀= ₀, M[(z₀- ₀)(z₀ - ₀)^T] = P₀ (6)

де Q₀0, P₀0, a R₀>0. (7)

Критерий оптимума в этом случае имеет вид:

J =M[ ^T(t_f)Fz(t_f) + [z^TQz + u^TRu)dt], (8)

_{который нужно минимизировать.}

Во всех последних выражениях М[.] помечает отыскивание математического ожидания случайной величины.

Потому что z,u и y является в общем случае векторами, то, B, C, F, Q, R, R0, Q0, P0 является матрицами и условия (7) являются условиями негативной и позитивной определенности матриц.

Если ввести в рассмотрение функционал

S[z(t),t] = min {J[z(t),u(t),t]}, uÎU,t₀tt_f,

то он будет функцией Беллмана и можно воспользоваться идеями вывода функционального равнения метода динамического программирования с учетом случайного характера исследуемых величин.

Расчеты для оптимального управления:

, (9)

u^*= -R^-1B^T. (10)

Существенным отличием от детерминированного случая является тот факт, что действительное значение z(t) неизвестно, а можно получить только лишь статистическую оценку состояния z(t).

Тогда в представлении функции Беллмана мы можем записать

(11)

где - оценка состояния

Подставив (11) в (9) получим оптимальный закон управления.

u^* = -R^-1B^TK (t), (12)

где - оценка состояния, а К - матрица

Проблема определения оценки заключается в том, чтоб на основании знания исходного вектора в(t) на интервале [t0,t] найти несмещенную оценку, что обеспечивает минимум средней квадратической ошибки

J₀= M{(z(t) - )^T(z(t)- )}®min (13)

Если шумы, которые влияют на состояние системы и изменение исходного вектора (то есть V0 и VH) не коррелированны, то нелинейная оценка, что удовлетворяет (5.59) определяется из равнения

, (14)

де матрица коэффициентов ДО0 определяется из равнений

(5.61)(15)

где дисперсионная матрица Р есть симметричной положительно определенной.

Таким образом, статистическая задача управления при неполной информации разбивается на двух задач:

1 формирование оптимальной оценки состояния системы по равенства (14) - (15);

2 расчет оптимального управления по формуле (12)

3 Такой подход к решению задачи называется принципом разделимости.

⇐ Предыдущая 26 27 28 29 303132 33 34 35 Следующая ⇒

Дата публикования: 2015-02-18; Прочитано: 286 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!

studopedia.org - Студопедия.Орг - 2014-2025 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.078 с)...