Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Численная модель характеризуется зависимостью такого вида, который допускает только частные численные решения для конкретных начальных условий и количественных параметров модели. 4 страница



Контрольные вопросы

1. Какие виды методов используются для иследования сложных систем?

2. Предмет имитационного моделирования.

3. Что вы понимаете под средствами моделирования и какие виды знаете?

4. Что вы понимате под проверкой адекватности модели?

5. Что означает планирование экспериментов с моделью?

Литература

11.

12.

13.

14.

15.


Лекция 4. ПРОБЛЕМА МОДЕЛИРОВАНИЯ (2 часа)

План

1. Объект моделирования

2. Сведения об объекте

3. Априорная информация

4. Апостериорная информация

При постановке и решении проблемы моделирования исследователь сталкивается с различными вопросами, одним из основных является вопрос – что называть объектом моделирования и какие общие свойства, черты модели объекта? Поэтому проблему моделирования начнем с изучения объекта моделирования.

1. Объект моделирования

Объект моделирования удобно представлять в виде многополюсника, изображенного на рис.1.а, где х1,..., хп наблюдаемые входы объекта, e1,..., еk — его ненаблюдаемые входы; у1,..., ут наблюдаемые выходы объекта.

       
 
а)
 
б)


Рис. 1. Изображение объекта моделирования.

Многомерный объект удобно описывать в векторной форме (рис. 1.б), где

X=(x1,... xn);

Y=(y1,... ym);

E=(e1,... ek);

Все входы объекта представляют собой воздействия внешней среды на объект и являются какими-то определенными функциями состояния среды и времени. Так как отсутствует модель среды, воздействующей на объект моделирования, то входы объекта естественно рассматривать как случайные функции времени, т. е.

X=X(t), E=E(t),

статистические свойства которых в общем случае неизвестны. Однако известны наблюдения входа и выхода объекта, т. е. реализации функций X(t) и Y(t) в непрерывной или дискретной форме. Относительно ненаблюдаемого входа Е(t) предполагается известной его структура, т. е. характер этой случайной функции. В данной книге мы ограничимся случаем, когда E(t) является нормальным случайным процессом, непосредственное наблюдение которого невозможно.

Объект связывает входы Х и Е с выходом Y некоторым априори неизвестным оператором F0

Y=F0(X, E).

Однако идентифицируется не он, а оператор моде­ли F, связывающий наблюдаемые входы и выходы:

Y=F(X).

Ненаблюдаемый фактор Е(t) рассматривается как случайная помеха, затрудняющая определение оператора F.

Резюмируя, можно сказать, что объект идентификации в общем случае представляется в виде многополюсника, часть входов которого ненаблюдаема (это и есть Е)

2. Сведения об объекте

Все сведения об объекте, которые необходимо иметь для того, чтобы начать процедуру идентификации, как сказано выше, подразделяются на два вида: априор­ные Аи апостериорные B. Так, что двойка

< А, B> (1)

характеризует всю информацию об объекте. Рассмотрим оба вида сведений в отдельности.

3. Априорная информация

Априорная информация, которой необходимо распо­лагать еще до наблюдения входов и выходов объекта, должна ответить на вопрос, что представляет собой структура идентифицируемого объекта. Структуру преж­де всего мы будем характеризовать значениями четырех признаков:

A =<α, β, γ, δ>, (2)

которые кодируют объект по четырем признакам. Сле­дует сразу отметить, что структура объекта полностью далёко не исчерпывается этими четырьмя признаками.

Рассмотрим указанные признаки вида объекта под­робнее и уточним их смысл.

1. Признак, динамичности α. Будем объект называть динамическим (α=1), если поведение его выхода зависит не только от значений входа в текущий момент времени, но и от предыдущих значений входа. Это означает, что объект обладает памятью (или инерционностью), кото­рая и определяет зависимость выхода от предыстории входа.

В противном случае объект будем называть статиче­ским (α=0).

2. Признак стохастичности β. Будем объект называть стохастическим (β=1), если поведение его выхода за­висит от неконтролируемых входов объекта или (что то же) сам объект содержит неконтролируемый источник случайных факторов возмущений. В противном случае будем объект называть детерминированным (β=0).

Заметим, что, строго говоря, нестохастических объек­тов не существует в природе, так как всякое измерение неизбежно вносит свою погрешность в результат наблю­дения. Поэтому правильнее говорить о “малой” и “боль­шой” стохастичности объекта, подразумевая, что с ма­лой стохастичностью можно не считаться и называть такой объект детерминированным.

3. Признак нелинейности γ. Объект будем называть нелинейным (γ=1), если его реакция на два различных возмущения входа не эквивалентна сумме реакций на каждое из этих возмущений в отдельности. Для случая без помех нелинейность определяется условием

F 0(X 1 + X 2) ≠ F 0(X 1) + F 0(X 2).

При невыполнении этого условия, т. е. при равенстве в этом выражении, объект будем называть линейным (γ=0).

4. Признак дискретности δ. Будем объект называть дискретным (δ=1), если состояние его входов и выходов изменяется или измеряется лишь в дискретные моменты времени t =1, 2,..., п. Если же вход и выход изме­няются или измеряются непрерывно, то объект назовем непрерывным (δ=0). Таким образом, способ измерения может изменит этот признак объекта.

Как видно, A в значительной степени проясняет вид модели, а для ее полной определенности следует ска­зать о характере динамики (при α=1), вероятностных свойствах стохастичности (при, γ = 1) и виде нелиней­ности (при β=1).

Естественно, что представления о виде модели, опре­деляемые A, могут измениться после анализа апостери­орной информации, т. е. после наблюдения за поведе­нием входа и выхода объекта.

4. Апостериорная информация

Если априорная информация A имеет качественный характер, то апостериорная—количественный, т. е. ре­зультат (протокол) наблюдений входа и выхода объекта. Этот протокол имеет вид:

B = <X, Y>,

где X результаты всех измерений 'входов объекта; Y результаты этих измерений его выходов за тот же период наблюдений.

Для непрерывных объектов (A=αβγ0) имеем запи­си непрерывных данных X =X(t), Y =Y(t) в интервале 0≤t≤T. Таким образом, получаем:

B 0=(<X(t), Y(t) > (0 ≤ t ≤ T).

Это означает, что поведение объекта зарегистрирова­но в виде n+m различных кривых: x1 (t),..., xn (t), y 1(t),..., ym (t) в этом интервале.

Заметим, что X и X(t) в данном случае не тождест­венны, так как X представляет собой всю зависимость Х (t) в заданном интервале, a X (t) может выражать только конкретное значение этой зависимости в момент t. Аналогична не тождественность Y и Y (t).

В дискретном случае (A=αβγl) имеем X=(X 1,.... X N),
Y = (Y 1,..., YN) и протокол записывается в виде

B1=(< Xi, Yi > (i=1,..., N)),

который представляет собой таблицу чисел из п+т столбцов и N строк:

B1=

Очевидна преемственность этих двух форм записи. Так,.протокол B1 может быть получен из B0 путем фиксации дискретных моментов времени t=0, δ, 2δ,..., (N— 1) δ, где δ - интервал дискретности (δ= T/N).

(Заметим, что обратный переход возможен далеко не всегда.)

Таким образом двойка (1) достаточно полно харак­теризует объект для целей его идентификации. Она и будет использоваться при изложении соответствующих идей, методов и подходов идентификации.

Контрольные вопросы

1. Обшее представление объекта моделирования в виде многополюсника.

2. Априорная и апостериорная информация об объекте моделирования.

3. По каким признакам классифицируются объекты моделирования?

Литература

16.

17.

18.

19.


Лекция 5. ЗАДАЧА ИДЕНТИФИКАЦИИ (2 часа)

План

1. Постановка задачи идентификации.

2. Трудности идентификации

1. Постановка задачи идентификации.

Задачей идентификации является определение оператора F0 объекта, т.е. построения такого оператора модели F, которой был определенном смысле близок к оператора объекта F0 т.е.

F»F0 (1)

(Заметим, что указанная «близость» весьма относительно, так как оператора F 0 и F могут иметь разные структуру, могут быть сформулированы на разных языках и иметь разные число входов. Именно поэтому близость операторов непосредственно оценить трудно или просто невозможно, тем более что часто об операторе объекта F0 мало что известно.) В связи с этим естественно оценивать близость операторов по их реакциям на одно и тоже входное воздействие Х, т.е. по выходом объекта Y(t)=F0[ X, E(t)] и модели YM=F(X). Степень близости этих реакций в каждый момент времени можно оценить, например, значением квадрата модуля разности векторов выхода:

, (2)

где векторов выхода модели.

В общем случае близость объекта и модели оценивается так называемой функцией невязки ρ. Это скалярная функция двух векторных аргументов – выходов объекта и модели:

, (3)

которая обладает следующими свойствами:

1) не отрицательна для любых Y(t) и YM (t), т.е.

ρ(Y(t), YM (t)) ≥ 0

2) равно нулю при Y(t) ≡ YM (t), т.е.

ρ(Y(t), YM (t))=0;

3) непрерывна и выпукла вниз по обоим аргументам, т.е.

(4)


ρ((1-λ)Y1+λY2, YM) ≤ (1-λ)ρ(Y1, YM)+λρ(Y2, YM)
ρ(Y(1-λ)YM1+λYM2) ≤ (1-λ)ρ(Y, YM1)+λρ(Y, YM2)

где 0 ≤ λ ≤ 1.

Говоря проще, эта функция всегда лежит ниже отрезка прямой, соединяющей две любые точки (Y1, YM1) и (Y2, YM2), где Yi, YM i – произвольные векторы. Удовлетворить этим требованиям не сложно. Так, соотношение (2') соответствует им. Именно оно и будет чаще всего применяться в дальнейшим.

Теперь сформулируем задачу идентификации. Она заключается в том, чтобы построит такой оператор модели F, которой бы реагировал на возмущение Х аналогично реакции объекта У. Реакция оператора модели на вход Х имеет вид:

УМ=F(X)

Следовательно модельный оператор F должен быть таким, чтобы:

УМ ~ У

где ~ знак эквивалентности, т.е. выходы модели и объекта при одинаковых входных воздействиях Х должен быть эквивалентны Этого можно добиться, если ввести единую меру близости на всем интервале наблюдения, а не только в каждой точке, как (3).

Такой мерой в непрерывном случае (объект А=αβγ0) может быть интеграл

Действительно, в соответствии с определениям функции ρ(.,.) величина Q выражает степень близости функций Y(t) и YM (t) в интервале 0 ≤ t ≤ T. Значение явно зависит от F:

и задача идентификации заключается в ее минимизации путем соответствующего выбора оператора модели F. Если по физическому смыслу задачи важность информации Вв различные моменты времени не одинакова, то целесообразно введение переменного веса h(t)>0:

(5)

с естественным нормированием

(6)

Выбор функции h(t) определяется ценностью информации. Например, для стохастического непрерывного объекта (А=αβγ0) при неравноточных наблюдениях, т.е. когда дисперсия ошибки наблюдения выхода зависит определённым образом от времени

,

где f(t) – заданная функция, вес h(t) должен изменяться следующим образом:

где, k – нормирующий член, обеспечивающий выполнение условия (6). Это означает, что ценность информации обратно пропорционально уровняю дисперсии случайных помех.

Величину Q(F) часто называют невязкой выходов объекта и модели. Эта невязка является функционалом, зависящим от оператора модели F. По своей конструкции эта невязка неотрицательно и равно нулю при , т. е. при совпадение выходов объекта и модели на исследуемом интервале.

Если объект является статическим и непрерывным А=0βγ0 т. е., F(·) есть функция то невязка (5) принимает вид:

Для дискретного объекта () функционал невязки записывается в очевидной форме:

(7)

а статическим дискретный объект () имеет функционал невязки в виде:

где, - вес информация в i -й момент времени. Если объект стохастический и дискретный () и измерения, например, зашумлены случайной помехой с изменяющейся дисперсией σ2i(i=1,..., N), то вес следует определять как

hi=k/σ2i,

где k – нормирующий член.

Таким образом степень несоответствия (степень невязки) операторов модели и объекта можно выразить в виде функционалов типов (5) и (7), зависящих явно от оператора модели F.

Естественно, процесс идентификации, т. е. процесс определения оператора модели, строит так, чтобы минимизировать указанную невязку, т. е. решать задачи минимизации функционала Q(F) по оператору F:

(8)

Эта символическая запись выражает следующую простую мысль: нужно минимизировать функционал Q(F), варьируя оператором (или в простейшим случае функцией) F не произвольно, а в некотором определенном классе операторов (или функцией) Ω. Это обозначается с отношение F ÎΩ, т. е. F принадлежит классу Ω, где Ω – заданный класс операторов или функций. Результатом процедуры минимизации является некоторый оператор (или функция) F* (не обязательно единственно), обладающий свойством:

(9)

т. е. невязка Q* на этом операторе минимально (точнее, не превышает всех возможных невязок, которые можно получить в классе Ω).

Говоря еще проще, для идентификации в заданном классе надо найти оператор F, минимизирующий функционал невязки Q(F) на этом классе.

Утверждения, что идентификация всегда сводиться к операции отыскания минимума, естественно, преувеличено. Действительно легко представить себе статический объект, который идентифицируется путем решения системы линейных или в общем случае нелинейных уравнений. Однако утверждения о сведении задания идентификации к задаче минимизации имеют общий характер для всех случаев идентификации с любыми классами допустимых операторов и функций.

Таким образом, использование процедуры минимизация для решение задачи идентификации объектов является принципиальным и важным обстоятельством, свойственным обычно решению сложных задач идентификации.

2. Трудности идентификации

Отметим две трудности постановки и решения задачи идентификации.

Первая трудность заключается в определении класса оператора Ω, в котором ищется это решение. Преодоление этой трудности едва ли в настоящая время возможно формальным образом.

Действительно, на стадии определение класса Ω должна быт использована априорная информации об объекте как предмета идентификации для целей управления. Этот этап крайне трудно формализуем и нуждается в эвратических решениях. Пока такие решения может принимать только человек.

Для принятия решения о классе Ω необходимо учесть следующее:

1) структур объекта управления;

2) механизм работы объекта;

3) цель управления;

4) алгоритм управления.

Последние два пункта связывают класс Ω с будущим управлением, для которого и идентифицируется объект.

Вторая трудность, которую нужно преодолевать при идентификации, заключается в решении поставленной задачи минимизации (8) с наименьшим ущербом для потребителя. дело в том, что процесс решения всякий задачи связан с определенными потерями (времени, средств, оборудование, энергии и т. д.). Это обстоятельство накладывает определенные ограничение на выбор алгоритма идентификации.

Действительно, это алгоритм должен решать поставленную задачу в определенном смысле наилучшим образом. Например, задачи идентификации должна быть решена за минимальное время или затраты средств на ее решение должны быть минимальные и т. д.

Как видно, всегда должен быть определен критерий эффективности процесса решение задачи идентификации. Чаше всего это будет ущерб, наносимый в процессе решение задачи идентификации, т. е. потери на идентификацию. Очевидно, что эти потери зависят от сложности задачи (8), необходимого объема экспериментальных данных и способа решения задачи, т. е. от алгоритма минимизации функционала Q(F).

Обозначим через А – алгоритм решения задачи идентификации (9), а I – потери на идентификацию, которые представляют собой функционал, зависящий от алгоритма А. Очевидно, что алгоритм следует выбирать таким, чтобы потери на идентификацию I были минимальны. Отсюда очевидным образом следует задача определения алгоритма как задача минимизации:

(10)

где I{B, A} – потери на идентификацию, т. е. на решение задачи B=[Q((F)à minFÎΩ] с помощью алгоритма А. Этот функционал должен быть задан. К примеру это может быть временно или стоимость решения задачи идентификации, сложность ее программирования, сложность применяемой при этой операторе, ее амортизация в процессе работе и т.д.

Задача (10) формулируется следующим образом: нужно в классе Ξ найти алгоритме идентификации А*, которой минимизирует потери на идентификацию I заданного объекта. Такой алгоритм А* естественно называть оптимальном в указанном смысле. Класс Ξ алгоритмов идентификации при этом должен быть задан. Если множество Ξ состоит из конечного и не слишком большого числа алгоритмов т. е.

Ξ

Заметим сразу, что, как правило, для идентификации выбирается не оптимальный алгоритм А*, а некоторый рациональный алгоритм Ã*, который обеспечивает решения задачи при допустимых потерях на идентификацию. Пусть I – допустимые потери. Тогда задача отыскание рационального алгоритма сводится к следующей:

(11)

Любой алгоритм из множества Ξ, удовлетворяющий этому неравенству, следует считать рациональным.

Таким образом, вторая трудность решение задачи идентификации сводиться к отысканию алгоритма решения этой задачи. При этом искомый алгоритм не может быть любым и должен удовлетворять определенным требованиям – оптимальности (10) или рациональности (11). Не последнюю роль здесь играет задание класса алгоритмов идентификации Ξ. процесс определение класса Ξ является эвристическим и пока доступным лишь человеку.

Контрольные вопросы

1. Определение задачи идентификации.

2. Как ставиться задача идентификация?

3. Что понимается под функцией невязки выходов объекта и модели?

4. Сведение задачи идентификация к задаче оптимизации?

5. Какие трудности возникают в задачах идентификации?

Литература

20.

21.

22.

23.

24.


Лекция 6. ЗАДАЧИ ИДЕНТИФИКАЦИИ И КЛАССИФИКАЦИЯ
МЕТОДОВ ИДЕНТИФИКАЦИИ (2 часа)

План

1. Идентификация структуры и параметров объекта

2. Классификация методов идентификации

1. Идентификация структуры и параметров объекта

Будем называть структурной идентификацией процесс определения структуры оператора модели F. Если же структура этого оператора F определена или априори известно, то процесс идентификации сводится к определению параметров этой структуры, т. е. задаче более простой чем предыдущая. Назовем ее параметрической идентификацией (иногда первый процесс называет идентификацией широком смысле, а второй – в узком).

Таким образом, идентификация структуры связана прежде всего с предварительном выбором структуры модели, а идентификация параметров – лишь с определением параметров этой модели при заданной структуре. Как видно, первый этап структурной идентификации предшествует второму и часто включает в себя второй как составную часть.

К сожалению, понятия «структура» не имеет четкого определения, хотя по видимому, интуитивно понимается всеми примерно одинаково. Будем под структурой модели понимать вид оператора с точностью до его коэффициентов. Заметим, что структура объекта, кодируемая А, вообще говоря, может не совпадать со структурой модели. Так, стохастический свойства объекта обычно не отражаются модели, а лишь определяют выбор метода идентификации ее параметров. Кроме того, модель может заведомо иметь меньше входов и выходов, чем их имеет объект. Это часто делает при малом объеме наблюдений (иначе не определить параметры модели).

Теперь уточным задачу идентификации. В (8) проблема сформулирована в самом общем виде, когда идентифицируется и структура и параметры модели. Пусть структуры и модели известна, т. е. задача структурной идентификации решена. Тогда оператор F(х) может быть представлен в виде

F(x)= f (x, c),

где f (.,.) – заданный оператор, а С=(с1,..., ск) –вектор неизвестных параметров модели. В этом случае задача идентификации параметров модели может быть записана, вообще говоря в виде задачи минимизации функции (а не функционала) невязки:

(12)

решением которой является вектор С*=(с*1,... с*к). Здесь

функция невязки выходов объекта и модели; Rk – k- мерное евклидово пространства векторов С. Здесь трудности решения задачи заключается в организации эффективного процесса минимизации заданных функций многих (к) переменных. Заметим, что так, как структура модели известна, то число переменных k определено заранее.

Очень часто структуру можно закодировать, введя структурный параметры. Такими структурными параметрами является числа k и l в примере 2. В общем случае обозначим эти параметры вектором.

D=(d1,..., dq),

Это означает, что структура кодируется q величинами d1,..., dq. Оператор модели теперь представляется в виде

F(X) = f(X, C, D),

Где f—заданный оператор. Здесь оператор модели определяется двумя типами параметров структурными D и параметрами объекта С. Функция невязки выходов объекта и модели (5) здесь принимает вид:

(13)
 
 

Тогда задачи идентификации в широком смысле сведется к решению следующий задачи минимизации функции k+q переменных:

 
 

Здесь S – область определения структурных параметров.

В заключение отметим, что сведение общей задачи идентификации (8) к параметрический идентификации (12) и (13) естественно имеет условный характер. Целью такого представления является упрощения задачи и сведение ее к известно ранее с хорошо разработанными методами решения. Такой задачей является задача математической программирования: минимизация функции многих переменных, принадлежащих заданному множеству. Именно так мы сформулируем задачи параметрических идентификации.

Однако не следует думать, что такое сведение задачи идентификации к задаче математического программирование решает все проблемы идентификации. Здесь возникает ряд новых проблем, например как это сведение сделать в конкретном случае как решить полученную задачу минимизации? Эти проблемы порождают другие и т. д. Но связь идентификации с математическим программированием, отмеченную выше, следует всегда иметь виду.

2. Классификация методов идентификации

Будем различать методы идентификации по трем классификационным признакам и характеризовать метод значениями этих признаков:

(14)

которые кодируют метод. Здесь ξ, η, ς – структурные признаки, которые могут принимать два значения. Естественно, что структура метода никак не исчерпывается этими тремя признаками. Тройка (14) служит, скорее, для обозначения метода, чем для его описания. Рассмотрим и охарактеризуем эти признаки.





Дата публикования: 2015-03-26; Прочитано: 256 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.027 с)...