Главная \| Случайная страница \| Контакты \| Мы поможем в написании вашей работы!

Моделирование предметных областей в экономике

⇐ Предыдущая 6 7 8 9 10 11 121314 15 Следующая ⇒

Для моделирования предметных областей экономики применяются модели, которые основаны на смысловых характеристиках информации. Такие модели называются семантическими [8, 9].

Семантические модели данных служат средством представления структуры предметной области [8, с. 187]. Они имеют много общего с иерархическими и сетевыми моделями данных, могут использоваться как средство построения структуры соответствующих баз данных.

Семантические модели должны отвечать следующим требованиям:

– обеспечивать интегрированное представление о предметной области;

– иметь понятийный аппарат модели, доступный как специалисту предметной области, так и администратору БД;

– содержать информацию, достаточную для дальнейшего проектирования ЭИС.

Семантические модели данных оперируют общим набором понятий и отличаются конструкциями, применяемыми для их выражения, полнотой отражения понятий, удобством использования при разработке ЭИС. Как эталон семантической полноты рассматривается естественный язык, а для формализации языковых конструкций в моделях привлекается аппарат математической лингвистики.

Рассмотрим конструкции естественного языка (высказывания), декомпозиция которых невозможна без утраты смысла. Структура высказываний оказывается достаточной для выражения закономерностей, присутствующих в предметной области и ЭИС.

Элементами высказываний служат атомарные факты. Способ представления атомарного факта состоит в указании объектов, их взаимодействий и свойств, которые описывают событие, соответствующее атомарному факту, а также обозначении времени наступления этого события.

Объекты могут быть атомарными и составными. Атомарный объект –это любой объект, разложение которого на другие объекты в рамках данной предметной области не производится. Составные объекты содержат так или иначе организованные множества объектов. Рекурсивно применяя это определение, можно получить произвольную структуру объектов и фактов и рассматривать ее как составной объект. Информация о том, что объект имеет некоторое свойство или несколько объектов взаимосвязаны, представляется в виде высказывания об объекте (или группе объектов).

Существуют правила вывода новых свойств и связей из ранее определенных. Конъюнкция двух свойств является новым свойством. Свойства могут образовывать комбинации и наследоваться через связи.

Объект может существовать независимо от того, определены или нет свойства и связи, к нему относящиеся. Обязательные свойства, необходимые для определения существующего объекта, – это время его появления и время его исчезновения (как элемента информационных потребностей пользователей ЭИС).

Атомарный факт представляется тремя компонентами:

(х, у, t),

где х – множество объектов О ₁, О ₂,..., O_k; у – свойство или связь объектов; t – время.

Объект может быть составным, т. е. построенным как множество других объектов и, возможно, атомарных фактов.

Объекты могут вступать в отношения двух типов – обобщения, когда один объект определяется в виде множества других объектов, и агрегации, когда объект соотносится с именем действия, в котором он может участвовать. Например, объект Личность обобщает такие объекты, как Рабочий, Служащий, Студент; объект Транспорт агрегируется с действием Перевозка. Обобщения и агрегации могут образовывать иерархические структуры.

Семантические модели данных обычно предполагают два уровня интерпретации: уровень объектов предметной области и уровень атрибутов базы данных. При необходимости их можно совместить в одном представлении.

Известно достаточно большое число семантических моделей данных (рис. 16), однако используемые в них понятия, идеи и методы характеризуются большим сходством, что облегчает их совместное рассмотрение.

Рис. 16

Модель сущностей и связей является наиболее распространенной семантической моделью. Она использует графическое представление всех компонентов. Базовыми элементами модели «сущность – связь» служат типы сущностей, обозначаемые далее прямоугольниками, и типы связей, обозначаемые двойными прямоугольниками [8, 9]. Многие сущности, рассматриваемые в этой модели, соответствуют физическим объектам предметной области.

Структура предметной области в модели «сущность – связь» изображается в форме диаграммы. Дуги на диаграмме соединяют тип сущности с типом связи. На дугах указывается 1 или m в соответствии с тем, сколько раз идентификатор объекта может возникнуть в строках отношений, представляющих связи объектов (1 – один раз, m – несколько раз).

Диаграмма может или представлять только объекты и связи, или дополнительно содержать атрибуты, описывающие их свойства. На рис. 17–19 показаны разные типы связей (объекты и связи, без атрибутов): N -арная, рекурсивная и несколько связей для одной и той же пары объектов, соответственно.

Представление предметной области с помощью модели «сущность – связь» позволяет:

– однозначно разработать структуру многоуровневой сетевой базы данных;

– обеспечить одинаковое понимание всеми пользователями содержимого базы данных.

Рис. 17

Рис. 18

Рис. 19

Модель «сущность – связь» характеризуется рядом недостатков:

– отсутствуют изобразительные средства для фиксации организационной иерархии процессов управления и агрегации данных по уровням управления;

– принятое в модели правило формирования множества отношений базы данных создает слишком много отношений для объектов и связей. В результате диаграмма объектов и связей реальной задачи быстро становится громоздкой и необозримой.

Считается, что возможности выражения семантики в терминах сущностей и связей весьма ограничены. Повышение выразительной силы изобразительных средств достигается в модели семантической сети.

Семантические сети применительно к задачам проектирования структуры базы данных ЭИС используются в сравнительно узком диапазоне – для представления структуры понятий и структуры событий.

Семантические сети – это ориентированные графы с помеченными дугами [8, с. 192]. Они позволяют структурировать имеющуюся информацию и знания. Аппарат семантических сетей выступает естественной формализацией ассоциативных связей, которыми пользуется человек при извлечении каких-либо новых фактов из имеющихся. Построение сети способствует осмыслению информации и знаний, поскольку дает возможность установить противоречивые ситуации, недостаточность информации и т. п.

Обычно в семантической сети предусматривается четыре категории вершин:

– понятия (объекты);

– события;

– свойства;

– значения.

Понятияпредставляют собой константы или параметры, которые характеризуют физические или абстрактные объекты. Событияотражают действия, происходящие в реальном мире, и определяются указанием типа действия и ролей, которые объекты играют в этом действии. Свойстваиспользуются для представления состояния или для модификации понятий и событий.

Сведения семантической сети образуют сценарий, который является набором понятий, событий, причинно-следственных связей. Применительно к базе данных сценарий может рассматриваться как шаблон, которому должна соответствовать хранимая информация, чтобы обеспечивалась ее осмысленность.

Необходимо различать вершины,обозначающие экземпляры объектов, и вершины,представляющие классы объектов. Например, Петров – экземпляр типа Студент. В семантической сети экземпляр может принадлежать более чем к одному классу (Петров – и Студент, и Спортсмен). Различные роли Петрова отображаются его принадлежностью к различным классам. Петров – студент в своих связях с преподавателями и дисциплинами, а в отношениях с тренером и командой он – спортсмен.

В других моделях, в отличие от семантической сети, типы объектов указаны в схеме, а экземпляры объектов представлены значениями в базе данных. В семантической сети один и тот же экземпляр объекта может быть соотнесен с несколькими типами. В синтаксических моделях (реляционной, сетевой или иерархической) для обеспечения такой связи потребуется дублирование информации об объекте.

Различие между вершинами сети (представлением экземпляра и представлением класса) приводит к существованию трех типов дуг:

– дуги, соединяющей два экземпляра, которая соответствует утверждению;

– дуги между классом и экземпляром, которая показывает пример классов;

– дуги, связывающей два класса, которая определяет бинарное отношение классов.

Все семантические отношения предметной области можно разделить на следующие:

– лингвистические;

– логические;

– теоретико-множественные;

– квантификационные.

Лингвистические отношениябывают глагольные (время, вид, род, число, залог, наклонение) и атрибутивные (модификация, размер, форма).

Логические отношения подразделяются на конъюнкцию, дизъюнкцию, отрицание и импликацию.

Теоретико-множественные отношения – это отношение подмножества, отношение части и целого, отношение множества и элемента. Они обладают свойством транзитивности.

Квантификационные отношенияделятся на логические кванторы общности и существования, нелогические кванторы («много», «несколько») и числовые характеристики.

Основой для определения того или иного понятия является множество его отношений с другими понятиями.

Обязательными отношениями выступают:

– класс, к которому принадлежит данное понятие;

– свойства, выделяющие понятие из всех понятий данного класса;

– примеры данного понятия.

Поскольку термины, использованные в толковании понятия, сами служат понятиями, то их трактовка организуется по той же схеме. В итоге связи понятий образуют структуру, в общем случае сетевую.

Существуют две обязательные связи при установлении структуры понятий:

– связь «есть-нек» (от слов «есть некоторый»): направлена от частного понятия к более общему и отражает принадлежность элемента к классу;

– связь «есть-часть»: показывает, что объект содержит в своем составе разнородные компоненты (объекты), не подобные данному объекту.

Пример семантической сети для описания структуры понятия «юридическое лицо» приведен на рис. 20. Одинарными линиями показаны связи «есть-нек», двойными – связи «есть-часть». В семантической сети с помощью связи «есть-нек» можно иллюстрировать ссылку на экземпляр объекта.

Рис. 20

Для представления событий и действий с помощью семантической сети предварительно выделяются простые отношения, которые характеризуют основные компоненты события [8, 9]. В первую очередь из события вычленяется действие, которое обычно описывается глаголом. Далее необходимо определить объекты, которые действуют, объекты, над которыми эти действия производятся, и т. д. Все эти связи предметов, событий и качеств с глаголом называются падежами. Обычно рассматривают следующие падежи:

– агент: предмет, являющийся инициатором действия;

– объект: предмет, подвергающийся действию;

– источник: размещение предмета перед действием;

– приемник: размещение предмета после действия;

– время: указание на то, когда происходит событие;

– место: указание на то, где происходит событие;

– цель: указание на цель действия.

На рис. 21 приводится семантическая сеть, описывающая структуру события «Директор объединения,,Продтовары“» остановил 25 марта 2010 г. РТП № 1, чтобы заменить торговое оборудование».

Рис. 21

Отметим ряд преимуществ семантических сетей:

– описание объектов и событий производится на уровне, очень близком к естественному языку;

– обеспечивается возможность сцепления различных фрагментов сети;

– в семантической сети возможные отношения между понятиями и событиями образуют достаточно небольшое и хорошо формализованное множество;

– для каждой операции над данными и знаниями можно выделить из полной сети, представляющей всю семантику (или все знания), некоторый участок, который охватывает необходимые в данном запросе смысловые характеристики.

В настоящее время ведутся теоретические исследования семантических моделей данных для обеспечения их совместимости с программными спецификациями запросов к базе данных. Уже достигнуто использование общего понятийного аппарата в описаниях структуры информации и алгоритмов.

Способность человека накапливать и применять знания, принимать решения можно назвать естественным интеллектом. Соответствующие возможности информационной системы определяются как искусственный интеллект.

Система понятий для представления знаний существенно отличается от понятий для представления данных, поэтому отображение знаний производится в базу знаний. Вместе с тем база знаний способна хранить данные как простую разновидность знаний.

Запросы, которые формулируются пользователями информационной системы, реализуются одним из двух возможных способов:

– сообщения, являющиеся ответом на запрос, хранятся в явном виде в БД, и процесс получения ответа представляет собой выделение подмножества значений из файлов БД, удовлетворяющих запросу;

– ответ не существует в явном виде в БД и формируется в процессе логического вывода на основании имеющихся данных.

База знаний содержит:

– сведения, которые отражают существующие в предметной области закономерности и позволяют выводить новые факты, справедливые в данном состоянии предметной области, но отсутствующие в БД, а также прогнозировать потенциально возможные состояния предметной области;

– сведения о структуре ЭИС и БД (метаинформацию);

– сведения, обеспечивающие понимание входного языка, т. е. перевод входных запросов на внутренний язык [1, 2, 6, 8, 9].

Принято говорить не о знаниях вообще, а о знаниях, зафиксированных с помощью той или иной модели знаний. Принципиальными различиями обладают три модели представления знаний – продукционная модель, модель фреймов и модель семантических сетей.

Продукционная модель (модель логического вывода) состоит из трех основных компонентов:

– набора правил, представляющего собой в продукционной системе базу знаний;

– рабочей памяти, в которой хранятся исходные факты и результаты выводов, полученных из этих фактов;

– механизма логического вывода, использующего правила в соответствии с содержимым рабочей памяти и формирующего новые факты [8, с. 198].

Каждое правило содержит условную и заключительную части. В условной находится одиночный факт либо несколько фактов (условий), соединенных логической операцией «и». В заключительной части размещены факты, которые необходимо дополнительно сформировать в рабочей памяти, если условная часть правила является истинной.

Представление знаний в виде набора правил имеет следующие преимущества:

– легкость создания и понимания отдельных правил;

– простота механизма логического вывода.

К недостаткам этого способа организации базы знаний относятся неясность взаимных отношений правил и отличие от человеческой структуры знаний.

В основе теории фреймов лежит фиксация знаний путем сопоставления новых фактов с рамками, обозначенными для каждого объекта в сознании человека [1, 8, 9].Структура в памяти ЭВМ, представляющая эти рамки, называется фреймом.С помощью фреймов мы пытаемся выразить процесс систематизации знаний в форме, максимально близкой к принципам систематизации знаний человеком.

Фрейм – это таблица, структура и принципы организации которой являются развитием понятия отношения в реляционной модели данных [8, с. 201]. Новизна фреймов определяется двумя условиями:

– имя атрибута может в ряде случаев занимать во фрейме позицию значения;

– значением атрибута может служить имя другого фрейма или имя программно реализованной процедуры.

Слотом фрейманазывается элемент данных, предназначенный для фиксации знаний об объекте, которому отведен данный фрейм. Перечислим параметры слотов.

1. Имя. Каждый слот должен иметь уникальное имя во фрейме, к которому он принадлежит. Имя слота в некоторых случаях может быть служебным. Среди служебных имен отметим имя пользователя, определяющего фрейм; дату определения или модификации фрейма; комментарий.

2. Указатель наследования. Он показывает, какую информацию об атрибутах слотов во фрейме верхнего уровня наследуют слоты с теми же именами во фрейме нижнего уровня. Приведем типичные указатели наследования:

– S (тот же): слот наследуется с теми же значениями данных;

– U (уникальный): слот наследуется, но данные в каждом фрейме могут принимать любые значения;

– I (независимый): слот не наследуется.

3. Указатель типа данных. Ктипам данных относятся:

– FRAME (указатель): указывает имя фрейма верхнего уровня;

– АТОМ (переменная);

– TEXT (текстовая информация);

– LIST (список);

– LISP (присоединенная процедура).

С помощью механизма управления наследованием по отношениям «есть-нек» осуществляются автоматический поиск и определение значений слотов фрейма верхнего уровня и присоединенных процедур.

Фреймовые системы обеспечивают ряд преимуществпо сравнению с продукционной моделью представления знаний:

– знания организованы на основе концептуальных объектов;

– допускается комбинация представления декларативных (как устроен объект) и процедурных (как он взаимодействует) знаний;

– иерархия фреймов вполне соответствует классификации понятий, привычной для восприятия человеком;

– система фреймов легко расширяется и модифицируется.

Трудности применения фреймовой модели знаний в основном связаны с программированием присоединенных процедур.

Особенность семантической сети как модели знаний состоит в единстве базы знаний и механизма вывода новых фактов. На основании вопроса к базе знаний строится семантическая сеть, отображающая структуру вопроса, и ответ выдается в результате сопоставления общей сети для базы знаний в целом и сети для вопроса. Cемантические сети предлагают достаточно понятный способ представления знаний на основе отношений между вершинами и дугами сети. Однако с увеличением размеров сети ухудшается ее обозримость и увеличивается время вывода новых фактов с помощью механизма сопоставления.

Считается, чтомодели знаний – продукционная, фреймовая и модель семантических сетей – обладают практически равными возможностями представления знаний, использующих отношения «есть-нек» и «есть-часть [8, с. 206]. Дополнительно каждая модель знаний содержит средства усиления этой базовой конфигурации:

– продукционная модель позволяет легко расширять и усложнять множество правил вывода;

– фреймовая модель дает возможность усилить вычислительные аспекты обработки знаний за счет расширения множества присоединенных процедур;

– модель семантических сетей позволяет расширять список отношений между вершинами и дугами сети, приближая выразительные возможности сети к уровню естественного языка.

Контрольные вопросы и задания

1. Что используется для представления структуры предметной области?

2. Каким требованиям должны отвечать семантические модели?

3. Перечислите разновидности семантических моделей.

4. Охарактеризуйте модель «сущность – связь».

5. Раскройте сущность модели семантических сетей.

6. Чем отличается представление знаний от технологии баз данных?

7. Что включает в себя содержание базы знаний?

8. Назовите разновидности моделей представления знаний.

9. Расскажите о продукционной модели.

10. Каковы особенности модели фреймов?

11. Охарактеризуйте семантические сети для представления знаний.

12. Выполните задания 2.94–2.101 из практикума [9, с. 125–129].

⇐ Предыдущая 6 7 8 9 10 11 121314 15 Следующая ⇒

Дата публикования: 2014-11-03; Прочитано: 1581 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!

studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.018 с)...