Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Дескрипторная модель данных



Дескрипторная модель данных относится к моделям ги­бридного типа, позволяющим реализовывать различные спо­собы взаимодействия между объектами. Она является разви­тием объектно-характеристической модели для предметной области, описание которой наиболее удобно строить как опи­сание совокупности:

- документов и отношений между ними;

- свойств, выражающих основное смысловое содержание процессов и явлений ПО, отображаемых в документах и отноше­ний между свойствами.

При построении дескрипторной модели исходят из гипоте­зы о том, что:

- ПО можно адекватно описать как совокупность докумен­тов и отношений между ними;

- основное смысловое содержание каждого документа может быть описано набором дескрипторов с заданными отношениями между ними;

- каждый документ может быть описан конечным набором свойств с конечным числом их значений и отношений между ними;

- описание совокупности документов достаточно для описа­ния ПО.

Пусть D = (d1, d2... di... dm) - множество документов, отоб­ражающих ПО. Множество свойств ПО, отображаемых в доку­ментах, обозначим Х0. Разобьем его на два подмножества:

- жесткоструктурируемых свойств, назовем их фактографи­ческими;

- неструктурируемых и слабоструктурируемых свойств, которые выражают основное смысловое содержание процессов и явлений ПО, отображаемых в документах. Назовем эти свой­ства смысловыразительными и будем описывать с помощью де­скрипторов.

При описании свойства фиксируют его название и значение.

Тогда

X=(x1, x2... xj... xn) - подмножество названий фактографи­ческих свойств документов;

X*=(x1*, x2*... xj*... xn*) - подмножество значений фактогра­фических свойств документов;

T=(t1, t2... tk... tp) - множество имен дескрипторов некото­рого тезауруса Т0 предметной области;

T*=(t1*, t2*... tk*... tp*) - семейство множеств смысловыразительных способностей дескрипторов, принадлежащих Т. Мера смысловыразительной способности дескриптора tk для выраже­ния содержания документа обозначается t*k и принимает значе­ния в диапазоне 0 < t*ik < 1 при i - 1,.., m,k = 1,..., n. В частном слу­чае, если t*ik = 0, дескриптор не несет никакой смысловой нагруз­ки для выражения содержания документа di и, наоборот, при t*ik= 1 дескриптор несет максимальную смысловую нагрузку.

В соответствии с принятой гипотезой основное смысловое содержание документа может быть описано набором дескрипто­ров с заданными отношениями между ними. Тогда поисковый об­раз документа di

ПОД (di)= (ti1ti1*,... tiktik*, tiptip*).

Соответственно при построении модели каждый документ описывается в следующем виде:

di = (xi1xi1*,... xijxij*,… xinxin*, ti1ti1*,…tiktik*,… tiptip*).

Тогда совокупность всех документов описывается мат­рицей

d1 = (x11 x11*,... x1jx1j*,… x1nx1n*, t11t11*,…t1kt1k*,… t1pt1p*)

……………………………………………………………

di = (xi1 xi1*,... xijxij*,… xinxin*, ti1ti1*,…tiktik*,… tiptip*)

……………………………………………………………

dm = (xm1 xm1*,... xmjxmj*,… xmnxmn*, tm1tm1*,…tmktmk*,… tmptmp*)

где m - общее количество документов, п - общее количество факто­графических характеристик, р - общее количество дескрипторов.

Названия фактографических характеристик и дескрипто­ров можно не дублировать. Тогда совокупность всех документов можно описать в следующем виде:

?

Таблица заполняется следующим образом. Каждый стол­бец ставится во взаимно-однозначное соответствие с одним именем свойства из множества х свойств, а каждая строка – с описанием одного документа. В клетку таблицы, общую для не­которой строки и столбца, вносится значение свойства, имя ко­торого определено столбцом, а принадлежность к документу - строкой.

Строка, которая образована из клеток, заполненных назва­ниями свойств, соответствующих столбцам матрицы, называется ядром схемы свойств таблицы. Столбец, образованный из клеток, заполненных названиями документов, называется ядром схемы документов таблицы. Таблицу, заполненную значениями свойств документов, называют матрицей. Названия свойств, перечислен­ных в схеме свойств, называют свойствами нулевого ранга. На­звания документов, перечисленных в схеме документов, называ­ют документами нулевого ранга.

Структура и связи между элементами ядра схемы свойств, ядра схемы документов и матрицы аналогичны показанным на рис. 10.15.

Матрица дает возможность (как и в случае объектно-харак­теристической модели) построить на базе ядра схемы докумен­тов (свойств) различные варианты общей конструкции схемы -иерархическую, сетевую и реляционную.

Многоаспектную (иерархическую, сетевую или реляцион­ную) схему называют тезаурусом. Нетрудно видеть, что данное определение соответствует общепринятому понятию тезауруса. Действительно, каждой одноаспектной или многоаспектной схе­ме соответствует некоторое отношение (вид-род, часть-целое, причина-следствие и т. д.) или их совокупность на множествах документов (фактографических или смысловыразительных свойств).

Совокупность тезауруса документопотока, тезауруса факто­графических свойств, тезауруса смысловыразительных свойств и связанной с ними матрицы называют дескрипторной, или доку­ментально-фактографической, моделью ПО.

Содержание и методика проведения прямого и обратного поиска на базе данной модели аналогичны таковым в объектно-характеристической модели.

40. Объектно-ориентированная модель данных. (Тема 10, стр. 90-95).





Дата публикования: 2015-02-03; Прочитано: 1420 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.008 с)...