Главная Случайная страница Контакты | Мы поможем в написании вашей работы! | ||
|
Дескрипторная модель данных относится к моделям гибридного типа, позволяющим реализовывать различные способы взаимодействия между объектами. Она является развитием объектно-характеристической модели для предметной области, описание которой наиболее удобно строить как описание совокупности:
- документов и отношений между ними;
- свойств, выражающих основное смысловое содержание процессов и явлений ПО, отображаемых в документах и отношений между свойствами.
При построении дескрипторной модели исходят из гипотезы о том, что:
- ПО можно адекватно описать как совокупность документов и отношений между ними;
- основное смысловое содержание каждого документа может быть описано набором дескрипторов с заданными отношениями между ними;
- каждый документ может быть описан конечным набором свойств с конечным числом их значений и отношений между ними;
- описание совокупности документов достаточно для описания ПО.
Пусть D = (d1, d2... di... dm) - множество документов, отображающих ПО. Множество свойств ПО, отображаемых в документах, обозначим Х0. Разобьем его на два подмножества:
- жесткоструктурируемых свойств, назовем их фактографическими;
- неструктурируемых и слабоструктурируемых свойств, которые выражают основное смысловое содержание процессов и явлений ПО, отображаемых в документах. Назовем эти свойства смысловыразительными и будем описывать с помощью дескрипторов.
При описании свойства фиксируют его название и значение.
Тогда
X=(x1, x2... xj... xn) - подмножество названий фактографических свойств документов;
X*=(x1*, x2*... xj*... xn*) - подмножество значений фактографических свойств документов;
T=(t1, t2... tk... tp) - множество имен дескрипторов некоторого тезауруса Т0 предметной области;
T*=(t1*, t2*... tk*... tp*) - семейство множеств смысловыразительных способностей дескрипторов, принадлежащих Т. Мера смысловыразительной способности дескриптора tk для выражения содержания документа обозначается t*k и принимает значения в диапазоне 0 < t*ik < 1 при i - 1,.., m,k = 1,..., n. В частном случае, если t*ik = 0, дескриптор не несет никакой смысловой нагрузки для выражения содержания документа di и, наоборот, при t*ik= 1 дескриптор несет максимальную смысловую нагрузку.
В соответствии с принятой гипотезой основное смысловое содержание документа может быть описано набором дескрипторов с заданными отношениями между ними. Тогда поисковый образ документа di
ПОД (di)= (ti1ti1*,... tiktik*, tiptip*).
Соответственно при построении модели каждый документ описывается в следующем виде:
di = (xi1xi1*,... xijxij*,… xinxin*, ti1ti1*,…tiktik*,… tiptip*).
Тогда совокупность всех документов описывается матрицей
d1 = (x11 x11*,... x1jx1j*,… x1nx1n*, t11t11*,…t1kt1k*,… t1pt1p*)
……………………………………………………………
di = (xi1 xi1*,... xijxij*,… xinxin*, ti1ti1*,…tiktik*,… tiptip*)
……………………………………………………………
dm = (xm1 xm1*,... xmjxmj*,… xmnxmn*, tm1tm1*,…tmktmk*,… tmptmp*)
где m - общее количество документов, п - общее количество фактографических характеристик, р - общее количество дескрипторов.
Названия фактографических характеристик и дескрипторов можно не дублировать. Тогда совокупность всех документов можно описать в следующем виде:
?
Таблица заполняется следующим образом. Каждый столбец ставится во взаимно-однозначное соответствие с одним именем свойства из множества х свойств, а каждая строка – с описанием одного документа. В клетку таблицы, общую для некоторой строки и столбца, вносится значение свойства, имя которого определено столбцом, а принадлежность к документу - строкой.
Строка, которая образована из клеток, заполненных названиями свойств, соответствующих столбцам матрицы, называется ядром схемы свойств таблицы. Столбец, образованный из клеток, заполненных названиями документов, называется ядром схемы документов таблицы. Таблицу, заполненную значениями свойств документов, называют матрицей. Названия свойств, перечисленных в схеме свойств, называют свойствами нулевого ранга. Названия документов, перечисленных в схеме документов, называют документами нулевого ранга.
Структура и связи между элементами ядра схемы свойств, ядра схемы документов и матрицы аналогичны показанным на рис. 10.15.
Матрица дает возможность (как и в случае объектно-характеристической модели) построить на базе ядра схемы документов (свойств) различные варианты общей конструкции схемы -иерархическую, сетевую и реляционную.
Многоаспектную (иерархическую, сетевую или реляционную) схему называют тезаурусом. Нетрудно видеть, что данное определение соответствует общепринятому понятию тезауруса. Действительно, каждой одноаспектной или многоаспектной схеме соответствует некоторое отношение (вид-род, часть-целое, причина-следствие и т. д.) или их совокупность на множествах документов (фактографических или смысловыразительных свойств).
Совокупность тезауруса документопотока, тезауруса фактографических свойств, тезауруса смысловыразительных свойств и связанной с ними матрицы называют дескрипторной, или документально-фактографической, моделью ПО.
Содержание и методика проведения прямого и обратного поиска на базе данной модели аналогичны таковым в объектно-характеристической модели.
40. Объектно-ориентированная модель данных. (Тема 10, стр. 90-95).
Дата публикования: 2015-02-03; Прочитано: 1420 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!