Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Методика проектирования документальных БД. (Тема 11, стр. 108-110)



11.2.1. Методика проектирования документальных БД.

В соответствии с методикой проектирования документаль­ных систем основными этапами этого процесса являются:

- анализ предметной области - описание существующего ин­формационного массива; описание системы доступа; анализ ин­формационных потребностей пользователя; изучение интенсив­ности использования существующей коллекции документов; оп­ределение возможных изменений информационного массива;

- принятие основных проектных решений - о составе БД; о включаемой информации по каждому документу; об организации доступа к документам базы данных.

Начальным этапом проектирования ИС является анализ ПО. Так как создание БД обусловлено существованием пробле­мы доступа к информационному массиву, важно сначала:

1) оп­ределить, изучить и описать имеющийся массив документов, про­анализировать доступные ресурсы системы, данные, их источни­ки, зависимости и взаимосвязи;

2) выяснить, какая информация, в каком виде и когда нужна каждому пользователю.

При изучении массива документов следует особо выделить такие его характеристики, как:

1) тип материала, отраженного в документах (например, являются ли они подборкой - статей из журналов, отчетов об ис­следовательских работах, книг, имен и адресов или комбинацией всех этих типов текстовых материалов; содержатся ли в докумен­тах нетекстовые объекты, такие как графика, аудио, видео и др.);

2) язык написания документов (при необходимости можно предусмотреть записи в БД полностью или частично на языке оригинала);

3) важнейшие темы, разделы массива документов, а также возможность подобной разбивки коллекции документов. Знание этих характеристик позднее отразится на выборе системы упоря­дочения и индексирования;

4) размер массива документов и возможности его роста.

Одновременно с описанием коллекции документов в целом необходимо описывать элементы данных отдельных объектов, документов. Например, при проектировании полнотекстовых БД необходимо указать минимальную, максимальную или среднюю длину документа, текстового поля. Кроме того, следует учитывать, что статьи обычно имеют несколько авторов, составителей, информацию о цитировании, реферат, аннотацию или поясни­тельную записку- Подобные характеристики документов коллек­ции надо выявлять уже на раннем этапе разработки БД, так как в дальнейшем они будут необходимы разработчику при принятии основных проектных решений относительно содержания (соста­ва) БД и разработки структуры записей или документов.

После того как изучена и описана коллекция документов, которая составит основу информационного массива разрабаты­ваемой БД, необходимо подробно изучить круг пользователей будущей БД и функции человека, который будет нести ответст­венность за БД и станет се координатором.

От уровня профессиональной подготовки и от элементар­ного кругозора пользователей будет зависеть степень детализа­ции отдельных компонентов создаваемой БД (например, наличие помощи, пользовательский интерфейс). Л от того, насколько гра­мотно будут определены обязанности человека, занимающегося администрированием БД, и от уровня его компетентности в рабо­те предметной области, зависят форма проведения контроля и ха­рактер управления ресурсами системы документационного обес­печения.

Информация о том, с какими документами какие группы пользователей будут работать, необходима, например, для реше­ния об администрировании доступа пользователей к БД, а соот­ветственно к определенным типам документов. Важной характе­ристикой является также количество пользователей вообще и ис­пользующих систему одновременно.

Что касается непосредственно доступа к документам, то разработчик получает от пользователей информацию о том, ка­кие ключи доступа необходимы, каким образом каждый из поль­зователей желал бы искать информацию в БД. Необходим ли ему поиск по предмету (теме), по дате публикации, по автору или по названию? Возможен ли формальный поиск с использованием булевых операторов? Нужен ли поиск по запросам на естествен­ном языке? Каким образом должны быть отсортированы доку­менты, полученные в результате поиска, создавать ли отчет по ре­зультатам поиска? Существует ли необходимость интеграции до­кументов БД в другие системы?

Особое внимание следует уделить требованиям к выводу информации. Решение этого вопроса зависит от пожеланий поль­зователя, в каком виде должна быть представлена итоговая информация, будь то текст, таблица либо изображение. Пользова­тель должен иметь возможность сортировать информацию по нужным критериям, возможность интеграции документов в раз­личные пакеты прикладных программ, особенно если это касает­ся нетекстовых видов информации.

Следующий этап - принятие основных проектных реше­ний. На данном этапе принимают решения о составе БД, о соста­ве информации по каждому документу, о структуре записей в БД и структуре полей записей.

Определение состава БД базируется на принятии следую­щих решений:

- о включаемой в базу данных информации, например всей опубликованной литературе или только периодических изданий, либо только изданий определенных издательств и т. п.;

- о широте охвата информации, например, рассматривать ли документ как неделимое целое или в соответствии с нуждами пользователей можно производить доступ к отдельным главам; можно создать смысловые группы не по отдельным документам, а по разделам или статьям. Для каждой группы можно опреде­лить, в каком виде будет представлена информация, какой тип информации, кроме текста, будет присутствовать;

- о включении полнотекстовой информации.

Следующим шагом при проектировании БД будет приня­тие решения о составе информации по каждому документу про­ектируемой БД. Этот состав определяется на основе анализа информационных потребностей, возникающих при решении пользователями задач основной деятельности. Данный состав оп­ределяется и требованиями к возможностям поиска информа­ции. Часто для улучшения доступа к информации вводят допол­нительные поля, например для ключевых слов. Однако принятие решения об использовании ключевых слов влечет за собой необ­ходимость принятия решений о контроле за терминами.

Определение структуры записей в документальной БД за­висит от характера информации и ее применения. Важным мо­ментом при принятии данного проектного решения становится выявление типов документов, представление которых в БД мож­но реализовать на основе одинаковой структуры записи. Затем для каждой типовой структуры записи требуется сформировать набор полей, их структуру в записи, а также характеристики ин­формации, представленной в каждом поле. Поля должны быть организованы в определенной логической последовательности. Для контроля каждая запись должна иметь уникальный иденти­фикационный номер. При определении характеристик каждого поля следует задать:

- тип информации, содержащейся в каждом из полей (тексто­вая, числовая, дата и т. д.), что задает возможности ее обработки;

- возможности множественных значений в полях (например несколько авторов);

- во всех ли полях обязательно будут присутствовать значения;

- возможность поиска по полю;

- способ индексирования информации, помещенной в поле (пофразовый или по словам);

- поля, по которым может проводиться сортировка записей при выдаче, и др.

Документальные ИС имеют ряд особенностей, которые не­обходимо учитывать при физической реализации ИС в про­граммных средах [23].

45. Особенности проектирования фактографических БД. (Тема 11, стр. 111-112).





Дата публикования: 2015-02-03; Прочитано: 1228 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.007 с)...