![]() |
Главная Случайная страница Контакты | Мы поможем в написании вашей работы! | |
|
11.2.1. Методика проектирования документальных БД.
В соответствии с методикой проектирования документальных систем основными этапами этого процесса являются:
- анализ предметной области - описание существующего информационного массива; описание системы доступа; анализ информационных потребностей пользователя; изучение интенсивности использования существующей коллекции документов; определение возможных изменений информационного массива;
- принятие основных проектных решений - о составе БД; о включаемой информации по каждому документу; об организации доступа к документам базы данных.
Начальным этапом проектирования ИС является анализ ПО. Так как создание БД обусловлено существованием проблемы доступа к информационному массиву, важно сначала:
1) определить, изучить и описать имеющийся массив документов, проанализировать доступные ресурсы системы, данные, их источники, зависимости и взаимосвязи;
2) выяснить, какая информация, в каком виде и когда нужна каждому пользователю.
При изучении массива документов следует особо выделить такие его характеристики, как:
1) тип материала, отраженного в документах (например, являются ли они подборкой - статей из журналов, отчетов об исследовательских работах, книг, имен и адресов или комбинацией всех этих типов текстовых материалов; содержатся ли в документах нетекстовые объекты, такие как графика, аудио, видео и др.);
2) язык написания документов (при необходимости можно предусмотреть записи в БД полностью или частично на языке оригинала);
3) важнейшие темы, разделы массива документов, а также возможность подобной разбивки коллекции документов. Знание этих характеристик позднее отразится на выборе системы упорядочения и индексирования;
4) размер массива документов и возможности его роста.
Одновременно с описанием коллекции документов в целом необходимо описывать элементы данных отдельных объектов, документов. Например, при проектировании полнотекстовых БД необходимо указать минимальную, максимальную или среднюю длину документа, текстового поля. Кроме того, следует учитывать, что статьи обычно имеют несколько авторов, составителей, информацию о цитировании, реферат, аннотацию или пояснительную записку- Подобные характеристики документов коллекции надо выявлять уже на раннем этапе разработки БД, так как в дальнейшем они будут необходимы разработчику при принятии основных проектных решений относительно содержания (состава) БД и разработки структуры записей или документов.
После того как изучена и описана коллекция документов, которая составит основу информационного массива разрабатываемой БД, необходимо подробно изучить круг пользователей будущей БД и функции человека, который будет нести ответственность за БД и станет се координатором.
От уровня профессиональной подготовки и от элементарного кругозора пользователей будет зависеть степень детализации отдельных компонентов создаваемой БД (например, наличие помощи, пользовательский интерфейс). Л от того, насколько грамотно будут определены обязанности человека, занимающегося администрированием БД, и от уровня его компетентности в работе предметной области, зависят форма проведения контроля и характер управления ресурсами системы документационного обеспечения.
Информация о том, с какими документами какие группы пользователей будут работать, необходима, например, для решения об администрировании доступа пользователей к БД, а соответственно к определенным типам документов. Важной характеристикой является также количество пользователей вообще и использующих систему одновременно.
Что касается непосредственно доступа к документам, то разработчик получает от пользователей информацию о том, какие ключи доступа необходимы, каким образом каждый из пользователей желал бы искать информацию в БД. Необходим ли ему поиск по предмету (теме), по дате публикации, по автору или по названию? Возможен ли формальный поиск с использованием булевых операторов? Нужен ли поиск по запросам на естественном языке? Каким образом должны быть отсортированы документы, полученные в результате поиска, создавать ли отчет по результатам поиска? Существует ли необходимость интеграции документов БД в другие системы?
Особое внимание следует уделить требованиям к выводу информации. Решение этого вопроса зависит от пожеланий пользователя, в каком виде должна быть представлена итоговая информация, будь то текст, таблица либо изображение. Пользователь должен иметь возможность сортировать информацию по нужным критериям, возможность интеграции документов в различные пакеты прикладных программ, особенно если это касается нетекстовых видов информации.
Следующий этап - принятие основных проектных решений. На данном этапе принимают решения о составе БД, о составе информации по каждому документу, о структуре записей в БД и структуре полей записей.
Определение состава БД базируется на принятии следующих решений:
- о включаемой в базу данных информации, например всей опубликованной литературе или только периодических изданий, либо только изданий определенных издательств и т. п.;
- о широте охвата информации, например, рассматривать ли документ как неделимое целое или в соответствии с нуждами пользователей можно производить доступ к отдельным главам; можно создать смысловые группы не по отдельным документам, а по разделам или статьям. Для каждой группы можно определить, в каком виде будет представлена информация, какой тип информации, кроме текста, будет присутствовать;
- о включении полнотекстовой информации.
Следующим шагом при проектировании БД будет принятие решения о составе информации по каждому документу проектируемой БД. Этот состав определяется на основе анализа информационных потребностей, возникающих при решении пользователями задач основной деятельности. Данный состав определяется и требованиями к возможностям поиска информации. Часто для улучшения доступа к информации вводят дополнительные поля, например для ключевых слов. Однако принятие решения об использовании ключевых слов влечет за собой необходимость принятия решений о контроле за терминами.
Определение структуры записей в документальной БД зависит от характера информации и ее применения. Важным моментом при принятии данного проектного решения становится выявление типов документов, представление которых в БД можно реализовать на основе одинаковой структуры записи. Затем для каждой типовой структуры записи требуется сформировать набор полей, их структуру в записи, а также характеристики информации, представленной в каждом поле. Поля должны быть организованы в определенной логической последовательности. Для контроля каждая запись должна иметь уникальный идентификационный номер. При определении характеристик каждого поля следует задать:
- тип информации, содержащейся в каждом из полей (текстовая, числовая, дата и т. д.), что задает возможности ее обработки;
- возможности множественных значений в полях (например несколько авторов);
- во всех ли полях обязательно будут присутствовать значения;
- возможность поиска по полю;
- способ индексирования информации, помещенной в поле (пофразовый или по словам);
- поля, по которым может проводиться сортировка записей при выдаче, и др.
Документальные ИС имеют ряд особенностей, которые необходимо учитывать при физической реализации ИС в программных средах [23].
45. Особенности проектирования фактографических БД. (Тема 11, стр. 111-112).
Дата публикования: 2015-02-03; Прочитано: 1228 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!