Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Обобщенная модель документа



=

Как показывает анализ существующих определений, каждый тип документа является функцией следующих документообразующих признаков:

Д=f(С[g],Н[i],А[q],Ф[j],У[h],П[w],М[w]), (1) где:

Д - документ;
С[g] - содержание информации, отражаемой в документе;
Н[i] - носитель информации;
А[q] - алфавит представления информации;
Ф[j] - метод(способ) фиксации информации(данных), зафиксированной в документе;
У[h] - устройство (техническое средство), обеспечивающее как воспроизводство документа в форме, пригодной для восприятия человеком, так и регистрацию(фиксацию), сбор, передачу, хранение и обработку, ввода-вывода документов;
П[w] - правила (способы, методы, алгоритмы, программы) преобразования документов (информации (данных)) при изменении носителя информации, устройств воспроизведения, фиксации, сбора, передачи, хранения, обработки, вводав-ывода документов;
М[z] - метаинформация о документе(информация, описывающая документ).

В первом приближении, документообразующие признаки могут быть заданы следующим перечень:
1. Содержание информации, отражаемой в документе (С[g], где g=.):

1.1. Проблемная область информации, отраженной в документе:

1.1.1. Научно-техническая информация.
1.1.2. Экономическая информация.
1.1.3. Управленческая информация.
1.1.4. Технологическая информация.
1.1.5. Производственная информация.
1.1.6. Юридическая информация.
1.1.7. Справочная информация.
1.1.8. Социальная информация.
1.1.9. Медицинская информация.
1.1.10. Прочая(в том числе: художественная, религиозная, музыка, искусство, литература и т.д.).

1.2. Описательная информация о документе (информация, описывающая документ):

1.2.1. Реферативно-библиографические данные (в соответствии с принятыми нормами описания конкретного вида документа).
1.2.2. Лингвистические средства, раскрывающие содержание документа (классификации, классификаторы, рубрикаторы, тезаурусы и дескрипторные словари, прочие словарно-терминологические средства).
1.2.3. Идентификационная информация, способствующая однозначной идентификации документа и его места в совокупности взаимосвязанных документов, а также связей документа с другими документами, фондами документов, владельцами и прочее.

2. Носитель информации (Н[i],где i=..):

2.1. Бумажный носитель:

2.1.1. Документы, подготовленные с помощью традиционных средств полиграфии.
2.1.2. Бумажный носитель для устройств типа "принтер".
2.1.3. Перфолента.
2.1.4. Перфокарта.
2.1.5. Носители для устройств отображения.

2.2. Магнитные и магнитооптические (CD-ROM) носители:

2.2.1. Магнитная лента.
2.2.2. Магнитные диски и дискеты.
2.2.3. Жесткие диски (винчестеры).
2.2.4. CD-ROM.
2.2.5. Оперативная память.

2.3. Микрофильмовые носители и кинофотоматериалы:

2.3.1. Микрофильмы.
2.3.2. Микрофиши.
2.3.3. Фотоносители.
2.3.4. Киноматериалы.

2.4. Устройства отображения:

2.4.1. Табло для алфавитно-цифровой информации.
2.4.2. Экраны.
2.4.3. Самописцы.

2.5. Сообщения по линиям связи.

3. Алфавит представления информации (А[q],где q=..):

3.1. Цифры.
3.2. Буквы.
3.3. Символы иероглифических систем письменности.
3.4. Знаки:

3.4.1. Математические и химические знаки.
3.4.2. Почтовые знаки.
3.4.3. Картографические знаки.
3.4.4. Железнодорожные и пароходные знаки, знаки правил уличного движения и прочие.
3.4.5. Метеорологические знаки.
3.4.6. Астрономические и лунные знаки.

3.5. Прочие системы специальных знаков и условных обозначений (знаки радиоэлектронных схем, технологических процессов и прочее).

4. Метод (способ) фиксации информации (данных),зафиксированной в документе (Ф[j], где j=...):

4.1. Тексты.
4.2. Формульная информация (в том числе различные методы представления химических формул и структур).
4.3. Табличная информация (в том числе: бланковая, анкетная).
4.4. Графика (рисунки, чертежи, карты, изображения,видеоматериалы и прочее).
4.5. Представление пространственных данных.
4.6. Аудиоинформация.
4.7. Аудиовизуальная информация.
4.8. Цифровая и аналоговая информация, записываемая различной регистрирующей аппаратурой.
4.9. Перфорация (от азбуки для слепых до кодовых комбинаций на перфоносителях).

5. Устройство (техническое средство), обеспечивающее как воспроизводство документа в форме, пригодной для восприятия человеком, так и регистрацию (фиксацию). сбор, передачу, хранение и обработку, ввода-вывода документов (У[h], где h=..):

5.1. Средства ручной обработки.
5.2. Оргтехника.
5.3. Микрофильмовая техника (все средства кинофототехники).
5.4. Элекронно-вычислительная техника (в том числе: ЭВМ, телевизионная техника).
5.5. Средства и каналы связи.

6. Правила (способы, методы, алгоритмы, программы) преобразования документов (информации (данных)) при изменении носителя информации, устройств воспроизведения, фиксации, сбора, передачи, хранения, обработки, ввода-вывода документов (П[w] где w=..):

6.1. Преобразования:

6.1.1. Информации (данных).
6.1.2. Носителей.
6.1.3. Технических средств.
6.1.4. Алгоритмов, программ, правил.

6.2. Операции обработки:

6.2.1. Копирование.
6.2.2. Контроль.
6.2.3. Поиск.
6.2.4. Восстановление.
6.2.5. Защита.
6.2.6. Ввод-вывод.
6.2.7. Преобразование:

6.2.7.1. Редактирование (включение, замена, извлечение, объединение, сегментирование, гашение, уничтожение, создание связи, изменение положения, упорядочение, слияние, группировка).
6.2.7.2. Кодирование-декодирование, траслитерация, транскрибирование.

6.2.8. Просмотр.
6.2.9. Обмен.
6.2.10. Хранение.
6.2.11. Прочие операции.

7. Метаинформация о документе (информация, описывающая документ) (М[z],где z=..):

7.1. Описание структуры документа.
7.2. Описание системы кодирования, включаемой в документ.
7.3. Описание операций, разрешенных над информацией, включаемой в документ.
7.4. Описание информации, включаемой в документ.
7.5. Описание информации, идентифицирующей документ.
7.6. Описание технических средств, необходимых для обработки документов и информации, включенной в документ.
7.7. Описание правил, алгоритмов, программ, обеспечивающих работу с документом.

Перечень составлен на основании анализа документов, циркулирующих в различных сферах человеческой деятельности.

Приведенный перечень с достаточной полнотой отражает состояние (уровень развития) современных информационных технологий, опирающихся на документальные информационные ресурсы.

Каждый документ характеризуется своим набором признаков. С другой стороны, один и тот же по содержанию документ может иметь различную форму представления в зависимости от того, в какой информационной структуре он функционирует.

Общее количество видов и форм документов, используемых в качестве источников информации, неизвестно.

Только по признакам, входящим в группу "содержание информации" различные исследователи состава фондов крупнейших библиотек и информационных центров выявили, около 110-130 видов документов (широкого распространения и непубликуемых).

Существуют различные классификационные перечни этих видов документов. Применительно к фондам научно-технических документов, как правило, выделяют 6 классификационных групп:

Анализ по методу Цвикки (морфологический анализ) позволяет на основании перечисленных документообразующих признаков выявить более широкую гамма видов документов, которые находятся в жесткой зависимости от информационной инфраструктуры (технической, программной и технологической).

Функционирование документальных информационных ресурсов (особенно представленных на машиночитаемых носителях) свидетельствует о том, что период их "жизненного цикла" существенно превосходит периоды "жизненного цикла" конкретных технических средств, программных продуктов, поколения ЭВМ. Изменение технической и программной конфигурации автоматизированных информационных систем порождает проблему непрерывного конвертирования информационных массивов, которая по мере увеличения их объема становится все более дорогостоящей процедурой. С другой стороны, процессы конвертирования создают условия безвозвратной утраты тех или иных ресурсов в результате неадекватных процессов преобразования и/или утраты связей массивов с программной и технической средой, обеспечивающей их целостность и обработку, и/или утратой массивов и/или программных средств, обеспечивающих идентификацию и однозначное декодирование данных и т.п.

Нарастающее многообразие документообразующих признаков, ведет к сверхизбыточному нарастанию несовместимых форм представления информации в документах, что существенным образом увеличивает число барьеров межу информацией, зафиксированной в документе, и пользователем, желающим получить доступ к этой информации.

Если при использовании документов на традиционных носителях, основным барьером, при условии получения документа, был "языковой барьер" и уровень профессиональной подготовки пользователя, то переход к машиночитаемым носителям, количество барьеров резко возрастает.

Основные барьеры доступа к документальным информационным ресурсам в зависимости от различных документообразующих признаков в первом приближении могут быть заданы следующим перечнем:

1. Барьеры, возникающие при использовании микрофильмовых носителей (микрофильмы, микрофиши):

2. Магнитные и магнитооптические (CD-ROM) носители (магнитная лента, магнитные диски, дискеты, жесткие диски (винчестеры), CD-ROM, оперативная память):

3. Алфавит представления информации:

  1. Несовместимость символьного набора.
  2. Несовместимость системы кодирования.
  3. Несовместимые системы правил лексикографического упорядочения.
  4. Несовместимость используемых символьных множеств с языками представления информации и типами представляемой информации.
  5. Неразличимость "синонимии" символов (начертательной и кодовой).
  6. Несовместимость правил транслитерирования.

4. Устройство (техническое средство):

5. Правила (способы, методы, алгоритмы, программы) преобразования документов (информации, данных):

6. Метаинформация о документе (информация, описывающая документ):

Исходя из изложенного, следует сделать следующие вывод:

  1. Современный уровень развития информационных технологий с документальными ресурсами и тенденции их развития встраивают между носителем информации и пользователем информации, зафиксированной на носителе, сложнейшую техногенную среду (техническую, алгоритмическую, программную, технологическую), без участия которой пользователь не способен получить доступ к информации и воспринимать ее.
  2. Несовместимость техногенной среды создает значительные трудности для восприятия информации, зафиксированной на машиночитаемых носителях, и во многих случаях ведет к их безвозвратной утрате.
  3. Использование машиночитаемых ресурсов возможно в том и только том случае, если они используются в согласованной (нормализованной, стандартизованной) техногенной среде. Требуемый уровень согласования для различных типов машиночитаемых документов различен. Соответственно каждая техногенная среда позволяет осуществлять работу с различными (свойственными только для нее) типами машиночитаемых ресурсов. Более того, различные модификации (версии) одной и той же техносферы могут порождать несовместимые машиночитаемые информационные ресурсы. К этой категории барьеров относятся ситуации связанные с использованием несовместимых текстовых редакторов, драйверов, видеокарт, системные требования к конфигурации и прочее.
  4. Современный уровень развития техносферы визуализации и использования информации, зафиксированной на машиночитаемых носителях, порождает формирование информационных ресурсов с высокой степенью "нерегулируемой (скрытой) криптографичности", определяемой несогласованностью инструментальных средств, находящихся в распоряжении конкретных пользователей. "Нерегулируемая (скрытая) криптографичность" информационных ресурсов, в свою очередь, порождает неадекватное воспроизводство информации, содержащейся на носителе, что исключает ее использование.

В каждый данный момент времени конкретная информационная система находится в состоянии информационной, технической, программной и технологической совместимости. Но система непрерывно развивается (модернизируется, модифицируется): изменяется состав технических, программных и технологических средств. Развиваются и внешние информационные системы.

Собственное развитие осуществляется, как правило, с учетом принятых ранее технических и программных решений (не исключаются случаи преобразований от "чистого листа", когда происходят принципиальные изменения, коренная ломка структуры технических и программных средств).

Каждая внешняя система, осуществляя аналогичный процесс развития, принимает иные проектные решения, обеспечивающие свои цели.

В результате в системах накапливаются документальные информационные ресурсы, несовместимые на уровне технических средств, различающиеся по структуре, форматам представления данных, методам кодирования, правилам содержательного описания и т.д. Взаимодействие пользователя с такими ресурсами невозможно без разработки системы комплексных программных средств, обеспечивающих конвертацию информационных массивов к виду, при котором могут осуществляться информационные технологии, образованные "новой конфигурацией" программно-технического комплекса системы на новый текущий момент времени. Создается ситуация, при которой "ретроспективные" массивы, даже приведенные к формальным условиям совместимости с массивами "на данный момент времени", являются неадекватной формой представления ранее накопленной информации. Степень этой "неадекватности" различна, она, как правило, соответствует той степени "правильности", которую удалось обеспечить при конвертировании к новой форме представления.

При этом нужно учитывать, что взаимнооднозначное преобразование информационных массивов не всегда имеет место. Это положение относится как к собственным массивам системы, так, особенно, и к массивам внешних систем.

Например, несмотря на разработку мощных современных текстовых процессоров и баз данных, далеко не всегда между ними возможен взаимный экспорт (импорт) файлов.

Многократное конвертирование, в конечном счете, может создать условия абсолютной утраты достоверности информации.

Ситуация осложняется тем, что:

В результате воздействия всех факторов возможно создание условий, при которых создаются условия ФАКТИЧЕСКОЙ НЕДОСТУПНОСТИ к ФОРМАЛЬНО ДОСТУПНЫМ информационным ресурсам.
=





Дата публикования: 2015-01-10; Прочитано: 569 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.012 с)...