Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Классификация и кодирование информации



Одной из операций при работе с информацией является классификация информации об объектах.

Классификация объектов - система распределения объектов (предметов, явлений, процессов, понятий) по классам в соответствии с определенным признаком.

Разработаны 3 метода классификации объектов: иерархический, фасетный, дескрипторный.

Иерархическая система классификации строится следующим образом:

исходное множество элементов составляет 0-й уровень и делится в зависимости от выбранного классификационного признака на классы (группировки), которые образуют 1-й уровень.

каждый класс 1-го уровня в соответствии со своими, характерным для него классификационным признаками делится на подклассы, которые образуют 2-й уровень

и т.д.

Пример. Иерархическая система классификации для информационного объекта «Факультет» (рис.1.6), которая позволяет классифицировать информацию о студентах по следующим признакам: факультет, на котором студент учится, возрастной состав, пол, для женщин – наличие детей.

Рис. 1.6. Пример иерархической системы классификации

Фасетная система классификации позволяет выбирать признаки классификации независимо как друг от друга, так и от семантического содержания классифицируемого объекта. Признаки классификации называются фасетами. Каждый фасет (Фi) содержит совокупность однородных значений данного классификационного признака. Процедура классификации состоит в присвоении каждому объекту соответствующих значений из фасетов. При этом могут быть использованы не все фасеты (рис. 1.7.)

Рис. 1.7. Фасетная система классификации

Пример. Для объектов, использованных в предыдущем примере, разработаем фасетную классификацию (рис. 1.8.)

Рис. 1.8. Пример фасетной классификации

Дескрипторная система классификации. Для организации поиска информации, для ведения тезарусов (словарей) эффективно используется дескрипторная (описательная) система классификации. Особенно широко она используется в библиотечной системе поиска. Суть этого метода классификации в следующем:

отбирается совокупность ключевых слов или словосочетаний, описывающих определенную предметную область или совокупность однородных объектов. Причем среди ключевых слов могут находиться синонимы.

выбранные ключевые слова и словосочетания подвергаются нормализации, т.е. из совокупности синонимов выбирается один или несколько наиболее употребимых;

создается словарь дескрипторов, т.е. словарь ключевых слов и словосочетаний, отобранных в результате процедуры нормализации.

Система кодирования применяется для замены названия объекта на условное обозначение (код) в целях обеспечения удобной и более эффективной обработки информации.

Система кодирования - совокупность правил кодового обозначения объектов.

Код строится на базе алфавита, состоящего из букв, цифр и других символов. Код характеризуется:

длиной - число позиций в коде;

структурой - порядок расположения в коде символов, используемых для обозначения классификационного признака.

Можно выделить две группы методов, используемых в системе кодирования (рис. 1.9):

классификационная система кодирования, основанная на проведении предварительной классификации объектов (иерархической или фасетной);

регистрационная система кодирования, не требующая предварительной классификации объектов.

Рис. 1.9. Системы кодирования, использующие разные методы

Последовательное кодирование используется для иерархической системы классификации. Сначала записывается код старшей группировки 1-го уровня, затем код группировки 2-го уровня и т.д.

Пример. Для объекта ФАКУЛЬТЕТ (см. выше) можно задать следующие коды:

131 - студенты медицинского факультета, свыше 30 лет, мужчины.

2221 - студенты факультета экономики и права, от 20 до 30, женщины, имеющие детей.

Параллельное кодирование используется для фасетной системы классификации. Все фасеты кодируются независимо друг от друга; для значений каждого фасета выделяется определенное количество разрядов кода.

Пример. Для объекта ФАКУЛЬТЕТ код 1310 расшифровывается аналогично предыдущему, но 4-й разряд равен 0 т.к. значение для мужчин не определено.

Порядковая система кодирования предполагает последовательную нумерацию объектов числами натурального ряда.

Серийно-порядковая система кодирования предусматривает предварительное выделение групп объектов, которые образуют серию, а затем в каждой серии производится порядковая нумерация объектов.





Дата публикования: 2014-11-18; Прочитано: 7319 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.006 с)...