Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Система кодирования и классификации



Классификация - разделение множества объектов технико-экономической и социальной информации на подмножества по их сходству или различию в соответствии с принятыми методами, подразделяемыми на иерархический и фасетный.

Методы классификации должны обеспечивать систематизацию объектов классификации по определенным выбранным признакам, которыми могут быть: свойства, характеристики или параметры объектов. Количество значений признака определяет число образуемых классификационных группировок по этому признаку. Для классификации продукции используются, например, следующие признаки: отраслевая принадлежность, назначение, область применения, принцип действия, конструктивные особенности, используемый для изготовления способ и материал. В частности, в Общероссийском классификаторе продукции (ОКП) трубы стальные классифицируются по способу изготовления: тянутые, сварные, центробежнолитые, катаные; по назначению:водогазопроводные, нефтепроводные, подшипниковые, для котлов высокого давления, бурильные, насосно-компрессорные; по виду материала: нержавеющие, углеродистые, эмалированные; по размеру: диаметром 1020 мм, 1220 мм, 1420 мм и другие.

Для описания процесса классификации информации используются следующие термины и определения понятий.

Система классификации - совокупность методов и правил классификации и ее результат.

Объект классификации - элемент классифицируемого множества.

Признак классификации - свойство или характеристика объекта, по которому производится классификация.

Ступень классификации - этап классификации при иерархическом методе, в результате которого получается совокупность классификационных группировок.

Глубина классификации - число ступеней классификации, которое зависит от степени конкретизации группировок и числа признаков, необходимых для решения конкретных задач.

Группировка классификационная - подмножество объектов, полученное в результате классификации.

Метод классификации иерархический - последовательное разделение множества объектов на подчиненные классификационные группировки. В этом методе множество объектов делится сначала по некоторому выбранному признаку (основанию деления) на крупные группировки, затем каждая из этих группировок делится на ряд последующих группировок по другому признаку, конкретизируя объект классификации. Таким образом между классификационными группировками устанавливается подчиненность (иерархия).

Метод классификации фасетный - параллельное разделение множества объектов на независимые классификационные группировки. В этом методе классификационное множество объектов информации описывается набором независимых фасетов (списков), не имеющих жесткой взаимосвязи друг с другом, которые можно использовать отдельно для решения различных задач. Например, в Общероссийском классификаторе информации о населении (ОКИН) используются следующие фасеты: пол, возраст, гражданство, национальности, языки, родство и другие.

Кодирование - присвоение кода классификационной группировке или объекту классификации для обеспечения их однозначной идентификации в классификаторах в соответствии с выбранным методом кодирования с помощью знаков (символов).

Кодирование предназначено для формализованного описания заданного множества объектов, которое позволяет производить эффективную автоматизированную обработку информации. Для описания процесса кодирования информации используются следующие термины и определения понятий.

Код - знак или совокупность знаков, принятых для обозначения классификационной группировки и (или) объекта классификации.

В качестве синонимов кода используются понятия: кодовое обозначение, кодовая комбинация, код объекта. Код (кодовое обозначение) образуется в соответствии с правилами кодирования, принятыми в данной системе кодирования, и характеризуется длиной - числом знаков (разрядов) и структурой - условным обозначением состава и последовательности расположения знаков в коде.

Система кодирования - совокупность методов и правил кодирования классификационных группировок и объектов классификации заданного множества.

Длина кода - число знаков в коде без учета пробелов.

Разряд кода - позиция знака в коде.

Структура кода - условное обозначение состава и последовательности расположения знаков в коде.

Алфавит кода - система знаков, принятых для образования кода.

Алфавит кода буквенный - алфавит кода, знаками которого являются буквы алфавитов естественных языков.

Алфавит кода буквенно-цифровой - алфавит кода, знаками которого являются буквы алфавитов естественных языков и цифры.

Алфавит кода цифровой - алфавит кода, знаками которого являются цифры.

9. Классификационное кодирование:

Классификационное кодирование применяется после проведения классификации объектов. Различают последовательное и параллельное кодирование.

Последовательное кодирование используется для иерархической классификационной структуры. Суть метода заключается в следующем: сначала записывается код старшей группировки 1-го уровня, затем код группировки 2-го уровня, затем код группировки 3-го уровня и т.д. В результате получается кодовая комбинация, каждый разряд которой содержит информацию о специфике выделенной группы на каждом уровне иерархической структуры. Последовательная система кодирования обладает теми же достоинствами и недостатками, что и иерархическая система классификации.

Пример 2.15. Проведем кодирование информации, классифицированной с помощью иерархической схемы (см. рис. 2.4). Количество кодовых группировок будет определяться глубиной классификации и равно 4. Прежде чем начать кодирование, необходимо определиться с алфавитом, т.е. какие будут использоваться символы. Для большей наглядности выберем десятичную систему счисления – 10 арабских цифр. Анализ схемы на рис. 2.4 показывает, что длина кода определяется 4 десятичными разрядами, а кодирование группировки на каждом уровне можно делать путем последовательной нумерации слева направо. В общем виде код можно записать как ХХХХ, где X – значение десятичного разряда. Рассмотрим структуру кода, начиная со старшего разряда:

1-й (старший) разряд выделен для классификационного признака "название факультета" и имеет следующие значения: 1 – коммерческий; 2 – информационные системы; 3 – для следующего названия факультета и т.д.;

2-й разряд выделен для классификационного признака "возраст" и имеет следующие значения: 1 – до 20 лет; 2 – от 20 до 30 лет; 3 – свыше 30 лет; 3-й разряд выделен для классификационного признака "пол" и имеет следующие значения: 1 – мужчины; 2 – женщины;

4-й разряд выделен для классификационного признака "наличие детей у женщин" и имеет следующие значения: 1 – есть дети; 2 – нет детей, 0 – для мужчин, так как подобной информации не требуется.

Принятая система кодирования позволяет легко расшифровать любой код группировки, например:

1310 – студенты коммерческого факультета, свыше 30 лет, мужчины; 2221 – студенты факультета информационных систем, от 20 до 30 лет, женщины, имеющие детей.

Параллельное кодирование используется для фасетной системы классификации. Суть метода заключается в следующем: все фасеты кодируются независимо друг от друга; для значений каждого фасета выделяется определенное количество разрядов кода. Параллельная система кодирования обладает теми же достоинствами и недостатками, что и фасетная система классификации.

Пример 2.16. Проведем кодирование информации, классифицированной с помощью фасетной схемы (см. рис. 2.6). Количество кодовых группировок определяется количеством фасетов и равно 4. Выберем десятичную систему счисления в качестве алфавита кодировки, что позволит для значений фасетов выделить один разряд и иметь длину кода, равную 4. В отличие от последовательного кодирования для иерархической системы классификации в данном методе не имеет значения порядок кодировки фасетов. В общем виде код можно записать как ХХХХ, где X – значение десятичного разряда. Рассмотрим структуру кода, начиная со старшего разряда:

1-й (старший) разряд выделен для фасета "пол" и имеет следующие значения: 1 -мужчины; 2 – женщины;

2-й разряд выделен для фасета "наличие детей у женщин" и имеет следующие значения: 1 – есть дети; 2 – нет детей, 0 – для мужчин, так как подобной информации не требуется;

3-й разряд выделен для фасета "возраст" и имеет следующие значения: 1 – до 20 лет; 2 – от 20 до 30 лет; 3 – свыше 30 лет;

4-й разряд выделен для фасета "название факультета" и имеет следующие значения: 1 – радиотехнический, 2 – машиностроительный, 3 – коммерческий; 4 – информационные системы; 5 – математический и т.д.

Принятая система кодирования позволяет легко расшифровать любой код группировки, например:

2135 – женщины в возрасте свыше 30 лет, имеющие детей и являющиеся студентами математического факультета;

1021 – мужчины возраста от 20 до 30 лет, являющиеся студентами радиотехнического факультета.

10. Регистрационное кодирование:

Регистрационное кодирование используется для однозначной идентификации объектов и не требует предварительной классификации объектов. Различают порядковую и серийно-порядковую систему.

Порядковая система кодирования предполагает последовательную нумерацию объектов числами натурального ряда. Этот порядок может быть случайным или определяться после предварительного упорядочения объектов, например по алфавиту. Этот метод применяется в том случае, когда количество объектов невелико, например кодирование названий факультетов университета, кодирование студентов в учебной группе.

Серийно-порядковая система кодирования предусматривает предварительное выделение групп объектов, которые составляют серию, а затем в каждой серии производится порядковая нумерация объектов. Каждая серия также будет иметь порядковую нумерацию. По своей сути серийно-порядковая система является смешанной: классифицирующей и идентифицирующей. Применяется тогда, когда количество групп невелико.

Пример 2.17. Все студенты одного факультета разбиваются на учебные группы (в данной терминологии – серии), для которых используется порядковая нумерация. Внутри каждой группы производится упорядочение фамилий студентов по алфавиту и каждому студенту присваивается номер.





Дата публикования: 2015-02-03; Прочитано: 704 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2025 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (1.018 с)...