Главная Случайная страница Контакты | Мы поможем в написании вашей работы! | ||
|
Для уменьшения количества терминов в ПО вводят ИПТ (тезаурус - синоним), в котором отражаются устойчивые связи между понятиями данной предметной области.
Тезаурус – семантическая сеть, в которой понятия связаны регулярными и устойчивыми семантическими отношениями: иерархическими (имеет место нарушение правильной структуры дерева), ассоциативными, эквивалентности. Тезаурус является лексическим инструментом ИПС для осуществления поиска.
Информационно-поисковые тезаурусы. (ИПТ) позволяют решить проблему соотнесения:
• авторской терминологии (понятий и слов естественного языка, которые автор использует для обозначения этих понятий);
• терминологии системы (понятий и терминов, которые используются для выражения этих понятий при вводе документов в ИПС);
• терминологии потребителя (понятий и терминов, которые потребитель использует для представления этих понятии при формировании запросов).
тезаурус состоит из контролируемого, но изменяемого словаря терминов, между которыми указаны смысловые связи. представляет собой перечень лексических единиц, упорядоченных по систематическому и алфавитному принципам Лексические единицы обычно делятся на дескрипторы и аскрипторы.
Дескриптор — лексическая единица, предназначенная для использования в поисковых образах документов и/или запросов.
Аскриптор — лексическая единица, которая в поисковых образах документов (запросов) при поиске или обработке информации подлежит замене на дескриптор. ИПТ подразделяют на два типа:
1) тезаурусы, выделяющие среди своих лексических единиц дескрипторы и аскрипторы;
2) тезаурусы, все лексические единицы которых являются дескрипторами.
Рассмотрим структуру и виды связей на примере ИПТ по информатике [Информационно-поисковый тезаурус, 1987].
Лексические единицы тезауруса поделены на дескрипторы и ключевые слова — не дескрипторы и нормализованы следующим образом:
• имена существительные, обозначающие исчисляемые объекты, представлены в форме именительного падежа множественного числа;
• существительные, обозначающие неисчисляемые объекты, представлены в форме именительного падежа единственного числа;
• для всех словосочетаний-дескрипторов, включая словосочетания с именем собственным, используется естественный (прямой) порядок слов.
Лексические единицы в тезаурусе организованы в виде словарных статей. Словарная статья дескриптора состоит из собственно дескриптора (заглавного дескриптора) и списка дескрипторов и ключевых слов, связанных с заглавным дескриптором по смыслу.
Общеупотребительные аббревиатуры входят в тезаурус в качестве дескрипторов. Каждая из них снабжена расшифровкой, которая приводится в косых скобках строчными буквами.
В дескрипторной статье лексические единицы располагаются в следующем порядке:
• заглавный дескриптор;
• ключевые слова, условно синонимичные заглавному дескриптору;
• вышестоящие дескрипторы;
• нижестоящие дескрипторы;
• дескрипторы, связанные с заглавным дескриптором одним из ассоциативных отношений.
Дата публикования: 2015-01-26; Прочитано: 358 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!