Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Информационно-поисковый тезаурус. Структура ИПТ



ГОСТ 7.25-2001. СИБИД. Тезаурус информационно-поисковый одноязычный. Правила разработки, структура, состав и форма представления. ИПТ – это структурированный словарь для контроля лексики, в котором явно и системно определяются основные семантические отношения (эквивалентности, иерархические и ассоциативные) между терминами естественного языка. В соответствии с ГОСТ 7.25-2001 ИПТ ориентированы, прежде всего, на использование в рамках автоматизированных информацион­ных систем и сетей научно-технической информации. лексическая единица (ЛЕ) ИПТ: Слово, словосочетание или лексически значимый компонент сложного слова естественного языка, включенное в ИПТ в качестве дескриптора или аскриптора. Класс эквивалентности ЛЕ: Совокупность лексических единиц, различие значение которых несущественно для определения основного содержания документов в информационной системе. Многоязычный ИПТ - это ИПТ содержащие ЛЕ взятые из нескольких естественных языков и представляющий эквивалентные по смыслу понятия на каждом из этих языков.

По своему построению ИПТ подразделяют на два типа:

- тезаурусы, выделяющие среди своих лексических единиц дескрипторы и аскрипторы;

- тезаурусы, все ЛЕ которых являются дескрипторами.

Построение ИПТ включает следующие этапы:

- определение тематического охвата ИПТ;

- сбор массива ЛЕ;

- формирование словника ИПТ;

- построение словарных статей и указателей;

- оформление ИПТ;

- экспертиза и регистрация ИПТ.

Назначение ИПТ

Появление ИПТ неразрывно связано с развитием автоматизированных информационных систем (АИС). Первоначально целью создания ИПТ являлось повышение показателей качества поиска информации в АИС. В соответствии с этой целью назначение ИПТ заключалось в следующем:

1. Обеспечивать индексирование документов и запросов средствами дескрипторного языка путем замены ключевых слов соответствующими дескрипторами, а также осуществлять избыточное индексирование документов и/или информационных запросов за счет использования вышестоящих, нижестоящих и ассоциативных понятий;

2. Отражать парадигматические отношения, существующие между лексическими единицами какой-либо отрасли науки или техники.

3. Служить средством контроля и нормализации лексики конкретной отрасли знания, обеспечивать единое и формализованное представление информации в ИПС.

Кроме того, ИПТ использовались и используются при традиционном (ручном) информационном поиске как средство терминологического контроля, позволяющее на основе эксплицитного представления парадигматических отношений между дескрипторами сужать или расширять область поиска, уточнять информационные запросы пользователей, осуществлять корректировку поисковых предписаний.

3. Структура ИПТ

В соответствии с ГОСТ 7.25-2001 «Тезаурус информационно-поисковый одноязычный. Правила разработки, структура, состав и форма представления» в состав ИПТ входят следующие элементы:

1) вводная часть;

2) основная часть (лексико-семантический указатель);

3)дополнительные части (систематический, пермутационный, иерархический и другие указатели и списки специальных категорий лексических единиц).

Обязательными составными частями являются вводная часть и лексико-семантический указатель.

Допускается в состав ИПТ вводить приложения, содержащие допол­нительные сведения о разработке и использовании ИПТ.

Вводная часть включает титульный лист и введение.

На титульном листе должны быть приведены:

- наименование ИПТ, включающее термин «информационно-поис­ковый тезаурус» и указывающее область его применения;

- наименование организации-разработчика и дополнительные сведения об авторстве ИПТ;

- сведения о переиздании;

- место и год создания или издания ИПТ.

Введение должно содержать:

- цель создания и область применения тезауруса, описанные кодами

и наименованиями рубрик Межгосударственного рубрикатора НТИ;

- ссылки на источники, использованные для сбора лексики ИПТ;

- ссылки на нормативные и методические документы, использован­ные при составлении ИПТ;

- описание порядка составления тезауруса, включая обоснование

представительности использованных источников лексики;

- описание состава и структуры;

- перечень отношений между лексическими единицами и методические основания для их установления;

- перечень всех символов и специальных сокращений, допущенных

для представления;

- порядок алфавитного расположения (расположение букв разных

алфавитов, небуквенных символов и др.);

- количественные характеристики тезауруса (общее число статей, число дескрипторов, аскрипторов и др.);

- описание состава и формы представления дополнительных данных в словарных статьях;

- абзац следующего содержания: «Тезаурус подготовлен в соответствии с ГОСТ 7.25».

Введение к последующим изданиям (версиям) ИПТ дополнительно должно содержать:

- обоснование необходимости составления новой версии тезауруса;

- указание на характер внесенных изменений.

Лексико-семантический указатель – это упорядоченная последовательностью словарных статей ИПТ, сформированная я путем расположения их в алфавитном порядке заглавных лексических единиц. Представляет собой алфавитный перечень всех дескрипторов и аскрипторов с их словарными статьями.





Дата публикования: 2015-01-24; Прочитано: 1702 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.009 с)...