Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Основные элементы информационно-поискового языка



Для определения роли и места ИПЯ рассмотрим основные понятия языков, тесно связанных с информационно-поисковыми языками. Язык - это знаковая система любой физической приро­ды, выполняющая познавательную и коммуникативную функ­ции в процессе человеческой деятельности. Естественный язык (ЕЯ) есть особого рода преобразователь заданных смыслов в тек­сты и наоборот.

Информационный язык - формальная семантическая систе­ма, включающая алфавит, правила образования конструкций, их преобразования и интерпретации и предназначенная для описа­ния, обработки, логической переработки и поиска информации.

Информационно-поисковый язык - специализированный искусственный язык, предназначенный для описания основного содержания (центральной темы) и формальных характеристик документов с целью информационного поиска.

Алгоритмический язык используется для записи информа­ции и алгоритмов ее обработки в форме, воспринимаемой ЭВМ. Каждый из названных языков предназначен для описания языковых объектов и, следовательно, в той или иной мере обладает смысло-выразительной способностью, т. е. способностью выра­жать смысловое содержание текстов. Указанная способность за­висит от того, на каких уровнях представляются языковые объек­ты средствами данного языка.

Различают следующие уровни представления языковых объектов.

1. Семантика - основные закономерности строения внут­ренней (смысловой) стороны языковых объектов. Семантичес­кий уровень представления языковых объектов позволяет отоб­разить их смысловое содержание, выразить связь смыслов от­дельных знаков со смыслом текста (связь смысла языковых объектов между собой и со смыслом образуемого ими более сложного языкового объекта).

2. Синтаксис - основные закономерности, определяющие отношения между единицами языка в пределах конкретных тек­стов. Синтаксический уровень представления языковых объек­тов позволяет выразить их структуру, отношения знаков в тексте, закономерности построения текстов.

3. Морфология - основные закономерности построения слов языка, т. е. система грамматических категорий и способов их выражения.

4. Правописание - система правил, устанавливающая еди­нообразные способы передачи речи на письме.

5. Фонетика - основные закономерности поведения рече­вого аппарата и способы их использования.

Указанные уровни представления языковых объектов поз­воляют описать преобразование «звук-фонема-морфема-сло­во-текст-смысл».

ИПЯ представляют языковые объекты на 1, 2,3,4 уровнях. Однако арсенал средств ИПЯ для представления языковых объ­ектов на семантическом уровне менее развит по сравнению с ар­сеналом естественного языка.

Основными элементами ИПЯ являются алфавит, лексика и грамматика.

Алфавит ИПЯ - система знаков, используемых для записи слов и выражений ИПЯ. Это могут быть буквы русского и/или английского языка, знаки препинания, арабские цифры, любые иные символы.

Лексика, или словарный состав ИПЯ, - совокупность слов, словосочетаний и выражений, используемых для построения текстов ИПЯ. В качестве лексических единиц ИПЯ могут быть ис­пользованы:

- слова, фрагменты слов, словосочетания и выражения любо­го естественного языка;

- коды и шифры (цифровые, буквенные, буквенно-цифро­вые) словосочетаний, слов и выражений, выступающие в роли имен соответствующих классов;

- шифры и коды в сочетании со словами, словосочетаниями и выражениями.

Существуют различные способы задания словарного соста­ва ИПЯ, в том числе:

- перечисление всех лексических единиц ИПЯ;

- перечисление части лексических единиц и задание правил формирования из них других лексических единиц;

- задание правил построения лексических единиц, слов и вы­ражений естественного языка.

Первый способ задания лексики требует больших интел­лектуальных усилий. Процесс построения лексики нельзя авто­матизировать. Лексика ИПЯ оказывается жестко фиксирован­ной и в ряде случаев не позволяет достаточно точно выразить смысловое содержание текстов. Третий способ поддается полной автоматизации, хотя и требует больших интеллектуальных за­трат на определение правил формирования лексики. Однако на­учный подход к формированию словарного состава делает его бо­лее совершенным, обеспечивает единообразие и уменьшает субъ­ективизм при построении лексики. Второй способ занимает промежуточное положение и в отношении интеллектуальных усилий, и в отношении автоматизации процессов.

Грамматика ИПЯ - совокупность средств и способов постро­ения, изменения и сочетания лексических единиц. Грамматика включает морфологию и синтаксис. Морфология - совокупность средств и способов построения и изменения слов. Синтаксис - сово­купность средств и способов соединения слов в выражения и фразы.

17. Состав и структура дескрипторных ИПЯ. Определения: ключевое слово, словосочетание, дескриптор, тезаурус, семантическая карта. (Тема 5, стр. 43-44).





Дата публикования: 2015-02-03; Прочитано: 1367 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.007 с)...