Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Морфологический анализ



Морфологический анализ применяется к формам слов предложений. Результатом морфологического анализа является получение исходной формы слова (леммы), его лексического значения, части речи и морфологических признаков (например, род, число, падеж), которые подаются на вход синтаксического анализатора.

Существуют следующие методы морфологического анализа [12]:

– декларативный;

– процедурный;

– комбинированный (сочетание декларативного и процедурного);

– основанный на универсальных морфологических моделях.

При декларативном методе в словаре хранятся все возможные формы слов с соответствующей морфологической информацией. В этом случае задача морфологического анализа состоит в поиске формы слова в словаре и переписывании из словаря морфологической информации. Достоинством метода является скорость анализа, поэтому этот метод является наиболее распространенным. Недостатком метода являются высокая трудоемкость создания и поддержания словаря, а также большой объем хранимой информации, поскольку форм у каждого слова в русском и украинском языке много.

Процедурный метод выделяет основу формы слова; идентифицирует ее и приписывает форме слова морфологическую информацию. Недостатком метода являются высокая трудоемкость составления словарей «приставка-корень», «корень-суффикс-флективный класс», «флективный класс-флексия-морфологическая информация», поскольку в русском и украинском языке большое число слов-исключений, не позволяющих автоматизировать этот процесс.

Комбинированный метод использует как словарь форм слов, так и словарь основ. Если поиск по словарю форм не успешен (т.е. декларативный метод не дал результата), то задействуют словарь основ (т.е. процедурный метод).

В рамках метода, основанного на универсальных морфологических моделях, используются:

– модели в виде системы уравнений алгебры конечных предикатов;

– модели морфологии системы «Смысл-Текст».

Системы уравнений алгебры конечных предикатов [13] предложены Ю.П. Шабановым-Кушнаренко и позволяют проводить анализ и синтез форм слов.

Морфологическая функция представляется в виде уравнения

,

морфологическое отношение представляется в виде уравнения

,

где – часть слова (основа и аффиксы), – морфологическая информация.

Например, грамматическое правило, которое описывает то, что для имен существительных форма слова заканчивается на «а», если родительный падеж, мужской род, единственное число, одушевленный, основа заканчивается на «п», представлено в виде

,

или в виде

,

где – первая буква окончания «а», – родительный падеж, – мужской род, – единственное число, – одушевленный, – последняя буква основы «п».

Недостатком этого метода является сложность практической реализации, поскольку в русском и украинском языках имеется большое число слов-исключений, к которым этот подход неприменим.

Система «Смысл-Текст» [14] предложена И.А. Мельчуком и использует синтез форм слов. В общем виде правила морфологического синтеза представлены как

,

где – лексема, – морфологическая характеристика, – форма слова.

В этом подходе учитывались все особенности морфологии русского языка. Поэтому с помощью соответствующих правил можно синтезировать любую форму слова.





Дата публикования: 2015-09-17; Прочитано: 395 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.008 с)...