Главная Случайная страница Контакты | Мы поможем в написании вашей работы! | ||
|
Морфологический анализ применяется к формам слов предложений. Результатом морфологического анализа является получение исходной формы слова (леммы), его лексического значения, части речи и морфологических признаков (например, род, число, падеж), которые подаются на вход синтаксического анализатора.
Существуют следующие методы морфологического анализа [12]:
– декларативный;
– процедурный;
– комбинированный (сочетание декларативного и процедурного);
– основанный на универсальных морфологических моделях.
При декларативном методе в словаре хранятся все возможные формы слов с соответствующей морфологической информацией. В этом случае задача морфологического анализа состоит в поиске формы слова в словаре и переписывании из словаря морфологической информации. Достоинством метода является скорость анализа, поэтому этот метод является наиболее распространенным. Недостатком метода являются высокая трудоемкость создания и поддержания словаря, а также большой объем хранимой информации, поскольку форм у каждого слова в русском и украинском языке много.
Процедурный метод выделяет основу формы слова; идентифицирует ее и приписывает форме слова морфологическую информацию. Недостатком метода являются высокая трудоемкость составления словарей «приставка-корень», «корень-суффикс-флективный класс», «флективный класс-флексия-морфологическая информация», поскольку в русском и украинском языке большое число слов-исключений, не позволяющих автоматизировать этот процесс.
Комбинированный метод использует как словарь форм слов, так и словарь основ. Если поиск по словарю форм не успешен (т.е. декларативный метод не дал результата), то задействуют словарь основ (т.е. процедурный метод).
В рамках метода, основанного на универсальных морфологических моделях, используются:
– модели в виде системы уравнений алгебры конечных предикатов;
– модели морфологии системы «Смысл-Текст».
Системы уравнений алгебры конечных предикатов [13] предложены Ю.П. Шабановым-Кушнаренко и позволяют проводить анализ и синтез форм слов.
Морфологическая функция представляется в виде уравнения
,
морфологическое отношение представляется в виде уравнения
,
где – часть слова (основа и аффиксы), – морфологическая информация.
Например, грамматическое правило, которое описывает то, что для имен существительных форма слова заканчивается на «а», если родительный падеж, мужской род, единственное число, одушевленный, основа заканчивается на «п», представлено в виде
,
или в виде
,
где – первая буква окончания «а», – родительный падеж, – мужской род, – единственное число, – одушевленный, – последняя буква основы «п».
Недостатком этого метода является сложность практической реализации, поскольку в русском и украинском языках имеется большое число слов-исключений, к которым этот подход неприменим.
Система «Смысл-Текст» [14] предложена И.А. Мельчуком и использует синтез форм слов. В общем виде правила морфологического синтеза представлены как
,
где – лексема, – морфологическая характеристика, – форма слова.
В этом подходе учитывались все особенности морфологии русского языка. Поэтому с помощью соответствующих правил можно синтезировать любую форму слова.
Дата публикования: 2015-09-17; Прочитано: 395 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!