Главная Случайная страница Контакты | Мы поможем в написании вашей работы! | ||
|
Анализ Интерпретация Генерация Синтез высказывания смысла смысла высказывания
высказывания высказывания
Рисунок 2
Ведение диалога выполняется по одной их 2-х схем:
1. Диалог ведет пользователь
2. Диалог ведет система
Диалоговый компонент можно рассматривать на 3-х уровнях:
1. общая структура - тип диалога и класс решаемых задач
2. тематическая структура - структура конкретной задачи
3. шаг диалога - взаимодействие участников в акте диалога
На уровне общей структуры действия ЕЯ системы задаются в виде последовательности этапов:
· - инструктаж;
· - определение задачи;
· - решение задачи;
· - объяснение решения задачи;
· - выдача результатов решения и их оценка;
· - объяснение после решения задачи;
· - объяснение причин неудачи.
Перечисленные задачи необязательно должны быть во всех конкретных шагах диалога.
Вторая задача диалогового компонента вызвана тем, что реакции одного участника могут не соответствовать ожиданиям другого. В этом случае происходит перехват инициативы.
5. Компонент понимания высказываний
Данный компонент предназначен для выделения смысла входного высказывания и его представления на внутреннем языке системы. Под смыслом понимается семантическая информация, которую пользователь хотел бы передать системе. Это компонент включает в себя анализ и интерпретацию высказывания. Анализ сводится к 3 составляющим:
1. Анализ слов
2. Анализ предложений
3. Анализ связанных текстов
Анализ слов сводится к морфологическому анализу и к обнаружению и исправлению орфографических ошибок.
Анализ предложений обычно сводится к синтаксическому и семантическому (знаки препинания) анализам и выполняется специальным функциональным блоком, называемым анализатором.
Анализ связанных текстов достигается лингвистическими и ситуационными средствами. На этом этапе решается задача выявления связей между предложениями. Анализ обычно реализуется в виде отдельного блока –анализатора, который различается по ряду параметров:
· по типу анализируемых предложений (повествовательные, вопросительные, полные, неполные, простые, сложные и т.п.);
· по выделяемым описаниям сущностей (понятия, отношения и т.п.);
· по глубине проникновения в смысл;
· по используемым средствам (морфологический, синтаксический и семантический анализ).
Цель морфологического анализа состоит в получении основ слова. Под основой понимается словоформа с отсеченным окончанием и значениями грамматических категорий (например, часть речи, род, число, падеж). Для каждого высказывания, поступающего на вход системы, формируется словоформа. Принцип такого использования заложен в систему ПОЭТ.
Методы обнаружения и исправления орфографических ошибок подразделяются на два класса: с использованием или без использования словаря основ.
Частотные методы основаны на сортировке слов по частоте их встречаемости в текстах. Предполагается, что частота встречаемости слов, содержащих ошибки, низкая.
Полиграммные методы поиска ошибок используют списки возможных сочетаний букв в словах. Обычно анализируются пары и тройки идущих подряд букв. Например, тройка из трех букв «ннн» может рассматриваться как ошибка. Этим методом целесообразно пользоваться в системах с пополняемым словарем.
Наиболее распространенным способом анализа ЕЯ-предложений является разбор сверху вниз, слева направо, основанный на фиксированной грамматике.
Имеются анализаторы, использующие сопоставление по образцам.
В этом случае анализ предложения сводится к сопоставлению с множеством образцов, представляющих последовательность слов. В образцах содержатся не только константы, но и переменные. При этом переменные образца сопоставляются с любой строкой символов.
6. Компонент генерации высказываний
Процесс генерации состоит из 2-х составляющих:
1. Генерация смысла высказывания
2. Синтез высказывания на естественном языке
Результатом выполнения 1-го этапа является внутреннее представление смысла генерируемого высказывания. При этом решаются следующие подзадачи:
· определяется информация, которая должна быть сообщена пользователю;
· выделяются аспекты, интересующие пользователя;
· разбивается сообщаемая информация на части в соответствии с будущими предложениями и устанавливается последовательность этих частей.
На втором этапе решаются следующие подзадачи:
· построение синтаксиса структуры отдельных предложений;
· морфологический синтез словоформ.
Дата публикования: 2014-10-18; Прочитано: 862 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!