![]() |
Главная Случайная страница Контакты | Мы поможем в написании вашей работы! | |
|
Стохастический подход базируется на N-грамах (обычно биграмах или триграмах) [16] и предусматривает представление предложения в виде совместной вероятности появления последовательности слов , т.е.
.
Например, совместная вероятность последовательности слов «отправить сляб в печь» определяется по формуле
Р(отправить сляб в печь)=Р(отправить)Р(сляб|отправить) Р(в|отправить сляб)Р(печь|отправить сляб в)
Для биграм предложение представляется в виде
.
Для триграм предложение представляется в виде
.
N-грамы используются в случае объединения систем распознавания речи и анализа языковых конструкций, когда возможно неверное распознавание произнесенных слов.
При анализе предложения с помощью метод биграм и триграм результатом анализа является вероятность такой структуры.
К недостаткам этого метода относится игнорирование синтаксической структуры предложения, а также слабая адаптация к новой предметной области. Этот подход не формирует древовидную синтаксическую структуру, и семантический анализ после него не проводится.
Дата публикования: 2015-09-17; Прочитано: 284 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!