Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Стохастический подход



Стохастический подход базируется на N-грамах (обычно биграмах или триграмах) [16] и предусматривает представление предложения в виде совместной вероятности появления последовательности слов , т.е.

.

Например, совместная вероятность последовательности слов «отправить сляб в печь» определяется по формуле

Р(отправить сляб в печь)=Р(отправить)Р(сляб|отправить) Р(в|отправить сляб)Р(печь|отправить сляб в)

Для биграм предложение представляется в виде

.

Для триграм предложение представляется в виде

.

N-грамы используются в случае объединения систем распознавания речи и анализа языковых конструкций, когда возможно неверное распознавание произнесенных слов.

При анализе предложения с помощью метод биграм и триграм результатом анализа является вероятность такой структуры.

К недостаткам этого метода относится игнорирование синтаксической структуры предложения, а также слабая адаптация к новой предметной области. Этот подход не формирует древовидную синтаксическую структуру, и семантический анализ после него не проводится.





Дата публикования: 2015-09-17; Прочитано: 284 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2025 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.783 с)...