Главная Случайная страница Контакты | Мы поможем в написании вашей работы! | ||
|
Существует 2 основных режима:
1. режим с настройкой на голос (адаптивный)
2. режим без настройки на голос (неадаптивный)
1) Выглядит следующим образом Человек читает некоторые специальные тексты, компьютер распознает слова и выдает варианты распознания. Человек редактирует ошибки, т.е. некорректные слова, читает заново. После некоторых таких этапов коррекции компьютер оказывается в состоянии распознать речь человека. В таких системах используют специальные ограниченные словари (обычно до 1000 слов)
2) Считается наиболее сложными для реализации, т.к. система должна распознать речь любого человека. Нервная система гораздо легче организуется для человека с жестким фонетическим строем (немецкий, русский)
Существующие компьютерные системы распознания речи, как правило, базируются на базе 2 компонентов – лингвистического и акустического.
Акустическая модель отвечает за предстоящий речесигнал, т.е. преобразование его в некоторую физическую форму, за счет выделения характерной речевой волны.
Лингвистическая модель интерпретирует информацию акустической модели за счет заложенных лингвистических знаний, выдает признаки технические или иные фонетические и представляет их пользователю.
IBM ViaVoice
Dragon Systems Dragondietate
Philips Sprach Magic
HBBY (русская)
Наиболее известными исследовательскими организациями, занимающимися речевыми технологиями является Московский Государственный Лингвистический Университет с кафедры теории и практики лингвистики.
Дата публикования: 2015-02-20; Прочитано: 1110 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!