Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Принцип работы систем распознавания речи



Существует 2 основных режима:

1. режим с настройкой на голос (адаптивный)

2. режим без настройки на голос (неадаптивный)

1) Выглядит следующим образом Человек читает некоторые специальные тексты, компьютер распознает слова и выдает варианты распознания. Человек редактирует ошибки, т.е. некорректные слова, читает заново. После некоторых таких этапов коррекции компьютер оказывается в состоянии распознать речь человека. В таких системах используют специальные ограниченные словари (обычно до 1000 слов)

2) Считается наиболее сложными для реализации, т.к. система должна распознать речь любого человека. Нервная система гораздо легче организуется для человека с жестким фонетическим строем (немецкий, русский)

Существующие компьютерные системы распознания речи, как правило, базируются на базе 2 компонентов – лингвистического и акустического.

Акустическая модель отвечает за предстоящий речесигнал, т.е. преобразование его в некоторую физическую форму, за счет выделения характерной речевой волны.

Лингвистическая модель интерпретирует информацию акустической модели за счет заложенных лингвистических знаний, выдает признаки технические или иные фонетические и представляет их пользователю.

IBM ViaVoice

Dragon Systems Dragondietate

Philips Sprach Magic

HBBY (русская)

Наиболее известными исследовательскими организациями, занимающимися речевыми технологиями является Московский Государственный Лингвистический Университет с кафедры теории и практики лингвистики.

  1. Синтез речи – задачи и принцип работы систем. Методы синтеза речи, способы моделирования человеческой речи, типы синтезаторов речи. Системы синтеза текст-речь.




Дата публикования: 2015-02-20; Прочитано: 1110 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2025 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.006 с)...