Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Анализ речевых сигналов в частотной области



Одним из основных способов обработки речи в частотной области является кратковременный спектральный анализ. На выполнении кратковременного спектрального анализа основана работа многих систем распознавания речи, спектрографов, вокодеров. Кратковременный спектральный анализ может быть реализован с использованием гребенки полосовых фильтров (рис. 2) или с помощью дискретного преобразования Фурье. Полосы пропускания фильтров выбираются так, чтобы перекрыть весь частотный диапазон речи. Средние значения модулей выходных сигналов фильтров будут представлять значения спектральных коэффициентов в полосах.

Рис. 2. Гребенка фильтров.

Иногда частотный диапазон разбивают на неравные полосы с учетом особенностей слухового восприятия человека. Экспериментально установлено, что во внутреннем ухе человека высота тона (частота) звукового сигнала преобразуется в механические колебания определенных участков базилярной мембраны. При этом линейным приращениям координаты вдоль тела мембраны соответствуют логарифмические приращения частоты звука, т.е. частота звука, воспринимаемого человеком, нелинейно зависит от действительной физической частоты. Это приводит к неодинаковой разрешающей способности по частоте и к восприятию звуков в соответствии с механизмом критических частотных полос. Сложный звук постоянной громкости, состоящий из нескольких тонов, лежащих в пределах критической полосы, воспринимается человеком с таким же субъективным ощущением, как одно-тональный звук, соответствующий центральной частоте критической полосы. Ширина критических полос для области частот до Гц составляет примерно Гц. Выше Гц ширина критических полос увеличивается примерно на по сравнению с шириной предыдущей полосы. Ширина критических полос аппроксимируется зависимостью:

[Гц].

Для характеристики субъективных частот, воспринимаемых человеком, предложено несколько шкал: барк-шкала, мел-шкала. Функция

[Барк]

используется для перевода частот, заданных в герцах, в барки.

Гребенка (банк) фильтров с неравными полосами пропускания, заданными в герцах и соответствующими критическим полосам слуха, будет иметь равномерное распределение центральных частот и равные значения полос пропускания, измеренных в барках. Таким образом, применение барк-шкалы соответствует равномерному разбиению оси субъективных частот. Мел-шкала вводится с аналогичной целью и имеет незначительные отличия от барк-шкалы.

Кратковременный спектральный анализ речи может быть также выполнен на основе ДПФ. Кратковременное дискретное преобразование Фурье определяется следующим образом:

, (3)

где представляет отрезок речи, взвешенный окном , длиной отсчетов:

, . (4)

Один из алгоритмов определения частоты основного тона основан на вычислении произведения:

. (5)

Значения, вычисляемые с помощью (5), могут быть весьма большими. Для уменьшения значений вычисляют логарифм от (5). Зависимость представляет произведение функций , сжатых по частоте. В вокализованной речи сжатие частоты в раз должно привести к совпадению гармоник основного тона. Благодаря этому в спектре появляется максимум на частоте основного тона. Невокализованная речь характеризуется существенно меньшими значениями и она не имеет максимума в спектре на частоте основного тона. Данный способ определения частоты основного тона устойчив к шумам, поскольку шумовые компоненты в спектре не регулярны.





Дата публикования: 2014-11-26; Прочитано: 792 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.006 с)...