Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Характеристика речевого сигнала



Акустические речевые сигналы создает речевой аппарат человека, голосовой тракт которого представляет собой трубку со средней длиной у взрослого мужчины примерно 17 см и с переменной площадью поперечного сечения. Вход в голосовой тракт образуют голосовые связки, а выход — губы.

Поперечное сечение может изменяться при движении артикул ярных органов — губ, челюстей, языка и небной занавески (мягкого неба), являющейся продолжением твердого неба, от полного закрытия до величины более 20 см2.

Вспомогательный путь распространения звуковых колебаний образует носовой тракт, который начинается у небной занавески и заканчивается ноздрями. Опусканием или поднятием небной занавески регулируется связь между носовой и ротовой полостями, которая существенным образом влияет на характер произносимых звуков.

Источником энергии при речеобразовании служит поток воздуха, выталкиваемого из легких при сжимании грудной клетки ее мускулатурой. Воздух проходит по трахее в полость глотки. Сверху трахея заканчивается гортанью. На хрящевой основе гортани укреплены 2 пленки из связочной и мышечной ткани, которая называется голосовыми связками. Щелевой проход между связками образует голосовую щель. При прохождении под давлением воздуха через голосовую щель связки колеблются с частотой, определяемой в основном массой и упругостью связок и величиной подсвязочного давления воздуха. Основная частота колебаний голосовых связок называется частотой основного тона. Частота (высота) основного тона характеризует собой тип голоса говорящего: бас, баритон, тенор, альт, контральто, сопрано. Частоты основного тона указанных типов голосов находятся в интервале 80 - 300 Гц, но различия частот слабо влияют на показатели распознавания звуков речи.

Сила воздушного потока, прошедшего через голосовую щель и определяющая громкость речевого сигнала, зависит от площади щели и подсвязочного давления воздуха. Для очень громких звуков в, легких создается давление порядка 20 см водяного столба.

Толчки или импульсы воздуха, прошедшего через колеблющиеся голосовые связки, возбуждают акустическую систему над голосовыми связками. Форма импульсов, образуемых голосовой щелью, в процессе разговора, сильно изменяется в зависимости от частоты основного тона и интенсивности звука. Звуки малой интенсивности и с низкой частотой основного тона имеют низкое подсвязочное давление, большую скважность и небольшую амплитуду импульсов. При средних громкости и частоте основного тона импульсы имеют треугольную форму, частотный спектр которой богат гармониками или обертонами. Длительность импульсов составляет величину порядка 0,3 - 0,7 периода колебаний. Звуки большой интенсивности и с высокой частотой основного тона характеризуются высоким подсвязочным давлением, небольшой скважностью и большой амплитудой.

Кроме того, голосовой тракт возбуждает турбулентный поток воздуха в точках сужения и изменения давления воздуха, создаваемого в области смычки губ, зубов или неба. При раскрытии смычки речевой тракт возбуждается в результате возникающего в нем переходного процесса.

При возбуждении голосового тракта колебаниями голосовых связок образуются гласные звуки, звонкие (вокализованные) согласные звуки — совместно голосовым и шумовым источниками, а глухие — только шумовыми источниками.

Спектр речевого сигнала после прохождения резонаторов голосового тракта, образуемых воздушными объемами полости рта и носоглотки, изменяется в процессе произнесения различных звуков и зависит от положения языка и зубов. При этом одни гармонические составляющие усиливаются, другие подавляются. Области спектра звука, в которых сосредоточивается основная мощность акустического сигнала, называются формантными областями или формантами.

Большинство звуков речи имеют одну или две форманты, что обусловлено участием в образовании звуков резонаторов голосового тракта полостей рта и носоглотки. Форманты звуков речи расположены в области частот от 150 - 200 Гц до 8600 Гц. Например, гласный звук «а» имеет одну форманту полосой 1100— 1400 Гц, звук «э» — две форманты в полосах 600 - 1000 Гц и 1600— 2500 Гц, согласный звук «л» — две форманты (200 - 500 Гц), звук «ш» — одну форманту полосой 1200 - 6300 Гц. Но основная энергия подавляющей части формант сосредоточена в диапазоне частот 300 - 3000 Гц, что позволило ограничить спектр речевого сигнала, передаваемого по стандартному телефонному каналу, этой полосой. Гласные звуки имеют выраженный дискретный спектр, согласные звуки характеризуются либо сплошным спектром, либо наличием сплошного спектра в отдельных полосах частот.

Спектральный состав речевого сигнала

В процессе прохождения воздушного потока из легких через голосовые связки и полости рта и носа образуются звуки речи, причем мощность гармоник частоты основного тона меняется (кривая 2 на рисунке). Области повышенной мощности гармоник частоты основного тона и являются формантами.

Энергетический спектр речевого сигнала - область частот, в которой сосредоточена основная энергия сигнала (Рисунок),из которого следует, что речь представляет собой широкополосный процесс, частотный спектр которого простирается от 50..100 Гц до 8000..10000 Гц. Установлено, однако, что качество речи получается вполне удовлетворительным при ограничении спектра частотами 300..3400 Гц. Эти частоты приняты МСЭ-Т в качестве границ эффективного спектра речи. При указанной полосе частот слоговая разборчивость составляет около 90%, разборчивость фраз - более 99% и сохраняется удовлетворительная натуральность звучания.

Энергетический спектр речевого сигнала

Средняя длительность различных звуков речи существенно различается в диапазоне 20 - 260 мс. Гласные звуки более длительные, чем согласные, наибольшая длительность отмечается для звука «а», наименьшая — для звука «п». Длительность ударных гласных звуков больше, чем неударных.

Психологическая (с учетом чувствительности уха на разных частотах) интенсивность акустических сигналов изменяется в широких пределах 0 - 130 дБ. Для человека как основного источника соотношение между уровнем громкости и его качественной оценкой характеризуется следующими данными: очень тихая речь (шепот) — 5 - 10 дБ, тихая речь — 30 - 40 дБ, речь умеренной громкости — 50 - 60 дБ, громкая речь — 60 - 70 дБ, крик — 70 - 80 дБ и более. Для сравнения: фортиссимо большого симфонического оркестра составляет 90 дБ, вой сирены «скорой помощи» — 100 дБ, а шум реактивного двигателя на расстоянии 5 м — 120 дБ.

Уровень речи во время речеобразования непрерывно меняется. Поэтому интенсивность речи характеризуют средним уровнем интенсивности речи и средним спектральным уровнем речи — средним уровнем энергии, приходящейся на полосу шириной 1 Гц. Разность между пиковым (максимальным) значением речевого сигнала и его средним уровнем называют пикфактором речи.

Так как основным приемником звуковых волн является слуховая система человека, субъективное восприятие которым интенсивности речи зависит не только от величины звукового давления звуковой волны на мембрану уха, но и от ее частоты, то для оценки энергетического показателя звука, учитывающего возможности слуха человека, введено понятие громкости звука. Громкость звука представляет собой взвешенную по частоте интенсивность звука.

Кроме громкости речь человека характеризуется тоновым диапазоном (диапазоном частот), тембром и вибрато.

Среднестатистический голос человека включает тоны (частоты) в диапазоне 64 - 1300 Гц. Крайне низкие тоны басовых голосов имеют частоту около 40 Гц, высокие тоны детских голосов — около 4000 Гц. При разговоре изменение тона составляет обычно 0,1 диапазона голоса, изменение тона певческого мужского голоса достигает около 2,5 октавы, женского— 3 октавы.





Дата публикования: 2014-11-04; Прочитано: 9308 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.006 с)...