Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Первичный речевой сигнал



Речь с физической точки зрения состоит из последовательности звуков с паузами между их группами. При нормальном темпе речи паузы появляются между отрывками фраз, так как при этом слова произносятся слитно (хотя слух, как правило, воспринимает слова по отдельности). При замедленном темпе речи, например, при диктовке, паузы могут делаться между словами и даже их частями. Предлоги, союзы звучат всегда слитно с последующим словом.

Один и тот же звук речи разные люди произносят по-разному. Произношение звуков речи зависит от ударения, соседних звуков и т. п. Но при всем многообразии в их произношении они являются физическими реализациями (произнесением) ограниченного числа обобщенных звуков речи, называемых фонемами. Фонема — это то, что человек хочет произнести, а звук речи — это то, что человек фактически произносит. Фонема по отношению к звуку речи играет ту же роль, что и образцовая буква по отношению к ее рукописной форме в конкретном написании.

B русском языке насчитываются 41 основная и 3 неясно зву­чащих фонемы: 6 гласных (а, о, у, э, и, ы), 1 полугласная (й) и 34 согласных. Гласные буквы я, ю, ё, е (соответствуют или состав­ным фонемам: йа, йу, йо, йэ, или служат для смягчения предыду­щей согласной. Согласных фонем больше, чем согласных букв, так как род согласных букв соответствует двум фонемам: мягкой и твердой. Только твердых фонем 3 (ш, ж, ц), только мягких—1 (ч). Остальные l6 существуют в обоих видах: твердом и мягком.

Если связки тонкие и сильно напряжены, то период получается коротким и частота основного тона — высокой; для толстых, слабонапря­женных связок частота основного тона низкая. Эта ча­стота для всех голосов лежит в пределах от 70 до 450 Гц. При произнесении речи она непрерывно изме­няется в соответствии с ударением и подчеркиванием звуков и слов, а также для проявления эмоций (воп­рос, восклицание, удивление и т. д.). Изменение часто­ты основного тона называют интонацией. У каждого человека свой диапазон изменения частоты основного тона (обычно он бывает немногим более октавы) и своя интонация. Последняя имеет большое значение для узнаваемости говорящего. Основной тон, интона­ция, устный «почерк» и тембр (окраска) голоса могут служить для опознавания человека. При этом степень достоверности опознавания выше, чем по отпечаткам пальцев. Это свойство используют в разработанной в последнее время аппаратуре, срабатывающей только от определенных голосов.

Импульсы основного тона имеют пилообразную форму, и поэтому при их периодическом повторении по­лучается дискретный спектр с большим числом гармо­ник (до 40), частоты которых кратны частоте основно­го тона. Огибающая спектра основного тона имеет спад в сторону высоких частот с крутизной около 6 дБ/окт. Например, для мужского голоса уровень гар­моник на частоте 3000 Гц ниже уровня на 100 Гц при­мерно на 30 дБ.

Звуки речи делят на звонкие и глухие. Звонкие зву­ки образуются с участием голосовых связок, в этом случае находящихся в напряжении. Под напором воз­духа, идущего из легких, они периодически раздвига­ются, в результате чего создается прерывистый поток воздуха. Импульсы потока воздуха, создаваемые голо­совыми связками с достаточной точностью, могут счи­таться периодическими. Соответствующий период пов­торения импульсов называют периодом основного тона голоса То. Обратную величину fo=1\T называют час­тотой основного тона.

При произнесении глухих звуков голосовые связки находятся в расслабленном состоянии и поток воздуха из легких свободно проходит в полость рта. Встречая на своем пути различные преграды в виде языка, зу­бов, губ, он образует завихрения, создающие шум со сплошным спектром.

По способу образования согласные делят на сонорные, щеле­вые, взрывные и аффрикаты (комбинация глухих взрывных и щеле­вых). Сонорные (л, ль, р, рь, м, мь, н, нь) по звучанию похожи на гласные, но отдельно не произносятся и поэтому отнесены к согласным. Щелевые (в, вь, з, зь, ж, ф, фь, с, сь, ш, х, хь) обра­зуются путем проталкивания потока воздуха в виде импульсов шума через узкие щели, создаваемые языкам и нёбом, губами, зубами, гортанью. Взрывные (п, пь, т, ть, к, кь, б, 6ъ, д, дь, г, гь) образуются путем (резкого проталкивания.потока (воздуха через гу­бы, зубы, гортань. По месту образования фонемы делят на губные, зубные, нёбные, гортанные, передние и задние.

При произнесении звуков речи язык, губы, зубы, нижняя челюсть, голосовые связки должны находиться для каждой фонемы в строго определенном положении или движении. Эти движения называют артикуляцией органов речи. При этом в речеобразующем тракте соз­даются определенные для данной фонемы резонансные полости, а для слитного звучания фонем в речи — и оп­ределенные переходы от одной формы тракта к другой.

Через речевой тракт при произнесении звуков прохо­дят или тональный импульсный сигнал, или шумовой, или тот и другой вместе. Речевой тракт представляет собой сложный акустический фильтр с рядом резонансов, создаваемых полостями рта, носа и носоглотки, т. е. с помощью артикуляционных органов речи. Вследствие этого тональный или шумовой спектры с монотонной огибающей превращаются в спектры с рядом максиму­мов и минимумов.

Форманта — термин фонетики, обозначающий акустическую характеристику звуков речи (прежде всего гласных), связанную с уровнем частоты голосового тона и образующую тембр звука. Форманта может характеризоваться либо занимаемой ею частотной полосой, либо средней частотой, соответствующей максимуму амплитуды или энергии составляющих в формантной полосе, и средним уровнем этой энергии. Большинство звуков речи имеет одну или две форманты, что обусловлено участием в образовании этих звуков основных резонаторов голосового аппарата - полости глотки и носоглотки.

Максимально в отдельных звуках замечено до 6 усиленных частотных областей. Однако далеко не все они являются формантами. Некоторые из них никакого значения для распознавания звуков не имеют, хотя и несут в себе довольно значительную энергию.

Формантными являются одна или две частотные области. Исключение из передачи любой из этих областей вызывает искажение передаваемого звука, т. е. либо превращение его в другой звук, либо вообще потерю им признаков звука человеческой речи. рукописной форме в конкретном напи­сании.

Максимумы спектра называют формантами, а нулевые значения — антиформантами. Оги­бающая спектра для каждой фонемы имеет индивиду­альную и вполне определенную форму (рис. 3.3). При произнесении речи спектр ее непрерывно изменяется, в результате чего образуются формантные переходы. Ча­стотный диапазон речи находится в пределах 70 — 7000 Гц.

Звонкие звуки речи, особенно гласные, имеют высо­кий уровень интенсивности, глухие — низкий. В процес­се произнесения речи ее громкость непрерывно изменя-

ется, особенно резко при взрывных звуках речи. Дина­мический диапазон уровней звуков речи находится в пределах 35—45 дБ. Гласные звуки имеют в среднем длительность около 0,15 с, согласные —около 0,08 с, звук «п» — около 30 мс. Большая длительность гласных звуков необходима для перестройки артикуляционных органов, так как иначе язык будет «заплетаться».

Звуки речи неодинаково информативны. Так, глас­ные звуки содержат меньшую информацию о смысле ре­чи, чем глухие. Поэтому разборчивость речи снижается при действии шумов, в пер­вую очередь из-за маскировки глухих звуков.

Известно, что для передачи одного и того же сооб­щения по телеграфу и по речевому тракту требуется различная пропускная способность тракта: для телегра­фного сообщения не более 100 бит/с, а для речевого — около 100 000 бит/с (полоса равна 7000 Гц, динамичес­кий диапазон 42 дБ, т. е. требуется семизначный код, откуда имеем: 2х7000х7 = 98000 бит/с), т. е. в 1000 раз большая. Может показаться, что речевой сигнал имеет огромную избыточность. Это неверно и вот почему.

.В результате спектральной модуляции изменяется соотношение между частотными составляющими несу­щей, т. е. изменяется форма огибающей ее спектра (по­являются форманты и антиформанты). Почти вся ин­формация о звуках речи заключается в этой спектраль­ной огибающей и ее временном изменении. Эти измене­ния происходят медленно(в темпе произнесения звуков), поэтому передача сведений об огибающей и ее из­менении не требует пропускной способности тракта бо­лее 100 бит/с. Но для передачи широкополосной несу­щей с ее широким динамическим диапазоном требуется очень большая пропускная способность. Кроме того, речевой сигнал при образовании в речевом тракте приобретает много информации, не относящейся к смыслу передаваемой речи (например, фазовую информацию). Эта информация называется сопутствующей. Для ее пе­редачи также расходуется пропускная способность трак­та. Из этого следует, что избыточность речевого сигна­ла лишь немного превышает избыточность телеграфно­го сигнала с таким же сообщением: речевой сигнал от­личается от телеграфного лишь информацией об эмоци­ях и личности говорящего.

Поэтому для передачи смысла достаточно переда­вать сведения о форме огибающей спектра речи, а так­же об изменении основного тона речи и переходов тон-шума. Эти сигналы идут от речевого центра мозга.

- Частично информация о звуках речи заключена в переходах от тонального спектра к шумовому и обратно (т. е. в переходах от звонких звуков к глухим и обратно), а информация о сигнале — еще и в интонации. По фонетической теории информация заклю­чается только в скорости изменения спектральных уровней.

- Речевой сигнал можно уподобить водоему, в котором нахо­дится рыба. Водоем может иметь большой объем, а полезной ин­формации (рыбы) в нем может быть немного.





Дата публикования: 2014-10-25; Прочитано: 2358 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2025 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.038 с)...