Главная \| Случайная страница \| Контакты \| Мы поможем в написании вашей работы!

Первичный речевой сигнал

⇐ Предыдущая 29 30 31 32 333435 36 37 38 Следующая ⇒

Речь с физической точки зрения состоит из последовательности звуков с паузами между их группами. При нормальном темпе речи паузы появляются между отрывками фраз, так как при этом слова произносятся слитно (хотя слух, как правило, воспринимает слова по отдельности). При замедленном темпе речи, например, при диктовке, паузы могут делаться между словами и даже их частями. Предлоги, союзы звучат всегда слитно с последующим словом.

Один и тот же звук речи разные люди произносят по-разному. Произношение звуков речи зависит от ударения, соседних звуков и т. п. Но при всем многообразии в их произношении они являются физическими реализациями (произнесением) ограниченного числа обобщенных звуков речи, называемых фонемами. Фонема — это то, что человек хочет произнести, а звук речи — это то, что человек фактически произносит. Фонема по отношению к звуку речи играет ту же роль, что и образцовая буква по отношению к ее рукописной форме в конкретном написании.

B русском языке насчитываются 41 основная и 3 неясно звучащих фонемы: 6 гласных (а, о, у, э, и, ы), 1 полугласная (й) и 34 согласных. Гласные буквы я, ю, ё, е (соответствуют или составным фонемам: йа, йу, йо, йэ, или служат для смягчения предыдущей согласной. Согласных фонем больше, чем согласных букв, так как род согласных букв соответствует двум фонемам: мягкой и твердой. Только твердых фонем 3 (ш, ж, ц), только мягких—1 (ч). Остальные l6 существуют в обоих видах: твердом и мягком.

Если связки тонкие и сильно напряжены, то период получается коротким и частота основного тона — высокой; для толстых, слабонапряженных связок частота основного тона низкая. Эта частота для всех голосов лежит в пределах от 70 до 450 Гц. При произнесении речи она непрерывно изменяется в соответствии с ударением и подчеркиванием звуков и слов, а также для проявления эмоций (вопрос, восклицание, удивление и т. д.). Изменение частоты основного тона называют интонацией. У каждого человека свой диапазон изменения частоты основного тона (обычно он бывает немногим более октавы) и своя интонация. Последняя имеет большое значение для узнаваемости говорящего. Основной тон, интонация, устный «почерк» и тембр (окраска) голоса могут служить для опознавания человека. При этом степень достоверности опознавания выше, чем по отпечаткам пальцев. Это свойство используют в разработанной в последнее время аппаратуре, срабатывающей только от определенных голосов.

Импульсы основного тона имеют пилообразную форму, и поэтому при их периодическом повторении получается дискретный спектр с большим числом гармоник (до 40), частоты которых кратны частоте основного тона. Огибающая спектра основного тона имеет спад в сторону высоких частот с крутизной около 6 дБ/окт. Например, для мужского голоса уровень гармоник на частоте 3000 Гц ниже уровня на 100 Гц примерно на 30 дБ.

Звуки речи делят на звонкие и глухие. Звонкие звуки образуются с участием голосовых связок, в этом случае находящихся в напряжении. Под напором воздуха, идущего из легких, они периодически раздвигаются, в результате чего создается прерывистый поток воздуха. Импульсы потока воздуха, создаваемые голосовыми связками с достаточной точностью, могут считаться периодическими. Соответствующий период повторения импульсов называют периодом основного тона голоса То. Обратную величину fo=1\T называют частотой основного тона.

При произнесении глухих звуков голосовые связки находятся в расслабленном состоянии и поток воздуха из легких свободно проходит в полость рта. Встречая на своем пути различные преграды в виде языка, зубов, губ, он образует завихрения, создающие шум со сплошным спектром.

По способу образования согласные делят на сонорные, щелевые, взрывные и аффрикаты (комбинация глухих взрывных и щелевых). Сонорные (л, ль, р, рь, м, мь, н, нь) по звучанию похожи на гласные, но отдельно не произносятся и поэтому отнесены к согласным. Щелевые (в, вь, з, зь, ж, ф, фь, с, сь, ш, х, хь) образуются путем проталкивания потока воздуха в виде импульсов шума через узкие щели, создаваемые языкам и нёбом, губами, зубами, гортанью. Взрывные (п, пь, т, ть, к, кь, б, 6ъ, д, дь, г, гь) образуются путем (резкого проталкивания.потока (воздуха через губы, зубы, гортань. По месту образования фонемы делят на губные, зубные, нёбные, гортанные, передние и задние.

При произнесении звуков речи язык, губы, зубы, нижняя челюсть, голосовые связки должны находиться для каждой фонемы в строго определенном положении или движении. Эти движения называют артикуляцией органов речи. При этом в речеобразующем тракте создаются определенные для данной фонемы резонансные полости, а для слитного звучания фонем в речи — и определенные переходы от одной формы тракта к другой.

Через речевой тракт при произнесении звуков проходят или тональный импульсный сигнал, или шумовой, или тот и другой вместе. Речевой тракт представляет собой сложный акустический фильтр с рядом резонансов, создаваемых полостями рта, носа и носоглотки, т. е. с помощью артикуляционных органов речи. Вследствие этого тональный или шумовой спектры с монотонной огибающей превращаются в спектры с рядом максимумов и минимумов.

Форманта — термин фонетики, обозначающий акустическую характеристику звуков речи (прежде всего гласных), связанную с уровнем частоты голосового тона и образующую тембр звука. Форманта может характеризоваться либо занимаемой ею частотной полосой, либо средней частотой, соответствующей максимуму амплитуды или энергии составляющих в формантной полосе, и средним уровнем этой энергии. Большинство звуков речи имеет одну или две форманты, что обусловлено участием в образовании этих звуков основных резонаторов голосового аппарата - полости глотки и носоглотки.

Максимально в отдельных звуках замечено до 6 усиленных частотных областей. Однако далеко не все они являются формантами. Некоторые из них никакого значения для распознавания звуков не имеют, хотя и несут в себе довольно значительную энергию.

Формантными являются одна или две частотные области. Исключение из передачи любой из этих областей вызывает искажение передаваемого звука, т. е. либо превращение его в другой звук, либо вообще потерю им признаков звука человеческой речи. рукописной форме в конкретном написании.

Максимумы спектра называют формантами, а нулевые значения — антиформантами. Огибающая спектра для каждой фонемы имеет индивидуальную и вполне определенную форму (рис. 3.3). При произнесении речи спектр ее непрерывно изменяется, в результате чего образуются формантные переходы. Частотный диапазон речи находится в пределах 70 — 7000 Гц.

Звонкие звуки речи, особенно гласные, имеют высокий уровень интенсивности, глухие — низкий. В процессе произнесения речи ее громкость непрерывно изменя-

ется, особенно резко при взрывных звуках речи. Динамический диапазон уровней звуков речи находится в пределах 35—45 дБ. Гласные звуки имеют в среднем длительность около 0,15 с, согласные —около 0,08 с, звук «п» — около 30 мс. Большая длительность гласных звуков необходима для перестройки артикуляционных органов, так как иначе язык будет «заплетаться».

Звуки речи неодинаково информативны. Так, гласные звуки содержат меньшую информацию о смысле речи, чем глухие. Поэтому разборчивость речи снижается при действии шумов, в первую очередь из-за маскировки глухих звуков.

Известно, что для передачи одного и того же сообщения по телеграфу и по речевому тракту требуется различная пропускная способность тракта: для телеграфного сообщения не более 100 бит/с, а для речевого — около 100 000 бит/с (полоса равна 7000 Гц, динамический диапазон 42 дБ, т. е. требуется семизначный код, откуда имеем: 2х7000х7 = 98000 бит/с), т. е. в 1000 раз большая. Может показаться, что речевой сигнал имеет огромную избыточность. Это неверно и вот почему.

.В результате спектральной модуляции изменяется соотношение между частотными составляющими несущей, т. е. изменяется форма огибающей ее спектра (появляются форманты и антиформанты). Почти вся информация о звуках речи заключается в этой спектральной огибающей и ее временном изменении. Эти изменения происходят медленно(в темпе произнесения звуков), поэтому передача сведений об огибающей и ее изменении не требует пропускной способности тракта более 100 бит/с. Но для передачи широкополосной несущей с ее широким динамическим диапазоном требуется очень большая пропускная способность. Кроме того, речевой сигнал при образовании в речевом тракте приобретает много информации, не относящейся к смыслу передаваемой речи (например, фазовую информацию). Эта информация называется сопутствующей. Для ее передачи также расходуется пропускная способность тракта. Из этого следует, что избыточность речевого сигнала лишь немного превышает избыточность телеграфного сигнала с таким же сообщением: речевой сигнал отличается от телеграфного лишь информацией об эмоциях и личности говорящего.

Поэтому для передачи смысла достаточно передавать сведения о форме огибающей спектра речи, а также об изменении основного тона речи и переходов тон-шума. Эти сигналы идут от речевого центра мозга.

- Частично информация о звуках речи заключена в переходах от тонального спектра к шумовому и обратно (т. е. в переходах от звонких звуков к глухим и обратно), а информация о сигнале — еще и в интонации. По фонетической теории информация заключается только в скорости изменения спектральных уровней.

- Речевой сигнал можно уподобить водоему, в котором находится рыба. Водоем может иметь большой объем, а полезной информации (рыбы) в нем может быть немного.

⇐ Предыдущая 29 30 31 32 333435 36 37 38 Следующая ⇒

Дата публикования: 2014-10-25; Прочитано: 2419 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!

studopedia.org - Студопедия.Орг - 2014-2026 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.862 с)...