Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Обробка мови



Обробка мови у стандарті GSM здійснюється з метою забезпечення високої якості повідомлень, що передають, та реалізації додаткових сервісних можливостей.

Обробка мови здійснюється у рамках прийнятої системи переривчастої передачі мови (Discontinuous Transmission – DTX), яка забезпечує вмикання передавача, коли користувач починає розмову, і вимикає його в паузах та у кінці розмови. DTX керується детектором активності мови (Voice Activity Detector – VAD), який забезпечує виявлення і виділення інтервалів передачі мови з шумом і шуму без мови навіть в тих випадках, коли рівень шуму дорівнює рівню мови. До складу системи переривчастої передачі мови входить також пристрій формування комфортного шуму, який вмикається і прослуховується у паузах розмови, коли передавач відключений. (Експериментально доведено, що відключення фонового шуму на виході приймача в паузах при відключенні передавача дратує абонента і знижує розбірливість мови, тому використання комфортного шуму у паузах вважається необхідним.) DTX-процес у приймачі виникає при інтерполяції фрагментів мови, загублених через помилки у каналі.

Структурна схема процесів обробки мови в стандарті GSM показана на рис. 4.13, головним пристроєм в цій схемі є мовний кодек [4,5].

Рисунок 4.13 – Структурна схема процесів обробки мови в стандарті GSM

Алгоритм роботи і структурна схема мовного PRE/LTP-LPC-кодека. Принцип обраногоу стандарті GSM метода кодування мови полягає у вилученні основних характеристик мови у формі коефіцієнтів фільтру, за допомогою яких мова може бути відновлена, використовуючи низькошвидкісну квантизацію. Структурні схеми кодера і декодера мови показані на рис. 4.14.

Зменшення швидкості передачі мови до 13кбіт/с здійснюють в три етапи:

1) LPC – лінійним кодуванням з передбаченням;

2) LTP – довготривалим передбаченням;

3) RPE – регулярним імпульсним збудженням.

На першому етапі вхідний сигнал ділиться на сегменти 260 біт по 20 мс. Потім у процесі LPC аналізу обчислюють 8 коефіцієнтів r (t)цифрового LPC фільтра аналізу, які представляють як рівень, а потім зменшують до мінімуму динамічний діапазон d фільтрованої версії.

На другому етапі відбувається подальше зниження динамічного діапазону за рахунок довготривалого передбачення, в процесі якого кожний сегмент вирівнюють до рівня попередніх сегментів мови. В принципі, LTP фільтр віднімає попередній період сигналу від поточного періоду. Цей фільтр характеризують параметром затримки N і коефіцієнтом підсилення b. Період обчислення цих параметрів дорівнює 5 мс.

Рисунок 4.14 – Структурна схема кодека мови

Вісім коефіцієнтів r(i) LPC фільтру аналізу і параметри LTP фільтру аналізу кодуються і передаються зі швидкістю 3,6 кбіт/с.

Для формування послідовності збудження остаточний сигнал пропускають через фільтр нижніх частот з частотою зрізу 3…4 кГц.

Остаточно періодична послідовність фрагментів передається зі швидкістю 9,4 кбіт/с. Загальна швидкість передачі складає 3,6 + 9,4 = 13кбіт/с.

У декодері мовний сигнал відновлюється за відгуками послідовності регулярного імпульсного збудження (RPE) двохступінчатим синтезуючим фільтром, як показано на рис. 4.14.

При цьому якість мови відповідає якості мови, що передається через ISDN, та перевищує якість мови в аналогових радіотелефонних системах.

Теоретично час затримки мовного сигналу в кодеку дорівнює тривалості сегмента і становить 20 мс. Реальний час затримки з врахуванням операцій канального кодування і перемежування, а також фізичного виконання розглянутих операцій складає 70…80 мс [4,5].

Детектор активності мови. Детектор активності мови (VAD) призначений для увімкнення передавального пристрою тільки при передачі інформації. Якщо канал на мить вільний, його можна заблокувати. Оскільки середня активність мови абонента нижче 50%, то це забезпечує суттєву економію енергії акумуляторної батареї.

До VAD пред’являються наступні основні вимоги:

− мінімізація ймовірності фальшивої тривоги при дії шуму високого рівня;

− висока ймовірність правильного виявлення мови низького рівня;

− висока швидкодія розпізнавання мови для виключення затримок увімкнення;

− мінімальний час затримки вимкнення.

В стандарті GSM прийнята схема VAD з обробкою в частотній області. Структурна схема VAD приведена на рис. 4.15. Її робота основана на розпізнаванні спектральних характеристик мови і шуму.

Рисунок 4.15 – Структурна схема детектора активності мови

Вважається, що фоновий шум є стаціонарним протягом відносно великого періоду часу, його спектр також повільно змінюється в часі. VAD визначає спектральне відхилення вхідного впливу від спектра фонового шуму. Цю операцію здійснюють інверсним фільтром, коефіцієнти якого встановлюють відносно дії на вході тільки фонового шуму. При наявності на вході мови і шуму інверсний фільтр здійснює придушення компонентів шуму і в загальному випадку знижує його інтенсивність. Енергія суміші сигналу та шуму на виході інверсного фільтра порівнюється з порогом, що встановлюють в період дії на вході тільки шуму. Цей поріг перебуває вище рівня енергії шумового сигналу. Перевищення порогового рівня розпізнається як наявність на вході суміші сигналу та шуму. Коефіцієнти інверсного фільтра і рівень порогу змінюють в часі в залежності від зміни рівня вхідного шуму. Рішення про зміну параметрів приймають вторинним VAD на основі порівняння огинаючих спектрів в послідовні моменти часу. Якщо вони є аналогічними для відносно довгого періоду часу, вважають, що має місце шум, значить, коефіцієнти фільтра і шумовий поріг можна змінювати, тобто адаптувати VAD до поточного рівня і спектральних характеристик вхідного шуму.

VAD з обробкою в спектральній області вдало поєднується з мовним RPE/LTP-LPC-кодеком, оскільки в процесі LPC-аналізу вже визначають огинаючу спектру вхідного впливу, необхідну для роботи вторинного VAD [5].

Формування комфортного шуму. Формування комфортного шуму здійснюють в паузах активної мовли і керуєть мовним декодером. Коли VAD в передавачі виявить, що абонент припиняє розмову, передавач залишається ще ввімкнутим протягом наступних 5-ти мовних кадрів. Під час перших чотирьох з них характеристики фонового шуму оцінюють шляхом усереднювання коефіцієнта підсилення і коефіцієнтів фільтра LPC-аналізу. Ці усереднені значення передають в наступному п’ятому кадрі, в якому містять інформацію про комфортний шум (SІD-кадр).

В мовному декодері комфортний шум генерується на основі LPC аналізу SID-кадру. Щоб виключити дратуючий вплив модуляції шуму, комфортний шум повинен відповідати по амплітуді і спектру реальному фоновому шуму на місці передачі. В умовах мобільного зв’язку фоновий шум може постійно змінюватись. Це значить, що характеристики шуму повинні передавати з передавального боку на приймальний бік не лише в кінці кожного мовного сплеску, але і в мовних паузах так, щоб між комфортним і реальним шумом не було різких неузгоджень в наступних мовних кадрах. З цієї причини SІD-кадри надсилають кожні 480мс протягом мовних пауз.

Динамічна зміна характеристик комфортного шуму забезпечує природність відтворення мовного повідомлення при використанні системи передачі мовлення з перериваннями [5].

Екстраполяція втраченого мовного кадру. В умовах завмирань сигналів в мобільному зв’язку мовні фрагменти можуть піддавати значним спотворенням. При цьому для виключення дратуючого ефекту при відтворенні необхідно здійснювати екстраполяцію мовного кадру. Було встановлено, що втрата одного мовного кадру може бути компенсована шляхом повторення попереднього фрагмента. При значних за тривалістю перериваннях в зв’язку попередній фрагмент більше не повторюють, і сигнал на виході мовного декодера поступово зменшується, щоб вказати користувачу на руйнування каналу. Те ж саме відбувається із SID-кадром. Якщо він втрачений під час мовної паузи, то формують комфортний шум з параметрами попереднього SID-кадру. Якщо втрачений ще один SID-кадр, то комфортний шум поступово затухає.

Застосування екстраполяції мови при цифровій передачі, формування плавних акустичних переходів при завмираннях сигналу в каналах у сукупності з повним DTX-процесом значно покращує споживацькі якості зв’язку в системі GSM [5].

Контрольні запитання

1. Наведіть основні характеристики системи GSM-900.

2. Які структурні елементи системи GSM ви знаєте? Яке їх призначення?

3. Які дані зберігаються в реєстрах HLR та VLR?

4. Поясніть часову структуру системи GSM.

5. Які часові інтервали використовуються в часовій структурі системи GSM? Яке їх призначення?

6. Навіщо використовуються та який принцип формування повільних стрибків за частотою?

7. Які канали трафіку існують в системі GSM?

8. Наведіть класифікацію каналів управління в системі GSM та поясніть їх призначення.

9. Який метод модуляції використовують в системі GSM для передачі інформації через радіоканал?

10. Які принципи покладено в основу при обробці мови в системі GSM?





Дата публикования: 2015-01-23; Прочитано: 877 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.008 с)...