Digitalizace akustického signálu Počítačové zpracování řeči Luděk Bártek Fakulta Informatiky Masarykova Univerzita Brno podzim 2023 Luděk Bártek Počítačové zpracování řeči Q Digitalizace akustického signálu • Vzorkování • Kvantizace o Kódování průběhu vlny Luděk Bártek Počítačové zpracování řeči Vzorkování Digitalizace akustického signálu Kódování průběhu vlny • Cíl - převod spojitého signálu na posloupnost digitálních hodnot vhodných pro uchování v počítači. a Postup digitalizace: O Vzorkování - převod reálných vstupních hodnot na posloupnost diskrétních reálných čísel. Q Kvantizace - převod posloupnosti reálných čísel na posloupnost celých/reálných čísel. O Kódování - způsob uložení a kódování posloupnosti hodnot získaných v kroku 2. Luděk Bártek Počítačové zpracování řeči Vzorkování Digitalizace akustického signálu Kódování průběhu vlny • Transformace spojitého časové závislého signálu s(t) na časově diskrétní posloupnost sn(T) = 0, 1,2, ... • T - perioda vzorkování. 9 Pokud nemá dojít ke ztrátě informace, musí být vzorkovací frekvence aspoň dvojnásobkem nejvyšší frekvence, která je signálu obsažena. • Po čase T je sejmuta a dána na výstup (ke kvantizaci) hodnota ze vstupního snímače. • většinou okamžitá úroveň napětí nebo proudu na vstupu. Luděk Bártek Počítačové zpracování řeči o Vzorkování Digitalizace akustického signálu • digitální zpracování zvuku © audio CD • mp3 - navíc použita ztrátová komprese 9 miniDisc - navíc použita ztrátová komprese ATRAC o DAT • ... • digitální zpracování signálu obecně (digitalizace dat z různých analogových měřících zařízení, digitální zpracování obrazu, ...) Luděk Bártek Počítačové zpracování řeči Luděk Bártek Počítačové zpracování řeči Vzorkování Digitalizace akustického signálu Kvantizace Kódování průběhu vlny Shannonův vzorkovací teorém • Analogový signál s(t) lze rekonstruovat z hodnot vzorků sn(T) následovně: s(řHÍ>(T)^ n=—oo právě tehdy když je vzorkovací frekvence alespoň dvojnásobkem nejvyšší frekvence obsažené ve vstupním signálu. • Důsledky: 9 Vzorkovací frekvence by měla být alespoň dvojnásobkem nejvyšší frekvence vstupního signálu. 9 Je-li menší dochází ke zkreslení složek vyšších frekvencí, o Spor příznivců a odpůrců audio CD - je 44kHz dostačující vzorkovací frekvence pro hudbu? Luděk Bártek Počítačové zpracování řeči Vzorkování Digitalizace akustického signálu Kvantizace Kódování průběhu vlny • Převod reálných navzorkovaných hodnot na celočíselné hodnoty. o Počet celočíselných hodnot = počet úrovní kvantování • 256 • 65 536 • 16 777 216 • Kvantizační krok - reálný interval přiřazený kvantizované jednotce. • Na vstupu je signál s amplitudou 128 mA (-128 - 127 mA). o 8bitová kvantizace - 256 kvantizačních úrovní • kvantizační krok = = 1 [mA]. o Běžně používané kvantizace - 8, 16, 24, 32 bitů. • Realizováno pomocí A/D převodníků • součást zvukových karet • mobilních telefonů 9 ... Luděk Bártek Počítačové zpracování řeči Vzorkování Digitalizace akustického signálu Kvantizace Kódování průběhu vlny Běžně používané parametry digitalizace zvuku • Vzorkovací frekvence: » 8 kHz - telefonní kvalita • 16 kHz - běžná řeč • 22 kHz - rozhlasová kvalita • 44 kHz - audio CD • 48 kHz - DVD • Kvantizace: • 8 bitů • 16 bitů • 24 bitů o 32/64 bitů v pohyblivé řádové čárce • Počet audio kanálů • 1 • 2 • 4 • 6 (5.1, 5 směrových kanálů + basy) Luděk Bártek Počítačové zpracování řeči Vzorkování Digitalizace akustického signálu Kvantizace Kódování průběhu vlny Způsoby kódování signálu • PCM - přímé ukládání hodnot získaných kvantizací. o Výhody - jednoduché na zpracování, nedochází k další ztrátě informací. • Nevýhody: • často malé rozdíly mezi hodnotami sousedních vzorků -značná redundance dat, 9 konstantní hodnota kvantizačního kroku (závisí na parametrech AD převodníku) - v případě malé amplitudy vstupního signálu - ztráta informace (signál nepřekročí kvantizační krok), v případě velké amplitudy - hodnota překročí rozsah - zkreslení signálu. Oba případy brání kvalitní rekonstrukci původního signálu. Luděk Bártek Počítačové zpracování řeči Vzorkování Digitalizace akustického signálu Kódování průběhu vlny Řešení nevýhod PCM o Diferenční PCM a Uchovávání rozdílů sousedních vzorků místo uchovávání jejich hodnot. o Hodnota rozdílu bývá podstatně menší než hodnota vzorku - lze uchovat pomocí méně bitů. • Adaptivní PCM • Kvantizační krok se určuje na základě amplitudy vstupního signálu. Luděk Bártek Počítačové zpracování řeči