Digitalizace akustického signálu Počítačové zpracování řeči Luděk Bártek Fakulta Informatiky Masarykova Univerzita Brno podzim 2019 Luděk Bártek Počítačové zpracování řeči Q Digitalizace akustického signálu • Vzorkování • Kvantizace o Kódování průběhu vlny Luděk Bártek Počítačové zpracování řeči Vzorkování Digitalizace akustického signálu Kódování průběhu vlny • Cíl - převod spojitého signálu na posloupnost digitálních hodnot vhodných pro uchování v počítači. • Postup digitalizace: O Vzorkování - převod reálných vstupních hodnot na posloupnost diskrétních reálných čísel. Q Kvantizace - převod posloupnosti reálných čísel na posloupnost celých/reálných čísel. O Kódování - způsob uložení a kódování posloupnosti hodnot získaných v kroku 2. Luděk Bártek Počítačové zpracování řeči Vzorkování Digitalizace akustického signálu Kódování průběhu vlny • Transformace spojitého časové závislého signálu s(t) na časově diskrétní posloupnost sn(T) = 0, 1,2, ... • T - perioda vzorkování. 9 Pokud nemá dojít ke ztrátě informace, musí být vzorkovací frekvence aspoň dvojnásobkem nejvyšší frekvence, která je signálu obsažena. • Po čase T je sejmuta a dána na výstup (ke kvantizaci) hodnota ze vstupního snímače. • většinou okamžitá úroveň napětí nebo proudu na vstupu. Luděk Bártek Počítačové zpracování řeči digitální zpracování zvuku o audio CD • mp3 - navíc použita ztrátová komprese • miniDisc - navíc použita ztrátová komprese ATRAC • DAT • ... digitální zpracování signálu obecně (digitalizace dat z různých analogových měřících zařízení, digitální zpracování obrazu, ...) Luděk Bártek Počítačové zpracování řeči Vzorkování Digitalizace akustického signálu gnálu Luděk Bártek Počítačové zpracování řeči Vzorkování Digitalizace akustického signálu Kvantizace Kódování průběhu vlny Shannonův vzorkovací teorém Analogový signál s(t) lze rekonstruovat z hodnot vzorků sn(T) následovně: s(t) t Sn(Tf^l n=—oo v / J právě tehdy když je vzorkovací frekvence alespoň dvojnásobkem nejvyšší frekvence obsažené ve vstupním signálu. Důsledky: • Vzorkovací frekvence by měla být alespoň dvojnásobkem nejvyšší frekvence vstupního signálu. 9 Je-li menší dochází ke zkreslení složek vyšších frekvencí, o Spor příznivců a odpůrců audio CD - je 44kHz dostačující vzorkovací frekvence pro hudbu? Luděk Bártek Počítačové zpracování řeči Vzorkování Digitalizace akustického signálu Kvantizace Kódování průběhu vlny • Převod reálných navzorkovaných hodnot na celočíselné hodnoty. o Počet celočíselných hodnot = počet úrovní kvantování • 256 • 65 536 • 16 777 216 • Kvantizační krok - reálný interval přiřazený kvantizované jednotce. • Na vstupu je signál s amplitudou 128 mA (-128 - 127 mA). o 8bitová kvantizace - 256 kvantizačních úrovní • kvantizační krok = = 1 [mA]. o Běžně používané kvantizace - 8, 16, 24, 32 bitů. • Realizováno pomocí A/D převodníků • součást zvukových karet • mobilních telefonů Luděk Bártek Počítačové zpracování řeči Vzorkování Digitalizace akustického signálu Kvantizace Kódování průběhu vlny Běžně používané parametry digitalizace zvuku • Vzorkovací frekvence: • 8 kHz - telefonní kvalita • 16 kHz - běžná řeč • 22 kHz - rozhlasová kvalita • 44 kHz - audio CD • 48 kHz - DVD • Kvantizace: • 8 bitů • 16 bitů • 24 bitů » 32/64 bitů v pohyblivé řádové čárce • Počet audio kanálů • 1 • 2 • 4 9 6 (5.1, 5 směrových kanálů + basy) Luděk Bártek Počítačové zpracování řeči Vzorkování Digitalizace akustického signálu • PCM - přímé ukládání hodnot získaných kvantizací. o Výhody - jednoduché na zpracování, nedochází k další ztrátě informací. • Nevýhody: • často malé rozdíly mezi hodnotami sousedních vzorků -značná redundance dat, o konstantní hodnota kvantizačního kroku (závisí na parametrech AD převodníku) - v případě malé amplitudy vstupního signálu - ztráta informace (signál nepřekročí kvantizační krok), v případě velké amplitudy - hodnota překročí rozsah - zkreslení signálu. Oba případy brání kvalitní rekonstrukci původního signálu. Luděk Bártek Počítačové zpracování řeči Vzorkování Digitalizace akustického signálu Kódování průběhu vlny Řešení nevýhod PCM o Diferenční PCM 9 Uchovávání rozdílů sousedních vzorků místo uchovávání jejich hodnot. o Hodnota rozdílu bývá podstatně menší než hodnota vzorku - lze uchovat pomocí méně bitů. • Adaptivní PCM • Kvantizační krok se určuje na základě amplitudy vstupního signálu. Luděk Bártek Počítačové zpracování řeči