Dialogové systémy Luděk Bártek Dialogové systémy Luděk Bártek Laboratoř vyhledávání a dialogu, Fakulta Informatiky Masarykovy Univerzity, Brno jaro 2020 Digitalizace zvuku Dialogové systémy Luděk Bártek Cíl - převod spojitého akustického signálu na posloupnost diskrétních hodnot. ■ Tyto lze zpracovat na počítači. Kroky digitalizace zvuku: vzorkování - snímání aktuální hodnoty signálu s danou frekvencí (vzorkovací frekvence) kvantizace - převod reálných hodnot na celočíselné kódování průběhu vlny - způsob ukládání informací o průběhu zvuku. ■ Snímaní aktuální hodnoty signálu - snímání se opakuje s určitou frekvencí (vzorkovací frekvence). ■ Vzorkovací frekvence - měla by být minimálně dvojnásobkem nejvyšší frekvence, která je v signálu přítomna, aby bylo možné původní signál bez ztráty informace zrekonstruovat (Shannonův vzorkovací teorém). ■ Získané hodnoty musí být následně kvantizovány a vhodným způsobem uloženy. ■ Nejpoužívanější vzorkovací frekvence: ■ 8 kHz - telefonní kvalita ■ 16 kHz ■ 22050 Hz - rozhlasová kvalita ■ 44100 Hz - CD kvalita ■ 48 kHz - DVD kvalita Kvantizace Dialogové systémy Luděk Bártek Metoda převodu spojitých hodnot na diskrétní. Princip: ■ Pokud hodnota signálu překročí n. násobek kvantizačního kroku je jí přiřazena hodnota n. ■ kvantizační krok ■ o kolik se musí průměrně změnit vstupní úroveň signálu, aby se výstup změnil o 1 ■ kvantizační krok = rozsah hodnot měřené veličiny/počet diskrétních hodnot ■ kvantizační chyba - zaokrouhlovací chyba způsobená velikostí kvantizačního kroku, přímo úměrná velikosti kvantizačního kroku. Běžně používané kvantizace: ■ zpracování zvuku: 8 bitů (28 úrovní), 16 bitů (216 úrovní), 24 bitů (224 úrovní) ■ zpracování obrazu navíc 32 bitů (232 úrovní) Způsoby kódování průběhu vlny Dialogové systémy Luděk Bártek ■ Přímé ukládání hodnot získaných kvantizací- kódování Úvod do PCM (Pulse-Code Modulation). počítačového ~7 v\Y"ľx rr\\i'ľx n í ■ relativně pomalé změny průběhu zvukového signálu - malé Z.[Jí dt-UVd 111 zvuku rozdíly mezi sousedními vzorky. ■ Velká redundance dat. ■ Problém v případě příliš velkého rozptylu amplitud v signálu (příliš velký kvantizační krok - příliš velká kvantizační chyba, příliš malý kvantizační krok - přetečení v okamžiku zvětšení amplitudy signálu). ■ Diferenční PCM - ukládá se rozdíl mezi sousedními vzorky ■ Adaptivní PCM — PCM s proměnou velikostí kvantizačního kroku - kvantizační krok se uzpůsobí velikosti amplitudy signálu. Diferenční pulsní kódová modulace Dialogové systémy Luděk Bártek Vychází z předpokladů: ■ Rozdíl dvou po sobě jdoucích vzorků je podstatně menší hodnota než hodnota vzorku. ■ Následující vzorek lze poměrně přesně odhadnout jako lineární kombinaci předchozích vzorků. Blokové schéma kódování signálu pomoci DPCM 3(11) J i s"{n) s'(n) s/f(n) - odhad hodnoty řečového vzorku sř(n) - rekonstruovaný signál, získaný jako součet kvantizovaného signálu ôf(n) a sřř(n) 6{n) = s(n) - s"{n) Adaptivní pulsní kódová modulace Dialogové systémy Luděk Bártek Možné velké změny amplitudy signálu: ■ Nepřesné zachycení slabého signálu - amplituda je příliš malá, srovnatelná s kvantizačním krokem (příliš velký kvantizační krok). ■ Zkreslení (ořezání) silného signálu - dojde k přetečení rozsahu hodnot určených pro zakódování signálu (příliš malý kvantizační krok). Řešení: přizpůsobení kvantizačního kroku amplitudě signálu.