Dialogové systémy Luděk Bártek Laboratoř vyhledávání a dialogu, Fakulta Informatiky Masarykovy Univerzity, Brno jaro 2013 Základy fonetiky Dialogové systémy Zkoumá zvukovou stránku jazyka z různých aspektů. Základní pojmy, které souvisejí s dialogovými systémy: ■ foném ■ samohlásky - formanty ■ souhlásky - znělost/neznělost souhlásek ■ koartikulace ■ spodoba znělosti Fonémy a fonetická transkripce Dialogové systémy Luděk Bártek ■ Foném - elementární zvukový segment, který je vymezen Základy fonetiky na základě své schopnosti diferencovat vyšší, znakové jednotky jazykového systému (morfémy). Úvod do počítačového ■ Fonetická transkripce (přepis) - převod psaného textu do zpracování zvuku odpovídající fonetické podoby: Komunikace uživatel - na shledanou —> na zhledanou na schledanou dialogový systém ■ Fonetická abeceda - slouží k zápisu fonetického přepisu Vol P SIP ■ Mezinárodní fonetická abeceda (IPA) - součástí standardu Zpracování di- UNICODE gitalizovaného signálu ■ Řečové vyhodnocení metod fonetické abecedy (SAMPA) - Analýza digitalizovaného sedmibitový přepis fonetické abecedy, využívá se při automatizovaném zpracování (např. řečový syntetizér Analýza digitalizovaného MBrola, ...).. signálu ve frekvenční -) [n<0Vn>« 0 ■ Průběh vah okénka na mikrosegmentu: 1 -00.0 Pravoúhlé okénko Dialogové systémy Luděk Bártek Základy fonetiky ■ Vychází se z předpokladu: Úvod do počítačového zpracování Q vzorky mikrosegmentu nejsou pro naše potřeby ovlivněny okolím mikrosegmentu zvuku B všechny vzorky mikrosegmentu jsou ovlivněny stejně. Komunikace uživatel -dialogový systém Vol P Zpracování digitalizovaného signálu ■ Všechny vzorky mikrosegmentu mají shodnou váhu. , . ÍO < n < N 1 w(n) = < |/)<0Vn>« 0 Analýza digitalizovaného Analýza digitalizovaného frekvenčn i 1 -00.0 Ana Rychlí lýza signálu ve frekvenční oblasti í diskrétní Fourierova transformace Dialogové systémy Luděk Bártek Základy fonetiky Úvod do počítačového zpracování zvuku ■ Výpočet spektrálních koeficientů pomocí DFT - n2 operací nad komplexními čísly. Komunikace uživatel -dialogový systém ■ ■ Pomocí FFT - N * log2N/2 operací násobení. FFT požaduje, aby délka analyzovaného segmentu byla Vol P SIP mocninou 2. Zpracování digitalizovaného signálu Analýza digitalizovaného Analýza digitalizovaného frekvenční Ana Kepstr lýza signálu ve frekvenční oblasti "ální analýza Dialogové systémy Luděk Bártek ■ Vychází z modelu činnosti hlasového ústrojí. Základy ■ Řečové kmity lze modelovat jako odezvu lineárního fonetiky systému na buzení sestávající ze sledu pulzů pro znělou řeč Úvod do počítačového a šumu pro neznělou. zpracování zvuku ■ Kepstrum - X(k) = IFFT(FFT(x(k))) Komunikace uživatel - ■ Kepstrální analýza umožňuje z řeči oddělit parametry dialogový systém buzení a parametry hlasového ústrojí. Vol P SIP ■ Využití: Zpracování di- ■ ocenění fonetické struktury řeči - znělost perioda gitalizovaného signálu základního tónu, formanty, . .. Analýza digitalizovaného ■ rozpoznávání slov Analýza digitalizovaného ■ verifikace a identifikace mluvčího ■ .. . frekvenční Analýza signálu ve frekvenční oblasti Lineárni prediktivní analýza Jedna z nejefektivnějších metod analýzy akustického signálu - zajišťuje velmi přesné odhady parametru při relativně malé zátěži. Vychází z předpokladu, že s(/c) lze popsat jako lineární kombinaci N předchozích vzorků a buzení u(k): s(k) N /=1 /) + Gu{k) kde G je koeficient zesílení a A/ řád modelu. Použití: ■ určování spektrálních charakteristik modelu hlasového ústrojí ■ z chyby predikce lze odvodit poznatky o znělosti a určit frekvenci základního hlasivkového tónu ■ koeficienty a,- nesou informaci o spektrálních vlastnostech lze je použít jako příznaky pro rozpoznávání řečiL 1 -00.0