Dialogové systémy Luděk Bártek Základy fonetiky Dialogové systémy Luděk Bártek Laboratoř vyhledávání a dialogu, Fakulta Informatiky Masarykovy Univerzity, Brno jaro 2020 Základy fonetiky Dialogové systémy Luděk Bártek Základy fonetiky ■ Zkoumá zvukovou stránku jazyka z různých aspektů. ■ Základní pojmy, které souvisejí se zpracováním řeči a dialogovými systémy: ■ foném ■ samohlásky - formanty ■ souhlásky - znělost/neznělost souhlásek ■ koartikulace ■ spodoba znělosti Fonémy a fonetická transkripce Dialogové systémy Luděk Bártek Foném - elementární zvukový segment, který je vymezen na základě své schopnosti diferencovat vyšší, znakové jednotky jazykového systému (morfémy). Fonetická transkripce (přepis) - převod psaného textu do odpovídající fonetické podoby: na shledanou —> na zhledanou | na schledanou Fonetická abeceda - slouží k jednoznečnému zápisu fonetického přepisu ■ Mezinárodní fonetická abeceda (IPA) - součástí standardu UNICODE ■ Fonetická abeceda pro metody zpracování řeči (Speech Assessment Methods Phonetic Alphabet - SAMPA) -sedmibitový přepis fonetické abecedy, využívá se při automatizovaném zpracování (např. řečový syntetizér MBrola, ...).. Ukázky fonetických přepisů Dialogové systémy Luděk Bártek Základy fonetiky ■ Fonetický přepis věty:„Ukázka fonetických transkripcí" ■ IPA: 'uka:ska f'onet,itski:x tr'anskriptsi: ■ SAMPA: ukAska foneticklH transkripcsl Samohlásky Dialogové systémy Luděk Bártek ■ Samohláska - samostatně tvoří slabiku ■ Rozdělení samohlásek: ■ krátké: a, e, i, o, u ■ dlouhé: á, é, í, ó, ú ■ dvojhlásky: eu, au, ou ■ Obsahují: ■ základní hlasivkový tón - frekvence kmitání hlasivek (100 — 400 Hz) ■ formanty - frekvence vzniklé a zesílené rezonancí v dutinách řečového traktu. □ s Formanty Dialogové systémy Luděk Bártek ■ Frekvence vzniklé a zesílené rezonancí v hlasových Základy fonetiky dutinách ■ F\ - vzniká rezonancí v dutině ústní. ■ F2 - vzniká rezonancí v dutině hrdelní. ■ Existují i vyšší formanty (F3, . ..) - výskyt je často individuální. ■ Výskyt a intenzita formantů se může lišit v závislosti na: ■ pohlaví - muž/žena ■ věku - dětství/dospívání/dospělost/seniorský věk ■ zdravotním stavu - např. nachlazení, ochraptělost, nemoci hlasivek a hrtanu, . .. ■ . .. Formanty F\ a F2 pro české samohlásky Dialogové systémy Luděk Bártek Samohláska Formant F± Formant F2 a 700 1100 Hz 1100 1500 Hz e 500 700 Hz 1500 2000 Hz i 300 500 Hz 2000 3000 Hz 0 500 700 Hz 900 1200 Hz u 300 500 Hz 600 1000 Hz Tabulka: Formanty F\ a F2 u samohlásek Četnost výskytu samohlásek Dialogové systémy Luděk Bártek Samohláska(y) Relativní četnost [e] 10 % [a]. M. N 6 7 % M 4% [á], [u], [é], [ou], [ú] < 4 % [ó], [au], [eu] pouze nepatrná frekvence Souhlásky Dialogové systémy Luděk Bártek Na rozdíl od samohlásek jsou souhlásky dynamické děje. Silně závisí na kontextu, ve kterém se nacházejí. Tónový charakter mají pouze části některých souhlásek: Dělí se podle: ■ znělé - vznikají v hrtanu, obsahují základní hlasivkový tón. ■ neznělé - vznikají v řečových dutinách (nosohltanové, ústní, .. .), mohou mít charakter šumu (např. sykavky): ■ problematická detekce začátku promluvy při zašuměném zdroji. ■ Znělé a neznělé samohlásky se mohou vyskytovat v párech (párové souhlásky) např.: ■ r/l ■ b/p ■ d/t