FONETIKA A FONOLOGIE V TEORII A PRAXI Umí váš telefon mluvit? Jak zkoumat zvukovou stránku jazyků a jak tyto poznatky použít mimo jazykovědu? ➢ tvorba a vnímání řeči ➢ mluvicí stroje a poslouchajicí stroje ➢ fonetika jako nástroj pro odhalení zločinu Aleš Bičan Jaké aspekty řeči chceme zkoumat a jaké nástroje pro to použijeme? Co zkoumat? tvorba řeči vnímání a porozumění řeči řeč jako druh zvuku využití řeči pro komunikaci Jak zkoumat? • přímé pozorování • rentgen • umělé patro • přímé pozorování • nahrávky • přístroje analyzující zvuk • počítačové programy[*] • přímé pozorování • chování mluvčích • analýza jazykových dokladů Jaká disciplína? ARTIKULAČNÍ PERCEPČNÍ AKUSTICKÁ FONOLOGIE („funkční fonetika“) FONETIKA [*] např. Praat, https://www.fon.hum.uva.nl/praat/ Tvorba řeči: artikulační fonetika výsledný zvuk (hlásky) ← FILTR pohyby jazyka, rtů, měkkého patra ↑ základní zvuk, základní melodie ← ZDROJ kmitání hlasivek ↑ proud vzduchu (činnost plic) Vnímání a porozumění řeči: percepční fonetika • Lidské ucho je schopno vnímat jen určitý rozsah zvuků (biologický filtr) • Vnímání zvuků je však selektivní: malé dítě je schopno rozpoznat všechny zvuku lidských jazyků, ale postupně tuto schopnost ztrácí a omezuje se pouze na zvuky svého jazyka (např. Japonci [r] right × [l] light, Češi [n] sin × [ŋ] sing) • Posloucháme rty a vidíme zvuky aneb nevnímáme pouze sluchem, ale i zrakem[*] [*] McGurkův efekt, https://www.youtube.com/watch?v=PWGeUztTkRA • Vnímání může být ovlivněno tzv. primingem (priming): dřívější podnět ovlivňuje pozdější chování a myšlení ➢ Případ Davida Baina (odsouzen za vraždu 1995, později osvobozen v odvolacím řízení) ▪ Řekl Bain v telefonu I shot the prick.? 190 posluchačů nahrávky nikdo neslyšel I shot the prick. ↓ ↙ ↘ Rozdělení na 2 skupiny, každá s jinou informací Skupina A Bain řekl I shot the prick. Skupina B Bain řekl He shot them all. ↓ ↓ ↓ Nové poslechnutí nahrávky 30 %: ano, Bain řekl I shot the prick. větu He shot them all. nikdo neslyšel ↓ ↓ Expertíza: Bain neřekl I shot the prick. polovina stále tvrdila, že Bain řekl I shot the prick. Řeč jako zvuk: akustická fonetika Řeč je kombinace • tónových zvuků (pravidelné kmitání a rezonance) • šumových zvuků (nepravidelné šumy vzniklé třením) • ticha (při uzavření průchodu vzduchu) • Tónové zvuky lze rozdělit na různé složky, každá má jinou frekvenci a intenzitu • Nejvýraznější jsou samohlásky díky svým formantům (frekvenční složky s výraznou intenzitou – tmavé pruhy ve spektrogramu) Existuje unikátní otisk hlasu stejně jako unikátní otisk prstu? • Nejspíš ne, protože hlas jedince je odrazem jeho fyziognomie (velikost hlavy a dutin, velikost a tvar hlasivek) a výchovy (naučíme se mluvit určitým způsobem) [nature × nurture : dědičnost × prostředí] • Každý má jiný idiolekt projevující se jako specifická výslovnost (akcent), jako odraz regionální variability (dialekt), sociální variability (sociolekt) nebo kontextové/funkční variability (styl) • I jednovaječná identická dvojčata mají jiný hlas To je všechno pěkné, ale k čemu to je? • Jak poznatky o lidské řeči použít pro zjednodušení a zlepšení lidského života? • Jak mohou tyto poznatky napravit, co jsme my nebo příroda „pokazila“? • Jak může být fonetika užitečná v různých odvětvích lidské činnosti (pracovní, umělecké, právní, vědecké atd.)? Fonetika • Jazykovědná disciplína s největším přesahem k přírodním vědám • Jazykovědná disciplína s největší využitelností v praxi • Mediálně zajímavá např. Radek Skarnitzl (ředitel Fonetického ústavu FF UK) v Show Jana Krause: https://www.youtube.com/watch?v=ZjKbBB-JpmQ Možnosti aplikace fonetiky v praxi (výběr) Informační technologie, strojírenství (řečové technologie) Kriminalistika (forenzní fonetika) Lékařství (foniatrie, logopedie) • vytvoření umělé řeči • automatické rozpoznání řeči • automatické rozpoznání jazyka • rozpoznání mluvčího • identifikace mluvčího • profilování mluvčího • rozpoznání toho, co bylo řečeno • odstranění vrozených a poúrazových vad, poruch řeči • nápravy řečových vad a chybné výslovnosti Vzdělávání Umění A další… • výuka cizích jazyků • výuka správné výslovnosti • tvorba jazyků • řeč jako herecký prostředek • zpěv • např. reklama, tvorba značek (branding), animace Mluvicí stroje: syntéza řeči • Může lidskou řeč vytvořit něco jiného než člověk? • Lze vytvořit mechanický mluvicí stroj?[*] • Lze elektronicky generovat řeč stejně jako jiné zvuky? [*] Wolfgang von Kempelen (1734–1804), https://www.youtube.com/watch?v=k_YUB_S6Gpo Praktické výhody: • Lidé s poruchou řeči by mohli mluvit • Slepí lidé by mohli mít přístup k psanému textu • Líní lidé by nemuseli číst, ale jen poslouchat • Přístroje by mohly nahradit práci lidí (při poskytovaní informací přes telefon, automatický dabing) Alexa (Amazon), Siri (Apple), Cortana (Microsoft) Jak probíhá syntéza řeči? • Převod textu do řeči (TTS: text to speech) • Převod není přímý, ale probíhá přes fonetickou transkripci [|| ˈfonɛtɪkaᴗjɛ | ˈjazɪkovjɛdnaː | ˈdɪst͜sɪpliːna | ˈzabiːvajiːt͜siːᴗsɛ | ˈmatɛrɪjaːlɲiː | ˈstraːŋkou̯ | ˈzvukoviːx | ˈviːrazoviːx | ˈprostr̝̊ɛtkuː | ˈjazɪka ||] Psaný jazyk ≠ mluvený jazyk • Zapisujeme i to, co nevyslovujeme (řeč se rychle mění, psaný jazyk méně) čeština: jsi, leccos, srdce angličtina: late, knight, write mezery (!): dá mi × dámy • Vyslovujeme i to, co nepíšeme (více, než si myslíme) přízvuk: angl. importpods. jm. × importsloveso, č. na stole × stole některé hlásky: [fʔoku] v oku, [marije] Marie • Pravopis je víceznačný (jeden grafém = více fonů) pouček [po͡uček] × [poʔuček] ion [jo:n] × špion [špijo:n] baby [babi] × [bejbi] • Někdy zapisujeme celé pojmy 100 % studentů × 100% úspěšnost 777 123 567 • Jindy zase zkracujeme sv. Tomáš × sv. první IPA [ipa] × [iːpeːaː] Vlastní syntéza: generování umělé řeči Přístupy k syntéze řeči parametrický konkatenační Východiska: • akustické vlastnosti řeči zaznamenané jako číselné hodnoty • reálné promluvy (které se rozloží, složí a smíchají) Metoda: • zřetězení modelů řečových jednotek pomocí statistických modelů • zřetězení vhodně vybraných reálných zvukových jednotek Výhody a nevýhody: • stabilní kvalita, nižší kvalita řeči kvůli zprůměrování hodnot parametrů • vysoká adaptabilita • větší paměťová náročnost, ale přirozenější řeč • občasný výrazný pokles kvality u neobvyklých spojení řečových jednotek Ukázky obou: http://ui.kky.zcu.cz/cs/research-fields/acoustic-speech-synthesis#ttscs Co se skládá při (konkatenační) syntéze? Slova, to je jasné! • Časově náročné velké množství slov a slovních tvarů asi 120 000 podstatných jmen × 7 pádů × 2 čísla = 1 680 000 různých tvarů podstatných jmen v češtině • Náročné na hardware a software nutnost uložit nahrávky všech slov a rychle mezi nimi vyhledávat • Prakticky nemožné žádná databáze nezaznamenává všechna slova (často chybí nářeční slova, vlastní jména) nová slova stále přibývají (neologismy, přejímky) Tak hlásky! • Navzdory hláskovému písmu po hláskách vůbec nemluvíme pes není [p] [e] [s] malé děti a negramotní lidé nejsou obvykle schopni hlásky rozeznat • Řeč je nepřetržitá, hlásky na sebe plynule navazují a navzájem se ovlivňují důsledkem koartikulace [ki]tara × [ku]ře • Reálnější jednotkou tvorby a vnímání řeči je slabika (ale podobné problémy) Tak co tedy? Difony! • Difon (di-fon): spojení dvou vedle sebe stojících hlásek (fonů), popř. ticha strana = ticho-[s] + [st] + [tr] + [ra] + [an] + [na] + [a]-ticho • „Slepí“ se dohromady a překryvy se upraví • Dnes se však používá kombinace jednotek různé velikosti a volí se nejlepší kandidát stranám: [stran] + [naːm] stranovat: [stra]strana + [anovat]panovat • I náš mozek nejspíš takto řeč ukládá a tvoří To ale nestačí! • Je nutné vzít v úvahu rozdíly v melodii (intonaci) a síle řeči (přízvuku) importpodst.jm. × importsloveso pole × na pole To je moje. × To je moje? × To je moje! Upéct ne, uvařit. × Upéct, ne uvařit. × Upéct, neuvařit. Jak dobrá je syntéza řeči? • Dvě protichůdné síly: srozumitelnost × přirozenost • Vysoce srozumitelné syntézy málo přirozené • Vysoce přirozené syntézy mohou být méně srozumitelné • V reálné řeči dochází k zjednodušování a splývání hlásek A já mu povídám, ty vole, to nemůžeš šidit, protože to on pozná! [ʔa ja: mu poviːdaːm ti vole to nemuːžeš šiďit protože to ʔon poznaː] × [ʔa ja m̩ paːm ti we to nem̩ že šiďit pše toːn poznaː] Poslouchajicí stroje: Automatické rozpoznání řeči (ARŘ) • Daleko složitější než syntéza řeči u syntézy stačí vytvořit jeden hlas, ale u ARŘ pracujeme s miliony různých hlasů • Proto se systémy obvykle omezují na konkrétní mluvní situace např. komunikace s bankou přes telefon, informace o letech • Nebo omezeny na konkrétního mluvčího, kterého se učí rozpoznávat Jak ARŘ probíhá? • Nahrávka se rozdělí na úseky po 10 ms • Počítač (neuronová síť) srovnává každý úsek s databází zvuků a stanovuje míru pravděpodobnosti, jakou zvuk odpovídá různým hláskám • Zároveň se vypočítává kontextuální (fonotaktická) pravděpodobnost pro danou hlásku • A také jazyková (syntaktická) pravděpodobnost pro dané slovo a posloupnost slov • Výsledek je nejpravděpodobnější shoda Fonotaktika • Kombinace hlásek (fonémů) nejsou v jazyce náhodné • Některé kombinace nejsou možné [ť] + [eː] [t] + [č] na začátku slov [ř] + [j] uvnitř kořene • Některé kombinace jsou častější než jiné na začátku slov: [př] > [pr] > [st] > [sp] > [kr] > [tr] > [sl] Jak to zjistit? • Rozborem zvukové struktury slov nebo experimenty s mluvčími • Pro češtinu existuje Fonologický korpus češtiny (transkripce 461 tisíc slov)[*] [*] https://ujc.avcr.cz/phword Jaká je v češtině pravděpodobnost dalších hlásek po nosovce? 1. hláska 2. hláska 3. hláska nosovka [m]: 32 % samohláska: 82 % krátká s.: 90 % [a]: 35 % [e]: 17 % [i]: 21 % [o]: 20 % [u]: 7 % dlouhá s.: 10 % … … souhláska: 18 % … … … … [n]: 62 % samohláska: 100 % krátká s.: 93 % [a]: 30 % [e]: 62 % [i]: 1 % [o]: 5 % [u]: 1 % dlouhá s.: 7 % … … souhláska: 0 % … … … … [ň]: 2 % … … … … … … Forenzní fonetika aneb čím může být fonetika prospěšná pro kriminalistickou praxi? Některé úkoly forenzní fonetiky Identifikace mluvčího • kdo to mluvil? Profilování mluvčího • co nám řeč řekne o mluvčím? Analýza obtížných nahrávek • co bylo řečeno? Autentizace nahrávky • manipuloval někdo s nahrávkou? • existuje nahrávka, máme podezřelého • existuje nahrávka, ale žádný podezřelý • nahrávka je nezřetelná • chceme ověřit autentičnost nahrávky Identifikace mluvčího sporná nahrávka (neznámý pachatel) např. vydírání přes telefon, zneužití tísňového volání, nahrávka během přepadení ↔ ? jaká je míra shody? srovnávací nahrávka (nahrávka podezřelého) např. při výslechu Problémy • Nahrávka pachatele často bývá nekvalitní • Pachatel záměrně mění hlas • Podezřelý je nahráván v jiné řečové situaci Profilování mluvčího • Promluvy nepřenášejí jen informaci zakódovanou do slov (reprezentativní fce), ale také informace o nás (expresivní/výrazová fce) • Promluvy zároveň nějak působí na posluchače (apelativní fce) • Na našem způsobu mluvení se projevují různé sociální faktory (pohlaví[*] , věk[**] , místo narození/pobytu, vzdělání, společenské postavení, zaměstnání atd. → předmět zájmu sociofonetiky, odvětví sociolingvistiky) [*] biologicky dané, avšak sociokulturně ovlivněné [**] neprůkazné, mluvčí mají tendenci nadhodnocovat a podhodnocovat věk • Na mluvení se projevuje i požití omamných látek ➢ Havárie tankeru Exxon Valdez (největší ropná katastrofa, 1989) ▪ fonetikové zkoumali nahrávky kapitánových radiových zpráv ▪ mohl být pod vlivem alkoholu (výslovnost [š] místo [s]) • Zkušený fonetik (jazykovědec) může z nahrávky „vyčíst“ informace o mluvčím a vytipovat okruh podezřelých ➢ Yorkshirský rozparovač, 70. léta 20. století (13 ubodání žen, 7 pokusů o vraždu) ▪ na základě nahrávky jazykoví experti lokalizovali čtvrť ve městě Sunderland ▪ autor nahrávky John Humble byl skutečně z této čtvrti, ale nebyl yorkshirským rozparovačem; tím byl Peter Sutcliffe → Literatura • Skarnitzl, Radek – Šturm, Pavel – Volín, Jan. 2016. Zvuková báze řečové komunikace: Fonetický a fonologický popis řeči. Karolinum. [odtud většina fonetických obrázků] • Skarnitzl, Radek (ed.), 2014. Fonetická identifikace mluvčího. Karolinum. • Ladefoged, Peter – Disner, Ferrari. 2012. Vowels and Consonants. Třetí vydání. Wiley-Blackwell. • Munro, Murray J. 2021. Applying Phonetics. Wiley-Blackwell. • Matoušek, Jindřich. 2017. SYNTÉZA ŘEČI. In: Petr Karlík, Marek Nekula, Jana Pleskalová (eds.), CzechEncy - Nový encyklopedický slovník češtiny. URL: https://www.czechency.org/slovnik/SYNT%C3%89ZA%20%C5%98E%C4 %8CI • Nekula, Marek. 2017. FUNKCE JAZYKA. In: Petr Karlík, Marek Nekula, Jana Pleskalová (eds.), CzechEncy - Nový encyklopedický slovník češtiny. URL: https://www.czechency.org/slovnik/FUNKCE%20JAZYKA