– 27 – 2. Explozivy v intervokalické pozici 2.1. Uvedení do artikulačních a akustických vlastností Explozivy jsou obstruenty, jejichž artikulace sestává ze dvou fází: závěr (úplná překážka) a exploze (uvolnění překážky). Během závěrové fáze je vokální trakt úplně uzavřen, takže se před překážkou (ve smyslu výdechového proudu vzduchu) hromadí vzduch a stoupá intraorální tlak. Ve fázi explozivní se překážka uvolní, rychle unikající proud vzduchu mezi oddalujícími se artikulátory způsobí vyrovnávání intraorálního a atmosférického tlaku a za překážkou (ve smyslu výdechového proudu vzduchu) vzniká krátký turbulentní šum. Akustické rysy obou fází explozivy se liší mimo jiné v závislosti na jejich znělosti. U neznělých exploziv se nevyskytuje základní frekvence (F0) ani formantová struktura. Protože glotální a supraglotální aktivity nejsou při artikulaci plně synchronizovány, setkáváme se na začátku závěrové fáze s dozníváním základní frekvence (Stevens, 1998: 333) předcházejícího vokálu v trvání přibližně 20–30 ms. Krátký explozivní šum bývá poměrně výrazný. U (plně) znělých exploziv je po celou dobu jejich trvání přítomna základní frekvence (bez formantové struktury). Šumová složka v explozivní fázi bývá velmi slabá nebo úplně chybí. Všechny akustické události v explozivách (závěr, exploze, nástup základní frekvence, přechodové fáze k sousedním vokálům) se obvykle liší trváním jednak v závislosti na znělosti, jednak na místě artikulace, což je důsledkem různé masy a hybnosti artikulačních orgánů, které se účastní artikulačních pohybů (Machač, 2006). Kromě relativního trvání se explozivy (zejména neznělé) liší spektrálním složením explozivního šumu, který má nejvyšší frekvenci u alveolár (okolo 4–5 kHz), velární Fonetika_CZ_def.indd 27Fonetika_CZ_def.indd 27 25.2.2010 12:11:3725.2.2010 12:11:37 – 28 – šum se pohybuje v oblasti 1,5–2 kHz (veláry ovšem bývají silně ovlivněny kvalitou okolních vokálů) a bilabiály mají poměrně ploché spektrum bez výrazného maxima. 2.2. Vlastní fonetické rysy a základní pravidla pro segmentaci Za vlastní fonetické rysy exploziv lze považovat: a) závěrovost, tj. přítomnost úplné překážky v daném místě artikulace a v důsledku toho nepřítomnost formantové struktury, b) explozivnost, tj. uvolnění závěru v podobě explozivního šumu, c) orálnost a d) přítomnost základní frekvence (F0) u fonologicky znělých exploziv a její nepřítomnost u exploziv fonologicky neznělých. Při stanovování pravidel pro segmentaci hledáme takové vlastní fonetické rysy obou typů hlásek (zde exploziv a vokálů), které jsou relevantní pro jejich odlišení v akustickém signálu. Některé z vlastních rysů jsou bezesporu významné pro charakteristiku hláskových typů, nemohou však sloužit jako spolehlivé a praktické vodítko pro umístění hranice. Podívejme se nejprve, které rysy pro segmentaci intervokalických exploziv nevyužíváme. Jedná se zejména o základní frekvenci a o šumovou složku explozivní fáze. Orientace podle přítomnosti nebo nepřítomnosti F0 je problematická proto, že se jedná o společný fonetický rys vokálů a znělých exploziv. Pokud bychom tento rys užívali pouze pro segmentaci neznělých exploziv (neznělost jako kontrast vůči sousednímu vokálu), narazili bychom na dva problémy. Jedním je doznívání F0 předcházejícího vokálu do začátku závěrové fáze, druhým srovnatelnost segmentace znělých a neznělých exploziv. Problematičnost využití konce šumu pro umístění pravé hranice explozivy spočívá v tom, že bývá u znělých exploziv podstatně méně výrazný a kratší než u neznělých, jeho konec může být obtížně zachytitelný nebo šum chybí úplně. Srovnatelnost Fonetika_CZ_def.indd 28Fonetika_CZ_def.indd 28 25.2.2010 12:11:3725.2.2010 12:11:37 – 29 – segmentace znělých a neznělých exploziv by tak opět byla obtížná a neodpovídala by plně změnám ve vokálním traktu. Obr. 2.1. Schematické znázornění průběhu F0, vyšších formantů (F1, F2) a šumu v sekvenci vokál-exploziva-vokál. Obr. 2.2. Sekvence [ucɪ] ilustruje využití kritéria plné formantové struktury. Akustické události jsou označeny takto: (1) plná formantová struktura vokálu, (2) doznívání základní frekvence v závěrové fázi, (3) závěrová fáze bez základní frekvence, (4) explozivní šum, (5) předznívání základní frekvence. Explozivu chápeme jako sled fází 2 až 5. Fonetika_CZ_def.indd 29Fonetika_CZ_def.indd 29 25.2.2010 12:11:3725.2.2010 12:11:37 – 30 – Při určování vlastních fonetických rysů relevantních pro segmentaci exploziv v sousedství vokálů vycházíme proto ze skutečnosti, že vokály jsou artikulačně charakterizovány otevřeností vokálního traktu a akusticky přítomností plné formantové struktury, zatímco explozivy kontrastují artikulačně s okolními vokály zejména zavřeností vokálního traktu a akusticky nepřítomností formantové struktury. Obrázek 2.1 ukazuje průběh vybraných fonetických rysů intervokalických exploziv: F0, vyšších formantů (F1, F2) a šumu. Černá barva označuje nejvyšší míru přítomnosti daného rysu, odstíny šedi směrem k světlejší vyjadřují ubývání rysu, směrem k tmavší jeho přibývání a barva bílá značí nepřítomnost rysu. Při stanovování pravidel pro určování hranic explozív docházíme k závěru, že různý charakter znělých a neznělých exploziv sotva dovoluje jejich srovnatelnou segmentaci pouze Obr. 2.3. Sekvence [apɛ] s méně zřetelnou explozí. Fonetika_CZ_def.indd 30Fonetika_CZ_def.indd 30 25.2.2010 12:11:3825.2.2010 12:11:38 – 31 – na základě artikulačních a akustických vlastností jich samých. Proto při určování vlastních fonetických rysů relevantních pro segmentaci vycházíme z kontrastu přítomnosti a nepřítomnosti plné formantové struktury. Na obrázku 2.2 je sekvence [ucɪ] rozčleněna do šesti akustických událostí (označené číslicemi mezi oscilogramem a spektrogramem) a hranice hlásek jsou založeny na kritériu „plné formantové struktury“. Současně je zřejmé, že využití základní frekvence pro určování hranic explozivy by bylo zavádějící. Na obrázku 2.3 je příklad intervokalické explozivy [p], tentokrát s (vizuálně) málo zřetelným explozivním šumem. Výše jsme zmínili, že explozivní fáze znělých exploziv bývá slabá a někdy se sotva zřetelným kontrastem v oscilogramu, ačkoli mluvčí vytvořil úplný závěr. Příklad je znázorněn Obr. 2.4. Sekvence [abɪ] se slabou explozí a téměř bez šumové složky. Fonetika_CZ_def.indd 31Fonetika_CZ_def.indd 31 25.2.2010 12:11:3825.2.2010 12:11:38 – 32 – na obrázku 2.4 v sekvenci [abɪ]. Nástup plné formantové struktury je však dobře patrný, a segmentace proto není problematická. 2.3. Další pravidla pro segmentaci V tomto oddílu se věnujeme příkladům, kdy je stanovení hranic méně jednoznačné, protože exploziva nebyla vytvořena v kanonické podobě. Jedním z vlastních fonetických rysů exploziv, které vykazují menší stabilitu a nemusejí tedy být v řeči vždy přítomny, je závěrovost. Při podstatném, avšak neúplném přiblížení artikulátorů vzniká překážka podobná úžině u frikativ a následkem toho též třecí šum. V takovém případě můžeme hovořit o frikativizaci exploziv. Při umísťování hranic potom postupujeme obdobně jako u frikativ (podrobnosti v kapitole 3), za základní fonetický rys přitom opět považujeme nástup Obr. 2.5. Sekvence [ɛɟɛ] se slabou frikativizací. Fonetika_CZ_def.indd 32Fonetika_CZ_def.indd 32 25.2.2010 12:11:3825.2.2010 12:11:38 – 33 – Obr. 2.7. Sekvence [ɛɟɛ] s „polovokalickým“ /ɟ/. Obr. 2.6. Sekvence [ɛɟɛ] se silnější frikativizací (a s částečnou desonorizací v závěrové fázi). print-bis1gs6-margin-0 – 34 – plné formantové struktury, jak je znázorněno na obrázku 2.5 a zejména 2.6. Ačkoli se oba příklady vztahují k palatále [ɟ], týká se tento jev i jiných exploziv. Obtížnější případy pro segmentaci nastávají tehdy, když u znělých exploziv místo vytvoření úplné překážky dojde pouze k malému přiblížení artikulačních orgánů a hláska získává „polovokalický“ charakter. Obrázek 2.7 zachycuje další sekvenci [ɛɟɛ], kde exploze není viditelná vůbec. Z důvodu polovokalického charakteru [ɟ] je nástup formantové struktury poněkud pozvolnější a umístění hranice je obtížnější. V takových případech je vhodné brát v úvahu zřetelnost formantové struktury, komplexnost tvaru zvukové vlny, relativní amplitudu a také sluchový dojem. Zejména velární explozivy bývají realizovány s vícenásobnou explozí. O tomto jevu se zmiňujeme přesto, že z hlediska segmentačního není zdrojem problémů, neboť je pro nás důležitý Obr. 2.8. Sekvence [ku] s vícenásobnou explozí. Fonetika_CZ_def.indd 34Fonetika_CZ_def.indd 34 25.2.2010 12:11:3925.2.2010 12:11:39 – 35 – nástup plné formantové struktury. Obrázek 2.8 ukazuje příklad [k] s trojnásobnou explozí. V úvodním oddílu se zmiňujeme o tom, že často není možné určit přesný časový okamžik, kdy určitý akustický jev začíná nebo končí, a že se spíše setkáváme s kratšími či delšími fázemi postupného přechodu, tzn. přechodovými oblastmi. V takových případech nejsou fonetické rysy, které považujeme za relevantní pro odlišení sousedních hlásek, dostatečně zřetelným vodítkem k umístění hranice, neboť akustický kontrast v přechodové fázi je nízký. Přechodová oblast může mít různé podoby, například: a) rozpad formantové struktury je pozvolný, může trvat až desítky milisekund, b) formantové sloupky nejsou zřetelné, Obr. 2.9. Sekvence [iːku] s relativně dlouhými přechodovými oblastmi na obou stranách [k]. Silné horizontální čáry v horní části obrázku označují rozsah rozpadu a tvoření formantové struktury, šipky jejich přibližnou frekvenční polohu. Fonetika_CZ_def.indd 35Fonetika_CZ_def.indd 35 25.2.2010 12:11:3925.2.2010 12:11:39 – 36 – c) formantová struktura se překrývá se šumovou složkou. Přechodová oblast se u exploziv vyskytuje hojněji na jejich začátku, neboť sbližování artikulátorů (tvoření závěru) patrně probíhá pomaleji než jejich oddalování (které je urychlováno vzduchem nahromaděným před překážkou). Na obrázku 2.9 vidíme přechodová pásma na obou stranách explozivy. V obou případech klademe hranice do středu těchto oblastí. V sekvenci [iːk] přechodovou fázi představuje relativně pomalé oslabování formantové struktury (označeno černou vodorovnou čarou). V sekvenci [ku] se formantová struktura rovněž vytváří poměrně pomalu. Na obrázku 2.10 vidíme další příklad pozvolně se rozpadající formantové struktury, zvláště v oblasti F2 mírně pod frekvencí 1 kHz. Obr. 2.10. Sekvence [uta] s pozvolna oslabovanou formantovou strukturou. Silná horizontální čára v horní části obrázku označuje rozsah rozpadu formantové struktury, šipka jeho přibližnou frekvenční polohu. Fonetika_CZ_def.indd 36Fonetika_CZ_def.indd 36 25.2.2010 12:11:3925.2.2010 12:11:39 – 37 – Se zajímavými přechodovými oblastmi se můžeme setkat ve spojení [iː] s dorzální (tj. velární nebo palatální) explozivou. Poměrně pomalé přibližování artikulátorů při tvoření závěru často začíná již během artikulace vokálu, takže při znění tónu vzniká úžina a třecí šum podobný znělé frikativě palatální [ʝ]. Rozhodnutí jak zacházet s takovýmito případy je spíše arbitrární. Hranici lze umístit například na začátek šumu, na jeho konec nebo – jak jsme se rozhodli – pojímat šum jako přechodovou oblast a hranici umístit do jeho středu (viz obr. 2.11). Poslední jev, o kterém se zmiňujeme v souvislosti se segmentací exploziv, je častá implicitní nebo „krátká“ realizace alveoláry /d/. Špička jazyka, místo aby se podílela Obr. 2.11. Sekvence [iːku] s palatálním šumem. Silná horizontální čára označuje přechodovou oblast. Fonetika_CZ_def.indd 37Fonetika_CZ_def.indd 37 25.2.2010 12:11:4025.2.2010 12:11:40 – 38 – na vytvoření úplné překážky, vykoná pouze balistický pohyb s velmi krátkým alveolárním kontaktem. Tento takzvaný alveolární švih [ɾ] je značně frekventovaný v americké angličtině jako varianta obou alveolárních exploziv /t/ a /d/. Slova jako latter a ladder pak znějí v podstatě stejně [ˈlæɾɚ]. V češtině se [ɾ] vyskytuje jako převažující varianta vibranty /r/ (viz kap. 5), ve španělštině se jedná o standardní výslovnost “krátkého” /r/. Na obrázku 2.12 jsou znázorněny dvě realizace /d/ formou alveolárního švihu v českém slově budu. Na obrázku vlevo je patrné oslabení formantové struktury ve vyšších frekvencích v důsledku velmi krátkého přiblížení špičky jazyka k alveolám. Na ukázce vpravo je poměrně obtížné stanovit pravou hranici pouze na základě zobrazení, pro segmentaci považujeme za nutný poslech. Obr.2.12. Dva příklady sekvence [uɾu], v levém zobrazení zřetelnější než v pravém. Fonetika_CZ_def.indd 38Fonetika_CZ_def.indd 38 25.2.2010 12:11:4025.2.2010 12:11:40 – 39 – 2.4. Shrnutí Umísťujeme-li hranice kanonicky vyslovených exploziv, používáme kritérium plné formantové struktury. To znamená, že exploziva začíná na konci plné formantové struktury (na pravé straně posledního zřetelného formantového sloupku) a končí na začátku plné formantové struktury (na levé straně prvního zřetelného formantového sloupku). Doznívání základní frekvence na začátku závěrové fáze stejně jako předznívání základní frekvence na konci fáze explozivní pojímáme jako součást explozivy. Pokud rozpad nebo tvoření formantové struktury probíhá pozvolna nebo nejasně, považujeme takový úsek v signálu za přechodovou oblast a hranici explozivy klademe do jejího středu (tj. do průchodu nulou nejblíže středu přechodové oblasti). Při výslovnosti exploziv bez úplné překážky využíváme pro segmentaci především plnou formantovou strukturu sousedních vokálů, dále tvar zvukové vlny, snížení amplitudy a – pokud je to užitečné – poslech. Podrobnosti k segmentaci frikativizovaných exploziv nebo exploziv polovokalického charakteru (viz výše) uvádíme v kapitolách o segmentaci frikativ a aproximant. Závěrem se zmiňme o aspirovaných explozivách. Aspirace je frekventovaným jevem například u napjatých exploziv na začátku přízvučné slabiky v angličtině a němčině. Protože se aspirace akusticky podobá neznělým frikativám, umísťujeme její pravou hranici v souladu s pravidly pro segmentování neznělých frikativ (viz kap. 3). Fonetika_CZ_def.indd 39Fonetika_CZ_def.indd 39 25.2.2010 12:11:4025.2.2010 12:11:40