Co dokáže náš hlas? Fonetický pohled na variabilitu řečové produkce Radek Skarnitzl l.ÚVOD S vokalizací neboli používáním hlasu pro komunikaci se setkáváme u řady zvířecích druhů (Fitch 2000). Jen u lidí se však vokalizace vyvinula v hlavní modus komunikace, při němž složitá souhra několika mluvních orgánů vytváří komunikačně funkční změny v proudění vzduchu. Zjednodušeně můžeme říct, že při produkci řeči ze vzduchového proudu vycházejícího z plic vzniká kmitáním hlasivek jakýsi „primární" zvuk, který dále modifikujeme pomocí artikulačních orgánů ve vokálním traktu. Klíčovým aspektem hlasivkových a artikulačních pohybů je koordinace: ačkoli všechny tyto orgány, na jejichž pohybech se podílejí desítky různých svalů, mají obrovské množství stupňů volnosti (Kelso — Saltzman —- Tuller 1986), výše zmíněná synergická souhra probíhá zcela hladce a přirozeně. Cílem tohoto článku je prozkoumat na jedné straně možnosti, které nám jako mluvčím náš řečový mechanismus poskytuje, a na straně druhé způsoby, jimiž těchto možností v každodenní komunikaci využíváme. Jedním z ústředních témat článku tedy bude něco, co se v pojednáních o zvukové stránce jazyka někdy neobjevuje: variabilita řečové produkce. Řečová variabilita bývá v mnoha přístupech redukována na systematické (alofonické) změny podmíněné segmentálním či prozodickým kontextem: neznělé explozivy na začátku prízvučné slabiky bývají například v angličtině či němčině aspirované, samohlásky v okolí nosových souhlásek bývají nazalizované. Již méně často se setkáme s diskusí aspirace a nazalizace v češtině, ačkoli se aspirace u některých mluvčích vyskytuje ve finálních pozicích (např. ve větě Chce se mi spát.) •a nazalizace může sloužit jako signál ironie nebo i jako kvazipermanentní zabarvení hlasu konkrétního mluvčího. Takové změny se tradičně považovaly za náhodné a až v poslední době se ukazuje, že mohou v komunikaci hrát nezanedbatelnou roli. Tím se již dotýkáme druhého ústředního tématu tohoto příspěvku: zajímá nás, co variabilita v řeči signalizuje, tedy — z pohledu posluchače — co všechno z řeči můžeme vyčíst. Proces tvorby řeči se většinou dělí na tři složky: respirační (dechovou), která pro účely tohoto pojednání není zásadní, dále pak fonační a artikulační (blíže viz Skarnitzl — Šturm — Volín 2016, 2. kap.). Podle filtrové teorie produkce řeči (anglicky source-filter iheary; Fant 1960) považujeme fonační aparát za zdroj (již jsme uvedli, že zde kmitáním hlasivek vzniká primární zvuk) a artikulační ústrojí za filtr, v němž je tento primární zvuk tvarován do nejrůznějších podob. Protože zdroj i filtr fungují 98 SLOVO A SMYSL 26 do značné míry nezávisle na sobě a naší řeči propůjčují odlišné kvality, pojednáme o nich v samostatných oddílech. Ve čtvrtém oddílu představíme doposud nejpropra-covanější model variability řečové produkce, pomocí nějž možnosti a limity řeči systematicky shrneme. V oddílu pátém se zaměříme na opačnou stranu komunikačního procesu a ukážeme, co všechno o sobě řečí sdělujeme komunikačnímu partnerovi. 2. VARIABILITA FONAČNÍHO CHOVÁNÍ Fonační ústrojí se nachází v hrtanu (larynx), který představuje složitý komplex chru-pávkových, svalových a vazivových tkání. Je dobře známo, že se hrtan vyvinul především jako svěrač bránící průniku cizích těles do dechového systému. Tato a další primární funkce hrtanu výrazně omezily možnosti tvorby zvuku. Z anatomického hlediska je fonační mechanismus u všech lidí víceméně podobný a i škála zvuků, které jsme schopni produkovat, se u různých lidí příliš neliší; srovnejme lidské možnosti s širokou paletou zvuků, s nimiž se setkáme u ptáků, jimž se kromě hrtanu vyvinul orgán přímo pro zpěv, syňnx (viz např. Catchpole — Slater 2008). Pevné laryngální struktury schematicky ilustruje obrázek 1 {blíže viz Skar-nitzl 2011, 2. kap.). Chrupavka prstencová nasedá na horní chrupavku průdušnice; na její zadní zvýšené straně se nacházejí chrupavky hlasivkové, z jejichž předních výběžků se pnou hlasivky směrem dopředu k chrupavce štítné; chrupavka štítná je pak kloubně spojena s chrupavkou prstencovou. Pohyb přední části štítné chrupavky směrem dolů, umožněný štítno-prstencovým kloubem a svalem, napíná hlasivky a je zodpovědný za zvyšování základní frekvence kmitání hlasivek. Změny základní frekvence (Fo) vnímáme jako změny výšky hlasivkového tónu. obrázek 1: Schematické zobrazení pevných hrtanových struktur (pohled zezadu zleva) 2.1. ZMĚNY ŘEČOVÉ MELODIE Podívejme se na základní frekvenci detailněji. Melodických změn při řečí bohatě využíváme, zároveň se však mluvčí od sebe v jejich používání liší. Proto nám Fo poslouží jako vhodný první parametr pro diskusi variability v řečové produkci. Je zřejmé, že u průměrné mluvčí ženského pohlaví hlasivky kmitají s vyšší frek- ^DEKSKARNITZL 99 -end než u průměrného muže. Základní frekvence primárně závisí na délce hlasi-'tik- Ty js°u u mužů přibližně o 60 procent delší než u žen (Titze 1989); průměrná hodnota Fo u mužů se tak pohybuje kolem 120 Hz, u žen okolo 200 Hz. Kromě pohlaví mluvčího závisí Fo i na dalších faktorech (podrobněji o nich pojednávají Skar-nitzl — Hývlová 2014). Mnohdy se nám například zdá, že mluvčí jiného jazyka s řečovou melodií zacházejí odlišně: hovoří obecně výš či níž, více či méně „zpívají", připadají nám afektovaní či znudění. Empirické výzkumy tyto dojmy skutečně potvrzují: střední hlasová frekvence se liší v různých jazycích (např. Keating — Kuo 2012), či dokonce dialektech téhož jazyka (Deutsch et al. 2009); jazyky se odlišují v intonačním rozpětí (Mennen — SchaerRer — Docherty 2012) a v prozodickém frázování (jun 3003). Kromě toho jsou naše melodické projevy samozřejmě ovlivněny i psychologickými a situačními faktory (Braun 1995). Do první skupiny patří především různé afektivní stavy: nejvýrazněji základní frekvencí ovlivňují prožívané emoce (Banse — Scherer I996) ~~ jinak hovoříme, když jsme veselí, naštvaní či smutní — a dále pak nálady, postoje, aktuální ladění a osobnostní vlastnosti mluvčího (Scherer 2003). K situačním faktorům řadíme například vliv mluvního stylu (mluvčí bude s melodií zacházet jinak pří veřejné přednášce a jinak při nenuceném hovoru se svými přáteli) nebo hladinu okolního hluku (hovoří se o tzv. Lombardově efektu; Lu ~ Cooke 2008). Za zmínku stojí nakonec také skutečnost, že základní frekvence je parametr, který mluvčí nejčastěji mění, když chtějí maskovat svůj hlas, například při anonymním telefonátu; Růžičková a Skarnitzl (v přípravě) ukazují, že v maskovaném projevu se oproti běžné řeči průměrná Fo významně lišila u 60 ze 100 zkoumaných mluvčích. Na jedné straně je tedy základní frekvence výrazně ovlivněna délkou hlasivek konkrétního mluvčího, na straně druhé je však rozpětí frekvencí, jež nám naše hlasivky umožňují, skutečně obrovské. Jak bude zřejmé i na následujících stránkách, anatomické struktury našeho řečového mechanismu určují mezní hodnoty pro konkrétní akustické parametry, tyto limity jsou ale zároveň značně „štědré". 2.2. KVALITA HLASU Doposud jsme hovořili pouze o základní frekvenci kmitání hlasivek. Hlasivková činnost je však mnohem bohatší. V úvodu jsme zmínili, že fonace představuje zdrojový signál, že kmitáním hlasivek vzniká jakýsi primární zvuk, který je dále filtrován ve vokálním traktu. Z toho je zřejmé, že hlasivky nekmitají pouze jednou (základní) frekvencí, ale že se jedná o složený tón: jen složený tón s bohatým obsahem frekvencí může rozkmitat vokální trakt na různých frekvencích. Obrázek 2 zjednodušeně naznačuje několik základních způsobů kmitání — nalevo základní frekvenci, dále pak druhou a třetí harmonickou složku. Ze zobrazení napravo je pak patrné, že hlasivky kmitají nejen v předo-zadním směru, ale i ve směru vertikálním. V jednoduchém obrázku však již nelze zachytit, že hlasivky ve skutečnosti kmitají všemi těmito a dalšími způsoby zároveň a že amplitudu jednotlivých složek můžeme do jisté míry měnit (Titze 1994,4- kap.), což dává vzniknout různým komunikačně funkčním kvalitám hlasu. Různé způsoby kmitání hlasivek jsou umožněny jednak precizně vrstvenou strukturou samotných hlasivek, jednak jemným nastavením laryngálních svalů. 100 SLOVO A SMYSL 26 obrázek 2: Schematické zobrazení několika způsobů kmitaní hlasivek, upraveno podle: Titze (1994, s. 98) a Skamitzl (2011, s. 38) Vnitřní hrtanové svaly delíme podle jejich funkce na ty, které hlasivky svírají, otevírají, napínají a uvolňují, ale při řeči často bývají aktivní současně v synergické souhře, což umožňuje již zmíněné velmi jemné ovládání hlasivek a hlasových kvalit. Pro popis různých kvalit fonace jsou důležité tři parametry naznačené v obrázku 3: addukční napětí (napětí přitahující hlasivkové chrupavky k sobě), podélné napětí hlasivek a středové stlačení hlasivek (Laver 1980,3. kap,). addukční ^ addukční napětí napětí obrázek 3: Tři parametry svalového napětí v hrtanu, upraveno podle: Laver 1980, s. 109 Většina mluvčích nejčastěji používá normální (někdy také modálni) fonaci, pří níž všechny tři parametry dosahují neutrálních hodnot a která je zároveň nej efektivnější: stojí nás jen nepatrné úsilí a výsledný zvuk je poměrně hlasitý. Vysoká amplituda kmitání je naznačena i na levé části obrázku 4. Při normální fonaci zapojujeme především hrtanové svěrače, které k sobě přiblíží hlasivkové chrupavky i samotné hlasivky. Když se hlasivky takto dostanou do fonačního postavení, rozkmitá je vzduch proudící z plic. To je důležitý aspekt hlasivkového kmitání obecně: svalovou činností hlasivky pouze nastavíme do cílové pozice, kmitání už je pak samočinné, poháněné aerodynamickými silami a elasticitou hlasivkových tkání (Titze 1994). RADEK SKARNITZL 101 normální dyšná třepená napjatá obrázek 4: Schematické zobrazení nastavení hlasivkových chrupavek a hlasivek při základních typech fonačních modifikací; podoba kmitání hlasivek je naznačena přerušovanou čarou Jak již bylo řečeno výše, základní nastavení hlasivkového kmitání — normální fo-naci — můžeme v návaznosti na komunikační záměr měnit; hovoříme pak o fonačních modifikacích, o odlišných kvalitách hlasu, které se v alespoň jednom ze tří výše zmíněných parametrů odchylují od neutrálního nastavení. Nejběžnější tři modifikace ukazuje zbývající část obrázku 4. Při dyšné fonaci je více aktivován hrtanový rozvěrač, který od sebe trochu oddálí hlasivkové chrupavky, a dochází tak ke snížení addukčního napětí. Mezi hlasivkovými chrupavkami uniká vzduch a kmitání hlasivek je doprovázeno dyšným šumem. Kvůli tomu je dyšná fonace neefektivním způsobem používání hlasu: vzduch v plicích mluvčímu mnohem rychleji dojde. Jako habituální způsob fonace je dyšná fonace často projevem nějakého patologického jevu (Shipley — McAfee 2009,11. kap.). V rámci každodenní variability však dyšný hlas běžně používáme při sdělování něčeho důvěrného, k navození intimní či tajemné atmosféry. Mimoto si můžeme všimnout, že vyšší míra dyšnosti je charakteristickým rysem ženských hlasů (Henton — Bladon 1985, Van Borsel — Janssens — De Bodt 2009). Výzkumy opakovaně ukazují, že posluchači považují dyšné ženské hlasy za přitažlivější (např. Liu — Xu 2011, Babel — McGuire — King 2014); dyšná kvalita hlasu údajně výrazně napomohla popularitě americké herečky Marilyn Monroe. Třepená fonace je ještě zajímavější kvalitou hlasu, a to nejen z hlediska své produkce, ale zejména pro své sociolingvistícké vlastnosti. Je charakteristická nízkou frekvencí kmitání — někdy tak nízkou, i pod 30 Hz, že sluchem rozeznáme jednotlivé kmity — a často také mírně aperiodickým kmitáním. Třepená fonace, resp. její různé podtypy (Keating — Garellek — Kreiman 2015), jsou výsledkem složitého nastavení hltanových svalů a hlasivek. Jak naznačuje obrázek 4, hlasivkové chrupavky jsou přitisknuté těsněji k sobě (addukční napětí je vyšší), a proto mohou kmitat jen přední části hlasivek. Hlasivky jsou díky složitému nastavení hlasivkových svalů ^nižšímu středovému stlačení a nižšímu podélnému napětí) kratší a tlustší. Amplituda kmitání je rovněž nízká, hlasivky jsou po většinu cyklu zavřené a vzduch skrz ně jen jakoby „probublává". Z popisu nejspíš vyplývá, že se jedná o poněkud nezdravý způsob fonace, který jako trvalé nastavení opět může být znakem laryn-gální patologie. S třepenou fonací se však zcela běžně setkáváme na konci promluvových úseků s klesavou intonací (Henton — Bladon 1988, Wolk — Abdelli-Beruh — Slavin 2012). Můžeme vidět souvislost s jedním z deklinačních jevů: v okamžicích, kdy nám dochází vzduch v plicích, klesá síla výdechového proudu a základní frekvence, hlasivky často „přepnou" do jiného způsobu kmitání. Ogden {2001) ukazuje, 102 SLOVO A SMYSL 26 že ve finštině slouží třepená fonace jako signál konce repliky v konverzaci, kdy jeden mluvčí předává slovo druhému. Na třepené fonaci je však především fascinující její používání jakožto signálu identity, zejména v angličtině. Necelých třicet let starý článek Hentonové a Bladona, který se jako jeden z prvních věnoval sociofonetickým aspektům třepené fonace, uvádí pro standardní britskou a severní angličtinu statisticky významně vyšší míru užívání u mužů než u žen. Podobně Stuart-Smithová uvádí ještě ke konci minulého století vyšší výskyt třepené fonace u mužů ve skotském Glasgow {Stuart-Smith 1999). V posledních přibližně deseti letech došlo však k dramatické změně v používání třepené fonace, hlavně v americké angličtině. Třepená fonace se stala jedním z charakteristických rysů výslovnosti mladých amerických žen (srov. data pro ženy u Wolk et al. 2012 a pro muže ve studii stejného autorského týmu, Abdelli-Beruh — Wolk — Slavín 2014, dále pak Podešva 2013, Melvin — Clopper 2015). Yuasa (2010) ukázala, že mladé kalifornské ženy třepenou fonaci používají významně více než muži — tradičně se zmiňují například Britney Spears, Kim Kardashian a další „Valley Girls". Třepená fonace {anglicky např. areak, creáky vaice, vocal fry) se stala široce diskutovaným fenoménem: o výzkumech „třepení" běžně informují standardní média a kanál youtube je plný nejrůznějŠích sestřihů a parodií. Yuasaová hypotetizuje, že postupně dochází k reinterpretaci třepené fonace jakožto nové ženské kvality hlasu. Posluchači v její studii popisovali mluvčí s nejvyšší mírou třepené fonace jako vzdělanou ženu, profesionálku, která nejspíš pochází z většího města. Yuasaová a také Podešva {2013) se domnívají, že třepená fonace (která, jak jsme uvedli, je charakteristická nízkou frekvencí kmitám' hlasivek) ženám umožňuje znít více jako muži, a tedy autoritativněji, aniž by však ženy působily agre^ sivně. Oproti těmto pozitivním vlastnostem je podle studie z roku 2014 vnímání třepené fonace u žen veskrze negativní: mluvčí byly vnímány jako méně kompetentní, méně vzdělané, méně důvěryhodné a atraktivní, a posluchači {400 žen a 400 mužů) by byli méně ochotní tyto mluvčí přijmout na pracovní pozici (Anderson et al. 2014). Z výsledků zmíněných studií tedy vyplývá hlavně to, že změna — zřejmě jak v oblasti pro dukce třepené fonace, tak i jí připisovaných sociálních charakteristik — stále probíhá. Posledním typem fonace uvedeným na obrázku 4 je napjatá fonace. Při té vyšší aktivita obou hrtanových svěraču způsobuje silné středové stlačení hlasivek a vyšší addukční napětí. Kvůli tomuto silnému napětí dochází k zúžení v horní Části hrtanu a i přes vysoký subglotální tlak je proudění vzduchu hrtanem snížené. Ve srovnání s normální fonaci vykazuje napjatá fonace větší míru odchylek v trvání a amplitudě jednotlivých hlasivkových cyklů a obsahuje více šumových složek (Moisik 2012). Výsledný hlas se většinou popisuje jako drsný a pro hlasivky je velmi nezdravý. Typickým představitelem napjaté fonace je americký jazzman Louis Armstrong. Moisik ukázal, že tuto kvalitu hlasu často používají umělci představující Afroameričany a že se může jednat o hlasový způsob vyjadřování rasových stereotypů. V anglofonní literatuře se uvažuje o další kvalitě hlasu, která je nám známa spíš ze zpěvu: o falzetu, při němž je podélné napětí hlasivek velmi vysoké, kmitá jen jejich přední část a výsledkem je „tenký hlásek". Zde se falzetu blíže nevěnujeme, protože v běžné spontánní češtině se — alespoň na základě neformálních pozorování — příliš často nevyskytuje; to možná souvisí i s obecně plošší intonací v češtině. Nicméně v angličtině se falzet pro signalizaci různých sociálně relevantních kategorií používa (viz např. Podešva 2007). RADEK SKARNITZL 103 V oddílu 2.1 byly v souvislosti s melodickým chováním zmíněny afektivní stavy. Je zřejmé, že k signalizaci nejrůznějších afektivních stavů využíváme i fonačních modifikací (Banse — Scherer 1996, Klasmeyer — Sendlmeier 2000). Nedávné výzkumy ukazují, že kvalita hlasu je zásadní především pro vyjadřování emocí, o něco méně pak již pro signalizaci postojů a nálad (Grichkovtsova — Morel — Lacheret 2012). V jedné takové studii se například ukázalo, že napjatá fonace je vnímána jako projev stresu a zlosti, třepená fonace signalizovala uvolněného a znuděného mluvčího, ale také vyvolávala dojem intimity a stydlivostí {Gobi — Ní Chasaide 2003). Z dosavadního popisu jistě vyplývá, že fonacní modifikace představují větší či menší odchylky od normální fonace. Jedná se tedy o kontinuální proměnné: stejně jako můžeme postupně snižovat Či zvyšovat například středové stlačení hlasivek, tak může i hlas být více či méně dyšný, napjatý a podobně. Závěrem tohoto oddílu je třeba poznamenat, že jsme zde uvedli základní typy fonačních modifikací. Ve skutečnosti se tyto typy mohou různě kombinovat: Laver (1980, s. 111 n.) uvádí kupříkladu dyšnou třepenou fonaci, třepený falzet nebo napjatou třepenou fonaci. Důkladný přehled o komunikačním využívání kvality hlasu přinášejí Podešva a Callier (2015). Na počátku druhého oddílu jsme uvedli, že laryngální mechanismus je u všech lidí podobný a že jeho výrazové prostředky jsou ve srovnání s ptáky omezené. Ve skutečnosti je patrné, že jsou lidské laryngální struktury značně složité, pokud je srovnáme třeba s těmi u psů. Věřím, že tento oddíl ukázal, že nám hlasivky umožňují vyjadřovat velmi širokou paletu hlasových kvalit a melodických schémat. 3. VARIABILITA ART1KULACE Hlasivkový signál, ve vší popsané bohatosti, rozkmitává vzduchový sloupec ve vokálním traktu, který působí jako filtr {tzn. některé frekvence propouští a jiné tlumí). Vokální trakt zahrnuje tři nadhrtanové dutiny {ústní, nosní a hltanovou), jsou to však zejména překážky a modifikace vytvářené v ústní dutině, které určují nejen podobu jednotlivých hlásek, ale řeči obecně. Ačkoli je náš artikulační mechanismus do značné míry svázán požadavkem na dosahování fonetických cílů, které odpovídají jednotlivým hláskám, bude zřejmé, že i v nadhrtanové oblasti existuje prostor pro variabilitu a že tuto variabilitu v komunikaci využíváme. Začněme zajímavou interakcí mezi laryngálním a artikulačním systémem. Pozorný čtenář si možná všiml, že na obrázku 1 z horních rohů Štítné chrupavky vychází další struktury. Jedná se o drobné chrupavky a vazivovou tkáň, jíž je celý hrtan upnut k jazylce. Hrtan tedy není shora k ničemu připevněn, je pomocí vaziva pouze zavěšen a svalovou činností ho můžeme oproti neutrální poloze zvýšit a snížit, a to až o 15 mm na každou stranu (Laukkanen et al. 1999). Jak vyplývá z obrázku 5, vertikální poloha hrtanu ovlivňuje délku vzduchového sloupce ve vokálním traktu (především hltanové části), a tedy jeho rezonanční vlastnosti. Stejně jako rezonanční frekvence prázdné láhve budou nižší než láhve zpola naplněné vodou, budou rezonanční frekvence zkráceného vokálního traktu (vlivem zvýšeného hrtanu) vyšší a prodlouženého vokálního traktu (vlivem sníženého hrtanu) nižší. Délka vokálního traktu průměrného muže je přibližně 17,5 cm a jeho první tři rezonanční frekvence při neutrálním nastavení jsou 500,1500 a 2500 Hz. S hrtanem sníženým o 1,5 cm budou frek- 104 SLOVO A SMYSL 26 vence 460,1380 a 2300 Hz, zatímco pri zvýšení o 1,5 cm budou frekvence přibližně 550, 1650 a 2750 Hz. Vliv vertikální polohy hrtanu si každý snadno může vyzkoušet: hrtan automaticky snížíme, když stáhneme bradu dolů k hrudi, a naopak zvýšíme, když hlavu zakloníme. Rozdíl mezi krajními nastaveními dosahuje přibližně třetiny rozdílu mezi délkou průměrného mužského a ženského vokálního traktu, ovšem v rámci řečové produkce téhož mluvčího. Nás samozřejmě zajímá, jakou roli hraje vertikální poloha hrtanu v komunikaci. Především je třeba říci, že mnoho mluvčích, a dokonce i zpěváků habituáině tvoří řeč či zpívá se zvýšeným hrtanem, což může vést k výše zmíněné nezdravé napjaté fonaci. Přední americký hlasový poradce Roger Love považuje zvýšený hrtan za jeden z nejčastějších problémů {Love 1999) a snížení polohy hrtanu představuje v klinické hlasové terapii častý cíl {Mathieson et al. 2009). Z poněkud odlišného pohledu se jednoznačně ukazuje, že mužské hlasy, které znějí níž (nejen ve smyslu základní frekvence, ale právě i rezonančních frekvencí), jsou ženami preferovány (Feinberg et al. 2011); to je zřejmě způsobeno evoluční výhodou větších jedinců (Evans — Neave — Wakelin 2006). Nejspíš není překvapivé, že muži naopak preferují ženské hlasy s vyšší Fo i s vyššími rezonančními frekvencemi (Collins — Missíng 2003, Liu — Xu 2011). OBaÁZEK 5: Vokální trakt. Šedou přerušovanou čárou je vyznačena podoba vzduchového sloupce a směr proudění vzduchu vokálním traktem od hlasivekk retní štěrbině. Naznačeny jsou v textu zmiňované orgány: alveolárni výběžek (í), tvrdé patro (2), měkké patro (3), hltan (4), špička jazyka (5), Čepel jazyka (ď), hřbet jazyka (7) a kořen jazyka (8) Přesuňme se od hrtanu na opačný konec vokálního traktu, ke rtům. Pomocí rtů totiž dokážeme dosáhnout podobného účinku jako v případě nastavování vertikální pozice hrtanu. Kromě toho, že rty zaostřujeme při výslovnosti samohlásky [i:] a zaokrouhlujeme při výslovnosti samohlásek [u: o:] či souhlásky [š], může retní zaokrouhlení či zaostření představovat i habituální nastavení konkrétního mluvčího. Zatímco zaokrouhlení rtů, které je doprovázeno vyšpulením, prodlužuje vokální trakt a tím snižuje jeho rezonanční frekvence, zaostření rty „vtahuje" dovnitř, vokální trakt zkracuje a rezonanční frekvence zvyšuje. Díky relativně vyšším rezonančním frekvencím RADEK SKARNITZL 105 jsme pak schopni poznat, že se mluvčí usmívá, i když ho třeba nevidíme. Činnost rtů je velmi důležitá v řeči dospělých k miminkům (angl. infant-directed speech): ukazuje se, že kromě živější intonace výrazněji pohybujeme rty (Green et al. 2010). Zajímavou roli při řeči hraje spodní čelist, která funguje jako pohyblivý artiku-lační orgán —- měla by se snižovat v závislosti na výšce samohlásek, nejvíce tedy u otevřených jako [a;] — ale zároveň čelist můžeme zafixovat, například skousnutím zubů nebo tužky. I se zafixovanou čelistí může mluvčí artikulovat a díky kompenzačním mechanismům mu je poměrně dobře rozumět, ale je zřejmé, že jde o řeč defektní. Náležité otevírání ústní dutiny je samozřejmě klíčové pro správnou rezonanci hlasu: když hovoříme s nedostatečně otevřenými ústy, značná část akustické energie našeho hlasu se pohltí v ústní dutině a do prostředí nevychází. Na rezonanci hlasu se nejspíš podílí i velmi bohatě členěná nosní dutina. Nosní dutinu otevíráme a uzavíráme měkkým patrem (označeno číslem 3 na obrázku 5). Zejména ve spojení s vedlejšími nosními dutinami představuje komplexní rezonátor. Vedlejší nosní (nebo také paranazální) dutiny jsou dutiny nacházející se v okolních kostech. Tyto dutiny se vyvíjejí postupně během vývoje jedince, některé z nich až dvacet let, a u jednotlivých lidí se jejich tvar a objem může značně lišit. Funkce vedlejších nosních dutin dodnes není zcela objasněná (Keir 2009), ale z fonetického hlediska je nejzajímavější hypotéza, že působí jako rezonanční prostory při tvorbě hlasu a že právě variabilita v jejich tvaru a velikosti přispívá k osobité barvě hlasu každého mluvčího. Odhlédneme-li od takzvané huhňavosti (patologicky změněné nazality, při níž je nosní dutina neustále otevřená např. při rozštěpu patra nebo naopak zavřená např. při zbytnělé nosní mandli), otevíráme nosní dutinu v češtině při vyslovování nosních souhlásek jako [m n ň]. Otevření měkkého patra — a s ním přítomnost nosní rezonance — se však nemusí vázat pouze na tyto hlásky, ale může při komunikaci sloužit zajímavým účelům. Ačkoli výzkumy nejsou zcela jednoznačné, dlouhodobější naza-lita může být například jedním z prostředků, jichž využíváme k signalizaci sarkasmu či ironie (viz např. studie citované v článku autorů Cheang — Pell 2008). Možná si v této souvislosti leckterý čtenář vybaví řeč jednoho z našich bývalých prezidentů, v níž se sarkasmus i výrazná nazalita často potkávaly. Zajímavou sociofonetickou studii provedl již vícekrát citovaný Robert Podešva se svými kolegy: dvacet profesionálních herců mělo za úkol představit dvacet různých typů lidí (učitelův oblíbenec, pohodář, malý spratek, gangster, rozmrzelý stařík, osobitá černoška apod.). Výsledky ukazují, že se zvýšená nazalita nenáhodně objevovala u postav, jimž je společná absence agresi -v ity, zatímco v rolích drsnějších postav byla nazalita snížená. Stejně jako v předchozím oddílu zmíněné fonační modifikace může i nazalita fungovat jako signál příslušnosti ke konkrétní sociální skupině. Nedávná studie kupříkladu dokumentuje rozšiřování nazality mezi mladými prodavačkami v obchodech s módními oděvy (ikuta 2013). Nejvýraznější modifikace primárního hlasivkového tónu vytváříme v dutině ústní pomocí jazyka. Jazyk zabírá dvě třetiny ústní dutiny a je to téměř výlučně svalový orgán, eož znamená, že je mimořádně ohebný, pružný a rychlý. Z funkčního hlediska je třeba hovořit o jazyce jako o dvou artikulačních orgánech: jeho přední část (špička a čepel) a zadní část (hřbet) se totiž do jisté míry mohou pohybovat nezávisle na sobě. Můžeme tedy například vytvořit závěr přední částí jazyka na dásních (třeba jako u hlásky [t]), ale zároveň můžeme zdvihnout zadní část jazyka směrem k tvrdému patru (viz obr. 5), což hlásce dodá „měkčí" zvuk: hovoříme o palatalizovaném [t>], které známe například z ruštiny. 106 SLOVO A SMYSL 26 Mohli bychom si myslet, že činnost jazyka je omezena požadavky na vytvoření závěrů a úžin v konkrétních, přesně definovaných místech ústní dutiny a že prostoru pro variabilitu, která by mohla vyjadřovat něco jiného než cílovou kvalitu konkrétní hlásky, příliš nezbývá. To by však byla domněnka chybná; i v případě jazyka jde význam některých jeho pohybů či posunů nad rámec základní zvukové podoby řečových jednotek. Za prvé se ukazuje, že podobné posuny jazyka aplikované na vybrané hlásky mohou signalizovat sociální identitu. V káhirské arabštině se vyskytuje výše zmíněná palatalizace u hlásek [t] a [d] jakožto silně stigmatizovaný prvek výslovnosti: palatalizující ženy i muži byli posluchači vnímáni jako chudší, méně vzdělaní, sebevědomí či přitažliví než mluvčí, kteří nepalatalizovali, a u žen byla palatalizace navíc spojována s koketností {Geenberg 2012). V kodaňské dánštině je palatalizované [t>] znakem výslovnosti adolescentů z nižších sociálních tříd (Mae-gaard 2010). Za druhé může být sekundární posun jazyka charakteristický pro konkrétní komunikační situace. Stejně jako jsme výše zmínili zaokrouhlení a vyšpulení rtů jako rys řeči k miminkům, tak někteří mluvčí (ve stereotypním vnímání zejména babičky, tetičky a podobně) s miminky „šišlají", což je foneticky opět palatalizace. Konečně může daný mluvčí vykazovat odchylku od neutrálního nastavení jazyka habítuálne, a takové nastavení je pak charakteristické pro jeho řeč. Jedním z takových posunů může být i již zmíněná palatalizace: setkáme se s ní například u herce a komika Luďka Soboty. Nastavením, které jsme doposud nezmínili, je faryngali-zace, posun hřbetu a kořene jazyka směrem dozadu, do hltanu (pharynx). S touto zvláštní rezonancí se můžeme setkat u jednotlivých mluvčích (typickým příkladem je moderátor Jiří Václavek), ale může opět signalizovat i příslušnost k sociální skupině: Stuart-Smithová (1999) o faryngalizaci hovoří jako o jednom z rysů výslovnosti pracujících tříd v Glasgow. 4. ZDROJE VARIABILITY ŘEČOVÉ PRODUKCE Předcházející dva oddíly výběrově nastínily některé anatomické vlastnosti řečového mechanismu a především se věnovaly variabilitě, kterou nám naše řečové ústrojí umožňuje. Jak již bylo zmíněno, mezní a optimální hodnoty různých akustických parametrů jsou určeny anatomií a fyziologií vokálního traktu, ale plasticita našeho řečového mechanismu je obrovská. V tomto oddílu zdroje variability řečové produkce popíšeme systematičtěji; využijeme k tomu doposud nepřekonaný model Francise Nolana, vytvořený původně pro účely foneticky motivované identifikace mluvčích (Nolan 1983, viz také Skarnitzl 2014). Na vrcholu Nolanova modelu zdrojů řečové variability (Nolan 1983, 2. kap.) stojí komunikační záměr. Význam záměru mluvčího v konkrétní komunikační situaci je jistě zřejmý z izolovaných příkladů uváděných v předchozích dvou oddílech. Nolan rozlišuje pět složek komunikačního záměru. Kromě kognitivní složky, která se týká samotného obsahu sdělení abstrahovaného od kontextu, jsou to dále složky afektivní (sdělování emocí, nálad, projev osobnostních rysů), sociální (odraz formality komunikační situace nebo vzájemného postavení účastníků v řečovém projevu), sebepre-zentační (typ osobnosti, který v dané situaci projektujeme, např. stydlivý či sebevědomý) a konečně interakční (řízení samotného konverzačního procesu). RADEK SKARNITZL 107 K vyjádření všech složek komunikačního zámeru využíváme různých fonetických prostředků, které dělíme na segmentální (úroveň jednotlivých hlásek) a supraseg-mentální (viz obrázek 6), ačkoli se v řeči samozřejmě překrývají a nelze je oddělit. Segmentální složka se týká fonetické realizace jednotlivých hlásek: jejich vlastnosti mohou být dány idiosynkratickými výslovnostními návyky nebo přítomností řečových vad, ale mohou se mírně lišit i v závislosti na komunikační situaci. V supra-segmentální složce podobně dochází k upřesňování realizace prozodických jednotek (napr. výraznost melodického poklesu či stoupnutí, lokální změna mluvního tempa či hlasitosti apod.). Ačkoli na úrovni jednotlivých segmentálních i suprasegmentálních jednotek existuje prostor pro variabilitu, pro účely tohoto článku jsou v rámci obou složek zajímavější dlouhodobá nastavení, jejichž příklady jsme uváděli v předcházejících oddílech. Dlouhodobá nastavení určují odchylky od neutrálních hodnot. Na segmentální úrovni se jedná o fonační modifikace (srov. oddíl 2.2), kdy je znělým hláskám „připsán" například rys dysné či napjaté fonace, a o artíkulační posuny (oddíl 3), kdy na relevantní hlásky aplikujeme například zaokrouhlení rtů nebo posun jazyka směrem k tvrdému patru. Na suprasegmentální úrovni můžeme hovořit o neutrální střední hlasové frekvenci daného mluvčího, o jeho neutrálním intonačním rozpětí, mluvním tempu a podobně, a o dlouhodobějších odchylkách od těchto neutrálních hodnot. Z obrázku 6 je zřejmé, že komunikační záměr je mapován přímo na dlouhodobé nastavení v obou složkách; neutrální hodnoty jsou jinými slovy měněny v přímé závislosti na komunikačním záměru. - o O 3 o Segmentální složka realizace hlásek komunikační záměr Suprasegmentální složka f">. 0 b tn r+ realizace < 0 %■ prozodických a & O- jednotek fonetická reprezentace implementace I řečový signál obrázek 6: Model zdrojů řečové variability (upraveno podle Nolan 1983,2. kap.) Výslednicí segmentální a suprasegmentální složky — jejich krátkodobých i dlouhodobých nastavení ~ je fonetická reprezentace, která zřejmě představuje percepční cíl, jehož chce mluvčí dosáhnout. Fonetická reprezentace je následně realizována implementačními pravidly, jejichž výstupem jsou neuromuskulární příkazy artikulač- 108 SLOVO A SMYSL 26 ním orgánům vedoucí k provedení takových artikulačních úkonů, aby výsledný zvuk odpovídal komunikačnímu záměru. Fonetická implementace skýtá prostor pro značnou variabilitu zejména mezi mluvčími, protože konkrétní artikulační úkony je třeba realizovat v rámci anatomie vokálního traktu daného mluvčího. Zdá se, že odlišné anatomické vlastnosti různých vokálních traktů se odrážejí především v přechodech mezi jednotlivými fonetickými cíli, že si mluvčí musí vytvořit ídiosynkratické strategie pro pohyb mezi cílí a pro koordinaci artikulačních úkonů (Nolan 1999). Cílem tohoto oddílu bylo pomocí Nolanova modelu systematicky zobecnit poznatky z předchozích dvou oddílů a ukázat, jak velký prostor pro variabilitu v řečové produkci existuje a s jakým množstvím stupňů volnosti náš řečový mechanismus operuje: můžeme například současně mluvit dyšně, se zaokrouhlenými rty a se sníženým hrtanem. V oddílu následujícím se na řečovou variabilitu podíváme z pohledu percepce. 5. ZVUKOVÁ TVÁŘ JEDINCE Často slýcháváme, že řeč používáme k přenosu informací. To je samozřejmě pravda, ale zároveň se jedná o pohled velmi zjednodušený. Většina mezilidské komunikace neprobíhá za účelem pouhého vzájemného předávání si informací v úzkém slova smyslu: komunikace je ve skutečnosti mnohovrstevná (srov. také komunikační záměr v Nolanově modelu v předchozím oddílu). Kromě základní vrstvy — můžeme hovořit o primárních sémantických obsazích — jsou nedílnou součástí prakticky jakékoli komunikační situace pragmatické aspekty (viz např. Hirschová 2013). I zdánlivě jednoduchým sdělováním informací chceme dosáhnout různých komunikačních cílů: můžeme chtít posluchače zaujmout pro dané téma, můžeme v nich chtít vyvolat nějakou reakci a podobně. Pokud se účastníci konverzace vidí, hraje samozřejmě velmi důležitou roli i neverbální složka komunikace. V tomto oddílu se zaměříme na ještě jinou „vrstvu" řečové komunikace, která je rovněž neustále přítomna: hovoříme o vrstvě či složce indexové. Řeč můžeme považovat za „zvukovou tvář" jedince — Bělin, Fec-teau a Bedard (2004) hovoří o auditory face — protože svým řečovým projevem signalizujeme (angl. to index) nejrůznější stránky naší identity. Řečí tedy sdělujeme obrovské množství informací a posluchači jsou schopni — s vyšší či nižší mírou úspěšnosti — tyto informace dešifrovat (Nygaard 2005). Již před téměř padesáti lety rozdělil John Laver indexové informace na ty, které jsou biologické povahy, na informace psychologické a sociální (Laver 1968); stejně bude strukturován i tento oddíl. 5.1. BIOLOGICKY PODMÍNĚNÉ INDEXOVÉ INFORMACE Do biologických informací patří samozřejmě pohlaví mluvčího, které až na výjimky z hlasu poznáme bez problémů. Mužské hlasivky jsou v průměru o 60 % delší, hrtan obecně asi o 20 % větší (zejména díky vystouplé štítné chrupavce) a i vokální trakt je delší, je však dokázáno, že biologické rozdíly mezi muži a ženami mohou být umocněny či potlačeny sociokulturními faktory: rozdíly mezi rezonančními frekvencemi vokálního traktu (formanty) mužů a žen jsou například mnohem výraznější u Norů či Poláků než u Dánů či Maďarů (Johnson 2006). Biologickými faktory jsou do značné RADEK SKARNITZL 109 míry dány i koreláty věku. Věk se odráží zejména ve střední hlasové frekvencí (průměrné Fo), která u mužů přibližně do čtyřiceti let klesá a asi od padesáti let opět začíná stoupat, zatímco u žen od dosažení dospelosti mírně klesá přibližně do věku padesáti let a pak se ustálí (Stathopoulos — Huber — Sussman 2011). Z hlasu jsme částečně schopni odhadnout i další biologické vlastnosti člověka, například jeho vzrůst (výšku, případně hmotnost). Když slyšíme po telefonu cizí hlas, často si utvoříme dojem o vzrůstu daného mluvčího a náš dojem je při osobním setkám často potvrzen. Nezřídka se však setkáme i s výjimkami. Gonzalez (2003) dokonce ukázal, že jen 14 % odhadů posluchačů významně korelovalo se skutečnou výškou a váhou mluvčích, ale že odhady zároveň byly konzistentní. To znamená, že posluchači při úsudcích o vzrůstu mluvčího spoléhají na podobné stereotypy, které však neodpovídají realitě. Třetí oblast spadající do biologických informací se týká zdravotního stavu: je zřejmé, že se z hlasu o krátkodobých i dlouhodobých aspektech zdravotního stavu jedince dozvíme mnohé. Ke krátkodobým patří například vliv nachlazení na na-zální rezonanci, zastření hlasu při laryngitidě nebo vytvoření tzv. hlasových uzlíků pří přehnané hlasové námaze (Roth — Worťhington 2011, 8. kap.), ale i prostá únava. Mezi dlouhodobé aspekty řadíme například hlasové změny doprovázející Parkinsonovu nemoc (Rusz et al. 2011) nebo Huntingtonovu nemoc (Rusz et al. 2013) a samozřejmě celou řadu onemocnění, která se přímo dotýkají orgánů podílejících se na tvorbě řečí. Laver (1968) mezi vlivy zdravotního stavu, které mohou nabýt dlouhodobého charakteru, řadí i kouření nebo nadměrné požívání alkoholu. 5.2. PSYCHOLOGICKY PODMÍNĚNÉ INDEXOVÉ INFORMACE O psychologických indexových informacích jsme se už zmínili výše, především o těch krátkodobé povahy, jako jsou emoce či nálady. Výzkumy ukazují, že emoce jsme schopni z řeči poznat s poměrně slušnou mírou přesnosti, ačkoli se úspěšnost rozpoznání jednotlivých emocí liší: z hlasu nejlépe rozeznáme smutek a zlost, zatímco identifikace štěstí či znechucení na základe hlasových informací je výrazně horší a spolehlivěji je rozpoznáváme z výrazu tváře. Zajímavé navíc je, že přestože mezi jednotlivými národy a kulturami existují nezanedbatelné rozdíly ve způsobu, jakým jsou emoce vyjadřovány, identifikace emocí z řeči je výrazně univerzálnější (Sche-rer — Clark-Polner — Mortillaro 2011). Kromě emocí do afektivních stavů řadíme i dlouhodobé rysy, tedy osobnostní vlastností mluvčího. To, že si lidé na základě řečového projevu automaticky a velmi rychle vytvářejí (ne vždy přesné) názory na povahové rysy mluvčího, je dobře známé (Carney — Colvin — Hall 2007). Výzkum percepce osobnostních rysů na základě řečového signálu je jednou z hlavních oblastí psycholingvistického výzkumu. Hodnocení se tradičně týkalo dvou oblastí: tou první je postavení, které zahrnuje rysy jako inteligence, sebedůvěra, kompetence, ambice či manažerské schopnosti, druhou oblastí je společenskost, která zahrnuj e přátelskost, zdvořilost, smysl pro humor či laskavost. V poslední době se více používají dimenzionální modely osobnosti, z nichž nejznámější je pětifaktorový model Big Five, v němž figuruje pět na sobě nezávislých osobnostních faktorů: extraverze, přívětivost, svědomitost, emocionální stabilita a intelekt (Hřebíčková 2011). no SLOVO A SMYSL 26 Výzkum zaměřený na identifikaci povahových rysů z řeči dodnes Často používá tzv. techniku spojitých masek {angl. matched-guise technique; Lamhert et al., 1960, Chromý 2009). Ta byla původně určena ke zkoumání postojů k jazykům či jazykovým varietám — spočívá v tom, že posluchači na základě poslechu hodnotí osobnostní vlastnosti mluvčího v různých „maskách" (jazycích či variet jednoho jazyka) a následně se porovná hodnocení v obou maskách. Lambertova průkopnická studie bi-lingvních mluvčích angličtiny a francouzštiny v Kanadě ukázala, že týmž mluvčím byly připisovány příznivější vlastnosti, když hovořili anglicky, než když hovořili francouzsky, a to nejen anglofonními, ale i frankofonními Kanaďany. Dnešní technické možnosti manipulace řečového signálu otevřely psycholingvistickému a psychofo-netickému výzkumu nové obzory. Fonetici provádějí kontrolované manipulace vybraného akustického parametru a následně zjišťují, zda tyto manipulace ovlivňují hodnocení mluvčího. Ukazuje se například, že rychlejší mluvčí jsou hodnoceni jako kompetentnější, ale méně laskaví (Smith et al. 1975), že mluvčí s vyšším hlasem jsou vnímáni jako extrovertnejší, ale také jako méně emočně stabilní či méně svědomití (imhof 2010) nebo že narušení rytmické struktury řeci vede k horšímu hodnocení emoční stability (Volín — Poesová — Skarnitzl 2014) a kompetentnosti mluvčího (Berkovcová — Černikovská — Skarnitzl 2016). 5.3. SOCIÁLNĚ PODMÍNĚNÉ INDEXOVÉ INFORMACE Poslední skupina indexových informací se týká takových rysů, které si osvojujeme imitací, jakožto členové různě definovaných sociálních skupin. Již samotné osvojování sociálních indexových rysů výslovnosti je velmi zajímavé. Jak ukázali Foul-kes — Docherty — Watt (2005), už malé děti jsou citlivé na rozdíly ve výslovnosti mužů a žen: zatímco dvou- až tříleté dívky a chlapci ve své výslovnosti ještě nerozlišovali mezi ženským a mužským způsobem výslovnosti {šlo o preaspiraci typickou pro ženy v severoanglickém Newcastlu), v druhé polovině čtvrtého roku začalo docházet k genderově specifické diferenciaci a do devátého roku si děti „odpovídající" fonetické prostředky osvojily úplně. Ze zmíněného příkladu vyplývá, že se v řeci biologicky a sociálně podmíněné indexové informace překrývají. Rozdíly mezi řečovým projevem žen a mužů jsou tedy částečně dané biologicky (zmínili jsme odlišnou délku hlasivek, velikost hrtanu a vokálního traktu), ale v konkrétních řečových komunitách se zároveň mohou vyvinout rozdíly, které si jejich členové osvojí jako rys společné identity. Kromě možných informací o pohlaví (resp. genderu) řečový signál obsahuje informace o regionálním původu mluvčího nebo socioekonomickém postavení; v druhém a třetím oddílu jsme zmínili studii Jane Stuart-Smithové, která zkoumala fonační i ar-tikulační projevy mluvčích v Glasgow (Stuart-Smith 1999). Velmi robustní jsou v řeči rysy, které vypovídají o etnickém původu mluvčího; nejvíce výzkumů probíhá v Americe, kde se ukazuje, že Afroameričané (tzv. Afričan American Vernacular English, AAVE) jsou poslechem od bílých Američanů většinou dobře rozlišitelní (Thomas 2007). Jak vyplývá z některých studií citovaných v oddílech 2 a 3, řečový projev obsahuje vodítka i o členství v sociálních skupinách. Specifické charakteristiky se mohou vytvořit v rámci profesní skupiny, jak ukázal výzkum japonských prodavaček (Ikuta 2013), ale také například v rámci skupiny definované zálibou v určitém hudebním RADEK SKARNITZL 111 stylu. Newyorští adolescenti z bohatých bělošských rodin, kteří poslouchají hip hop, si „přisvojují" řečové a jazykové prostředky černošské angličtiny {Cutler 1999); podobně i angličtí adolescenti se zálibou v reggae používají jazykové i výslovnostní rysy jamajské angličtiny (Rampton 2011). Specifické fonetické prostředky se někdy asociují i s řečí homosexuálních mluvčích (Munson 2007); v češtině například existuje stereotyp, že homosexuálové vyslovují postalveolární hlásky, [š ž č], s vyššími a ostřejšími rezonancemi, což je způsobené absencí zaokrouhlení rtů. Jedná se však o mýtus: ne všichni homosexuální muži tento rys využívají, naopak se s ním setkáme í u jedinců heterosexuálních. Všechny tyto ilustrace potvrzují aktuální směřování sociolíngvistického výzkumu, který se hlásí k sociálně konstrukčnímu přístupu k lidské identitě {Bucholtz — Hall 2005): mluvčí utvářejí svou identitu během konverzace a neustále ji aktualizují v reakci na průběh interakce. Identita každého mluvčího je „polyfonní": signalizujeme různé aspekty naší identity najednou, tyto aspekty se překrývají a nelze je oddělit. Pěknou paralelu složitosti lidské identity poskytuje Carmen Foughtová: „vyjádřit něčí identitu z hlediska genderu, věku, společenské třídy, etnického původu a mnoha dalších faktorů je podobné, jako když pečete koláč: když se díváme na hotový produkt, nemusí být snadné oddělit nebo odhalit jednotlivé přísady, a dva různí jedinci mohou použít stejné přísady a dospět k trochu odlišnému výsledku" {Fought 2011, s. 244, přel. R. S.). Podobně složité jsou i projevy identity v řečovém a jazykovém chování. 6. ZÁVĚR V tomto článku jsme prozkoumali lidskou řeč z několika hledisek: částečně jsme se věnovali artikulaČní fonetice, tedy samotné tvorbě řečového signálu, dále jsme zmínili různé aspekty psychofonetiky, sociofonetíky a forenzní fonetiky. Cílem bylo poukázat na něco, co všichni běžně děláme, avšak většinou si toho nejsme vědomi: na bohatost řečové produkce, na její možnosti a limity. Limity jsou určeny především anatomií našeho vokálního traktu, ale je patrné, že nás ve skutečnosti příliš neomezují. Možnosti, které nám jsou v oblasti řečové produkce dány, dobře ilustrují výzkumy maskování hlasu, tedy cílených změn řečového projevu například při imitaci nebo při snaze skrýt svou identitu při páchání trestné činností (Růžičková — Skamitzl, v přípravě): někteří mluvčí jsou schopní svůj hlas změnit natolik, že by to neodhalil zkušený fonetik ani sebelepší počítačový program. I to svědčí o tom, že plasticita řečové produkce je obrovská a že s naším hlasem skutečně zacházíme jako s uměleckým nástrojem. REFERENCE Abdelli-Beruh, Nassima B. — Wolk, Lesley — of young women in the labor market. PLoS Slavín, Díanne: Prevalence of vocal fry in One 9,2014, e97506. young adult male American English speakers. Babel, Molly — McGuire, Grant — King, Journal ofVoice 28,2014, s, 185-190. Joseph: Towards a more nuanced view of vocal Anderson, Rindy C. — Klofstad, Casey A. ~ attractíveness. PLoS One 9,2014, e88616. Mayew, William J. — Venkatachalam, Banse, Rainer — Scherer, Klaus R.: Acoustic Mohan: Vocal fry may undermine the success profíles in vocal emotion expression. Journal 112 SLOVO A SMYSL 26 of Personality and Social Psychology 70,1996, s. 614-636. Belin, Pascal — Fecteau, Shirley — Bédard, Catherine: Thinking the voice: neural correlates of voice perception. Trends in Cognitive Sciences 8, 2004, s. 129-135. Berkovcová, Zussana — Černikovská, Štěpánka -— Skarnitzl, Radek: Vliv temporálních manipulací na vnímání kompetence mluvčího. Studie z aplikované lingvistiky, 2016, č. 7, 5. 7-20. Braun, Angelika: Fundamental frequency — How speaker-specific is it? BE1PHOL 64, Studies inForensic Phonetics, 1995, s. 9-23. Bucholtz, Mary — Hall, Kira: Identity and interaction: A sodocultural linguistic approach. Discourse Studies 7,2005, s. 585-614. Carney, DanaR. — Colvin, C. Randall — Hall, Judith A.: A thin slice perspective on the accuracy of first impressions. Journal of Research in Personality 41,2007, s. 1054-1072. Catchpole, Clive K. — Slater, Peter J. B: Bird song; biological themes and variation. Cambridge University Press, Cambridge 2008 (2. vyd.). Collins, Sarah A. — Missing, Caroline: Vocal and visual attractiveness are related in women. Animal Behaviour, 2003, č. 65, s. 997-1004. Cutler, Cecilia A.: Yorkvjlle Crossing: White teens, hip hop and African American English. Journal ofSociolinguistics 3,1999, s. 428-442. Deutsch, Dianna — Le, Jinghong ~~ Shen, Jing — Henthorn, Trevor: The pitch levels of female speech in two Chinese villages. Journal of the Acoustical Sodety of America 125, 2009, s. EL208-EL213. Evans, Sarah — Neave, Nick — Wakelin, Dělila: Relationships between vocal characteristics and body size and shape in human males: An evolutionary explanation for a deep male voice. Biological Psychology 72, 2006, s. 160-163. Fant, Guimar: Acoustic Theory of Speech Production. Mouton, The Hague 1960. Feinberg, David R. —Jones, Benedict C. — DeBruine, Lisa M. — O'Connor, Julian J. M. — Tigue, Cara C. — Borak, Diana J.: Integrating fundamental and formaat frequencies in women's preferences for men's voices. Behavioral Ecology 22,2011, s. 1320-1325. Fitch, William T.: The evolution of speech: A comparative review. Trends in Cognitive Sciences 4, 2000, s. 258-267. Fought, Carmen: Language and ethnicity. In: Rajend Mesthrie (ed.): The Cambridge Handbook of Sociolinguistics. Cambridge University Press, Cambrigde 2011, s. 238-257. Foulkes, Paul — Docherty, Gerard — Watt, Dominic: Phonological variation in child-directed speech. Language 81, 2005, s. 177-206. Geenberg, Katherine R.: "The people who say TSH TSH": The social life of Cairene Arabic palatalization. University of Pennsylvania Working Papers in Linguistics 18 (2), 2012, s. 21-30. Gobi, Christer — Ni Chasaide, Ailbhe: The role of voice quality in communicating emotion, mood and attitude. Speech Communication, 2003, c. 40, s. 189-212. Gonzalez, Julio: Estimation of speakers' weight and height from speech: a re-analysis of data from multiple studies by Lass and colleagues. Perceptual and Motor Skills 96, 2003, s. 297-304. Green, Jordan R. — Nip, Ignatius S. B. — Wilson, Erin M. — Mefferd, Antje S. — Yunusova, Yana: Lip movement exaggerations during infant-directed speech. Journal of Speech, Language and Hearing Research 53, 2010, s. 1529-1542. Grichkovtsova, Ioulia — Morel, Michel — Lacheret, Anne: The role of voice quality and prosodic contour in affective speech perception. Speech Communication 54,2012, s. 414-429. Henton, Caroline G. — Bladon, Anthony: Breathiness in normal female speech: :. Inefficiency versus desirability. Language. S Communication 5,198 5, s. 221-227. Henton, Caroline — Bladon, Anthony: Creak as a sociophonetic marker. In: Larry M. ilymar: — Charles N. Li (eds.): Language, Speech and Mind: Studies in Honour of RADEK SKARNITZL 113 Victoria A. Fromkin. Routledge, London 1988, s. 3-29. Hirschová, Milada: Pragmatika v češtine. Karolinum, Praha 2013. Hřebíčková, Martina: Perifaktorovy model osobnosti: Přístupy, diagnostika, uplatnění. Grada, Praha 2011. Cheang, Henry S. — Pell, Marc D.: The sound of sarcasm. Speech Communication 50,2008, s. 366-381. Chromý, Jan: Postoje k jazyku, technika spojitých masek a čeština. Nose řeč 92,2009, s. 252-262. Ikuta, Shoko: Nasality as a social identity marker in urban Japanese. Journal of English 8 American literature and linguistics 128,2013, s. 61-74. Imhof, Margaréte: Listening to voices and judging people. International Journal of Listening 24, 2010, s. 19-33. Johnson, Keith: Resonance in an exemplar-based lexicon: The emergence of social identity and phonology. Journal of Phonetics 34, 2006, s. 485-499. Jun, Sun-Ah: Prosodic phrasing and attachment preferences. Journal of Psycfio/írtguistíc Research 32,2003, s. 219-249. Keating, Patricia — Garellek, Marc — Kreiman, Jody: Acoustic properties of different kinds of creaky voice. Proceedings of the 18th ICPhS, 2015, paper 821. Keating, Patricia — Kuo, Grace: Comparison of speaking fundamental frequency in English and Mandarin. Journal of the Acoustical Sodety of America 132, 2012, s. 1050-1060. Kcir, James: Why do we have paranasal sinuses? Journal of Laryngology & Otology 123, 2009, s. 4-8. Kelso, J. A. Scott — Saltzman, Elliot L. — Tuller, Betty: The dynamical perspective on speech production: data and theory. Journal of Phonetics 14,1986, s. 29-59. Klasmeyer, Gudrun — Sendlmeier, Walter E: Voice and emotional states. In: Raymond D. Kent — Martin J. Bali (eds.): Voice Qualify Measurement Singular Publishing, San Diego 2000, s. 339-357. Lambert, Wallace E. — Hodgson, R. C. — Gardner, Robert C. — Fillenbaum, Samuel: Evaluational reactions to spoken languages. Journal of Abnormal and Social Psychology 60, 1960, s. 44-51. Laukkanen, Anne-Maria — Takalo, Raija — Vilkman, Erkki — Nummenranta, Jaana — Lipponen, Tero: Simultaneous videofluorographic and dual-channel electroglottographic registration of the vertical laryngeal position in various phonatory tasks. Journal of Voice 13,1999, s. 60-71. Laver, John: Voice quality and indexical information. British Journal of Disorders of Communication 3,1968, s, 43-54. Laver, John: The Phonetic Description of Voice Quality. Cambridge University Press, Cambridge 1980. Liu, Xuan — Xu, Yi: What makes a female voice attractive? Proceedings of 17th ICPhS, 2011, s. 1274-1277. Love, Roger: Set Your Voice Free. Little, Brown and Company, Boston 1999. Lu, Youyi — Cooke, Martin: Speech production modifications produced by competing talkers, babble, and stationary noise. Journal of the Acoustical Society of America 124,2008, s. 3261-3275. Maegaard, Marie: Linguistic practice and stereotypes among Copenhagen adolescents. In: Pia Quist — Bente A. Svendsen (eds.): Multilingual urban Scandinavia: New linguistic practices. Multilingual Matters, Bristol 2010, s. 189-206. Mathieson, Lesley — Hirani, Shashi P. — Epstein, Ruth — Baken, Ronald J. — Wood, Gary — Rubin, John S.: Laryngeal Manual Therapy: A preliminary study to examine its treatment effects in the management of muscle tension dysphonia. Journal of Voice 23, 2009, s. 353-366. Melvin, Shannon. — Clopper, Cynthia G.: Gender variation in creaky voice and fundamental frequency, Proceedings of 18th ICPhS, 2015, Paper 320. Mennen, Ineke — Schaeffler, Felix — Docherty, Gerry: Cross-language differences in fundamental frequency range: 114 SLOVO A SMYSL 26 A comparison of English and German. Journal of the Acoustical Society of America 131,2012, s. 2249-2260. Moisik, Scott R.: Harsh voice quality and its association with blackness in popular American media. Phonetica 69, 2012, s. 193-215. Munson, Benjamin: The acoustic correlates of perceived masculinity, perceived femininity, and perceived sexual orientation. Language and Speech 50,2007, s. 125-142. Nolan, Francis: The Phonetic Bases of Speaker recognition. Cambridge University Press, Cambridge 1983. Nolan, Francis: Speaker Recognition and Forensic Phonetics. In: William J. Hardcastle — John Laver (eds.): The Handbook of Phonetic Sciences. Blackwell Publishers, Oxford 1999, s. 744-767. Nygaard, Lynne C: Perceptual integration of linguistic and nonlinguistic properties of speech. In; David B. Pisoni — Robert E. Remez (eds.): The Handbook of Speech Perception. Blackwell Publishers, Oxford 2005, s. 390-413. Ogden, Richard: Turn transition, creak and glottal stop in Finnish talk-in-interaction. ]oumal of the International Phonetic Associations, 2001, s. 139-152. Podesva, Robert J.: Phonation type as a stylistic variable: The use of falsetto in constructing a persona./ournal of Sociolinguistics 11,2007, s. 478-504. Podesva, Robert J.: Gender and the social meaning of non-modal phonation types. Proceedings of the 37th Annual Meeting of the Berkeley Linguistics Society, 2013, s. 427-448. Podesva, Robert J. — Callier, Patrick: Voice quality and identity. Annual Review of Applied Linguistics 35, 2015, s. 173-194. Podesva, Robert J. — Hilton, Katherina — Moon, Kyuwon — Szakay, Anita: Nasality as non-aggressiveness: An articulatory sociophonetic study [prezentace na konferenci New Ways of Analyzing Variation 42, Pittsburgh, 17. — 23.10.2013] [30.10. 2016]. Rampton, Ben: From multi-ethnic urban heteroglossia' to 'contemporary urban vernaculars', Language & Communication 31, 2011, s. 276-294. Roth, FromaP. — Wortbington, Colleen K.: Treatment Resource Manual for Speech-Language Pathology. Delmar, Clifton Park 2011 (4. vyd.). Rusz, Jan — Čmejla, Roman — Růžičková, Hana — Růžička, Evžen: Quantitative acoustic measurements for characterization of voice and speech disorders in early untreated Parkinsons disease. Journal of the Acoustical Society ofAmerica 129, 2011, s. 350-367. Rusz, Jan — Klempíř, Jiří — Baborová, Eva — Tykalová, Tereza — Majerová, Veronika — Čmejla, Roman — Růžička, Evžen — Roth, Jan: Objective acoustic quantification of phonatory dysfunction in Huntington's disease. PLoS One 8,2013, e65881. Růžičková, Alžběta — Skarnitzl, Radek: Voice disguise strategies in Czech male speakers. Acta Universitatis Carolinae — Přúloíogica, Phonetica Pragensia, 2017 (v přípravě). Scherer, Klaus R.: Vocal communication of emotion: A review of research paradigms. Speech Communication 40, 2003, s. 227-256. Scherer, Klaus R. — Clark-Polner, Elizabeth — Mortillaro, Mar cello: In the eye of the beholder? Universality and cultural specificity in the expression and perception of emotion, internationa! Journal of Psychology 46, 2011, s. 401-435. Shipley, Kenneth G. — McAfee, Julie G.: Assessment in Speech-Language Pathology: A Resource Manual. Delmar, Clifton Park 2009 (4. vyd.). Skarnitzl, Radek: Znělostní kontrast nejen v češtině. Nakladatelství Epocha, Praha 2011. Skarnitzl, Radek (ed.): Fonetická identifikace mluvčího. Filozofická fakulta UK, Praha 2014. Skarnitzl, Radek — Hývlová, Dita: Statistický popis hodnot základní frekvence. In: R. Skarnitzl (ed.): Fonetická identifikace mluvčího. Filozofická fakulta UK, Praha 2014, s. 49-64. RADEK SKARNITZL 115 Skarnítzl, Radek — Šturm, Pavel — Voiín, Jan: Zvuková báze řečové komunikace: fonetický a fonologicky~ popis řeči. Karolinum, Praha 2016. Smith, Bruce L. — Brown, Bruce L. — Strong, William J. — Rencher, Alvin C: Effects of Speech Rate on Personality Perception. Language and Speech 18,1975, s. 145-152. Stathopoulos, Elaine T. — Huber, Jessica E. — Sussman, Joan E.: Changes in acoustic characteristics of the voice across the life span; Measures from individuals 4-93 years of age. Journal of Speech, Language and Hearing Research 54,2011, s. 1011-1021. Stuart-Smith, Jane: Glasgow: accent and voice quality. In: Paul Foulkes — Gerard Docherty (eds.): Urban Voices: Accent Studies in the British Isies. Arnold, London 1999, s. 203-222. Thomas, ErikR.: Phonological and phonetic characteristics of African American vernacular English. Language and Linguistics Compass 1, 2007, s. 450-475. Titze, Ingo K.: Physiological and acoustic differences between male and female voices. journal of the Acoustical Society of America 85, 1989, s. 1699-1707. Titze, Ingo R.: Principles of Voice Production. Prentice Hall, Englewood Cliffs 1994. Van Borsel, John — Janssens, Joke — De Bodt, Marc: Breaťhíness as a feminine voice characteristic: A perceptual approach. Journal of Voice 23, 2009, s. 291-294. Volín, Jan — Poesová, Kristýna — Skarnitzl, Radek: The impact of rhythmic distortions in speech on personality assessment. Research in Language 12, 2014, s. 209-216. Wolk, Lesley — Abdelli-Beruh, Nassima B. — Slavin, Dianne: Habitual use of vocal fry in young adult female speakers. Journal of Voice 26, 2012, s. elll-ell6. Yuasa, Ikuko P.: Creaky voice: A new feminine voice quality for young urban-oriented upwardly mobile American women? American Speech 85, 2010, s. 315-337. RÉSUMÉ What are our voices capable of? Phonetic perspective on the variability of speech production The paper surveys the plasticity of the speech production mechanism. At the level of phonatory behaviour, a distinction is made between the frequency of vocal fold vibration, which is reflected in the pitch of the voice, and the manner in which the vocal folds vibrate, which lends our voice different qualities. The main types of phonatory modifications are described and some of their uses in everyday communication, as well as their perceptual eSects, are documented from literature. Modifications of the primary makeup of speech sounds in the supraglottal vocal tract, such as rounding or spreading of the lips, hyper- or hyponasality, and palatalization, are discussed in the following section. The two levels of description — phonatory and articulatory — are formally anchored in Nolans model of the sources of variability in speech. The final part of the paper examines speech variability from the perspective of the listener, regarding one's speech as their auditory face which signals biologically, psychologically, and socially conditioned information about the speaker. KLÍČOVÁ SLOVA / KEYWORDS Produkce řeči; fonace; artikulace; řečová variabilita; percepce řečí / speech production; phonation; articulation; speech variability; speech perception. Radek Skarnitzl | Fonetický ústav Filozofické fakulty Univerzity Karlovy Í?adek.Skarmtzi@/f.cuni.cz