Empirické metody v lingvistice Učebnice pro studenty lingvistických a spřízněných oborů Jan Chromý Poslední aktualizace: 10. října 2023 Chromý & Söhne Verlag Upozornění Toto je průběžná verze připravované učebnice Empirické metody v lingvistice. Je zcela zdarma, avšak samotný text podléhá standardní ochraně autorských práv a není tak možné jej využívat bez svolení autora. Copyright © Jan Chromý (2023) Sazba Tento dokument byl vysázen v prostředí ETgX pomocí třídy kaobook. Vydavatel Chromý & Sôhne Verlag It's the questions we can't answer that teach us the most. They teach us how to think. If you give a man an answer, all he gains is a little fact. But give him a question and he'll look for his own answers. - Patrick Rothfuss: Wise Man's Fear Obsah Obsah v 1 Úvod 1 1.1 Co je to empirický výzkum? ......................... 1 1.2 Proč empirické metody?............................ 2 1.3 Komu je učebnice určena? .......................... 3 1.4 Jak je učebnice členěna?............................ 4 1.5 Otázky na přemýšlení............................. 5 výzkumný postup 6 2 Výzkumná otázka a hypotézy 7 2.1 Co jsou hypotézy?............................... 7 2.2 Hypotézy a proměnné............................. 8 2.3 Pracovní a nulové hypotézy.......................... 9 2.4 Formulace hypotéz .............................. 10 2.5 Explorativní výzkum............................. 12 2.6 Jak vzniká výzkumná otázka......................... 12 2.7 Indukce a dedukce............................... 13 2.8 Otázky na přemýšlení............................. 15 3 Výzkumný postup 16 3.1 Máme hypotézy - a co dál?.......................... 16 3.2 Průřezová studie................................ 18 3.3 Experimentální výzkum............................ 22 3.4 Longitudinální výzkum............................ 26 3.5 Případová studie................................ 28 3.6 Kombinace strategií.............................. 29 3.7 Otázky na přemýšlení............................. 30 Sběr dat 31 4 Techniky sběru dat a dotazník 32 4.1 Techniky sběru dat a výzkumné strategie.................. 32 4.2 Jak vypadá dotazník.............................. 33 Základní prvky dotazníku.......................... 34 Otázky v dotazníku.............................. 36 4.3 Přímé a nepřímé techniky........................... 40 4.4 Hodnocení přijatelnosti............................ 42 4.5 Elicitace jazykových dat............................ 44 4.6 Otázky na přemýšlení............................. 45 5 Rozhovor 46 5.1 Rozhovor: nepřímá technika......................... 46 5.2 Rozhovor: přímá technika........................... 47 5.3 Běžná mluva a paradox pozorovatele.................... 49 5.4 Struktura a formát rozhovoru ........................ 50 5.5 Skryté nahrávání................................ 51 5.6 Nevýhody lingvistického rozhovoru..................... 52 5.7 Elicitace jazykových jevů........................... 52 5.8 Technické otázky nahrávání ......................... 53 5.9 Přepis...................................... 54 5.10 Otázky na přemýšlení............................. 56 6 Pozorování 57 6.1 Zúčastněné pozorování............................ 58 6.2 Nahrávání interakcí.............................. 59 6.3 Strukturované pozorování .......................... 60 Dílčí techniky.................................. 61 6.4 Otázky na přemýšlení............................. 71 7 Analýza dostupných materiálů 72 7.1 Jazykové korpusy............................... 73 7.2 Databáze.................................... 73 7.3 Metaanalýza.................................. 74 7.4 Open-data, open-science........................... 75 7.5 Otázky na přemýšlení............................. 76 8 Ještě k intuici 77 8.1 Expertní intuice................................ 78 8.2 Pojem introspekce............................... 80 8.3 Otázky na přemýšlení............................. 81 9 Vzorek a populace 82 9.1 Způsoby výběru vzorku............................ 85 9.2 Volba výběru vzorku ............................. 87 9.3 Velikost vzorku................................. 88 9.4 Otázky na přemýšlení............................. 89 výsledky 90 10 Proměnné a výsledky 91 10.1 Typy proměnných............................... 92 10.2 Vyčíslení proměnných............................. 93 10.3 Operacionalizace proměnných........................ 94 10.4 Rozdělení dat.................................. 96 Nominální proměnné............................. 96 Řadové proměnné............................... 97 Numerické proměnné............................. 98 10.5 Typy rozdělení................................. 101 Normální rozdělení.............................. 103 10.6 Otázky na přemýšlení............................. 104 11 Vztahy mezi proměnnými 105 11.1 Korelace..................................... 107 11.2 Kauzalita.................................... 109 11.3 Vztah více proměnných............................ 110 11.4 Otázky na přemýšlení............................. 112 12 Výsledky a realita H3 12.1 Redukce..................................... H3 12.2 Náhodná a systematická chyba........................ 116 Zkreslení a operacionalizace......................... 116 Zkreslení a technika sběru dat........................ 117 Zkreslení a zpracování dat.......................... 117 Nezohledněné proměnné........................... 119 12.3 Typy chyb.................................... 120 12.4 Odhalování chyb................................ 121 Zjišťování reliability.............................. 122 Zjišťování validity............................... 124 12.5 Replikovatelnost................................ 125 12.6 Replikace a lingvistika............................. 127 12.7 Dobré návyky................................. 128 12.8 Otázky na přemýšlení............................. 130 Seznam literatury 131 Seznam obrázků 2.1 Schematické znázornění vztahu mezi závislou a nezávislou proměnnou. . . 9 2.2 Schéma deduktivního výzkumu (od teorií přes ověřování hypotéz zpět k teoriím)....................................... 13 2.3 Schéma induktivního výzkumu (od pozorování k teoriím) .......... 14 3.1 Schematicky znázorněný postup výzkumu od výzkumné otázky až k interpretaci výsledků. Některé kroky jsou spolu vzájemně provázány, což je naznačeno oboustrannými šipkami........................ 16 5.1 Obrázek pro elicitaci pojmenování částí plotu (Balhar et al., 2011, s. 204) ... 53 6.1 Co je na obrázku? Jastrow, J. (1899). The minďs eye. Popular Science Monthly, 54,299-312 ..................................... 62 6.2 Schematicky znázorněné časy a posloupnost fixací pro větu Agresivní plavčík sežral bezbranného žraloka a rychle odplul. Časy jsou v milisekundách. Jednotlivé oblasti pro analýzu jsou vyznačeny svislými čarami............... 65 6.3 Semirealistické zobrazení použité v technice visual world paradigm ve výzkumu Altmanna a Kamide (1999)............................. 66 6.4 Graf s výsledky experimentu ze studie Altmanna a Kamide (1999)...... 67 6.5 Schematické zobrazení intermodal preferential looking paradigm. Mezi dvěma monitory je reproduktor, z něhož se ozývají zvukové stimuly.......... 68 6.6 Osoba s nasazenou čepicí s EEG elektrodami. Zdroj: Archiv Kateřiny Chládkové. 69 6.7 Modelový příklad rozdílu v amplitudě elektrických potenciálů mezi věrohodnými a nevěrohodnými větami. Na ose x je zachycen čas v milisekundách, na ose y elektrický potenciál v mikrovoltech..................... 70 10.1 Ilustrace rovnoměrně (nahoře) a nerovnoměrné (dole) rozdělené škály. ... 95 10.2 Sloupcový graf zachycující výsledky z příkladu (5)............... 97 10.3 Skládaný sloupcový graf zachycující rozdělení odpovědí na jednotlivé stupně škály přijatelnosti u slovesa soustředit se..................... 98 10.4 Tři grafická zobrazení rozdělení numerické proměnné reakční čas v experimentu zaměřeném na pojmenování obrázků. Nahoře jsou histogramy (pro skupinu rodilých mluvčích češtiny a pro skupinu rodilých mluvčích slovenštiny). Vlevo dole je houslový graf, vpravo dole krabicový graf..... 100 10.5 Pět typů rozdělení (numerických, případně řadových) dat........... 102 10.6 Schematické zobrazení normálního rozdělení a jednotlivých hodnot..... 104 11.1 Bodový graf zachycující vztah mezi průměrným reakčním časem na slovo v češtině a jeho ekvivalent ve slovenštině, a to pro identická a rozdílná slova. . 109 11.2 Hypotetický vztah mediace a moderace na příkladu výzkumu Shiri Lev Ari (2018)......................................... 111 12.1 Ilustrativní příklad vztahu reliability a validity na hypotetickém střílení do terče.......................................... 121 Seznam tabulek 3.1 Hypotetické výsledky předběžného a následného zkoumání v případě průřezové studie v příkladu (5)............................. 21 3.2 Hypotetické výsledky experimentálního zkoumání v případě průřezové studie v příkladu (9).................................... 23 3.3 Příklad rozdělení podmínek pomocí latinského čtverce. Participanti jsou označeni písmeny abecedy (A, B...), itemy arabskými číslicemi (1, 2...) a podmínky římskými číslicemi (i, ii...)...................... 26 3.4 Výhody a nevýhody jednotlivých výzkumných strategií............ 30 5.1 Frekvence vybraných proměnných z mluvené češtiny v hodinové nahrávce 221eté mluvčí z Českých Budějovic z připravovaného korpusu SAUP. .... 52 9.1 Stručný přehled výhod a nevýhod jednotlivých způsobů výběru vzorku. . . 88 10.1 Shrnutí toho, jaké střední hodnoty lze u jednotlivých proměnných určovat . 94 10.2 Výsledky ze studie Chromý - Vojvodič (2023) ................. 96 10.3 Frekvence morfologických variant hanil a haněl v korpusu SYN2010...... 96 10.4 Výsledky z práce Hladíková (2018)........................ 97 10.5 Data převzatá z disertační práce A. Kříže (2020)................ 100 11.1 Tabulka ukazující souvislost mezi tím, zda jazyky používají postpozice či prepozice, a tím, jaké je pořadí prísudku a předmětu. Čísla uvádí počty jazyků. 105 12.1 Tabulka ukazující možné chyby z hlediska špatné detekce vztahu....... 120 Úvod i 1.1 Co je to empirický výzkum? Lingvistika je již po několik desetiletí značně rozdrobená disciplína. Existuje velké množství různých subdisciplín a badatelé přistupují k jazyku a jeho užívání z různých teoretických a metodologických pozic. Můžeme si proto klást otázku, co vlastně spojuje jednotlivé přístupy - kromě obecného vztahu k jazykovým jevům. Jakou spojitost mají například dialektologický výzkum lexikální zásoby na určitém území, zkoumání málo frekventovaných gramatických jevů využívající hodnocení přijatelnosti, výzkum čtení prostřednictvím sledování očních pohybů, korpusově založená analýza diskurzu, lexikografická excerpce a následná tvorba slovníku, fonetický výzkum výslovnosti samohlásek anebo zkoumání porozumění větám využívající elektroencefalografii (EEG)? Na první pohled zřejmě žádnou. Ve skutečnosti se však všechny tyto výzkumy řídí stejnými podkladovými pravidly. Ve všech uvedených případech jde o empirické výzkumy a z tohoto hlediska se dají přirovnat i k bádáním v oblastech, které se o jazyk a jeho užívání vůbec nezajímají (případně jen částečně), jako jsou třeba společenské vědy (antropologie, sociologie a psychologie apod.), ale i vědy přírodní (biologie, chemie apod.). Klíčovým spojujícím prvkem je to, že se tyto výzkumy opírají o určitá data, která jsou obvykle víceméně nezávislá na osobě badatele. V dialektologii představují data například výsledky dotazníků či nahrávky rozhovorů. Ve výzkumu málo frekventovaných gramatických jevů prostřednictvím hodnocení přijatelnosti jsou výchozími daty jednotlivá hodnocení pro jednotlivé zkoumané konstrukce. Čtení zkoumané prostřednictvím sledování očních pohybů je zachycováno mimo jiné na základě doby fixací v různých oblastech textu či na základě velikosti zornice. Pro korpusově založenou analýzu diskurzu zase data představují různé anotované texty týkající se zkoumaného tématu. Lexikografická práce se opírá o rozsáhlá data založená na excerpci informací o slovech či konstrukcích. Fonetický výzkum výslovnosti samohlásek pracuje se segmentovanými audionahrávkami a výzkum porozumění větám využívající EEG zase jako výchozí data využívá snímanou elektrickou aktivitu mozku, především tzv. kognitivní evokované potenciály (ERP). Právě práce s daty je definiční charakteristikou všech empirických výzkumů. Data se mohou týkat nejrůznějších jevů, mohou být získána různorodými technikami (v lingvistice například dotazníkem, rozhovorem, experimentem, pozorováním apod.), mohou být omezená, anebo naopak obrovská, mohou být získána od jedné jednotky, anebo od většího množství zkoumaných jednotek (v lingvistických oborech jde obvykle o mluvčí či o jazykové jednotky jako texty či věty, v jiných oborech to pochopitelně mohou být nejrůznější entity, ať už živé, či neživé) a mohou být různým způsobem uspořádaná. Ve všech případech však jde o empirická data, na jejichž základě vyvozují badatelé určité závěry. 1.1 Co je to empirický výzkum? 1 1.2 Proč empirické metody? . . 2 1.3 Komu je učebnice určena? 3 1.4 Jak je učebnice členěna? . . 4 1.5 Otázky na přemýšlení ... 5 elektroencefalografie = neurozobrazo-vací metoda využívající snímání elektrické aktivity na povrchu kůže hlavy [angl. electroencephalography] kognitivní evokované potenciály (ERP) = elektrické napětí vznikající při mozkové reakci na určitý podnět (například slovo, větu, tón apod.), které lze snímat elek-troencefalografem [angl. event-related potentials] 1.2 Proč empirické metody? Většina lingvistických subdisciplín je v dnešní době založená silně empiricky. U některých z nich (například psycholingvistika, fonetika, nebo dialektologie) to tak bylo vlastně od jejich počátku, u jiných došlo v předchozích desetiletích k výraznému posunu od výzkumů založených zejména na intuici k práci s daty (například ve výzkumu gramatiky se velmi rozšířil korpusový, ale i experimentální přístup). Mezi jednotlivými subdisciplínami pochopitelně existují výrazné rozdíly v tom, s jakými daty pracují, jak velké datové zdroje jsou obvykle analyzovány, či jakým způsobem taková analýza vlastně probíhá. Existují přitom i lingvisté, kteří jsou zaměřeni teoretičtěji a s daty pracují jenom okrajově. Platí však, že by i sebevíce teoreticky zaměření lingvisté měli vědět, jak empirický výzkum dělat a hlavně jak kriticky číst texty, které o výsledcích empirického výzkumu informují. I pokud totiž sami empirický výzkum nedělají, potřebují pro svá tvrzení oporu ve výsledcích empirických výzkumů realizovaných jinými badateli. A pokud je neumí kriticky zhodnotit, snadno se dostávají na scestí. Každý empiricky zaměřený výzkum má určitý obecný cíl, nějakou výzkumnou otázku, na kterou se snaží odpovědět prostřednictvím sběru, analýzy a interpretace dat. Tato cesta může být velmi dlouhá (často i několik let) a trnitá. Tak jako v běžném životě narážíme i v empirickém výzkumu na určité nesnáze, které jsou často zapříčiněny zcela praktickými důvody, s nimiž moc nezmůžeme. Patří k nim nedostatek času či financí, obtížné shánění osob, které by měly být do výzkumu zapojeny, momentální nefunkčnost techniky nutné pro realizaci výzkumu a podobně. Problémy si ale můžeme přivodit sami tím, že podceníme některý z dílčích kroků při realizaci výzkumu. Pokud například hned na začátku dialektologického výzkumu nebo výzkumu používajícího hodnocení přijatelnosti podceníme podobu dotazníku, může se nám stát, že i když celému výzkumu věnujeme hodně času a energie, získáme nezajímavé a nepoužitelné výsledky. Když ve výzkumu čtení či porozumění určitým větám podceníme podobu používaných stimulů, mohou být výsledky těžko zobecnitelné, i když třeba nasbíráme data od několika stovek mluvčích. Pokud si vytváříme korpus pro následnou analýzu diskurzu nebo plán excerpce pro tvorbu slovníku, můžeme podcenit principy výběru výchozích textů, což může způsobit, že naše závěry budou dosti zkreslené. A totéž se nám může stát i ve fonetickém výzkumu, když nebudeme přemýšlet nad tím, jaké nahrávky vlastně zpracováváme (od jakých jsou mluvčích, v jakých byly nahrávány situacích apod.). Snadno se může stát, že něco takového podceníme. Uvedené příklady jsou jenom jedněmi z mnoha. Poukazují však na zásadní věc. Děláme-li empirický výzkum, lze zkazit spoustu věcí, a to třeba i vcelku nevědomky. Pokud se nám to stane, může být výsledek našeho výzkumu k ničemu. Možných uklouznutí je po cestě od výzkumné otázky k závěrům velká řada a bývá těžké se jim bránit. Aby se nám mohlo podařit touto cestou projít se ctí, musíme dobře poznat nástrahy, na jaké narážíme (někdy dokonce nevyhnutelně). A právě k tomu slouží principy empirické metodologie. Jsou tady proto, aby nás vedly a pomáhaly nám na cestě k poznání, na které bychom se bez nich nejspíše ztratili. Osvojit si tyto principy je podobné jako naučit se řídit jachtu: Pokud se nám to podaří, nezaručuje to, že naše plavba bude snadná a bezproblémová. Na řadu 1 Úvod 3 nebezpečí však budeme připraveni nebo třeba poznáme, že zrovna nemá smysl vyplouvat. Pokud to ale neumíme, anebo to umíme jenom částečně, je prakticky jisté, že naše plavba neskončí dobře. Empirickou metodologii je však potřeba si osvojit i v případě, že se sami empirický výzkum dělat nechystáme. Pokud totiž porozumíme tomu, jak empirický výzkum funguje, na jakých principech je založen a jaké výhody a nevýhody jsou spojeny s jednotlivými rozhodnutími při realizaci takového výzkumu, jsme schopni poměrně dobře kriticky recipovat různá bádání, na která narážíme v publikovaných studiích, na přednáškách či konferencích anebo třeba i v médiích. Lze říci, že žádná empirická studie není v pravém slova smyslu bezvadná, či spíše že nemá žádná slabá místa, a není vůbec těžké narazit na práci, která je metodologicky přímo sporná. Bez znalosti empirické metodologie to však nemusíme poznat a můžeme žít v domnění, že výsledky různých (špatně provedených) studií jsou jakési objektivní pravdy o světě kolem nás. To může mít neblahé důsledky na celou společnost, protože se takové nevalidní poznatky mohou dostávat do učebnic či do médií a negativně tak ovlivňovat chování či uvažování lidí (odstrašujícím příkladem zde mohou být třeba metodologicky problémové výzkumy bilingvismu z 1. poloviny 20. století, které měly velký vliv na to, že se řada rodičů ve smíšených rodinách rozhodla mluvit na své potomstvo pouze jedním jazykem, byť byl třeba pro jednoho z rodičů jazykem nerodným; srov. Barac, R., & Bialystok, E. (2011). Cogni- Barac and Bialystok, 2011). tive development of bilingual children. Language Teaching, 44(1), 36-54 1.3 Komu je učebnice určena? Jak jsem zmínil, lingvistika si před časem prošla posunem k empirii a i směry, které třeba ještě v polovině 20. století byly silně teoreticky orientované, dnes vychází z empirických dat. Problém přitom je, že tento proces empirizace byl a je pozvolný a vlastně proběhl a stále probíhá přirozeně, bez nějakého vnějšího zásahu. To je přímo spojeno se skutečností, že se empirické metody dostávaly do studijních plánů lingvistických studijních programů jen postupně a že v některých studijních programech s lingvistickým zaměřením takovýto kurz dokonce stále chybí. V lingvistice se tak aktivně pohybuje velké množství badatelů, kteří se s empirickou metodologií seznámili až v relativně pozdější fázi kariéry a třeba jen povrchně. Tato učebnice tak chce a musí cílit přinejmenším na tři různé skupiny potenciálních uživatelů. Zaprvé jde o učitele kurzů věnovaných empirické metodologii a o studenty těchto kurzů. Zadruhé jde o studenty, kteří ve svém studijním plánu žádný takový kurz nemají, ale budou muset či chtít nějaký empirický výzkum sami realizovat v rámci své bakalářské nebo diplomové práce. Zatřetí se jedná o badatele, kteří si empirické metody osvojovali takříkajíc za pochodu a nejsou si v nich zcela jisti. Zkombinovat tyto tři typy modelových čtenářů není samozřejmé, protože každá z těchto skupin potřebuje něco jiného. Pro první skupinu by tato učebnice měla sloužit jako podpůrný studijní materiál, který bude kombinován s vlastním výkladem vyučujícího. Pro druhou skupinu je žádoucí, aby učebnice byla materiálem sama o sobě a studenty neochudila o nic podstatného, protože nemusí mít k dispozici někoho, kdo by jim 1 Úvod 4 věc vysvětlil či uvedl do souvislostí. U třetí skupiny se dá zase očekávat jistá pokročilost a neochota procházet vysloveně úvodní pojednání. 1.4 Jak je učebnice členěna? Uvedené problémy se pokusím vyřešit určitou strukturací textu. Hlavní text bude víceméně obecné teoretické pojednání, které představí různé aspekty empirického výzkumu. Toto pojednání bude doprovázeno různými reálnými příklady, na které lze narazit v odborné literatuře, přičemž se nebudu vyhýbat ani příkladům sporným, které dobře ilustrují různé potíže, na něž může empirický výzkum narážet, a někdy ani příkladům odstrašujícím, zvláště pokud jde o jevy, na které lze v literatuře narazit častěji a u kterých má smysl vysvětlovat, v čem jsou špatně. Každá kapitola bude doplněna doporučenou literaturou, a to jak obecnou k jednotlivým metodologickým otázkám, tak literaturou, kterou lze dle mého soudu brát jako příklady dobré praxe. V samostatných boxech budou uváděny jednotlivé termíny spolu s vysvětlením a svou anglickou podobou (tu považuji za zásadní, protože dominantní lingvistická produkce vychází právě v tomto jazyce, a je tak nabíledni, že na ni čtenáři této učebnice dříve či později narazí). V každé kapitole budou k dispozici i náměty k zamyšlení, které by měly čtenáře stimulovat k dalšímu přemýšlení o vyložené problematice. Součástí učebnice budou také online materiály, které budou mimo jiné zahrnovat cvičení k jednotlivým kapitolám spolu s řešeními, doprovodné materiály z různých výzkumů, které nepůjde z rozsahových či technických důvodů vměstnat do samotné knihy (kupříkladu ukázky rozhovorů s přepisem). Budu rovněž využívat marginálie, které by měly (vedle názvů kapitol a podkapitol) pomáhat marginálie = poznámka na okraji stránky při orientaci v textu. Na závěr bych se chtěl ještě zastavit u otázky, proč vlastně psát další knihu o empirických metodách, když je jich už hodně. To je regulérní a poměrně důležitá otázka — rozhodně by nemělo smysl trávit desítky hodin prací na učebnici, která bude plně nahraditelná nějakou již existující knihou. Je nepochybné, že učebnic empirických metod existuje hodně a nemálo jich je i zaměřeno na lingvistiku. Sám jsem ale jako vyučující empirických metod v lingvistice narážel na to, že žádná z těchto učebnic nebyla z různých důvodů optimální. Učebnice zaměřené obecně anebo na jiné oblasti, než je výzkum jazyka a jeho užívání, poskytují často velmi dobrý vhled do obecných principů empirického výzkumu, ale pro studenty lingvistických či filologických oborů jsou v nich vykládané jevy často obtížně představitelné a propojitelné s jejich vlastním oborem. To je pochopitelně výrazný problém, který velmi snižuje motivaci studentů se s empirickými metodami seznamovat, což je ještě znásobeno tím, že toto seznamování nebývá pro všechny úplně snadné. Z pozice učitele jsem tak přesvědčen, že je nutné, aby si studenti oborů zaměřených na jazyk a jeho užívání osvojovali empirickou metodologii ukotvenou ve svém vlastním poli zájmu, kterému již do určité míry rozumí. Právě toto ukotvení může mnoho věcí hodně usnadnit. Lingvisticky orientovaných metodologických úvodů je vícero, ale domnívám se, že rovněž nejsou ideální pro dosažení cílů, které si klade tato učebnice. Velká část z nich se totiž zaměřuje výhradně na statistiku, což je téma, kterého se v této 1 Úvod učebnici dotkneme jenom částečně (věnovat se budeme pouze deskriptívni statistice) a zejména s cílem získat schopnost kritického zpracování zobrazených dat. Jiné úvody se s touto učebnicí překrývají více, v řadě ohledů se však odchylují. Především je časté, že se takový úvod zaměřuje jen na určitou specifickou oblast lingvistiky (například sociolingvistiku -viz Tagliamonte, 2006, či třeba na výzkum osvojování druhého jazyka - viz Mackey and Gass, 2015), případně na určitou konkrétní techniku či okruh technik (například hodnocení gramatičnosti/přijatelnosti - viz Schütze, 2016, či na využití korpusů - viz McEnery and Hardie, 2011). To je pochopitelně samo o sobě v pořádku a jedná se o publikace, na které budu nezřídka odkazovat. Jde však o knihz koncipované jinak. Cílem této učebnice je poskytnout úvod do empirických metod, který by mohl sloužit pro lingvisticky orientované čtenáře bez ohledu na jejich konkrétní zaměření. Na jednotlivé jevy se budeme dívat z různých perspektiv a budeme je ilustrovat na příkladech z různých lingvistických subdisciplín, jako byly třeba ty, o nichž jsme společně přemýšleli v úvodu této kapitoly. Tagliamonte, S. A. (2006). Analysing so-ciolinguistic variation. Cambridge University Press Mackey, A., & Gass, S. M. (2015). Second language research: Methodology and design. Routledge Schütze, C. T. (2016). The empirical base of linguistics: Grammaticality judgments and linguistic methodology. Language Science Press McEnery, T., & Hardie, A. (2011). Corpus linguistics: Method, theory and practice. Cambridge University Press 1.5 Otázky na přemýšlení Podívejte se na nějakou empiricky založenou lingvistickou studii, kterou jste nedávno četli. Zamyslete se nad těmito věcmi: 1. Na základě dostupných informací si co nejdetailněji představte, jak výzkum probíhal (od samotného začátku až do odevzdání článku do recenzního řízení). Na jaké problémy autor či autoři při realizaci výzkumu naráželi? Jak se s nimi vyrovnávali? 2. Jaká omezení má samotná studie? Lze její závěry bez potíží zobecňovat? Pokud ne, proč? 3. Šlo by daný výzkum realizovat prostřednictvím nějaké jiné metody? Co všechno by se muselo změnit a jaké dopady by to patrně mělo na výsledky? výzkumný postup Výzkumná otázka a hypotézy Každý výzkum začíná výzkumnou otázkou a formulací hypotéz. Na podobné tvrzení narazíte v naprosté většině učebnic empirických metod. Na druhou stranu se výzkumným otázkám a hypotézám obvykle nevěnuje moc pozornosti a implicitně se očekává, že tuto část výzkumu každý zvládne. Je pravda, že vymezit si cíl výzkumu, respektive jeho předmět, a to, na co má vlastně váš výzkum hledat odpovědi, není samo o sobě až tak těžké. Je však dobré si uvědomit, že naši práci může výrazně ovlivnit už to, nakolik pečlivě formulujeme její cíle. V praxi jsem se zejména v případě studentských závěrečných prací setkal s řadou na první pohled ambiciózních výzkumných otázek, které však byly od počátku nerealistické a nebylo v možnostech autorů na ně smysluplně odpovědět. Výsledkem pak byla slabá práce, přestože jí autoři věnovali hodně času a psychických sil. Zkrátka a dobře, výzkumné otázce a hypotézám je dobré věnovat čas a dobře je promyslet. A právě proto se tomu relativně obšírně věnujeme i zde. 2.1 Co jsou hypotézy?..... 7 2.2 Hypotézy a proměnné ... 8 2.3 Pracovní a nulové hypotézy 9 2.4 Formulace hypotéz..... 10 2.5 Explorativní výzkum .... 12 2.6 Jak vzniká výzkumná otázka............. 12 2.7 Indukce a dedukce..... 13 2.8 Otázky na přemýšlení ... 15 2.1 Co jsou hypotézy? Začněme tím, co jsou to hypotézy a jak se liší od výzkumných otázek. Slovo „hypotéza" se totiž používá v běžném jazyce v širším smyslu, než jak ji obvykle chápeme v empirickém výzkumu. V empirické metodologii je hypotéza tvrzení, které usouvztažňuje určité jevy a vymezuje povahu a směr tohoto vztahu. Mohli bychom například předpokládat, že vzdělání (jev A) nějak souvisí s velikostí slovní zásoby (jev B). Naše hypotéza by tak například mohla znít: (1) Čím vyšší má jedinec vzdělání, tím větší má slovní zásobu. Nebo by nás mohlo zajímat, jestli existuje nějaká souvislost mezi pohlavím (jev C) a velikostí slovní zásoby (jev B), přičemž bychom mohli formulovat hypotézu: (2) Zeny mají větší slovní zásobu než muži. Klíčovou vlastností každé hypotézy je její „falzifikovatelnost" (vyvratitel-nost), tj. to, že pokud bychom v našem výzkumu dosáhli specifických výsledků, mohli bychom se slušnou jistotou tvrdit, že daná hypotéza není platná. To zní možná trochu zvláštně. Intuitivně bychom předpokládali, že hypotézy prokazujeme, tedy že docházíme k tomu, že hypotéza platí. Ve skutečnosti tomu tak není v žádné empiricky orientované disciplíně (ani třeba ve farmakologii). To nejlepší, čeho můžeme dosáhnout, je zjištění, že existuje jen malá šance, že je naše hypotéza nesprávná. Proč to tak je, si vysvětlíme později. Je však dobré si již na začátku zafixovat jednoduchou poučku: hypotézy nepotvrzujeme, naopak je vyvracíme. 2 Výzkumná otázka a hypotézy 8 Na rozdíl od hypotézy je výzkumná otázka širší a nemusí být příliš konkrétní. Hypotéza je tvrzení, výzkumná otázka má z povahy věci formu otázky. Výše uvedené dva příklady hypotéz bychom mohli shrnout do obecnější otázky Jaké faktory ovlivňují velikost slovní zásoby? Na základě takto formulované otázky bychom mohli formulovat i další hypotézy, ať už nám připadají smysluplné, nebo nikoliv, kupříkladu: (3) Čím starší je mluvčí, tím větší má slovní zásobu. (4) Bilingvní mluvčí mají menší slovní zásobu než monolingvní. (5) Lidé, kteří čtou poezii, mají větší slovní zásobu než lidé, kteří poezii nečtou. (6) Barva vlasů jedince nemá vliv na velikost jeho slovní zásoby. (7) Místo narození jedince nemá vliv na velikost jeho slovní zásoby. Výzkumnou otázkou si vlastně vymezujeme určité výzkumné pole a hypotézy nám slouží k tomu, abychom na tuto otázku z různých úhlů pohledu odpovídali. Hypotéz může být v rámci určité výzkumné otázky relativně velké množství (výše uvedených sedm hypotéz bychom zajisté mohli ještě rozhojňovat). Z pochopitelných důvodů však obvykle neověřujeme všechny - zaměřujeme se na ty, které jsme schopni testovat a jejichž testování má zároveň z různých důvodů smysl (což by třeba nebyl případ hypotézy o barvě vlasů). 2.2 Hypotézy a proměnné Když se podíváme na sedm výše uvedených hypotéz, můžeme si všimnout několika věcí. Předně, jeden z usouvztažňovaných jevů je vždycky stejný, tedy velikost slovní zásoby, a druhý z jevů se v jednotlivých hypotézách liší (vzdělání, pohlaví, věk, bilingvnost/monolingvnost, čtení poezie, barva vlasů, místo narození). Je to z toho důvodu, že se v těchto hypotézách vyslovují předpoklady o tom, co velikost slovní zásoby ovlivňuje (respektive naopak neovlivňuje, jako je tomu v hypotézách (6) a (7)). Předpokládáme tedy, že velikost slovní zásoby je něčím ovlivňována, že na ni působí určité faktory, jako je kupříkladu věk mluvčího v hypotéze (3). Souborně o takových jevech mluvíme jako o proměnných. Proměnná je abstraktní jednotka, která má v konkrétních případech (ve svých „realizacích") určitou hodnotu. Například proměnná pohlaví může mít hodnoty muž a žena, možných hodnot proměnné věk je oproti tomu potenciálně mnohem více (45 let, 14 let, 31 let atd.). Zamyslíme-li se nad výše uvedenými hypotézami, může nám připadat nápadné, že je v nich vždy jedna proměnná, o níž předpokládáme, že ovlivňuje (či naopak neovlivňuje) druhou. Můžeme říct, že předpokládáme, že jedna je „příčinou" a druhá „následkem". Proměnné, která je dle našeho předpokladu ovlivňována, říkáme závislá proměnná, (někdy též „závisle proměnná"). Naopak proměnným, o kterých v našich hypotézách předpokládáme, že jsou tím, co ovlivňuje, říkáme nezávislá proměnná, („nezávisle proměnná"). Termíny závislá a nezávislá proměnná se studentům často pletou (podobně jako třeba názvy ptáků proměnná = abstraktní jednotka, která nabývá různých konkrétních hodnot [angl. variable] závislá proměnná = proměnná, o které předpokládáme, že je ovlivňována jinou zkoumanou proměnnou [angl. dependent variable] nezávislá proměnná = proměnná, o které předpokládáme, že ovlivňuje jinou zkoumanou proměnnou [angl. independent variable] 2 Výzkumná otázka a hypotézy 9 žluna a žluva), což poukazuje na to, že není dobré dvě různé věci ze stejné kategorie nazývat formálně blízkými slovy. Pomoci však může motivovanost těchto termínů: o „závislé proměnné" předpokládáme, že je závislá na „nezávislé proměnné", tedy že je nezávislou proměnnou ovlivňována. V případě výše vymezených hypotéz je tak závislou proměnnou vždy velikost slovní zásoby, zatímco nezávislou proměnnou je pokaždé něco jiného (viz Obrázek 2.1). nezávislá proměnná I ZJ)> závislá proměnná Je vhodné podotknout, že to, co je v určité hypotéze závislou proměnnou, může být v jiné hypotéze proměnnou nezávislou. Není to tedy tak, že by některé proměnné byly z povahy závislé a jiné z povahy nezávislé. V případě velikosti slovní zásoby je taková věc nasnadě. Například v rámci výzkumné otázky Jaké jsou důsledky velikosti slovní zásoby na porozumění? bychom mohli formulovat hypotézu (8) Čím větší má jedinec slovní zásobu, tím lépe rozumí klasické literatuře. V této hypotéze je velikost slovní zásoby nezávislou proměnnou a předpokládá se její vliv na rozumění klasické literatuře, které zde představuje proměnnou závislou. K proměnným se ještě mnohem podrobněji vrátíme v samostatné kapitole. 2.3 Pracovní a nulové hypotézy Další důležitou věcí je, že se mezi sebou liší hypotézy (1) až (5) na jedné straně a (6) a (7) na straně druhé. Zatímco první skupina hypotéz předpokládá vztah, tj. že závislá proměnná velikost slovní zásoby je ovlivňována jednotlivými nezávislými proměnnými, hypotézy (6) a (7) předpokládají, že vztah mezi nezávislou a závislou proměnnou neexistuje. To je pochopitelně zcela regulérní předpoklad a pro celý empirický výzkum je neexistence vztahu z různých důvodů klíčová možnost, jak si později ukážeme. Na tomto místě se spokojíme se samotným konstatováním, že existují hypotézy dvou typů. Na jedné straně máme hypotézy, které nějaký vztah předpokládají. Těm říkáme pracovní hypotézy.. Na straně druhé pak stojí hypotézy, které předpokládají, že vztah mezi nezávislou a závislou proměnnou neexistuje. Jim říkáme nulové hypotézy. Pokud se snažíme zachytit vztah mezi dvěma proměnnými, můžeme obvykle formulovat různé pracovní hypotézy (tj. různá tvrzení o tom, jak tento vztah přesně vypadá), avšak jenom jednu nulovou hypotézu (tj. tvrzení, že mezi těmito jevy žádný vztah není). Obrázek 2.1: Schematické znázornění vztahu mezi závislou a nezávislou proměnnou. pracovní hypotéza = hypotéza, která předpokládá, že mezi proměnnými je nějaký vztah [angl. working hypothesis] nulová hypotéza = hypotéza, která předpokládá, že mezi proměnnými neexistuje žádný vztah [angl. null hypothesis] vzdělání pohlaví věk bilingvnost četba poezie barva vlasů místo narození velikost slovní zásoby 2 Výzkumná otázka a hypotézy 10 2.4 Formulace hypotéz Jak jsme řekli výše, klíčovou vlastností hypotéz je to, že je můžeme za jistých okolností vyvrátit, tedy takzvaně falzifikovat. Zároveň jsme mluvili o tom, že ačkoliv můžeme v rámci určité výzkumné otázky formulovat velké množství různých hypotéz, obvykle jich testujeme jenom několik (nebo dokonce jenom jednu). Tyto dva obecné poznatky jsou klíčové pro samotnou formulaci hypotéz. Při formulaci hypotéz je potřeba zajistit následující věci: Z hlediska testování hypotéz je klíčové, abychom dobře vymezili jevy (proměnné), které v rámci hypotézy usouvztažňujeme. Již na samém začátku výzkumu bychom měli mít dobře promyšleno, o jaké jevy se jedná, jak je definujeme, a hlavně jak je přesně budeme měřit a jakých hodnot mohou v konkrétních případech nabývat. S tím pak úzce souvisí ještě otázka, zda máme k dispozici možnosti, jak jednotlivé jevy měřit. Tohle může znít relativně triviálně a v případě některých jevů to ani není nic těžkého - jindy to však může být poměrně složité. Vezměme si jako příklad výše uvedenou hypotézu (3). Nezávislou proměnnou je zde věk v letech. To je proměnná, která se většinou měří poměrně snadno, protože se na ni můžeme přímo zeptat daného mluvčího (pokud tedy nezkoumáme etnika, pro která je věk nepodstatnou záležitostí a kde svůj přesný věk jednotlivci často vůbec neznají). Se závislou proměnnou je to však složitější. Velikost slovní zásoby je totiž na jednu stranu intuitivně představitelný jev, který můžeme i snadno obecně vymezit jako počet slov, která mluvčí zná. Problém však spočívá v tom, že se jedná o proměnnou, jejíž hodnoty pro jednotlivé mluvčí zjišťujeme poměrně komplikovaně a technicky vzato je spíše odhadujeme, než v pravém slova smyslu měříme (viz Box 1: Způsoby zjišťování velikosti slovní zásoby). Hypotéza (3) tak sama o sobě vypadá naprosto bezproblémově. Když se však zamyslíme nad tím, zda ji budeme schopni ověřovat, můžeme dospět k závěru, že je to příliš složité s ohledem na to, jaké jsou naše časové, finanční a technické možnosti. To pochopitelně platí pro celou výzkumnou otázku Jaké faktory ovlivňují velikost slovní zásoby? Zajisté je to otázka zajímavá a má smysl ji zkoumat - je však třeba dobře promyslet, jestli jsme schopni to z praktického hlediska zvládnout. Box 1: Způsoby zjišťování velikosti slovní zásoby Největší dosud publikovaný slovník češtiny, Příruční slovník jazyka českého (1935-1957) obsahuje přibližně 250 000 hesel. Kdybychom tedy spekulovali o tom, kolik slov má čeština, byl by tento počet určitým odrazovým můstkem (můžeme předpokládat, že některá ze zachycených slov se již vůbec nepoužívají, na druhou stranu však od té doby spousta slov vzniklo). Zároveň je zřejmé, že každý z nás zná (ať už aktivně či pasivně) jen jistou výseč z celkového počtu českých slov. Existují různé výzkumy, které se zabývají tím, jaké faktory velikost slovní zásoby ovlivňují (viz např. Keuleers et al., 2015). Metodologicky zajímavá je však samotná otázka, jak můžeme zjistit, kolik zná určitý mluvčí slov. Hypoteticky by bylo možné projít s daným mluvčím celý slovník (případně nějakou databázi slov, třeba vytvořenou na Keuleers, E., Stevens, M., Mandera, P., & Brysbaert, M. (2015). Word knowledge in the crowd: Measuring vocabulary size and word prevalence in a massive online experiment. The Quarterly Journal of Experimental Psychology, 68(8), 1665-1692 2 Výzkumná otázka a hypotézy 11 základě referenčního korpusu) a u každého slova zjistit, zda ho mluvčí zná či nikoliv. Takový způsob zjišťování je relativně přesný, avšak mimořádně zdlouhavý, nepříjemný a odhodlalo by se k němu nejspíš jen málo mluvčích. Z praktického hlediska je tak třeba postupovat jinak. Při odhadech velikosti slovní zásoby se typicky používá princip zobecňování z určitého vzorku. Testuje se to, nakolik mluvčí zná určitý soubor slov (například z různých frekvenčních pásem - od hodně frekventovaných po velmi zřídkavá) a poté se jeho skóre zobecní na celou slovní zásobu daného jazyka. Přesný způsob realizace se v různých případech může dost lišit, důležité je však to, že se vždy jedná pouze o určitý odhad. Skutečnou velikost slovní zásoby určitého mluvčího vlastně nejsme schopni zjistit přesně. Dobrým příkladem jedné studie zaměřené na odhadování velikosti slovní zásoby je Brysbaert et al. (2016). S ověřitelností bezprostředně souvisí i to, jak jsou vlastně hypotézy formulovány. Pokud bychom k věci přistupovali opravdu rigorózně, měli bychom mít předem vyjasněné logické podmínky, za jakých by byla hypotéza vyvrácena a za jakých naopak nikoliv. Podívejme se třeba na tyto dvě volně formulované hypotézy: (9) Studenti humanitních oborů mají velkou slovní zásobu. (10) Hraní scrabblu má vliv na velikost slovní zásoby. Striktně vzato jsou obě tyto hypotézy formulovány špatně, protože není jasné, za jaké situace by byly vyvráceny. V případě hypotézy (9) je problém v tom, že zde chybí nějaké srovnání - proměnnou je zde vlastně jenom velikost slovní zásoby, druhý jev (studenti humanitních oborů) má jenom jednu hodnotu. S tím pak souvisí to, co to znamená „velká slovní zásoba". Znění hypotézy na to odpověď neposkytuje. Pokud bychom tedy například na základě jinak velmi dobře provedeného zkoumání došli k závěru, že studenti humanitních oborů znají průměrně třeba 50 000 slov, nemohli bychom říci, zda hypotéza platí či nikoliv. Zkusme si to srovnat s variantou Studenti humanitních oborů mají větší slovní zásobu než studenti technických oborů. Tam srovnání je a je tam i specifikován směr vztahu - pokud bychom pak naměřili, že studenti humanitních oborů znají průměrně 50 000 slov, zatímco studenti technických oborů průměrně 45 000 slov, mohli bychom se k hypotéze smysluplně vyjádřit (samozřejmě po provedení určitých analytických kroků, k čemuž se dostaneme později). V případě hypotézy (10) je problém v tom, že není jasný směr vztahu. Hypotézu tedy z logiky věci paradoxně nevyvrací ani situace, kdy bychom zjistili, že mají hráči scrabblu nižší slovní zásobu, ani situace opačná, tedy že by jejich slovní zásoba byla vyšší. Co se týče výběru z potenciálních hypotéz, které připadají v úvahu, je zásadní, abychom měli dobrý důvod předpokládat, že spolu jevy usouvz-tažněné v rámci určité hypotézy nějak souvisí. Tento důvod nám typicky dává předchozí literatura k tématu, respektive naše obeznámenost s dosavadními vědeckými poznatky daného tématu. Zásadní přitom je, Brysbaert, M., Stevens, M., Mandera, P., & Keuleers, E. (2016). How many words do we know? Practical estimates of vocabulary size dependent on word definition, the degree of language input and the participant's age. Frontiers in psychology, 7,1116 2 Výzkumná otázka a hypotézy 12 aby ona předpokládaná souvislost byla nějak teoreticky vysvětlitelná. Pokud bychom pouze zkoumali nějakou nahodile vytvořenou, intuitivně dobře znějící hypotézu a nakonec třeba i došli k závěru, že ji naše výsledky nevyvrací, není to až tak zajímavé, pokud nemáme určitou oporu v teorii. 2.5 Explorativní výzkum Předchozí pojednání o hypotézách se může z hlediska výzkumné praxe jevit jako příliš striktní. Běžně se totiž můžeme setkat s tím, že jsou hypotézy vymezovány relativně volně. Ostatně, přesné znění hypotéz v různých studiích často ani nenajdeme. Zkušení badatelé, kteří ví, co dělají, explicitně formulovat hypotézy nutně nepotřebují. Zejména na začátku odborné kariéry je ale myslím dobré si ono rigorózní uvažování o hypotézách osvojit, protože to potom výrazně usnadňuje celé plánování výzkumu, jeho realizaci i vyhodnocení získaných výsledků. Badatelé mohou však mít i jiné důvody, proč hypotézy neformulovat tak striktně, jak jsme o tom mluvili výše. Podívejme se na následující příklad. (11) Badatelé plánují udělat megastudii zaměřenou na to, jaké faktory ovlivňují velikost slovní zásoby. Vytvoří krátký test zaměřený na orientační zjištění velikosti slovní zásoby a zároveň každé testované osobě předloží dotazník obsahující různé demografické otázky (například na věk, pohlaví, vzdělání, počet jazyků, kterými daná osoba hovoří apod.). Díky tomu, že na výzkumu spolupracují s různými médii, která výzkum propagují jako možnost zdarma a online si otestovat, kolik člověk umí slov, získají velké množství , T, , , , ^ ' 1: Jde zhruba o postup uplatňovaný ve respondentů (řádově desetitisíce). výzkumu Keuleers et al. (2015). Výzkum v příkladu (11) badatelům umožňuje podívat se na vztahy mezi zjištěnou velikostí slovní zásoby a různými demografickými kategoriemi. Jedná se o příklad explorativního výzkumu. Takový výzkum vlastně prozkoumává dosud málo prozkoumaný terén, což je spojeno i s tím, že obvykle nepracuje s jasně vymezenými hypotézami, jejichž platnost by se snažil testovat, ale spíše se porozhlíží po tom, jaké proměnné by spolu mohly souviset a jak. Explorativní výzkum může být velmi přínosný a může nám pomoci získat představu o tom, jak určité věci fungují. Zároveň může tento typ výzkumu přinést podněty pro výzkumy navazující, které mohou (právě díky předchozímu explorativnímu výzkumu) již pracovat s jasněji vymezenými hypotézami. explorativní výzkum = výzkum, který se zaměřuje na dosud nepříliš prozkoumanou oblast, typicky s cílem dospět k předběžnému porozumění tomu, jak daná oblast funguje [angl. exploratory research] 2.6 Jak vzniká výzkumná otázka Potřeba opory v teorii úzce souvisí s tím, jak vlastně vzniká výzkumná otázka. Výzkumná otázka může být pochopitelně výsledkem náhlého vzplanutí mysli, může být zapříčiněna nějakou náhlou událostí či prostě aktuálním děním, ale v naprosté většině případů vyplývají výzkumné 2 Výzkumná otázka a hypotézy 13 otázky z odborné literatury a z dosavadního poznání určité problematiky. Lze říci, že empirická věda je do značné míry kumulativní. Tím nechci nějak rozporovat kuhnovskou představu vývoje vědy (Kuhn, 1997), která Kuhn, T. S. (1997). Struktura vědeckých nazírá vědecký pokrok jako proces různých revolucí a diskontinuit. Ku- revoluci. Oikoymenh mulativností míním vzájemnou návaznost jednotlivých výzkumů. Tato návaznost může být a často je založená kriticky - jedni autoři rozporují na základě svého výzkumu předchozí závěry jiných badatelů. Často mezi sebou soupeří různé teorie a autoři v různých empiricky založených studiích argumentují pro určitou teorii, a naopak vyvrací jinou. Teorie bývají postupem času opouštěny (třeba i abruptně), anebo revidovány, avšak návaznost jednotlivých výzkumů zůstává nezpochybnitelná. Formulaci výzkumných otázek by tak měla předcházet dobrá znalost literatury v dané oblasti. V případě studentů je často jasné, že příliš hlubokou znalost odborné literatury v jedné konkrétní oblasti mít nebudou - formulace výzkumné otázky je proto to, co by měl do značné míry určovat (obvykle mnohem poučenější) vedoucí práce. 2.7 Indukce a dedukce V této souvislosti je vhodné vymezit dva přístupy k empirickému výzkumu, které se často dávají do protikladu. K empirickému výzkumu lze přistupovat tak, že vlastně ověřujeme určitou teorii. Na základě teorie formulujeme hypotézy, ty testujeme, docházíme k závěrům a ty poté promítáme do teorie (případně tuto teorii vyvracíme; viz Obrázek 2.2). Takovému přístupu od teorie přes hypotézy a měření zpět k teorii se říká deduktivní přístup. Právě tomuto přístupu se v této učebnici budeme věnovat primárně. hypotézy teorie testovaní zavery Obrázek 2.2: Schéma deduktivního výzkumu (od teorií přes ověřování hypotéz zpět k teoriím) Oproti tomu se vymezuje induktivní přístup, který vychází z teoreticky nepodmíněného pozorování reality, na jehož základě dochází k povšimnutí si pravidelností, z nichž se vyvozují určité závěry a následně určité teorie (viz Obrázek 2.3). Někteří autoři staví tyto dva přístupy do ostrého kontrastu. Například lingvistický směr zvaný konverzační analýza vznikl jako výrazně induktivní směr, který zdůrazňuje ateoretičnost výchozího popisu a snahu dívat se na věci otevřenýma očima. Osobně se domnívám, že ve skutečnosti jsou si uvedené dva přístupy protichůdné pouze jako abstraktní idea, nikoliv z hlediska výzkumné praxe. 2 Výzkumná otázka a hypotézy 14 Obrázek 2.3: Schéma induktivního výzkumu (od pozorování k teoriím) Jednak lze jen těžko věřit tomu, že je možné zaujímat v pravém slova smyslu ateoretický pohled, tedy snažit se pozorovat určité jazykové jevy bez nějakých předchozích předpokladů a představ, byť třeba jen intuitivních, explicitně nevyjádřených. Často problematická je v praxi rovněž uvedená cykličnost deduktivního přístupu - existují vedle sebe různé teorie a výsledky různých výzkumů jsou s nimi tu více a tu méně v souladu. To může být částečně dáno určitými sociálními aspekty vědy (autorům se z pochopitelných důvodů nechce hned opouštět určitou teorii, kterou formulovali a věnovali jí hodně času), avšak neméně důležité je i to, že vztah výsledků a teorie není tak přímočarý, jak by idealizovaná představa naznačovala. Jde především o to, že výsledky je nutné nějak interpretovat a tato interpretace není vůbec samozřejmá a je zatížena řadou možných zkreslení a subjektivních omylů. V posledku jsou si tak oba přístupy podobnější, než by se zdálo - oba pracují s empirickými daty, oba využívají určitý metodologický aparát a oba dochází na základě určitých pravidel k nějakým zobecněním. Deduktivní přístup má obecně striktnější a jednoznačnější pravidla a je typicky kvantitativní, tj. získaná data statisticky vyhodnocuje. Induktivní přístup je metodologicky volnější, ale umožňuje zkoumat jevy, které by se deduktivně zkoumaly obtížně. Osobně se domnívám, že z hlediska popisu jazyka a jeho užívání lze výsledky získané deduktivně a induktivně považovat za komplementární, vzájemně se obohacující. Má zkrátka smysl dívat se na stejné věci z různých úhlů pohledu. Box 2: Checklist pro tvorbu hypotéz Umím přesně vymezit jednotlivé jevy zahrnuté v hypotéze. Vím, jakých potenciálních hodnot proměnná může nabývat. Vím, jak určovat hodnoty proměnných v nejrůznějších případech, na které mohu ve výzkumu narazit. Mám technické, časové a finanční možnosti na to, abych byl/a schopen/schopna zjišťovat tyto hodnoty. Jsem schopen/schopna jasně určit, zda byla hypotéza vyvrácena, ať už budou výsledky jakékoliv. Mnou vytvořená hypotéza exaktně formuluje směr vztahu mezi proměnnými. hypotézy hypotézy hypotézy hypotézy hypotézy teorie 2 Výzkumná otázka a hypotézy 15 □ Jsem schopen/schopna teoreticky odůvodnit, proč by spolu měly dané jevy souviset. 2.8 Otázky na přemýšlení Podívejte se na nějakou empiricky založenou lingvistickou studii, kterou jste nedávno četli. Zkuste odpovědět na tyto otázky: 1. Jakou má tato studie výzkumnou otázku (případně jaké otázky)? Je tato otázka explicitně vyjádřena v textu? 2. Jaké má tato studie pracovní hypotézy? Jsou explicitně vyjádřeny v textu? Pokud ano, jsou formulovány dobře? 3. Jedná se o explorativní výzkum? Pokud ano, co je toho důvodem? 4. Jaké se v daném výzkumu používají závislé a nezávislé proměnné? Jsou tyto jevy jasně vymezené? Výzkumný postup 3 3.1 Máme hypotézy - a co dál? Po vymezení výzkumné otázky a hypotéz, které chceme ověřovat, máme za sebou první a důležitý krok. To těžší je však stále ještě před námi. Musíme naplánovat, jakým způsobem budeme tyto hypotézy ověřovat. Je zřejmé, že na to už částečně myslíme při formulaci samotných hypotéz, protože už v tomto kroku si musíme být jisti, že jsou hypotézy za našich podmínek ověřitelné. Ceká nás však ještě hodně vzájemně souvisejících rozhodnutí, která je třeba učinit. Musíme se rozhodnout pro určitou techniku sběru dat, respektive metodu v užším slova smyslu (například dotazníkové hodnocení přijatelnosti, sledování očních pohybů při čtení vět (eye-tracking), korpusovou analýzu, terénní výzkum založený na pozorování apod.), stanovit si vzorek (jak velký objem dat budeme potřebovat či chtít analyzovat), promyslet strategii, jak techniku sběru dat na daném vzorku využijeme, nasbírat data a analyzovat je a zjištěné výsledky musíme být schopni interpretovat, přičemž si musíme být vědomi, jak jsou naše závěry ovlivňovány právě použitou metodologií. Na obrázku 3.1 je zachyceno schéma výzkumného postupu - povšimněme si zejména toho, že některé kroky jsou vzájemně provázané a nelze je činit nezávisle na sobě. 3.1 Máme hypotézy - a co dál? 16 3.2 Průřezová studie ...... 18 3.3 Experimentální výzkum . . 22 3.4 Longitudinální výzkum . . 26 3.5 Případová studie...... 28 3.6 Kombinace strategií .... 29 3.7 Otázky na přemýšlení ... 30 hypotézy t způsob ověřování hypotéz technika sběru *+■ vzorek *+■ strategie I sběr dat i analýza dat interpretace Obrázek 3.1: Schematicky znázorněný postup výzkumu od výzkumné otázky až k interpretaci výsledků. Některé kroky jsou spolu vzájemně provázány což je naznačeno oboustrannými šipkami. Jak si budeme ukazovat, všechny tyto kroky jsou vedeny snahou o vyvážení nesouladu mezi ideálním způsobem ověření hypotéz a našimi reálnými možnostmi. Zkrátka a dobře, cesta empirického výzkumu se pojí s různými kompromisy - někdy většími, jindy menšími. Během realizace vlastního výzkumu to zjistíte okamžitě. Je však dobré mít to na paměti i při kritickém hodnocení cizích výzkumů. Žádný není bezproblémový a v každém byly učiněny nějaké kompromisy. I dobře udělané studie tak mají slabiny, které přináší určitou nejistotu při zobecňování výsledků. 3 Výzkumný postup 17 Při kritickém čtení bychom měli být schopni takové slabiny identifikovat a zhodnotit, nakolik se potenciálně mohly ve výsledcích promítnout. Zároveň by nás to mělo vést ke kritické vstřícnosti - být si vědom slabin nějakého výzkumu je určitě podstatné, je ale dobré si uvědomovat, že slabiny jako takové jsou nevyhnutelné a autoři vůbec nemuseli odvést špatnou práci. V této kapitole se zaměříme na to, čemu budeme říkat výzkumná strategie (někdy se v témž významu používá „výzkumný design", ale tento pojem je často používán siřeji pro celou koncepci výzkumu). Ke každé výzkumné otázce je totiž možné přistoupit různými způsoby. Vezměme si pro začátek několik příkladů z oblasti výzkumu osvojování jazyka: (1) Badatelé se zaměřují na to, jak si děti osvojují češtinu. V pravidelných intervalech tří týdnů tedy nahrávají hodinové interakce celkově asi dvanácti dětí s jejich rodiči. První nahrávky spadají zhruba do věku, kdy děti začínají trochu více mluvit (orientačně kolem jednoho a půl roku života), poslední zhruba do doby čtyř let věku dítěte. Nahrávky se poté přepisují a analyzují. Jednotlivé jevy se analyzují z hlediska vývoje v čase.1 (2) Štěpán Matějka (2022) zkoumal, jak si děti (rodilí mluvčí češtiny) osvojují předložky. Zaměřují se na období mezi dvěma a třemi lety dítěte. Ve výzkumu využívají rodičovské dotazníky (standardní metoda ve výzkumu osvojování jazyka). Rodiče dítěte vyplní dotazník, v němž uvedou, zda dítě zná jednotlivé předložky, které jsou předmětem výzkumu. Do výzkumu je zahrnuto asi 120 rodičů s dětmi v uvedeném věkovém rozpětí. Každé dítě je tedy zachyceno jen v jednom časovém bodě a celková věková škála je pokryta různými dětmi. Výsledkem je obecný obrázek vývoje užívání předložek mezi dvěma a třemi lety. (3) Badatel-rodič zkoumá své dítě v období mezi 1;112 a 2;4 pomocí kombinace rodičovského deníku (tj. pravidelné zapisování si toho, co dítě řeklo) a nahrávání. Výzkum je velmi detailní a díky deníku se zachycují i okrajové a zřídkavé jazykové jevy. Výsledkem je plastický popis osvojování jazyka jednoho dítěte. 1: Jde zhruba o postup uplatňovaný v korpusu osvojování češtiny u malých dětí, který vytvořila Anna Chromá, který je k dispozici na stránkách CHILDES: https://childes.talkbank.org/ Matějka, Š. (2022). Pořadí osvojování gramatických slov a tvarů: Elektronický dotazník [Disertační práce]. Filozofická fakulta Univerzity Karlovy 2: Značení se středníkem se ve výzkumu osvojování jazyka běžně používá pro rozdělení let a měsíců. 1;11 tak znamená 1 rok a 11 měsíců. (4) Filip Smolík a Veronika Bláhová (2022) zkoumali, zda děti ve věku dvou a tří let využívají informaci o gramatickém čísle při zpracování jazyka. Provedli proto výzkum, který využívá metodu zrakové preference (dítě sedí na klíně rodiče přede dvěma monitory a sleduje se, na který z monitorů se dívá). Dětem byly pouštěny krátké věty typu Kde jsou tady na obrázku kočky? (věta s plurálem) anebo Kde je tady na obrázku bota ? (věta se singulárem), přičemž na jedné obrazovce se vždy objevil obrázek, který odpovídal otázce (např. kočky, respektive bota) a na druhé jiný obrázek, který zobrazoval jev v opačném čísle (singulár v případě kočky, plurál v případě bota). Měřilo se, kam se děti v průběhu poslouchání věty dívaly, přičemž se zjišťovalo, nakolik se v průběhu poslouchání jsou tady na obrázku dívaly na obrázek s vícero předměty a v průběhu poslouchání je tady na obrázku na obrázky s jedním předmětem. Autoři vyšli z předpokladu, že pokud děti v daném věku využívají při zpracování jazyka informaci o gramatickém čísle, měly by Smolík, R, & Bláhová, V. (2022). Here come the nouns: Czech two-year-olds use verb number endings to predict sentence subjects. Cognition, 219,104964 3 Výzkumný postup 18 se více zaměřovat na obrázky, které odpovídají číslu spony, ještě předtím, než je vyřčeno koncové substantivum. Ačkoliv se všechny uvedené výzkumy zaměřují na osvojování jazyka u dětí, v řadě ohledů se od sebe liší. V případě (1) se sběr dat provádí několik let ve stanovených intervalech, přičemž se prostě zaznamenávají přirozené projevy dětí. Podobně je tomu i u příkladu (3), který se však od příkladu (1) liší v tom, že jednak kombinuje dva způsoby sběru dat a jednak se zaměřuje jen na jedno dítě, avšak do větší podrobnosti. Zcela odlišný je naopak příklad (2), kde se vývojové rozdíly zjišťují prostřednictvím srovnání různě starých dětí. U příkladu (4) se vývojové rozdíly zkoumají rovněž na základě srovnání dětí různého věku, avšak na rozdíl od příkladu (2) je zde jazykové chování dětí zkoumáno za předem stanovených podmínek a měří se jejich reakce na určité speciálně vytvořené podněty. Uvedené čtyři příklady ilustrují čtyři základní výzkumné strategie (či designy) . Příklad (1) reprezentuje longitudinální výzkum., kdy se sbírají data od určité skupiny v určitých časových intervalech. Příklad (2) představuje průřezovou studii., která v určitém časovém bodě srovnává rozdíly mezi jedinci, které existovaly již před započetím výzkumu. Příklad (3) spadá mezi případové studie., které se zaměřují na jednu jednotku (případně malý okruh jednotek) a zkoumají je do větší hloubky (v příkladu (3) je zkoumanou jednotkou dítě, ale v jiných případech může jít také třeba o konkrétní text, žánr apod., pročež se používá souhrnné označení „jednotka" a ne třeba „jedinec"). Příklad (4) pak představuje experimentální výzkum., který je charakteristický jednak tím, že alespoň některé rozdíly mezi jednotkami vytváří až v průběhu výzkumu (v tomto případě děti poslouchají určité věty a měří se, kam se dívají), a zároveň srovnává různé situace (chování u vět se singulárovou sponou a chování u vět s plurálovou sponou). Tyto čtyři strategie si nyní představíme podrobněji a probereme si jejich výhody a nevýhody. V některých aspektech budeme vycházet z knihy Davida de Vause (2001), kterou rovněž doporučujú k dalšímu studiu. Je vhodné na tomto místě podotknout, že uvedené strategie jsou jakési obecné typy a že v konkrétních případech mohou být různě kombinovány, případně propojovány. U toho se krátce zastavíme na konci kapitoly. longitudinální výzkum = výzkum založený na sběru dat v určitých časových intervalech [angl. longitudinal research] průřezová studie = výzkumná strategie spočívající v tom, že se v určitém časovém bodě analyzují rozdíly, které existovaly již před započetím výzkumu [angl. cross-sectional study] případová studie = výzkumná strategie založená na zkoumání jedné jednotky (nebo několika málo jednotek), a to obvykle do velkého detailu [angl. case study] experimentální výzkum = výzkum založený na manipulaci nezávislé proměnné; pracuje s experimentální a kontrolní skupinou [angl. experimental research] De Vaus, D. (2001). Research design in social research. Sage 3.2 Průřezová studie Průřezové studie mohou být nejrůznějšího charakteru a mohou se zaměřovat na různé jevy. Vedle příkladu (2) uveďme ještě alespoň dva další příklady z jiné oblasti, než je osvojování jazyka: (5) Bohumír Dejmek (1981,1987) podnikl v 80. letech 20. století výzkum toho, jak nejmladší a nejstarší generace obyvatel Hradce Králové užívá různé jevy z obecné češtiny (ej místo ý, í místo é, protetické v- apod.). Analyzoval projevy 47 mluvčích z nejstarší generace a 113 mluvčích z nejmladší generace. Mimo jiné zjistil, že mluvčí z nejstarší generace v Hradci Králové používali neslabičné u místo v či f (například prauda místo pravda) ve 13,3 % případů, zatímco mluvčí z nejmladší generace jen v 5 % všech případů. Tento Dejmek, B. (1981). Mluva nejstarší generace Hradce Králové: Se zaměřením na diferenční jevy hláskové a morfologické. Pedagogická fakulta v Hradci Králové Dejmek, B. (1987). Běžně mluvený jazyk nejmladší generace Hradce Králové. Pedagogická fakulta v Hradci Králové 3 Výzkumný postup 19 výsledek lze chápat jako doklad postupného zanikání tohoto jevu v mluvě obyvatel Hradce Králové. (6) Tomáš Jelínek (2013) analyzoval rozdíly mezi třemi žánrovými sub-korpusy korpusu SYN2005 (beletrie, odborná literatura a publicistika) z hlediska různých syntaktických jevů, mimo jiné z hlediska užívání neshodného přívlastku v genitivu. Ukázal, že nejméně se neshodný přívlastek objevoval v subkorpusu beletrie (13 % všech substantiv v tomto subkorpusu představovalo neshodný přívlastek v genitivu), více v subkorpusu publicistiky (20,6 %) a nejvíce v subkorpusu odborné literatury (25,9 % všech substantiv v tomto subkorpusu). Vidíme, že případy (2), (5) a (6) se liší v zaměření, a kdyby nebyly postaveny takto vedle sebe, asi bychom ani nepřemýšleli o tom, že mají něco společného. Právě ve zvolené výzkumné strategii se však shodují -všechny tři jsou průřezovými studiemi. Pracuje se v nich s jednotkami (například lidmi, texty, slovy, žánry apod.), o nichž je známo, že se liší v hodnotách nezávislých proměnných (děti v příkladu (2) se lišily věkem, mluvčí z Hradce Králové v příkladu (5) příslušností ke generaci a sub korpusy v příkladu (6) tím, o jaký žánr se jednalo). Dané jednotky se podrobují výzkumu a zjišťuje se, nakolik se jednotlivé hodnoty oněch jednotek liší v hodnotách závislé proměnné. Pokud se zjistí, že se výrazněji liší, poukazuje to na to, že mezi nezávislou a závislou proměnnou je nějaký vztah. Zásadní je, že analyzované jednotky a rozdíly mezi nimi v hodnotách nezávislé proměnné existovaly již před započetím samotného výzkumu (srov. oproti tomu manipulaci proměnných a náhodné rozdělení do skupin u experimentálního výzkumu). Právě tato skutečnost má zásadní důsledky pro závěry a zobecnění, k nimž je možné na základě průřezové studie dojít. Další podstatnou vlastností běžné průřezové studie je to, že nezachycuje vývoj určitých jevů v čase, ale zaměřuje se na určitý krátký časový interval, v němž výzkum probíhá. U průřezové studie se tak neprovádí předběžné a následné zkoumání, nemáme informace o vývoji jednotlivých zkoumaných jednotek. To samo o sobě neznamená, že by průřezová studie z povahy věci vývojové aspekty zkoumaných jevů ignorovala. Každá z jednotek se sice sleduje jen v určitém časovém bodě. Pokud se však daný výzkum zajímá o vývoj jevů v čase, lze tuto informaci abstrahovat právě srovnáním různých jednotek, které jsou vývojově v jiné fázi. V příkladu (2) se to dělo prostřednictvím srovnání mezi dětmi různého věku, v příkladu (5) pak na základě srovnání výsledků dvou generací. Takové srovnání je možné, často se i děje a poskytuje nám potenciálně cenné informace o vývojových aspektech různých jevů. Je to však zásadně odlišné oproti přístupu, který zkoumá určitou skupinu v průběhu času, jako je tomu například v příkladu (1) výše (viz také Box 3.1: Apparent-time a real-time change v sociolingvistice). Jako každá výzkumná strategie má průřezová studie své výhody i nevýhody. Hlavní výhodou je její jednoduchost a realizovatelnost. Vzhledem k tomu, že se tato strategie zaměřuje jen na určitý časový bod (respektive na určité krátké období, kdy se výzkum provede, přičemž se v tomto období plynutí času zanedbává), lze výzkum uskutečnit poměrně rychle Jelínek, T. (2013). Srovnání žánrů v korpusu na základě syntaktických funkcí substantiv. Korpus - gramatika - axiologie, (8), 3-11 3 Výzkumný postup 20 (obzvláště pokud na to má badatel dostatek prostředků). Relativně efektivně tak lze získat data, která nám umožní docházet k určitým závěrům a zobecněním. Box 3.1: Apparent-time a real-time change v sociolingvistice Jedním z hlavních témat variační sociolingvistiky a souvisejících disciplín je, jakým způsobem se užívání jazyka mění v čase. Z praktického hlediska je to však poněkud problematické. Pokud bychom chtěli zkoumat změnu takzvaně v reálném čase (angl. real-time change), náš výzkum by trval roky až desetiletí. Takové výzkumy skutečně existují, ale jde spíše o určitou shodu náhod než o předem plánované projekty. Může se jednat o výzkum, který analyzuje shodou okolností dostupné materiály, jako je výzkum Jonathana Harringtona et al. (2000), v němž se analyzovaly fonetické proměny projevu královny Alžběty od 50. do 80. let 20. století. Alternativou je pak výzkum, který s časovým odstupem navazuje na výzkum již dříve udělaný, jako je studie Gillian Sankoff a Hélene Blondeau (2007), které srovnávaly výsledky výzkumu zaměřeného na výslovnost /r/ v montrealské francouzštině, přičemž měly k dispozici data z let 1971 a 1984, přičemž část vzorku tvořili identičtí mluvčí. Variační sociolingvistika však vyvinula způsob, jak analyzovat změnu takzvaně ve „zdánlivém čase" (apparent-time change). V takovém případě se vlastně srovnávají různé generace, přičemž se předpokládá, že například mluva dnešních osmdesátníků víceméně odráží to, jak mluvili třicátníci před padesáti lety. Pokud tedy srovnáme to, jak mluví dnešní mladší a starší generace, získáme informace o tom, jakým způsobem probíhá jazyková změna. Pro podrobnější informace o tomto principu viz studii Guye Baileyho et al. (1991). Zatímco pozorování změny v reálném čase je založeno na longitudinál-ním výzkumu, změnu ve zdánlivém čase identifikujeme prostřednictvím průřezové studie. Oba typy výzkumů se však zaměřují na totéž, tedy na to, jak se jazyk vyvíjí v čase. Harrington, J., Palethorpe, S., & Watson, C. I. (2000). Does the Queen speak the Queen's English? Nature, 408(6815), 927-928 Sankoff, G., & Blondeau, H. (2007). Language change across the lifespan:/r/in Montreal French. Language, 560-588 Bailey, G., Wikle, T., Tillery, J., & Sand, L. (1991). The apparent time construct. Language variation and change, 3(3), 241— 264 Problém však je, že závěry a zobecnění založené na průřezových studiích bývají vratké a hrozí, že přesně neodpovídají realitě. Odborně řečeno můžeme říct, že průřezové studie mají vysokou tendenci podléhat různým zkreslením (o zkresleních podrobně v samostatné kapitole). Ukažme si to na následujícím vymyšleném příkladu: (7) Výzkum si kladl za cíl zjistit rozdíly v efektivitě dvou vybraných učebnic českého jazyka pro ZS (učebnice A a učebnice B). Pomocí standardizovaného testu se zkoumaly znalosti češtiny u dvou tříd, kde se po celý rok využívala učebnice A, a dvou jiných tříd, kde se po celý rok využívala učebnice B. Zjistilo se, že třídy, které se učily z učebnice A, měly lepší výsledky než třídy, které se učily z učebnice B. Badatelé tak došli k závěru, že učebnice A je efektivnější a žáci se z ní naučí více, než když budou používat učebnici B. Vypadá to přímočaře. Skupiny se liší jak ve znalosti češtiny (závislá proměnná), tak v tom, jakou učebnici používaly (nezávislá proměnná) - 3 Výzkumný postup 21 nabízí se tedy tyto jevy usouvztažnit. Takové usouvztažnění může být smysluplné a skutečně to může být tak, že učebnice A je prostě lepší a žáci se toho díky ní naučí více. Jisti si tím však být nemůžeme, a to přinejmenším ze tří důvodů: (a) existence vnějších příčin, (b) nejasný směr vztahu a (c) předchozí rozdíly mezi skupinami. Existencí vnějších příčin mám na mysli to, že je ve hře potenciálně celá řada nezávislých proměnných, které výzkum nesleduje. Učebnice jistě není to jediné, co ovlivňuje, nakolik se žák naučí probíranou látku. Skupiny se mohou lišit třeba v tom, kdo je češtinu učí, jakým způsobem se vlastně s učebnicemi pracuje, jaký mají k češtině vztah a jakou mají motivaci se češtinu učit, případně jestli se hodiny češtiny konají hned ráno, nebo až před obědem, kdy jsou žáci unavenější. Takovýchto potenciálních proměnných je možné identifikovat nesčetně. Problém směru vztahu spočívá v tom, zda lze tvrdit, že je předpokládaná nezávislá proměnná skutečně nezávislou a závislá proměnná závislou a není to naopak. V uvedeném příkladě bychom mohli předpokládat, že učebnice mohla být učitelem zvolena třeba kvůli předchozím znalostem studentů. U skupin žáků, kteří měli s češtinou spíše potíže, se využívala učebnice B, zatímco u skupin, které měly v češtině spíše lepší výsledky, se pracovalo s učebnicí A. Zkrátka a dobře, mohlo by to být tak, že rozdíly mezi skupinami byly samy o sobě příčinou volby učebnice, a nikoliv jejím následkem. Podotkněme zde, že problém směru vztahu je s průřezovými studiemi silně spjat, částečně ale závisí na tom, jaké proměnné používáme. Pokud bychom například usouvztažňovali věk a jazykové schopnosti dětí (jako je tomu v příkladu (2) výše), stěží bychom mohli předpokládat, že jazykové schopnosti dětí jsou příčinou toho, kolik je dětem let (a podobně tomu je i u příkladů (5) a (6)). Třetí problém, tedy existence rozdílů mezi skupinami, pak může souviset s problémem směru vztahu (jako jsme si ukázali v předchozím odstavci), není to ale tak vždy. I v případě, že by učebnice byla pro každou skupinu stanovena víceméně nahodile (a nebylo by možné předpokládat, že je volba učebnice důsledkem meziskupinových rozdílů), není vyloučeno, že se skupiny výrazně lišily již před setkáním s danými učebnicemi. Představme si třeba, že žáci využívající učebnici A získali v testu průměrně 75 bodů ze 100, zatímco žáci využívající učebnici B získali průměrně 60 bodů. Rozdíl se zdá být markantní. Otázka však je, jak by se skupiny bývaly lišily ještě předtím, než začaly pracovat s danými učebnicemi. V takovémto předběžném srovnání mohlo vyjít třeba to, že zatímco skupina, která později využívala učebnici A, měla průměrný výsledek 60 bodů, skupina, která později využívala učebnici B, měla 10 bodů - viz tabulka 3.1. Z tabulky 3.1 vidíme, že zatímco ze samotného následného měření se zdá, že učebnice A je efektivnější (mezi žáky používajícími učebnici A a učebnici B je průměrný rozdíl 15 bodů), při zohlednění předběžného zkoumání je tomu právě naopak. Žáci, kteří využívali učebnici A, se za dobu používání této učebnice zlepšili průměrně jen o 15 bodů, zatímco žáci, kteří využívali učebnici B, o celých 50 bodů. Tohle nutně neznamená, že je efektivnější učebnice B - pořád totiž mohou být ve hře nejrůznější vnější proměnné. Poukazuje to ale na to, že závěr, že je efektivnější učebnice A, ke kterému bychom došli prostou průřezovou studií, je velmi sporný. vnější příčina = proměnná, která ovlivňuje zkoumané proměnné, ale sama o sobě není zahrnuta do výzkumu [angl. confound] Tabulka 3.1: Hypotetické výsledky předběžného a následného zkoumání v případě průřezové studie v příkladu (5) pre-test učebnice post- test 60 bodů A 75 bodů 10 bodů B 60 bodů 3 Výzkumný postup 22 Je jasné, že průřezová studie má různá omezení a při vyhodnocování získaných výsledků a při snaze tyto výsledky zobecnit musíme být obzvláště opatrní. U průřezové studie je velmi důležité, aby byla založena na co největším vzorku, díky kterému může být vliv různých vnějších příčin utlumen (byť ne zcela odstraněn). Představme si, že nezkoumáme pouze dvě třídy používající učebnici A a dvě třídy používající učebnici B, ale třeba 30 a 30 tříd. Pokud mezi těmito skupinami průřezovou studií zjistíme výraznější rozdíly, můžeme si být výsledky jistější než ve výzkumu pouhých čtyř tříd. Není to tak, že bychom všechny uvedené problémy průřezové studie automaticky překonali, ale můžeme věřit, že nehrají tak zásadní roli, jako by tomu mohlo být u výsledků pro čtyři třídy. K problematice výběru vzorku se však ještě vrátíme mnohem podrobněji. Přes všechny své nevýhody je průřezová studie v řadě případů jedinou smysluplnou strategií, kterou můžeme zaujmout, chceme-li docházet k širším zobecněním. V lingvistice (zejména v některých jejích subdis-ciplínách, jako je třeba dialektologie) je tak průřezová studie naprosto běžnou a základní výzkumnou strategií. Badatelé si často z časových důvodů nemohou dovolit provádět longitudinální výzkum a zachytit tak reálný vývoj v čase (v příkladu (5) by takový výzkum trval i více než padesát let: nejprve by se otestovala nejmladší generace, pak by se počkalo, až se z ní stane generace nejstarší, a otestovala by se znova). Zároveň v řadě případů není možné manipulovat hodnoty nezávislých proměnných a vytvářet rozdíly mezi skupinami až v průběhu výzkumu, jako se to dělá v experimentech. To platí pro příklady (2), (5) i (6). 3.3 Experimentální výzkum Ve výkladu o průřezových studiích jsme zmínili, že se jednotlivé skupiny, které srovnáváme, mohou lišit i jinak než jenom z toho hlediska, které nás zajímá. Jinými slovy, u průřezových studií nemůžeme nikdy zcela vyloučit vliv různých vnějších příčin. Ideální by byla situace, kdy by se určité skupiny lišily pouze námi zkoumanou nezávislou proměnnou, a nikoliv potenciálními nezávislými proměnnými, které ve výzkumu nezohledňu-jeme. Taková situace je však v praxi téměř vyloučena. Vždycky existují vnější příčiny, které nám výsledky průřezových studií problematizují. Problémy, které jsou spojeny s průřezovými studiemi, experimentální výzkum účinně eliminuje. Vedle příkladu (4) výše si pro ilustraci uveďme ještě jeden další příklad: (8) V jednom výzkumu (Chromý and Dufek, 2012) jsme se zaměřovali na to, jak ovlivňuje hodnocení výroku důvěryhodnost jeho autora Pracovali s pěti fiktivními politickými výroky spojenými se jmény politiků a úkolem účastníků výzkumu bylo vždy uvést, nakolik s výrokem souhlasí, a následně ohodnotit důvěryhodnost daných politiků. Pracovalo se s několika verzemi dotazníku a v každé verzi byl stejný úryvek spojen s jiným jménem politika. Ve výsledcích tak autoři mohli srovnávat hodnocení stejných výroků z hlediska toho, kdo byl uveden jako jejich autor a nakolik byl pro mluvčího důvěryhodný. Chromý,}., & Dufek, O. (2012). Důvěryhodnost politiků jako sociolingvistický fenomén. Naše společnost, 10(1), 29-39 3 Výzkumný postup 23 Slovo experiment je v běžném jazyce používáno ve velmi širokém významu. V odborném smyslu však jde o výzkumnou strategii, která je vymezena dvěma principy: 1. manipulací nezávislých proměnných a 2. využíváním experimentální a kontrolní skupiny. Oba tyto principy jsou oproti průřezovým studiím odlišné. Zatímco v průřezových studiích se zkoumají existující skupiny, o nichž už předem víme, že se liší v určité nezávislé proměnné (případně ve více nezávislých proměnných), v experimentu se rozdíly mezi skupinami vytváří až v rámci výzkumu. V příkladu (4) se děti setkávaly s větami, kde byla použita buď spona v singuláru, anebo spona v plurálu, v příkladu (8) zase účastníci výzkumu četli různé úryvky, které byly připsány různým autorům. Právě tohle je myšleno manipulací nezávislých proměnných -konkrétní zkoumané jednotky jsou kontrolovane vystaveny určité hodnotě nezávislé proměnné. Tím se vytváří různé skupiny, které zkoumáme (typicky se mluví o experimentální a kontrolní skupině). Je přitom důležité, že začlenění do jedné nebo druhé skupiny je náhodné a nemělo by být vedeno nějakým záměrem. Náhodné rozdělení do skupin by mělo zajistit, že jsou si tyto skupiny relativně podobné a neliší se výrazně v různých dalších, nezohledňovaných nezávislých proměnných (srov. i náhodný výběr v kapitole o vzorku a populaci). Pojďme se podívat na jednoduchý příklad, který je z hlediska zaměření podobný jako příklad (7), liší se však právě použitou strategií: manipulace proměnných = kontrolované vystavování zkoumané skupiny jednotek určité hodnotě nezávislé proměnné [angl. manipulation of a variable] experimentální skupina = skupina jednotek, u nichž j e manipulována nezávislá proměnná [angl. experimental group] kontrolní skupina = skupina jednotek, u nichž je nezávislá proměnná manipulována tak, aby její hodnota byla nějak „výchozí" a byla odlišná od hodnoty nezávislé proměnné u experimentální skupiny [angl. control group] (9) Výzkum si kladl za cíl zjistit rozdíly v efektivitě dvou vybraných učebnic českého jazyka pro ZS (učebnice A a učebnice B). Do výzkumu se zapojili žáci čtyř tříd, přičemž v každé třídě byli náhodně rozděleni do dvou skupin - jedna pracovala s učebnicí A a druhá s učebnicí B. Žáci byli otestováni předtím, než začali používat danou učebnici, a poté po roce od začátku používání učebnic. Experiment zjistil, že skupiny, které používaly učebnici A, měly celkově lepší výsledky testů, a autoři výzkumu tak došli k závěru, že učebnice A je efektivnější a žáci se z ní naučí více, než když budou používat učebnici B. V případě (9) máme, stejně jako v případě (7), dvě skupiny, jejichž výsledky srovnáváme. Rozdíl spočívá v tom, že zatímco v příkladu (7) jde o předem existující třídy, v příkladu (9) byly skupiny vytvořeny až v rámci výzkumu a rozdělení do nich bylo náhodné. Podívejme se na hypotetické výsledky v tabulce 3.2. Z tabulky vidíme drobný rozdíl mezi skupinami v pre-testu (tedy v měření, které probíhá před manipulací nezávislé proměnné; též předběžné měření/pozorování). Výše jsme zmínili, že náhodné rozdělení do skupin má z principu tu funkci, aby si skupiny byly přirozeně podobné. To však neznamená, že budou zcela identické - na drobné rozdíly mezi skupinami v experimentu narážíme vlastně vždy (zvláště když zkoumáme omezené množství jednotek). Zároveň zde vidíme rozdíl v post-testu (tedy v měření, které následuje po manipulaci nezávislé proměnné, v tomto případě tedy po roce užívání učebnic; někdy též následné měření/pozorování). Důležité je, že zvolená strategie nám umožňuje minimalizovat riziko vlivu vnějších proměnných, zcela neutralizuje problém směru vztahu (ten je zde jednoznačný) a zároveň Tabulka 3.2: Hypotetické výsledky experimentálního zkoumání v případě průřezové studie v příkladu (9) pre-test učebnice post- test 50 bodů A 77 bodů 54 bodů B 62 bodů předběžné měření/pozorování (pre-test) = měření před provedením manipulace nezávislé proměnné [angl. pre-test] následné měření/pozorování (post-test) = měření po provedení manipulace nezávislé proměnné [angl. post-test] 3 Výzkumný postup 24 pre-testem explicitně zachycujeme předchozí rozdíly mezi skupinami. Zjištěné výsledky jsou tak - ve srovnání s průřezovou studií - poměrně spolehlivé (ačkoliv i u nich narážíme na různá potenciální zkreslení, jak si ještě povíme). Uvedený postup se často označuje jako klasický experiment (srov. třeba Disman, 2002, s. 35). Existují však i jiné experimentální postupy. Velmi často se používá to, co Disman (2002, s. 39) označuje jako následné pozorování na dvou skupinách. Z tohoto označení vyplývá, že se jedná pouze o post-test - účastníci výzkumu jsou náhodně rozděleni do dvou skupin, dochází k manipulaci nezávislé proměnné a následně se měří rozdíly mezi skupinami. Tento postup má pochopitelně oproti klasickému experimentu tu nevýhodu, že stojí na implicitní představě, že v pre-testu by obě skupiny dopadly identicky. V případě velkého vzorku je to opravdu velmi pravděpodobné, ale problém může nastat tehdy, je-li vzorek relativně malý. Naopak výhoda tohoto postupu je snazší realizovatelnost - stačí nám jedno měření místo dvou. Dosud jsme se v této části věnovali případům, kdy byla každá skupina spojena s jednou hodnotou nezávislé proměnné - jedna skupina se učila z učebnice A, druhá z učebnice B. Takovému experimentálnímu postupu se v angličtině říká „between-subject design" (tedy design spočívající ve srovnávání mezi testovanými osobami), přičemž pevně zavedený a široce používaný český ekvivalent, pokud vím, neexistuje. Zde se přikloníme k variantě „mezisubjektový design", která se místy používá. Mezisubjektový design je vcelku běžný postup, v řadě případů však dává smysl používat postup odlišný, který spočívá v tom, že se vlastně pracuje pouze s jednou skupinou a každý účastník výzkumu je vystaven všem hodnotám nezávislé proměnné (resp. nezávislých proměnných). V angličtině se tomu říká „within-subject design" a zde budeme používat překlad „vnitrosubjektový design", na který lze občas narazit. Tento postup může na první pohled působit zvláštně a často si ho ani nejde smysluplně představit - výše uvedený výzkum by stěží mohl fungovat, kdybychom oběma skupinám dávali jak učebnici A, tak učebnici B. Ve skutečnosti jde však o přístup, který často uplatnit lze a přináší výrazné výhody. Vraťme se k příkladu (4) výše. Zkoumaným dětem byly prezentovány věty a měřilo se, kam se v průběhu poslouchání těchto vět dívají (který z obrázků vizuálně preferují). Nezávislou proměnnou zde bylo gramatické číslo slovesa (je/jsou), závislou proměnnou zvolený obrázek. Kdyby se daný experiment přiklonil k mezisubjektovému designu, pracovalo by se se dvěma skupinami dětí, přičemž jedna skupina by dostávala věty se slovesem v plurálu a druhá skupina věty se slovesem v singuláru. To je potenciálně přípustná varianta, má však podstatné nevýhody. Předně můžeme počítat s tím, že se děti v obou skupinách budou různými způsoby lišit. Ačkoliv by rozdělení do skupin bylo náhodné a rozdíly mezi skupinami menší, vliv vnějších proměnných by nebylo možné zcela vyloučit (zvláště pokud bychom neprovedli pre-test). Povaha daného výzkumu však umožňuje vystavit každou zkoumanou jednotku (v tomto případě dítě) oběma hodnotám nezávislé proměnné. Lze si totiž snadno představit, že děti budou v průběhu experimentu poslouchat jak věty se slovesem v singuláru, tak věty se slovesem v plurálu. Například v psycholingvistickém výzkumu se taková strategie uplatňuje běžně. Disman, M. (2002). Jak se vyrábí sociologická znalost. Karolinum mezisubjektový design = experimentální strategie, v níž je každá zkoumaná jednotka vystavena jen jedné hodnotě nezávislé proměnné [angl. between-subject design] vnitrosubjektový design = experimentální strategie, v níž je každá zkoumaná jednotka vystavena všem hodnotám nezávislé proměnné [angl. within-subject design] 3 Výzkumný postup 25 V experimentálním výzkumu vždy pracujeme s určitými položkami (anglicky „items" a česky velice často „itemy"), přičemž každá položka má určité podmínky. V případě výzkumu v příkladu (4) by položka/item vypadala například takto: (a) Kočka (A) Kde jsou tady na obrázku kočky? (B) Kde je tady na obrázku kočka ? Položka/item tedy shrnuje stimuly, které se vzájemně liší hodnotou nezávislé proměnné (případně více nezávislých proměnných). V tomto případě je položka složena ze dvou vět, jedna obsahuje sloveso a podmět v množném čísle, druhá v jednotném. Těmto větám říkáme podmínky -jde vlastně o různé realizace položky (itemu). V tomto případě bychom tak mohli větu (A) nazývat „plurálová podmínka", větu (B) „singulárová podmínka". Důležitou otázku, kterou si musíme v rámci výzkumu klást, je, jestli má být každá položka realizována ve všech hodnotách nezávislé proměnné, anebo ne. Pokud to tak je (jako je tomu v uvedeném příkladu), mluvíme o takzvaném vnitropoložkovém designu. Lze si ovšem představit i odlišný případ: (a) Kočka (A) Kde jsou tady na obrázku kočky? (b) Slon (B) Kde je tady na obrázku slon? V tomto případě je každá položka realizována pouze jednou hodnotou nezávislé proměnné: položka Kočka je v plurálu, zatímco položka Slon je v singuláru. Takovému postupu se v angličtině říká between-items design (česky budeme používat mezipoložkový design). Takovýto postup má zjevné nevýhody, protože reakce na různé položky se mohou lišit nejenom vlivem zkoumaných proměnných. Z toho důvodu je běžnější používat vnitropoložkový design, je-li to z povahy výzkumu možné. Typicky (ale nikoliv nutně) každé zkoumané jednotce prezentujeme jednu z podmínek každé položky. Jak ale zajistit to, aby se každý účastník zároveň setkal se všemi hodnotami nezávislých proměnných a přitom se od každé položky setkal jenom s jednou podmínkou? Snadno - využijeme více itemů a střídáme podmínky, s nimiž se každý účastník setká. Když si tedy představíme, že budeme mít celkově třeba 16 itemů a každý bude mít analogicky dvě podmínky jako příkladový item s kočkami, můžeme každému z účastníků výzkumu prezentovat osm itemů v podmínce (a) a osm itemů v podmínce (b). Tím zajistíme, že se každý účastník výzkumu setká s oběma hodnotami nezávislé proměnné, a to navíc ve více případech. Pokud se rozhodneme pro vnitrosubjektový a zároveň vnitropoložkový design, je naším cílem obvykle to, aby byl každý účastník vystaven stejnému počtu každé z podmínek a abychom v celkových výsledcích měli přibližně stejný počet podmínek od každého z itemů. Toho se obvykle dosahuje dvěma snadnými kroky. Zaprvé je zásadní, aby počet použitých itemů byl násobkem počtu podmínek. Máme-li tedy dvě podmínky jako u itemu výše, stačí, aby byl počet itemů dělitelný dvěma. Pokud jsou podmínky tři, musí být počet itemů dělitelný třemi atd. Zadruhé je důležité, aby od každého itemu byly podmínky jednotlivým item (položka) = soubor jinak identických stimulů, které se liší pouze hodnotami nezávislé proměnné [angl. item] podmínka = jedna z realizací itemu, odpovídá jedné hodnotě nezávislé proměnné [angl. condition] vnitropoložkový design = experimentální postup, v němž je každá položka (item) realizována jako soubor podmínek [angl. within-item design] mezipoložkový design = experimentální postup, v němž je každá položka (item) realizována pouze jednou hodnotou nezávislé proměnné [angl. between-item design] 3 Výzkumný postup 26 účastníkům rozděleny rovnoměrně. Toho se obvykle dosahuje pomocí takzvaného latinského čtverce (viz Box 3.2: Latinský čtverec a vyvažování účastníků výzkumu), díky kterému vytvoříme několik skupin účastníků výzkumu, které se liší v tom, se kterou podmínkou se u kterého z itemů setkají. Box 3.2: Latinský čtverec a vyvažování účastníků výzkumu Jak jsme řekli, ve výzkumu využívajícím vnitrosubjektový design, bychom měli každého účastníka vystavit stejnému počtu každé z podmínek a zároveň chceme, aby jednotlivé podmínky od každého itemu byly ve výsledcích zastoupeny stejnou měrou. Jednou z možností, jak takovéto vyvažování provést, poskytuje takzvaný latinský čtverec. Představme si, že máme dvacet čtyři itemů (č. 1, č. 2 až č. 24) a každý z itemů má čtyři podmínky (podmínky i, ii, iii, iv). Dále máme různé testované osoby (A, B, C, D atd.). Pokud chceme pro vyvažování použít latinský čtverec, přidělíme testované osobě A od itemu 1 podmínku i, od itemu 2 podmínku ii, od itemu 3 podmínku iii, od itemu 4 podmínku iv, od itemu 5 zase podmínku i atd. Testované osobě B přidělíme od itemu 1 podmínku ii, od itemu 2 podmínku iii, od itemu 3 podmínku iv, od itemu 4 podmínku i atd. U testované osoby C začneme u itemu 1 s podmínku iii, u testované osoby D s podmínkou iv. U dalších testovaných osob to je pak analogické: testovaná osoba E pak bude mít stejné rozdělení podmínek jako osoba A, osoba F jako osoba B atd. Schematicky znázorněno je to v tabulce 3.3. latinský čtverec = způsob vyváženého rozdělení itemů a podmínek mezi zkoumané jednotky [angl. latin square design] Tabulka 3.3: Příklad rozdělení podmínek pomocí latinského čtverce. Participanti jsou označeni písmeny abecedy (A, B...), itemy arabskými číslicemi (1,2...) a podmínky římskými číslicemi (i, ii...). A B C D E l:i 1: ii 1: iii l:iv 1: i 2: ii 2: iii 2: iv 2: i 2: ii 3: iii 3: iv 3: i 3: ii 3: iii 4: iv 4: i 4: ii 4: iii 4: iv 5: i 5: ii 5: iii 5: iv 5: i Celkově lze říct, že experimentální zkoumání řeší problémy spojené s průřezovou studií a v řadě výzkumných směrů zaměřených na jazyk a jeho užívání se jedná o základní a běžně využívanou strategii. Je však třeba si uvědomit, že k mnoha výzkumným problémům není možné přistupovat experimentálně, protože z praktických či etických důvodů nemůžeme provádět manipulaci proměnných, respektive vytvářet rozdíly mezi skupinami v průběhu zkoumání. Zároveň je experiment často technicky a časově náročnější než průřezová studie (byť to záleží na zvolené technice sběru dat), což je i důvod, proč je obvykle spojen s menším vzorkem (v řádu desítek osob). Jednou z otázek experimentálního výzkumu tak je především jeho zobecnitelnost na širší populaci, k čemuž se však vrátíme v kapitole o výběru vzorku. 3.4 Longitudinální výzkum Třetí výzkumnou strategií, na kterou se podíváme, je takzvaný longitudinální výzkum. Tato strategie je určena ke zkoumání určitých jevů v reálném čase. Obecným principem longitudinálního výzkumu je provádět výzkum v určitých časových intervalech a zjišťovat vývojové změny či trendy. Oproti průřezové studii, která může na určité vývojové tendence poukazovat třeba prostřednictvím srovnání osob různého věku, longitudinální výzkum nazírá časové proměny přímo. Výše v příkladu (1) jsme si ukázali jednu možnost, jak může longitudinální výzkumu vypadat -badatelé v určitých intervalech nahrávali projevy několika dětí a následně 3 Výzkumný postup 27 analyzovali vývoj jejich jazyka. Nyní se pojďme podívat na další dva příklady: (10) Badatelé zkoumají užívání ej místo ý u mluvčích z Brandýsa nad Labem narozených v 80. letech 20. století. Sondy dělají opakovaně vždy po deseti letech na nově vybraném vzorku 20 lidí (10 žen a 10 mužů). (11) Badatelé zkoumají užívání ej místo ý u obyvatel Brandýsa nad Labem. Sondy dělají opakovaně vždy po deseti letech na nově vybraném vzorku 20 lidí (10 žen a 10 mužů). Příklady (10) a (11) jsou si na první pohled poměrně podobné, v praktických aspektech se však zásadně liší. Zatímco příklad (10) pracuje se skupinou obyvatel, která se v čase výrazně neproměňuje, anebo do ní alespoň nepřibývají další jednotky, v příkladu (11) jde o skupinu obyvatel, která se v čase mění výrazně (lidé se stěhují do Brandýsa, nebo naopak z Brandýsa, rodí se děti, jiní lidé umírají). Zatímco tedy v příkladu (10) vybírají badatelé v každém kole nový vzorek z víceméně stejné skupiny (jejíž velikost se postupně zmenšuje), v příkladu (11) je skupina proměnlivá. Postupu v příkladu (10) se říká „kohortová studie", zatímco v příkladu (11) se jedná o „trendovou studii". Třetí variantou longitudinálního výzkumu pak je „panelová studie", tedy výzkum na identických jedincích, jako tomu je v příkladu (1). Jednotlivé varianty longitudinálního výzkumu mají své výhody a nevýhody. Panelová studie je jasně ideální v tom, že máme informaci o vývoji jednotlivých jednotek, zkoumaný vzorek zůstává stejný a my si můžeme být relativně jisti tím, že naměřené rozdíly u každého mluvčího víceméně odpovídají jeho vývoji. Problém panelových studií však je, že jednotky mohou v průběhu času z výzkumu odpadat. V příkladu (1) se například může stát, že rodiče některého z dětí se po čase rozhodnou s nahráváním skončit, jindy se zase může stát, že se třeba některý účastník výzkumu odstěhuje do zahraničí, změní e-mailovou adresu, a přestane tím pádem být pro badatele dostupný apod. Úbytek vzorku je u panelových studií běžný a může být i velmi výrazný (viz Box 3.3: Longitudinální výzkum synestézie). Výzkum tím může být i velmi negativně poznamenán. kohortová studie = typ longitudinálního výzkumu, ve kterém se v intervalech zkoumá identická populace, ale vždy se vybírá nový vzorek [angl. cohort study] trendová studie = typ longitudinálního výzkumu založený na zkoumání určité populace, která se v čase proměňuje [angl. trend study] panelová studie = typ longitudinálního výzkumu založený na zkoumání identického vzorku v průběhu času [angl. panel study] Box 3.3: Longitudinální výzkum synestézie V letech 2015-2017 jsme provedli longitudinální panelovou studii synestézie grafémy-barvy (viz Chromý et al., 2019). Osoby s tímto typem synestézie si automaticky asociují barvy s písmeny a/nebo číslicemi (například písmeno A je pro ně červené, číslo 2 modré apod.). Kladli jsme si otázku, zda jsou tyto asociace mezi grafémy a barvami dlouhodobě stálé, konzistentní (jak se tvrdí v literatuře), anebo se v průběhu času proměňují. Celkově jsme provedli tři měření: na podzim 2015, na jaře 2016 a na přelomu roku 2016/2017. V prvním kole výzkumu jsme pracovali se vzorkem 42 osob, druhého kola se však zúčastnilo pouze 28 osob, a to přesto, že jsme za účast platili a že jsme k účasti vyzývali opakovaně pomocí e-mailu. Třetího kola se pak zúčastnilo 27 lidí. Jinými slovy, v průběhu cca roku a půl z tohoto panelového výzkumu odpadlo 15 osob ze 42, tedy zhruba Chromý, ]., Borůvková, M., Malá, L., & Sudzinová, T. (2019). Long-term versus short-term consistency in the grapheme-colour synaesthesia: Grapheme-colour pairings can change in adulthood. Attention, Perception, & Psy-chophysics, 81(6), 1805-1812 3 Výzkumný postup 28 35 % účastníků. S takovou situací jsme předem počítali a naše původní představa byla získat data od zhruba 30 lidí, což se povedlo. Ilustruje to však jeden z největších problémů panelových studií - po určitém čase se nám může stát, že nebudeme mít koho zkoumat. Kohortová studie je panelové studii v něčem podobná, protože skupina, která badatele zajímá, zůstává po celou dobu výzkumu prakticky stejná. Mění se pouze vzorek jedinců, kteří jsou v konkrétních kolech podrobováni výzkumu. Oproti panelovému šetření je to zjevně nevýhodné v tom, že nezachycujeme rozdíly mezi identickými jedinci a spoléháme na zobecnění pro širší skupinu jako takovou. Na druhou stranu nás zde nemusí tolik znervózňovat možnost, že se některé jednotky nebudou chtít výzkumu účastnit (do vzorku si můžeme vybrat někoho náhradního). Trendová studie se od předchozích dvou variant liší v tom, že se zaměřuje na skupinu jednotek, jejíž složení je v čase výrazně proměnlivé. Jak tedy název odpovídá, sledují se určité obecné trendy (například jak se s časem mění užívání ý vs. ej v Brandýse nad Labem). Trendová studie vlastně představuje v určitém intervalu opakovanou průřezovou studii. 3.5 Případová studie Čtvrtou strategií, kterou jsme zmínili na začátku této kapitoly, je takzvaná případová studie a ilustrovali jsme ji příkladem (3), kdy badatel zkoumal pomocí rodičovského deníku a nahrávání jazykový vývoj vlastního dítěte. Uveďme si ještě jeden další příklad. (12) Devyani Sharma (2018) zkoumala jazykové chování indicko-amerického politického komentátora a novináře Fareeda Zakarii, přičemž se zaměřovala na období mezi lety 2003-2012 a analyzovala nahrávky jeho projevů směřované k americkému, respektive indickému publiku. Sharma ukázala, že Zakaria aktivně uzpůsoboval výslovnost určitých samohlásek a souhlásek v závislosti na publiku (indickému, respektive americkému). Zároveň se však ukázalo, že v situacích snížené pozornosti k řeči docházelo u Zakarii k posunu k jeho dominantnímu stylu výslovnosti (blízkého indické angličtině) nezávisle na publiku. případová studie = výzkumná strategie založená na zkoumání jedné jednotky (nebo několika málo jednotek), a to obvykle do velkého detailu [angl. case study] Sharma, D. (2018). Style dominance: Attention, audience, and the 'real me'. Language in Society, 47(1), 1-31 Případová studie představuje strategii, která je poměrně specifická v tom, že pracuje s jednou jednotkou (případně několika málo jednotkami) a obvykle se u této jednotky pokouší o poměrně detailní rozbor sledovaných jevů. Takové studie nemají potenciál pro široké zobecnění svých závěrů (často třeba ani nevyužívají kvantitativní metody popisu dat), mohou nám však poměrně dobře sloužit k rozvíjení teorií a hypotéz pro siřeji zaměřené případové či longitudinální studie nebo experimenty. Hypotetický výzkum v příkladu (3) může být velmi přínosný zejména v jazycích, kde není průběh osvojování dostatečně popsán a chybí i datové zdroje (korpusy), z nichž by bylo možné pro popis průběhu osvojování vycházet. Naopak studie v příkladu (12) zase popisuje velmi specifický příklad bidialektálního mluvčího, který ve svých mediálních vystoupeních běžně používá jak americkou, tak indickou angličtinu, a jehož nahrávky jsou vcelku snadno k dispozici. Jedním z obvyklých důvodů, proč se přiklonit k případové studii, je tak omezený přístup k širší skupině nějak specifických jednotek, které nás v našem výzkumu zajímají. Zatímco třeba provést výzkum s větším vzorkem typicky se vyvíjejících dětí může být náročné, avšak realizovatelné, provádět výzkum s dětmi se vzácnou vývojovou poruchou může narážet na praktické problémy, jak se k takovým dětem dostat. Případová studie tedy může vytvářet určitý rámec pro budoucí širší výzkum, může přicházet se zjištěními, která má smysl následně ověřovat na dalších jednotkách. Je třeba podotknout, že případová studie se nemusí týkat jen jednotek ve smyslu konkrétních osob. Zkoumaná jednotka může mít širší povahu, může se například jednat o určitou třídu, která nás zajímá z hlediska jazykové interakce učitel-žáci, může jít o nějakou instituci (třeba nadnárodní firmu, kde se zkoumají preference užívání určitých jazyků), nebo nějaké místo (třeba etnicky a jazykově smíšenou vesnici, ve které dochází k přepínání kódů). To poukazuje na skutečnost, že případová studie není z principu nějakou snazší a omezenější alternativou výše uvedených tří strategií. Pokud je prováděna solidně, jedná se o komplexní a náročný výzkum, na němž badatel stráví poměrně hodně času. Užitečné je rovněž provádět případové studie jako součást nějakého dlouhodobějšího plánu a následně jednotlivé případové studie realizované pomocí identické metodologie skládat dohromady do širšího celku. Taková praxe je ideální zejména pro studentské závěrečné práce - stanoví-li se určitá výzkumná metodologie a jednotliví studenti ve svých bakalářských či diplomových pracích na základě této metodologie v průběhu času provádí případové studie, vznikne poměrně bohatý zdroj podrobných informací o širším vzorku jednotek. 3.6 Kombinace strategií Na závěr této kapitoly připomeňme to, co jsme zmínili již na začátku, totiž že uvedené čtyři strategie představují určité typy a v konkrétních případech mohou být různě modifikovány a specifikovány. Zároveň je zcela zásadní, jakou techniku sběru dat badatelé v rámci určité strategie využívají, což pochopitelně ovlivňuje řadu praktických aspektů celého výzkumu - od jeho praktické realizovatelnosti přes časovou náročnost až třeba po finanční stránku výzkumu. Jak jsme viděli, každá strategie má určité výhody a nevýhody. U některých výzkumných otázek je uplatnění některých strategií nevhodné, nebo dokonce nemožné, naopak jiné výzkumné otázky jsou v tomto ohledu relativně tvárné. Důležité je mimo jiné to, že se různé strategie dají v konkrétních výzkumných projektech různě kombinovat. Například je možné udělat určitou průřezovou studii a na základě získaných poznatků provést navazující experimentální zkoumání. Můžeme realizovat longitudinální výzkum, který bude založen experimentálně apod. V kombinaci strategií může spočívat poměrně velká síla - můžeme tak totiž využít výhody různých strategií, a naopak neutralizovat jejich nevýhody (viz shrnutí v tabulce 3.4). 3 Výzkumný postup 30 Tabulka 3.4: Výhody a nevýhody jednotlivých výzkumných strategií. výzkumná strategie výhody nevýhody průřezová studie jednoduchost a realizovatelnost vratkost závěrů (zkreslení) vnější příčiny problém směru vztahu nelze použít vždy technická a časová náročnost experimentální výzkum kontrola nad proměnnými nízké riziko vnějších příčin sledování změn v reálném čase longitudinální výzkum časově extrémně náročné komplikace se vzorkem nezobecnitelnost případová studie rámec pro další výzkum 3.7 Otázky na přemýšlení Podívejte se na nějakou empiricky založenou lingvistickou studii, kterou jste nedávno četli. Zkuste odpovědět na tyto otázky: 1. Jakou výzkumnou strategii autoři výzkumu zvolili? Proč? 2. Bylo by možné daný výzkum realizovat jinou výzkumnou strategií? Pokud ano, jak by to vypadalo? Pokud ne, proč by to nešlo? 3. Pokud se jednalo o experimentální výzkum, používal se mezisub-jektový, anebo vnitrosubjektový design? 4. Jaké slabiny tato studie má vzhledem k tomu, jaká výzkumná strategie v ní byla použita? Sběr dat Techniky sběru dat a dotazník V předchozí kapitole jsme si představili různé výzkumné strategie (designy), které lze ve výzkumu uplatňovat. Volba výzkumné strategie je jedním ze tří klíčových rozhodnutí, která provádíme, abychom mohli ověřovat své hypotézy. Další rozhodnutí spočívají ve výběru vzorku a ve stanovení techniky sběru dat (tj. „metody" v užším slova smyslu). Důležité je, že tyto tři kroky jsou vzájemně úzce spjaty a je vždy třeba je promýšlet společně. V této učebnici si je z praktických důvodů představíme samostatně - je však důležité mít na paměti, že to, jakou použijeme techniku sběru dat, nemá smysl promýšlet, aniž bychom vzali v potaz, jaká je pro naše účely vhodná výzkumná strategie a jaký vzorek máme či můžeme mít k dispozici. V předchozím výkladu jsme si vymezili čtyři základní výzkumné strategie - průřezovou studii, experiment, longitudinální výzkum a případovou studii. Řekli jsme si, že jsou to určité typy a že v konkrétních případech mohou být modifikovány, anebo vzájemně propojovány. Víceméně však šlo o celistvý přehled. V případě technik sběru dat je ale takový přehled prakticky vyloučený - jednotlivých metod v užším slova smyslu je v různých subdisciplínách, které se zabývají jazykem a jeho užíváním, nepřeberné množství. Zde se tak pokusíme vymezit určité obecnější množiny metod a poukážeme na jejich silné a slabé stránky. Zároveň si představíme některé hojně využívané metody. Na řadu technik se podrobněji nedostane - čtenářům však alespoň nabídnu odkazy na vhodnou výchozí literaturu k nim. 4.1 Techniky sběru dat a výzkumné strategie . . . 4.2 Jak vypadá dotazník . . Základní prvky dotazníku Otázky v dotazníku . . . 4.3 Přímé a nepřímé techniky 4.4 Hodnocení přijatelnosti . 4.5 Elicitace jazykových dat . 4.6 Otázky na přemýšlení . . 32 33 34 36 40 42 44 45 4.1 Techniky sběru dat a výzkumné strategie Jak spolu souvisí techniky sběru dat a výzkumné strategie? V určitém smyslu volně. Například dotazník, tedy běžně používanou techniku, se kterou máme všichni nějakou zkušenost, je možné využít ve všech čtyřech výzkumných strategiích. Podívejme se na tři modelové příklady: (1) V dotazníkovém výzkumu se zkoumají postoje studentů posledních dvou ročníků středních škol k různým jevům obecné češtiny (ej místo ý, z místo é, protetické v-, minulé příčestí typu tisk/ tisknul, spad/spadnul apod.). (2) Badatelé se zaměřují na to, zda slovosled ovlivňuje přijatelnost vět v češtině. Jako podněty použijí 40 itemů, přičemž každá věta má dvě varianty: OVS (např. Zkušeného kuchaře si do své restaurace přivedl velkorysý podnikatel.) a SVO (např. Velkorysý podnikatel si do své restaurace přivedl zkušeného kuchaře.). Pro hodnocení se používá škála vymezená póly zcela přijatelná věta a zcela nepřijatelná věta. Celý dotazník je online a účastníkům výzkumu se z každé 4 Techniky sběru dat a dotazník 33 dvojice variant vždycky prezentuje jen jedna, a to tak, aby celkově ohodnotili 20 vět OVS a 20 vět SVO. (3) Badatel zkoumá mluvčí, která aktivně ovládá 13 jazyků. Snaží se zjistit, co jí při učení se jazykům pomáhá. Kombinuje při tom různé techniky. Jednou z nich jsou standardizované dotazníky, prostřednictvím kterých se na základě sebehodnocení určuje hodnota proměnné míra znalosti jazyka. Tyto dotazníky mají pomoci stanovit, na jaké úrovni daná mluvčí jednotlivé jazyky ovládá. Uvedené tři příklady ukazují, že je možné dotazník využít pro účely průřezové studie (1), experimentálního výzkumu (2) a případové studie (3). Zároveň je pochopitelně možné dotazník využít i pro longitudinální výzkum - stačí si třeba představit, že výzkum v příkladu (1) budeme vícekrát opakovat v určitém intervalu (třeba pěti let) a budeme tak docházet k určitým vývojovým trendům. Dotazník je tedy technikou, kterou můžeme poměrně snadno využívat v nejrůznějších strategiích. Na druhou stranu je zřejmé, že pro jisté výzkumné strategie je obecně vhodnější a pro jiné méně. Případová studie jde typicky do větší hloubky, než je možné a účelné zachycovat dotazníkem (ostatně v případu (3) sloužily dotazníky jenom jako jedna z použitých metod). V experimentálním výzkumu je dotazník běžně využíván jako způsob zjišťování hodnot určitých nemanipulovaných nezávislých proměnných (demografické charakteristiky jako věk, pohlaví, vzdělání atd.), lze ho však využít i při samotné manipulaci hodnot nezávislé proměnné, jak ukazuje příklad (2). U longitudinálního výzkumu přichází v úvahu vcelku dobře (záleží pochopitelně na cílech výzkumu) a nejpřirozenější je využití dotazníku u průřezových studií. Dotazník je každopádně poměrně tvárná technika, zejména pro svou uchopitelnost. Jiné techniky jsou s určitými strategiemi spjaty mnohem pevněji. Například sledování očních pohybů při čtení je typicky spjato s experimentálním výzkumem. V ostatních strategiích ho lze uplatnit rovněž, je to však z různých důvodů spíše omezeně využívaná možnost. Důvod, proč většina technik lne k některým výzkumným strategiím, a naopak je spíše málo využívaná pro jiné strategie, spočívá v tom, že každá technika sběru dat má své výhody a nevýhody. Ty mohou být ryze praktického rázu (snadná, nebo naopak obtížná realizovatelnost, finanční náročnost, nutnost využití určitých přístrojů apod.), mohou však být motivovány i tím, jaké jsou ve výzkumu testovány hypotézy. Jak jsem poznamenal v úvodu této kapitoly, vymezíme si zde určité množiny technik sběru dat (metod v užším slova smyslu) a podíváme se na jejich výhody a nevýhody. Pro tyto účely si pracovně vypůjčíme rozlišení na dotazníky, rozhovory, pozorování a analýzu dokumentů (Disman, 2002), přičemž v této kapitole se budeme dále věnovat dotazníkům a v příštích kapitolách pak ostatním technikám. 4.2 Jak vypadá dotazník Dotazník je natolik rozšířená technika sběru dat, že se s ní ve svém životě setkal každý z nás. Používá se pro jednoduché průzkumy s pár otázkami, Disman, M. (2002). Jak se vyrábí sociologická znalost. Karolinum 4 Techniky sběru dat a dotazník 34 ale i pro komplexní výzkumné projekty, kdy vyplnění dotazníku zabere i více než hodinu času. Obeznámenost lidí s touto technikou je užitečná pro výuku empirických metod, protože právě na dotaznících se dá srozumitelně ukazovat spousta problémů, na které v empirickém (a nejen dotazníkovém) výzkumu narážíme. Zároveň to s sebou nese riziko podcenění. Skutečnost, že se většina lidí setkala během svého života s relativně velkým množstvím dotazníků a že formálně je dotazník prostě souborem otázek a nabízených způsobů odpovědi, vyvolává intuitivní představu, že udělat dotazníkový výzkum je snadné a bezproblémové. To je ale fatální omyl - vytvořit dotazník, který je funkční a umožní nám skutečně dobře ověřovat naše hypotézy, je poměrně náročný úkol. Narážíme zde totiž na řadu potenciálních problémů. Než se však podíváme na to, o jaké problémy typicky jde a jak je můžeme řešit, řekněme si, jaké existují důvody pro použití dotazníku. Jsou přinejmenším tři. 1. Nízké náklady. Dotazníkový výzkum spojen s relativně nízkými náklady na realizaci (zejména ve srovnání s jinými technikami). Tento fakt je v dnešní době ještě umocněn tím, že dotazníkový výzkum lze snadno realizovat online, což jednak minimalizuje čas, který musí badatel či jeho tým strávit rozdáváním a sbíráním dotazníků, jednak to extrémně zefektivňuje následné zpracování dat, protože není nutné dotazníky přepisovat, snažit se porozumět nesrozumitelnému písmu apod. 2. Rychlý sběr dat. Dotazník umožňuje relativně rychle nasbírat data, a to zejména v případě, že zkoumáme skupiny lidí, kterým je možné administrovat dotazník hromadně (například studenty, osoby z různých zájmových spolků, osoby dobře dostupné přes internet, rodiče malých dětí apod.). 3. Anonymita. Dotazníkový výzkum je relativně přesvědčivě anonymní (pokud tomu tedy nebrání naše potřeba zachytit určité osobní údaje, například kvůli následnému kontaktování osob v longitu-dinálním výzkumu), což je výhodné, protože respondenti nemusí dlouze zvažovat, zda jim účast ve výzkumu potenciálně nezpůsobí nějaké potíže. Základní prvky dotazníku Při sestavování dotazníku je potřeba věnovat pozornost čtyřem věcem: grafické podobě dotazníku, jeho rozsahu, instrukcím a otázkám (včetně nabízených odpovědí). Zní to intuitivně, ale v praxi můžeme narazit na velké množství dotazníků, jejichž autoři přinejmenším jeden z těchto aspektů výrazně podcenili a tím vlastně celý svůj výzkum znevěrohodnili. Co se týče rozsahu, je pochopitelné, že dotazník nemůže být přehnaně dlouhý, a to zejména tehdy, nemáme-li pro respondenty žádnou odměnu (anebo jiný způsob motivace). Právě tohle je hlavní důvod, proč je sestavení dotazníku tak náročné - máme jen relativně malou plochu na to, abychom zjistili vše, co potřebujeme k adekvátnímu ověření našich hypotéz. Obecné pravidlo stanovující délku dotazníku neexistuje. Dává však smysl zvažovat nikoliv samotný počet otázek, ale spíše dobu, kterou respondent potřebuje pro jeho vyplnění, přičemž vhodné je řídit se spíše tím, kolik času na vyplnění potřebují pomalí respondenti. Pokud respondentům nejprve řekneme, že to nebude trvat déle než deset minut, 4 Techniky sběru dat a dotazník 35 ale někteří budou po deseti minutách v polovině, budou rozladěni a negativně se to promítne na kvalitě jejich odpovědí nebo na návratnosti (část respondentů výzkum nedokončí). Záležet bychom si měli dát na grafické podobě dotazníku, protože to může zvýšit ochotu respondentů věnovat nám trochu času. A pokud vypadá dotazník neprofesionálne, je pravděpodobné, že nám ho nevěnují, anebo vyplnění dotazníku odbudou. Grafická podoba dotazníku tak může pomoci zvýšit celkovou důvěryhodnost našeho výzkumu. Je proto vhodné, aby byl dotazník spíše vzdušný a otázky byly na papíře či na obrazovce rozmístěny volněji (to může vyvolávat i pozitivní subjektivní představu, že jde vyplňování rychle), aby byl použit dobře čitelný font a velikost písma (je třeba počítat s tím, že někteří mluvčí budou mít jisté potíže se zrakem a malé písmo jim může dělat potíže), výhodou bývá použití loga instituce, která výzkum zaštiťuje. V online dotaznících lze navíc mezi jednotlivé části dotazníku vkládat i různé graficky zpracované povzbuzující zprávy („Jde vám to dobře!", „Už je to skoro hotové!" apod.), které mohou zvyšovat uvadající motivaci výzkum dokončit. Grafickou podobu dotazníku je jistě vhodné zvažovat i s ohledem na adekvátnost pro sociální skupinu, na niž se výzkum zaměřuje. Na dotazníku se velmi často podceňuje podoba instrukcí. Ty jsou v podstatě dvojího typu. Úvodní instrukce slouží jako obecné informace o výzkumu pro respondenty a mají také persvazivní funkci, snaží se přesvědčit respondenty, aby se výzkumu zúčastnili. V úvodních instrukcích by nikdy neměly chybět následující informace: (a) kdo výzkum realizuje (osoba i instituce, ideálně včetně kontaktu), (b) jaký je cíl výzkumu (to nemusí být příliš detailní, aby to neovlivnilo následné odpovědi), (c) jakým způsobem se bude pracovat s daty a kdo k nim bude mít přístup (zejména u výzkumu, který není plně anonymní), (d) informace o anonymitě, respektive potřebě jejího porušení. Dále mohou úvodní instrukce obsahovat různé další informace, jako například to, že neexistují správné a špatné odpovědi (pokud je to v daném případě pravda), informace o způsobu sběru dotazníků (zejména v případě dotazníků distribuovaných prostřednictvím pošty), informace o tom, jak se případně dostat k výsledkům výzkumu, apod. V některých případech (například ve výzkumu využívajícím hodnocení přijatelnosti) může dávat smysl v instrukcích uvést i příklady otázek, aby respondenti pochopili, co se po nich přesně chce. Příklad úvodních instrukcí viz Box 4.1: Úvodní instrukce v dotazníku použitého ve výzkumu důvěryhodnosti politiků (Chromý and Dufek, 2012). Box 4.1: Úvodní instrukce v dotazníku použitého ve výzkumu důvěryhodnosti politiků (Chromý and Dufek, 2012) Milé studentky, milí studenti, rádi bychom Vás poprosili o vyplnění následujícího dotazníku, který vznikl jako součást realizace výzkumného projektu v rámci vnitřních grantů na Filozofické fakultě Univerzity Karlovy v Praze. Chromý,}., & Dufek, O. (2012). Důvěryhodnost politiků jako sociolingvistický fenomén. Naše společnost, 10(1), 29-39 4 Techniky sběru dat a dotazník 36 Výzkum je věnován problematice proměn hodnocení politických výroků. Obsahuje celkově 8 krátkých projevů českých politiků. Vaším úkolem bude odpovědět na 2 otázky u každého výroku, a to zcela na základě Vašeho osobního hodnocení. Jinými slovy, neexistují špatné ani správné odpovědi - záleží pouze na Vás. Vyplnění dotazníku je dobrovolné. Nechcete-li, nemusíte se výzkumu účastnit. Výzkum je plně anonymní. Nikde nebude uváděno, kdo se výzkumu zúčastnil. Pokud by Vás dotazník zaujal a chtěli byste se seznámit s výsledky celého výzkumu, kontaktujte nás na adrese . Tuto stranu si můžete nechat. Děkujeme za Vaši ochotu se výzkumu zúčastnit! Otázky v dotazníku Vedle úvodních instrukcí jsou důležité také instrukce k jednotlivým otázkám. Ty pochopitelně nemusí být všude, ale je třeba brát v úvahu, že kreativita respondentů při odpovídání na otázky je často překvapivá (zejména v případě, že je dotazník papírový), což posléze může výrazně znesnadnit přepis a vyhodnocení výsledků. Zkrátka a dobře bývá vhodné uvést u instrukcí k jednotlivým otázkám i informace, které považujeme za samozřejmé (včetně toho, že se třeba zaškrtává jenjedna, nebo naopak více možných odpovědí, jakým způsobem se má vyznačit zvolená odpověď atd.). Nejsložitější na dotazníku je však pochopitelně formulovat otázky, navrhnout možnosti odpovědí a vybrat, které z těchto otázek v dotazníku nakonec budou. Otázky v dotazníku mohou mít různorodou povahu. Podívejme se na několik příkladů: (4) Jaký je váš názor na konstrukci Najíst se tam nenajíme? (5) Ohodnoťte následující konstrukci na uvedené škále: Najíst se tam nenajíme. zcela nepřijatelná □ □ □ □ □ zcela přijatelná (6) Je pro Vás následující konstrukce přijatelná v běžném hovoru? Najíst se tam nenajíme. ano - ne Příklady (4)-(6) se všechny zaměřují na hodnocení konstrukce Najíst se tam nenajíme, která je zajímavá v tom, že ji někteří mluvčí češtiny zcela odmítají jako negramatickou, zatímco jiní ji běžně používají, přičemž tento rozdíl je patrně daný regionálně. Příklad (4) má formu takzvané otevřené otázky, tedy otázky, která má volnou možnost odpovědi, zatímco příklady (5) a (6) jsou takzvané uzavřené otázky, tedy otázky, u nichž respondenti volí z nabízených možností odpovědi. Otevřené otázky jsou sice potenciálně výhodné v tom, že respondent má možnost odpovědět svými slovy, není svazován nabídkou a může napsat podrobně, co si skutečně myslí. Problém ale je, že respondenti to nedělají a otevřené otevřená otázka = otázka bez nabízené možnosti odpovědi; umožňuje respondentům volně se vyjádřit [angl. open-ended questions] uzavřená otázka = otázka, která respondentům nabízí možnosti odpovědi [angl. closed-ended questions] 4 Techniky sběru dat a dotazník 37 otázky v dotazníku jsou jim obvykle spíše na obtíž. Obvyklá odpověď na otevřenou otázku má délku jen několik málo slov, takže obecně není vhodné otevřenou formu otázky využívat pro klíčové části dotazníku. Kromě toho však nastává problém i v případě, že respondent skutečně napíše podrobné vyjádření. Není totiž snadné a přímočaré takové výsledky zobecňovat. Představme si třeba, že by jedna respondentka odpověděla „s touto konstrukcí jsem se nikdy nesetkala, působí zvláštně a nejsem si jistá, jestli jí rozumím" a jiná respondentka napsala „divná, ne moc srozumitelná věta, mám pocit, že jsem něco takového někde slyšela, ale nevím, kdy a kde přesně". Jedná se pouze o dvě respondentky (přičemž u dotazníkového výzkumu se počet respondentů pohybuje obvykle přinejmenším v desítkách), ale už tady narážíme na problém zobecnění - myslí si respondentky víceméně totéž, nebo ne? Máme zařadit jejich odpovědi do stejné kategorie, nebo ne? Odpovědi na tyto otázky nejsou snadné a patrně by bylo těžké najít v tom nějakou obecnou shodu. Z těchto důvodů mají otevřené otázky smysl spíše doplňkově, pro případné vysvětlení nějakých předchozích odpovědí, které měly formu výběru z nabízených možností, a pak pro dotazování na věci, které mají z podstaty omezené a jasné možnosti odpovědí (věk, obor studia, mateřský jazyk apod.). Uzavřených otázek je několik obecných typů podle toho, jaké možnosti odpovědi jsou nabízeny: (a) výběr z více možností (b) škála (c) řazení odpovědí Výběr z více možností může mít různé varianty - od volby ano-ne až k výběru z většího množství různých možností, přičemž počet zvolených možností může být limitován (typicky na jednu, ale v některých případech i na více). V angličtině se v tomto ohledu někdy rozlišuje mezi multiple-choice question (jedna možnost volby) a checklist (možnost zaškrtnout vše, co pro daného respondenta platí). U výběru z více možností je badatel vždy vystaven potenciálnímu riziku, že se najde respondent, jenž v nabídce nenajde přiléhavou odpověď (což je velká chyba na straně autora dotazníku). I z těchto důvodů bývá vhodné nabídnout i odpověď „Jiné" s otevřenou možností napsat, o co se jedná. Využití škál v dotaznících má dlouhou tradici a má řadu výhod. Skály se poměrně dobře vyhodnocují a dají se vcelku snadno využít pro nejrůznější výzkumné účely. Na dobře vytvořené škále je respondent schopen relativně přesně zaznamenat svůj postoj, názor či přesvědčení a respondenti jsou na využití škál vcelku zvyklí. Ve výzkumech zaměřených na jazyk a jeho užívání se často používají dva typy škál - viz následující příklady: (7) Prostřednictvím následující škály uveďte míru vašeho souhlasu s tvrzením: Pokud jsou rodné jazyky rodičů různé, měli by na děti mluvit každý svým jazykem. zcela nesouhlasím □ □ □ □ □ zcela souhlasím (8) Nakolik by podle Vás měli rodiče s různými rodnými jazyky používat své jazyky v hovoru se svými dětmi? Odpovězte pomocí výběr z více možností = typ nabízené odpovědi na uzavřené otázky, jenž představuje několik kategoriálně rozdílných variant odpovědi, z nichž respondent typicky vybírá jednu [angl. multiple choice item] škála = typ nabízené odpovědi na uzavřené otázky, jenž představuje varianty odpovědí uspořádané na určitém kontinuu [angl. scale] řazení odpovědí = typ nabízené odpovědi spočívající v tom, že respondenti mají seřadit určité položky podle nějakého kritéria [angl. rank order question] 4 Techniky sběru dat a dotazník 38 škály od 1 {vůbec neměli, měli by se dohodnout na jednom jazyce) do 10 {za všech okolností měli). Příklad (7) představuje standardní verzi takzvané Likertovy škály (vyslovujeme /likrtova/, někdy se ale lze setkat i s výslovností /lajkrtova/). Tato škála ve své standardní verzi vyjadřuje míru souhlasu s určitým tvrzením (viz ale Box 4.2). Typicky bývá pětistupňová, anebo sedmistupňová. Lze ji využít rovněž ve formě takzvané „nucené volby", kdy se vyloučí střední, neutrální stupeň, a respondent je tedy nucen přiklonit se buď na stranu souhlasu, nebo nesouhlasu. Taková možnost je spíše problematická, protože je možné, že respondent reálně nemá na věc silný názor, nedokáže se rozhodnout apod. Naopak potenciální výhoda je, že nucená volba nutí respondenta otázku dobře promyslet a nenabízí mu „únikovou cestu" v podobě neutrální odpovědi. V každém případě je nucená volba něčím, co je vhodné volit v odůvodněných případech (například když víme, že neutrální odpověď volí příliš mnoho respondentů) a na co je vhodné zaměřit pozornost při pilotování dotazníku (viz ještě dále část 12.4 Odhalování chyb, s. 121). Označení Likertova škála (případně anglické Likert-type scale) se používá i pro jiný typ odpovědí než míru souhlasu. Ve výzkumech využívajících hodnocení přijatelnosti se typicky používá škála vymezená póly zcela nepřijatelná - zcela přijatelná (věta), jako jsme viděli v příkladech (5) a (7) výše. Jedná se o typický příklad toho, co by se nazývalo Likert-type scale. Likertova škála = typ škály, který je pro-totypicky vyjadřování mírou souhlasu s tvrzením [angl. Likert scale] nucená volba = varianta škály, která nezahrnuje neutrální stupeň odpovědi, a respondenty tak nutí odpovědět buď pozitivně, nebo negativně [angl. forced-choice] Box 4.2: Likertova škála aneb jak se vyvíjí termíny Likertovu škálu jsme si zde vymezili jako jeden z typů otázek, který můžeme použít ve výzkumu, a který spočívá v tom, že účastníci výzkumu uvádí, nakolik souhlasí s daným tvrzením. Tento termín se takto běžně používá a každý, kdo se orientuje v empirickém výzkumu jazyka a jeho užívání, tomuto termínu takto rozumí. Z hlediska vývoje terminologie je nicméně zajímavé, že původní význam Likertovy škály je poněkud odlišný. Sám Likert (1932) totiž Likert, R. (1932). A techniquefor the mea- svou škálu nechápal jako formát otázky, ale jako souhrnný způsob surement ofathtudes. měření určitého jevu. Skála spočívala v součtu odpovědí na určité množství otázek zaměřených na určitý jev. Ve své knize například uvádí škálu internacionalismu, která zahrnuje 24 otázek, z nichž 9 využívá jako odpověď míru souhlasu s tvrzením, 3 jsou založeny na výběru z více možností a 12 otázek spočívá v možnosti odpovědi ano - ne - nevím. Každá z nabízených odpovědí je spojena s určitým počtem bodů a celkový součet představuje míru internacionalismu dané osoby. Postupem času se však pojem Likertova škála zúžil na formát otázek, který se pro dané účely obvykle používaly (tedy souhlas s tvrzením). Na původní chápání Likertovy škály lze někdy narazit i v současnosti, a to zejména v sociologii. Příklad (8) má k Likertově škále rovněž velmi blízko. Jde vlastně o škálu, která využívá pro vyjádření určité míry číslo (v tomto případě stupnici 1-10). Skálu tohoto typu dobře známe z našeho každodenního života: například hodnocení spokojenosti s nákupem v eshopu, hodnocení restaurace pomocí hvězdiček, hodnocení filmu na internetovém portálu 4 Techniky sběru dat a dotazník 39 apod. V těchto situacích se často používá kratší škála od 1 do 5, případně se místo čísel používají třeba hvězdičky či body. Ve všech případech však Nakolik jste spokojeni s touto učebnicí? jde o vyčíslení určité míry (spokojenosti, pociťované kvality, přesvědčení ***** apod.). Tento typ škály je dobře využitelný například pro ohodnocení určitých osobních vlastností či znalostí. V řadě výzkumů, v nichž není prostor na podrobné testování znalosti cizího jazyka, avšak míra znalosti cizího jazyka je důležitou nezávislou proměnnou, se využívají škály subjektivního zhodnocení znalosti jazyka: Na škále od 1 do 10 ohodnoťte své jazykové dovednosti v daném jazyce (přičemž stupně 1 a 10 bývají podrobněji vysvětleny). Razení odpovědí je z mé zkušenosti ve výzkumu jazyka a jeho užívání spíše málo využívaná varianta uzavřené otázky. Spočívá v tom, že respondent má podle určitého klíče (například míry souhlasu od nejmenší po největší) uspořádat jednotlivé nabízené odpovědi. Určitou variantou tohoto způsobu odpovědi může být úloha, kdy má respondent uvádět, kterou z určitých variant odpovědi preferuje. To může být využito například v hodnocení přijatelnosti: (9) Následující dvě věty vyjadřují totéž. Uveďte, která z nich je podle Vás vhodnější, použili byste ji spíše: _Tadeáš si omylem rozšlápl brýle, takže asi nebude vidět na prezentaci. _Tadeáš si omylem rozšlápl brýle, takže asi neuvidí na prezentaci. Příklad (9) je vyjádřením preference jedné z variant, a jde tak o nucenou volbu odpovědi. Pro určité účely může být takové dotazování vhodné, podrobnější informace však lze zjistit uplatněním samostatných škál pro každou z vět (viz ještě oddíl 4.4, s. 42). Kromě uvedených typů otázekje možné v dotaznících využívat i takzvané „kontrolní otázky". Ty slouží primárně k ověření toho, že respondenti dávají pozor, odpovídají uváženě a v souladu se svým přesvědčením. Kontrolní otázka se může ptát na totéž, na co se ptala nějaká předchozí otázka, a kontrola spočívá v tom, že se sleduje, zda jsou odpovědi víceméně stejné. Pokud by stejné nebyly, pravděpodobně to znamená, že respondent nevěnuje dotazníku příliš pozornosti a odpovídá alespoň částečně nahodile, což může být důvodem pro vyřazení jeho dotazníku z výzkumu. Jiným příkladem kontrolní otázky jsou otázky, které mají jednoznačnou a správnou odpověď, přičemž se kontroluje, zda respondenti zvolili právě tuto správnou odpověď (pokud ne, vypovídá to o tom, že otázky pořádně nečetli a odpovídali nahodile). Pro formulaci otázek platí určitá pravidla. Důležité je například neptat se na dvě věci najednou (takzvaná „dvouhlavňová otázka"), a to zejména v případech, kdy hrozí, že respondent bude mít na dané dvě věci různé názory. Otázky by měly být formulovány jednoduchým a přirozeným jazykem s ohledem na cílovou sociální skupinu. V nabízených odpovědích by nemělo nic chybět a jednotlivé možnosti by měly být ideálně logicky řazeny. Zároveň by se nabízené odpovědi neměly významově překrývat, pokud mohou respondenti vybrat pouze jednu z odpovědí. U škál je zásadní, aby byly všechny stupně srozumitelné (a aby je respondenti chápali víceméně stejně) a zároveň aby byl počet stupňů přiměřený možným rozdílům (tři stupně mohou být málo, dvacet stupňů naopak nerozlišitelně moc). Pro kvantitativní zpracování výsledků je rovněž důležité, aby škály vymezené kontinuum rozdělovaly na stejně „široké" kontrolní otázka = otázka sloužící k ověřování toho, zda respondent věnuje dotazníku (případně jiné technice sběru dat) náležitou pozornost; typicky se ptá na něco, na co se dotazovala už nějaká z předchozích otázek, případně je to otázka s jednoznačnou a pro všechny stejnou odpovědí [angl. control questions] dvouhlavňová otázka = otázka, která se zaměřuje na více rozdílných věcí, a respondent tak nemá možnost odpovědět podle svého přesvědčení, pokud tyto věci vnímá rozdílně [angl. double-barreled question] 4 Techniky sběru dat a dotazník 40 stupně, tj. aby určitý stupeň škály nezahrnoval značně větší množství potenciálních hodnot než jiný. K tomu se ještě vrátíme ve výkladu o deskriptívni statistice. V uzavřených otázkách rovněž nebývá vhodné používat negaci - pokud se například zeptáme Nevadí vám konstrukce Najíst se tam nenajíme?, není úplně jasné, jestli odpověď „ano" znamená „nevadí", nebo „vadí". Ačkoliv dotazník vypadá na první pohled jako snadno uchopitelná technika, opak je pravdou, jak už jsme si řekli. Otázek můžeme vymyslet velké množství, avšak jen zlomek z nich můžeme reálně použít. Výsledný počet otázek je z principu určován cíli výzkumu a také motivací na straně respondentů (pokud respondentům například platíme, můžeme si dovolit udělat dotazník delší). Někdy se doporučuje vytvořit si široký soubor otázek, z nichž pak můžeme vybírat. Při volbě otázek, jejich přesného znění a nabízených odpovědí nám mohou velmi pomoci formulované hypotézy. Dotazník má být ostatně prostředkem k ověřování hypotéz, takže je u každé otázky důležité se ptát, jak se vlastně otázka vztahuje k uvedeným hypotézám a nakolik budu schopen prostřednictvím odpovědí na danou otázku tyto hypotézy testovat. Zároveň má smysl uvažovat o tom, jak budou orientačně vypadat odpovědi, a již předem mít jasno, jaká bude interpretace takových výsledků. V neposlední řadě je pak potřeba uvažovat nad tím, jestli se různé otázky nějak nepřekrývají (pokud tedy nejde o otázky kontrolní), jestli se nezaměřují na totéž, a neposkytly by nám tak v podstatě duplicitní odpovědi. Poslední obecnou věc, nad kterou je potřeba u dotazníkového výzkumu přemýšlet, je vyřazování dotazníků. To je potenciálně problematické, protože vyřazování určitých respondentů z výzkumu může výrazně ovlivnit jeho výsledky. Z tohoto důvodu by se mělo vyřazování dotazníků řídit určitými pravidly. V prvé řadě by nikdy neměly být vyřazovány dotazníky, které vypadají podezřele z obsahových důvodů (například proto, že respondent uvádí názory, které badatel neočekával, apod.). Hlavní důvody pro vyřazení jsou tak spíše formální, a to nesprávné vyplnění dotazníků (zaškrtávání více možností u otázek s jedinou možnou odpovědí, chybějící odpovědi), anebo nesoulad u kontrolních otázek. V každém případě je důležité při psaní zpráv o výsledcích (ať už jde o odborné články, diplomové práce apod.) vždy uvádět, kolik dotazníků bylo vyřazeno a z jakých důvodů. 4.3 Přímé a nepřímé techniky Dotazníkové výzkumy bývají chápány jako prototypický příklad takzvaných nepřímých technik. Touto „nepřímostí" je myšleno, že se v dotazníku typicky ptáme respondentů na jejich postoje, názory, zkušenosti, způsoby chování atd. Jinými slovy místo toho, abychom tyto jevy zkoumali přímo, vycházíme z toho, co nám o nich řekne někdo, koho se týkají. Nepřímé techniky, přičemž nemusí jít pouze o dotazníky, mají zjevné slabé stránky, které spočívají především v tom, že informace, kterou získáme od respondenta, může být zkreslená, a to nejrůznějším způsobem: respondent nemusí být schopen přesné sebereflexe, může odpovídat pod vlivem určitých společenských konvencí, může pochopit otázku jinak, než jak ji zamýšlíme, apod. To je poměrně závažný problém, nepřímá technika = technika, jejímž prostřednictvím se ptáme respondentů na předmět zkoumání a samotný předmět zkoumání nesledujeme [angl. indirect technique/method] 4 Techniky sběru dat a dotazník 41 nicméně nepřímé techniky mohou mít také různé výhody, jak si ještě ukážeme. Výhradně jako nepřímá technika funguje dotazník v sociologii, v lingvistice je tak často využíván rovněž. Dotazník je běžnou součástí ne-jrůznějších výzkumů, protože nám umožňuje snadno zjistit demografická data o zkoumaných mluvčích. Jak jsme viděli již z příkladů (l)-(3), dotazník může být využíván mimo jiné ve výzkumu postojů k různým jazykovým jevům nebo například ve výzkumu využívajícím hodnocení přijatelnosti (dříve též gramatičnosti), což je velmi běžná lingvistická metoda. Respondenti jsou dotazováni na to, jak hodnotí určitou větu, konstrukci, respektive způsob použití nějakého jevu. Ačkoliv je dotazník v empirických vědách využíván obvykle jako nepřímá technika, v lingvistice je možné využívat ho i jako techniku přímou. Podívejme se alespoň na tři příklady: hodnocení přijatelnosti = specifická lingvistická metoda spočívající v přímém dotazování mluvčích na jejich jazykové intuice [angl. acceptability judgment] (10) Badatelé se zaměřují na plurálovou atrakci, konkrétně jim jde o to, zda a nakolik podstatné jméno v plurálu, které stojí mezi subjektem a predikátem věty, ovlivňuje tvar predikátu (jeho gramatické číslo). Využívali začátky vět jako (a) Kráva na rozlehlých loukách... (b) Krávy na rozlehlých loukách... (c) Kráva na rozlehlé louce... (d) Krávy na rozlehlé louce... Úkolem respondentů bylo v dotazníku co nejrychleji doplňovat uvedené začátky vět tak, aby vznikla smysluplná věta. Předpokládali, že začátky typu (a) budou spojeny s největší chybovostí odpovědí, a tedy že plurál u vloženého substantiva bude způsobovat tendenci užívat plurál i u predikátu. (Pro podobný, byť odlišnou technikou realizovaný výzkum viz studii Bock and Miller, 1991.) (11) Pro účely psycholingvistických výzkumů se často využívají různé „normy". Mimo jiné jde o normy pojmenování určitých obrázků. Tyto normy vznikají tak, že se většímu počtu rodilých mluvčích určitého jazyka předkládají prostřednictvím dotazníku obrázky a tito mluvčí mají uvést, jak se říká věci, která je na obrázku zobrazena, a případně ještě odpovědět na další otázky (například jak dobře tento obrázek reprezentuje zobrazovaný jev, jak dobře jsou s tímto jevem obeznámeni apod.). Ve výsledných normách se pak uvádí, jaké nejčastější pojmenování mluvčí volí, nakolik se na tom shodují a jak odpovídají na další otázky. Viz například normy Bank of Standardized Stimuli založené na fotografiích (Brodeur et al, 2010; Brodeur et al, 2014), anebo Multipic (Duňabeitia et al, 2018). (12) V dialektologickém výzkumu se dotazník často využívá pro účely sbírání regionálních jazykových variant. Lze přitom využít obrázky, které mají respondenti pojmenovat, anebo jednotlivá slova či tvary slov, na jejichž regionální podobu se badatelé respondentů ptají (viz Balhar et al., 2011, s. 35-217). Bock, J. K., & Miller, C. A. (1991). Broken agreement. Cognitive psychology, 23(1), 45-93 Brodeur, M. B., Dionne-Dostie, E., Mon-treuil, T., & Lepage, M. (2010). The Bank of Standardized Stimuli (BOSS), a new set of 480 normative photos of objects to be used as visual stimuli in cognitive research. PloS one, 5(5), el0773 Brodeur, M. B., Guerard, K., & Bouras, M. (2014). Bank of standardized stimuli (BOSS) phase II: 930 new normative photos. PloS one, 9(9), el06953 Duňabeitia, J. A., Crepaldi, D., Meyer, A. S., New, B., Pliatsikas, C, Smolka, E., & Brysbaert, M. (2018). MultiPic: A standardized set of 750 drawings with norms for six European languages. Quarterly Journal of Experimental Psychology, 71(4), 808-816 Balhar, J., et al. (2011). Český jazykový atlas. Dodatky. Academia 4 Techniky sběru dat a dotazník 42 Příklady (10)-(12) se od příkladů (l)-(3) výrazně liší. Pomocí dotazníků se v těchto případech zkoumá jazyková produkce mluvčích, nikoliv jejich hodnocení či třeba jejich jazyková intuice. Dotazník v takových případech vlastně slouží ke kontrolované elicitaci dat o jazykové produkci. Ačkoliv pro oba typy dotazníků platí vše, co jsme uvedli výše, pro dotazník jako přímou techniku neplatí některé výhrady, které lze mít k dotazníku jako k technice nepřímé. Z těchto důvodů rozčleníme následující výklad do dvou samostatných částí. V části 4.4 věnované dotazníku jako nepřímé technice se budeme věnovat hodnocení přijatelnosti, v části 4.5 zaměřené na dotazník jako přímou techniku se zaměříme na elicitaci jazykových dat. 4.4 Hodnocení přijatelnosti Jak jsme již řekli, toto využití dotazníku je spojeno s tím, že jevy, které nás zajímají, nezkoumáme přímo, ale zprostředkovaně, na základě tvrzení či odpovědí respondentů. Zmínili jsme rovněž nejvýraznější problém takového výzkumu, a to přítomnost nejrůznějších zkreslení, která jsou spojena se schopnostmi a ochotou respondentů. Na druhou stranu jsme řekli, že dotazníkový výzkum má obecně jisté výhody, a to především to, že je časově a finančně nenáročný a za relativně krátkou dobu lze nasbírat poměrně hodně dat. Jedním z nejtypičtějších způsobů využití dotazníku jako nepřímé techniky ve výzkumu jazyka a jeho užívání je zkoumání hodnocení přijatelnosti. Ve výzkumu tohoto typu se zjišťuje, zda, případně nakolik hodnotí mluvčí určitého jazyka nějakou větu či konstrukci jako gramatickou či přijatelnou. Přesné vymezení toho, co znamená „přijatelná/gramatická věta", se může v rámci různých výzkumů částečně lišit. V Boxu 4.3 uvádím příklad instrukcí, který jsme použili v jednom našem nepublikovaném výzkumu. Box 4.3: Příklad instrukcí z jednoho nepublikovaného výzkumu využívajícího hodnocení přijatelnosti V tomto experimentu bude Vaším úkolem hodnotit věty podle toho, do jaké míry jsou podle Vašeho osobního názoru přijatelné v češtině. Věty se v tomto ohledu mezi sebou budou lišit. Některé Vám jistě budou připadat jako úplně normální české věty, se kterými byste se mohli setkat, ať už v běžném hovoru, ve škole, v novinách, anebo třeba v literatuře. Jiné věty Vás oproti tomu budou při čtení nejspíše něčím rušit a budou se Vám zdát nějak problematické. Pro hodnocení budete používat pětistupňovou škálu, která je vymezená stupni zcela přijatelná a zcela nepřijatelná věta. Zcela přijatelná věta na Vás působí bezproblémově, nic Vás na ní nezarazilo a mohli byste se s ní docela pravděpodobně setkat v ústním či písemném projevu rodilých mluvčích češtiny. Zcela nepřijatelná věta na Vás oproti tomu působí naprosto rušivě, je velmi divná a rodilí mluvčí češtiny by ji nejspíše nikdy nepoužili, anebo jedině omylem jako přeřeknutí. Hodnocení provedete kliknutím na vybraný stupeň škály. Nad svým přímá technika = technika, jejímž prostřednictvím zkoumáme předmět výzkumu přímo [angl. direct tech-nique/meťhod] 4 Techniky sběru dat a dotazník 43 hodnocením moc nepřemýšlejte. Zajímá nás především Vaše první reakce, zkrátka to, jak uvedené věty vnímáte intuitivně Vy sami. V instrukcích k hodnocení přijatelnosti je vždy důležité účastníky výzkumu co nejvíce sladit, aby v rámci svého hodnocení vlastně dělali totéž. V českém prostředí hrozí například silná vazba na kodifikaci a preskriptivní představy o užívání jazyka, zároveň je dobré uvést nějaký orientační kontext, do něhož by si měli účastníci výzkumu hodnocené věty zasadit. Zkoumáme-li různé jazykové jevy, nabízí se využít dostupné korpusy, které nám poskytují vcelku autentický a bohatý jazykový materiál. Ani opravdu velké korpusy nám však nepřinášejí příliš mnoho informací o jevech, které se používají relativně omezeně (zejména pokud bychom chtěli určité jazykové jevy usouvztažňovat se sociálními proměnnými, které se týkají mluvčích, jako jsou věk, pohlaví apod.). Hodnocení přijatelnosti je z tohoto hlediska velmi užitečnou alternativou korpusového výzkumu, protože nám umožňuje manipulaci proměnných a získávání informací i o jazykových jevech, které jsou relativně málo frekventované. Vztah korpusových frekvencí a pociťované přijatelnosti jevů není zcela přímočarý. Bermel a Knittl (2012) na českých morfologických variantách ukazují, že zatímco varianty, které mají v korpusu vysokou frekvenci, mají tendenci být rovněž hodnoceny jako vysoce přijatelné, pro varianty s nízkou frekvencí analogické zobecnění neplatí. Není to tak, že by málo frekventované jevy byly automaticky hodnoceny jako málo přijatelné. To je důležitý poznatek, který poukazuje právě na to, že kombinace korpusových metod s hodnocením přijatelnosti může být velmi plodná. Box 4.4: Stručný rozcestník na literaturu o hodnocení přijatelnosti Komplexním vstupem do problematiky hodnocení přijatelnosti je kniha Carsona Schútzeho The Empirical Base of Linguistics: Grammatically Judgments and Linguistic Methodology (Schutze, 2016). Stručnější, ale užitečný úvod nabízí rovněž přehledová studie Carsona Schútzeho a Jona Sprouse judgment data (Schútze, 2010). O aktuálních otázkách spojených se zkoumáním přijatelnosti pojednávají Jana Háussler aTomJuzek (2017) Různé typy odpovědí, které lze při hodnocení přijatelnosti používat, rozebírají Jon Sprouse et al. (2013) a také Thomas Weskott a Gisbert Fanselow (2011). Rozdíly v hodnocení syntaktických konstrukcí mezi školenými lingvisty a laiky zkoumala Ewa Dabrowska (2010). Praxi využívání hodnocení přijatelnosti v lingvistickém výzkumu kritizovali Edward Gibson a Evelina Fedorenko (2010; 2013). Hodnocení přijatelnosti je - tak jako každý výzkum - spojeno s řadou rozhodnutí, která mají dopad na získané výsledky. Existuje k němu však poměrně hodně literatury, o kterou se lze opřít. Stručný rozcestník naleznete v boxu 4.4. Bermel, N., & Knittl, L. (2012). Corpus frequency and acceptability judgments: A study of morphosyntactic variants in Czech. Corpus Linguistics and Linguistic Theory, 8(2), 241-275 Schütze, C. T. (2016). The empirical base of linguistics: Grammaticality judgments and linguistic methodology. Language Science Press Schütze, C. T. (2010). Judgement data. In R. Podesva & D. Sharma (Eds.), Research Methods in Linguistics. Cambridge University Press Haussier, J., & Juzek, T. (2017). Hot topics surrounding acceptability judgement tasks. In Proceedings of Linguistic Evidence 2016: Empirical, Theoretical, and Computational Perspectives. University of Tübingen Sprouse, J., Schütze, C. T, & Almeida, D. (2013). A comparison of informal and formal acceptability judgments using a random sample from Linguistic Inquiry 2001-2010. Lingua, 134, 219-248 Weskott, T, & Fanselow, G. (2011). On the informativity of different measures of linguistic acceptability. Language, 249-273 Dabrowska, E. (2010). Naive v. expert intuitions: An empirical study of acceptability judgments. The linguistic review, 27,1-23 Gibson, E., & Fedorenko, E. (2010). Weak quantitative standards in linguistics research. Trends in cognitive sciences, 14(6), 233-234 Gibson, E., & Fedorenko, E. (2013). The need for quantitative methods in syntax and semantics research. Language and Cognitive Processes, 28(1-2), 88-124 4 Techniky sběru dat a dotazník AA 4.5 Elicitace jazykových dat Využití dotazníku jako přímé techniky sběru dat je pro lingvistiku specifické. S tím souvisí to, že většina učebnic a skript, které se věnují empirické metodologii v sociálních vědách, s touto alternativou ani nepočítá a dotazníky hodnotí výhradně jako metodu nepřímou. Pro lingvisticky orientované čtenáře to může být zavádějící, poněvadž různé problémy spojené s nepřímými metodami u využití dotazníku jako přímé metody odpadají. Obecně lze říct, že dotazník jako přímá technika slouží k takzvané „elici-taci" jazykových dat, tedy vlastně navozuje situaci, v níž má respondent použít nějaký jazykový jev, který je předmětem zkoumání. Klíčovým aspektem přitom je to, že jevů, které připadají v úvahu, je více (alespoň tedy dva) a představují hodnoty nezávislé proměnné. Často přitom lze vytvořit dotazník tak, aby si respondent ani neuvědomoval, co je přesně předmětem výzkumu. V boxu 4.5 uvádím příklad jednoho souboru otázek z dotazníku z diplomové práce Hany Sedláčkové (Sedláčková, 2012). Respondenti postupně četli krátké texty a následně měli odpovědět na otázky k nim. Schválně zkuste odhadnout, co se v daném výzkumu zkoumalo. Box 4.5: Příklad otázky z diplomové práce Hany Sedláčkové Karlovi se dostal do rukou leták, kde ho velice zaujala fotografie koně. To by byl dárek pro jeho malou dceru! U fotografie však nenašel telefonní číslo majitele, musel tedy použít telefonní seznam. Jako středoškolský učitel by si koně mohl dovolit. Třeba se jednou zúčastní nějakého dostihu a zvítězí. Dcera se těšila, že ho ubytují na verandě, ale rodiče ji museli zklamat. Do domu kůň nesmí, mají přece dost velkou zahradu. Zato maminka si sbalila kufr a míří s ním k ubytovně. 1. Kde se nacházela fotografie koně? 2. Kde našel Karel telefonní číslo majitele koně? 3. Kde Karel učí? 4. Kde bude nakonec kůň u Karlovy rodiny bydlet? 5. Kde by jednou mohl kůň zvítězit? 6. Kde bude bydlet maminka? Cíl tohoto výzkumu nebývá okamžitě zřejmý ani studentům lingvistických či filologických oborů, byť se odhadnout dá, zaměříme-li se na to, jak modelově mohou vypadat jednotlivé odpovědi. Naprostá většina respondentů však měla za to, že se jedná o test porozumění psanému textu, a pravý cíl výzkumu, tj. zkoumání konkurence předložek v a na, jim zůstal utajen. Tento typ dotazníku umožňoval elicitovat, kterou předložku různí mluvčí volí v kombinaci s různými podstatnými jmény. Autorka práce navíc srovnávala starší a mladší mluvčí a došla k závěru, že mladší mluvčí mají větší tendenci užívat předložku na tam, kde Sedláčková, H. (2012). Aspekty variace předložek na av(e)v současné češtině [Diplomová práce]. Filozofická fakulta Univerzity Karlovy 4 Techniky sběru dat a dotazník 45 starší používají v. Tyto výsledky je třeba z různých důvodů chápat jako orientační a předběžné, nicméně z metodologického hlediska představuje tento výzkum užitečnou alternativu ke korpusovému zkoumání (v němž se některá substantiva v 6. pádě ve spojení s na/v budou vyskytovat jen relativně omezeně a zároveň výskyty z psaných textů budou ovlivněny kodifikací), ale i ke zkoumání využívajícímu hodnocení přijatelnosti (kde by bylo obtížné skrýt zkoumaný jev). Využití dotazníku jako přímé metody je tak užitečný způsob získávání dat, která jinak nejsou badatelům dostupná. I u této metody nás však do určité míry omezuje limitovaný rozsah dotazníku. Zároveň zde do popředí vystupuje i psaná povaha dotazníku. Pokud bychom zkoumali určité jevy, které jsou úzce spjaty s mluveným módem jazyka, není dotazník zcela optimální metoda. 4.6 Otázky na přemýšlení Zkuste odpovědět na tyto otázky: 1. Nakolik se mohou výsledky získané na základě hodnocení přijatelnosti odlišovat od toho, co bychom zjistili na základě korpusové analýzy reálného užívání jazyka? Proč? 2. Jak byste postupovali, pokud byste měli za úkol připravit dotazníkový výzkum přijatelnosti morfologických variant u substantiv ženského rodu v češtině? Jaké kroky byste učinili? 3. Jakými všemi způsoby se dají dotazníky distribuovat respondentům? Jaké jsou jejich výhody a naopak nevýhody? 4. Jak byste postupovali, kdybyste měli za úkol elicitovat pomocí dotazníků nářeční slovní zásobu? Jak by dotazník vypadal a proč? Rozhovor 5 Podobně jako v případě dotazníku je rozhovor v sociálních vědách obvykle pojímán jako nepřímá technika - slouží totiž jako způsob zjišťování názorů, postojů či přesvědčení respondentů. V lingvistice je však používán především jako technika přímá, tedy jako způsob získávání dialogických jazykových dat. Pozornost zde budeme věnovat hlavně druhé uvedené funkci, nejprve se ale krátce zastavíme u využití rozhovoru v sociologickém smyslu. 5.1 Rozhovor: nepřímá technika Tento typ využití rozhovoru je ve své podstatě velmi blízký dotazníku. Oproti němu má však určité nevýhody. Předně, realizace rozhovoru bývá z praktického hlediska náročnější než využití dotazníku. Na druhou stranu jsou s tímto způsobem získávání informací spojeny zřejmé výhody. Badatel má totiž přímý kontakt s respondentem, což může zvýšit kvalitu získávaných informací - otázky je tak možné dovysvětlit, badatel může udržovat motivaci respondentů odpovídat, má přehled o chování respondentů apod. U rozhovorů navíc dává smysl více využívat otevřené otázky (na rozdíl od dotazníku), protože v mluveném módu komunikace bývají respondenti obecně ochotnější poskytnout podrobnější odpovědi. Podívejme se na tři příklady: 5.1 Rozhovor: nepřímá technika ...............46 5.2 Rozhovor: přímá technika 47 5.3 Běžná mluva a paradox pozorovatele........49 5.4 Struktura a formát rozhovoru..........50 5.5 Skryté nahrávání ..... 51 5.6 Nevýhody lingvistického rozhovoru.......... 52 5.7 Elicitace jazykových jevů 52 5.8 Technické otázky nahrávání..........53 5.9 Přepis.............54 5.10 Otázky na přemýšlení . . 56 (1) James Wilson (2010) ve svém výzkumu prostřednictvím rozhovoru zjišťoval demografické údaje o účastnících výzkumu. Na základě různých předem připravených otázek stanovoval míru integrace mluvčího v Praze, kterou následně využíval jako nezávislou proměnnou a usouvztažňoval ji s užíváním různých obecněčeských jevů (například ej místo y). (2) Jiří Nekvapil a Marek Nekula (2006) zkoumali jazykový management v nadnárodních podnicích v České republice. Využívali přitom kombinaci různých technik, mimo jiné takzvané následné (follow-up) rozhovory (tj. rozhovory, v nichž badatelé s účastníky výzkumu rozebírali předem pořízenou nahrávku jejich autentické interakce) a semistrukturované rozhovory (tj. rozhovory s částečně připravenými otázkami a jejich pořadím), které se zaměřovaly na využívání jazyků v daných nadnárodních podnicích. (3) Ane Ortega et al. (2015) zkoumali jazykové postoje k baskičtine u tzv. nových mluvčích (tj. osob, které si baskičtinu osvojily jinak než v rodině) prostřednictvím tzv. ohniskových skupin („focus groups", moderované skupinové rozhovory). Celkem pořídili záznam z pěti ohniskových skupin a devět individuálních rozhovorů, a od 35 osob tak získali nahrávky o délce 21 hodin. Moderátoři Wilson, J. (2010). Moravians in Prague: A sociolinguistic study of dialect contact in the Czech Republic. Peter Lang Nekvapil, J., & Nekula, M. (2006). K jazykové situaci v nadnárodních podnicích p\uusobících v české republice. Slovo a slovesnost, 2(67), 83-95 následný (follow-up) rozhovor = rozhovor, v němž badatelé s účastníky výzkumu rozebírají předem pořízenou nahrávku jejich autentické interakce [angl. follow-up interview] semistrukturovaný rozhovor = rozhovor s částečně připravenými otázkami a jejich pořadím [angl. semi-structured interview] Ortega, A., Urla, J., Amorrortu, E., Goirigolzarri, J., & Uranga, B. (2015). Linguistic identity among new speakers of Basque. International Journal of the Sociology of Language, 2015(231), 85-105 ohnisková skupina = moderovaný skupinový rozhovor zaměřený na určité zkoumané téma [angl. focus group] 5 Rozhovor 47 ohniskových skupin do diskuse zasahovali minimálně, aby dali diskutujícím prostor vyjádřit všechny pro ně relevantní témata a aspekty problematiky. Následující individuální rozhovory se pak do větší hloubky zaměřovaly na postoje k osvojování baskičtiny. Uvedené tři příklady představují poměrně různorodé způsoby využití rozhovoru jako nepřímé techniky ve výzkumu jazyka a jeho užívání. Příklad (1) se velmi blíží běžnému dotazníku. Wilson kladl všem respondentům prakticky stejné otázky, aby od nich získal specifické demografické informace, které mu následně sloužily k určení míry integrace v Praze. Jde o příklad strukturovaného rozhovoru - tedy rozhovoru s předem danými otázkami a jejich pořadím. Strukturace rozhovoru má zjevné výhody - od jednotlivých respondentů získáme údaje stejného typu, což nám umožňuje kvantitativní zpracování dat a s tím spojené pravděpodobnostní zobecňování závěrů. Nevýhody pevnější strukturace naopak spočívají v tom, že badatelé mohou snadno pominout důležité aspekty problematiky, které nejsou zachyceny v připravených otázkách. Z toho důvodu je častou strategií využívání semistrukturovaných rozhovorů, kdy je část otázek pro všechny respondenty stejná (což zajišťuje souměřitelnost) a část vyplyne až v průběhu rozhovoru podle odpovědí respondenta, což zajišťuje větší hloubku a adekvátnost získaných informací a zároveň částečně eliminuje riziko toho, že se některé podstatné aspekty problematiky zcela opominou. Semistrukturované rozhovory byly využity i v příkladu (2), a to v kombinaci s takzvanými následnými rozhovory. Následné rozhovory se používají ve výzkumu jazykového managementu pro vysvětlení určitého jazykového chování, které je předtím zaznamenáno (ať už zvukově, či jako video; podrobněji viz Neústupný, 1999). Příklad (3) pak využívá ohniskové skupiny, což jsou v podstatě moderované skupinové rozhovory. Tento typ rozhovorů je častý v případě induktivně orientovaného kvalitativního výzkumu, který se zaměřuje například na odhalování jazykových ideologií, postojů mluvčích a jejich vnímání jazykového chování. Důležitá je zde role moderátora, která může být z hlediska zaměření ohniskové skupiny buď aktivnější, nebo upozaděnější s cílem přenechat aktivitu diskutujícím, jako tomu bylo v příkladu (3). Ohniskové skupiny mohou být cenné v tom, že jednotlivé aspekty problematiky, která je ve skupině tematizována, vysvítají na povrch z diskuse mezi aktéry, přičemž lze předpokládat, že právě tyto aspekty jsou těmito aktéry považovány za závažné (více o ohniskových skupinách viz například Kamberelis and Dimitriadis, 2013). strukturovaný rozhovor = rozhovor s fixně připravenými otázkami a jejich pořadím [angl. structured interview] semistrukturovaný rozhovor = rozhovor s částečně připravenými otázkami a jejich pořadím [angl. semi-structured interview] Neústupný, J. V. (1999). Následné (follow-up) interview. Slovo a slovesnosí, 60(1), 13— 18 Kamberelis, G., & Dimitriadis, G. (2013). Focus groups. Routledge 5.2 Rozhovor: přímá technika Podobně jako dotazník lze i rozhovor ve vědách o jazyce a jeho užívání používat pro získávání přímých dat o jazykovém chování. Spolu s Willia-mem Labovem (1972) můžeme takovému využití rozhovoru říkat „lingvistický rozhovor", poněvadž je to technika specifická pro lingvistický výzkum. Lingvistické rozhovory jsou typické pro dialektologii či variační sociolingvistiku a využívají se také při budování mluvených korpusů (viz například korpus ORAL2013 v rámci Českého národního korpusu; Benešová et al., 2015). Labov, W. (1972). Sociolinguistic patterns. University of Pennsylvania press Benešová, L., Křen, M., & Waclawičová, M. (2015). Korpus spontánní mluvené češtiny ORAL2013. Časopis pro moderní filologii, 1(97), 42-50 5 Rozhovor 48 Jednou z hlavních motivací využití lingvistického rozhovoru je získávání autentických mluvených jazykových dat. Pro ilustraci si ukažme několik příkladů: (4) Kromě rozhovoru uvedeného v příkladu (1) využíval ve svém výzkumu J. Wilson (2010) ještě volné, zhruba dvacetiminutové rozhovory, které vedla rodilá mluvčí češtiny. Tyto rozhovory sloužily k zaznamenání autentických hovorů s mluvčími z Moravy, kteří dlouhodobě žili v Praze. Získané nahrávky pak byly analyzovány z hlediska užívání různých jevů obecné češtiny. (5) Otec variační sociolingvistiky William Labov (1972) zkoumal proměnnou (r) v New Yorku pomocí rychlého a anonymního průzkumu. V několika obchodních domech se ptal na to, kde najde zboží, o němž věděl, že se nachází ve čtvrtém patře. Součástí odpovědi tak bylo většinou spojení fourthfloor (čtvrté patro), v němž se proměnná (r) objevila jak ve finální pozici, tak v pozici uvnitř slova před souhláskou. Poté, co Labov dostal na svou otázku odpověď, se zeptal ještě jednou s tím, že nerozuměl. Dostal tak znovu odpověď s požadovaným slovním spojením, avšak pozorněji vyslovenou (můžeme říct, že tím Labov navodil pečlivější styl řeči). Odpovědi si po odchodu dotazovaného zapisoval fonetickou transkripcí. Za šest a půl hodiny získal data od velkého vzorku 264 mluvčích. Wilson, J. (2010). Moravians in Prague: A sociolinguistic study of dialect contact in the Czech Republic. Peter Lang (6) Nikolas Coupland (1980) dlouhodobě nahrával pracovní interakce zaměstnankyně cestovní kanceláře (Sue) v Cardiffu s jejími přáteli, s klienty a s ostatními zaměstnanci. Analýzou těchto nahrávek ukazoval, jak se mění její řečový styl v závislosti na tom, s kým mluvila. Analyzovalo se několik proměnných (mimo jiné výslovnost /t/ v pozici mezi samohláskami) a ukázalo se, že Sue používala standardní varianty proměnných mnohem více v případě hovoru s klienty či v telefonických hovorech, méně v pracovně zaměřených hovorech s kolegy a nejméně pak v neformálních konverzacích s kolegy-přáteli. Coupland, N. (1980). Style-shifting in a Cardiff work-setting. Language in society, 9(1), 1-12 Tyto tři výzkumy se týkají tří oblastí, pro něž má smysl používat rozhovor jako přímou techniku. Příklad (4) je klasické využití rozhovoru pro elicitaci běžné mluvy (angl. „vernacular"). Badatel se v takovém případě snaží navodit situaci, kdy nahrávaná osoba mluví „co nejpřirozeněji", „spontánně", „běžně" apod. To je z různých důvodů problematické, k čemuž se ještě zakrátko vrátíme. Příklad (5) je velmi specifickým a vlastně dost atypickým využitím rozhovoru, jehož cílem je vlastně pouze rychlá a efektivní elicitace jednoho jazykového jevu ve dvou kontextových stylech, kterým Labov říká „běžný" či „nenucený" („casual style") a „pečlivý" („careful style"). Jedná se však o ilustraci toho, že za určitých podmínek můžeme rozhovor využívat ke zkoumání stylových rozdílů v projevu mluvčích (v tomto případě rozdílu udávaného situačně, kontextem). V příkladu (6) se jedná rovněž o výzkum řečového stylu, jde však o výzkum zaměřený na komunikační akomodaci, tedy to, nakolik se mluvčí ve svém projevu přibližují svým komunikačním partnerům. běžná mluva = spontánní způsob projevu, který určitá osoba zaujímá v každodenních, neformálních situacích, kdy ke svému užívání jazyka neupírá přílišnou pozornost [angl. vernacular] běžný styl = Labovem vymezený styl projevu, kterým mluvčí mluví, když se nesoustředí na to, jak mluví [angl. casual style] pečlivý styl = Labovem vymezený styl projevu, kterým mluvčí mluví, když se soustředí na to, jak mluví [angl. careful style] 5 Rozhovor 49 5.3 Běžná mluva a paradox pozorovatele Snaha získat přirozená, spontánní data o mluvené produkci je něco, co je předmětem zájmu lingvistů odedávna. V praxi se však potýkáme s řadou potíží. Problém už je v samotném vymezení pojmu běžná mluva. Z teoretického hlediska to je o něco snazší než v praxi - můžeme třeba říct, že je to spontánní způsob projevu, který určitá osoba zaujímá v každodenních, neformálních situacích, kdy ke svému užívání jazyka neupírá přílišnou pozornost. Je však otázka, zda skutečně existuje nějaký spontánní, neformální způsob projevu, anebo zda přece jenom mluvčí nemění svůj řečový styl na základě tématu, komunikačního partnera, případně proaktivně. Těmito otázkami se detailně zabývá variační sociolingvistika (viz např. Tagliamonte, 2011; Milroy and Gordon, 2012 apod.). Zde se spokojíme s tím, že běžná mluva je z povahy věci určitý konstrukt, něco, co vytváříme zobecněním v rámci našeho výzkumu. Nejlépe je tato povaha běžné mluvy patrná z praktického hlediska. Děláme-li rozhovor s mluvčím, kterého neznáme, můžeme zaujímat různé strategie, abychom ho přiměli používat běžnou mluvu. Problém ale je, že nepoznáme, zda to běžná mluva skutečně je. Představme si například situaci, kdy nahráváme neformální rozhovor s nějakou mluvčí z Prahy, ale mluvčí používá relativně vysoké množství spisovných koncovek. Znamená to, že nepoužívá běžnou mluvu? Anebo je to součástí její běžné mluvy? Tyto otázky nelze zodpovědět, pokud tuto mluvčí neznáme, případně pokud to sama nějak netematizuje apod. S tím souvisí druhý problém. Při snaze zaznamenávat běžnou mluvu narážíme na jeden paradox. Naším cílem je pozorovat a zaznamenávat, jak lidé užívají jazyk, když nejsou pozorováni. Na tento problém upozornil William Labov (1972). To, že mluvčí ví, že jsou nahráváni, z principu ovlivňuje způsob jejich projevu. Tento problém nelze úplně odstranit, ale pochopitelně to není tak, že bychom se ho nemohli snažit minimalizovat. To lze dělat různými způsoby. Nikolas Coupland (1980) v příkladu (6) například nahrával Sue několik dní, aby se s nahráváním plně sžila a přestala ho vnímat jako něco nezvyklého, a jako data pro analýzu zvolil až nahrávky z pátého dne nahrávání. Chromý (2017) jako nahrávající ve výzkumu užívání protetického v- využíval proškolené jedince, kteří pocházeli z daných lokalit a kteří tak nahrávali rozhovory se svými přáteli. Právě vzájemný vztah mezi nahrávajícím a nahrávaným může pomoci neformálnosti rozhovoru, a tedy i používání běžné mluvy. Často se ale pro elicitaci běžné mluvy používají určité strategie, které souvisí s tématem hovoru nebo se samotnou povahou a situací rozhovoru. Co se týče tematické stránky rozhovoru, uvádí se obvykle, že je lepší neptat se na příliš osobní otázky, které by mohly u nahrávaného vyvolat jistou zdrženlivost, a naopak je pro elicitaci běžné mluvy vhodné využívat otázky, které jsou emocionálně nabité. Například Tagliamonte (2006, kapitola 3) uvádí mimo jiné tyto otázky: Tagliamonte, S. A. (2011). Variationist so-ciolinguistics: Change, observation, interpretation. John Wiley & Sons Milroy, L., & Gordon, M. J. (2012). Sociolingvistika: Metody a interpretace. Karolinum Labov, W. (1972). Sociolinguistic patterns. University of Pennsylvania press Coupland, N. (1980). Style-shifting in a Cardiff work-setting. Language in society, 9(1), 1-12 Chromý, J. (2017). Protetické v- v češtině. Filozofická fakulta Univerzity Karlovy Tagliamonte, S. A. (2006). Analysing sociolinguistic variation. Cambridge University Press (7) Zdálo se vám někdy něco, co vás opravdu vyděsilo? Co to bylo? Byl jste někdy v situaci, kdy jste si říkal, že je s vámi amen? Obvinil vás někdy někdo z něčeho, co jste neudělal? Co to bylo? 5 Rozhovor 50 U otázek tohoto typu se předpokládá, že způsobí určité emoční nabuzení, které sníží pozornost, již nahrávaný upírá ke způsobu svého projevu. Jinými slovy, nahrávaný by si při odpovědi na tyto otázky neměl natolik hlídat to, jak mluví. 5.4 Struktura a formát rozhovoru Co se týče samotné povahy nahrávání, narazíme v literatuře na různé strategie. Jedna z nich může být pozměnění formátu rozhovoru. Například mohou badatelé místo nahrávání jeden na jednoho zvolit formát skupinového rozhovoru, kdy je nahrávající v roli moderátora, který je spíše upozaděný a snaží se, aby se nahrávaní bavili primárně mezi sebou (taková varianta má však nevýhodu, že od různých mluvčích ve skupině můžeme získat dost nevyvážený objem řeči). Případně je možné nahrávání spojit s určitou společenskou událostí - například nahrávání spontánní konverzace u večeře. Další variantou může být pořizování nahrávek bez přítomnosti badatele, což už jsme ostatně viděli v příkladu (6). Strategií je zkrátka větší množství a je třeba je volit i s ohledem na konkrétní mluvčí, které se chystáme nahrávat. Kromě samotné elicitace běžné mluvy bývá cílem lingvistického rozhovoru ještě získat co největší objem řeči. Různí lidé jsou totiž různě upovídaní - před některé stačí (s trochou nadsázky) postavit diktafon a nahrajeme třeba půlhodinový monolog, jiní jsou ostýchavější a je velmi těžké je k hovoru podnítit. I pro tyto účely existují různé strategie. V prvé řadě je důležité ptát se na to, co je pro nahrávaného zajímavé. To zní až triviálně, ale v případě, že nahrávaného osobně neznáme, anebo známe jen málo, to nemusí být vůbec jednoduché. Bývá proto vhodné si o nahrávaném něco předem zjistit (jaké jsou jeho záliby, čím se zabývá, Milroy, L., & Gordon, M. J. (2012). CO ho štve, O čem rád mluví atd.). Milroyová a Gordon (2012, S. 71) uvádí Sociolingvistika: Metody a interpretace. .. , . , , , , , , -li Karolinum strategii nechat se poučit, tj. namísto kladeni otázek se postavit do role neznalého a nechat si vysvětlit, jak nějaká věc funguje, jak se něco vyrábí apod. Obecně platí, že je vhodné vyhýbat se zjišťovacím otázkám, tedy otázkám, na něž mohou nahrávaní odpovědět prostě „ano", nebo „ne". Dlouhá odpovědna zjišťovací otázku je totiž z pragmatického hlediska relativně nekooperativní, a mluvčí se proto obvykle uchylují ke stručnosti. Pro elicitaci delších úseků řeči jsou vhodné otázky, které podněcují určité vyprávění (typicky otázky na nějakou výraznou společenskou či historickou událost): (8) Pamatujete si na povodně, co tu byly před deseti lety? Co jste tehdy dělal/a? Pamatujete si, jak tu hořel ten ovčín? Co jste tehdy dělal/a? Jaký jste naposledy viděl/a film? ... Aha, to neznám, o čem to je? Jakou knihu jste naposledy četl/a? ... Aha, to neznám, o čem to je? Lingvistické rozhovory mohou být rovněž do různé míry strukturované. Nestrukturované rozhovory jsou vhodné z toho důvodu, že lze obsah rozhovoru vždy dobře vztáhnout k danému mluvčímu, jeho zálibám a zájmům a vyhnout se otázkám, u nichž očekáváme, že budou v případě daného mluvčího nefunkční. Na první pohled by se tak mohlo zdát, že strukturace lingvistického rozhovoru je vlastně spíše na obtíž. Do nějaké 5 Rozhovor 51 míry to platí, avšak úspěšná realizace nestrukturovaného rozhovoru může být relativně náročná. Představte si, že mluvíte s někým, koho prakticky neznáte, kdo má zcela jiné zájmy než vy a kdo navíc není příliš hovorný. Takový rozhovor bývá pro nahrávajícího utrpením a může se stát, že mu brzy dojdou otázky - nahrávající otázky na místě viditelně vymýšlí, klade je pomalu po odmlkách a skáče od tématu k tématu, což pro nahrávaného může být podezřelé. Určitá strukturace rozhovoru tak poskytuje nahrávajícímu oporu pro to, na co se ptát, a snižuje prodlevy mezi koncem odpovědi a následující otázkou. Zároveň je strukturace vhodná proto, že se zachovává podobná tematická struktura napříč rozhovory, což je rovněž vhodné, chceme-li se pokoušet o nějaké zobecnění u určitých skupin mluvčích. V neposlední řadě se strukturace hodí i v případě, že na určitém výzkumu pracuje větší množství nahrávajících osob - bez ní by mohlo hrozit, že budou jednotlivé rozhovory co do obsahu a zaměření velmi různorodé. Jak tedy strukturovat lingvistický rozhovor? Ve variační sociolingvistice je vcelku osvědčené využití různých modulů, tedy vlastně tematických okruhů, jimž jsou podřazené různé otázky. Tagliamonte (2006, Appendix B) uvádí příklad modulů, které využívala ve svém výzkumu. Jedná se celkem o 29 modulů, v rámci každého je řada otázek. Nahrávající postupují tak, že nejprve začnou obecnějšími otázkami v rámci daného modulu, čímž zjišťují, zda chce nahrávaný o věci mluvit. Pokud ano, pokračují konkrétními otázkami, pokud ne, posouvají se k dalšímu modulu s tím, že se k předchozímu mohou ještě vrátit později. Jde tak vlastně o pružnou strukturu, kterou lze uzpůsobovat aktuálnímu mluvčímu. Touto strukturou rozhovoru se inspiroval i dosud nepublikovaný Plán biografického rozhovoru pro tradiční české krajanské komunity, který vznikl v rámci Ústavu českého jazyka a teorie komunikace a který uvádíme v příloze A (DOPLNIT) této knihy. Tento plán pracuje s 15 moduly (například Místo, Společenské události, Jazyk, Narozeniny apod.) a celkově několika desítkami otázek. Je určen primárně pro nahrávání rozhovorů v českých krajanských komunitách, avšak po jistých úpravách ho lze použít i pro nahrávání v rámci ČR. 5.5 Skryté nahrávání Přemýšlíme-li nad tím, jak se zbavit problémů spojených s paradoxem pozorovatele, může nás napadnout, že bychom nahrávali potají. Tím, že by nahrávaný nevěděl, že je nahráván, by se zajistilo, že se bude vyjadřovat přirozeně. To samo o sobě dává smysl, má to však dva háčky. Zaprvé je skryté nahrávání jako takové neetické - není eticky přípustné nahrávat někoho bez jeho explicitního souhlasu. Přijatelnou variantou může být skryté nahrávání provést a svolení získat až následně s odůvodněním, že bylo důležité, aby mluvčí o nahrávání nevěděl. To je však riskantní. Mluvčí nemusí zpětný souhlas udělit, což má za následek, že musíme nahrávku v jeho přítomnosti vymazat. Navíc to může poškodit naši vlastní pozici. V případě menších zkoumaných oblastí se navíc může stát, že se brzo rozkřikne, že nahráváme skrytě, a lidé začnou být Tagliamonte, S. A. (2006). Analysing so-ciolinguistic variation. Cambridge University Press 5 Rozhovor 52 podezřívaví, budou odmítat s námi mluvit apod. K etickým otázkám se ještě vrátíme v části o etice vědecké práce. Zadruhé je skryté nahrávání velice problematické z technických důvodů. V případě standardního přiznaného nahrávání je možné uzpůsobit prostředí tak, aby byla nahrávka technicky vysoce kvalitní, což je velmi užitečné pro její následné zpracování. Skryté nahrávání je typicky spojeno se špatnou kvalitou záznamu - nahrávaný nemusí být dobře slyšet, mohou být výrazné různé ruchy z okolí apod. To pak může znamenat komplikace při přepisu a v důsledku i nemožnost provést některé typy analýz (zejména co se zvukové stránky řeči týče). 5.6 Nevýhody lingvistického rozhovoru Lingvistický rozhovor se zdá být ideálním způsobem, jak získávat autentická mluvená data. Na výzkum některých jevů se však rozhovor nehodí, případně hodí jen málo. V prvé řadě je rozhovor nevhodný na výzkum jevů, které jsou málo frekventované (ať už obecně, anebo v běžné řeči). Radu výzkumně zajímavých jevů prostřednictvím rozhovoru buď nezachytíme, anebo zachytíme jen v několika málo případech, což nám nestačí na hlubší analýzu. Z hlediska jazykových rovin platí, že prostřednictvím rozhovoru se dají poměrně dobře zkoumat fonologické jevy, hůře morfologické a syntaktické jevy a velmi špatně jevy lexikální. Ale i v rámci jednotlivých rovin existuje velká variabilita ve frekvenci jevů. V tabulce 5.1 uvádíme frekvenci proměnných z mluvené češtiny z hodinové nahrávky 221eté mluvčí z Českých Budějovic z připravovaného korpusu SAUP. Pro proměnné, jako jsou protetické v- u funkčních slov (von místo on, vod místo od) či úžení é>í v koncovkách (např. dobrý místo dobré), máme na základě hodinového rozhovoru poměrně dost dat na to, abychom mohli říct, jak je daná mluvčí užívá. Oproti tomu pro proměnné, jako jsou koncovka 1. osoby plurálu sloves {budem místo budeme) anebo diftongizace ý>ej v předponách (vejlet místo výlet), disponujeme tak málo daty, že analýza toho, jak je mluvčí užívá, nemá valný smysl. Kromě obecně málo frekventovaných jevů se prostřednictvím rozhovoru ještě špatně zkoumají jevy, které jsou z pragmatického hlediska nenáležité pro tento typ interakce. Například užívání rozkazovacího způsobu nebo vulgarismů může být sice v běžné konverzaci vcelku časté, avšak v rozhovoru člověka s diktafonem a cizí osoby se spíše vyskytovat nebudou. Tabulka 5.1: Frekvence vybraných proměnných z mluvené češtiny v hodinové nahrávce 221eté mluvčí z Českých Budějovic z připravovaného korpusu SAUP. proměnná frekvence -m/-me v 1. os. pl. 6 -y/-mi/-ma v 7. p. pl. 11 ý>ej (koncovky) 90 ý>ej (předpony) 7 v- u funkčních slov 263 é>í (koncovky) 170 é>í (kmen) 2 5.7 Elicitace jazykových jevů Uvedené nevýhody rozhovorů lze určitým způsobem vyvažovat pomocí řízené elicitace jevů. O tu se můžeme pokoušet vhodnými přirozeně znějícími otázkami přímo v průběhu rozhovoru. Tematicky tak modifikujeme rozhovor s tím cílem, aby mluvčí používali jevy, které nás zajímají: (9) Co byste dělal/a, kdybyste vyhrál/a milion v loterii? 5 Rozhovor 53 Příklad (9) může sloužit jako ilustrace elicitace kondicionálových tvarů slovesa, protože otázka vyžaduje odpověď v kondicionálu. V řadě jiných případů je však elicitace jako přirozená součást rozhovoru spíše obtížná a narušuje se tím plynulost rozhovoru, která je důležitá pro zachování běžné mluvy. V takových případech může dávat smysl rozhovor spojit s určitými úkoly. Jednou z možností je v rámci rozhovoru využívat obrázky, na nichž budou zobrazeny jevy, jejichž pojmenování nás zajímá. Jako příklad může sloužit obrázek, který se využíval v dotazníku při sběru dat pro Český jazykový atlas (viz obrázek 5.1; viz Balhar et al., 2011). Je vcelku zřejmé, že získat údaje o tom, jak se jmenují jednotlivé části plotu, by bylo bez takového obrázku poměrně složité. Kromě slovní zásoby můžeme však při řízené elicitaci cílit třeba i na využívání určitých gramatických konstrukcí, pádových tvarů apod. Vzpomeňme si na příklad (5) výše, v němž William Labov velice efektivně elicitoval proměnnou (r). Tento typ elicitace a jeho úspěšnost závisí velice silně na kreativitě badatele či jeho týmu. Je však zřejmé, že jako doplněk běžného lingvistického rozhovoru je řízená elicitace velmi užitečná. Balhar, ]., et al. (2011). Český jazykový atlas. Dodatky. Academia Obrázek 5.1: Obrázek pro elicitaci pojmenování částí plotu (Balhar et al., 2011, s. 204) 5.8 Technické otázky nahrávání Velké obtíže při využití lingvistického rozhovoru mohou být spojeny se samotným nahráváním. Asi není třeba zdůrazňovat, že klíčové je mít k dispozici kvalitní diktafon, který je schopen nahrávat nekomprimované zvukové soubory. Užitečný přitom může být externí mikrofon, případně možnost připojení klopových mikrofonů pro nahrávajícího a nahrávaného (případně více nahrávaných). Zásadní je ovšem prostředí, v němž nahráváme. Jak jsme již řekli výše, kvalita nahrávky velmi silně ovlivňuje její následné zpracování. Pokud je nahrávka nahrána kvalitně, je čistá, bez ruchů z okolí, může být přepis relativně snadný. V jiných případech může být problém vůbec zpětně rozluštit, co mluvčí říkal, kterou ze zkoumaných variant vlastně v daném případě použil apod. Důležité je proto přizpůsobit prostředí, v němž nahráváme. Pokud používáme mikrofony přímo na diktafonu, je vhodné podložit diktafon něčím měkkým (například šátkem; jinak se do mikrofonu dost nepříjemně promítne jakékoliv zavadění o stůl), je potřeba zavřít okna, vypnout všechny přístroje, které dělají nějaký zvuk (lednice, rádio, televize, tikající hodiny, větrák, topení apod.), případně prostě pro nahrávání zvolit místnost, kde takové přístroje nejsou. Jinými slovy, je ideální být v co nejtišším prostředí uvnitř. Případně může být dobré pokusit se přes skříně či zdi rozvěsit deky či závěsy, což brání odrazu zvuku od rovných ploch, apod. Pochopitelně ne v každém případě máme takové možnosti. Tak jako s mnohými jinými metodologickými aspekty výzkumu i zde platí, že v praxi vždy vyvažujeme mezi ideálním řešením a našimi praktickými možnostmi. Pokud byste se chystali nahrávat lingvistické rozhovory, přečtěte si poučný článek Magdaleny Zikové a Jana Křivana Nahrávání v terénním lingvistickém výzkumu: jak získat kvalitní záznam řeči? (Ziková and Křivan, 2014). Ziková, M.,& Křivan, J. (2014). Nahrávání v terénním lingvistickém výzkumu: Jak získat kvalitní záznam řeči? Studie z aplikované lingvistiky, 5(1), 65-82 5 Rozhovor 54 5.9 Přepis Důležitou součástí využití lingvistického rozhovoru je jeho přepis, z něhož vycházíme při následné analýze. Obecná otázka je, co všechno zaznamenávat. Na jedné straně můžeme chtít zaznamenávat všechny dílčí fonetické rozdíly, na straně druhé nám může stačit zaznamenávat jenom některé jevy a jinak přepisovat víceméně v souladu s pravopisem. Můžeme a nemusíme zapisovat hezitační zvuky, pauzy, sebeopravy, překryvy v řeči mluvčích, intonaci, různé parajazykové či nejazykové jevy (smích, imitaci řeči někoho jiného, vyslovení v cizím jazyce), můžeme dokonce zaznamenávat i zvukové jevy, které nejsou přímou součástí rozhovoru (třeba štěkání psa v pozadí apod.). Zkrátka a dobře, volba konkrétní podoby transkripce není samozřejmá a měla by být motivovaná cíli našeho výzkumu. Uveďme si několik příkladů transkripce, které slouží různým účelům: (10) ty počty no takže jako dohromady bych tam běla bejt tři sta dvacet hodin no a vono vlastně já dělám na tu dohodu o [provedení] práce . a tam mám maximálně tři sta hodin na rok a to už budu mít prostě splněný teď za prázdniny určitě @ ale ono to nevadí tak jako pak budeme přidávat na tu hodinu abysme to tak jako ošulili . takže teď mám padesát na hodinu a pak mi bude [jako] přidávat že pak třeba se vyšplhá na pět tisíc za hodinu aby to prostě aby [to sedělo ne] abych dostala prostě těch padesát za hodinu ale on to [nějak jako udělal] (11) ti počti nó taže jako dohromadi bich tammňela bejttřistadvacet hodin no a vono vlasňe já ďelám na tu dohodup provedení práce | -a tam mam maksimáňe třista hodin na rok -a to uš budu mít prste splnení tet za prázňini učiťe -alep to nevadí tak jako pak budeme přidávat na tu hodinu -abisme to tak jako ošulili | tagže tet mám padesát na hodinu -a pak mi bude jako přidávat že pak třeba se višplhá na pjetisíc za hodinu -abi to prste -abi to sedelo ne -abich dostala prste ťech padesát za hodinu -ale -on to ňejak jako udělal Kaderka, P. (2013). Pragmatika situace. Slovo a slovesnost, 74(1), 13-40 (12) Interview televizního reportéra s tiskovou mluvčí ministerstva (převzato z Kaderka, 2013) (REP = reportér, KAM = kameraman, TMM = tisková mluvčí ministerstva) ((natáčí se v prostorách ministerstva; KAM zapíná kameru uprostřed reportérovy věty; kamera zabírá v detailu TMM; v pozadí je plocha s názvem a logem ministerstva)) 1 REP: ee s tim nějak, (.) ee hejbat, mysite si že to je zásadní 2 problém (..) ee (.) co (.) co ministerstvo vnitra 3 [na (.) na tento problém (.)] 4 KAM: [((„zoomuje", tj. přibližuje a oddaluje snímanou 5 osobu))] 6 REP: co s tim uděláte, ((dává TMM před ústa mikrofon 7 s logem televize)) 8 TMM: (tak) přepadávání lidí je obecně problém ale v těchto: 9 (.) případech kdy jde o hendykepované osoby vím že 10 pan ministr hovořil s panem prezidentem policejním 5 Rozhovor 55 11 již v loňském roce (..) a že policie české republiky 12 zejména těmto velmi zavrženího- (.) zavrženího- 13 belelelelem ((odvrací se od kamery, omluvně se 14 zasměje)) 15 REP: =dáme to ještě jednou prosím 16 TMM: ((pohodí hlavou/vlasy, zvedne zrak a déle než vteřinu 17 se dívá bez hnutí nahoru)) 18 REP: [bez otázky to dáme?] 19 TMM: [((dívá se stále nahoru))] mmm (.) muže[me] 20 REP: [do]bře 21 TMM: =mužeme ((zrak upřený stále vzhůru se stáčí na stranu, 22 pak šikmo dolů, dvě vteřiny se dívá šikmo k zemi, pak 23 zvedne zrak k REP)) a já si nechám to přepadávání že 24 je špatný obecně 25 REP: =určitě. (.) v pohodě, (to vy) já vám nemůžu tady říkat 26 že ne. (13) (MOT = matka, CHI = dítě, ©Comment = komentář, %xpho = zvuková realizace) 263 *MOT: tak to sem přines, já ti to ukážu 264 ©Comment: CHI přináší puzzle. 265 *CHI: [?] lev. 266 %xpho: tetě uef. 267 *MOT: tadyto, ne? 268 %xpho: tajito, ne. 269 *MOT: nebo co to je, ukaž. 270 *MOT: no, to je lev. 271 *CHI: todle? 272 *MOT: hm, hele@i, koukej, vidíš? 273 *MOT: to je on, tady. 274 %xpho: to je von, tady. 275 *CHI: tohle je lev. 276 %xpho: todue je uef. 277 *MOT: +< to je ten dílek se lvem. 278 *CHI: a tadyto? 279 %xpho: a tajito. Hála, B., & Vážný, V. (1951). Pravidla pro vědecký přepis dialektických zápisů českých a slovenských. Česká akademie věd a umění v Praze Vidíme, že uvedené přepisy se velmi liší. Příklad (10) využívá pravidla transkripce pro korpusy řady ORAL (https://wiki.korpus.cz/doku.php/ cnk:oral:pravidla). Jedná se o víceúrovňový přepis, z něhož je zde pro ilustraci prezentována pouze ortografická rovina pro jednoho mluvčího. Tento přepis se blíží tomu, jak bychom určitou repliku zapsali v běžném pravopise, ale v některých věcech je specifický. Předně se zde nepoužívají velká písmena pro značení začátků vět a interpunkce, tečkami se značí pauzy, zavináč je značka pro hezitační zvuk a hranaté závorky znamenají překryv, tj. to, že v dané oblasti projevu něco říkal ještě někdo další. Zároveň tento způsob přepisu pomíjí různé jevy, jako je třeba krácení dlouhých, nebo naopak dloužení krátkých samohlásek, výslovnostní redukce apod. Příklad (11) je identický úryvek jako v příkladu (10), je však přepsaný podle Pravidel pro vědecký přepis dialektických zápisů českých a slovenských (1951), která stojí kdesi mezi ortografickým a fonetickým přepisem a jejich 5 Rozhovor 56 cílem je zachycovat rozdíly, na něž lze narazit v českých a slovenských dialektech. Z toho důvodu se například podle výslovnosti rozlišuje měkké i a tvrdé y, pomocí tečky uprostřed řádku zaznamenává tvrdý hlasový začátek (ráz), nepoužívá se grafém ě, nezapisují se nevyslovené hlásky, ale naopak se neznačí třeba překryvy v projevu, hezitační zvuky apod. Příklad (12) ilustruje přepis typický pro konverzační analýzu, který spíše zanedbává dílčí fonetické rozdíly, ale všímá si různých nejazykových aspektů interakce, které jsou potenciálně podstatné pro porozumění a interpretaci samotné interakce (například směr pohledu mluvčího apod.). Zároveň se tam značí i překryvy v replikách (viz řádky 19 a 20, kdy při reportérově výslovnosti poslední slabiky slova můžeme už kameraman vyslovoval první slabiku slova dobře). Pravidla tohoto přepisu, který se využíval mimo jiné v korpusu DIALOG (http://ujc. dialogy.cz/), jsou detailně popsána v práci Petra Kaderky a Zdeňky Svobodové (2006). Příklad (13) je převzat z korpusu CHILDES (https:/ /childes.talkbank. org/access/Slavic/Czech/Chroma-protect/Chroma.html). Jde o přepis interakcí mezi rodiči a malými dětmi. U tohoto přepisu přímo vidíme více rovin. Jednak jsou tam víceméně ortograficky přepsané repliky matky a dítěte, dále je tam rovina komentářů, které jsou podstatné pro porozumění toho, co se v interakci děje (v daném případě dítě přináší puzzle). A zároveň je tam rovina zvukové realizace, kde se orientačně přepisuje, jak byla daná replika vyslovena (můžeme si všimnout, že nejde o fonetický přepis, ale spíše ortografické napodobení toho, co bylo vysloveno). Uvedené příklady byly pouze ilustrativní. V praxi se můžeme setkat s ne-jrůznějšími způsoby přepisu, které jsou porůznu uzpůsobeny výzkumným cílům. Mezi ně mohou patřit i lingvistické obci siřeji známé způsoby přepisu využívané ve zvukovém popisu jazyka: fonetický a fonémický přepis (viz například Skarnitzl et al., 2016). Kaderka, R, & Svobodová, Z. (2006). Jak přepisovat audiovizuální záznam rozhovoru? Manuál pro přepiso-vatele televizních diskusních pořadů. Jazykovedné aktuality, 43(3-4), 18-51 Skarnitzl, R., Sturm, R, & Volín, J. (2016). Zvuková báze řečové komunikace: Fonetický a fonologický popis řeči. Karolinum 5.10 Otázky na přemýšlení Zkuste odpovědět na tyto otázky: 1. Jak byste pomocí rozhovoru jako nepřímé techniky zjišťovali míru integrace v určitém místě? Jaké otázky byste použili a proč? Jak byste došli k výslednému skóre? 2. Jak dlouhý by měl být rozhovor, v němž byste mohli dobře zdokumentovat to, jak určitý mluvčí v běžné mluvě používá protetické v-u plnovýznamových slov (například vokno vs. okno)? Proč? 3. Jaký způsob transkripce byste použili, kdybyste měli za úkol analyzovat užívání hezitačních zvuků v neformálních rozhovorech. Proč? Pozorování 6 Dotazník a rozhovor jsou vcelku standardní techniky využívané při výzkumu nejrůznějších témat, a to v různých teoretických perspektivách. Přes tuto tematickou různorodost se dá ovšem říct, že dotazníky v různých výzkumech jsou si vlastně do značné míry podobné, a stejně tomu tak je i s rozhovory. Zkrátka a dobře, tyto techniky jsou ze své povahy poměrně fixované. Tato fixovanost dotazníků a rozhovorů vyjde najevo zejména ve srovnání s širokou rodinou technik, které se zaměřují na pozorování. Právě na pozorování se zaměříme v této kapitole. Podívejme se na následující příklady: 6.1 Zúčastněné pozorování . . 58 6.2 Nahrávání interakcí .... 59 6.3 Strukturované pozorování 60 Dílčí techniky........ 61 6.4 Otázky na přemýšlení ... 71 (1) Penelope Eckert (1989) provedla dvouletý etnografický výzkum na střední škole na předměstí Detroitu. Do této školy získala neomezený přístup a ředitel ji seznámil s učiteli a dalšími zaměstnanci školy a všem představil cíle jejího výzkumu zaměřeného na studenty. V prvním roce navštěvovala tuto školu pravidelně, v druhém již spíše nárazově. Obvykle do školy přijela ráno a zůstávala tam do pozdního odpoledne. Občas chodila se studenty, kteří se rozhodli nejít do třídy, do fast-foodu, anebo se s nimi procházela po ulicích. Cílem bylo mít co nejméně formální přístup ke studentům školy, proto neměla vlastní kancelář, neúčastnila se přímo výuky a vyhýbala se komunikaci se zaměstnanci školy, aby u studentů nevzbuzovala podezření. Většinu času tak trávila ve společných prostorech. V průběhu času se díky různým interakcím stávala součástí sociální sítě školy. Plánovitě se přesouvala na různá místa ve škole, aby sledovala aktivity, které se tam odehrávají. Kromě samotného pozorování každodenních aktivit pořizovala i individuální a skupinové rozhovory, díky kterým získala specifické informace o jednotlivých studentech a jejich vazbách a zároveň dostatečný objem řeči pro následné analýzy jazykové variace. (2) Anna Chromá a Klára Matiasovitsová vytváří korpus raného jazyka u rodilých mluvčích češtiny. Jsou domluveny s rodiči malých dětí, kteří v pravidelných intervalech tří týdnů nahrávají své interakce s dětmi při hře, při jídle, při čtení apod. Nahrává se na video a doba nahrávaných interakcí v jednom časovém bodě je vždy cca 60 minut. Nahrávky se následně přepisují specifickou transkripcí. Výsledná data je možné využít pro různé analýzy, které se týkají vývoje dětské řeči, komunikace rodičů s dětmi apod. (3) Emmanuel Keuleers et al. (2015) zkoumali znalost slov u mluvčích nizozemštiny. Využili k tomu jednoduchý online test znalosti slov. Účastníci výzkumu měli za úkol u celkem 100 slov (70 reálně existujících a 30 vymyšlených) rozhodnout, zda jde o slovo, které v nizozemštině existuje. Zobrazená slova byla pro každého účastníka vygenerována náhodně z celkového souboru 53 000 slov. Eckert, P. (1989). Jocks and burnouts: Social categories and identity in the high school. Teachers college press Keuleers, E., Stevens, M., Mandera, P., & Brysbaert, M. (2015). Word knowledge in the crowd: Measuring vocabulary size and word prevalence in a massive online experiment. The Quarterly Journal of Experimental Psychology, 68(8), 1665-1692 6 Pozorovaní 58 Účast trvala několik málo minut a každý účastník následně dostal vyhodnocení svých odpovědí (včetně odkazů do online slovníku u existujících slov, která neznal). Celkově se výzkumu zúčastnilo 278 590 rodilých mluvčích nizozemštiny. Na základě těchto dat pak mohli analyzovat jak takzvanou slovní prevalenci (kolik procent mluvčích zná určité slovo), tak i různé demografické faktory, které ovlivňují velikost slovní zásoby. Zachycovalo se rovněž to, jak rychle účastníci na jednotlivá slova reagovali. (4) Christiane von Stutterheim et al. (2012) zkoumali, jak mluvčí různých jazyků (angličtiny, němčiny, češtiny, ruštiny, arabštiny, nizozemštiny a španělštiny) pojmenovávají různé pohybové události, které jim byly zobrazovány formou krátkých videí. Zároveň s tím badatelé zachycovali oční pohyby účastníků výzkumu (tj. kam se v rámci videa dívají a jak dlouho). Zaměřovali se mimo jiné na to, zda se mluvčí různých jazyků liší v tom, nakolik vyjadřují cílové body pohybových událostí a nakolik se při sledování videí snaží fixovat oblast, kde je předpokládaný cíl pohybu. Von Stutterheim, C, Andermann, M., Carroll, M., Flecken, M., & Schmied-tovä, B. (2012). How grammaticized concepts shape event conceptualization in language production: Insights from linguistic analysis, eye tracking data, and memory performance. Linguistics, 50(4), 833-867 chology, 47(2), 164-203 (5) Fernanda Ferreira (2003) zkoumala, jakou roli hraje věrohodnost Ferreira, F. (2003). The misinterpretation sdělení při jeho interpretaci. Účastníkům výzkumu prezentovala °f "onca"°™al/™t™ces' CoSnitive VST zvukové nahrávky vět jako (a) The dog bit the man (b) The man bit the dog (c) The man was bitten by the dog (d) The dog was bitten by the man Po vyslechnutí věty dostali účastníci otázku na určitou informaci ve větě. Klíčová byla otázka na agens věty. Ukázalo se, že zatímco u vět (a)-(c) účastníci výzkumu téměř nechybují, u věty typu (d) byla chybovost kolem 25 % (u této věty tak účastníci často tvrdili, že to byl pes, kdo pokousal muže). Uvedené příklady ilustrují různorodost toho, co vše může spadat pod „pozorování". Příklady se shodují v tom, že se pozoruje určité chování (pozorování je tedy z principu přímá technika). Liší se však tím, nakolik je toto chování badatelem manipulováno či ohraničováno. V příkladech (1) a (2) je tato manipulace relativně slabá (badatelé se snaží do interakcí přímo nezasahovat, dávat jim volný průběh a zaznamenávat tak co nejvíc „přirozené" situace). Oproti tomu v příkladech (3), (4) a (5) se vlastně předem stanovuje, co se bude pozorovat (určení, zda jde o slovo, verbální popis pohybové události a oční pohyby při sledování videa, anebo odpověď na otázku), a účastníci jsou přímo vystaveni předem připraveným podnětům (psaným slovům, videím, nahraným větám). Tyto rozdíly v podstatě můžeme charakterizovat různou mírou strukturace pozorování. 6.1 Zúčastněné pozorování Příklad (1) popisuje situaci, kdy se badatelka začlenila do zkoumaného společenství, stala se jeho součástí a to jí umožnilo získávat informace 6 Pozorovaní 59 o tomto společenství zevnitř. Tomuto postupu říkáme zúčastněné pozorování a jedná se o hojně využívanou techniku etnografického výzkumu a antropologie (srov. Spradley, 2016; DeWalt and DeWalt, 2010). Výhody techniky jsou nasnadě. V ideálním případě badatel minimalizuje paradox pozorovatele, který jsme zmiňovali v souvislosti s rozhovory, a sám se stává aktérem v daném společenství. Pochopitelně pro pevnější začlenění je potřeba poměrně hodně času - kupříkladu Penelope Eckert v příkladu (1) strávila ve zkoumané škole dva roky, přičemž první rok tam dojížděla pravidelně. V řadě případů proto badatelé využívají pro výzkumné účely svého již předcházejícího členství v určitém společenství. Zkoumání vlastního společenství však nemusí fungovat nejlépe, protože badatel může na komunikačním chování v rámci daného společenství snadno přehlížet různé podstatné aspekty, protože si ani neuvědomí, že jsou něčím zvláštní. Celkově lze říci, že míra zapojení badatele do daného společenství může být různá, a to od ve společenství známého a přijímaného „cizince" až po plně integrovaného člena daného společenství. Integrace je dlouhodobý proces, který však může přinést cenné výsledky pro samotný výzkum. Kromě překonání paradoxu pozorovatele je zúčastněné pozorování výhodnou metodou i proto, že se badatel detailně a „na vlastní kůži" seznámí s různými komunikačními či jazykovými aspekty fungování daného společenství. Zároveň může z pozice člena společenství i testovat, jak fungují různá jazyková či komunikační pravidla, prostřednictvím jejich porušování. Zúčastněné pozorování tak badateli přináší výrazný vhled do praxe daného společenství a velký objem kvalitativních dat (různých poznámek, deníkových záznamů, doplňkových záznamů, materiálů apod.). Milroyová a Gordon (2012, s. 68-72) uvádí, že zúčastněné pozorování je obzvláště vhodné v malých uzavřených společenstvích, jejichž členové by mohli být velmi opatrní při uplatnění jiných výzkumných technik (jako například lingvistický rozhovor), a také v bilingvních společenstvích, kde běžně dochází k přepínání jazyků. Volba jazyka komunikace je totiž do značné míry podmíněna komunikačními partnery. Je tedy pravděpodobné, že v přítomnosti relativně neznámého badatele bude užívání jazyků vychýleno oproti normálu. Na příkladu (1) jsme viděli ještě jeden rys zúčastněného pozorování: nebrání souběžnému využití dalších metod, jako jsou rozhovor, ohniskové skupiny apod. Jinými slovy, prostřednictvím zúčastněného pozorování lze získat podrobné informace zevnitř společenství, které je poté možné cíleně doplňovat či prohlubovat pomocí jiných technik. zúčastněné pozorování = způsob pozorování, kdy se badatel stává součástí pozorovaného společenství a sleduje toto společenství zevnitř [angl. participant observation] Spradley, J. P. (2016). Participant observation. Waveland Press DeWalt, K., & DeWalt, B. R. (2010). Participant observation: A guide for fieldworkers. Rowman Altamira Milroy, L., & Gordon, M. J. (2012). Sociolingvistika: Metody a interpretace. Karolinum 6.2 Nahrávání interakcí Příklad (2) reprezentuje způsob sběru dat, který je do určité míry alternativou lingvistického rozhovoru a řada pouček je pro oba způsoby sběru dat stejná. Cílem je zaznamenávat přirozené interakce, což je však narušováno tím, že jsou u toho účastníci těchto interakcí nahráváni. V projevech malých dětí se tento faktor nejspíš neprojeví, ale může se promítat do chování rodičů, kteří s dětmi interagují. Stejně tak je tomu i v případě, že se zaznamenávají pouze interakce dospělých. Možných strategií, jak přimět nahrávané, aby se chovali co nejpřirozeněji, existuje celá řada. Pozitivní efekt může mít určitě to, když si účastníci na nahrávání zvyknou, což platí zejména v případě, že je dlouhodobější. Vhodné je, aby nahrávací zařízení (ať už je to diktafon, či videokamera) nebylo neustále na očích, aby se interagující cítili pohodlně a nevnímali celou situaci jako něco nepřirozeného (viz rovněž předchozí kapitola). Tento způsob sběru dat je užitečný pro získávání relativně velkého objemu dat. Interakce je možné přepsat a dále anotovat na nejrůznějších rovinách (například včetně anotace gestikulace a mimiky). Výsledná data je pak možné využívat jako korpus a analyzovat je nejrůznějšími způsoby. 6.3 Strukturované pozorování Příklad (3) představuje vysoce strukturovanou techniku, kdy vlastně účastníci výzkumu využívají odpovědi ano (toto slovo znám) a ne (toto slovo neznám). Podobně je tomu i v příkladu (4), kdy se zaznamenávalo, jakým způsobem účastníci výzkumu popisovali dění na videu, kam se dívají a jak dlouho, a příkladu (5), kdy se zaznamenávala správnost odpovědi na otázku. Kromě toho se ve všech případech zaznamenávaly některé další proměnné, jako byl věk účastníků výzkumu, pohlaví apod. Všimněme si ale, že se v takových případech velké množství situačních aspektů zcela opomíjí, což je spojeno se strukturací pozorování. K této otázce se vrátíme ještě v souvislosti s redukcemi, které ve výzkumu provádíme. U uvedených tří příkladů strukturovaného pozorování si můžeme ještě všimnout jejich souvislosti s různými výzkumnými strategiemi. Příklad (3) představuje de facto průřezovou studii - zjišťují se předem existující rozdíly mezi jednotlivými mluvčími a vztahy znalosti slova jakožto závislé proměnné s různými nezávislými proměnnými, jako jsou věk, pohlaví, znalost cizích jazyků apod. V příkladech (4) a (5) se jedná o experimentální výzkum. Právě s experimentálním výzkumem je strukturované pozorování spjato nejúžeji, protože experimentální výzkum z povahy věci vyžaduje manipulaci proměnných, tedy z pohledu sběru dat vcelku přísný způsob strukturace. Zajímavý rozdíl, který se ve výzkumu tohoto typu objevil až v nedávné době, spočívá v tom, v jakých podmínkách je výzkum realizován. Zatímco dříve se experimentální výzkum využívající strukturované pozorování odehrával primárně v laboratoři (a v některých specifičtějších případech v přirozeném prostředí), v dnešní době se stále více výzkumů realizuje ve virtuálním prostředí, čemuž výrazně napomohla i pandemie Covid-19. Na tomto místě je proto dobré zaměřit se na to, jaké výhody a nevýhody nám může přinášet laboratorní, respektive online výzkum. Základní pozitivum výzkumu realizovaného v laboratoři je velmi dobrá kontrola nad všemi jeho aspekty, ať už jde o technické zabezpečení, chování účastníka výzkumu, udržení pozornosti, zaznamenávání případných nejasností a problémů atd. Na druhou stranu to s sebou nese různé problémy - v prvé řadě je třeba do laboratoře přilákat účastníky, což vyžaduje nějakou formu odměny (finanční, věcnou, případně u studentů to mohou být kredity) a za všech okolností limituje velikost vzorku. Výzkum realizovaný online je oproti tomu snadno šiřitelný, a je-li udělán chytře, jako tomu bylo u příkladu (3), může se jeho prostřednictvím získat velké množství účastníků, často i řádově větší, než by prakticky umožňoval výzkum v laboratoři. I online výzkum má však jisté stinné stránky. Především badatel nemá vůbec žádnou kontrolu nad chováním účastníků. Ti se mohou nacházet v rušivém prostředí, může na ně někdo mluvit, mohou si během experimentu pustit hudbu, mohou třeba i úplně odejít od počítače, případně střídat chvilky účasti na experimentu s chvilkami, kdy se věnují něčemu jinému. V jednom našem online výzkumu, v němž se měřil čas odpovědí, trvalo jedné účastnici odpovědět na určitou otázku 43 hodin. Lze předpokládat, že tak dlouho nad odpovědí nepřemýšlela. Spíše prostě experiment přerušila a vrátila se k němu až po dlouhé době. Tyto problémy je pochopitelně možné částečně utlumit podrobnými instrukcemi a zdůrazněním, že je důležité, aby účastníci výzkum nepřerušovali, aby ho absolvovali v tichém prostředí, vypnuli si na počítači hudbu apod. To samo o sobě však nezaručuje, že se tím budou účastníci řídit. Z mé zkušenosti rovněž vyplývá, že účastníci online výzkumu mnohem spíše výzkum nedokončí, je-li delší než cca 15 minut, anebo není-li pro ně příliš zábavný. To se v laboratoři obvykle neděje, ačkoliv účastníky výzkumu nemůžeme nikdy nutit experiment dokončit. Online výzkum má tedy výrazná pozitiva související především s dobrou dostupností účastníků, avšak i výrazná negativa, která způsobují zkreslení výsledků. Volba laboratorního nebo virtuálního prostředí proto musí být dost uvážlivá. Dílčí techniky Příklady (3), (4) a (5) představují jen zlomek technik, které lze při strukturovaném pozorování chování využívat. Jednotlivé techniky do určité míry souvisí s různými teoretickými přístupy a rovněž s dílčími oblastmi výzkumu jazyka a jeho užívání. Například v psycholingvi-stickém výzkumu se často využívají techniky, které měří či zaznamenávají reakce na různé podněty (může jít o reakční časy, oční pohyby, verbální reakce apod.), a dále různé neurozobrazovací techniky (EEG, funkční magnetická rezonance, pozitronová emisní tomografie). Ve výzkumu osvojování prvního jazyka u velmi malých dětí (případně u plodů) lze narazit také na habituační techniky, při kterých se měří rychlost sání, tep či vizuální orientace dítěte. Není cílem této učebnice přinést detailní informace ke všem těmto technikám. Ve stručnosti si tak představíme pouze vybrané experimentální techniky, a to zejména s ohledem na to, nakolik často jsou využívány v literatuře a také nakolik je pravděpodobné, že je budou chtít využívat studenti ve svých závěrečných pracích. Techniky nejprve krátce představíme, upozorníme na jejich výhody a nevýhody a především odkážeme na další literaturu. Nejprve se podíváme na techniky zaměřené na měření reakčních časů. Ty jsou užívané velmi často, protože jsou obvykle snadno aplikovatelné i bez složitého technického vybavení. Zároveň nám přináší zajímavé informace o průběhu zpracování jazyka, a to jak z produkčního, tak z percepčního hlediska. Níže si stručně představíme tři velmi běžné techniky, a to pojmenovávání obrázků, úlohu detekce slova a čtení vlastním tempem. 6 Pozorovaní 62 Následně se podíváme na techniky, které zachycují pohled účastníků výzkumu. Ty jsou z hlediska realizace náročnější, protože vyžadují technické vybavení, konkrétně eye-tracker s vysokým časovým rozlišením. Půjde nám o sledování očních pohybů při čtení, visual world paradigm a o preferential looking paradigm. Poté se krátce zastavíme u technik zaměřených na elicitaci jazykové produkce. Kapitolu uzavřeme krátkým pojednáním o neurozobrazovacích technikách. Pojmenovávání obrázků Pojmenovávání obrázků je úloha, která se využívá zejména ve výzkumu lexikálního vybavování. Účastníkům výzkumu jsou postupně prezentovány obrázky (viz třeba 6.1) a úkolem je tyto obrázky co nejrychleji správně pojmenovat. Měří se správnost odpovědi a čas, který uběhne od zobrazení obrázku po začátek první hlásky odpovědi (speech onset). Předpokládá se přitom, že rychlost pojmenování obrázku je ovlivňována různými faktory. Mezi hlavní faktory, které ovlivňují rychlost pojmenovávání, patří (Perret and Bonin, 2019): (a) shoda s vlastní představou (angl. „image agreement"; čím více je daný obrázek odlišný od vlastní představy o podobě jevu, tím pomalejší je reakční čas při pojmenovávání) (b) shoda v pojmenování (angl. „name agreement"; čím méně se mluvčí shodují na tom, jaké pojmenování používají, tím delší je reakční čas) (c) představitelnost (angl. „image variability" či „imageability"; čím více různých představ vyvolává dané slovo, tím je pomalejší pojmenování obrázku) (d) věk osvojení slova (angl. „age of acquisition"; čím dříve je slovo osvojeno, tím rychlejší reakční čas) (e) známost (familiarita) zobrazeného jevu (angl. „conceptual familiar-ity"; čím více je zobrazovaný jev mluvčímu známý, tím rychlejší jsou reakční časy) Faktory tohoto typu je tak potřeba ve výzkumu využívajícího pojmenovávání obrázků zohledňovat. Částečně je to možné díky různým databázím obrázků, které údaje o jednotlivých faktorech obsahují. Například Bank of Standardized Stimuli II (Brodeur et al., 2014) obsahují mimo jiné informace o shodě v pojmenování, familiaritě a shodě s vlastní představou. Problém těchto databází však může být v tom, že jsou vždy spojeny s určitým jazykem, případně s kulturním prostředím. V tomto smyslu je zajímavou databází Multipic 2.0 (Duňabeitia et al., 2022), která obsahuje informace o shodě v pojmenování a shodě s vlastní představou a je normována i pro češtinu. Extrémně zajímavou databází je LinguaPix (Krautz and Keuleers, 2021) - obsahuje 1620 barevných fotografií, k nimž jsou k dispozici různé normy a také nahrávky odpovědí (v němčině). Z uvedených faktorů vyplývá, že pojmenovávání obrázků nespočívá pouze ve vybavování určitého slova, ale že zahrnuje i další procesy, jako je samotné rozpoznání toho, co na daném obrázku vůbec je. Existují různé modely, které se snaží celý proces pojmenovávání zachytit (viz např. Glaser, 1992; Johnson et al., 1996). úloha pojmenování obrázků = úloha, jejímž cílem je zjistit, jak dlouho mluvčím trvá vybavit si slovo pojmenovávající určitý obrázek [angl. picture naming task] Obrázek 6.1: Co je na obrázku? Jastrow, J. (1899). The mind's eye. Popular Science Monthly, 54, 299-312 Perret, C, & Bonin, P. (2019). Which variables should be controlled for to investigate picture naming in adults? A Bayesian meta-analysis. Behavior research methods, 51(6), 2533-2545 Brodeur, M. B., Guérard, K., & Bouras, M. (2014). Bank of standardized stimuli (BOSS) phase II: 930 new normative photos. PloS one, 9(9), el06953 Duňabeitia, J. A., Baciero, A., Antóniou, K., Antóniou, M., Ataman, E., Baus, C, Ben-Shachar, M., QaglcLľ, O. C, Chromý, J., Comesaňa, M., et al. (2022). The multilingual picture database. Scientific data, 9(1), 1-6 Krautz, A. E., & Keuleers, E. (2021). LinguaPix database: A megastudy of picture-naming norms. Behavior Research Methods, 1-14 Glaser, W. R. (1992). Picture naming. Cognition, 42(1-3), 61-105 Johnson, C. J., Paivio, A., & Clark, J. M. (1996). Cognitive components of picture naming. Psychological bulletin, 120(1), 113-139 6 Pozorovaní 63 Pro účely realizace experimentů využívajících pojmenovávání obrázků existují v dnešní době různé softwarové nástroje. Již dlouhou dobu se používá volně dostupný program DMDX (Forster and Forster, 2003). Zdarma a široce využívaný je také program PsychoPy (Peirce, 2007). Úloha detekce slova Další experimentální technikou zaměřenou na lexikální vybavování je úloha detekce slova. Účastníkům výzkumu se na obrazovce objevují řetězce písmen (reálně existující slova, anebo tzv. pseudoslova) a jejich úkolem je co nejrychleji rozhodnout, zda se jedná o existující slovo daného jazyka, anebo nikoliv. I u této techniky se zachycuje správnost odpovědi a reakční čas, přičemž se předpokládá, že reakční čas zachycuje náročnost lexikálního vybavování. Mezi hlavní faktory, které ovlivňují rychlost reakcí v této úloze, patří (Kříž and Chromý, 2020): (a) délka slova (čím delší slovo, tím pomalejší reakce) (b) věk osvojení slova (čím později bylo slovo osvojeno, tím pomalejší reakce) (c) představitelnost (čím představitelnější jev slovo pojmenovává, tím rychlejší reakce) (d) velikost ortografického/fenologického sousedství (čím více slov je ortograficky či fenologický podobných, tím pomalejší je reakce) Za hlavní problém této metody je možné brát její nepřesvědčivou ekologickou validitu, tedy vlastně to, že je svým způsobem nepřirozená (hodnotí se slova izolovaně zobrazená na obrazovce, zatímco v běžných situacích bývají slova začleněna do určitého kontextu). Zároveň je otázka, nakolik je slovo v rámci úlohy detekce slova skutečně zpracováno. Klíčový problém taky spočívá v tom, že při dvou možnostech odpovědí je relativně vysoká šance odpovědět správně, aniž bychom slovo znali (to se zejména může projevit ve výzkumu málo frekventovaných slov, anebo ve výzkumu L2; viz Diependaele et al., 2012). Užitečným zdrojem informací o úloze detekce slova může být několik tzv. „megastudií", které poskytují normy pro různé jazyky - mimo jiné pro francouzštinu (38 840 slov; viz Ferrand et al., 2010) a angličtinu (28 730 slov; Keuleers et al., 2012). Pro realizaci experimentu využívajícího úlohu detekce slova je možné užít stejné softwarové nástroje jako v případě úlohy pojmenovávání obrázků. Pro další informace o úloze detekce slova viz česky psanou přehledovou studii Adama Kříže a Jana Chromého (2020). Čtení vlastním tempem Pro účely výzkumu v oblasti zpracování věty, respektive kratšího textu se často používá takzvané čtení vlastním tempem (angl. „self-paced reading", případně „moving-window technique"). Účastníci výzkumu, který tuto techniku využívá, čtou věty po úsecích (po jednotlivých slovech, anebo po delších úsecích), přičemž si regulují rychlost odhalování jednotlivých úseků. Nejprve větu vidí jako sled podtržítek. Stiskem tlačítka odhalí první úsek a dalším stiskem tlačítka odhalí další úsek a ten první opět skryjí. Takto čtou větu až do konce, po čemž obvykle následuje Forster, K. I., & Forster, J. C. (2003). DMDX: A Windows display program with millisecond accuracy. Behavior research methods, instruments, & computers, 35(1), 116-124 Peirce, J. W. (2007). PsychoPy—psychophysics software in Python, journal of neuroscience methods, 162(1-2), 8-13 úloha detekce slova = úloha spočívající v rozhodování, zda je uvedený stimul slovo, nebo nikoliv [angl. lexical decision task] Kříž, A, & Chromý, J. (2020). Úloha detekce slova a její využití v psycholingvi-stickém výzkumu. Naše řeč, 103(4), 352-367 Diependaele, K., Brysbaert, M., & Neri, P. (2012). How noisy is lexical decision? Frontiers in psychology, 3, 348 Ferrand, L., New, B., Brysbaert, M., Keuleers, E., Bonin, P, Méot, A., Augustinova, M., & Pallier, C. (2010). The French Lexicon Project: Lexical decision data for 38,840 French words and 38,840 pseu-dowords. Behavior research methods, 42(2), 488-496 Keuleers, E., Lacey, P., Rastle, K., & Brysbaert, M. (2012). The British Lexicon Project: Lexical decision data for 28,730 monosyllabic and disyllabic English words. Behavior research methods, 44(1), 287-304 čtení vlastním tempem = úloha, ve které účastníci čtou stimuly postupně po jednotlivých úsecích, přičemž tyto úseky odhalují pomocí mačkání určitého tlačítka [angl. self-paced reading task] 6 Pozorovaní 64 jednoduchá otázka na porozumění obsahu věty. Měří se rychlost mačkání tlačítka, tedy vlastně doba, po kterou je každý úsek odhalen. Předpokládá se, že čím delší je reakční čas, tím pomalejší je zpracování tohoto úseku. Problémem této metody je to, že proces čtení není přirozený. Hlavní potíž je pak v tom, že se při čtení nelze vracet, což v přirozeném čtení činíme velmi často. O čtení vlastním tempem se tedy předpokládá, že zachycuje primárně prvotní zpracování věty a že může být paměťově náročnější než čtení přirozené. Druhý problém je pak v tom, že při čtení je nutné neustále mačkat určité tlačítko, což samo o sobě prodlužuje reakční čas. Celkově jsou tak věty v úloze čtení vlastním tempem čteny déle, než by byly čteny v přirozeném čtení. Přesto je čtení vlastním tempem poměrně oblíbenou metodou, a to zejména proto, že různé studie ukázaly, že výsledky získané prostřednictvím této metody poměrně dobře odpovídají výsledkům získaným prostřednictvím sledování očních pohybů (viz např. Ferreira and Henderson, 1990). Na rozdíl od sledování očních pohybů je však čtení vlastním tempem velmi snadno realizovatelné a nevyžaduje drahé technické vybavení. Pro další informace o této technice viz česky psanou přehledovou studii Jana Chromého a Jakuba Dotlačila (2022), anebo anglickou práci Jill Jegerski (2013). Analogickou metodou pro zpracování mluveného jazyka je poslouchání vlastním tempem (angl. „self-paced listening", resp. „auditory moving-window", Papadopoulou et al., 2013). Experiment využívající čtení vlastním tempem je možné realizovat v online i offline podobě například pomocí softwaru PCIbexFarm (https: / /farm.pcibex.net/), který je k dispozici zdarma. Sledování očních pohybů při čtení Ferreira, R, & Henderson, J. M. (1990). Use of verb Information in syntactic parsing: Evidence from eye movements and word-by-word self-paced reading. Journal of Experimental Psychology: Learning, Memory, and Cognition, 16(4), 555-568 Chromý, J., & Dotlačil, J. (2022). Čtení vlastním tempem: Kritické představení metody. Časopis pro moderní filologii, 104(2), 177-193 Jegerski, J. (2013). Self-paced reading. In J. Jegerski & B. VanPatten (Eds.), Research methods in second language psycholinguis-tics (pp. 36-65). Routledge Papadopoulou, D., Tsimpli, I., Amvrazis, N., Jegerski, J., & VanPatten, B. (2013). Self-paced listening. In Research methods in second language psycholinguistics (pp. 66-84). Routledge Proces čtení můžeme kromě techniky čtení vlastním tempem zkoumat i pomocí sledování očních pohybů (angl. eye-tracking). Pro tyto účely potřebujeme speciální přístroj, tzv. eye-tracker, s poměrně dobrým časovým a prostorovým rozlišením (tj. přístroj, který dovede měřit, kam se oči dívají v řádu milisekund a s vysokou přesností). Abychom porozuměli tomu, jak tato technika funguje, musíme si říct něco málo k tomu, jak funguje čtení u lidí. Při čtení se střídají fixace a sakády. Fixace představují zastavení oka, během kterého jsou extrahovány informace z textu. Fixace obvykle trvají v řádu stovek milisekund. Sakády jsou pak rychlé přeskoky oka mezi fixacemi a trvají v řádu desítek milisekund. Při čtení zleva doprava (jako je tomu třeba v češtině) se při fixaci u dospělých zpracovávají asi tři písmena doleva a až 14-15 písmen doprava (vědomě asi 7-8). Během sakád nejsou extrahovány žádné informace. Sakády mohou být dopředně, anebo mohou směřovat zpět do textu. Druhému typu sakád se pak říká regrese a mají buď prostorově korektivní roli (například proto, že předchozí sakáda byla moc dlouhá a je třeba se trochu vrátit), anebo se jimi řeší určitý problém se zpracováním (vracíme se zpět do textu, protože nám to, co čteme, nedává smysl). Více o pohybech očích při čtení viz podrobný článek Keitha Raynera (1998). sledování očních pohybů = technika zaznamenávající pohybí očí, především pak místo, čas a posloupnost fixací [angl. eye-tracking] fixace = zastavení oka při čtení, během kterého jsou extrahovány informace z textu [angl. fixation] sakáda = rychlý přeskok oka mezi fixacemi [angl. saccade] Rayner, K. (1998). Eye movements in reading and information processing: 20 years of research. Psychological bulletin, 124(3), 372-422 Při sledování očních pohybů se zachycuje místo, čas a posloupnost jednotlivých fixací. Víme tak, jak dlouho fixovali jednotliví účastníci 6 Pozorovaní 65 výzkumu kterou oblast v textu a na jaké místo následně přešli. Na obrázku 6.2 je schematicky znázorněno čtení jedné české věty. Agresivní plavčík sežral bezbranného žraloka a rychle odplul 281 111 Obrázek 6.2: Schematicky znázorněné časy a posloupnost fixací pro větu Agresivní plavčík sežral bezbranného žraloka a rychle odplul. Časy jsou v milisekundách. Jednotlivé oblasti pro analýzu jsou vyznačeny svislými čarami. Údaje na obrázku jsou vymyšlené, ale docela dobře by mohly odpovídat reálnému čtení. Uvedená věta je sice gramaticky v pořádku, ale je nevěrohodná, neodpovídá našim znalostem světa (plavčíci typicky nežerou žraloky, ale je to spíš naopak). Z obrázku vidíme, že tento smyšlený čtenář čte postupně po jednotlivých slovech a když dojde ke slovu žralok, vrací se zpět (provádí regresi) ke slovu plavčík a poté provádí dopřednou sakádu až ke slovu bezbranného a následně pokračuje dál. Všimněme si rovněž, že přímo nefixuje spojku a - to neznamená, že by tuto spojku daný čtenář nevnímal (informace o ní by byla pravděpodobně získána při fixaci slova žraloka). Abychom mohli zjištěné časy fixací a jejich posloupnost nějak smysluplně interpretovat, můžeme použít různá měřítka. Přehled nejčastějších z nich uvádíme v boxu 6.1. Nejčastěji užívaná měřítka ve sledování očních pohybů. Tento box se vám může hodit, když budete číst nějakou studii, která sledování očních pohybů využívá, protože daná měřítka jsou užívána natolik běžně, že je autoři ve svých textech často vůbec nevysvětlují. Box 6.1: Nejčastěji užívaná měřítka ve sledování očních pohybů V tomto boxu uvádím různá měřítka, která se obvykle používají ve výzkumu čtení využívajícím sledování očních pohybů. Vzhledem k tomu, že tato měřítka nemají zavedené české termíny a na česky psané studie využívající sledování očních pohybů prakticky nenarazíte, uvádím zde standardní anglické termíny s volným překladem do češtiny. Měřítka si ilustrujeme na různých oblastech na obrázku 6.2. First fixation duration (délka trvání první fixace) = délka první fixace v dané oblasti (jakékoliv pozdější fixace se nezapočítávají). V případě slova plavčík jde o 312 ms. Jedná se o typické měřítko prvotního zpracování. Gaze duration / first pass reading time (doba fixování oblasti do jejího prvního opuštění) = délka všech fixací v dané oblasti, které se staly předtím, než čtenář tuto oblast poprvé opustil. V případě slova plavčík je to opět 312 ms. Toto měřítko je užitečné zejména tehdy, pracujeme-li s delšími oblastmi (například při čtení textu), protože v případě kratších oblastí je často identické s délkou trvání první fixace. Total fixation/reading time (celkový čas čtení) = délka všech fixací, které byly v dané oblasti učiněny, a to včetně opětovného čtení. V případě slova plavčík je to 609 ms (312 ms + 297 ms). 6 Pozorovaní 66 Re-reading time (čas opětovného čtení) = délka všech fixací poté, co byla oblast poprvé opuštěna. V případě slova plavčík je to 297 ms. Jedná se o měřítko potíží s pozdějším zpracováním. Regression-path duration / Go-past time (čas čtení do pokročení vpřed) = délka všech fixací od chvíle prvního vstupu do dané oblasti až do jejího prvního opuštění směrem vpřed. V případě slova žraloka je to 1620 ms (512 ms první fixace + 297 ms fixace následující regresi ke slovu plavčík + 344 ms následná fixace slova bezbranného + 467 ms opětovná fixace slova žraloka). Jedná se o měřítko, které nám dává informaci o náročnosti zpracování dané oblasti, než se pokročí dále. Fixation probability (pravděpodobnost fixace) = pravděpodobnost toho, že byla oblast v průběhu experimentu fixována. Tento údaj se počítá z většího množství stimulů a z dat od většího množství čtenářů. Bývá například nižší u funkčních slov než u slov plnovýznamových. First pass regression out probability (pravděpodobnost regrese jako prvního opuštění slova) = pravděpodobnost, že byla oblast poprvé opuštěna směrem dozadu. I toto měřítko se počítá napříč celým souborem dat. Více o těchto měřítkách viz například Liversedge et al. (1998). Více o sledování očních pohybů se můžete dozvědět například z knihy The Oxford Handbook of Eye-Movements (Liversedge et al., 2011). Visual world paradigm Kromě toho, že se sledování očních pohybů využívá pro výzkum čtení, respektive porozumění psanému jazyku, může být využito i pro zkoumání toho, jak zpracováváme jazyk mluvený. To, kam se lidé dívají, totiž o zpracování jazyka vypovídá poměrně hodně. Technika, která se nazývá visual world paradigm (v češtině paradigma vizuálního světa, což však není zaužívané a může znít poněkud zvláštně) kombinuje zvukově prezentované stimuly s určitým obrázkem (ať už s částečně realistickým prostředím, v němž jsou určité objekty, anebo prostě s uměle poskládanými obrázky na obrazovce). Jako příklad nám poslouží klasická studie Gerryho Altmanna a Yuki Kamide (1999). Autoři prezentovali účastníkům experimentu vizuální scény, jako je ta na obrázku 6.3. Poté, co se objevila scéna, byla účastníkům prezentována buď věta The boy will eat the cake (Chlapec sní dort), anebo věta The boy will move the cake (Chlapec přesune dort). Všimněme si, že na obrázku jsou čtyři věci, kterými lze pohybovat, ale jenom jedna věc, která se běžně jí. V technice visual world paradigm se měří, kam se účastníci dívají v průběhu poslouchání zvukového stimulu. Můžeme odůvodněně předpokládat, že jakmile účastníci uslyší slovo cake, budou fixovat obrázek dortu. Zásadním zjištěním Altmanna a Kamide však bylo to, že pokud je účastníkům prezentována věta The boy will eat the cake, začnou dort fixovat dříve, a to již když slyší sloveso eat. Technika má specifické, ale vcelku snadno čitelné zobrazení výsledků. Na obrázku 6.4 vidíme grafické zobrazení výsledků pro danou vizuální scénu a zvukové stimuly. Na ose x je čas v ms od chvíle, kdy začalo být Liversedge, S. P., Paterson, K. B., & Pickering, M. J. (1998). Eye movements and measures of reading time. In G. Underwood (Ed.), Eye guidance in reading and scene perception (pp. 55-75). Elsevier Liversedge, S. P., Gilchrist, I., & Everting, S. (2011). The Oxford handbook of eye movements. Oxford University Press visual world paradigm = technika kombinující zvukové stimuly s vizuálními scénami; účastníci slyší jazykový stimul (větu) a zaznamenávají se jejich oční pohyby při sledování scén, které obsahují objekty zmíněné ve stimulu spolu s necílovými distraktory [angl. visual world paradigm] Altmann, G. T., & Kamide, Y. (1999). Incremental interpretation at verbs: Restricting the domain of subsequent reference. Cognition, 73(3), 247-264 Obrázek 6.3: Semirealistické zobrazení použité v technice visual world paradigm ve výzkumu Altmanna a Kamide (1999). 688208 6 Pozorovaní 67 prezentováno sloveso eat či move. Na ose y je kumulativní pravděpodobnost fixace předmětu (když tuto hodnotu vynásobíme 100, získáme procento lidí, kteří do dané doby fixovali daný předmět). Černé body zachycují fixace dortu, bílé body fixace jiného předmětu (distraktoru). Z uvedeného grafu plyne, že pravděpodobnost fixace dortu byla výrazně vyšší v případě, že bylo použito sloveso eat, a to ještě předtím, než začalo být vyslovováno samotné slovo cake (viz svislou čáru označující počátek vyslovování daného podstatného jména, angl. noun onset). i.o Obrázek 6.4: Graf s výsledky experimentu ze studie Altmanna a Kamide Time from Verb Onset (1999). Tato metoda nám tak může pomoci zkoumat vztah mezi jazykovou a vizuální informací při zpracování jazyka a zároveň nám může sloužit pro zpracování jazyka obecně, byť při tom můžeme narážet na různé metodologické potíže. Pro bližší informace o této metodě včetně praktických doporučení se lze obrátit na studii Sanne Berends, Susanne Brouwer a Simone Sprenger (2016). Rovněž stojí za to přečíst si kritický přehledový článek o možnostech využití metody od Falka Huettiga, Joosta Rommerse a Antje Meyer (2011). Berends, S. M., Brouwer, S. M., & Sprenger, S. A. (2016). Eye-tracking and the visual world paradigm. In Designing Research on Bilingual Development (pp. 55-80). Springer Huettig, F., Rommers, J., & Meyer, A. S. (2011). Using the visual world paradigm to study language processing: A review and critical evaluation. Acta psychologica, 137(2), 151-171 Preferential looking paradigm Sledování očních pohybů (respektive spíše směru pohledu) lze využít i ve výzkumu porozumění jazyku u malých dětí. V osmdesátých letech 20. století představila Roberta Michnick Golinkoff, Kathryn Hirsh-Pasek, Kathleen Cauley a Laura Gordon (1987) techniku, pro kterou se vžil název intermodal preferential looking paradigm, v češtině technika intermodální zrakové preference (viz Smolík, 2006). V této technice vidí dítě dva monitory s odlišnými vizuálními stimuly, přičemž může jít buď o obrázky, anebo i videa, na kterých jsou zobrazeny předměty, anebo komplexnější jevy (události). Na obrázku 6.5 vidíme dva monitory, na kterých jsou zobrazeny slon a žirafa. Dítěti je vždy prezentován zvukový stimul, který se shoduje pouze s jedním vizuálním stimulem. V případě obrázku 6.5 by to mohlo být třeba Kde je žirafa? Klíčovým předpokladem je, že dítě by se mělo déle dívat na ten monitor, který je se zvukovým stimulem ve shodě. Velkou výhodou této techniky je to, že je jejím prostřednictvím možné zkoumat porozumění jazyku i u dětí, které zatím samy příliš nemluví, Golinkoff, R. M., Hirsh-Pasek, K., Cauley, K. M., & Gordon, L. (1987). The eyes have it: Lexical and syntactic comprehension in a new paradigm. Journal of Child Lan--e, 14(1), 23-45 Smolík, R (2006). Časná znalost jazyka: Vývoj receptivní znalosti jazyka v prvních dvou letech života. Československá psychologie, 50(3), 238-250 6 Pozorovaní 68 ÍŤ8 i r © Obrázek 6.5: Schematické zobrazení in-termodal preferential looking paradigm. Mezi dvěma monitory je reproduktor, z něhož se ozývají zvukové stimuly. ale u kterých přitom můžeme předpokládat určité porozumění. V praxi se používá pro výzkum porozumění u dětí od 12 měsíců cca do 3 let věku a lze ho používat jak pro výzkum osvojení gramatických pravidel jazyka, tak pro výzkum osvojování slovní zásoby. Pro bližší a praktické informace o této technice viz studii Janiny Piotroski a Letitie Naigles (2011). Elicitace jazykové produkce Piotroski, J., & Naigles, L. R. (2011). Intermodal preferential looking. In E. Hoff (Ed.), Research methods in child language: A practical guide (pp. 17-28). Wiley-Blackwell Výzkum jazykové produkce je z různých důvodů komplikovaný. V dnešní době sice máme dostupné poměrně velké zdroje autentických projevů, ať už nějakým způsobem zpracovaných v rámci jazykových korpusů, anebo zaznamenaných ve zvukové či audiovizuální podobě v různých archivech (televizních, rozhlasových apod.). Takové materiály můžeme využívat při hledání odpovědí na nejrůznější výzkumné otázky. Na druhou stranu však existuje řada otázek, pro jejichž zodpovídání se autentické projevy z různých důvodů nehodí. Můžeme se například zaměřovat na méně frekventované jevy, které se v rámci autentických projevů objeví jen zřídka, nebo může být naším cílem zkoumat produkci kontrolovane (ve vztahu k různým manipulovaným proměnným) a třeba i v reálném čase. Jedním z příkladů elicitace jazykové produkce je výšeuvedený příklad (4) o výzkumu Christiane von Stutterhem et al. (2012). Účastníci tohoto výzkumu sledovali krátká videa, na nichž byly zachyceny pohybové události, a měli za úkol vždy říct, co se v těchto videích děje. Například šlo o video, kdy dva lidé šli po chodníku směrem ke kostelu. Tímto způsobem se elicitovaly jazykové struktury, které buď obsahovaly vyjádření cílových bodů (například Dva lidé jdou ke kostelu), anebo ne (například Někdo jde po chodníku). Právě vyjádření cílových bodů zde bylo zkoumanou závislou proměnnou. Tento výzkum byl zajímavý i tím, že údaje o jazykové produkci propojoval i se sledováním očních pohybů (nakolik byly cílové body v rámci videí fixovány). V psycholingvistickém výzkumu jazykové produkce se nezřídka používá úloha dokončení věty (sentence completion task). Například Badecker a Kuminiak (2007) prezentovali účastníkům experimentu (rodilým mluvčím slovenštiny) začátky vět jako Okno na pole a Okno na dvor, přičemž úkolem bylo dané spojení zopakovat a co nejrychleji libovolným způsobem dokončit větu tak, aby byla kompletní a dávala smysl. Nezávislou proměnnou zde byl rod uvedených substantiv, závislou proměnnou pak forma doplněného slovesa (respektive jeho jmenný rod). Předpokládalo se, že pokud se bude druhé substantivum (tzv. atraktor) od prvního (tj. podmětu) lišit v rodě, může ovlivnit jmenný rod prísudku, který účastníci experimentu musí z principu doplnit, aby věta dávala smysl. Badecker, W., & Kuminiak, F. (2007). Morphology, agreement and working memory retrieval in sentence production: Evidence from gender and case in Slovak. Journal of Memory and Language, 56(1), 65-85 6 Pozorovaní 69 Úloha dokončení věty je poměrně dobrým způsobem, jak získat data určitého typu (například údaje o shodě slovesa) za velmi kontrolovaných podmínek. Tato technika je z principu velmi snadno použitelná, je však třeba poukázat na to, že u ní může docházet k určitým problémům. Především je potřeba počítat s poměrně vysokým procentem případů, které se budou nějak odchylovat od očekávání a které bude třeba vyloučit. Typickým problémem může být to, že účastníci výzkumu špatně zopakují daný začátek věty, že větu nedokončí zcela, anebo že není odpovědi dobře rozumět. Neurozobrazovací techniky V posledních cca dvaceti letech lze ve výzkumu jazyka a jeho užívání pozorovat značný nárůst využívání neurozobrazovacích technik. Výchozím principem těchto technik je usouvztažňování naměřené mozkové aktivity s určitou jazykovou aktivitou (například poslech zvukových stimulů, čtení apod.). Jednotlivé metody se však v mnohých ohledech liší, a to jak tím, jakým způsobem mozkovou aktivitu měří, tak svým časovým a prostorovým rozlišením. Například funkční magnetická rezonance (fMRI), která měří mozkovou aktivitu pomocí sledování průtoku krve mozkem a míře jejího okysličení, má poměrně velmi dobré prostorové rozlišení, což znamená, že můžeme jeho prostřednictvím měřit aktivitu s poměrně velkou přesností toho, kde v mozku k této aktivitě dochází. Na druhou stranu má však tato metoda poměrně slabé časové rozlišení, takže nám neumožňuje sledovat rozdíly v aktivaci v desítkách či stovkách milisekund, ale pouze v řádu sekund, což je pro některé jazykové úkony příliš dlouhá doba. Výzkum využívající funkční magnetickou rezonanci přinesl významné poznatky o lokalizaci aktivace při různých jazykových úlohách - viz například přehledovou studii Cathy Price (2012). Patrně nejužívanější neurozobrazovací technikou ve výzkumu zpracování jazyka je elektroencefalografie (EEG). V této technice se pomocí elektrod měří elektrická aktivita na povrchu hlavy. Ve výzkumu jazyka se typicky měří takzvané kognitivní evokované potenciály (potenciály vázané na událost, angl. event-related potentials, ERP), tedy vlastně určité charakteristiky (komponenty) elektrické aktivity na povrchu hlavy v reakci na určitý stimul. Tato metoda sice nemá příliš dobré prostorové rozlišení, umožňuje nám však analyzovat rozdíly v řádu desítek a stovek milisekund, což je pro výzkum různých otázek spojených se zpracováním jazyka nezbytné. Výhodou EEG je rovněž to, že je oproti jiným technikám cenově relativně dostupné. Výzkum zaměřený na kognitivní evokované potenciály přinesl mnoho poznatků o zpracování různých jazykových struktur a jeho časových aspektech - viz například studii Anny Bereš (2017), která rovněž přináší stručný úvod do ERP. V této učebnici není na detailní popis neurozobrazovacích metod moc prostoru. Zájemcům o tuto problematiku doporučujeme jako dobré východisko The Oxford Handbook of Neurolinguistics (De Zubicaray and Schiller, 2019), který obsahuje jak část věnovanou přímo jednotlivým neurolingvistickým technikám (EEG, fMRI, magnetoencefalografie atd.), tak i části zaměřené přímo na neurolingvistické poznatky o jazyce a jeho užívání, které byly získány právě pomocí těchto technik. Vzhledem funkční magnetická rezonance = neurozobrazovací technika měřící průtok okysličené krve mozkem [angl. functional magnetic resonance imaging] Price, C. J. (2012). A review and synthesis of the first 20 years of PET and fMRI studies of heard speech, spoken language and reading. Neuroimage, 62(2), 816-847 Obrázek 6.6: Osoba s nasazenou čepicí s EEG elektrodami. Zdroj: Archiv Kateřiny Chládkové. Bereš, A. M. (2017). Time is of the essence: A review of electroencephalography (EEG) and event-related brain potentials (ERPs) in language research. Applied psychophysiology and biofeedback, 42(4), 247-255 De Zubicaray, G. I., & Schiller, N. O. (2019). The Oxford handbook of neurolinguistics. Oxford University Press 6 Pozorovaní 70 k tomu, že jsou však výzkumy zaměřené na ERP v některých oblastech zkoumání jazyka (zejména v psycholingvistice) již velmi běžné, uvedeme si v boxu 6.2 Tahák ke čtení výsledků studií využívajících ERP, který by měl pomoci s pochopením studií, které ERP využívají. Box 6.2: Tahák ke čtení výsledků studií využívajících ERP V experimentech, které analyzují kognitivní evokované potenciály (ERP), se participantům prezentují určité stimuly (například zvukové nahrávky vět), přičemž se pomocí elektrod připevněných na povrch hlavy měří elektrická aktivita v reakci na tyto stimuly. Naměřená aktivita se poté zprůměruje napříč stejnými podmínkami a účastníky výzkumu, přičemž výsledkem je určitá vlna, kterou lze zobrazit v jednoduchém grafu (viz obrázek 6.7). V tomto grafu je na ose x čas v milisekundách a na ose y pak elektrický potenciál v mikro-voltech fiV, přičemž konvenčně se záporné hodnoty zachycují nahoře a kladné dole. Hodnota potenciálu může být kladná (pozitivní), záporná (negativní), anebo nulová. Specifické části naměřené vlny se nazývají komponenty, přičemž bývají pojmenovány na základě toho, zda je jejich potenciál pozitivní (P) či negativní (N) a v jaké časové vzdálenosti od prezentace stimulu (v milisekundách) se projevují. Například komponenta P600 je tak spojena s pozitivním potenciálem okolo 600 ms po prezentaci stimulu. Klíčové je, že právě u těchto komponent můžeme očekávat rozdíly mezi podmínkami. Ve výzkumu zpracování jazyka pomocí ERP se opakovaně ukázaly jako důležité zejména tři komponenty, a to N400, P600 a LAN, resp. ELAN. Komponenta N400 (viz obrázek 6.7) představuje výrazný posun křivky směrem k negativnímu pólu okolo 400 ms po prezentaci stimulu a je spojena se sémantickým zpracováním stimulu. N400 se tak projevuje například u nevěrohodných či přímo nesmyslných vět (například Tomáš na louce natrhal kočky pro Evu vs. Tomáš na louce natrhal kytky pro Evu). Komponenta P600 je spojena s posunem křivky směrem k pozitivnímu pólu, a to zhruba v čase 500-800 ms po prezentaci stimulu. Na rozdíl od komponenty N400 je komponenta P600 spojena se zpracováním gramatiky (syntaxe). Komponentu P600 bychom tak mohli předpokládat například u gramaticky defektních vět (například Tomáš na loukou natrhal kytky pro Evu vs. Tomáš na louce natrhal kytky pro Evu). Komponenta LAN (levá anteriorní negativita, ,left anterior negativity'), respektive ELAN (raná levá anteriorní negativita, ,early left anterior negativity') je podobně jako komponenta P600 spojena se zpracováním gramatiky, přičemž jde však o vychýlení směrem k zápornému pólu a dříve. U LAN se uvádí latence zhruba 300-500 ms, u ELAN již 100-200 ms po prezentaci stimulu. Tato komponenta je rovněž specifická vzhledem k tomu, že se projevuje u elektrod, které snímají elektrickou aktivitu na levé přední části hlavy. Podrobnější informace o jednotlivých měřítkách lze najít například v přehledové studii Tamary Swaab et al. (2012). Obrázek 6.7: Modelový příklad rozdílu v amplitudě elektrických potenciálů mezi věrohodnými a nevěrohodnými větami. Na ose x je zachycen čas v milisekundách, na ose y elektrický potenciál v mikrovoltech. Swaab, T. Y., Ledoux, K., Camblin, C. C, & Boudewyn, M. A. (2012). Language-related ERP components. In The Oxford handbook of event-related potential components, (pp. 397-439). Oxford University Press Na závěr této části je třeba podotknout, že se neurolingvistický výzkum vyvíjí extrémně rychlým tempem. Většina poznatků o mozku, které v současnosti máme, je z posledních dvaceti let. Rovněž se vyvíjí technické možnosti neurozobrazování. Při samostudiu v této oblasti je tak vhodné se zvýšenou opatrností brát zřetel k roku publikace. 6.4 Otázky na přemýšlení Zkuste odpovědět na tyto otázky: 1. Jak byste koncipovali výzkum jazykových interakcí na určité střední škole v České republice, který by využíval zúčastněné pozorování? Na jaké problémy byste při jeho realizaci patrně naráželi a proč? 2. Na jaké potíže se patrně naráží při nahrávání interakcí rodičů s dětmi (například v příkladu (2) na začátku kapitoly)? Co všechno může komplikovat sběr dat i jejich následnou interpretaci? 3. Jak byste koncipovali výzkum faktorů, které v češtině ovlivňují vybavování slov, který by využíval pojmenování obrázků? Jaké kroky byste museli podniknout při přípravě experimentu? A proč? Analýza dostupných materiálů Předchozí tři obecné techniky sběru dat (dotazník, rozhovor a pozorování) se vzájemně v řadě ohledů liší. Jejich společným rysem však je to, že jsou založeny na sběru dat, která by bez použití daných technik neexistovala, anebo prostě nebyla zaznamenána. V této kapitole si ukážeme, že to nemusí být nutně tak, že tato data získává sám badatel. Podívejme se na následující příklady. (1) Vojtěch Jindra (2008) zkoumal tzv. vývojovou dynamiku obouvi-dových sloves cizího původu, tedy vlastně to, nakolik se obou-vidová slovesa cizího původu vidově vyhraňují. Pro tyto účely analyzoval výskyty jednotlivých obouvidových sloves v korpusu SYN2005, respektive v subkorpusu vytvořeném z publicistických textů z korpusu SYN2005. (2) Michal Hořejší (2020) analyzoval diskurz o národním parku Šumava, přičemž jako materiál využíval publicistické texty věnované národnímu parku Šumava z let 1991-2010. (3) Minna Lehtonen et al. (2018) se zaměřili na dlouho zkoumanou otázku, zda jsou bilingvní mluvčí nějak kognitivně zvýhodněni oproti monolingvním mluvčím. Namísto toho, aby sami dělali nějaký experiment, dali dohromady data získaná dříve v celkově 152 studiích (publikovaných i nepublikovaných) a provedli takzvanou metaanalýzu, v níž výsledky těchto studií analyzovali souborně. Díky tomu ukázali, že mezi bilingvismem a kognitivní kontrolou není žádný systematický vztah a že je tedy představa kognitivního zvýhodnění bilingvních mluvčích oproti monolingvním nejspíše mylná. 7.1 Jazykové korpusy...... 73 7.2 Databáze........... 73 7.3 Metaanalýza......... 74 7.4 Open-data, open-science . 75 7.5 Otázky na přemýšlení ... 76 Jindra, V., et al. (2008). Vývojová dynamika obouvidových sloves cizího původu na základě korpusových dat. Slovo a slovesnost, 69(3), 192-210 Hořejší, M. (2020). Kritická analýza diskurzu o Národním parku Šumava [Disertační práce]. Filozofická fakulta Univerzity Karlovy Lehtonen, M., Soveri, A., Laine, A., Jár-venpää, J., De Bruin, A., & Antfolk, J. (2018). Is bilingualism associated with enhanced executive functioning in adults? A meta-analytic review. Psychological bulletin, 144(4), 394-425 Uvedené příklady se zaměřují na odlišné věci. Příklad (1) se věnuje otázkám gramatických funkcí sloves a využívá k tomu data z volně dostupného korpusu SYN2005, tedy vlastně jistého vzorku psaných textů z let 2000-2004. Příklad (2) využívá metody kritické analýzy diskurzu, přičemž vychází z nejrůznějších volně dostupných publicistických textů, které byly zaměřené na tematiku Národního parku Šumava. Tyto dva příklady pracují s materiály, které existovaly už před samotným výzkumem (lze říct, že existovaly přímo nezávisle na tomto výzkumu) a které badatelům byly nějak přístupné (lépe či hůře). Navíc šlo o data, která jako součást nějakého výzkumu ani nevznikla (z této perspektivy lze říct, že jde o „přirozená" data). Trochu jiný je příklad (3). V něm se rovněž pracovalo s daty, která nebyla získána jako součást daného výzkumu, avšak sama o sobě v rámci určitého výzkumu vznikla (jednalo se o výsledky předchozích experimentů). V této krátké kapitole se budeme stručně věnovat jazykovým korpusům a v návaznosti na to využití různých dostupných databází. Na závěr se zaměříme na otázku sdílení dat a dalších výzkumných materiálů. kritická analýza diskurzu = směr zaměřený na kritické zkoumání užívání jazyka v souvislosti se sociální praxí a toho, jak právě užívání jazyka přispívá k existující sociální realitě [angl. critical discourse analysis] 7 Analýza dostupných materiálů 73 7.1 Jazykové korpusy Analýza dostupných materiálů je v oblasti věd o jazyce spojena především s jazykovými korpusy. Ty poskytují badatelům materiál k různorodým analýzám. Korpusy mohou být nejrůznějšího typu - psané, mluvené či multimodální (například korpusy obsahující videonahrávky s přepisy). Zároveň mohou být korpusy opatřeny různými rozšiřujícími informacemi. Mohou být lematizované a nejrůzněji anotované (například mohou obsahovat morfologickou anotaci, anebo třeba chybovou anotaci, jako v případě žákovských korpusů). Vzhledem k tomu, že korpusy jsou v dnešní době naprosto běžnou a základní součástí lingvistické činnosti, není myslím nutné se jim zde dlouze věnovat. Osobám, kterým se dosud korpusová lingvistika vyhýbala, doporučujú jednak Wiki Českého národního korpusu (https://wiki.korpus.cz/), kde je rovněž dostupný krátký kurz práce s korpusem, a dále nedávnou knihu Anatola Stefanowitsche (2020), která je Stefanowitsch, A. (2020). Corpus línguís- volně dostupná online: https://langsci-press.org/catalog/book/148. iics: A S"ide io ihe ™<*hodohgy. Language Science Press 7.2 Databáze Kromě korpusů lze ve výzkumu jazyka a jeho užívání pracovat i s dalšími databázemi. V předchozí kapitole jsme jich zmínili hned několik. Existují například databáze obrázků spolu s různými údaji (například míra shody v pojmenování, představitelnost apod.), anebo normy pro úlohu detekce slova pro různé jazyky. To však zdaleka není vše. Jednou z velmi zajímavých databází jsou jazykové atlasy, a to zejména pokud jsou v uživatelsky přívětivé elektronické podobě. V jazykové typologii je hojně využíván World Atlas of Linguistic Structures (https: //wals.info/), což je vlastně databáze strukturních rysů nejrůznějších jazyků světa. Tato databáze je online a čtenářům rozhodně doporučujú se na ni podívat a vyzkoušet si, co se s ní dá dělat (například tvorba map na základě nastavení určitých gramatických rysů). Velmi podobným projektem byl rovněž Atlas of Pidgin and Creole Language Structures (https: / /apics-online.info/), který se však zaměřuje výhradně na pidginy a kreoly (celkově jde o 76 jazyků). Specifickým typem databází jsou platformy, které badatelům umožňují sdílet jejich vlastní data. Jedná se o poměrně zásadní a stále více využívanou možnost. Badatelé po dokončení svého výzkumu zveřejňují nejenom určitý textový výstup (jako třeba článek či knihu), ale také data, která v rámci výzkumu získali a která v daném výstupu analyzují. Jednou z platforem, která to umožňuje, je Open Science Framework (dále OSF; https://osf.io/). Tato platforma není oborově specifická a badatelům umožňuje nejen sdílet data, ale i různé další materiály, a také svůj výzkum přeregistrovat (tj. vlastně zveřejnit podrobný plán výzkumu ještě před jeho samotnou realizací; viz ještě v kapitole 12). Významnou databází nejen pro lingvistiku, ale i pro další humanitní vědy je LINDAT CLARIAH-CZ (https://lindat.cz/). Ta umožňuje zdarma sdílet data, nástroje, aplikace a další materiály a řídí se principem FAIR (Findable, Accessible, Interoperable, Reusable, tedy zhruba nalezitelnost, přístupnost, vzájemná usouvztažnitelnost a opětovná využitelnost). A ještě 7 Analýza dostupných materiálů 74 další využívanou databází, tentokrát výhradně lingvisticky zaměřenou, je Tromso Repository of Language and Linguistics (TROLLing; https://trolling.uit.no/). 7.3 Metaanalýza Jednou z velkých výhod dostupných dat z různých výzkumů zaměřených podobným směrem je možnost tato data vzájemně usouvztažnit v takzvané metaanalýze. Velmi dobrým příkladem takového výzkumu je studie Minny Lehtonen et al. (2018), kterou jsme si už zmínili v příkladu (3). Cílem metaanalýzy je pomocí specifických statistických metod aplikovaných na data z předchozích výzkumů dojít k silnějšímu zobecnění, než jaké je možné učinit pouze z jednotlivých studií. Jak si ještě ukážeme v kapitole 9, výsledky jednotlivých studií podléhají různým zkreslením. To znamená, že výsledky určitého výzkumu mohou být a bývají z různých důvodů nepřesné (už třeba jenom proto, že se na náš experiment zrovna dostaví primárně vysoce inteligentní jedinci, jejichž výkon je z principu mnohem lepší, než by byl výkon běžné populace). Tím, že se v metaanalýze pracuje s větším množstvím jednotlivých studií, je možné odhalit celkové tendence, které se mohou od závěrů jednotlivých dílčích studií odlišovat. Velkou předností metaanalýz je i to, že se často snaží pracovat i s daty z výzkumů, které nebyly publikované v odborných periodikách (například závěrečné práce studentů). Nepublikované studie se totiž od publikovaných nemusí lišit jenom z hlediska kvality, ale také z hlediska svých závěrů. V různých výzkumných oblastech bylo zdokumentováno publikační zkreslení (publication bias), tedy tendence publikovat primárně pozitivní výsledky, a naopak nevydávat výsledky, které předpokládané efekty nenašly. Podívejme se na tento ilustrativní příklad: metaanalýza = statistická analýza zahrnující výsledky více předchozích studií [angl. meta-analysis] (4) Angela de Bruin et al. (2015) se zaměřili na to, zda se v oblasti výzkumu kognitivního zvýhodnění bilingvních mluvčích projevuje publikační zkreslení, tj. zda dochází k tomu, že jsou spíše publikovány studie, které toto zvýhodnění dokládají než studie, které přicházejí s doklady toho, že takové zvýhodnění neexistuje, nebo není průkazné. Autoři postupovali tak, že si vzali celkově 169 konferenčních abstraktů z let 1999 až 2012, které se zaměřovaly na dané téma, a poté zjišťovali, zda byly dané výzkumy posléze publikovány anebo ne. Ukázalo se, že výzkumy prezentované v abstraktech, které dokumentovaly kognitivní zvýhodnění, měly 63% pravděpodobnost být publikovány, zatímco výzkumů, které toto zvýhodnění nedokládaly, bylo publikováno pouze 36 %. De Bruin, A., Treccani, B., & Delia Sala, S. (2015). Cognitive advantage in bilin-gualism: An example of publication bias? Psychological science, 26(1), 99-107 Výzkum Angely de Bruin et al. (2015) je velmi cenný, protože poukazuje na to, že dojem, který by si mohl čtenář vytvořit na základě publikované literatury, může být vychýlený. Metaanalýza, kterou provedli Minna Lehtonen et al. (2018) pak v návaznosti na to ukázala, že tomu tak velmi pravděpodobně je. Metaanalýzy poskytují nesmírně užitečný způsob, jak ověřovat poznatky jednotlivých studií tím, že je vzájemně usouvztažníme. V praxi však naráží na řadu překážek. Ty nejviditelnější jsou spojeny s tím, že data 7 Analýza dostupných materiálů 75 z velkého množství výzkumů nejsou veřejně dostupná, a je třeba o ně individuálně žádat samotné autory, kteří je však nemusí být ochotni poskytnout. Zároveň samotná dostupnost dat ještě nemusí znamenat, že je vyhráno, protože data mohou být obtížně čitelná, pokud neobsahují podrobná metadata (průvodní dokument, který vysvětluje, co znamenají jednotlivé proměnné a jejich hodnoty). Velmi dobrým praktickým pojednáním o tom, jak provést metaanalýzu, představuje studie Luka Plonskyho a Fredericka Oswalda (2012). Plonsky, L., & Oswald, F. L. (2012). How to Do a Meta-Analysis. In A. Mackey & S. M. Gass (Eds.), Research Methods in Second Language Acquisition: A Practical Guide (pp. 275-295). Wiley-Blackwell plína. Naše řeč, 104(1), 5-14 7.4 Open-data, open-science V souvislosti s neblahými jevy, jako jsou publikační zkreslení, se v posledních letech velmi výrazně mluví o potřebě otevřeného sdílení dat a dalších výzkumných materiálů (samozřejmě při zachování všech základních etických norem spojených s citlivostí určitého typu dat). V nedávné době proběhla na toto téma diskuse v časopise Naše řeč (viz výchozí text Chromý and Cvrček, 2021 a poté následující reakce ve Chromý, ]., & Cvrček, V. (2021). Lingvis-stejném čísle), která je poměrně ilustrativní sondou do otázek sdílení dat tlka )ako otevřena a transparentní disa-a dalších materiálů v českém lingvistickém prostředí. I z této diskuse je zřejmé, že ne každý badatel je ochotný data, která získal v rámci svého výzkumu, dávat k dispozici ostatním. Je třeba rovněž zdůraznit, že sdílení dat je spojeno s určitým úsilím, protože je potřeba vytvořit průvodní dokument, který celý datový soubor popisuje, což nějakou dobu trvá. Na druhou stranu je praxe sdílet data spojená s řadou výhod, a to nejenom na straně odborné veřejnosti, která k datům získá přístup. Z hlediska samotného badatele je uložení dat na určité zálohované úložiště spolu s průvodním dokumentem o těchto datech výhodné hned z několika důvodů. 1. Sdílení dat dává badateli jistotu, že o data nepřijde a že je bude moci zpětně dohledat a rekonstruovat i po řadě let. Sám můžu potvrdit, že vrátit se k nějakým nedobře popsaným datům už třeba jenom po jednom roce může být velmi složité, protože už si nemusíte přesně pamatovat, co přesně znamená která zkratka, jaká rozhodnutí jste provedli při kódování, případně si dokonce nemusíte být jisti, který z různých souborů, které máte uložené, je ten poslední soubor, s nímž jste pracovali. Ukládání dat spolu s metadaty tak zajistí, že sám badatel bude moci nekomplikovaně svá data znovu využívat. 2. Tím, že badatel svá data sdílí, dodává kredit svému vlastnímu výzkumu. Zveřejněním dat badatel ukazuje, že je zpracoval se svým nejlepším vědomím a svědomím a že si za svými výsledky stojí. 3. Zveřejnění dat je technicky vzato vědecký výstup, který může badatel vykazovat stejně jako vykazuje samotné textové publikace. Jasné výhody má však sdílení dat a dalších materiálů pro odbornou veřejnost. Jmenujme alespoň čtyři: 1. Sdílení dat umožňuje zpětnou kontrolovatelnost. Badatel mohl udělat v průběhu zpracování dat určitou chybu, která se odrazila ve výsledcích. Díky tomu, že jsou data sdílena, je možné na takovou chybu přijít a výsledky revidovat. 7 Analýza dostupných materiálů 76 2. Díky sdíleným datům a dalším materiálům je možné pokusit se výzkum replikovat, tedy vlastně opětovně realizovat (byť třeba s určitými úpravami) a následně srovnat výsledky. Replikovatelnost je zejména v experimentálním výzkumu zcela zásadní podmínkou toho, že jsou výsledky výzkumu solidní. 3. Sdílení dat může výrazně usnadnit práci ostatním. To je velmi dobře vidět třeba na obrázkových databázích spojených s normami pro jejich pojmenování. Pokud může badatel takový zdroj využít, nemusí si předtím pracně vytvářet normy vlastní (zároveň ve svém výzkumu výchozí databázi řádně ocituje, čímž jí roste odborný kredit). 4. Dostupnost dat usnadňuje metaanalýzy, což posiluje naše poznatky o různých zkoumaných jevech. Lze předpokládat, že do budoucna bude na zveřejňování dat a dalších výzkumných materiálů čím dál větší tlak. Některé prestižní časopisy již zveřejnění dat a dalších materiálů vyžadují jako podmínku pro publikaci (samozřejmě s možností výjimky z etických či právních důvodů). Je třeba rovněž si uvědomit, že data získaná v rámci vědecké činnosti, která je podporovaná z veřejných prostředků, nejsou vlastnictvím jedince, ale patří veřejnosti. Je však třeba podotknout, že zveřejnění dat mohou v určitých případech bránit různé právní otázky. Je například možné, že data, s nimiž se ve výzkumu pracuje, jsou citlivá a není možné je zveřejnit v plné míře (badatel k tomu nemusí mít od účastníků výzkumu svolení). K otázkám otevřené vědy se ještě vrátíme v pozdějších kapitolách. Na tomto místě však ještě doporučíme k přečtení studii Anny Lau-rinavichyute et al. (2022), která se věnuje otázce reprodukovatelnosti výzkumů publikovaných v prestižním časopisu Journal oj Memory and Language a ukazuje na různé problémy s tím spojené. 7.5 Otázky na přemýšlení Zkuste odpovědět na tyto otázky: 1. Co všechno by mohlo být relevantním důvodem data nezveřejnit? Proč? 2. Publikační zkreslení může být potenciálně dáno vícero důvody, než jenom snahou vydavatelů publikovat výsledky ve prospěch určité myšlenky. Jak byste si ho vysvětlili jinak? 3. Jaké databáze by nejvíce pomohly Vám samotným ve vašem odborném snažení? Jak by ideálně mohly vypadat? A jak náročné by bylo je vytvořit? Laurinavichyute, A., Yadav, H., & Va-sishth, S. (2022). Share the code, not just the data: A case study of the reproducibility of articles published in the Journal of Memory and Language under the open data policy. Journal of Memory and Language, 125,104332 Ještě k intuici 8 Lingvistický výzkum je specifický v tom, že předmět jeho popisu je zároveň nástrojem tohoto popisu. Zároveň je jazyk bytostně spjat se 8.1 Expertní intuice.......78 svými uživateli. Každý mluvčí jazyka má o tom, jak jazyk vypadá a jak 8.2 Pojem introspekce.....80 se užívá, určitou představu, která může být více či méně přesná. Takové 8.3 Otázky na přemýšlení ... 81 představy o jazyce a jeho užívání mají pochopitelně i samotní badatelé a je tak nasnadě, že se tyto představy promítají i do jejich práce. V kapitolách o dotazníku a rozhovoru jsme se už věnovali tomu, že lze tyto techniky využívat jako nepřímou metodu, tedy se určitého okruhu lidí ptát právě na představy o jazyce a jeho užívání. Pojďme se ale podívat na tři příklady jiného typu. (1) Bohuslav Havránek (1932) na základě svého osobního povědomí představil koncepci čtyř „funkčních jazyků", kam patřily hovorový jazyk, pracovní jazyk, vědecký jazyk a básnický jazyk. (2) Luboš Veselý (2008) zveřejnil testy pro zjišťování vidových hodnot vidového paradigmatu slovesa. Jde vlastně o soubor jednoduchých otázek, pomocí kterých lze zjistit, zda je určité sloveso nedokonavé, dokonavé, anebo obouvidové. Otázky jsou na sebe navázány ve formě algoritmu majícího dva kroky. První otázkou je, zda lze utvořit perifrastické futurum a/nebo spojení fázové sloveso + infinitiv. Pokud na tuto otázku odpovíme „ne", jde o dokonavé sloveso. Pokud odpovíme „ano", přejdeme k dalšímu kroku. Ten se zaměřuje na rozdíl mezi nedokonavostí a obouvidovostí. (3) Laura Janda a Olga Lyashevskaya (2013) analyzovaly tzv. sémantické profily" ruských prefixů. Nejprve na základě dat z Ruského národního korpusu spočítaly, nakolik se jednotlivé prefixy objevují u sloves s různými sémantickými příznaky (např. lidská činnost, fyzický dopad, změna stavu či vlastnosti apod.) a následně rozebíraly sémantické aspekty jednotlivých sloves podle toho, zda jsou pro daný prefix typická, anebo netypická. Havránek, B. (1932). Úkoly spisovného jazyka a jeho kultura. In Spisovna čeština a jazyková kultura (pp. 32-84). Melantrich Veselý, L. (2008). Testy pro zjišťování vidové hodnoty vidového paradigmatu slovesa (indikátory slovesného vidu). Slovo a slovesnost, 69(3), 211-220 Janda, L. A., & Lyashevskaya, O. (2013). Semantic Profiles of Five Russian Prefixes: Po-, s-, za-, na-, pro-. Journal of Slavic linguistics, 211-258 Příklad (1) je typickou ilustrací využití intuice v lingvistickém výzkumu. Havránkova práce se neopírala o sběr dat určitou empirickou technikou (ať už pomocí dotazníků či rozhovorů, analýzou dostupných materiálů, anebo pozorováním) a o následnou analýzu těchto dat. Vycházela z expertního poznání jazykové reality. Takové poznání může být pochopitelně určitým způsobem zavádějící a nepřesné - to však neznamená, že nemůže mít i svou váhu. Například může přinášet určitý rámec, který se dá využívat v dalších výzkumech, které již třeba jsou empiricky sofistikovanější. Zároveň je využití expertní intuice v Havránkově případě zcela pochopitelné, protože v jeho době neexistovaly zdroje dat, o něž by bylo možné takovou koncepci smysluplně opřít. Druhý uvedený příklad je o poznání novější a je zaměřen jiným směrem. Poskytuje vlastně nástroj, jak kontrolovane usměrnit intuici tak, aby 8 Ještě k intuici 78 bylo možné jasně klasifikovat slovesa na základě jejich vidu. Je přitom důležité podotknout, že uvedené testy nejsou nutně závislé na intuici badatelů, ale mohou být velmi dobře aplikovatelné na korpusová data. Pro některá málo frekventovaná slovesa (například injikovat) avšak nemusí být ani ve velkém psaném korpusu dostatek údajů, aby bylo možné je podle Veselého testu ověřit. Tím se dostáváme k jedné výhodě intuice -ačkoliv nemusí být přesná, je široce použitelná (přinejmenším v rodném jazyce). Příklad (3) je ještě jiný a patrně by se o něm obvykle vůbec v souvislosti s využitím intuice nemluvilo. Jde totiž o výzkum opírající se o korpusové údaje a statistické vyhodnocení dat. Pokud se nad tím ale zamyslíme, intuice zde hrála výraznou roli také. Zaprvé byla intuice využívána pro samotnou klasifikaci sloves - zda se jedná o sloveso označující změnu stavu či lidskou činnost je založeno ryze na osobním povědomí, byť by na tom mezi badateli byla patrně velmi vysoká shoda. Zároveň i pozdější rozbor sémantických profilů jednotlivých prefixů se opírá o intuice ohledně fungování jednotlivých sloves a zejména jejich významu. Je proto vhodné si uvědomit, že prvky intuice nalézáme prakticky všude, i v metodologicky velmi komplikovaných studiích. I s ohledem na to proto považujú za důležité intuici věnovat samostatnou kapitolu, ačkoliv je v učebnicích lingvistické metodologie typicky spíše přehlížena. V dalších oddílech této kapitoly nejprve pojednáme o expertní intuici a následně se blíže podíváme na často používaný pojem „introspekce". Obě tyto části vycházejí z textu Chromý (2021). Chromý, J. (2021). Metody výzkumu vidu a způsobu slovesného děje. In Kapitoly o slovesném vidu nejen v češtině (pp. 142-170). Akropolis 8.1 Expertní intuice Velké množství poznatků o jazyce a jeho užívání bylo získáno právě touto metodou a expertní intuice má v lingvistickém výzkumu nadále určité místo. Badatelé často popisovali svou internalizovanou představu o jazyce získanou na základě své zkušenosti s nejrůznějšími jazykovými projevy, přičemž tato zkušenost mohla být spoluutvářena důkladným a systematickým studiem autentického materiálu, vlastní excerpcí a také obeznámeností s předchozí literaturou k tématu. Intuice badatelů-lingvistů zde proto označujú jako „expertní" - jsou určitým způsobem trénované a korigované a do jisté míry by se tak měly lišit od intuice běžných uživatelů jazyka (viz k tomu Dabrowska, 2010). Expertní intuice může být často velmi přesná a rámcově ve shodě s tím, co bychom zjistili pomocí korpusů či experimentálních technik. Vzhledem k tomu, že intuice nic nestojí a přinejmenším v rodném jazyce je relativně široce aplikovatelná, je její využívání nasnadě. Problémem intuice je však její závislost na osobě badatele. Badatelé mohu být o své intuici přesvědčeni jako o něčem přesně reflektujícím realitu. Jde však pouze o subjektivní přesvědčení, jehož relevanci můžeme ověřit jedině pomocí některé z empirických technik, které jsme si představili v předchozích kapitolách. To, že expertní intuice může být sporná až zavádějící, lze dobře ilustrovat na slovesu soustředit se. Zatímco někteří badatelé považují toto sloveso intuitivně za dokonavé (a tvar začnu se soustředit je pro ně nepřijatelný), jiní badatelé mají intuici odlišnou, totiž že jde o sloveso nedokonavé, anebo obouvidové (viz Veselý, 2011). Dabrowska, E. (2010). Naive v. expert intuitions: An empirical study of acceptability judgments. The linguistic review, 27,1-23 Veselý, L. (2011). O vidu slovesa soustředit se. Příspěvek k otázce jazykové správnosti. Naše řeč, (3), 134-141 8 Ještě k intuici 79 V případě expertní introspekce nemusí být navíc paradoxně bezproblémová ani situace, kdy se různí badatelé shodnou - může to totiž být snadno zapříčiněno tím, že jejich představy o fungování jazyka jsou spoluformovány jejich lingvistickým školením, případně náklonností k nějaké lingvistické teorii apod. Celkově vzato je problémem využití intuice její nejistá spolehlivost a subjektivnost. Rada autorů proto využívání intuice považuje za nežádoucí (např. Cvrček and Kovaříková, 2011). Existují však důvody, proč si myslet, že je takový postoj přehnaný: Zaprvé je potřeba si uvědomit, že rozhodnutí o metodologii výzkumu je vždy dáno vyvažováním mezi ideální možnou realizací a praktickými možnostmi badatele. Ačkoliv by pro určité účely mohlo být užitečnější aplikovat jinou metodu, nemusí to být pro badatele možné, anebo alespoň ne v takovém rozsahu, jaký by cíl výzkumu vyžadoval. Intuice tak může sloužit jako určitá z nouze ctnost. Zadruhé, je sporné, nakolik lze konkrétní doklady o selhání expertní intuice považovat za obecnou vlastnost tohoto přístupu. Můžeme říci, že není úplně jasné, nakolik poznatky získané expertní intuicí obecně odpovídají reálnému užívání jazyka. Můžeme najít příklady, kdy expertní intuice realitě příliš neodpovídala, ale i příklady toho, kdy realitu reflektovala poměrně přesně. Lze tak říci, že mezi dobrými lingvistickými popisy založenými na introspekci a reálným užíváním jazyka je vztah, byť třena ne přímočarý. Nelze tak apriorně tvrdit, že by lingvistické poznatky získané introspektívne byly z povahy věci nesprávné, byť je u nich nejspíše vysoká pravděpodobnost zkreslení. V souvislosti s tím navrhuje Chromý (2021) rozlišit expertní introspekce dvojího typu. První typ se týká užívání jazykových struktur (otázky typu co, případně jak často, kde a kdy) a opírá se primárně o jazykovou zkušenost a dlouhodobou paměť badatele. Druhý typ se zaměřuje na vysvětlení určitých poznatků o užívání (otázky typu proč) a je spojen s přístupem ke kognitivním procesům vyššího řádu (viz ještě níže v oddílu Pojem introspekce). Zatímco intuice druhého typu vede patrně k adekvátním závěrům jen nahodile, v případě introspekce prvního typu můžeme předpokládat o mnoho vyšší úspěšnost, byť je tato úspěšnost závislá na omezeních na straně badatele. Dlouhodobá paměť není prostým zrcadlem reality kolem nás a je omylná (Anderson, 2015), a je dokonce manipulovatelná (Loftus and Pickrell, 1995). Jazykové zkušenosti jedince jsou navíc formovány jeho sociální sítí, frekvencí a výrazností jevů, s nimiž se setkává, případně dalšími individuálně-psychologickými omezeními, jako jsou vnímavost. Je navíc pravděpodobné, že zatímco druhý typ intuice nelze vytrénovat k lepší úspěšnosti, první typ intuice do jisté míry ano. Zatretí je intuice nevyhnutelná v jakémkoliv výzkumu, stojí v jeho základu. Hypotézy pro nejrůznější empirické výzkumy jsou založeny na intuici, tedy na povědomí badatele o jazykové realitě. Stejně tak se o intuitivní představy nezřídka opírají i interpretace empiricky získaných dat. Role intuice zde sice může být velmi omezená, ale domnívám se, že ji nelze pominout zcela. Intuice je tak něčím, co bychom podle mého názoru neměli z principu pomíjet a odsuzovat, ale s čím bychom měli v lingvistice počítat a co by se samo mělo stát předmětem soustavnějšího výzkumu, abychom získali představu, nakolik poznatky získané na Cvrček, V., & Kovaříková, D. (2011). Možnosti a meze korpusové lingvistiky. Naše řeč, 3(94), 113-134 Anderson, M. C. (2015). Incidental forgetting. In Memory (pp. 231-263). Routledge Loftus, E. R, & Pickrell, J. E. (1995). The formation of false memories. Psychiatric annals, 25(12), 720-725 8 Ještě k intuici 80 základě expertní intuice odpovídají (respektive vůbec mohou odpovídat) jazykové realitě. 8.2 Pojem introspekce Dosud jsme v souvislosti s reflexí vlastního povědomí o jazyce a jeho užívání používali termín intuice. V diskusích o lingvistické metodologii se však poměrně často objevuje i termín introspekce, používaný prakticky ve stejném významu. Tento termín má svůj původ v psychologii přelomu 19. a 20. století. Introspektivní metoda je spojena již se samotnými začátky vědecké psychologie v druhé polovině 19. století (Boring, 1953). Jak však v podrobných historických analýzách dokládají Danziger (1980) a zejména Costall (2006), tato metoda se v psychologii nikdy nestala dominantní a zároveň si už psychologové konce 19. a začátku 20. století uvědomovali její nedostatky. Costall (2006) přitom však poukazuje na to, že ačkoliv označení „introspekce" je vnímáno poněkud negativně, samotná introspekce z psychologického výzkumu nikdy úplně nezmizela, protože řada výzkumů se zakládá například na sdělení o vlastních pocitech, dojmech či prožitcích. Pro porozumění roli intuice v lingvistickém výzkumu je však zajímavé zvláště to, že v některých psychologických pracích je introspekce temati-zována jako předmět výzkumu, je analyzována její spolehlivost (obvykle chápaná jako shoda s projevovaným chováním) a některé výzkumy se věnují i otázkám jejích důsledků na chování či projevované postoje. Důležitou v tomto ohledu byla zejména studie R. Nisbetta a T. D. Wilsona (1977), jejíž autoři došli na základě kritické reflexe různých empirických výzkumů k závěru, že subjektivní výpovědi o kognitivních procesech vyššího řádu (tedy například procesy, které stojí v základu našeho rozhodování, hodnocení, postojů či chování) jsou sice někdy adekvátní, ale že tato adekvátnost není dána přímým introspektivním přístupem k těmto procesům. Podle autorů se jedná o náhodně adekvátní využití apriorních kauzálních představ jedince: lidé mají totiž ke kognitivním procesům vyššího řádu jen velice omezený přístup a při reflexi působení určitých podnětů nezkoumají přímo paměťovou stopu daného kognitivního procesu, ale své výpovědi zakládají na implicitních apriorních předpokladech o kauzálním vztahu mezi podněty a reakcemi. Důležité v tomto ohledu je, že introspekce je nepřesná z povahy věci - lidé nedisponují schopnostmi přesně nahlížet své vnitřní procesy a závěry o těchto procesech vytváří na základě svých představ o souvislosti mezi podněty, jimž jsou vystaveni, a svými reakcemi. Z toho vyplývá, že introspekce není přímým odrazem mentálních procesů stojících v základu jazykové produkce či recepce, a to bez ohledu na případný trénink této schopnosti. Timothy Wilson s dalšími autory navíc na základě různých výzkumů tvrdí, že introspekce může dokonce mít rušivý vliv na naše chování, respektive na naše postoje. Například ukazují (T. D. Wilson et al., 1989; T. D. Wilson and Schooler, 1991), že jedinci mají tendenci měnit své názory, když jsou nuceni hledat pro tyto své názory odůvodnění (tedy když musí provádět introspekci), a že se u nich následně snižuje shoda mezi vyjadřovanými názory a chováním. V novější přehledové studii (T. D. introspekce = reflexe vlastního vědomí, postojů a přesvědčení [angl. introspection] Boring, E. G. (1953). A history of introspection. Psychological bulletin, 50(3), 169-189 Danziger, K. (1980). The history of introspection reconsidered. Journal of the History of the Behavioral Sciences, 16(3), 241-262 Costall, A. (2006). Introspectionism and the mythical origins of scientific psychology. Consciousness and Cognition, 15(4), 634-654 Nisbett, R. E., & Wilson, T. D. (1977). Telling more than we can know: Verbal reports on mental processes. Psychological review, 84(3), 231-259 Wilson, T. D., Dunn, D. S., Kraft, D., & Lisle, D. J. (1989). Introspection, attitude change, and attitude-behavior consistency: The disruptive effects of explaining why we feel the way we do. In Advances in experimental social psychology (pp. 287-343, Vol. 22). Elsevier Wilson, T. D., & Schooler, J. W. (1991). Thinking too much: Introspection can reduce the quality of preferences and decisions. Journal of personality and social psychology, 60(2), 181-192 8 Ještě k intuici 81 Wilson and Dunn, 2004) pak rozlišují motivačně zapříčiněná a nemotivačne zapříčiněná omezení sebepoznání, přičemž do první skupiny patří případy záměrného vytlačování určitých myšlenek, vzpomínek či pocitů z vědomí (což se podle autorů děje relativně omezeně), do druhé případy, které jsou dány samotnými omezeními našeho přístupu k mysli. Autoři poukazují mimo jiné na rozdíl mezi nevědomými (implicitními) a vědomými (explicitními) postoji, přičemž tvrdí, že jde o dva rozdílné systémy, které spolu souvisí jen částečně. Vedle Wilsonových studií jsou pozoruhodné rovněž práce Emily Pronin, které se věnují rozdílům ve vnímání a hodnocení sebe sama a vnímání a hodnocení ostatních. Pronin (2007) si všímá toho, že uvažování je často negativně vychýleno různými kognitivními, percepčními či motivačními faktory a že toto vychýlení jsou lidé schopni lépe identifikovat u ostatních než u sebe samých. Tuto tendenci (tzv. „bias blind spot") přičítá částečně motivačním faktorům, ale zdůrazňuje především to, že jde o nevědomý proces a že sami sebe vnímáme primárně na základě nepřesné a iluzorní introspekce, zatímco ostatní na základě jejich chování. To pak rozvíjí v článku s Matthewem Kuglerem (Pronin and Kugler, 2007), kde ukazují, že lidé mají tendenci chápat jako dobrý zdroj informací o sobě introspekci, zatímco introspekci druhých považují za nespolehlivou, a to i v případě, kdy je jim verbálně zpřístupněna. Tyto stručně představené psychologické poznatky jsou pro zhodnocení introspekce jako lingvistické metody důležité v několika směrech. Zaprvé je vhodné zdůraznit, že introspektívne založené práce nemusí být ve svých závěrech apriorně nepřesné či nesprávné. Zadruhé je důležité si uvědomit, že v současné době nedisponujeme přístupem k procesům, které stojí v základu našeho užívání jazykových struktur, případně přemýšlení o nich. Zatretí je velmi pravděpodobné, že nepřesné introspektívni hodnocení nemusí být dáno pouze snahou o sebeprezentaci, ale také samotnou nedostupností vlastních (implicitních) postojů. To je velmi důležité, protože nám k získání správných informací o postojích či názorech určitého mluvčího nestačí překonat zkreslení dané sebeprezentaci, na což se autoři výzkumů obvykle zaměřují (viz Schütze, 2016). 8.3 Otázky na přemýšlení Wilson, T. D., & Dunn, E. W. (2004). Self-knowledge: Its limits, value, and potential for improvement. Annual Review of Psychology, 55, 493-518 Pronin, E. (2007). Perception and mis-perception of bias in human judgment. Trends in cognitive sciences, 11(1), 37-43 Pronin, E., & Kugler, M. B. (2007). Valuing thoughts, ignoring behavior: The introspection illusion as a source of the bias blind spot, journal of Experimental Social Psychology, 43(4), 565-578 Schütze, C. T. (2016). The empirical base of linguistics: Grammaticality judgments and linguistic methodology. Language Science Press Zamyslete se nad nějakou lingvistickou studií, kterou jste v poslední době četli. Zkuste odpovědět na tyto otázky: 1. Do jaké míry využívali autoři výzkumu svou intuici? V jakých aspektech výzkumu se to projevovalo? 2. Nakolik mohlo využití intuice vnést do daného výzkumu zkreslení? 3. Bylo by možné realizovat výzkum nějak jinak, aby se intuice z výzkumu zcela odstranila? Jak? Vzorek a populace V předchozích kapitolách jsme se věnovali jednomu z podstatných aspektů empirického výzkumu, a to technice sběru dat. Ještě předtím jsme se zaměřili na různé strategie, které můžeme v empirickém výzkumu používat. Vedle techniky sběru dat a strategie jejího uplatnění je třetí klíčovou složkou co, respektive koho výzkumu podrobujeme. Podívejme se na několik příkladů. 9.1 Způsoby výběru vzorku . . 85 9.2 Volba výběru vzorku .... 87 9.3 Velikost vzorku.......88 9.4 Otázky na přemýšlení ... 89 (1) V analýze užívání protetického v- v současné češtině využíval Jan Chromý (2017) data z přibližně hodinových rozhovorů od celkem 159 mluvčích (40 z Prahy, 40 z Českých Budějovic, 40 z Plzně, 20 z Hradce Králové a 19 z Brna). V případě Prahy, Českých Budějovic a Plzně bylo 20 mluvčích ze starší generace (60-70 let) a 20 z mladší generace (20-30 let). V Hradci Králové a v Brně šlo pouze o mladší generaci. V každé generaci se nahrávaly rozhovory s 10 ženami a 10 muži (v případě Brna pouze 9 mužů). Celkově se pracovalo s 28 893 výskytů slov, kde se mohlo objevit protetické v-. (2) Pickering a Traxler (1998) realizovali experiment zaměřený na zpracování vět se slepou kolejí (garden-path sentences) v angličtině. Jedná se o věty, které jsou lokálně víceznačné - při jejich čtení si nejprve vytvoříme určitou syntaktickou analýzu, která však není správná a musíme ji přehodnotit. Výzkum využíval sledování očních pohybů a pracoval se vzorkem 32 studentů z University of Glasgow. Cílem bylo zjistit, nakolik zpracování slepé koleje ovlivňuje věrohodnost valenčmho doplnění. Autoři používali itemy složené ze čtyř podmínek, které se lišily věrohodností slepé koleje a také tím, zda byla slepá kolej vůbec ortograficky přípustná: (a) As the woman edited the magazine about fishing amused all the reporters. (b) As the woman sailed the magazine about fishing amused all the reporters. (c) As the woman edited, the magazine about fishing amused all the reporters. (d) As the woman sailed, the magazine about fishing amused all the reporters. V podmínkách (c) a (d) nemohlo ke slepé koleji dojít kvůli čárce za slovesem první věty v souvětí (edited, sailed). V podmínkách (a) a (b) ke slepé koleji dojít mohlo, avšak ve větě (b) to bylo nevěrohodné, protože sloveso to sail (,plouť) se obvykle (podobně jako v češtině) nepojí s přímým předmětem (na rozdíl od slovesa to edit,editovať). Autoři celkově pracovali s 24 takovými itemy. Každý účastník výzkumu tak přečetl šest příkladů každé podmínky. Chromý, J. (2017). Protetické v- v češtině. Filozofická fakulta Univerzity Karlovy Pickering, M. J., & Traxler, M. J. (1998). Plausibility and recovery from garden paths: An eye-tracking study. Journal of Experimental Psychology: Learning, Memory, and Cognition, 24(4), 940-961 věta se slepou kolejí = lokálně víceznačná věta, při jejímž čtení nejprve vzniká mylná syntaktická interpretace, kterou je později potřeba přehodnotit, aby bylo dosaženo správného porozumění [angl. garden-path sentence] (3) Korpus ORAL2013 se skládá z 835 nahrávek o celkové délce 17 471 minut, respektive 2 785 189 textových slov, přičemž v nahrávkách vystupuje celkem 1297 unikátních mluvčích. Korpus je koncipován 9 Vzorek a populace 83 jako „reprezentativní vzorek spontánní mluvené češtiny používané v neformálních komunikačních situacích" (viz Křen and Waclawičová, 2019, s. 129). (4) Brysbaert et al. (2019) zkoumali tzv. slovní prevalenci, tedy to, kolik lidí zná různá slova. Zaměřili se na 61 858 anglických slov a pracovali se vzorkem 221 268 rodilých mluvčích angličtiny, kteří se účastnili online testování. (5) Harrington et al. (2000) analyzovali vánoční projevy královny Alžběty II. v 50. letech a v 80. letech 20. století. Zaměřovali se přitom na to, jak se změnila královnina výslovnost jednotlivých anglických samohlásek. Uvedených pět příkladů poukazuje na několik důležitých věcí. V prvé řadě je zřejmé, že obvykle nemůžeme zkoumat všechny jednotky, které bychom potenciálně zkoumat mohli. Dokonce lze říct, že jsme tomu často i dost vzdáleni. V příkladu (1) se pracuje s několika desítkami mluvčích z každého z uvedených měst, přičemž se však jedná o města s desítkami až stovkami tisíc obyvatel. Příklad (3) představuje velký mluvený korpus, avšak 1297 mluvčích je oproti celkové populaci České republiky rovněž jenom malý zlomek. Analogicky je tomu i v případě (4), byť je zde počet zkoumaných mluvčích zásadně větší. V empirickém výzkumu se z toho důvodu rozlišuje mezi vzorkem a populací. Vzorek představuje reálně zkoumané jednotky, populace celkovou množinu jednotek, z nichž je vzorek vybrán. Slovo populace může být trochu zavádějící, protože se v běžné řeči používá zejména pro označení množiny obyvatel určitého města, státu či nějaké oblasti. Takové populace samozřejmě můžeme zkoumat, často jsou však cílovou populací, na niž chceme zobecňovat, dosti jiné množiny jednotek. Zaprvé nemusí být populace vůbec složena z lidí. Pokud se například zaměřujeme na jazyk českého denního tisku v roce 2015, budou populací všechny texty, které byly otištěny v českém denním tisku v roce 2015. Pokud chceme zkoumat třeba jazyk reklamy v Radiul v nultých a desátých letech 21. století, pak budou populaci tvořit všechny reklamy, které byly odvysílány v Radiul v daném časovém období. Zadruhé může být populace složena z množin osob, které jsou vymezeny nějakými specifickými charakteristikami. Například nás mohou zajímat postoje k jazyku u současných středoškoláků v Ostravě ve srovnání s ostravskými padesátníky V takovém případě tvoří populaci všichni ostravští středoškoláci a padesátníci. V některých případech můžeme zkoumat celou populaci - možná trochu paradoxně k tomu má nejblíž příklad (5), v němž představuje populaci jedna osoba (Alžběta II.) a vzorek pak její vánoční projevy z dvou časových období. Ve většině případů se však populace a vzorek liší, a to i diametrálně. Pro jakýkoliv empirický výzkum je tak klíčové, jaký je mezi vzorkem a populací vztah, přesněji to, nakolik vlastnosti zjištěné analýzou vzorku spolehlivě odráží vlastnosti celé populace. Tento vztah se obvykle nazírá jako reprezentativnost, což je míra, nakolik charakteristiky vzorku odpovídají charakteristikám populace. Reprezentativnost můžeme chápat jako určitou škálu: Vzorek může být jasně nereprezenta-tivní (představme si třeba, že bychom ve výzkumu čtenářských dovedností pracovali se vzorkem složeným ze studentů nějakého elitního Křen, M., & Waclawičová, M. (2019). Srovnání mluvených korpusů: Skutečně jen odlišná hlediska? Slovo a Slovesnost, 80(2), 128-139 Brysbaert, M., Mandera, R, McCormick, S. R, & Keuleers, E. (2019). Word prevalence norms for 62,000 English lemmas. Behavior research methods, 51(2), 467-479 slovní prevalence = míra znalosti slova v určité populaci [angl. word prevalence] Harrington, J., Palethorpe, S., & Watson, C. I. (2000). Does the Queen speak the Queen's English? Nature, 408(6815), 927-928 vzorek = množina jednotek, které reálně podrobujeme výzkumu [angl. sample] populace = množina jednotek, na které zobecňujeme výsledky výzkumu [angl. population] reprezentativnost = míra, do jaké vlastnosti vzorku odpovídají vlastnostem populace [angl. representativeness] gymnázia a následne zobecňovali na středoškoláky v České republice). Jindy však může pomerné dobře odrážet charakteristiky populace a můžeme o něm tak tvrdit, že je reprezentativní (viz ještě způsoby výběru vzorku níže). V ještě jiných případech může být reprezentativnost nějak sporná, nejednoznačná. Problém spočívá v tom, že vlastně nevíme s jistotou, co pro danou populaci přesně platí, takže reprezentativnost vzorku je něco, co spíše odhadujeme na základě určitých principů. Terminologická poznámka: reprezentativnost v korpusu V korpusové lingvistice se reprezentativnost chápe jinak než v jiných disciplínách, což může být poněkud zavádějící. Zatímco v sociálních vědách obecně se za reprezentativní považuje vzorek, který dobře odráží vlastnosti populace, v korpusové lingvistice se pracuje s reprezentativností jako s vlastností korpusu. Za reprezentativní korpus je pak považován korpus, „obsahuje-li v dostatečném množství texty všech jeho variet" (viz https://wiki.korpus.cz/doku.php/: pojmy:reprezentativnost). Jde tedy o míru zastoupení variet v korpusu, nikoliv o to, zda vzorek textů, které korpus obsahuje, svými charakteristikami odpovídá populaci textů, kterou má korpus odrážet. V této knize se s reprezentativností pracuje tak, jako je tomu zvykem v sociálních vědách. Na základě výzkumu provedeného na nějakém vzorku se vždy snažíme zobecňovat na to, co platí pro určitou populaci. Vzhledem k tomu, že reprezentativnosti je obvykle dosaženo jen do jisté míry, jsou taková zobecnění spojena s určitými nepřesnostmi, kterým říkáme zkreslení (viz ještě později). Je tedy zásadní vybírat vzorek vždy tak, aby co nejlépe odpovídal populaci a výsledné zkreslení bylo co nejnižší. To je však komplikováno praktickými možnostmi výzkumu. Opět se tak dostáváme k tomu, že realizace každého výzkumu je otázkou vyvažování mezi ideálními řešeními a praktickými možnostmi badatele či badatelského týmu. Než se podíváme na způsoby, jakými se dá vzorek vybírat, je třeba se zastavit ještě u jedné věci, která je pro výzkum jazyka a jeho užívání charakteristická. V lingvistice a spřízněných oborech má totiž vzorek často dvojí podobu - jednak bývá výzkum založen na určitých osobách, jednak na určitých jazykových jednotkách. Podíváme-li se na příklad (2) výše, vidíme, že se pracuje se vzorkem 32 studentů a se vzorkem 24 experimentálních itemů. Obě tyto množiny by mohly být složeny jinak, což by mělo pro celkový výzkum různé následky (větší počet itemů by prodloužil experiment, větší počet studentů by zase přinesl větší finanční náročnost výzkumu). Dvojí podoba vzorku je přítomná i ve všech ostatních případech, a to i v příkladu (5), ačkoliv o počtu analyzovaných samohlásek nemáme přesný údaj. Dvojí tvář vzorku v lingvistice je zcela zásadní jev, který je potřeba vnímat jak při tvorbě vlastního výzkumu, tak při kritické analýze publikovaných studií. Tím, že se nepracuje s jedním vzorkem, ale se dvěma, se zdvojnásobuje riziko zkreslení, nesprávného zobecnění získaných výsledků. 9 Vzorek a populace 85 9.1 Způsoby výběru vzorku Existují různé způsoby, jak vzorek vybírat. Podívejme se na několik příkladů: (6) Bailey a Dyer(ová) (1992) zkoumali fonologické a gramatické změny probíhající v Texasu. Napojili se na tehdejší průzkum veřejného mínění v Texasu, který se realizoval po telefonu. Do tohoto průzkumu zařadili několik svých sociolingvistických otázek a následně měli rovněž k dispozici audiozáznamy proběhnuvších telefonních hovorů (celkově okolo 500 hodin nahrávek). Z celého Texasu bylo náhodně vybráno 1000 domácností s telefonem (pevnou linkou, která v té době byla standardním vybavením prakticky jakékoliv domácnosti). Na každé číslo se badatelé pokusili zavolat maximálně pětkrát, pokud se dovolali, chtěli mluvit s tím členem domácnosti, jehož narozeniny byly nejblíže. Výzkumu se celkově zúčastnilo 70 % z náhodně vybraných domácností. (7) Výzkumy Centra pro výzkum veřejného mínění (CVVM; https: //cvvm.soc.cas.cz/) jsou obvykle založeny na odpovědích cca 1000 obyvatel ČR ve věku 15 a více let. Tento vzorek je sestavován tak, že napodobuje vlastnosti populace obyvatel ČR - ve vzorku je tak zhruba stejné procentuální zastoupení různých charakteristik (například vzdělání, věk, pohlaví apod.) jako v populaci obyvatel ČR, což jsou údaje známé díky sčítání lidu. Tento vzorek se získává prostřednictvím sítě tazatelů po celé republice. (8) V zimním semestru 2019/2020 byl v rámci semináře Empirické metody v lingvistice realizován on-line experiment zaměřený na porozumění českým větám. K účasti ve výzkumu vyzývali studenti semináře své přátele na Facebooku. Celkově se tak podařilo získat vzorek 113 rodilých mluvčích češtiny. (9) Markéta Ochodková (2021) realizovala výzkum konkurence mezi měkkým a tvrdým skloňováním u substantiv (například 2sg řidiče vs. fidiča, 6sg stroji vs. stroju apod.) v karvinské mluvě. Zajímalo ji přitom, zda dochází k jazykové změně. Z praktického hlediska se rozhodla pro vzorek 40 osob, přičemž 20 bylo z mladší generace (15-20 let) a 20 ze starší generace (nad 65 let). Každou dvacítku tvořilo 10 mužů a 10 žen. Do vzorku byly zařazeny osoby žijící od narození (respektive velmi brzkého věku) v Karviné. Bailey, G., & Dyer, M. (1992). An approach to sampling in dialectology. American Speech, 67(1), 3-20 Ochodková, M. (2021). Vývojové tendence ve variaci substantívni flexe v karvinské běžné mluvě [Bakalářská práce]. Filozofická fakulta Univerzity Karlovy Uvedené čtyři příklady představují poměrně odlišné způsoby, jak vzorek sestavovat, respektive vybírat. Připravujeme-li nějaký výzkum, máme poměrně hodně možností, jak k výběru vzorku přistoupit. Ať už se rozhodneme jakkoliv, je to spojeno s různými problémy. Někdy může být výběr vzorku spojen s velkými nároky na badatele či badatelský tým. Srovnáme-li příklady (6) a (9), je zřejmé, že texaský výzkum může být ambicióznější na adekvátní zobecnění, jeho realizace je však zcela zásadně náročnější. Vzorky v příkladech (8) a (9) jsou snadněji sestavitelné, je však sporné, nakolik vlastně můžeme na jejich základě korektně zobecnit na cílovou populaci. 9 Vzorek a populace 86 Základní rozdíl mezi různými způsoby stavby vzorku spočívá v tom, zda je výběr takzvaně pravděpodobnostní, anebo není. Pravděpodobnostnímu výběru se běžně říká náhodný výběr a ilustruje ho příklad (6). Klíčový princip u pravděpodobnostního/náhodného výběru spočívá v tom, že každá jednotka populace má stejnou šanci (pravděpodobnost) dostat se do vzorku. Slovo „náhodný" může být v tomto případě zavádějící, protože v běžném jazyce se náhoda chápe mnohem siřeji. Náhodnost výběru spočívá v tom, že žádná z jednotek není nijak upřednostněna, a to ani vůlí badatele, ani jinými faktory. Výběry, které nesplňují princip, že každá jednotka z populace má stejnou šanci se dostat do vzorku, nazýváme nepravděpodobnostní. Mezi různými nepravděpodobnostními výběry však existují dost velké rozdíly. Vidět to můžeme například ze srovnání příkladů (7) a (8). Vzorek v příkladu (7) je založen na tom, že se badatelé snaží co nejvíce napodobit to, jak vypadá daná populace. Usilují tedy o to, aby vzorek odrážel známé vlastnosti populace. Oproti tomu vzorek v příkladu (8) se o odrážení vlastností populace nesnaží, ale zaměřuje se prostě na ty jedince, kteří jsou k dispozici a ochotni se zúčastnit. To má pochopitelně dost zásadní dopady na otázku zobecnitelnosti výsledků (viz ještě níže). Zatímco v příkladu (7) lze uvažovat o tom, že je daný vzorek vcelku reprezentativní, v příkladu (8) se o reprezentativnosti zcela jistě mluvit nedá. Příklad (7) je typickým příkladem takzvaného kvótního výběru. Při výběru vzorku jsou na základě známých vlastností populace stanoveny určité kvóty a ty jsou následně naplňovány jednotkami, které jsou k dispozici. Pokud bychom například dělali kvótní výběr z populace aktuálních studentů bakalářského programu Český jazyk a literatura na Filozofické fakultě Univerzity Karlovy, mohli bychom stanovit kvóty na základě jednotlivých ročníků. K 12. červenci 2020 studovalo tento program 269 studentů, přičemž v 1. ročníku šlo o 109 osob, v 2. ročníku o 49 osob, ve 3. ročníku o 68 osob a ve 4. a vyšším ročníku o 43 osob. Kdybychom tedy chtěli vybrat kvótním výběrem vzorek o velikosti 60 studentů, měli bychom zachovat poměr, který platí pro danou populaci. Vybrali bychom tak 24 studentů z prvního ročníku, 11 z druhého, 15 ze třetího a 10 ze čtvrtého a vyššího. (Kvóty by pochopitelně mohly být komplikovanější a mohli bychom v nich například zohledňovat i pohlaví studentů nebo to, zda studují samostatné či sdružené studium.) Příklady (8) a (9) představují účelový výběr, který je založen ryze na rozhodnutí badatele. V rámci účelového výběru se pak dají rozlišit ještě různé specifičtější podtypy: (a) příležitostný výběr je založen na tom, že vzorek vybíráme z jednotek, které jsou snadno k dispozici (viz příklad (8)) (b) konsekutivní výběr vychází z toho, že se stanoví určité kvóty (bez snahy napodobovat populaci) a do vzorku se zařazují různé jednotky až do naplnění těchto kvót (viz příklad (9)) (c) technika sněhové koule je způsob výběru vzorku, kde jedinci, kteří byli zařazeni do vzorku) (a typicky již podrobeni výzkumu) doporučují do vzorku další osoby, které znají Poslední uvedený typ výběru vzorku je obzvláště užitečný v případech, kdy danou populaci vůbec neznáme a nemáme se při výběru o co opřít. Jeho užití je časté v dialektologickém či variačně sociolingvistickém výzkumu. náhodný výběr = výběr založený na principu, že každá jednotka má stejnou šanci dostat se do vzorku [angl. random/prob-ability sampling] nepravděpodobnostní výběr = souhrnné označení způsobů výběru vzorku, které nejsou založeny na principu, že má každá jednotka stejnou šanci dostat se do vzorku [angl. non-probability sampling] kvótní výběru = výběr, v němž se napodobují známé vlastnosti populace [angl. quota sampling] účelový výběr = způsob výběru vzorku, který je plně založen na rozhodnutí badatele [angl. judgmental sample] příležitostný výběr = výběr vzorku, kdy vybíráme z jednotek, jež nám jsou snadno k dispozici [angl. opportunistic sampling] konsekutivní výběr = typ účelového výběru, kdy se naplňují určité nastavené kvóty jednotek bez přímého vztahu ke zkoumané populaci [angl. consecutive sampling] technika sněhové koule = způsob výběru vzorku, kde jedinci, kteří byli zařazeni do vzorku doporučují do vzorku další osoby, které znají [angl. snowball sampling] 9.2 Volba výběru vzorku Při vybírání vzorku je třeba se nejprve zamyslet nad tím, v čem může nevhodně vybraný vzorek celému výzkumu uškodit. Již jsme zmínili problém reprezentativnosti. Pokud nebudeme mít dobré důvody předpokládat, že je vzorek reprezentativní, bude náš výzkum velmi pravděpodobně přinášet nějakým způsobem zavádějící a nepřesná zobecnění. Podíváme-li se však na praxi v lingvistickém výzkumu (a nejen v něm), jsou nereprezentativní vzorky běžným jevem, a to kvůli tomu, že reprezentativní vzorek prostě není při nejlepší vůli z praktického hlediska dosažitelný. Poměrně zásadní otázkou tak je, nakolik jsou naše poznatky z takovýchto výzkumů vůbec relevantní. Na tuto otázku není jednoduché odpovědět. Jasné je, že musíme být ve svých zobecněních opatrní a stejně tak musíme pečlivě zvažovat, nakolik důvěryhodná zobecnění předkládají studie, které čteme. Samotná nereprezentativnost vzorku však není důvodem, proč výzkum považovat za špatný. K celému problému se ještě vrátíme v další kapitole, kde se budeme věnovat zkreslením, validitě, reliabilitě a replikovatelnosti výzkumu. V ideálním případě je nejlepší způsob výběru vzorku náhodný (pravděpodobnostní) výběr. Pokud jsou jednotky do vzorku vybrány v technickém slova smyslu náhodně (například je ze soupisu celé populace vygeneruje počítač, nebo je třeba vylosujeme apod.) a tento vzorek je rozumně velký (o velikosti vzorku viz ještě níže), můžeme předpokládat, že takový vzorek dobře odráží všechny vlastnosti cílové populace. Tento předpoklad je odůvodněný statistickými zákonitostmi. Pokud budeme mít například skupinu tisíc lidí, v níž bude 700 žen a 300 mužů, a z této skupiny budeme náhodně losovat 100 jedinců, je velice pravděpodobné, že dospějeme k vzorku, v němž bude okolo 70 žen a okolo 30 mužů. Je docela dobře možné, že to bude kupříkladu 65 žen a 35 mužů (nebo třeba 73 žen a 27 mužů), ale je extrémně nepravděpodobné, že by to bylo třeba 20 žen a 80 mužů. Díky těmto statistickým principům si můžeme být poměrně dobře jisti, že vzorek dobře odráží jak známé, tak i neznámé vlastnosti populace. To je klíčový prvek náhodného výběru, protože se může často stát, že sice máme nějaký soupis populace, ale o jejích vlastnostech víme relativně málo. Z praktického hlediska je však náhodný výběr uskutečnitelný spíše jen ve specifických případech, vyžaduje totiž z povahy věci určité náležitosti. Abychom mohli naplnit princip, že má každá jednotka populace stejnou šanci dostat se do vzorku, musíme disponovat soupisem populace, z něhož pak náhodně vybíráme. Takový soupis však typicky nemáme. Pokud ho máme, narážíme na druhý problém, a to, že v případě, kdy populaci tvoří lidé. Zdaleka ne každý totiž musí být ochoten se výzkumu zúčastnit, případně zdaleka ne každého se nám podaří úspěšně kontaktovat. V příkladu (6) jsme ostatně viděli, že při uskutečnění náhodného výběru byli badatelé schopni do výzkumu zahrnout pouze 70 % původně plánovaného vzorku. Problém náhodného výběru spočívá v tom, že se ti, kteří se odmítnou účastnit, nedají nahrazovat, alespoň pokud chceme zachovat výchozí princip náhodného výběru. To, že se někdo odmítne výzkumu účastnit, může být totiž zapříčiněno faktory, které jsou pro daný výzkum důležité. Tím se narušuje reprezentativnost celého výzkumu. Na náhodný výběr tak můžeme ve výzkumu jazyka a jeho užívání narazit nejčastěji tehdy, když cílovou populací nejsou lidé. Náhodně můžeme 9 Vzorek a populace 88 například vybrat určitou množinu výskytů nějakého jevu v korpusu, anebo bychom mohli náhodně vybírat třeba výšeuvedené reklamy na Radiul. O reprezentativnost obvykle usiluje kvótní výběr. Ten záměrně napodobuje známé vlastnosti populace. K jeho realizaci nepotřebujeme nutně soupis jednotek populace, avšak musíme o populaci něco vědět. Díky sčítání lidu známe různé charakteristiky obyvatelstva, což je ostatně důvodem, proč se kvótní výběr využívá při různých průzkumech veřejného mínění. V řadě případů však máme o populaci pouze mlhavou představu (představme si třeba, že bychom chtěli zkoumat komunikaci mezi IT pracovníky v Praze), takže se vlastně nemáme o co opřít, když chceme stanovit kvóty. I pokud známe různé charakteristiky populace a jsme schopni stanovit smysluplné kvóty, narážíme na problém, že nejsme schopni napodobovat neznámé vlastnosti populace (na rozdíl od náhodného výběru). Hrozí tak, že vzorek bude v posledku nevyvážený a nebudou v něm systematicky zastoupeny určité specifické jednotky populace. Účelové výběry o reprezentativnost obvykle nijak neusilují, respektive u nich není zcela jasné, nakolik odráží cílovou populaci. Jejich velkou výhodou je praktická realizovatelnost - abychom vybrali vzorek účelově, nemusíme splňovat žádné předchozí požadavky. V tabulce č. 9.1 uvádíme přehledně výhody a nevýhody jednotlivých způsobů výběru vzorku. Tabulka 9.1: Stručný přehled výhod a nevýhod jednotlivých způsobů výběru vzorku. způsob výběru vzorku podmínky realizace výhody nevýhody náhodný výběr soupis populace dobře odráží známé i neznámé obtížná realizovatelnost přístup k jednotkám vlastnosti populace kvótní výběr znalost vlastností populace odráží známé vlastnosti popu- opomenutí neznámých vlast- lace ností populace účelový výběr kdykoliv snadno realizovatelný nereprezentativní 9.3 Velikost vzorku Kromě samotného způsobu výběru vzorku je zásadní, jak je vzorek velký. Pokud by vzorek tvořilo jenom několik lidí, bylo by prakticky jedno, jakým způsobem jsme je vybrali - ani náhodný výběr by zde nezajišťoval reprezentativnost. Lze říci, že obecně platí, že čím větší vzorek je, tím lépe. Na druhou stranu je však zřejmé, že čím větší vzorek chceme mít, tím náročnější pro nás bude sběr dat. Jak se tedy rozhodnout? Při určení velikosti vzorku se lze řídit různými poučkami. Obecně platí, že v případě, že je naše populace poměrně homogenní a nepředpokládáme výrazné rozdíly mezi jednotlivci, stačí nám menší vzorek než v případě, že zkoumáme heterogenní populaci s mnoha vnitřními rozdíly. Můžeme předpokládat, že se nám může stát, že vybereme nějakou jednotku, která bude v rámci celé populace vykazovat extrémní výsledky. Taková jednotka může vychýlit naše výsledky, a to tím víc, čím méně dalších jednotek ve vzorku máme. V tomto smyslu se často říká obecná poučka, že nám z homogenní populace stačí vybrat 30 a více jednotek. Při tomto počtu už případné extrémní jednotky, které vybereme, celkové výsledky ovlivňují jen málo. Z příkladů výše jsme viděli, že vzorky se pohybují ve velmi různorodých velikostech - od jednoho mluvčího až po statisíce. Velikost vzorku je nicméně závislá na praktických možnostech i celkovém zaměření výzkumu. V každém případě je důležité, aby si autoři výzkumu byli schopni vzorek z těchto hledisek obhájit. 9.4 Otázky na přemýšlení Zamyslete se nad nějakou empirickou studií, kterou jste v poslední době četli. Zkuste odpovědět na tyto otázky: 1. Jaký způsob vzorku byl ve studii používán a proč? 2. Byl použitý vzorek dostatečně velký? Proč? 3. Bylo by z praktického hlediska možné využít pro daný výzkum i jiný, lepší způsob vzorku? Jaký a proč? 4. Jaká byla populace, na kterou výzkum zobecňoval? Byla populace v textu explicitně diskutovaná? výsledky Proměnné a výsledky 10 V předchozí části knihy jsme se věnovali sběru dat, konkrétně různým výzkumným technikám a také otázce vzorku, s nímž ve výzkumu pracu- 10-1 JYPY proměnných .... 92 jeme. Nyní se zaměříme na to, jak uvažovat o datech, která jsme získali. V 10.2 Vyčíslení proměnných . 93 této kapitole si detailněji rozebereme pojem proměnná a podíváme se na 10.3 Operacionalizace proměn- to, co nám různé proměnné umožňují. S tímto pojmem jsme v této knize ných............. 94 pracovali už na řadě míst. Proměnnou jsme si definovali jako abstraktní 10.4 Rozdělení dat....... 96 jednotku, která může nabývat různých konkrétních hodnot. Zároveň jsme Nominální proměnné . . 96 dávali proměnné do spojitosti s hypotézami a v té souvislosti jsme rozlišili Radové proměnné .... 97 nezávislé a závislé proměnné a říkali jsme si, že proměnné můžeme ve Numerické proměnné . 98 výzkumu nějakým způsobem manipulovat. 10.5 Typy rozdělení...... 101 Normální rozdělení . . . 103 V této kapitole se na proměnné podíváme o mnoho podrobněji než „ „ , „ ť , , i 10-6 Otázky na přemýšlení . 104 dosud, zaměříme se na rozdíly mezi různými typy proměnných a na to, co z těchto rozdílů vyplývá, respektive co nám různé typy proměnných vlastně umožňují ve výzkumu dělat. Nejprve se ale podívejme na několik příkladů. (1) Ceháková a Chromý (2023) analyzovali zpracování vět se slepou kolejí v češtině. Účastníky výzkumu nechali číst mimo jiné věty typu Ostražitý policista prohledal obchodnici před prodejnou dodávku a odjel na služebnu a po přečtení věty jim vždy položili nějakou otázku. Ve dvou z experimentů šlo o zjišťovací otázky (například Prohledal policista obchodnici?), přičemž účastníci výzkumu volili mezi odpověďmi „ano", „ne" a „nevím". (2) V některých výzkumech může mít smysl zjišťovat aktuální náladu účastníků. Takový účel má tzv. Profile of Mood States (McNair et al., 1971), který do češtiny adaptovali Stuchlíková et al. (2005). Tato technika se zaměřuje na šest faktorů, konkrétně na tenzi, depresi, hněv, vitalitu, únavu a zmätenosť. Každý faktor se zjišťuje pomocí několika otázek na to, jak se daná osoba cítila v průběhu uplynulého týdne, přičemž daná osoba se vyjadřuje k určitému afektivnímu stavu, například rozzlobený/rozzlobená, a to pomocí pětistupňové škály (vůbec ne - trochu - středně - značně - velmi značně). (3) Adam Kříž (2020) v jedné části své disertační práci zkoumal, jak rychle si rodilí mluvčí slovenštiny žijící dlouhodobě v Praze vybavují slova ve slovenštině a v češtině. Využíval k tomu techniku pojmenování obrázků a jako hlavní měřítko používal dobu (v milisekundách), která uběhla mezi zobrazením obrázku a počátkem vyslovování cílového slova. (4) Marie Hamanová (2020) se ve své diplomové práci zaměřovala mimo jiné na verbální fluenci rodilých mluvčích češtiny z hlediska toho, nakolik ovládají jiné jazyky. V jedné části výzkumu prezentovala určitou kategorii (například zvíře) a účastníci měli za úkol Ceháková, M., & Chromý, J. (2023). Garden-path sentences and the diversity of their (mis)representations. PLoS ONE, 18(7), e0288817 McNair, D. M., Lorr, M., & Droppleman, L. F. (1971). Manual for the Profile of Mood States. Educational; Industrial Testing Services Stuchlíková, I., Man, E, & Hagtvet, K. (2005). Dotazník k měření afektivních stavů: Konfirmační faktorová analýza krátké české verze. Československá psychologie, 49(5), 459-467 Kříž, A. (2020). Jazykové chování slovenských rodilých mluvčích v Čechách [Doctoral dissertation, Filozofická fakulta Univerzity Karlovy], https:/ /dspace.cuni.cz/ handle/20.500.11956/124140 Hamanová, M.-A. (2020). Bilingvismus jako nevýhoda? Lexikální vybavování v prvním jazyce bilingvních mluvčích [Master's thesis, Filozofická fakulta Univerzity Karlovy], https://dspace.cuni.cz/ handle/20.500.11956/123007 10 Proměnné a výsledky 92 během jedné minuty vyjmenovat co nejvíce členů této kategorie (pes, kočka, kráva...). Účastníci uváděli průměrně asi 26 jednotek, přičemž minimální počet vyjmenovaných členů byl 13 a maximální 39. Když se podíváme na to, jaké proměnné se v uvedených příkladech používaly, můžeme si všimnout určitých rozdílů. V příkladu (1) se používala proměnná, která představovala odpovědi na zjišťovací otázky a mohla nabývat pouze tří hodnot (ano, ne, nevím). V příkladu (2) šlo proměnné, které zachycovaly pozici na pětistupňové škále. Tyto proměnné tak mohly vždy nabývat pouze pěti hodnot. Příklad (3) představuje zase trochu jinou proměnnou - na rozdíl od předchozích případů jsou její hodnoty číselné a odpovídají času v milisekundách. Číselné hodnoty má i proměnná počet jednotek vyjmenovaných v testu verbální fluence v příkladu (4). Tyto čtyři příklady dobře ilustrují rozdíly, které mohou existovat mezi různými proměnnými. Jak si ukážeme, mají tyto rozdíly poměrně důležitý dopad na to, co s danými proměnnými můžeme dělat při zpracování výsledků. 10.1 Typy proměnných Prvním typem proměnných, který si vymezíme, jsou numerické proměnné, což jsou proměnné, jejichž hodnoty představují určité číselné údaje. Mezi numerické proměnné tak spadají proměnné z příkladů (3) a (4), tedy čas v milisekundách a počet vyjmenovaných jednotek. Můžeme si ale všimnout, že tyhle příklady se od sebe trochu liší. Proměnná čas v milisekundách z příkladu (3) může nabývat potenciálně nekonečného množství hodnot (včetně desetinných čísel), například mezi hodnotami 351 ms a 352 ms může nabývat neomezeného množství hodnot (třeba 351,1 ms, 351,4897135 ms, 351,9999 ms atd.). Oproti tomu proměnná počet slov vyjmenovaných v testu verbální fluence z příkladu (4) je z hlediska možných hodnot omezená na celá čísla - kupříkladu mezi hodnotami 30 a 31 žádné další hodnoty nejsou (není z principu možné vyjmenovat 30,49 členů určité kategorie). Numerické proměnné z toho důvodu rozdělujeme ještě na spojité (kontinuální) proměnné a na nespojité (diskrétní) proměnné. Kontinuální proměnné mohou nabývat potenciálně nekonečného množství hodnot v rámci určitého rozsahu, zatímco diskrétní proměnné mají z principu omezený počet hodnot. Příklady (1) a (2) pak představují takzvané kategoriální proměnné (někdy též kvalitativní). Jednotlivé hodnoty těchto proměnných nejsou číselné a představují vlastně příslušnost k určité kategorii - například ke kategoriím ano, ne, nevím v příkladu (1), nebo ke kategoriím představujícím jednotlivé stupně škály v příkladu (2). Když se na tyto dvě proměnné podíváme blíže, můžeme si všimnout jednoho rozdílu mezi nimi. Zatímco v příkladu (2) můžeme hodnoty proměnných seřadit od nejnižší (vůbec ne) po nejvyšší (velmi značně), v příkladu (1) jsou jednotlivé hodnoty na stejné úrovni, respektive je podobným způsobem seřadit nemůžeme (nedává smysl říct, že ano je víc než nevím, nebo méně než ne apod.). Z toho důvodu rozlišujeme v rámci kategoriálních proměnných takzvané nominální a řadové proměnné. Hodnoty nominálních proměnných poukazují prostě jen na příslušnost k určité skupině či členství v určité numerická proměnná = proměnná, jejíž hodnoty představují číselné údaje [angl. numeric variable] spojitá (kontinuální) proměnná = proměnná, která může nabývat potenciálně nekonečného množství hodnot, protože její hodnoty představují určité kontinuum [angl. continuous variable] nespojitá (diskrétní) proměnná = proměnná, která může nabývat jenom omezeného množství hodnot, které nejsou dále členitelné [angl. discrete variable] kategoriální (kvalitativní) proměnná = proměnná, jejíž hodnoty nejsou číselné a označují příslušnost ke kategorii [angl. categorial variable] nominální proměnná = proměnná, jejíž hodnoty nejsou číselné a nelze seřadit od nejmenší po největší [angl. nominal variable] řadová (ordinální) proměnná = proměnná, jejíž hodnoty lze seřadit od nejmenší po největší, ale nejsou číselné [angl. ordinal variable] 10 Proměnné a výsledky 93 kategorii a nedává smysl u nich uvažovat o tom, že je nějaká hodnota nižší nebo vyšší než jiná - viz příklad (1). Radové (ordinální) proměnné jsou oproti tomu takové kategoriální proměnné, jejichž hodnoty můžeme podle určitého klíče seřadit od nejnižší po nejvyšší. 10.2 Vyčíslení proměnných Rozlišení typů proměnných není samoúčelná klasifikace, vytvořená pro účely týrání studentů u zkoušek, anebo proto, že někoho bavilo vymýšlení nových názvů. Vychází z podstatných rozdílů mezi proměnnými, které mají vliv na to, jak s nimi můžeme v našem výzkumu pracovat a jaké to má následky pro zpracování výsledků. Například s číselnými proměnnými nelze dělat totéž, co s kategoriálními proměnnými. Podívejme se nejprve, jak různé typy proměnných souvisí s takzvanými středními hodnotami, které už nejspíše dobře znáte (pro přehled viz Box 11.1). Box 11.1: Střední hodnoty (měřítka centrální tendence) Když nasbíráme určitá data, získáme velké množství různých konkrétních hodnot různých proměnných. Abychom se v tom vyznali, dává smysl naše data nějak popsat. Jedním z nejjednodušších způsobů, jak to udělat, je vyjádřit u jednotlivých proměnných jejich centrální tendenci, tj. jejich střední hodnotu. Jde vlastně o to, že identifikujeme určitou hodnotu, která je nějak „uprostřed". Pro tyto účely se používají tři typy hodnot: aritmetrický průměr, medián a modus. Aritmetrický průměr = součet všech hodnot vydělený počtem těchto hodnot. Medián = hodnota, která stojí přesně uprostřed, pokud všechny naměřené hodnoty uspořádáme od nejnižší po nejvyšší (pokud je hodnot sudý počet, je medián průměr dvou prostředních hodnot, pokud se od sebe liší). Modus = nejčastěji obsažená hodnota. Všimněme si, že jednotlivé proměnné se liší v tom, jaké střední hodnoty u nich můžeme určovat. U numerických proměnných je to jednoduché, protože u nich můžeme snadno spočítat jak průměr, tak medián, tak modus. U kategoriálních proměnných je to ale složitější. Nominální proměnné mohou vyjadřovat jedině modus (tedy to, že je nějaká hodnota nejčastější), ale nejde u nich určovat medián (hodnoty nemůžeme seřadit od nejmenší po největší) ani průměr (nemůžeme hodnoty sečíst a pak vydělit jejich počtem). Radové proměnné mohou kromě modu vyjadřovat i medián, protože u nich můžeme hodnoty uspořádat od nejmenší po největší. Průměr u řadových proměnných určovat nemůžeme (nemůžeme například sečíst vůbec ne a trochu). Sumarizaci toho, jaké střední hodnoty můžeme u jednotlivých typů proměnných určit, uvádíme v Tabulce 10.1. 10 Proměnné a výsledky 94 Tabulka 10.1: Shrnutí toho, jaké střední hodnoty lze u jednotlivých proměnných určovat typ proměnné příklad modus medián průměr numerická reakční čas ano ano ano (320 ms, 487 ms...) řadová škála ano ano ne (vůbec ne, trochu...) nominální odpověď ano ne ne (ano, ne, nevím...) 10.3 Operacionalizace proměnných Velmi důležitým aspektem jakéhokoliv výzkumu je to, že proměnné nejsou dány předem, ale že je vlastně v rámci výzkumu nějak utváříme, vymezujeme si je. Tomuto procesu se říká operacionalizace. Operacionalizace proměnných spočívá vlastně v převedení představy o určitém jevu do měřitelných jednotek. V podstatě jde o to, že si proměnnou nějak vymezíme a stanovíme si, jakých hodnot může v našem výzkumu nabývat a jak se tyto hodnoty stanovují na základě naměřených dat. To se týká i zdánlivě bezproblémových proměnných, jako je třeba věk. Ten můžeme operacionalizovat různě. V různých výzkumech můžeme běžně narazit na tři možnosti. Velmi často se pracuje s jednotkami let (například 32, 23, 18, 79 let...) a v takovém případě je proměnná věk operacionalizovaná jakožto numerická. Nezřídka ale lze narazit i na určitá rozmezí (22-25 let, 26-30 let atd.) a pak jde o řadovou proměnnou. Někdy se s věkem pracuje ještě obecněji a rozlišují se třeba kategorie typu mladší a starší mluvčí (vymezené například jako mladší 35 let vs. starší 35 let) a pak se s věkem pracuje jakožto s proměnnou nominální. Operacionalizace má zásadní dopady na možnosti statistického zpracování dat a také na samotnou informativnost celého výzkumu. Když si srovnáme uvedené tři způsoby operacionalizace proměnné věk, vidíme, že nám dávají různě podrobnou informaci. Zatímco v prvním případu u každé jednotky, kterou do výzkumu zařadíme, máme informaci o přesném věku, v druhém případě máme tuto informaci jenom přibližnou (víme, v jakém rozmezí se nachází), ve třetím případě o věku každé jednotky víme jen velmi málo a dokonce to může být i tak, že dvě osoby spadající do stejné kategorie si mohou být reálně věkově vzdálenější než dvě osoby z různých kategorií (například osobu ve věku 33 let bychom kategorizovali jako mladší, zatímco osobu ve věku 36 let jako starší, ačkoliv reálně je mezi nimi velmi malý rozdíl; naopak do kategorie starší by spadali třeba osoby ve věku 36 let a 89 let, tedy osoby od sebe vzdálené dvě generace). Všechny tři způsoby operacionalizace mohou mít svůj smysl, je však dobré si uvědomit například to, že pokud zvolíme operacionalizaci věku jako řadové proměnné, nebudeme moct vyčíslit průměrný věk účastníků výzkumu (a nebudeme moct použít spoustu dalších statistických měřítek). Při plánování výzkumu, respektive před sběrem dat musíme vždy operacionalizaci dobře promyslet. Operacionalizaci lze ovšem měnit i po nasbírání dat. V takovém případě však obecně platí, že můžeme operacionalizaci měnit bezproblémově pouze v tomto směru: numerické proměnné —> řadové proměnné —> nominální proměnné. Pokud je určitý jev operacionalizovaný jako numerická proměnná, můžeme z něj snadno operacionalizace = způsob převedení abstraktní představy do měřitelných jednotek [angl. operationalization] 10 Proměnné a výsledky 95 udělat řadovou, anebo nominální proměnnou. Platí přitom, že opera-cionalizaci určité proměnné můžeme měnit i beze změny typu proměnné. Například ve výzkumu v příkladu (1) se ze závislé proměnné odpověď s třemi hodnotami {ano, ne, nevím) vytvořila proměnná správnost odpovědi s dvěma hodnotami {správná, nesprávná). Stejně tak můžeme v rámci řadových proměnných v určitých případech zúžit určitou škálu z více stupňů na méně. Důležité každopádně je, že změnou operacionalizace z principu ztrácíme určité informace, takže je potřeba to dělat obezřetně. Ve specifických případech je možný i opačný směr změny operacionalizace. Ve výzkumech používajících škály se často řadové proměnné operacionalizují jako proměnné numerické. Jednotlivé stupně škály se očíslují a následně při zpracování dat pracuje s číselnými hodnotami. V případě škály uvedené v příkladu (2) bychom tak stupeň vůbec ne označili číslem 0, stupeň trochu číslem 1, stupeň středně číslem 2, stupeň značně číslem 3 a stupeň velmi značně číslem 4. Díky tomu získáme numerickou proměnnou a můžeme například spočítat průměrné skóre (což se ostatně ve vyhodnocení těchto dat používá). Samo o sobě je taková změna řadové proměnné na proměnnou numerickou možná, je ale přitom důležité myslet na dvě věci. Klíčové je zejména to, aby škála pokrývala dané kontinuum v úplnosti a aby jednotlivé stupně škály byly stejně „široké", tj. zachycovaly stejně velké výseky daného kontinua. Můžeme si to uvést na příkladu hypotetických škál uvedeném na obrázku 10.1. Zatímco první uvedená škála rozděluje kontinuum na víceméně rovnoměrné úseky, druhá škála je v tomto ohledu vytvořena špatně. Jednak jsou tři z pěti stupňů na pozitivní straně kontinua a jen dva na negativní straně, jednak se jednotlivé stupně značně liší tím, jak velký úsek kontinua pokrývají. Můžeme například předpokládat, že stupeň nepřijatelná zahrnuje typově mnohem širší okruh možností než stupeň extrémně nepřijatelná - tím pádem je mezi těmito stupni rozdíl nejenom v tom, k jaké kategorii referují, ale i v tom, jak jsou tyto kategorie „široké", jaký velký okruh hypotetických případů mohou vůbec zahrnovat. V případě, že bychom druhou uvedenou řadovou proměnou převedli na proměnnou numerickou, budeme mít problém, protože výsledné kalkulace (od prostého vypočítání průměru až po složitější statistické výpočty) budou zavádějící. Obrázek 10.1: Ilustrace rovnoměrně (nahoře) a nerovnoměrné (dole) rozdělené škály. 10 Proměnné a výsledky 96 10.4 Rozdělení dat Jedním z nejdůležitějších aspektů získaných dat je jejich rozdělení (distribuce), tj. vlastně to, v jaké míře jsou v datovém souboru zastoupeny jednotlivé hodnoty. Podobně jako se jednotlivé typy proměnných liší v tom, jaké střední hodnoty u nich můžeme zjišťovat, liší se i v tom, jakým způsobem mohou být naměřené hodnoty rozděleny. rozdělení (distribuce) dat = zastoupení jednotlivých hodnot v datovém souboru [angl. data distribution] Nominální proměnné Jak jsme řekli, jednotlivé hodnoty nominální proměnné pouze označují příslušnost ke kategorii, ale nemůžeme je seřadit od nejnižší po nejvyšší. Jedinou střední hodnotou, kterou u nich můžeme zjišťovat, je modus. Rozdělení dat proto typicky můžeme zachytit jednoduchou tabulkou zachycující frekvenci jednotlivých hodnot, případně sloupcovým grafem. Pro ilustraci si uveďme příklad reálného výzkumu. (5) Jan Chromý a Sonja Vojvodič (2023) se zaměřovali na to, nakolik si mluvčí češtiny vybavují informace z právě přečtených vět. V jednom z experimentů četli účastníci výzkumu věty typu Starší důchodce v neděli v knihovně velmi pečlivě pročetl noviny a následně dostali jednu ze tří otázek: (a) Co se stalo? (b) Kdy se to stalo? (c) Kde se to stalo? Jednotlivé odpovědi se následně kódovaly na správné a nesprávné. Výsledky jsou zachyceny v tabulce 10.2. otázka počet chyb celkem odpovědí % chyb Co se stalo? 16 674 2,37 % Kdy se to stalo? 121 673 17,98 % Kde se to stalo? 113 672 16,82 % Chromý, ]., & Vojvodič, S. (2023). When and where did it happen? Systematic differences in recall of core and optional sentence information. Quarterly journal of Experimental Psychology, 17470218231159190 Tabulka 10.2: Výsledky ze studie Chromý - Vojvodič (2023) V příkladu (5) je zachyceno rozdělení velmi jednoduché nominální proměnné, kterou můžeme nazvat chybovost odpovědí. Tabulka 10.2 uvádí nejprve absolutní frekvence chyb, tedy prostě to, kolikrát se pro jednotlivé otázky objevila ve výsledcích chybná odpověď. Procentuální údaje potom informují o relativní frekvenci, což je v tomto případě frekvence chyb vzhledem k celkovému počtu hodnot v datovém souboru. Relativní frekvence nás informuje o tom, jakou proporci z celkového počtu datových bodů zaujímají právě dané hodnoty (v tomto případě chyby). Relativní frekvence je velmi užitečná pro srovnávání mezi údaji (například srovnání pro různé hodnoty nezávislé proměnné, anebo srovnání s nějakým předchozím výzkumem), zatímco absolutní frekvence nám udává přesný počet výskytů. Obě hodnoty jsou proto užitečné a obecně platí, že bychom je měli pro dobrou přehlednost uvádět zároveň. Kdybychom uváděli pouze absolutní frekvenci, mohlo by to být pro čtenáře obtížně interpretovatelné. Naopak výhradní uvádění relativní frekvence může být velmi matoucí, protože čtenáři nedá představu, z jak velkého datového souboru se vychází. Pro ilustraci se můžeme podívat na tabulku 10.3. Rozdíl v relativní frekvenci mezi variantami hanil a haněl se zdá být velmi vysoký (téměř 50 %). Z údajů o absolutní frekvenci ale vidíme, že reálný rozdíl je pouhých 5 výskytů. Tabulka 10.3: Frekvence morfologických variant hanil a haněl v korpusu SYN2010. varianta relativní absolutní frekvence frekvence hanil 27,27 % 3 haněl 72,73 % 8 10 Proměnné a výsledky 97 Pro zobrazení rozdělení dat se kromě tabulek používají grafy. V případě nominálních proměnných je nejtypičtěji užívaným grafem sloupcový graf, v němž výška sloupce vyjadřuje počet výskytů určité hodnoty. Viz obrázek 10.2. Jak vidno, zobrazení rozdělení hodnot nám může do značné míry pomoci pro obecnou představu o tom, zda spolu nějaké proměnné nějak souvisí či nikoliv. V uvedeném příkladu vidíme celkem jasně, že odpovědi na otázky Co se stalo ? byly pro účastníky daného výzkumu velmi jednoduché, respektive že na ně odpovídali téměř vždy správně. Oproti tomu otázky Kdy se to stalo? a Kde se to stalo? byly spojeny s nápadně vyšší mírou chybovosti a vzájemně se lišily jenom málo. Řadové proměnné Řadové proměnné se od nominálních liší pouze v tom, že je možné jejich hodnoty seřadit od nejnižší po nejvyšší. To má ale určité důsledky pro možnosti zobrazení rozdělení. Rozdělení hodnot řadových proměnných můžeme zachytit stejným způsobem jako rozdělení hodnot proměnných nominálních (můžeme spočítat absolutní či relativní frekvenci jednotlivých hodnot, anebo udělat sloupcový graf), ale kromě toho máme k dispozici i další nástroje. Pro ilustraci si opět uvedeme příklad konkrétního výzkumu. (6) Barbora Hladíková (2018) ve své diplomové práci řešila aktuální tendence obouvidových sloves v češtině, přičemž využívala algoritmus pro ověřování vidové hodnoty sloves sestavený Veselým (2008). Jedním ze sloves, na které se zaměřila, bylo sloveso soustředit se. Pomocí techniky hodnocení přijatelnosti zjišťovala, jak rodilí mluvčí češtiny hodnotí věty s tímto slovesem, přičemž používala čtyři různé kontexty: (a) sloveso v opisném futuru (Nová dirigentka se bude soustředit na předvánoční koncerty; Hanka se bude soustředit pouze na svoje nemocné děti), (b) sloveso ve spojení s fázovým slovesem (Hokejisté Liberce se přestali soustředit na své protivníky; Karel se začal ve svém výzkumu soustředit na domestikovaná zvířata), (c) sloveso v konstrukci se spojkou až (Až se Ondřej soustředí na studium, zvládne všechny zkoušky; Až se firma soustředí na vývoj, začne se zboží prodávat), (d) sloveso v konstrukci se spojkou než (Viktor bude ve stresu, než se soustředí pouze na studium; Soupeři budou mít navrch, než se hráči soustředí na útok). První dva typy konstrukcí vypovídají o přijatelnosti nedokonavé hodnoty, druhé dva o přijatelnosti dokonavé hodnoty. Výsledky jsou zobrazeny v tabulce 10.4. kdy kde co Obrázek 10.2: Sloupcový graf zachycující výsledky z příkladu (5) Hladíková, B. (2018). Současné tendence obouvidových sloves v češtině [Doctoral dissertation, Filozofická fakulta Univerzity Karlovy], https:/ /dspace.cuni.cz/ handle/20.500.11956/100055 konstrukce zcela spíše neutrální spíše zcela nepřijatelná nepřijatelná přijatelná přijatelná opisné futurum 9 4 5 5 29 fázové sloveso 7 1 5 5 34 spojení s až 11 7 10 11 13 spojení s než 21 14 9 2 6 Tabulka 10.4: Výsledky z práce Hladíková (2018) Příklad (6) zachycuje rozdělení řadové proměnné (přijatelnost věty) pro čtyři různé typy konstrukcí. Podobně jako v případě nominálních 10 Proměnné a výsledky 98 proměnných můžeme pro zobrazení těchto výsledků použít sloupcový graf. Tentokrát ale může být užitečné použít takzvaný skládaný sloupcový graf, v němž se jednotlivé sloupce dávají na sebe. Tento graf lze zarovnat podle neutrální hodnoty, což nám v daném případě poskytne velmi dobré zobrazení rozdílů v rozdělení jednotlivých hodnot pro jednotlivé typy konstrukcí, viz obrázek 10.3. Hodnocení slovesa soustředit se fázová futuium zcela nepřijatelná spíše nepřijatelná % případů neutrální spíše přijatelná zcela přijatelná Obrázek 10.3: Skládaný sloupcový graf zachycující rozdělení odpovědí na jednotlivé stupně škály přijatelnosti u slovesa soustředit se V grafu vidíme zastoupení relativních frekvencí jednotlivých stupňů škály. Můžeme si z něj všimnout, že konstrukce s opisným futurem a s fázovými slovesy byly v tomto výzkumu hodnoceny o poznání lépe než konstrukce s až a než. Zároveň je ale patrné, že konstrukce s než jsou hodnoceny hůře než konstrukce s až, což by tak být ideálně nemělo, protože Veselý (2008) předpokládá, že oba tyto typy konstrukcí poukazují na to, zda se dané sloveso používá jako dokonavé. Je proto důvod zamyslet se nad tím, zda se zde neprojevuje nějaké zkreslení (viz kapitola Výsledky a realita). Vzhledem k tomu, že šlo o výzkum hodnocení přijatelnosti vět, je nasnadě hledat takové možné zkreslení v tom, jak věty použité v tomto výzkumu vlastně vypadaly a zda nebylo hodnocení vychýleno něčím jiným než samotným spojením slovesa soustředit se se spojkou než. Pro zobrazení rozdělení řadových proměnných existují i další běžně používané způsoby (například histogram), z nichž některé si pro lepší ilustraci uvedeme ve výkladu o rozdělení numerických proměnných. Numerické proměnné Jak jsme řekli, můžeme u numerických proměnných nejenom modus a medián, ale i průměr. Od řadových a nominálních proměnných se ale numerické proměnné obvykle liší ještě jedním rysem - zatímco závislé nominální a řadové proměnné typicky nabývají pouze několika málo možných hodnot (byť to není jejich definiční charakteristika), numerické proměnné mají velmi často možných hodnot velké množství a u spojitých proměnných je takových hodnot dokonce nekonečně mnoho. To má důležité důsledky. V prvé řadě pro zobrazení rozdělení hodnot numerických proměnných typicky nejsou vhodné jednoduché tabulky, jako jsme viděli výše u tabulek 10.2 a 10.4. Takové tabulky pochopitelně můžeme vytvořit, budou však velmi rozsáhlé a těžko čitelné. Z toho důvodu u numerických proměnných obvykle mnohem více spoléháme na střední hodnoty (zejména na průměr a medián). Střední hodnoty mají ovšem jeden problém - vystihují sice určitou centrální tendenci datového souboru, avšak vypovídají jenom velmi málo 10 Proměnné a výsledky 99 o tom, jak jsou hodnoty rozděleny. Z toho důvodu je potřeba doplňovat střední hodnoty ještě takzvanými ukazateli variability. Velmi jednoduchým ukazatelem je takzvané variační rozpětí, které spočívá ve specifikaci nejnižší a nejvyšší naměřené hodnoty. Když tedy budeme například měřit dobu, která uběhla mezi zobrazením obrázku a počátkem vyslovování cílového slova jako v příkladu (4), můžeme zjistit kromě průměru i nejnižší a nejvyšší naměřenou hodnotu (například 642 ms a 4239 ms). Tyto hodnoty pak představují variační rozpětí. Velmi užitečným nástrojem pro zachycení rozdělení hodnot numerických proměnných jsou takzvané kvantily (viz Box 11.2). Jedním z typicky užívaných kvantilů je takzvaný percentil, který udává, kolik procent případů má nižší hodnotu, než je hodnota daného datového bodu. Abychom mohli určit percentil, musíme tedy být schopni seřadit naměřené hodnoty od nejnižší po nejvyšší, což nám řadové proměnné umožňují (stejně jako proměnné numerické). S percentily se můžete setkat například v některých písemných zkouškách, které jsou založeny na tom, že porovnávají výkon zkoušených mezi sebou. Pokud se takové zkoušky zúčastníte a váš výsledek bude 91. percentil, znamená to, že přesně 91 % ostatních lidí, kteří se zkoušky zúčastnili, měla horší výsledek než vy. variační rozpětí = specifikace variability dat pomocí nejnižší a nejvyšší naměřené hodnoty [angl. range] kvantil = bod v rozdělení dat, který je určen pořadím hodnot v tomto rozdělení [angl. quantile] Box 11.2: Kvantily Když chceme na stejně velké části rozdělit určitý soubor naměřených hodnot uspořádaných od nejmenší k největší, můžeme použít takzvané kvantily. Běžně používaných kvantilů existuje několik typů, a to podle toho, na kolik dílů chceme data rozdělit. Běžně používaný je percentil, který soubor naměřených hodnot dělí na 100 stejně velkých dílů. Pomocí percentilů si můžeme přiblížit další kvantily. Když chceme data rozdělit přesně na dva díly, potřebujeme najít 50. percentil. Jde o tu naměřenou hodnotu, která je vyšší než přesně 50 % naměřených hodnot (respektive nižší než přesně 50 % naměřených hodnot). 50. percentilů se říká medián. V deskriptívni statistice se často používá rozdělení dat na čtyři stejně velké díly. V takovém případě se používají takzvané kvartily (s hláskou r před t, nikoliv s n), což je další báječně zvolený termín, s nímž už nikdo nic nenadělá. Kvartily se určují tři: 1. kvartil je vlastně 25. percentil a označuje hodnotu, která je vyšší než přesně 25 % nejnižších naměřených hodnot. 2. kvartil představuje 50. percentil neboli medián. Konečně 3. kvartil označuje 75. percentil a tedy hodnotu, která je vyšší než přesně 75 % naměřených hodnot). Relativně běžné je ještě použití takzvaných decilů, které dělí data na 10 stejně velkých dílů. Jednotlivé decily tak představují 10. percentil, 20. percentil, 30. percentil atd. Právě kvantily představují způsob, jak reprezentovat rozdělení dat o něco lépe než variační rozpětí. Místo nejnižší a nejvyšší hodnoty totiž můžeme rozpětí sledovat mezi určitými kvantily. Nejčastěji se v tomto případě používá takzvané mezikvartilové rozpětí (s r před t), což je vlastně mezikvartilové rozpětí = specifikace vari-specifikace datového souboru pomocí 25. a 75. percentilů (respektive abihty dat pomocí 1. a 3. kvartilu [angl. inter-quartile range] 10 Proměnné a výsledky 100 1. a 3. kvartilu). Jinými slovy, mezikvartilové rozpětí nám udává, kde začíná a kde končí středových 50 % naměřených hodnot. Mezikvartilové rozpětí se využívá kupříkladu v takzvaných krabicových grafech (viz ještě dále). Abychom si nyní rozdělení numerických proměnných lépe ilustrovali, podíváme se na konkrétní datový soubor, který si zobrazíme pomocí tří grafů a jedné tabulky. Jde o reakční časy rodilých mluvčích češtiny a rodilých mluvčích slovenštiny žijících na Slovensku v experimentu pojmenovávání obrázků v češtině (Kříž, 2020). Experiment vypadal tak, že se na obrazovce počítače objevil obrázek (například obrázek jahody) a účastníci výzkumu měli za úkol co nejrychleji správně říct, co je na obrázku. Na odpověď měli maximálně 5 sekund. Data v rámci obrázků zachycují počátek vyslovování správného pojmenování (špatné odpovědi byly z datového souboru odstraněny). Přesné číselné údaje pro daný datový soubor zachycuje tabulka 10.5. skupina průměr medián minimum 1. kvartil 3. kvartil maximum Češi 1029 ms 894 ms 412 ms 736 ms 1149 ms 4781 ms Slováci 1592 ms 1363 ms 611 ms 1055 ms 1905 ms 4864 ms Tabulka 10.5: Data převzatá z disertační práce A. Kříže (2020) Z tabulky 10.5 můžeme vyčíst, že mluvčí češtiny reagovali nápadně rychleji - průměr i medián u nich byly zhruba o 500 ms nižší než u mluvčích slovenštiny (což není nějak překvapivé vzhledem k tomu, že pro mluvčí slovenštiny se jednalo o experiment v jejich nerodném jazyce). Lepší představu o rozdělení dat nám ale může dát obrázek 10.4, na kterém je graficky zachyceno rozdělení dat, a to třemi běžně používanými způsoby. Ó00 S 400 %_ 200 0 Slováci Češi Češi Sk 1000 2000 3000 4000 5000 0 ms 1000 2000 3000 4000 5000 Slováci Češi 1000 2000 3000 4000 5000 ms 1000 2000 3000 4000 5000 ms Obrázek 10.4: Tři grafická zobrazení rozdělení numerické proměnné reakční čas v experimentu zaměřeném na pojmenování obrázků. Nahoře jsou histogramy (pro skupinu rodilých mluvčích češtiny a pro skupinu rodilých mluvčích slovenštiny). Vlevo dole je houslový graf, vpravo dole krabicový graf. Nahoře na obrázku jsou takzvané histogramy (jeden pro rodilé mluvčí češtiny a druhý pro rodilé mluvčí slovenštiny). Jde vlastně o sloupcové grafy, přičemž jednotlivé sloupce reprezentují počet hodnot v určitém rozsahu (v uvedeném případu zahrnuje každý sloupec přesně 50 ms). Světle červenou barvou jsou zobrazeny výsledky rodilých mluvčích češtiny, světle modrou výsledky rodilých mluvčích slovenštiny. Na první 10 Proměnné a výsledky 101 pohled vidíme, že zatímco rodilí mluvčí češtiny u většiny obrázků stihli začít vyslovovat slovo dříve než za jednu sekundu (tedy 1000 ms), rodilí mluvčí slovenštiny byli obvykle pomalejší. Pro takové srovnávání mezi skupinami je velmi užitečný houslový graf, který na obrázku 10.4 vidíme vlevo dole. Houslový graf zobrazuje rozdělení hustoty pravděpodobnosti - zjednodušeně můžeme říct, že čím baňatější „housle" v daném místě jsou, tím více hodnot se v tomto místě vyskytlo. Do houslového grafu se obvykle zanášejí další hodnoty -v uvedeném příkladě je zobrazen průměr (černý křížek) a medián (bílá hvězdička). Třetím grafem, který vidíme, je takzvaný krabicový graf (na obrázku 10.4 vpravo dole). To je rovněž často používaný způsob zachycení rozdělení dat. Samotná krabice označuje hodnoty kvartilů - levá a pravá strana krabice jsou vymezeny hodnotou 1. a 3. kvartilu a medián (2. kvartil) je zaznamenán čárou uprostřed. Od krabice vedou dva „vousy", které zachycují variabilitu dat, které jsou nižší než 1. kvartil, respektive vyšší než 3. kvartil. Maximální délka každého z vousů je typicky vymezena l,5násobkem mezikvartilového rozpětí. Z tabulky 10.5 víme, že pro rodilé mluvčí češtiny je hodnota 1. kvartilu 736 ms a hodnota 3. kvartilu 1149 ms, což znamená, že mezikvartilové rozpětí je 413 ms (1149 - 736). Když tuto hodnotu vynásobíme 1,5, dostaneme údaj 619,5. Maximální délka vousu směrem ven z krabice tak je v tomto případě 619,5 ms. Důležité je, že je to maximální délka - vous končí vždycky tam, kde je v datovém souboru poslední naměřená hodnota, která se vejde do daného maximálního rozsahu. Směrem od levé strany krabice by tedy úsečka mohla mířit až k hodnotě 116,5 ms (1. kvartil -1,5x mezikvartilové rozpětí). Reálně je ale nejnižší naměřená hodnota 412 ms (viz tabulka 10.5), takže úsečka končí právě na této hodnotě. Směrem na druhou stranu je hodnot více, takže úsečka využívá prakticky maximální možnou délku, která činí 1768,5 ms (3. kvartil +l,5x mezikvartilové rozpětí). Hodnoty, které se nevejdou do vousu, jsou považovány za odlehlé hodnoty (angl. outliers) a jsou zaznamenávány jako jednotlivé body. Vidíme, že v tomto případě je takových odlehlých hodnot hodně. To je tím, že reakční časy jsou rozdělené značně nerovnoměrně - 75 % všech reakcí bylo u rodilých mluvčích češtiny rychlejších než 1149 ms, ale v celkovém datovém souboru máme i hodnoty vyšší než 4 s, byť je jich o poznání méně. 10.5 Typy rozdělení Rozdělení naměřených hodnot má vždycky nějaký tvar. Pro statistické výpočty je klíčové, že každé rozdělení má nějaké svoje charakteristiky. Ambicí této učebnice není poskytnout souborný přehled těchto otázek, nicméně považujú za užitečné podívat se alespoň na některé snadno uchopitelné věci, které by mohly být k užitku pro další orientaci v problematice a taky pro lepší porozumění odborným studiím, které statistiku využívají. Na obrázku 10.5 je zobrazeno několik rozdělení numerických dat, na která můžete snadno narazit. Písmeno A označuje takzvané normální rozdělení (standard distribu- normální rozdělení = jednovrcholové, tion). Toto rozdělení má jeden vrchol a je symetrické. Červená čára na symetrické rozděleni dat v datovém souboru [angl. normal distribution] 10 Proměnné a výsledky 102 Obrázek 10.5: Pět typů rozdělení (numerických, případně řadových) dat. obrázku označuje průměr, přičemž u normálního rozdělení platí, že průměr, medián a modus jsou identické. Důležitou charakteristikou tohoto rozdělení je také to, že pro něj platí, že čím dále od průměru, tím méně hodnot. Nahoře uprostřed (písmeno B) je takzvané levostranně (negativně) sešik-mené rozdělení, které se oproti normálnímu rozdělení vyznačuje tím, že není symetrické a doleva klesá pomaleji. U tohoto rozdělení platí, že průměr je směrem nalevo od vrcholu rozdělení (modu) a je podstatně ovlivňován odlehlými hodnotami. Medián u tohoto rozdělení je vždy vyšší než průměr. Na tento typ rozdělení můžeme narazit například u proměnné úroveň znalosti druhého jazyka u vysokoškolských studentů - relativně málo studentů bude mít velmi nízkou úroveň, rozdělení bude postupně narůstat, ale někde kolem úrovně B2 nebo Cl opět začne klesat. V případě hodnocení přijatelnosti bychom takové rozdělení očekávali u jevů, které jsou celkově spíše nepřijatelné. Analogické k levostranně sešikmenému rozdělení je pravostranné (pozitivně) sešikmené rozdělení, které klesá pomaleji doprava (písmeno C). Platí zde, že průměr je vyšší než modus i než medián. Na takové rozdělení narazíme velmi běžně v experimentech zaměřených na měření reakčních časů. U reakčních časů je velká většina hodnot poměrně nízkých a rozdělení pozvolná klesá směrem k vyšším hodnotám (viz obrázek 10.4). Písmenem D je na obrázku označené takzvané rovnoměrné (či obdélníkového) rozdělení. U tohoto rozdělení jsou všechny hodnoty proměnné zastoupeny zhruba ve stejné míře. Takové rozdělení můžeme najít u proměnných, pro které platí, že jejich hodnoty se objevují (přibližně) se stejnou pravděpodobností. Výše v příkladu (6) jsme narazili na zhruba rovnoměrně rozdělené hodnoty u hodnocení přijatelnosti konstrukcí slovesa soustředit se s až. Posledním rozdělením, které si uvedeme, je takzvané bimodální rozdělení. Jak je patrné z názvu, má takové rozdělení dva mody, tedy dvě nejčastější hodnoty. V praxi se tak označují rozdělení, které mají dva vrcholy (ne nutně úplně stejně vysoké). Na obrázku 10.5 je rozdělení blízké bimodální rozdělení = rozdělení dat, které má dva vrcholy [angl. bimodal distribution] 10 Proměnné a výsledky 103 bimodálnímu zobrazeno pod písmenem E. Vidíme, že průměrná hodnota (zachycená červenou čárou) je vlastně někde mezi dvěma vrcholy daného rozdělení a jedná se o hodnotu, která je v datech zachycena poměrně málo. Podobně tomu je i s mediánem. Pokud jsou tedy naše data zhruba bimodálně rozdělená, představují průměr a medián dosti zavádějící údaje. Bimodální rozdělení obecně může poukazovat na to, že jsou naše data nějakým způsobem nekonzistentní, respektive že jsou naše data složena ze dvou různých rozdělení. Příkladem může být třeba hodnocení přijatelnosti nějakého jevu, který je hodnocen různými částmi populace výrazně různě, přičemž v rámci vzorku jsou zastoupeny obě tyto části populace. Zjistíme-li tedy, že jsou naše data bimodálně rozdělená, je vhodné se zamyslet nad tím, proč tomu tak je a zda bychom neměli zohlednit vliv určité nezávislé proměnné, kterou jsme doposud nebrali v potaz. Normální rozdělení Na závěr této kapitoly se ještě zastavme u normálního rozdělení, které je velice důležité pro různé statistické metody. Je s ním totiž spojeno jedno z důležitých měřítek variability dat, na které budete běžně narážet v nejrůznějších studiích, konkrétně směrodatná odchylka, a proto je důležité mu rozumět. Výše jsme si představili, jak variabilitu dat zachycovat pomocí kvantilů a jak ji zobrazovat graficky. Kromě těchto možností máme ještě možnost pracovat s takzvanými odchylkami od střední hodnoty. Odchylka od průměru je prostě vzdálenost naměřené hodnoty od hodnoty průměrné. Pokud je tedy naměřená hodnota třeba 400 a průměr 350 ms, je její odchylka od průměru pro tuto hodnotu 50 ms. V případě, že by naměřená hodnota byla 320 ms, měla by její odchylka hodnotu -30 ms. Každá naměřená hodnota tedy má nějakou svou odchylku - zápornou v případě, že je daná hodnota nižší než průměr, kladnou, když je daná hodnota vyšší než průměr, anebo nulovou, když je naměřená hodnota identická s průměrem. Abychom zachytili variabilitu pro celý datový soubor, můžeme snadno spočítat jeho průměrnou absolutní odchylku, tedy vlastně průměrnou hodnotu ze všech naměřených odchylek (přičemž se odchylky počítají jako absolutní hodnoty, tj. odchylka -30 ms se počítá jako 30 apod.). Platí, že čím vyšší průměrná odchylka je, tím vyšší je variabilita dat. Na průměrnou odchylku v odborných studiích ovšem příliš často nenarazíme, řádově častěji se používá takzvaná směrodatná odchylka (angl. standard deviation, zkracuje se obvykle jako sd, případně s, anebo a, tedy řecká sigma), a to mimo jiné proto, že úzce souvisí s normálním rozdělením. Počítá se podobně jako průměrná odchylka, rozdíly jsou přitom dva: (i) předtím, než jednotlivé odchylky sečteme, je umocníme („dáme na druhou"), (ii) potom, co spočítáme průměr z umocněných odchylek, provedeme odmocnění. Umocnění před sečtením má za následek mimo jiné to, že hodnotu směrodatné odchylky ovlivňují vyšší odchylky výrazně více než nižší odchylky. Směrodatná odchylka je tak svým způsobem citlivější než průměrná odchylka. Podotkněme ještě, že v případě, že počítáme směrodatnou odchylku pro vzorek, odečteme při počítání průměru od počtu odchylek jedničku. odchylka = vzdálenost naměřeného hodnoty od středové hodnoty, obvykle od průměru [angl. deviation] průměrná absolutní odchylka = průměr naměřených absolutních odchylek v datovém souboru [angl. average absolute deviation] směrodatná odchylka = měřítko variability strukturující normální rozdělení [angl. standard deviation] Výpočet směrodatné odchylky Vzorec pro populaci: N Vzorec pro vzorek: N-l 10 Proměnné a výsledky 104 K čemu je nám tedy směrodatná odchylka dobrá? Jak jsme již řekli, souvisí s normálním rozdělením dat. Podívejme se na obrázek 10.6. Obrázek 10.6: Schematické zobrazení normálního rozdělení a j ednotlivých hodnot. Na tomto obrázku je normální rozdělení. Přímo pod osou x jsou hodnoty označené písmenem a (sigma), které označuje směrodatnou odchylku pro populaci. Jak jsme řekli, normální rozdělení je jednovrcholové a symetrické, takže průměr, medián a modus představují stejnou hodnotu. Na grafu je tato hodnota na vrcholu křivky, který je na řádku pro směrodatné odchylky označen jako 0. Jednotlivé směrodatné odchylky nám potom normální rozdělení dělí na určité části, jejichž velikost je v křivce označená procentem. Například jedna směrodatná odchylka od průměru zahrnuje 34,13 % všech dat. Pokud tedy třeba víme, že jsou data normálně rozdělená, průměr je 350 a směrodatná odchylka 50, tak platí, že 34,13 % všech dat je obsaženo v intervalu 300-350, a dalších 34,13 % všech dat v intervalu 350-400. Podobným způsobem můžeme počítat dál. Například dvě směrodatné odchylky na jednu stranu představují 34,13 % + 13,59 %, tj. 47,72 % všech případů a dvě směrodatné odchylky na obě strany od průměru představují 95,44 % dat. Jedná se o poměrně důležité charakteristiky, které lze různě využívat. Když například víme, že nějaká hodnota odpovídá 3 a více směrodatným odchylkám, jde o hodnotu značně odlehlou, velice málo pravděpodobnou. V různých studiích se proto směrodatné odchylky používají pro odstranění extrémních hodnot (a v analýze se pak pracuje třeba jenom s těmi daty, které se vejdou do dvou směrodatných odchylek na každou stranu od průměru). Směrodatná odchylka je tedy poměrně důležitý údaj o variabilitě dat, který se často uvádí spolu s průměrem. Je však třeba si uvědomit, že jde o údaj, který je relevantní zejména v případě přibližně normálně rozdělených dat. V případě jinak rozdělených dat směrodatná odchylka uvedené vlastnosti nemá. 10.6 Otázky na přemýšlení Podívejte se na nějakou empiricky založenou lingvistickou studii, kterou jste nedávno četli. Zkuste odpovědět na tyto otázky: 1. Jaké závislé a nezávislé proměnné se ve výzkumu používaly? 2. O jaké typy proměnných se jednalo? 3. Bylo možné operacionalizovat dané proměnné jiným způsobem? Jak a v čem by to mohlo být výhodné, nebo naopak nevýhodné? 4. Můžete z informací v dané studii vysoudit, jak byla rozdělená získaná data? Pokud ne, jaké rozdělení byste předpokládali a proč? Vztahy mezi proměnnými li V předchozí kapitole jsme se zaměřili na rozdíly mezi různými typy proměnných a nastínili jsme, jak mohou být hodnoty jednotlivých proměnných rozdělené. Ve výkladu o rozdělení hodnot jsme navíc narazili na to, že z rozdělení hodnot jedné proměnné pro různé hodnoty druhé proměnné můžeme usuzovat na to, zda je mezi těmito proměnnými nějaký vztah. V této kapitole na to navážeme a zaměříme se na to, jak vztahy mezi proměnnými mohou vypadat. Jedná se o zásadní otázku, protože každý empirický výzkum se snaží zjišťovat, jak spolu souvisí různé jevy, respektive nakolik se tyto jevy ovlivňují. Určování toho, zda mezi zkoumanými proměnnými existuje nějaký vztah (a jak je tento vztah silný), přitom není úplně jednoduché. Podívejme se v této souvislosti na tři příklady. 11.1 Korelace.......... 107 11.2 Kauzalita ......... 109 11.3 Vztah více proměnných 110 11.4 Otázky na přemýšlení . 112 (1) Jan Chromý, James Brand, Anna Laurinavichyute a Radim Lacina (CITACE) provedli přímé experimentální srovnání toho, jak rodilí mluvčí angličtiny a rodilí mluvčí češtiny zpracovávají věty obsahující atrakci v čísle. Účastníci anglického experimentu četli věty jako (i) Thefilefor the archiver likely were tightly sealed by the authorities a (ii) Thefilefor the archivers likely were tightly sealed by the authorities. Účastníci českého experimentu pak četli věty typu (iii) Složka pro archivárku nejspíš byly pevně zapečetěny úřady a (iv) Složka pro archivárky nejspíš byly pevně zapečetěny úřady. V uvedených větách je narušená shoda podmetu s přísudkem - zatímco podmět (složka, respektive the filé) je v jednotném čísle, sloveso (byly, respektive were) je v množném čísle. V různých předchozích výzkumech se ukazovalo, že čtenáři zpracovávají věty typu (ii) rychleji než věty typu (i), což se vysvětlovalo vlivem podstatného jména (tzv. atraktoru), které stojí mezi podmětem a přísudkem (v případě českých vět jde o archivárku, respektive archivárky, u anglických vět jde o the archiver, respektive the archivers). V uvedené studii se ukázalo, že zatímco u rodilých mluvčích angličtiny skutečně k tomuto efektu dochází, rodilí mluvčí češtiny v českém experimentu žádný takový rozdíl nevykazovali, tj. ve čtení vět (iii) a (iv) nebyl významný rozdíl. (2) Jednou ze zajímavých oblastí typologického výzkumu je usouvz-tažnění používání různých jazykových struktur napříč jazyky světa. Dryer (2013) například zjišťoval, nakolik spolu souvisí pořadí prísudku a předmětu s tím, zda jazyk používá prepozice (předložky), anebo postpozice (záložky). Ukazuje se, že užívání těchto jevů spolu úzce souvisí - pokud jazyk používá (primárně) slovosled, kdy předmět následuje po prísudku, má tendenci používat prepozice (jako třeba v češtině). Naopak pokud je preferovaný slovosled s předmětem před přísudkem, má jazyk tendenci používat postpozice (například v nivchštině). Vztah těchto proměnných ukazuje Tabulka 11.1: Tabulka ukazující souvislost mezi tím, zda jazyky používají postpozice či prepozice, a tím, jaké je pořadí prísudku a předmětu. Čísla uvádí počty jazyků. VO OV předložky 417 10 záložky 38 427 Dryer, M. S. (2013). Relationship between the Order of Object and Verb and the Order of Adposition and Noun Phrase (v2020.3). In M. S. Dryer & M. Haspelmath (Eds.), The World Atlas of Language Structures Online. Zenodo 11 Vztahy mezi proměnnými 106 tabulka 11.1. (3) Ceháková a Chromý (2023) využívali čtení vlastním tempem pro zkoumání toho, jak lidé zpracovávají věty se slepou kolejí typu Ostražitý policista prohledal obchodnici před prodejnou dodávku a odjel na služebnu a zjistili, že u těchto vět dochází ve srovnání s kontrolními větami typu Ostražitý policista prohledal obchodníkovi před prodejnou dodávku a odjel na služebnu k pomalejším reakcím na objekt {dodávku) a na následující slova. Příklad (1) pojednává o komparativním výzkumu zpracování dvou různých jazyků. Zatímco v angličtině byly zdokumentovány očekávané výsledky (tedy že množné číslo u atraktoru způsobuje rychlejší reakční časy při zpracování věty se slovesem v množném čísle), v češtině tomu tak nebylo. To ukazuje na zajímavý rozdíl zpracování těchto jazyků. Z hlediska našeho výkladu jsou tyto výsledky důležité proto, že ukazují, že ve výzkumu ne vždy nalezneme mezi proměnnými vztah a že navíc absence vztahu může sama o sobě mít významnou výpovědní hodnotu. Proměnné zachycené v příkladu (2) jsou ve zřejmém vztahu. Kdybychom chtěli výsledky v tabulce 11.1 verbálně interpretovat, řekli bychom, že s jistými výjimkami platí, že pokud jazyk používá předložky a nikoliv záložky, má tendenci používat slovosled VO (tedy verbum - objekt), zatímco pokud používá záložky, má tendenci používat slovosled OV. Povšimněme si přitom dvou důležitých věcí. Zaprvé, uvedený vztah platí i opačně - pokud jazyk používá slovosled VO, má tendenci používat předložky, zatímco pokud používá slovosled OV, má tendenci používat záložky. Zadruhé, jen stěží můžeme tvrdit, že jedna proměnná přímo ovlivňuje druhou, tedy že užívání předložek či záložek by bylo způsobeno pořadím slovesa a objektu (anebo naopak). Uvedený vztah je klasickým příkladem korelace, což je klíčový pojem, který si v této kapitole rozebereme podrobněji. Příklad (3) ukazuje na vztah mezi délkou reakčních časů a přítomností slepé koleje (jinak řečeno syntaktické víceznačnosti, která je vyřešena v průběhu čtení věty). Můžeme říci, že na disambiguující slovo ve větách se slepou kolejí (v daném případě dodávku) reagují mluvčí pomaleji než na identické slovo v kontrolní podmínce. Vzhledem k tomu, že se větami se slepou kolejí zabývalo velké množství různých studií, víme, že je tento vztah poměrně silný a opakovaně dokumentovatelný. Zároveň je zřejmý i směr tohoto vztahu, tedy že přítomnost syntaktické víceznačnosti je příčinou toho, že zkoumané osoby vykazují při čtení vyšší reakční časy. Můžeme tedy říct, že mezi přítomností syntaktické víceznačnosti a reakčním časem existuje kauzální vztah, tedy příčinnost. Uvedené tři příklady nám ilustrují situace, k nimž můžeme v našem výzkumu dospět. Velmi běžné je to, že se ve výzkumu žádný vztah neukáže, jako je tomu v příkladu (1). Pokud určitý vztah zdokumentujeme, nemusí to být nutně tak, že jedna proměnná zapříčiňuje hodnoty druhé proměnné, což vidíme v příkladu (2). V neposlední řadě v některých případech můžeme být schopni zdokumentovat kauzalitu, tedy to, že jedna proměnná přímo ovlivňuje druhou, jako v příkladu (3). V následujících oddílech se blíže podíváme na několik pojmů, které se vztahem proměnných úzce souvisí. Začneme právě korelací a kauzalitou. Ceháková, M., & Chromý, J. (2023). Garden-path sentences and the diversity of their (mis)representations. PLoS ONE, 18(7), e0288817 11 Vztahy mezi proměnnými 107 11.1 Korelace Korelace je základní vztah mezi proměnnými, který spočívá v tom, že hodnoty zkoumaných proměnných jsou v systematickém a pravidelném souvýskytu. V příkladu (2) jsme viděli, že nejvíce jazyků se vyskytuje buď v kombinaci hodnot prepozice + VO (417 jazyků), anebo postpozice + OV (427 jazyků). V kombinacích prepozice + OV a postpozice + VO rovněž nějaké jazyky nacházíme, je jich však na první pohled výrazně menší množství, což poukazuje na poměrně jasný vztah mezi danými dvěma proměnnými. Velmi důležitou vlastností korelačního vztahu je to, že nám umožňuje s určitou pravděpodobností predikovat vlastnosti dalších, předtím nezkoumaných jednotek. Očividná korelace mezi užíváním prepozic a postpozic a pořadím prísudku a předmětu nám dovoluje predikovat strukturní vlastnosti dalších jazyků. Pokud například o nějakém jazyku budeme vědět, že umisťuje předmět za přísudek, budeme moct s vysokou pravděpodobností očekávat, že používá předložky a nikoliv záložky. Poznání korelačních vztahů je často velmi užitečné a získáváme díky němu představu o souvislostech mezi různými jevy. Ve výzkumu jazyka a jeho užívání můžeme narážet na velké množství korelací. U slov například koreluje jejich konkrétnost s věkem, kdy jsou typicky osvojeny, což zase koreluje s jejich frekvencí. Frekvence slov koreluje s délkou slov, délka slov zase s tím, jak velký má jazyk inventář fonémů. Korelace tohoto typu jsou velmi pěkně shrnuty v přehledové studii Roberta Ladda, Seána Robertse a Dana Dediu (2015), kterou doporučujú k přečtení. Podívejme se nyní ještě na jeden příklad, který usouvztažňuje počátek osvojování jazyka se syntaktickými znalostmi tohoto jazyka. korelace = systematický a pravidelný souvýskyt hodnot dvou proměnných [angl. correlation] Ladd, D. R., Roberts, S. G., & Dediu, D. (2015). Correlational studies in typological and historical linguistics. Annu. Rev. Linguist., 1(1), 221-241 (4) Hartshorne et al. (2018) pomocí online testu syntaktických znalostí nasbírali data od celkově 669 498 mluvčích angličtiny (rodilých a nerodilých). Ukázalo se, že věk, kdy si lidé začali angličtinu osvojovat koreloval s jejich syntaktickými znalostmi, přičemž platilo, že čím později si mluvčí začali angličtinu osvojovat, tím horší syntaktické znalosti vykazovali. Hartshorne, J. K., Tenenbaum, J. B., & Pinker, S. (2018). A critical period for second language acquisition: Evidence from 2/3 million English speakers. Cognition, 177, 263-277 Vztah zachycený výzkumem v příkladu (4) není sám o sobě až tak moc překvapivý a vypovídá o tom, že čím později se lidé začnou učit nějaký jazyk, tím hůře se ho pravděpodobně naučí. I v tomto případě je ovšem důležité si uvědomit, že existují různé výjimky, tedy lidi, kteří si začali osvojovat jazyk relativně brzy, ale příliš dobře se ho nenaučili, a naopak lidi, kteří se jazyk začali učit pozdě a dosáhli poměrně dobrých výsledků. To je u většiny korelačních vztahů normální. Korelace, kterou zjistíme, je vždy určitou tendencí, ze které existují výjimky. V některých případech je zjištěná korelace slabá (existuje hodně výjimek), někdy je silnější (výjimek je méně) a někdy i velmi silná (výjimek je málo). Síla korelace se odráží v tom, jak úspěšní budeme při predikování hodnot dalších jednotek. Pokud třeba víme, že je korelace velmi silná, můžeme s vysokou pravděpodobností úspěchu předpokládat, že další jednotky se budou chovat v souladu se zjištěným vztahem. Čím slabší korelace je, tím pravděpodobnější je, že narazíme na nějakou výjimku. 11 Vztahy mezi proměnnými 108 Důležité je, že síla korelačního vztahu se dá vyčíslit pomocí takzvaného korelačního koeficientu. Na ten lze v odborných studiích narazit velmi běžně, a je proto užitečné si zde vysvětlit výchozí princip, aniž bychom zabíhali do přílišných statistických detailů. Při výpočtu korelačního koeficientu je důležité, s jakými proměnnými pracujeme a jak jsou rozdělené hodnoty těchto proměnných (zdali normálně, nebo ne). Z toho důvodu existují různé způsoby výpočtu korelačního koeficientu. Bez ohledu na způsob výpočtu nicméně platí, že korelační koeficient (označovaný písmenem r) se z principu pohybuje mezi hodnotami -1 a 1. Hodnota -1 znamená dokonalou zápornou korelaci, která se v případě numerických proměnných dá chápat jako absolutní vztah „čím víc, tím míň". Hodnota 1 naopak znamená dokonalou kladnou korelaci, tedy absolutně platný vztah „čím víc, tím víc". Když má korelační koeficient hodnotu 0, znamená to, že mezi proměnnými žádný vztah není. O korelačním vztahu tedy mluvíme, když se hodnota korelačního koeficientu pohybuje ve větší vzdálenosti od 0 ať už k zápornému, nebo ke kladnému pólu. Když tedy například budeme vědět, že korelační koeficient pro určité dva jevy je třeba r = 0,9, znamená to opravdu velmi silnou korelaci, zatímco pokud bude tento koeficient například r = 0,2, je vztah mezi danými proměnnými velmi slabý (pokud vůbec nějaký). V literatuře můžeme narazit na určitá pásma síly korelace (například že pásmo mezi r = 0,2 a r = 0,4 je slabá korelace apod.), nejde ale o něco obecně přijímaného či daného. Dobrou pomůckou pro pochopení síly korelace může být vypočítat hodnotu R2, což je takzvaný koeficient determinace. Ten spočítáme velmi snadno tak, že korelační koeficient umocníme. Koeficient determinace nám pak říká, jaký podíl případů daná korelace „vysvětluje" (když ho vynásobíme 100, získáme údaje v procentech). Máme-li tak třeba korelační koeficient 0,6, platí korelační vztah pro 36% všech případů, což není špatné číslo. Koeficient r = 0,2 ale vysvětluje jenom 4% všech případů a to už se zdá být blízko zanedbatelnosti (pochopitelně však je důležité to zvažovat případ od případu). V příkladu (2) jsme viděli, jak zobrazit korelaci dvou nominálních proměnných pomocí tabulky 11.1. V případě numerických proměnných lze korelaci velmi užitečně zobrazit pomocí bodového grafu. Podívejme se například na graf na obrázku 11.1, který usouvztažňuje dvě numerické proměnné z experimentu využívajícího úlohu detekce slova (Kříž, 2020). Obrázek zachycuje průměrné reakční časy pro jednotlivá slova použitá v experimentu, a to pro rodilé mluvčí slovenštiny. Na ose x je reakční čas na slova v češtině a na ose y reakční čas na jejich ekvivalenty ve slovenštině. Každý bod reprezentuje průměrnou hodnotu pro určité slovo. V grafu jsou rovněž uvedené dvě přímky, které vlastně zachycují vztah uvedených dvou proměnných (těmto přímkám se říká regresní přímky). Vidíme, že jak v případě formálně identických, tak v případě rozdílných slov je mezi proměnnými viditelný korelační vztah - čím byly reakční časy v češtině vyšší, tím byly vyšší i ve slovenštině. Jednotlivé body v uvedeném grafu jsou různě rozprostřeny - některé jsou blízko regresní přímky (nebo i přímo na ní), jiné jsou vzdálenější. Vzdálenosti bodů od této přímky je poměrně důležitý údaj pro různé statistické výpočty a označuje takzvanou chybu, respektive reziduum. korelační koeficient = měřítko síly korelace pohybující se mezi hodnotami —1 a 1 [angl. correlation coefficient] koeficient determinace = měřítko vypovídající o tom, nakolik jsou data vysvětlena daným modelem [angl. coefficient of determination] Kříž, A. (2020). Jazykové chování slovenských rodilých mluvčích v Čechách [Doctoral dissertation, Filozofická fakulta Univerzity Karlovy], https:/ /dspace.cuni.cz/ handle/20.500.11956/124140 regresní přímka = přímka vyjadřující směr vztahu mezi proměnnými, jde o přímku, která prochází nejblíže všem bodům v datovém souboru [angl. regression line] 11 Vztahy mezi proměnnými 109 850- •JE • 700 800 Průměrný reakční čas v češtině Rozdíl mezi jazyky "•" identické -•- rozdílné Obrázek 11.1: Bodový graf zachycující vztah mezi průměrným reakčním časem na slovo v češtině a jeho ekvivalent ve slovenštině, a to pro identická a rozdílná slova. U grafů tohoto typu platí, že čím vzdálenější jsou jednotlivé body od regresní přímky, tím je korelace slabší, chybovější (a naopak). Absolutní korelace (r = 1, respektive r - -1) by byl případ, kdy by všechny body byly umístěny přímo na regresní přímce. Nulová korelace (r = 0) by byl případ, kdy by všechny body byly rovnoměrně rozprostřené po celém grafu. 11.2 Kauzalita Výše jsme uvedli, že kromě korelace se z hlediska vztahu mezi proměnnými pracuje ještě s takzvanou kauzalitou. Ta je pro výzkum zcela klíčovým pojmem. Svět funguje jako složitý systém příčin a následků a právě odhalování těchto příčinných vztahů (kauzalit) je to, o co je předmětem vědecké snahy bez ohledu na konkrétní obor. O korelaci a kauzalitě se běžně mluví jako o dvou různých typech vztahů, což je ale trochu zavádějící. Mnohem spíše jde o pojmy různého typu. Korelace spočívá v pravidelném souvýskytu hodnot proměnných, který je měřitelný, zatímco kauzalita znamená, že vztah mezi proměnnými má příčinnou povahu (jedna proměnná ovlivňuje druhou). Můžeme si povšimnout, že jakákoliv kauzalita je z principu také korelací. Opačně to ale neplatí: Korelace neznamená kauzalitu a korelační vztahy velmi často nemají kauzální povahu. Tento vztah mezi korelací a kauzalitou je zcela klíčový a ve výzkumné praxi způsobuje mnoho problémů. Zatímco korelace je měřitelná, jak jsme si ukázali výše, kauzalita je něco, co silně závisí na interpretaci. kauzalita = situace, kdy jsou proměnné v příčinném vztahu, tj. změny hodnot jedné způsobují změny hodnot druhé proměnné [angl. causality] 11 Vztahy mezi proměnnými 110 Abychom mohli uvažovat o tom, že je vztah mezi dvěma proměnnými kauzální, musí platit následující podmínky. 1. Dané proměnné musí být ve vztahu korelace. 2. Příčina musí stát před následkem, tj. vztah proměnných má jasnou časovou posloupnost (když se změní příčina, změní se následek, ale ne naopak). 3. Vztah mezi danými proměnnými přetrává i tehdy, pokud ve výzkumu zohledníme další, do té doby neanalyzované proměnné. Splnění těchto podmínek může být z různých důvodů komplikované. Jak jsme uvedli, korelaci můžeme celkem snadno spočítat, nicméně problém může být v její síle. Pokud je zjištěná korelace slabá (například pokud vysvětluje jenom 4 % ze všech zkoumaných případů), dává jenom omezený smysl předpokládat, že je daný vztah kauzální. Otázka časové posloupnosti proměnných vypadá na první pohled triviálně, ale v některých případech to tak být nemusí. O problému směru vztahu jsme ostatně už pojednali v kapitole Výzkumný postup. Nejsložitější je nicméně splnit třetí podmínku. Nikdy totiž nemůžeme s absolutní jistotou vědět, že ve hře nejsou ještě další proměnné, na něž jsme dosud nepomysleli. Navíc z praktického hlediska může být zohlednění různých dalších proměnných, které by potenciálně mohli mít na výsledky vliv, z různých důvodů obtížné. Z toho důvodu je otázka kauzality vždy závislá na interpretaci a odborném úsudku. V příští kapitole si ostatně ukážeme příklady toho, kdy se ukázalo, že předpokládaný kauzální vztah kauzální vůbec není. 11.3 Vztah více proměnných Pro zjednodušení jsme se dosud bavili vlastně jenom o vztahu mezi dvěma proměnnými. V reálném světě na sebe ale vzájemně působí velké množství různých jevů a i pokud se zaměřujeme jenom na velmi dílčí výsek světa kolem nás, je velice pravděpodobné, že vztahy mezi proměnnými jsou multiplexní, složité. Zaměřit se proto jenom na dvě proměnné je proto velké zjednodušení, které je ale z hlediska výzkumné praxe v řadě případů odůvodněné. Pokud dospějeme ve výzkumu k tomu, že je mezi určitými proměnnými nějaký vztah, může se stát, že důležitou roli hrajou nějaké jiné proměnné. V některých případech to může být dokonce tak, že vztah mezi zkoumanými proměnnými je pouze zdánlivý a zohlednění dalších proměnných nám ukáže, že tento vztah vůbec neexistuje (o tom viz další kapitola). Jindy je to ale složitější - může to bý tak, že vztah mezi proměnnými existuje, ale je nějak spoluutvářen či dotvářen nějakou další proměnnou. Podívejme se na jeden příklad. (5) Shiri Lev Ari (2018) zkoumala, nakolik velikost sociální sítě (opera-cionalizované jako to, s kolika lidmi se během běžného týdne daná osoba stýká) souvisí s tvárností sémantických reprezentací. Účastníci výzkumu (rodilí mluvčí holandštiny) nejprve viděli obrázky, na kterých bylo vždy 25 hvězdiček, přičemž se lišilo, kolik z nich bylo fialových a kolik zelených. U každého zobrazení měli účastníci Lev-Ari, S. (2018). Social network size can influence linguistic malleability and the propagation of linguistic change. Cognition, 176, 31-39 11 Vztahy mezi proměnnými 111 vždy zvolit jednu z variant, jak obrázek popsat. Buď šlo o Sommige sterren zijn paars („některé hvězdičky jsou fialové"), anebo o Veel van de sterren zijn paars („hodně hvězdiček je fialových"). Díky tomu bylo zjištěno, kde mají jednotliví účastníci výzkumu svou hranici mezi kategoriemi sommige (některé) a veel (hodně). Následně byli účastníci tohoto výzkumu vystaveni tomu, že poslouchali nahrávky určité osoby, jak pojmenovává obrázky s hvězdičkami. Klíčové bylo, že v nahrávkách byla záměrně používána posunutá hranice mezi sommige a veel, přičemž sommige bylo použito i pro obrázky s více fialovými hvězdičkami než daná testovaná osoba předtím sama dělala. V následné fázi se pak testovalo, nakolik mají mluvčí tendenci svou předchozí hranici mezi sommige a veel posouvat pod vlivem toho, co slyšeli. Lev Ari zjistila, že lidé s menší sociální sítí měli vyšší tendenci tuto hranici posouvat než lidé s větší sociální sítí, což interpretovala jako dopad počtu zdrojů: s čím více lidmi komunikujeme, tím menší vliv na nás má každá další osoba, s níž se setkáme. Výzkum v příkladu (5) je z teoretického hlediska velmi zajímavý a vypovídá o vlivu sociálních faktorů (velikost sociální sítě) na to, jak silně jsou u mluvčích ukotvené hranice jazykových kategorií. Když budeme nad tímto výzkumem déle přemýšlet, můžeme přijít s návrhy proměnných, které mohou uvedený vztah mezi velikostí sociální sítě a tvárností jazykových kategorií ovlivňovat. Například bychom mohli uvažovat o tom, že do daného vztahu bude zasahovat jazyková zkušenost, kterou můžeme prostě sledovat pomocí věku. Mohlo by to být tak, že by bez ohledu na velikost své sociální sítě měli lidi vyššího věku menší tendenci posouvat hranice jazykových kategorií než mladší mluvčí. Pokud by to skutečně platilo, vstupovala by proměnná věk do vztahu mezi velikostí sociální sítě a tvárností kategorií, a to v tom smyslu, že efekt tohoto vztahu by pro mladší mluvčí byl vyšší než pro starší. Věk by v tomto případě byl takzvanou moderační proměnnou (moderátorem). Moderace je jev, kdy určitá třetí proměnná ovlivňuje sílu zjištěného vztahu mezi nějakou nezávislou a závislou proměnnou. Mohlo by to být ale rovněž tak, že samotná velikost sociální sítě má vliv na určité proměnné, které následně samy mohou ovlivňovat tvárnost reprezentací. Je například známo, že velikost sociální sítě koreluje s pocitem samoty (Doměnech-Abella et al., 2021). Hypoteticky by to mohlo být tak, že právě pocit samoty vyvolává větší tendenci přiblížit se ostatním tím, jak používáme jazyk, tedy například upravením hranic kategorií. Kdyby to tak bylo, byl by pocit samoty takzvanou mediační proměnnou. Mediace spočívá v tom, že třetí proměnná (mediátor) vlastně (spolu)zprostředkovává vztah mezi nezávislou a závislou proměnnou. pocit samoty moderace = jev, kdy třetí proměnná ovlivňuje sílu vztahu mezi nezávislou a závislou proměnnou [angl. moderation] Doměnech-Abella, J., Mundó, J., Swit-sers, L., Van Tilburg, T., Fernandez, D., & Aznar-Lou, I. (2021). Social network size, loneliness, physical functioning and depressive symptoms among older adults: Examining reciprocal associations in four waves of the Longitudinal Aging Study Amsterdam (LASA). International journal of Geriatric Psychiatry, 36(10), 1541-1549 mediace = jev, kdy třetí proměnná zprostředkovává vztah mezi nezávislou a závislou proměnnou [angl. mediation] mediace velikost sociálnísítě moderace věk mediace tvárnost reprezentací Obrázek 11.2: Hypotetický vztah mediace a moderace na příkladu výzkumu Shiri Lev Ari (2018). 11 Vztahy mezi proměnnými 112 Je třeba říct, že uvedené příklady moderace a mediace jsou ryze hypotetické a není vůbec jisté, jestli by tyto vztahy doopravdy takto fungovaly. Pro naše účely jsou nicméně důležité pro ilustraci. Mediace a moderace se dají rovněž zachytit graficky, viz obrázek 11.2. 11.4 Otázky na přemýšlení Zamyslete se nad nějakou empirickou studií, kterou jste v poslední době četli. Zkuste odpovědět na tyto otázky: 1. Jaké vztahy proměnných studie identifikovala? 2. Jednalo se v daném případě (respektive daných případech) o korelaci? Proč? 3. Dává smysl uvažovat v případě tohoto vztahu (respektive těchto vztahů) o kauzalitě? Proč? 4. Jaké proměnné by hypoteticky mohly do daného vztahu, respektive vztahů vstupovat jako moderátory a jaké proměnné by mohly působit v roli mediátorů? Výsledky a realita 12 Někdy se může zdát, že věda přichází s jasnými a definitivními zjištěními o tom, jak svět kolem nás funguje. Ve škole se často předávají různé poučky jako dané, v médiích můžeme narazit na různé zprávy typu „vědci zjistili, že je něco tak a tak" apod. Ve skutečnosti jsou ale vědecké závěry mnohem vratší, než by se mohlo zdát. To vůbec neznamená, že by vědecké úsilí nemělo pozitivní dopady a že by jeho výsledky nebyly důležité. Právě naopak! Je nicméně potřeba uvědomit si, že výsledky výzkumů nemusí být v absolutním souladu s realitou, že dochází k určitým odchylkám (často ne dobře rozpoznatelným) a že je třeba při práci s vědeckými výstupy jisté opatrnosti. Vzdělávání se v určitém oboru má přinejmenším tři důležité aspekty. Jednak se seznamujeme s dosavadním poznáním daného oboru (status quo), jednak se učíme, jak toto poznání rozhojňovat (jak realizovat výzkum, který ho prohloubí), a jednak si osvojujeme schopnost kritického zhodnocení toho, co bylo dosud zjištěno, respektive co sami zjistíme. Všechny tři aspekty jsou velice důležité. Žádný poznatek, byť třeba často citovaný a obecně známý, není (nebo aspoň nemusí být) bezproblémový a je třeba si být vědomi toho, v čem potenciální problémy spočívají. V této kapitole se budeme věnovat tomu, na jaké chyby (ve velmi širokém smyslu) ve výzkumu narážíme a čím bývají způsobeny. Zároveň se zaměříme na to, jak takovým chybám předcházet, anebo alespoň minimalizovat jejich riziko. 12.1 Redukce.......... 113 12.2 Náhodná a systematická chyba............ 116 Zkreslení a operacional- izace ............ 116 Zkreslení a technika sběru dat.......... 117 Zkreslení a zpracování dat.............. 117 Nezohledněné proměnné 119 12.3 Typy chyb......... 120 12.4 Odhalování chyb .... 121 Zjišťování reliability . . 122 Zjišťování validity .... 124 12.5 Replikovatelnost..... 125 12.6 Replikace a lingvistika . 127 12.7 Dobré návyky...... 128 12.8 Otázky na přemýšlení . 130 12.1 Redukce Obecný problém, se kterým jsme v empirickém výzkumu konfrontováni, je to, že nejsme schopni popisovat svět kolem nás v jeho úplnosti. To je ostatně důvodem, proč máme různé vědecké obory, které se zaměřují jenom na určité aspekty světa kolem nás. Ale i v rámci konkrétních výzkumů v určitém oboru si realitu určitým způsobem zjednodušujeme, redukujeme ji jenom na vybrané aspekty, na které se pak ve výzkumu zaměřujeme. Takové redukce jsou dány vlastně praktickými důvody, ale následně mají zásadní vliv na to, co můžeme v našem výzkumu zjistit. Redukce vlastně způsobují, že se tomu, jak věci opravdu fungují, pouze nějak přibližujeme (i když třeba v určitých případech relativně dobře). Miroslav Disman (2002, s. 25-28) uvádí čtyři typy redukcí, které ve Disman, M. (2002). Jak se vyrábí socíolog- výzkumu provádíme: ická znalost Karolinum (a) redukce počtu pozorovaných proměnných: z potenciálně nekonečného počtu proměnných si vybíráme pouze některé, které ve výzkumu zohledňujeme (b) redukce počtu analyzovaných vztahů mezi proměnnými: mezi vybranými proměnnými se zabýváme jenom určitými vztahy (například nemusíme řešit možné vztahy mezi nezávislými proměnnými) 12 Výsledky a realita 114 (c) redukce populace na vzorek: z celkové populace vybíráme jenom určitou její část (d) redukce časového kontinua na popis jednoho či několika málo časových bodů: zanedbáváme změny jevů v čase (například když sbíráme data pro určitý výzkum delší dobu, zanedbáváme často časové rozdíly mezi tím, kdy byla která část dat sebrána) Abychom si to ilustrovali, uveďme si jeden příklad, tentokrát trochu delší: (1) Stacy Birch a Susan Garnsey (1995) se věnovaly tomu, jak pozice určitého slova v rématu ovlivňuje jeho zapamatování. V jednom z experimentů pracovaly s úlohou rozpoznání slova. Účastníci výzkumu nejprve četli větu a následně se jim na obrazovce objevilo slovo, u něhož měli pomocí stisku tlačítka co nejrychleji určit, zda bylo obsaženo v předchozí větě či nikoliv. Slova, která se objevovala, byla buď formálně shodná s jedním ze slov předchozí věty, anebo byla fenologický či sémanticky podobná slovům z předchozí věty. Měřila se rychlost a správnost stisku tlačítka (ano či ne). Autorky očekávaly, že slova, která byla ve větě v rématu (fokusu), budou rozpoznávána rychleji, než slova, která v rématu nebyla. Celkově se pracovalo s 200 položkami/itemy (tj. kombinacemi dvojice vět + slovo), přičemž 80 z nich představovaly výplňkové položky a 120 bylo předmětem analýzy. Z těchto 120 itemů bylo 40 itemů obsahujících formálně shodná slova, 40 obsahujících fenologický blízká slova (např. caucus a caution) a 40 obsahujících sémanticky blízká slova (např. bread a butter). Zde pro ilustraci příklad dvou itemů (první byl zaměřen na rozpoznání identického slova a druhý na rozpoznání sémanticky blízkého slova; podtržení signalizuje slovo, o které se ve větě jednalo): (a) Iťs the table that takés up far too much space in this little room. TABLE (b) After the clutter on the table had been cleared, Kimfound her ring. TABLE (c) There's this bread from the bakery that tastes really good with cheese. BUTTER (ď)The French have cheese, bread, andfruit with most oftheir meals. BUTTER Autorky se snažily, aby testované věty byly přibližně stejně dlouhé a také si předvýzkumem ověřovaly, zda rodilí mluvčí angličtiny skutečně vnímají slovo v rématu jako nějak zdůrazněné. Každá věta byla zobrazena po dobu 3 sekund. Poté byla na 1 sekundu prázdná obrazovka a následně se objevilo slovo. Na svou reakci měli účastníci výzkumu maximálně 1,75 sekundy. Po každém stisknutí se jim na obrazovce objevilo, zda odpověděli správně. Experiment trval zhruba 35 minut. Autorky pracovaly se vzorkem 40 studentů University of Illinois a na základě statistického zpracování dat došly k závěru, že u identických slov bylo rozpoznávání rychlejší v případě, že byla tato slova v rématu (např. věta (a) oproti (b)). Zároveň však nezjistily žádné statisticky významné rozdíly pro fenologický blízká a sémanticky blízká slova (pozice v rématu se u nich nezdála hrát podstatnou roli). Birch, S., & Garnsey, S. (1995). The effect of focus on memory for words in sentences, journal of Memory and Language, 34(2), 232-267. https://doi.org/10.1006/ jmla.1995.1011 Než se podíváme na možné problémy této studie, je třeba upozornit na to, že jsem ji pro účely tohoto výkladu nevybíral proto, že by byla nějak závadná. Je to spíše naopak, protože se jedná o vcelku zajímavou starší studii, která je dodnes citovaná. Potenciální problémy můžeme identifikovat u každé studie, na kterou narazíme, přičemž někdy jsou tyto problémy nápadnější a větší, jindy zase spíše nenápadné. Je to proto, že ve vědecké praxi jsme z principu nuceni vyvažovat mezi ideálním řešením a praktickými možnostmi, přičemž právě praktické možnosti jsou obvykle docela omezené. Když se podíváme na příklad (1), může nás napadnout spousta otázek, kupříkladu: Jak se určovalo, co je sémanticky nebo fonologicky blízké slovo? Proč bylo v každé experimentální skupině 40 itemů? Jakou roli mohly hrát syntaktické a sémantické rozdíly mezi dvěma větami v itemu (kromě samotné pozice v rématu)? Mohlo výsledky ovlivňovat to, že byly věty zobrazeny 3 sekundy? Mohlo výsledky ovlivňovat to, že byli účastníci výzkumu průběžně informováni o správnosti odpovědí? Není vzorek 40 studentů malý? Nemohla samotná prezentace slova po přečtení věty ovlivňovat paměťovou stopu? Způsob odpovědí ano - ne skýtá 50% šanci trefit správný výsledek - mohlo to mít vliv na výsledky? Mohl limit 1,75 sekundy ovlivnit správnost reakcí? Mohly hrát ve výsledcích roli i další nemanipulované faktory, jako třeba délka věty, časový odstup mezi zobrazením věty a zobrazením slova, paměťové schopnosti účastníků výzkumu, velikost písma, nebo třeba průběžně narůstající únava a ztráta pozornosti? Na některé z těchto otázek bychom našli v textu studie alespoň částečnou odpověď, na jiné nikoliv. Z uvedeného je zřejmé, že autorky v experimentu v příkladu (1) redukovaly realitu jenom na velmi specifický a vlastně uměle utvořený (manipulovaný) výsek. Tyto otázky vychází právě z redukcí, o kterých mluví Disman (2002): (a) Autorky redukovaly počet pozorovaných proměnných. Hlavní závislou proměnnou byl reakční čas správných odpovědí (vedlejší pak samotná správnost odpovědi), nezávislými proměnnými pak typ slova (shodné, fonologicky podobné, sémanticky podobné) a přítomnost slova v rématu. S dalšími potenciálními proměnnými se v tomto experimentu nepracovalo. Je přitom možné, že některé z nezohledněných proměnných měly na výsledky výrazný vliv (nabízí se třeba syntakticky a sémanticky velmi odlišná podoba dvou vět v každém z itemů). (b) Kromě redukce počtu pozorovaných proměnných redukovaly autorky rovněž populaci na vzorek. Jak jsme si uvedli v předchozí kapitole, vzorek má v lingvisticky zaměřených výzkumech často dvojí podobu. Autorky jednak redukovaly populaci rodilých mluvčích angličtiny na 40 vysokoškolských studentů, jednak redukovaly potenciálně možné věty v angličtině na soubor 120 specifických itemů. Taková redukce je zásadní, ale typicky bývá dána praktickými omezeními: může být obtížné získat větší vzorek osob a zároveň je velmi těžko představitelné, že by experiment obsahoval ještě větší množství vět, protože už tak trval 35 minut, což je poměrně dlouhá doba. (c) V experimentu došlo i na redukci časového kontinua na jeden bod. V řadě případů můžeme předpokládat, že dochází ke změnám v 12 Výsledky a realita 116 čase. Některé jevy se proměňují rapidně, jiné pozvolněji. V uvedeném experimentu velmi pravděpodobně docházelo v průběhu času ke změnám koncentrace, postupující únavě, ale také k lepšímu osvojení si samotné procedury apod. Můžeme tak předpokládat, že výkon jednotlivých účastníků nebyl konstantní. Proměny v průběhu experimentu jsou však opomíjeny. 12.2 Náhodná a systematická chyba Z toho, že ve výzkumu vždy nějakým způsobem redukujeme realitu, vyplývá, že se námi získané výsledky nekryjí zcela přesně s realitou, nějak se od ní odchylují. Takovým odchylkám od reality můžeme říkat chyby a mohou být buď náhodné, anebo systematické. Náhodná chyba je odchylka od reality, která není dána nějakou vnější, nepozorovanou proměnnou, ale je prostě v pravém slova smyslu nahodilá, je dána nejrůznějšími dílčími rušivými vlivy. Tuto chybu nelze nikdy zcela odstranit, nicméně ji můžeme minimalizovat. Její důležitou vlastností je, že se snižuje spolu s rostoucí velikostí vzorku - s čím větším vzorkem tedy pracujeme, tím menší tato chyba je. Systematická chyba neboli zkreslení je pak odchylka výsledků od reality daná něčím vnějším (nezohledněnou proměnnou, anebo více proměnnými). Charakteristické je, že se systematická chyba nezmenšuje, když zvětšíme vzorek. Tuto chybu je možné z výzkumu odstranit právě tím, že zohledníme to, čím je zapříčiněna. Dále se zaměříme na to, na jaké systematické chyby, respektive zkreslení lze ve výzkumu narážet, čím jsou způsobeny a jak se jim můžeme vyvarovat. Zkreslení může být dáno nejrůznějšími rozhodnutími, která učiníme v průběhu práce na výzkumném projektu - od formulace hypotéz, přes návrh techniky získávání dat, výběr vzorku (viz pojednání o reprezentativnosti v předchozí kapitole), sběr dat až po samotnou analýzu a interpretaci. náhodná chyba = nahodilá odchylka od reality, která není dána vnější proměnnou [angl. random error] systematická chyba (zkreslení) = odchylka od reality, která je dána vnější, nepozorovanou proměnnou [angl. systematic error; bias] Zkreslení a operacionalizace O operacionalizaci jsme už mluvili v kapitole věnované proměnným. Jak jsme řekli, má operacionalizaci zásadní dopady na možnosti statistického zpracování dat a různé způsoby operacionalizace určitého jevu nám dávají různě podrobnou informaci. To je pak důležité pro vyhodnocení výsledků - operacionalizace totiž do nich vnáší určité zkreslení. Když se vrátíme k příkladu (1), můžeme se zamýšlet nad tím, nakolik výsledky mohla ovlivnit operacionalizace kategorií „fenologický blízké slovo" a „sémanticky blízké slovo". Podíváme-li se přímo do studie Birch a Garnsey (1995), vidíme, že se v těchto kategoriích objevovaly dost různorodé případy. Například jako fenologický podobné dvojice byly vymezeny dvojice jako caution a caucus, tomato a tornado, battle a batter, ale také třeba dvojice airplane a heirloom, bull a boy. Jako sémanticky podobné byly vymezeny víceméně synonymní dvojice street - road, command -order, ale i dvojice ze stejných významových okruhů jako coffee - tea, butter - bread, lion - tiger, floor - ceiling apod. To pochopitelně mohlo způsobit 12 Výsledky a realita 117 zkreslení, protože není nepravděpodobné, že se odlišné dvojice v rámci určité kategorie chovají rozdílně. Zkreslení a technika sběru dat Nejrůznější systematické chyby mohou být způsobeny technikou sběru dat a jejím nastavením. Například v dotazníku využívajícím uzavřené otázky může docházet k tomu, že respondenti prostě v rychlosti zaškrtají ty odpovědi, které jim přijdou pod ruku, aniž by nad tím uvažovali. Analogický problém může vznikat v experimentech měřících reakční časy, které participanti mohou prostě „odklikat", aniž by se nějak věnovali jednotlivým stimulům. Zajímavým zkreslením týkajícím se jakékoliv techniky, která využívá uzavřené otázky, je tzv. přitakání Winkler et al., 1982), což spočívá v tom, že respondenti mají tendenci odpovídat na otázky spíše ano než ne (zejména se to týká otázek, na které nemají vyhraněný názor, anebo si nejsou jisti). Různé techniky sběru dat mohou být spojeny s efekty pořadí, což je zkreslení spočívající v tom, že předchozí položky (otázky v dotazníku, experimentální podněty apod.) ovlivňují reakce na následující položky. Z toho důvodu se pořadí položek velmi často randomizuje, tedy znáhod-ňuje (buď úplně, takže každý účastník výzkumu je vystaven specifickému pořadí podnětů, anebo nějak kontrolované, například tak, že se vytvoří několik způsobů řazení položek a každému respondentovi je náhodně přiřazeno jedno z nich). Když se vrátíme k příkladu (1), můžeme za potenciální zdroj zkreslení považovat například časová nastavení experimentu. Fixní čas 3 sekund pro zpracování věty může představovat zkreslení proto, že se čtenáři liší v tom, jak rychle čtou a někteří mohou být se čtením věty hotovi velmi rychle, zatímco jiní nemusí za 3 sekundy být schopni větu stihnout přečíst v úplnosti (anebo ne vždy). Podobně může zkreslení pramenit z omezeného času na odpověď. Ten je dán snahou, aby participanti s odpovědí neváhali, je však možné, že to u některých účastníků výzkumu způsobuje nežádoucí stres. Stejně tak může být zdrojem zkreslení zpětná vazba po každém stisknutí tlačítka. Jedná se o potenciální zdroje zkreslení a je klidně možné, že tyto aspekty výzkum nijak vážněji neovlivnily. Na druhou stranu nelze striktně z jednoho experimentu vysoudit, zda to tak je či není. Různá zkreslení, na která se naráží v behaviorálním výzkumu, popisují podrobněji Podsakoff et al. (2003). Zkreslení a zpracování dat Winkler, J. D., Kanouse, D. E., & Ware, J. E. (1982). Controlling for acquiescence response set in scale development. Journal of Applied Psychology, 67(5), 555-561 Podsakoff, P. M., MacKenzie, S. B., Lee, J.-Y., & Podsakoff, N. P. (2003). Common method biases in behavioral research: A critical review of the literature and recommended remedies. Journal of applied psychology, 88(5), 879-903 Ke zkreslením může docházet i v souvislosti se zpracováním dat. V některých výzkumech je nutné data kódovat, aby je bylo možné dále zpracovávat (například statisticky). Může jít například o odpovědi na otevřené otázky, anebo třeba o anotaci určitých jazykových jevů (například syntaktickou anotaci v korpusech). Kódování může být poměrně složité a může docházet k nekonzistencím (například se dva lidé, kteří kódování provádí, nemusí shodnout na tom, jak kódovat určitý jev). 12 Výsledky a realita 118 Pro tyto účely je důležité, aby existovala jasná pravidla, podle nichž se kódování provádí. Příklad takových pravidel uvádíme v Boxu 12.1. Zároveň bývá vhodné, aby kódování prováděla osoba, která není detailně seznámena s cíli výzkumu, respektive s jeho hypotézami, protože povědomí o tom, co se očekává jako výsledek výzkumu, může ovlivnit jednotlivá rozhodnutí při kódování. Box 12.1: Příklad pravidel kódování Ve studii Chromý a Vojvodič (2023) jsme se zaměřovali na to, jak lidé odpovídají na otevřené otázky. Použitá pravidla kódování vypadala následovně: Výsledky jsou anotovány na dvou úrovních: správnost odpovědi a typ nesprávné odpovědi. Správnost odpovědi Používají se dvě hodnoty: (i) správně, (ii) nesprávně. Správná odpověď je odpověď, která je sémanticky a syntakticky správná, buď opakuje to, co bylo výslovně uvedeno ve větě, nebo informaci formuluje jinak bez zjevného významového posunu (například pomocí blízkých synonym). Správná odpověďje konkrétní a obsahuje všechny potřebné informace. Pokud odpověď obsahuje další informace, na které nebyla otázka zaměřena, jsou pro správnost odpovědi brány v úvahu pouze cílové informace. Případná pravopisná nepřesnost (překlepy, překlepy) se pro správné kódování nebere v úvahu. Nesprávná odpověďje jakákoli jiná odpověď. Příklady Věta: Marie našla časopis v pondělí v knihovně. Otázka: Co Marie našla? Správně: „časopis", „žurnál", „žurnál v knihovně", „časopis z knihovny", „Myslím, že to byl časopis" nebo „žurnál v hale" Nesprávně: „kniha", „v knihovně", „v pondělí", „Marie nalezena" Typ nesprávné odpovědi Používají se čtyři hodnoty: (i) nevím, (ii) substituce, (iii) odlišné, (iv) zbytek. Odpovědi, ve kterých účastníci výslovně uvedli, že neznají odpověď nebo ve kterých tvrdili, že informace ve větě nebyly, byly kódovány jako „nevím". Odpovědi, které obsahovaly smysluplnou, ale nesprávnou odpověď na danou otázku, byly kódovány jako „substituce". Odpovědi, které zdánlivě odpovídaly na jinou otázku, byly kódovány jako „odlišné". Zbytek nesprávných odpovědí, jako jsou neúplné odpovědi, byl kódován jako „zbytek". Příklady Věta: Mary našla časopis v pondělí v knihovně. Otázka: Co Marie našla? Chromý, }., & Vojvodič, S. (2023). When and where did it happen? Systematic differences in recall of core and optional sentence information. Quarterly Journal of Experimental Psychology, 17470218231159190 12 Výsledky a realita 119 Nevím: „To nebylo ve větě řečeno", „Nevím", „Nejsem si jistý" Substituce: „kniha", „tužka", „papír" Odlišné: „v pondělí", „v knihovně", „Marie" Zbytek: „na", „a" Zkreslení může ale nastávat i v jiné oblasti zpracování dat, než je kódování, a to při rozhodování o tom, která data z výzkumu vyloučit, případně naopak která data chceme pro analýzu ponechat. Pokud máme nasbíraná data, můžeme mít různé důvody, proč některé jejich části z analýzy vyloučit. Například pokud zkoumáme rodilé mluvčí nějakého jazyka, můžeme chtít vyloučit z nasbíraných dat mluvčí, kteří jsou od narození bilingvní, ve výzkumu zaměřeném na výzkum běžné mluvy můžeme mít tendenci vyloučit mluvčí, kteří při nahrávání mluvili vyšším stylem, v experimentálním výzkumu založeném na měření reakčních časů můžeme oříznout výsledky tak, abychom se zbavili zcela extrémních hodnot, v dotazníkovém výzkumu nechceme do analýzy zahrnout někoho, kdo odpovídal bezmyšlenkovitě apod. Důvodů pro vyloučení určité části dat může být mnoho, je však dobré si uvědomit, že takové manipulace s daty mají určitý dopad na výsledky (zejména v případě menších vzorků může být takový dopad poměrně zásadní). Zde však narážíme na citlivý problém - pokud taková data vyloučíme, může to ovlivnit naše výsledky. Obecně zde platí, že bychom měli mít plán případného vylučování dat stanovený před započetím výzkumu a následně bychom se ho měli držet. Nezohledněné proměnné Velmi častým zdrojem zkreslení může být způsobené tím, jaké proměnné ve výzkumu zohledníme. Abychom si to ilustrovali, podívejme se na jeden příklad. (2) David John Saer (1923) publikoval vlivnou studii zkoumající rozdíly mezi monolingvními a bilingvními dětmi ve věku 7-11 let žijícími ve Walesu, přičemž celkově pracoval se vzorkem 828 dětí. Ve svém výzkumu využíval Stanford-Binetův inteligenční test a zjistil, že bilingvní děti z venkovského prostředí vykazovali výrazně horší výsledky než monolingvní děti z téhož prostředí. Tyto výsledky (spolu s dalšími) interpretoval jako neblahý dopad bilingvismu, přičemž tvrdil, že bilingvismus způsobuje duševní zmatenost. Příklad (2) dává do souvislosti počet jazyků, který si děti osvojují, s jejich inteligencí, přičemž dochází k tomu, že mezi těmito proměnnými je přímý vztah: osvojování více než jednoho jazyka způsobuje, že děti mají horší inteligenci. Tyto závěry měly ve své době dost závažné dopady (například na doporučení rodičům, že nemají děti vychovávat ve dvou jazycích), jsou však vysoce problematické. Klíčové v daném případě bylo, že děti byly testovány pomocí verbálního testu inteligence a to v angličtině, která pro většinu bilingvních dětí představovala druhý jazyk (prvním jazykem byla velština). Výsledky tak byly výrazně ovlivněny porozuměním samotnému testu. V kritické přehledové studii o třicet let Saer, D. J. (1923). The effect of bilingual-ism on intelligence. British Journal of Psychology: General Section, 14, 25-38 12 Výsledky a realita 120 později ukázala Darcy (1953), že zatímco ve verbálních testech inteligence bilingvní děti nezřídka zaostávají, v neverbálních testech inteligence jsou na stejné úrovni jako jejich monolingvní vrstevníci. Ačkoliv se tedy na základě Saerova (1923) výzkumu mohlo zdát, že mezi počtem osvojovaných jazyků a inteligencí je zřejmý vztah, nebyla to pravda a do výsledků vstupovala ještě jiná, opomíjená proměnná, konkrétně znalost testovacího jazyka. Právě nezohlednění proměnných, které vstupují do vztahu, který se svým výzkumem snažíme ověřovat, je zcela zásadní problém, který nemusí být na první pohled patrný. Ačkoliv se Saerův výzkum může zpětně zdát špatně provedený, velmi špatně interpretovaný a měl velmi neblahé důsledky pro výchovu a vzdělávání dětí, je docela pravděpodobné, že byl veden dobrými úmysly a autor si svá pochybení vůbec neuvědomil. V principu existuje nekonečné množství proměnných, které mohou na námi zkoumané jevy mít určitý vliv. To, které z těchto proměnných ve výzkumu zohledníme, není vůbec triviální záležitost a je potřeba to vždy dobře zvážit už v raných fázích výzkumu. Darcy, N. T. (1953). A review of the literature on the effects of bilingualism upon the measurement of intelligence. The Pedagogical Seminary and Journal of Genetic Psychology, 82(1), 21-57 12.3 Typy chyb Výše jsme se zaměřili na rozdíl mezi náhodnými a systematickými chybami. Tato distinkce vlastně vyjadřuje, zda se naše výsledky od reality odchylují kvůli určitým ruchům, anebo kvůli tomu, že je ve hře nějaká další proměnná, kterou přímo nesledujeme (případně více proměnných). Jinými slovy, šlo nám o to, čím je odchylka od reality způsobena. Nyní se podívejme na problematiku chyb z trochu jiné perspektivy, a to z hlediska toho, v čem daná odchylka od reality spočívá. Jak už jsme si vícekrát řekli, ve výzkumu se vždycky snažíme identifikovat určité vztahy. Právě poznání vztahů mezi proměnnými zlepšuje naši představu o tom, jak funguje svět kolem nás. Hlavním výsledkem určitého zkoumání je konstatování, že mezi proměnnou A a proměnnou B je či není vztah. Pokud je tento vztah deklarován, je obvykle vyjádřena jeho síla a také směr (srov. kladnou a zápornou korelaci). To nám vlastně dává možnost mýlit se hned několika způsoby. V prvé řadě můžeme chybovat v samotném určení toho, zda vztah existuje, nebo ne. Chyba pak spočívá buď v tom, že tvrdíme, že vztah existuje, ale ve skutečnosti tomu tak není (takzvaná chyba 1. druhu), anebo v tom, že tvrdíme, že vztah neexistuje, ale ve skutečnosti dané proměnné ve vztahu jsou (takzvaná chyba 2. druhu). Tyto možnosti omylu shrnuje tabulka 12.1. Tyto dvě chyby pojmenovány špatně zapamatovatelným způsobem a těžko říct proč. Jde však o poměrně důležitou distinkci zejména proto, že se s ní operuje v inferenční statistice. vztah podle nás existuje podle nás neexistuje reálně neexistuje chyba 1. druhu správně reálně existuje správně chyba 2. druhu I když ale vztah mezi proměnnými reálně existuje a určitý výzkum tento vztah dokládá, může docházet k chybám. Gelman a Carlin (2014) v této souvislosti rozlišují takzvané chyby S a chyby M. Chyby S (podle Tabulka 12.1: Tabulka ukazující možné chyby z hlediska špatné detekce vztahu. Gelman, A., & Carlin, J. (2014). Beyond power calculations: Assessing type S (sign) and type M (magnitude) errors. Perspectives on Psychological Science, 9(6), 641-651 12 Výsledky a realita 121 anglického „sign") spočívají v tom, že ve skutečnosti je vztah opačný, než výzkum tvrdí. Chyby M (podle anglického „magnitude") spočívají v omylu z hlediska síly vztahu. 12.4 Odhalování chyb V každém výzkumu můžeme narážet na různé chyby, protože do hry mohou vstupovat nejrůznější nepozorované proměnné. Pokud však nějaký výzkum realizujeme, musíme se aktivně snažit riziko chyb minimalizovat. Jedním ze způsobů, jak se bránit proti zkreslením (alespoň některým), je provést důkladnou pilotáž a získat odezvu od jejích účastníků. Pilotáž je vlastně provedení výzkumu nanečisto, a to s omezenou skupinou účastníků (může jít třeba o rodinné příslušníky, přátele, vlastní studenty apod.). V pilotáži můžeme vše vyzkoušet, můžeme ověřit, zda vše funguje tak, jak by mělo, a můžeme se i orientačně podívat na to, jak vypadají výsledky. Důležité je při pilotáži také získat zpětnou vazbu přímo od osob, které se jí účastnily - můžeme zjistit, zda je vše srozumitelné, zda není výzkum příliš náročný a únavný apod. To vše nás následně vede k upravené verzi celého výzkumného postupu. Pilotáž nás může upozornit na řadu různých problémů, které jsme si při navrhování výzkumu neuvědomili, nicméně není všespásná (z logiky věci nám například nepomůže předejít možným zkreslením spojeným s výběrem vzorku). I po provedení důkladné pilotáže mohou některé chyby přetrvávat. V souvislosti s chybovostí výsledků se často používají dva užitečné pojmy, a to reliabilita a validita. Reliabilita určitého výzkumného postupu spočívá v tom, nakolik jsou výsledky získané prostřednictvím tohoto postupu konzistentní. Pokud je výzkumný postup reliabilní, dává nám při opakovaných měřeních velmi podobné výsledky - pokud postup reliabilní není, získáváme při opakovaných měřeních výrazně odlišné výsledky. Reliabilita se dá usouvztažnit s výskytem náhodných chyb -čím větší je náhodná chyba, tím je výzkum méně reliabilní (a naopak). pilotáž = provedení výzkumu nanečisto na menším vzorku [angl. pilot study] reliabilita = míra, do jaké dává určitý výzkumný nástroj při opakovaných měřeních podobné výsledky, nakolik je v měření spolehlivý [angl. reliability] validita = míra, do jaké určitý výzkumný nástroj zkoumá to, co předpokládáme, že zkoumá [angl. validity] nereliabilní a nevalidní nereliabilní, ale validní reliabilní, ale nevalidní reliabilní a validní Obrázek 12.1: Ilustrativní příklad vztahu reliability a validity na hypotetickém střílení do terče. Validita (platnost) výzkumného postupu vyplývá z toho, nakolik daný postup skutečně zkoumá, co zkoumat má. Pokud je výzkumný postup validní, vypovídají jím získané výsledky o zkoumaném problému. Validita tak úzce souvisí s přítomností zkreslení (systematické chyby) - čím větší zkreslení je ve výzkumu přítomno, tím nižší je validita. Reliabilita a validita se často ilustrují pomocí terčů, jako na obrázku 12.1. Na tomto obrázku vidíme čtyři terče a na každém z nich různé zásahy. Na prvním terči zleva vidíme, že jsou zásahy poměrně rozprostřené (jde tedy o nereliabilní střelbu) a zároveň jsou systematicky vychýlené od středu nahoru (jde o nevalidní střelbu). Na druhém terči jsou zásahy rozprostřeny kolem středu (validní střelba), ale jsou poměrně daleko od sebe (střelba je nereliabilní). Na třetím terči pak vidíme příklad reliabilní, avšak nevalidní střelby: střelec se po každé trefil víceméně do stejného místa, ale zásahy šly systematicky mimo střed terče (do jeho pravé spodní části). A na posledním terči pak vidíme optimální situaci, kdy jdou zásahy do středu terče a zároveň jsou velmi málo rozprostřené. Zjišťování reliability Jak jsme řekli, souvisí reliabilita přímo s přítomností náhodné chyby a spočívá v tom, nakolik je měření spolehlivé. Existuje více způsobů, jak zjišťovat, nakolik je náš výzkumný postup reliabilní. Vzhledem k tomu, že reliabilní výzkum by měl při opakovaném měření generovat velmi podobné výsledky, je přirozenou cestou zjišťování reliability právě opakované měření. V takovém případě mluvíme o zjišťovány realiability metodou opakovaného měření (test-retest reliabilita). Tato metoda spočívá v tom, že výzkum provedeme dvakrát a výsledky statisticky usouvztažníme pomocí testu korelace (viz ještě dále). Ideálně bychom test-retest reliabilitu měli ověřovat na stejném vzorku s určitým časovým odstupem, to však ale samo o sobě může přinášet určité zkreslení. Řada jevů (například názory a přesvědčení osob) se s časem může výrazně měnit. Problém je rovněž v tom, že účastníci výzkumu jsou již s výzkumným postupem seznámeni a jejich výsledky tím mohou být ovlivněny (například jsou v určitých úlohách úspěšnější apod.). V případě, že využijeme pro ověřování test-retest reliability jiný vzorek, vystavujeme se zase tomu, že nebude jasné, zda jsou případné rozdíly ve výsledcích dány nereliabilností výzkumného postupu, anebo prostě rozdíly ve struktuře vzorku. Reliabilitu lze však zjišťovat i bez opakovaného měření. Jedním ze způsobů může být měření vnitřní konzistence výsledků. To dává smysl tehdy, využíváme-li pro zjišťování určitého vztahu mezi proměnnými více položek (itemů). Například v dotazníku můžeme mít více otázek zaměřených na zjišťování zkoumaného jevu (kupříkladu přijatelnost určité syntaktické konstrukce), v experimentu zase můžeme pracovat s více itemy (viz 40 itemů od každého typu dvojice v příkladu (1)). Vnitřní konzistence pak spočívá v tom, že jednotlivé položky přináší velmi podobné výsledky (mají mezi sebou vysokou korelaci). Variantou tohoto způsobu ověřování reliability může být metoda půlení (takzvaná split-half reliabilita), která spočívá v tom, že rozdělíme náš nástroj sběru dat na dvě poloviny (například bychom místo experimentu s 40 itemy pracovali s dvěma experimenty po 20 itemech) a následně usouvztažníme získané výsledky. 12 Výsledky a realita 123 Ještě jiným způsobem, jak nahlížet reliabilitu, je usouvztažňovat výsledky získané pomocí dvou velmi podobných nástrojů sběru dat. Například můžeme vytvořit dvě verze experimentů, které se budou shodovat v počtech itemů i výplňkových stimulů, budou pracovat se stejnými proměnnými a jejich hodnotami, ale samotná podoba stimulů bude odlišná (například jinak lexikálně obsazené věty). Takovému způsobu ověřování reliability se říká reliabilita paralelních forem. Problémem tohoto způsobu je však to, že se dva alternativní způsoby testování téhož jevu z principu nějak liší, nejsou plně ekvivalentní, což naměřenou míru shody výsledků z principu snižuje. Reliabilitu výzkumu můžeme zajišťovat i jinak, než že ji přímo sami zjišťujeme. V některých výzkumných odvětvích je například pro různé účely možné využívat různé standardizované a zavedené techniky. Uveďme si v té souvislosti alespoň dva příklady: (3) Dunn a Fox Tree (2009) vytvořily dotazník pro zjišťování jazykové Dum, A. L., & Tree, J. E. F. (2009). dominance bilingvních mluvčích z vícejazyčného prostředí (pů- A qmck' gradient bilingual dominance , v, , , „ , ... , , ^, i-v.. ^ „.,. , scale. Bilingualism: languageand cogniíion, vodne byl vytvořen pro bilmgvni mluvci angličtiny a španělštiny). 273-289 Dotazník je určen pro stanovování míry dominance jednoho z jazyků a skládá se ze 12 jednoduchých otázek zaměřených na osvojování a užívání obou jazyků. Odpovědi na jednotlivé otázky jsou obodované a výsledkem je skóre na škále od plně dominantního jednoho jazyka až k plně dominantnímu druhému z jazyků. Autorky ověřovaly smysluplnost dotazníku tím, že usouvztažňovaly výsledky získané tímto dotazníkem s výkonem v překladové úloze (účastníci výzkumu měli za úkol překládat přepisy spontánních projevů ze španělštiny do angličtiny, přičemž se měřilo, nakolik se při překladu dopouští hezitačních zvuků jako eh, em apod. a také elongací, tedy nenáležitých prodloužení slabik souvisejících s váháním). (4) Smolík a Bytešníková (2017) vytvořili Stučný dotazník dětského slovníku (SDDS), který obsahuje 40 položek pro zjišťování velikosti slovní zásoby u dětí ve věku 16-42 měsíců. Jedná se o rodičovský dotazník, v němž rodiče uvádí, zda danému slovu jejich dítě rozumí, respektive zda ho samo aktivně užívá. Pomocí tohoto dotazníku by mělo být možné zachytit opožděný či narušený vývoj slovní zásoby u malých dětí. Dotazník byl standardizován na vzorku 1047 dětí z ČR s různým demografickým pozadím. V návaznosti na to Smolík a Bytešníková (2021) provedli výzkum s 200 dětmi ve věku 1;3 až 3;6, který usouvztažňoval skóre v dotazníku SDDS s výsledky v testu produkce a porozumění založeném na obrázcích. Smolík, E, & Bytešníková, I. (2017). StruV čný dotazník dětského slovníku: Vývoj a normy nástroje pro screening vývoje jazyka v raném věku. Československá psychologie, 61(5), 460-473 Smolik, E, & Bytesnikova, I. (2021). Validity of the SDDS: A 40-item vocabulary screening tool for 18-to 42-month olds in Czech, journal of Communication Disorders, 93,106146 Příklady (3) a (4) představují standardizované výzkumné nástroje, které je možné využít pro vlastní účely. To je vhodné jak při snaze srovnávat výsledky vlastního výzkumu s dalšími výzkumy, které využívají tytéž nástroje, tak v případě, že se chceme opřít o zavedený a spolehlivý způsob testování. Zjišťování validity Jak jsme si uvedli, validita spočívá vlastně v míře, nakolik výzkumný nástroj skutečně zkoumá to, co zkoumat má. To souvisí s přítomností zkreslení. Pokud jsou výsledky systematicky ovlivňovány nějakou nepozorovanou nezávislou proměnnou, neodpovídají dobře realitě a výzkum není validní. Podobně jako u reliability, i validitu lze určitým způsobem ověřovat. Například se můžeme ptát na to, zda to, jakým způsobem určitý jev zkoumáme, skutečně tento jev pokrývá. Mluvíme pak o obsahové validitě. Pokud bychom například stanovovali obsahovou validitu dotazníku pro zjišťování jazykové dominance bilingvních mluvčích (viz příklad (3)), ptali bychom se na to, zda je dominance jazyků v úplnosti stanovitelná na základě daných 12 otázek a jaké aspekty toho, jak chápeme dominanci, jsou případně opomenuty. Obsahová validita vychází z posouzení odborníků a vztahuje se přímo k dosavadním poznatkům v dané výzkumné oblasti. Obsahové validitě je blízká takzvaná zjevná validita, což je vlastně validita určovaná ryze subjektivně (výzkumný postup se z odborného hlediska zdá zkoumat to, co zkoumat chce). Objektivnějším měřítkem je pak kriteriální validita, která spočívá v tom, že výsledky získané pomocí určitého výzkumného nástroje odpovídají určitému kritériu. Rozlišuje se přitom takzvaná souběžná validita a prediktivní validita. Výzkumný nástroj má vysokou souběžnou validitu, pokud jím získané výsledky výrazně odpovídají výsledkům získaným pomocí jiného nástroje, který se zaměřuje na stejný problém. To lze ilustrovat na příkladu (4), kde Smolík a Bytešníková (2021) usouvztažňovali výsledky získané pomocí rodičovského dotazníku SDDS s výsledky testu na produkci a porozumění u malých dětí. Jak rodičovský dotazník, tak test produkce a porozumění cílily na velikost slovní zásoby dětí, jejich výsledky by si tak ideálně měly odpovídat. Prediktivní validita spočívá ve shodě výsledků získaných pomocí určitého výzkumného nástroje s budoucím stavem. Příkladem sporné prediktivní validity mohou být nepřesné předpovědi počasí, které jsou založeny na meteorologickém modelu. Naopak dobrou prediktivní validitu by měly testy jazykových schopností, které by dobře určovaly, nakolik bude testovaná osoba schopná se domluvit v reálných situacích. Ještě jiným způsobem, jak určovat validitu výzkumného nástroje, je takzvaná konstruktová validita. Ta je založena na teoretickém vymezení problematiky (na určitém teoretickém konstruktu) a v podstatě jde o to, zda určitý výzkumný nástroj funguje tak, jak by podle teoretického konstruktu fungovat měl. Takovým konstruktem může být například úroveň znalosti nějakého jazyka (anebo třeba jazyková dominance u bilingvních mluvčích jako v příkladu (3)). Úroveň znalosti jazyka není samozřejmý pojem, ve výzkumu si ho teoreticky vymezujeme, „konstruujeme" si ho. Například můžeme předpokládat, že úroveň znalosti jazyka se odvíjí od znalosti slovní zásoby, znalosti gramatiky a zvukových a grafických aspektů jazyka a schopnosti tyto znalosti aktivně využívat, respektive jim rozumět. Kdybychom šli do detailů, ukázalo by se, jak komplexní a vlastně nejasný tento konstrukt může být (ačkoliv s ním běžně operujeme, a to vcelku intuitivně). Když si tento konstrukt nějak teoreticky vymezíme, můžeme se ptát na to, zda určitý výzkumný nástroj, který 12 Výsledky a realita 125 pro zjišťování úrovně znalosti jazyka používáme, skutečně zachycuje jednotlivé zásadní vlastnosti (indikátory) tohoto konstruktu. U konstruktové validity se vymezují dva podtypy: diskriminační a konvergentní validita. Diskriminační validita je založena na principu, že by výzkumný nástroj neměl zachycovat proměnné, které zachycovat nemá. Jinými slovy, měřítka zaměřená na odlišné aspekty teoretického konstruktu by si neměla odpovídat (neměla by spolu korelovat). Oproti tomu konvergentní validita spočívá v tom, že výzkumný nástroj skutečně zachycuje různé proměnné (aspekty teoretického konstruktu), které zachycovat má. Z toho vyplývá, že různá měřítka téhož teoretického konstruktu by si měla vzájemně odpovídat. Konvergentní validita je tedy prakticky identická se souběžnou validitou, v praxi se jejich zjišťování neliší, byť v literatuře se běžně uvádí jako typy odlišné. Posledním typem validity, který si uvedeme, je takzvaná ekologická validita. Výzkum je ekologicky validní, pokud se dají jeho výsledky zobecnit na to, jak jevy fungují v přirozeném prostředí. O ekologické validitě se tak často mluví v souvislosti s laboratorním a experimentálním výzkumem. Je otázka, nakolik třeba poznatky o zpracování jazyka, které získáme rigorózními experimentálními metodami, odpovídají tomu, jak zpracováváme jazyk v běžných životních situacích. K tomu lze doporučit například zajímavou studii Laury Speed, Eweliny Wnuk a Asify Majid (2017). 12.5 Replikovatelnost Speed, L. J., Wnuk, E., & Majid, A. (2017). Studying psycholinguistics out of the lab. In A. de Groot & P. Hagoort (Eds.), Research methods in psycholinguistics and the neurobiology of language: A practical guide (pp. 190-207). Wiley Reliabilita a validita úzce souvisí s replikovatelností výzkumu. Pokud se náš výzkum zaměřuje na jevy, u kterých nepředpokládáme významné proměny v čase, mělo by ho ideálně být možné úspěšně replikovat. Replikace spočívá v opětovném provedení výzkumu buď prakticky identickým postupem (přesná či přímá replikace), anebo s určitými obměnami, ale při zachování obecné orientace výzkumu (konceptuálni replikace). Ačkoliv je replikovatelnost vědeckých poznatků předpokladem jejich validity, v posledních letech se poukazuje na to, že v praxi je to složitější. Někdy se mluví přímo o replikační krizi (viz Box 12.2). Přesná/přímá replikace spočívá v tom, že se badatelé snaží určitý výzkum provést znovu, a to při zachování shodného výzkumného postupu. To pochopitelně nemusí být vždy možné, protože zejména u starších výzkumů mohou chybět podstatné informace pro to, aby bylo možné postupovat zcela stejně. U řady výzkumů to však možné je - použijeme stejně nastavenou techniku sběru dat, vybereme stejně velký vzorek ze stejné populace apod. Pokud se nám nepodaří výzkum replikovat, tj. pokud přesnou replikací nedojdeme k velmi podobným výsledkům jako předchozí výzkum, poukazuje to na problém, respektive přímo na platnost výsledků původního výzkumu. Konceptuálni replikace se nesnaží použít zcela shodný výzkumný postup jako předchozí výzkum (třeba i proto, že nemáme k dispozici dostatek informací o tom, jak původní výzkumný postup vypadal), ale cílí na to provést výzkum znovu se zachováním klíčových principů původního výzkumu. Předpokládáme přitom, že pokud jsou zjištění původního výzkumu platná, měli bychom získat analogické výsledky i při použití 12 Výsledky a realita 126 částečně odlišného postupu. Pokud se konceptuálni replikace nezdaří, poukazuje to opět na problém původního výzkumu, respektive jeho zobecnitelnosti. Box 12.2: Replikační krize v psychologii Po roce 2010 se v psychologii začalo mluvit o takzvané replikační krizi. Začalo se totiž čím dál více ukazovat, že řadu výzkumů (třeba i obecně známých a klasických) se nedaří replikovat. V roce 2015 přišel kolektiv autorů (Collaboration, 2015) se studií, v níž se pokusili replikovat výsledky 100 vybraných studií, které byly v roce 2008 publikovány v prestižních psychologických časopisech (Psychological Science, Journal of Personality and Sociál Psychology a Journal of Experimental Psychology: Learning, Memory, and Cognition). Došli přitom k šokujícímu závěru, že se jim podařilo replikovat pouze 39 % uvedených studií, přičemž významně nižší replikovatelnost zaznamenali v sociální psychologii (okolo 30 % replikovaných výsledků) než v kognitivní psychologii (okolo 50 % úspěšně replikovaných výsledků). Tato čísla jsou velmi vysoká a přináší s sebou otázku, nakolik jsou poznatky těchto disciplín vůbec důvěryhodné. Je však třeba zdůraznit, že replikační krize přinesla řadu pozitivních změn ve vědecké praxi, které napomáhají problémy s replikací do budoucna odstraňovat. K replikační krizi v psychologii viz například popularizační text Edwarda Dienera a Roberta Biswase-Dienera (2015). Collaboration, O. S. (2015). Estimating the reproducibility of psychological science. Science, 349(6251), aac4716 Diener, E., & Biswas-Diener, R. (2015). The replication crisis in psychology. In R. Biswas-Diener & E. Diener (Eds.), Noba textbook series: Psychology. DEF Publishers Neúspěšná replikace může být způsobena různými důvody. Existují odstrašující případy, kdy se díky neúspěšným replikacím ukázalo, že autor původní studie svá data upravoval tak, aby byly výsledky zajímavé, respektive v souladu s přáními autora. Nicméně důvodem nereplikace nemusí být zdaleka jenom podvádění s daty. Typickým problémem může být omezený vzorek původní studie. Ve starších experimentálních studiích se lze běžně setkat s výzkumy, které byly založeny na velmi malém počtu participantů (třeba jen na 15 osobách), případně i na malém vzorku stimulů. V takových výzkumech je z principu vysoké riziko toho, že jsou výsledky nahodilé, protože výsledky každé zkoumané jednotky velmi významně ovlivní výsledky celkové. V případě nereplikace starších výsledků může být problém i v tom, že došlo k různým změnám v čase. Například můžeme předpokládat, že dnešní účastníci výzkumu jsou typicky velmi schopní při práci s počítači (přinejmenším třeba ve srovnání s účastníky experimentů v 80. letech 20. století). Případný nezdar replikace experimentu zaměřeného na reakční časy může být hypoteticky dán právě tím. V případě neúspěšné konceptuálni replikace navíc mohou být zjištěné rozdíly ve výsledcích dány částečnými rozdíly v použitých metodách. Nemusí tak jít úplně o chybu původního výzkumu, ale spíše o problém se zobecnitelnosti výsledků. V každém případě je neúspěšná replikace důležitým signálem k tomu pracovat s výsledky původního výzkumu opatrně. Zároveň je důležité si uvědomit, že replikace jsou extrémně důležitým nástrojem pro rozvoj 12 Výsledky a realita 127 daného oboru. Neúspěšné replikace pomáhají upozornit na problémy, které by se bez nich možná neprojevily. Úspěšné replikace naopak přináší ujištění, že jsou předchozí výsledky v pořádku a že nám skutečně sdělují něco podstatného o světě kolem nás. 12.6 Replikace a lingvistika Mohlo by se zdát, že výzkumu jazyka a jeho užívání se otázka rep-likovatelnosti tolik netýká. Do určité míry je to pravda, a to proto, že u různých jazykových jevů očekáváme proměnlivost v čase (například by nedávalo smysl replikovat třeba studii zaměřenou na postoje ke spisovné češtině z 90. let 20. století, protože se tyto postoje v čase mění), a také proto, že se různé lingvistické výzkumy nemusí pokoušet o dalekosáhlé zobecnění, ale spíše o deskripci určitého stavu (například popis českého vidu založený na korpusu). Na druhou stranu není pravda, že by replikovatelnost nebyla pro výzkum jazyka a jeho užívání důležité téma. Jednak existuje řada výzkumů, které se snaží docházet k obecně platným závěrům, jednak samotná replikovatelnost úzce souvisí s usouvztažnitelností výsledků určitých výzkumů, která je podstatná i pro výzkumy, které jsou ryze deskriptívni a nenárokují si širší zobecnitelnost. Uveďme si dva příklady: (5) Lera Boroditsky (2001) provedla experimentální výzkum, v němž srovnávala to, jak vnímají čas mluvčí angličtiny a čínštiny. Vyšla přitom z toho, že mluvčí angličtiny primárně v jazyce konceptu-alizují horizontálně (podobně jako čeština, srov. už je to za námi, dát si kávu před obědem apod.), zatímco mluvčí čínštiny spíše vertikálně. Na základě relativně komplikovaného experimentálního postupu došla k tomu, že jazykové rozdíly se odráží v tom, jak mluvčí těchto dvou jazyků o čase přemýšlí. O několik let později byly však tyto závěry zpochybněny, a to hned dvojnásobně. January a Kako (2007) se pokusili replikovat část studie, která se zaměřovala na rodilé mluvčí angličtiny. Provedli celkově šest pokusů o replikaci a ani v jednom případě nedošli ke stejným výsledkům jako studie Lery Boroditsky. Chen (2007) se snažila replikovat část původní studie zaměřenou na rodilé mluvčí čínštiny a nebyla úspěšná ani v jednom ze dvou pokusů. Boroditsky, L. (2001). Does language shape thought?: Mandarin and English speakers' conceptions of time. Cognitive psychology, 43(1), 1-22 January, D., & Kako, E. (2007). Reevaluating evidence for linguistic relativity: Reply to Boroditsky (2001). Cognition, 104(2), 417-426 Chen, J.-Y. (2007). Do Chinese and English speakers think about time differently? Failure of replicating Boroditsky (2001). Cognition, 104(2), 427-436 (6) Pavel Jančák (1974) provedl výzkum užívání několika obecně českých proměnných (protetické v-, úžení é > í, diftongizace ý > ej a diftongizace ú > ou). Jednalo se o jeden z první kvantitativně zaměřených, variačně sociolingvistických výzkumů na češtině. V uvedené studii máme však jenom omezené množství informací o celém výzkumném postupu. Víme, že se výzkum konal v roce 1973 a zúčastnilo se ho devět vybraných žáků 8. a 9. tříd základních devítiletých škol na Starém Městě a Malé Straně, přičemž kritériem výběru bylo, že žáci od narození trvale žili v centru Prahy a zároveň, aby z vnitřní Prahy pocházeli i rodiče a ideálně prarodiče těchto žáků. Co se týče samotného postupu, víme, že byly pořízeny tři skupinové nahrávky o celkové délce asi 360 minut (na jedné nahrávce byli čtyři mluvčí, na druhé tři a na poslední Jančák, P. (1974). Frekvence hlavních hláskoslovných znaků v mluvě pražské mládeže. Naše řeč, 57(4), 191-200 12 Výsledky a realita 128 dva). Projevy byly dle Jančáka „spontánní, jen rámcově usměrněné [...], které se v ničem neliší od rozhovorů, které žáci vedou mezi sebou o přestávkách, při cestách ze školy, při volné zábavě ap." (s. 193). Účastníci výzkumu byli informováni o cíli výzkumu a byli nahráváni otevřeně na páskový magnetofon. Příklad (5) představuje vlastně neúspěšnou replikaci známého a velmi často citovaného lingvisticky orientovaného výzkumu, respektive výzkumu z oblasti jazykové relativity (vlivu jazyka na myšlení). Je třeba podotknout, že sama autorka se k těmto replikacím podrobně vyjádřila a nabídla další doklady toho, že se mluvčí angličtiny a čínštiny skutečně liší v tom, jak přemýšlí o čase (viz Boroditsky et al., 2011). Tento příklad je dobrou ilustrací toho, že se otázka problematické replikovatelnosti výzkumu může dotýkat i otázek výzkumu jazyka a jeho užívání. Příklad (6) se zase vztahuje k poměrně dávnému výzkumu zaměřeném na užívání obecné češtiny u pražské mládeže. Tento výzkum v pravém slova smyslu replikovat nemůžeme. Nicméně by mohlo být zajímavé tento výzkum zopakovat a srovnat Jančákovy (1974) výsledky s dnešní situací. Abychom mohli být schopni tento výzkum zopakovat, potřebovali bychom mít co nejpřesnější informace o tom, jak výzkum probíhal. Jančák nám jich bohužel nabízí velmi málo. Zdůrazněme přitom, že to je dané dobově - v 70. letech 20. století nebyl na popis metodologického postupu kladen takový důraz jako dnes. Dokonce lze říci, že na svou dobu uvádí Jančák metodologických informací více, než bývalo zvykem. Pro naše účely je to však dobrá ilustrace toho, jak zásadní je, aby výzkumy, které se publikují, obsahovaly dostatek informací pro jejich replikaci, respektive zopakování s časovým odstupem pro účely sledování určitých trendů, jako je třeba jazyková změna. 12.7 Dobré návyky Řešení výše uvedených problémů úzce souvisí s principy otevřené vědy. Podle těchto principů mají být všeobecně dostupné jak výstupy různých výzkumů, tak i vědecká data a další materiály (například skripty pro statistické zpracování, použité nástroje sběru dat apod.). Sdílíme-li data z našeho výzkumu a co nejpodrobnější informace o technice sběru dat apod., umožňujeme tím náš výzkum replikovat, respektive na něj přímo navázat. To je pro další rozvoj vědeckého poznání zásadní. V další kapitole se podíváme na plán managementu dat, což je velice účinný nástroj pro předcházení různým problémům. Zde se však zastavíme ještě u dvou důležitých prvků, které se v současné vědecké praxi stávají standardem, a to u preregistrace a registrovaného reportu. V reakci na replikační krizi přišli badatelé s nápadem, že by bylo možné výzkumy takzvaně „přeregistrovat", tedy vlastně před samotným provedením výzkumu registrovat, jak bude výzkum vypadat. V praxi to znamená specifikovat hypotézy, plánovanou velikost vzorku, techniku sběru dat a způsoby analýzy dat. Preregistrace lze provádět v různých online prostředích, které poskytují jednak preregistrační šablony, jednak samotný prostor pro publikování preregistrace. Hojně užívanou platformou je například Open Science Framework (OSF): https://osf.io/ Boroditsky, L., Fuhrman, O., & Mc-Cormick, K. (2011). Do English and Mandarin speakers think about time differently? Cognition, 118(1), 123-129 12 Výsledky a realita 129 Preregistrací se badatelé zavazují k určitému výzkumnému a analytickému postupu. Preregistrace tak pomáhají vymycovat to, čemu se v angličtině říká HARKing (zkratka Hypotheses After the Results are Known, tedy hypotézy poté, co jsou známy výsledky; viz Kerr, 1998). HARKing je praxe, kdy se jako hypotézy výzkumu uvádí tvrzení, která vznikla až na základě toho, jaké byly výsledky výzkumu. To je pochybené, protože kvůli různým zkreslením (anebo i náhodným chybám) mohou vyjít výsledky, které jsou nereliabilní a/nebo nevalidní. HARKing tedy spočívá v tom, že jsou nečekané výsledky prezentované jako očekávané a plánované - ačkoliv tedy badateli z různých důvodů vyšlo něco jiného, než plánoval, čtenář se to nedozví a možné zdroje zkreslení jsou vlastně opomíjeny (místo toho, aby se badatel pokusil vysvětlit post-hoc, proč jsou jeho výsledky odlišné oproti jeho teoretickým očekáváním). Další výhody preregistrací spočívají v tom, že se předem specifikuje způsob analýzy dat (včetně toho, jaká data budou vyřazena apod.). To je důležité, protože to zamezuje možným manipulacím s výsledky. Zároveň se předpokládá, že preregistrace poskytují určitou sílu i takzvaným nulovým výsledkům, tedy vlastně výsledkům, které nevyvrací nulovou hypotézu (nedávají nám oporu k tomu, abychom mohli říct, že je mezi zkoumanými proměnnými vztah). V kapitole 7 jsme mluvili o publikačním zkreslení, což je obvykle způsobeno tím, že se při publikování upřednostňují výstupy, které poukazují na určité vztahy oproti výstupům, které tyto vztahy nenalézají. Je zřejmé, že preregistrace nejsou všespásné. Pokud chce badatel ve svém výzkumu podvádět, zvládne to pravděpodobně i pokud vše preregistruje. Preregistrace jsou tak spíš nástrojem kultivačním. Z vlastní zkušenosti můžu říct, že je to velmi užitečný nástroj pro podrobné promyšlení vlastního výzkumu ještě před jeho realizací. Čas strávený přeregistrováním není ztracený, protože většinu informací z preregistrace je třeba stejně napsat do publikačního výstupu (případně do studentské práce). Podrobněji o preregistracích viz například Nosek et al. (2018). Kromě preregistrací se v poslední době začala nabízet ještě jedna související cesta, a to takzvané registrované reporty. Jde v podstatě o proměnu publikačního procesu. Tradičně byl publikační proces založen na tom, že badatelé odesílali do časopisu již hotovou studii, kde byla v posledku buď odmítnuta, anebo přijata do tisku (na základě anonymního recenzního řízení a po provedení různých úprav v návaznosti na recenzní posudky). Registrovaný report spočívá vlastně v tom, že badatelé neodesílají celou studii, ale pouze její první část, a to před vlastním sběrem dat. Registrovaný report tak v první fázi obsahuje teoretický úvod a detailní návrh výzkumu (v tomto ohledu je podobný preregistrací). Tato část studie poté prochází recenzním řízením a badatelé dostávají recenzní posudky, které musí pro účely postupu do další fáze, zohlednit, respektive zapracovat do textu. V další fázi poté provedou vlastní výzkum striktně podle uvedeného návrhu a odevzdají studii doplněnou o výsledky a interpretaci (přičemž nemohou měnit nic podstatného na již schválené části). Registrované reporty mají velkou řadu výhod. V prvé řadě eliminují publikační zkreslení, které vychází z preference pozitivních výsledků. Pokud totiž registrovaný report projde v recenzním řízení první fází a výzkum je následně realizován podle stanoveného návrhu, nemůže Kerr, N. L. (1998). HARKing: Hypothesizing after the results are known. Personality and social psychology review, 2(3), 196-217 Nosek, B. A., Ebersole, C. R., DeHaven, A. C, & Mellor, D. T. (2018). The prereg-istration revolution. Proceedings of the National Academy of Sciences, 115(11), 2600-2606 být následně odmítnut na základě toho, jak výzkum dopadl. Zároveň registrované reporty mají všechny výhody preregistrací. V neposlední řadě pak poskytují badatelům podrobnou zpětnou vazbu na vlastní výzkum ještě před jeho realizací. Lze očekávat, že se tento způsob publikování do budoucna významně rozšíří. 12.8 Otázky na přemýšlení Zamyslete se nad nějakou empirickou studií, kterou jste v poslední době četli. Zkuste odpovědět na tyto otázky: 1. Jaké byly v daném výzkumu provedeny redukce a jaké mohly mít tyto redukce následky? 2. Hrozila v daném výzkumu nějaká zkreslení? Jaká a proč? 3. Nakolik se vám zdá daný výzkum reliabilní a validní? 4. Nakolik by bylo možné daný výzkum replikovat, respektive provést znovu s časovým odstupem? Chybí v dané studii nějaké informace, které byste k tomu potřebovali? Seznam literatury Altmann, G. T., & Kamide, Y. (1999). Incremental interpretation at verbs: Restricting the domain of subsequent reference. Cognition, 73(3), 247-264. Anderson, M. C. (2015). Incidental forgetting. In Memory (pp. 231-263). Routledge. Badecker, W., & Kuminiak, F. (2007). Morphology, agreement and working memory retrieval in sentence production: Evidence from gender and case in Slovak. Journal of Memory and Language, 56(1), 65-85. Bailey, G., & Dyer, M. (1992). An approach to sampling in dialectology. American Speech, 67(1), 3-20. Bailey, G., Wikle, T., Tillery, J., & Sand, L. (1991). The apparent time construct. Language variation and change, 3(3), 241-264. Balhar, J., et al. (2011). Český jazykový atlas. Dodatky. Academia. Barac, R., & Bialystok, E. (2011). Cognitive development of bilingual children. Language Teaching, 44(1), 36-54. Benešová, L., Křen, M., & Waclawičová, M. (2015). Korpus spontánní mluvené češtiny ORAL2013. Časopis pro moderní filologii, 1(97), 42-50. Berends, S. M., Brouwer, S. M., & Sprenger, S. A. (2016). Eye-tracking and the visual world paradigm. In Designing Research on Bilingual Development (pp. 55-80). Springer. Beres, A. M. (2017). Time is of the essence: A review of electroencephalography (EEG) and event-related brain potentials (ERPs) in language research. Applied psychophysiology and biofeedback, 42(4), 247-255. Bermel, N., & Knittl, L. (2012). Corpus frequency and acceptability judgments: A study of morphosyntactic variants in Czech. Corpus Linguistics and Linguistic Theory, 8(2), 241-275. Birch, S., & Garnsey, S. (1995). The effect of focus on memory for words in sentences. Journal of Memory and Language, 34(2), 232-267. https://doi.org/10.1006/jmla.1995.1011 Bock, J. K, & Miller, C. A. (1991). Broken agreement. Cognitive psychology, 23(1), 45-93. Boring, E. G. (1953). A history of introspection. Psychological bulletin, 50(3), 169-189. Boroditsky, L. (2001). Does language shape thought?: Mandarin and English speakers' conceptions of time. Cognitive psychology, 43(1), 1-22. Boroditsky, L., Fuhrman, O., & McCormick, K. (2011). Do English and Mandarin speakers think about time differently? Cognition, 118(1), 123-129. Brodeur, M. B., Dionne-Dostie, E., Montreuil, T, & Lepage, M. (2010). The Bank of Standardized Stimuli (BOSS), a new set of 480 normative photos of objects to be used as visual stimuli in cognitive research. PloS one, 5(5), el0773. Brodeur, M. B., Guérard, K, & Bouras, M. (2014). Bank of standardized stimuli (BOSS) phase II: 930 new normative photos. PloS one, 9(9), el06953. Brysbaert, M., Mandera, P., McCormick, S. F, & Keuleers, E. (2019). Word prevalence norms for 62,000 English lemmas. Behavior research methods, 51(2), 467-479. Brysbaert, M., Stevens, M., Mandera, P., & Keuleers, E. (2016). How many words do we know? Practical estimates of vocabulary size dependent on word definition, the degree of language input and the participant's age. Frontiers in psychology, 7,1116. Ceháková, M., & Chromý, J. (2023). Garden-path sentences and the diversity of their (mis)representations. PLoS ONE, 18(7), e0288817. Chen, J.-Y. (2007). Do Chinese and English speakers think about time differently? Failure of replicating Boroditsky (2001). Cognition, 104(2), 427-436. Chromý, J. (2017). Protetické v- v češtině. Filozofická fakulta Univerzity Karlovy. Chromý, J. (2021). Metody výzkumu vidu a způsobu slovesného děje. In Kapitoly o slovesném vidu nejen v češtině (pp. 142-170). Akropolis. Chromý, ]., Borůvková, M., Malá, L., & Sudzinová, T. (2019). Long-term versus short-term consistency in the grapheme-colour synaesthesia: Grapheme-colour pairings can change in adulthood. Attention, Perception, & Psychophysics, 81(6), 1805-1812. Chromý, J., & Cvrček, V. (2021). Lingvistika jako otevřená a transparentní disciplína. Naše řeč, 104(1), 5-14. Chromý, ]., & Dotlačil, J. (2022). Čtení vlastním tempem: Kritické představení metody. Časopis pro moderní filologii, 104(2), 177-193. Chromý, J., & Dufek, O. (2012). Důvěryhodnost politiků jako sociolingvistický fenomén. Mise společnost, 20(1), 29-39. Chromý, ]., & Vojvodič, S. (2023). When and where did it happen? Systematic differences in recall of core and optional sentence information. Quarterly journal of Experimental Psychology, 17470218231159190. Collaboration, O. S. (2015). Estimating the reproducibility of psychological science. Science, 349(6251), aac4716. Costall, A. (2006). Introspectionism and the mythical origins of scientific psychology. Consciousness and Cognition, 25(4), 634-654. Coupland, N. (1980). Style-shifting in a Cardiff work-setting. Language in society, 9(1), 1-12. Cvrček, V., & Kovaříková, D. (2011). Možnosti a meze korpusové lingvistiky. Naše řeč, 3(94), 113-134. Dabrowska, E. (2010). Naive v. expert intuitions: An empirical study of acceptability judgments. The linguistic review, 27,1-23. Danziger, K. (1980). The history of introspection reconsidered, journal of the History of the Behavioral Sciences, 26(3), 241-262. Darcy, N. T. (1953). A review of the literature on the effects of bilingualism upon the measurement of intelligence. The Pedagogical Seminary and journal of Genetic Psychology, 82(1), 21-57. De Bruin, A., Treccani, B., & Delia Sala, S. (2015). Cognitive advantage in bilingualism: An example of publication bias? Psychological science, 26(1), 99-107. De Vaus, D. (2001). Research design in social research. Sage. De Zubicaray, G. I., & Schiller, N. O. (2019). The Oxford handbook of neurolinguistics. Oxford University Press. Dejmek, B. (1981). Mluva nejstarší generace Hradce Králové: Se zaměřením na diferenční jevy hláskové a morfologické. Pedagogická fakulta v Hradci Králové. Dejmek, B. (1987). Běžně mluvený jazyk nejmladší generace Hradce Králové. Pedagogická fakulta v Hradci Králové. DeWalt, K., & DeWalt, B. R. (2010). Participant observation: A guide for fieldworkers. Rowman Altamira. Diener, E., & Biswas-Diener, R. (2015). The replication crisis in psychology. In R. Biswas-Diener & E. Diener (Eds.), Noba textbook series: Psychology. DEF Publishers. Diependaele, K., Brysbaert, M., & Neri, P. (2012). How noisy is lexical decision? Frontiers in psychology, 3, 348. Disman, M. (2002). Jak se vyrábí sociologická znalost. Karolinum. Doměnech-Abella, ]., Mundó, J., Switsers, L., Van Tilburg, T, Fernandez, D., & Aznar-Lou, I. (2021). Social network size, loneliness, physical functioning and depressive symptoms among older adults: Examining reciprocal associations in four waves of the Longitudinal Aging Study Amsterdam (LASA). International Journal of Geriatric Psychiatry, 36(10), 1541-1549. Dryer, M. S. (2013). Relationship between the Order of Object and Verb and the Order of Adposition and Noun Phrase (v2020.3). In M. S. Dryer & M. Haspelmath (Eds.), The World Atlas of Language Structures Online. Zenodo. Duňabeitia, J. A., Baciero, A., Antóniou, K., Antóniou, M., Ataman, E., Baus, C, Ben-Shachar, M., Caglar, O. C, Chromý, J., Comesaňa, M., et al. (2022). The multilingual picture database. Scientific data, 9(1), 1-6. Duňabeitia, J. A., Crepaldi, D., Meyer, A. S., New, B., Pliatsikas, C, Smolka, E., & Brysbaert, M. (2018). MultiPic: A standardized set of 750 drawings with norms for six European languages. Quarterly Journal of Experimental Psychology, 71(4), 808-816. Dunn, A. L., & Tree, J. E. F. (2009). A quick, gradient bilingual dominance scale. Bilingualism: language and cognition, 22(3), 273-289. Eckert, P. (1989). Jocks and burnouts: Social categories and identity in the high school. Teachers college press. Ferrand, L., New, B., Brysbaert, M., Keuleers, E., Bonin, P., Méot, A., Augustinova, M., & Pallier, C. (2010). The French Lexicon Project: Lexical decision data for 38,840 French words and 38,840 pseudowords. Behavior research methods, 42(2), 488-496. Ferreira, F. (2003). The misinterpretation of noncanonical sentences. Cognitive psychology, 47(2), 164-203. Ferreira, F., & Henderson, J. M. (1990). Use of verb information in syntactic parsing: Evidence from eye movements and word-by-word self-paced reading. Journal of Experimental Psychology: Learning, Memory, and Cognition, 16(4), 555-568. Forster, K. L, & Forster, J. C. (2003). DMDX: A Windows display program with millisecond accuracy. Behavior research methods, instruments, & computers, 35(1), 116-124. Gelman, A., & Carlin, J. (2014). Beyond power calculations: Assessing type S (sign) and type M (magnitude) errors. Perspectives on Psychological Science, 9(6), 641-651. Gibson, E., & Fedorenko, E. (2010). Weak quantitative standards in linguistics research. Trends in cognitive sciences, 14(6), 233-234. Gibson, E., & Fedorenko, E. (2013). The need for quantitative methods in syntax and semantics research. Language and Cognitive Processes, 28(1-2), 88-124. Glaser, W. R. (1992). Picture naming. Cognition, 42(1-3), 61-105. Golinkoff, R. M., Hirsh-Pasek, K., Cauley, K. M., & Gordon, L. (1987). The eyes have it: Lexical and syntactic comprehension in a new paradigm. Journal of Child Language, 14(1), 23-45. Hála, B., & Vážný, V. (1951). Pravidla pro vědecký přepis dialektických zápisů českých a slovenských. Česká akademie věd a umění v Praze. Hamanová, M.-A. (2020). Bilingvismus jako nevýhoda? Lexikální vybavování v prvním jazyce bilingvních mluvčích [Master's thesis, Filozofická fakulta Univerzity Karlovy], https://dspace.cuni.cz/handle/20.500. 11956/123007 Harrington, I., Palethorpe, S., & Watson, C. I. (2000). Does the Queen speak the Queen's English? Nature, 408(6815), 927-928. Hartshorne, J. K., Tenenbaum, J. B., & Pinker, S. (2018). A critical period for second language acquisition: Evidence from 2/3 million English speakers. Cognition, 177, 263-277. Háussler, J., & Juzek, T. (2017). Hot topics surrounding acceptability judgement tasks. In Proceedings of Linguistic Evidence 2016: Empirical, Theoretical, and Computational Perspectives. University of Tubingen. Havránek, B. (1932). Úkoly spisovného jazyka a jeho kultura. In Spisovná čeština a jazyková kultura (pp. 32-84). Melantrich. Hladíková, B. (2018). Současné tendence obouvidových sloves v češtině [Doctoral dissertation, Filozofická fakulta Univerzity Karlovy], https://dspace.cuni.cz/handle/20.500.11956/100055 Hořejší, M. (2020). Kritická analýza diskurzu o Národním parku Šumava [Disertační práce]. Filozofická fakulta Univerzity Karlovy. Huettig, F, Rommers,}., & Meyer, A. S. (2011). Using the visual world paradigm to study language processing: A review and critical evaluation. Acta psychologica, 137(2), 151-171. Jančák, P. (1974). Frekvence hlavních hláskoslovných znaků v mluvě pražské mládeže. Mise řeč, 57(4), 191-200. Janda, L. A., & Lyashevskaya, O. (2013). Semantic Profiles of Five Russian Prefixes: Po-, s-, za-, na-, pro-. Journal of Slavic linguistics, 211-258. January, D., & Kako, E. (2007). Re-evaluating evidence for linguistic relativity: Reply to Boroditsky (2001). Cognition, 104(2), 417-426. Jastrow, J. (1899). The mind's eye. Popular Science Monthly, 54, 299-312. Jegerski, J. (2013). Self-paced reading. In J. Jegerski & B. VanPatten (Eds.), Research methods in second language psycholinguistics (pp. 36-65). Routledge. Jelínek, T. (2013). Srovnání žánrů v korpusu na základě syntaktických funkcí substantiv. Korpus - gramatika - axiologie, (8), 3-11. Jindra, V, et al. (2008). Vývojová dynamika obouvidových sloves cizího původu na základě korpusových dat. Slovo a slovesnost, 69(3), 192-210. Johnson, C. }., Paivio, A., & Clark, J. M. (1996). Cognitive components of picture naming. Psychological bulletin, 120(1), 113-139. Kaderka, P. (2013). Pragmatika situace. Slovo a slovesnost, 74(1), 13-40. Kaderka, P., & Svobodová, Z. (2006). Jak přepisovat audiovizuální záznam rozhovoru? Manuál pro přepiso- vatele televizních diskusních pořadů. Jazykovědné aktuality, 43(3-4), 18-51. Kamberelis, G, & Dimitriadis, G. (2013). Focms groups. Routledge. Kerr, N. L. (1998). HARKing: Hypothesizing after the results are known. Personality and social psychology review, 2(3), 196-217. Keuleers, E., Lacey, P., Rastle, K, & Brysbaert, M. (2012). The British Lexicon Project: Lexical decision data for 28,730 monosyllabic and disyllabic English words. Behavior research methods, 44(1), 287-304. Keuleers, E., Stevens, M., Mandera, P., & Brysbaert, M. (2015). Word knowledge in the crowd: Measuring vocabulary size and word prevalence in a massive online experiment. The Quarterly Journal of Experimental Psychology, 68(8), 1665-1692. Krautz, A. E., & Keuleers, E. (2021). LinguaPix database: A megastudy of picture-naming norms. Behavior Research Methods, 1-14. Křen, M., & Waclawičová, M. (2019). Srovnání mluvených korpusů: Skutečně jen odlišná hlediska? Slovo a Slovesnost, 80(2), 128-139. Kříž, A. (2020). Jazykové chování slovenských rodilých mluvčích v Čechách [Doctoral dissertation, Filozofická fakulta Univerzity Karlovy], https://dspace.cuni.cz/handle/20.500.11956/124140 Kříž, A., & Chromý, J. (2020). Úloha detekce slova a její využití v psycholingvistickém výzkumu. Naše řeč, 103(4), 352-367. Kuhn, T. S. (1997). Struktura vědeckých revolucí. Oikoymenh. Labov, W. (1972). Sociolinguistic patterns. University of Pennsylvania press. Ladd, D. R., Roberts, S. G., & Dediu, D. (2015). Correlational studies in typological and historical linguistics. Annu. Rev. Linguist., 1(1), 221-241. Laurinavichyute, A., Yadav, H., & Vasishth, S. (2022). Share the code, not just the data: A case study of the reproducibility of articles published in the Journal of Memory and Language under the open data policy. Journal of Memory and Language, 125,104332. Lehtonen, M., Soveri, A., Laine, A., Járvenpáá, J., De Bruin, A., & Antfolk, J. (2018). Is bilingualism associated with enhanced executive functioning in adults? A meta-analytic review. Psychological bulletin, 144(4), 394-425. Lev-Ari, S. (2018). Social network size can influence linguistic malleability and the propagation of linguistic change. Cognition, 176, 31-39. Likert, R. (1932). A technique for the measurement of attitudes. Liversedge, S. P., Gilchrist, I., & Everling, S. (2011). The Oxford handbook of eye movements. Oxford University Press. Liversedge, S. P., Paterson, K. B., & Pickering, M. J. (1998). Eye movements and measures of reading time. In G. Underwood (Ed.), Eye guidance in reading and scene perception (pp. 55-75). Elsevier. Loftus, E. F., & Pickrell, J. E. (1995). The formation of false memories. Psychiatric annals, 25(12), 720-725. Mackey, A., & Gass, S. M. (2015). Second language research: Methodology and design. Routledge. Matějka, S. (2022). Pořadí osvojování gramatických slova tvarů: Elektronický dotazník [Disertační práce]. Filozofická fakulta Univerzity Karlovy. McEnery, T, & Hardie, A. (2011). Corpus linguistics: Method, theory and practice. Cambridge University Press. McNair, D. M., Lorr, M., & Droppleman, L. F. (1971). Manual for the Profile of Mood States. Educational; Industrial Testing Services. Milroy, L., & Gordon, M. J. (2012). Sociolingvistika: Metody a interpretace. Karolinum. Nekvapil, J., & Nekula, M. (2006). K jazykové situaci v nadnárodních podnicích p\uusobících v české republice. Slovo a slovesnost, 2(67), 83-95. Neústupný, J. V. (1999). Následné (follow-up) interview. Slovo a slovesnost, 60(1), 13-18. Nisbett, R. E., & Wilson, T. D. (1977). Telling more than we can know: Verbal reports on mental processes. Psychological review, 84(3), 231-259. Nosek, B. A., Ebersole, C. R., DeHaven, A. C, & Mellor, D. T. (2018). The preregistration revolution. Proceedings of the National Academy of Sciences, 115(11), 2600-2606. Ochodková, M. (2021). Vývojové tendence ve variaci substantivníflexe v karvinské běžné mluvě [Bakalářská práce]. Filozofická fakulta Univerzity Karlovy. Ortega, A., Urla, ]., Amorrortu, E., Goirigolzarri, ]., & Uranga, B. (2015). Linguistic identity among new speakers of Basque. International Journal of the Sociology of Language, 2015(231), 85-105. Papadopoulou, D., Tsimpli, I., Amvrazis, N., Jegerski, J., & VanPatten, B. (2013). Self-paced listening. In Research methods in second language psycholinguistics (pp. 66-84). Routledge. Peirce, J. W. (2007). PsychoPy—psychophysics software in Python. Journal of neuroscience methods, 262(1-2), 8-13. Perret, C, & Bonin, P. (2019). Which variables should be controlled for to investigate picture naming in adults? A Bayesian meta-analysis. Behavior research methods, 52(6), 2533-2545. Pickering, M. J., & Traxler, M. J. (1998). Plausibility and recovery from garden paths: An eye-tracking study. Journal of Experimental Psychology: Learning, Memory, and Cognition, 24(4), 940-961. Piotroski, J., & Naigles, L. R. (2011). Intermodal preferential looking. In E. Hoff (Ed.), Research methods in child language: A practical guide (pp. 17-28). Wiley-Blackwell. Plonsky, L., & Oswald, F. L. (2012). How to Do a Meta-Analysis. In A. Mackey & S. M. Gass (Eds.), Research Methods in Second Language Acquisition: A Practical Guide (pp. 275-295). Wiley-Blackwell. Podsakoff, P. M., MacKenzie, S. B., Lee, J.-Y., & Podsakoff, N. P. (2003). Common method biases in behavioral research: A critical review of the literature and recommended remedies. Journal of applied psychology, 88(5), 879-903. Price, C. J. (2012). A review and synthesis of the first 20 years of PET and fMRI studies of heard speech, spoken language and reading. Neuroimage, 62(2), 816-847. Pronin, E. (2007). Perception and misperception of bias in human judgment. Trends in cognitive sciences, 11(1), 37-43. Pronin, E., & Kugler, M. B. (2007). Valuing thoughts, ignoring behavior: The introspection illusion as a source of the bias blind spot. Journal of Experimental Social Psychology, 43(4), 565-578. Rayner, K. (1998). Eye movements in reading and information processing: 20 years of research. Psychological bulletin, 224(3), 372-422. Saer, D. J. (1923). The effect of bilingualism on intelligence. British Journal of Psychology: General Section, 14, 25-38. Sankoff, G., & Blondeau, H. (2007). Language change across the lifespan:/r/in Montreal French. Language, 560-588. Schütze, C. T. (2010). Judgement data. In R. Podešva & D. Sharma (Eds.), Research Methods in Linguistics. Cambridge University Press. Schütze, C. T. (2016). The empirical base of linguistics: Grammaticality judgments and linguistic methodology. Language Science Press. Sedláčková, H. (2012). Aspekty variace předložek na a v(e) v současné češtině [Diplomová práce]. Filozofická fakulta Univerzity Karlovy. Sharma, D. (2018). Style dominance: Attention, audience, and the 'real me'. Language in Society, 47(1), 1-31. Skarnitzl, R., Sturm, P., & Volín, J. (2016). Zvuková báze řečové komunikace: Fonetický afonologický popis řeči. Karolinum. Smolík, F. (2006). Časná znalost jazyka: Vývoj receptivní znalosti jazyka v prvních dvou letech života. Československá psychologie, 50(3), 238-250. Smolík, F, & Bláhová, V. (2022). Here come the nouns: Czech two-year-olds use verb number endings to predict sentence subjects. Cognition, 219,104964. Smolík, F., & Bytešníková, I. (2017). StruX-čný dotazník dětského slovníku: Vývoj a normy nástroje pro screening vývoje jazyka v raném věku. Československá psychologie, 61(5), 460-473. Smolík, F, & Bytešníková, I. (2021). Validity of the SDDS: A 40-item vocabulary screening tool for 18-to 42-month olds in Czech. Journal of Communication Disorders, 93,106146. Speed, L. J., Wnuk, E., & Majid, A. (2017). Studying psycholinguistics out of the lab. In A. de Groot & P. Hagoort (Eds.), Research methods in psycholinguistics and the neurobiology of language: A practical guide (pp. 190-207). Wiley. Spradley, J. P. (2016). Participant observation. Waveland Press. Sprouse, J., Schütze, C. T, & Almeida, D. (2013). A comparison of informal and formal acceptability judgments using a random sample from Linguistic Inquiry 2001-2010. Lingua, 134, 219-248. Stefanowitsch, A. (2020). Corpus linguistics: A guide to the methodology. Language Science Press. Stuchlíková, I., Man, F., & Hagtvet, K. (2005). Dotazník k měření afektivních stavů: Konfirmační faktorová analýza krátké české verze. Československá psychologie, 49(5), 459-467. Swaab, T. Y., Ledoux, K, Camblin, C. C, & Boudewyn, M. A. (2012). Language-related ERP components. In The Oxford handbook of event-related potential components, (pp. 397-439). Oxford University Press. Tagliamonte, S. A. (2006). Analysing sociolinguistic variation. Cambridge University Press. Tagliamonte, S. A. (2011). Variationist sociolinguistics: Change, observation, interpretation. John Wiley & Sons. Veselý, L. (2008). Testy pro zjišťování vidové hodnoty vidového paradigmatu slovesa (indikátory slovesného vidu). Slovo a slovesnost, 69(3), 211-220. Veselý, L. (2011). O vidu slovesa soustředit se. Příspěvek k otázce jazykové správnosti. Naše řeč, (3), 134-141. Von Stutterheim, C, Andermann, M., Carroll, M., Flecken, M., & Schmiedtová, B. (2012). How grammaticized concepts shape event conceptualization in language production: Insights from linguistic analysis, eye tracking data, and memory performance. Linguistics, 50(4), 833-867. Weskott, T., & Fanselow, G. (2011). On the informativity of different measures of linguistic acceptability. Language, 249-273. Wilson, J. (2010). Moravians in Prague: A sociolinguistic study of dialect contact in the Czech Re-public. Peter Lang. Wilson, T. D., Dunn, D. S., Kraft, D., & Lisle, D. J. (1989). Introspection, attitude change, and attitude-behavior consistency: The disruptive effects of explaining why we feel the way we do. In Advances in experimental social psychology (pp. 287-343, Vol. 22). Elsevier. Wilson, T. D., & Dunn, E. W. (2004). Self-knowledge: Its limits, value, and potential for improvement. Annual Review of Psychology, 55, 493-518. Wilson, T. D., & Schooler, J. W. (1991). Thinking too much: Introspection can reduce the quality of preferences and decisions. Journal of personality and social psychology, 60(2), 181-192. Winkler, J. D., Kanouse, D. E., & Ware, J. E. (1982). Controlling for acquiescence response set in scale development. Journal of Applied Psychology, 67(5), 555-561. Ziková, M., & Křivan, J. (2014). Nahrávání v terénním lingvistickém výzkumu: Jak získat kvalitní záznam řeči? Studie z aplikované lingvistiky, 5(1), 65-82. Terminologický slovníček čtení vlastním tempem úloha, ve které účastníci čtou stimuly postupně po jednotlivých úsecích, přičemž tyto úseky odhalují pomocí mačkání určitého tlačítka [angl. self-paced reading task]. 63 bimodální rozdělení rozdělení dat, které má dva vrcholy [angl. bimodal distribution]. 102 běžná mluva spontánní způsob projevu, který určitá osoba zaujímá v každodenních, neformálních situacích, kdy ke svému užívání jazyka neupírá přílišnou pozornost [angl. vernacular]. 48-50, 53 běžný (nenucený) styl Labovem vymezený styl projevu, kterým mluvčí mluví, když se nesoustředí na to, jak mluví [angl. casual style] . 48 dvouhlavňová otázka otázka, která se zaměřuje na více rozdílných věcí, a respondent tak nemá možnost odpovědět podle svého přesvědčení, pokud tyto věci vnímá rozdílně [angl. double-barreled question]. 39 elektroencefalografie (EEG) neurozobrazovací metoda využívající snímání elektrické aktivity na povrchu kůže hlavy [angl. electroencephalography]. 1 elicitace dat proces získávání dat od mluvčích na základě určité techniky [angl. data elicitation]. 42, 44, 48-50, 52, 53 experimentální skupina skupina jednotek, u nichž je manipulována nezávislá proměnná [angl. experimental group]. 23 experimentální výzkum výzkum založený na manipulaci nezávislé proměnné; pracuje s experimentální a kontrolní skupinou [angl. experimental research]. 18, 22, 23, 26, 29, 30, 32, 33, 60 explorativní výzkum výzkum, který se zaměřuje na dosud nepříliš prozkoumanou oblast, typicky s cílem dospět k předběžnému porozumění tomu, jak daná oblast funguje [angl. exploratory research]. 12 fixace zastavení oka při čtení, během kterého jsou extrahovány informace z textu [angl. fixation]. 64 funkční magnetická rezonance (fMRI) neurozobrazovací technika měřící průtok okysličené krve mozkem [angl. functional magnetic resonance imaging]. 69 hodnocení přijatelnosti specifická lingvistická metoda spočívající v přímém dotazování mluvčích na jejich jazykové intuice [angl. acceptability judgment]. 41-43 introspekce reflexe vlastního vědomí, postojů a přesvědčení [angl. introspection]. 80, 81 kategoriální (kvalitativní) proměnná proměnná, jejíž hodnoty nejsou číselné a označují příslušnost ke kategorii [angl. categorial variable]. 92 kauzální vztah situace, kdy jsou proměnné v příčinném vztahu, tj. změny hodnot jedné způsobují změny hodnot druhé proměnné [angl. causality]. 109 koeficient determinace (R2) měřítko vypovídající o tom, nakolik jsou data vysvětlena daným modelem [angl. coefficient of determination]. 108 kognitivní evokované potenciály (ERP) elektrické napětí vznikající při mozkové reakci na určitý podnět (například slovo, větu, tón apod.), které lze snímat elektroencefalografem [angl. event-related potentials]. 1 kohortová studie typ longitudinálního výzkumu, ve kterém se v intervalech zkoumá identická populace, ale vždy se vybírá nový vzorek [angl. cohort study]. 27, 28 konsekutivní výběr typ účelového výběru, kdy se naplňují určité nastavené kvóty jednotek bez přímého vztahu ke zkoumané populaci [angl. consecutive sampling]. 86 kontrolní otázka otázka sloužící k ověřování toho, zda respondent věnuje dotazníku (případně jiné technice sběru dat) náležitou pozornost; typicky se ptá na něco, na co se dotazovala už nějaká z předchozích otázek, případně je to otázka s jednoznačnou a pro všechny stejnou odpovědí [angl. control questions]. 39 kontrolní skupina skupina jednotek, u nichž je nezávislá proměnná manipulována tak, aby její hodnota byla nějak „výchozí" a byla odlišná od hodnoty nezávislé proměnné u experimentální skupiny [angl. control group]. 23 korelace systematický a pravidelný souvýskyt hodnot dvou proměnných [angl. correlation]. 107 korelační koeficient (r) měřítko síly korelace pohybující se mezi hodnotami -1 a 1 [angl. correlation coefficient]. 108 kritická analýza diskurzu směr zaměřený na kritické zkoumání užívání jazyka v souvislosti se sociální praxí a toho, jak právě užívání jazyka přispívá k existující sociální realitě [angl. critical discourse analysis]. 72 kvantil bod v rozdělení dat, který je určen pořadím hodnot v tomto rozdělení [angl. quantile]. 99 kvótní výběr výběr, v němž se napodobují známé vlastnosti populace [angl. quota sampling]. 86, 88 latinský čtverec způsob vyváženého rozdělení itemů a podmínek mezi zkoumané jednotky [angl. latin square design]. 26 Likertova škála typ škály, který je prototypicky vyjadřování mírou souhlasu s tvrzením [angl. Likert scale]. 38 longitudinální výzkum výzkum založený na sběru dat v určitých časových intervalech [angl. longitudinal research]. 18, 20, 22, 26, 29, 30, 32, 33 manipulace proměnné kontrolované vystavování zkoumané skupiny jednotek určité hodnotě nezávislé proměnné [angl. manipulation of a variable]. 19, 23, 24, 26, 33, 43 mediace jev, kdy třetí proměnná zprostředkovává vztah mezi nezávislou a závislou proměnnou [angl. mediation]. Ill metaanalýza statistická analýza zahrnující výsledky více předchozích studií [angl. meta-analysis]. 74 mezikvartilové rozpětí specifikace variability dat pomocí 1. a 3. kvartilu [angl. inter-quartile range]. 99 mezipoložkový design experimentální postup, v němž je každá položka (item) realizována pouze jednou hodnotou nezávislé proměnné [angl. between-item design]. 25 mezisubj ektový design experimentální strategie, v níž je každá zkoumaná jednotka vystavena jen jedné hodnotě nezávislé proměnné [angl. between-subject design]. 24 moderace jev, kdy třetí proměnná ovlivňuje sílu vztahu mezi nezávislou a závislou proměnnou [angl. moderation]. Ill nepřímá technika/metoda technika, jejímž prostřednictvím se ptáme respondentů na předmět zkoumání a samotný předmět zkoumání nesledujeme [angl. indirect technique/method]. 40, 42, 44, 46, 47 nepravděpodobnostní výběr souhrnné označení způsobů výběru vzorku, které nejsou založeny na principu, že má každá jednotka stejnou šanci dostat se do vzorku [angl. non-probability sampling]. 86 nespojitá (diskrétní) proměnná proměnná, která může nabývat jenom omezeného množství hodnot, které nejsou dále členitelné [angl. discrete variable]. 92 nezávislá proměnná proměnná, o které předpokládáme, že ovlivňuje jinou zkoumanou proměnnou [angl. independent variable]. 8,19-22, 24, 25, 33, 44, 46, 60 náhodná chyba nahodilá odchylka od reality, která není dána vnější proměnnou [angl. random error]. 116, 122 náhodný/pravděpodobnostní výběr výběr založený na principu, že každá jednotka má stejnou šanci dostat se do vzorku [angl. random/probability sampling]. 86-88 následné měření/pozorování (post-test) měření po provedení manipulace nezávislé proměnné [angl. post-test]. 19, 23, 24 následný (follow-up) rozhovor rozhovor, v němž badatelé s účastníky výzkumu rozebírají předem pořízenou nahrávku jejich autentické interakce [angl. follow-up interview]. 46, 47 nominální proměnná proměnná, jejíž hodnoty nejsou číselné a nelze seřadit od nejmenší po největší [angl. nominal variable]. 92 normální rozdělení jednovrcholové, symetrické rozdělení dat v datovém souboru [angl. normal distribution]. 101 nucená volba varianta škály, která nezahrnuje neutrální stupeň odpovědi, a respondenty tak nutí odpovědět buď pozitivně, nebo negativně [angl. forced-choice]. 38, 39 nulová hypotéza hypotéza, která předpokládá, že mezi proměnnými neexistuje žádný vztah [angl. null hypothesis]. 9 numerická proměnná proměnná, jejíž hodnoty představují číselné údaje [angl. numeric variable]. 92 odchylka vzdálenost naměřeného hodnoty od středové hodnoty, obvykle od průměru [angl. deviation]. 103 ohnisková skupina moderovaný skupinový rozhovor zaměřený na určité zkoumané téma [angl. focus group]. 46, 47, 59 úloha detekce slova úloha spočívající v rozhodování, zda je uvedený stimul slovo, nebo nikoliv [angl. lexical decision task]. 63 úloha pojmenovávání obrázků úloha, jejímž cílem je zjistit, jak dlouho mluvčím trvá vybavit si slovo pojmenovávající určitý obrázek [angl. picture naming task]. 62 operacionalizace způsob převedení abstraktní představy do měřitelných jednotek [angl. operationalization]. 94 otevřená otázka otázka bez nabízené možnosti odpovědi; umožňuje respondentům volně se vyjádřit [angl. open-ended questions]. 36, 37, 46 panelová studie typ longitudinálního výzkumu založený na zkoumání identického vzorku v průběhu času [angl. panel study]. 27 paradox pozorovatele paradox spočívající v tom, že jediným způsobem, jak zjistit, jak lidé mluví, když nejsou pozorováni, je právě pozorování [angl. observer's paradox]. 59 pečlivý styl Labovem vymezený styl projevu, kterým mluvčí mluví, když se soustředí na to, jak mluví [angl. careful style]. 48 pilotáž provedení výzkumu nanečisto na menším vzorku [angl. pilot study]. 121 podmínka jedna z realizací itemu, odpovídá jedné hodnotě nezávislé proměnné [angl. condition]. 25 položka/item soubor jinak identických stimulů, které se liší pouze hodnotami nezávislé proměnné [angl. item]. 25, 26, 32 populace množina jednotek, na které zobecňujeme výsledky výzkumu [angl. population]. 83, 84, 86-88 předběžné měření/pozorování (pre-test) měření před provedením manipulace nezávislé proměnné [angl. pre-test]. 19, 23, 24 příležitostný výběr výběr vzorku, kdy vybíráme z jednotek, jež nám jsou snadno k dispozici [angl. opportunistic sampling]. 86 přímá technika/metoda technika, jejímž prostřednictvím zkoumáme předmět výzkumu přímo [angl. direct technique /method]. 42, 44-46 případová studie výzkumná strategie založená na zkoumání jedné jednotky (nebo několika málo jednotek), a to obvykle do velkého detailu [angl. case study]. 18, 28, 30, 32, 33 pracovní hypotéza hypotéza, která předpokládá, že mezi proměnnými je nějaký vztah [angl. working hypothesis]. 9 proměnná abstraktní jednotka, která nabývá různých konkrétních hodnot [angl. variable]. 8 průměrná absolutní odchylka průměr naměřených absolutních odchylek v datovém souboru [angl. average absolute deviation]. 103 průřezová studie výzkumná strategie spočívající v tom, že se v určitém časovém bodě analyzují rozdíly, které existovaly již před započetím výzkumu [angl. cross-sectional study]. 18-24, 26, 28-30, 32, 33, 60 řadová (ordinální) proměnná proměnná, jejíž hodnoty lze seřadit od nejmenší po největší, ale nejsou číselné [angl. ordinal variable]. 92 řazení odpovědí typ nabízené odpovědi spočívající v tom, že respondenti mají seřadit určité položky podle nějakého kritéria [angl. rank order question]. 37, 39 regresní přímka přímka vyjadřující směr vztahu mezi proměnnými, jde o přímku, která prochází nejblíže všem bodům v datovém souboru [angl. regression line]. 108 reliabilita míra, do jaké dává určitý výzkumný nástroj při opakovaných měřeních podobné výsledky, nakolik je v měření spolehlivý [angl. reliability]. 121,122 reprezentativnost míra, do jaké vlastnosti vzorku odpovídají vlastnostem populace [angl. representativeness]. 83, 84, 86-88 rozdělení dat zastoupení jednotlivých hodnot v datovém souboru [angl. data distribution]. 96 sakáda rychlý přeskok oka mezi fixacemi [angl. saccade]. 64 semistrukturovaný rozhovor rozhovor s částečně připravenými otázkami a jejich pořadím [angl. semi- structured interview] . 46, 47 škála typ nabízené odpovědi na uzavřené otázky, jenž představuje varianty odpovědí uspořádané na určitém kontinuu [angl. scale]. 37, 39 sledování očních pohybů technika zaznamenávající pohybí očí, především pak místo, čas a posloupnost fixací [angl. eye-tracking]. 64 slovní prevalence míra znalosti slova v určité populaci [angl. word prevalence]. 83 směrodatná odchylka měřítko variability strukturující normální rozdělení [angl. standard deviation]. 103 spojitá (kontinuální) proměnná proměnná, která může nabývat potenciálně nekonečného množství hodnot, protože její hodnoty představují určité kontinuum [angl. continuous variable]. 92 strukturovaný rozhovor rozhovor s fixně připravenými otázkami a jejich pořadím [angl. structured interview] . 47, 50 systematická chyba (zkreslení) odchylka od reality, která je dána vnější, nepozorovanou proměnnou [angl. systematic error; bias]. 116 technika sněhové koule způsob výběru vzorku, kde jedinci, kteří byli zařazeni do vzorku doporučují do vzorku další osoby, které znají [angl. snowball sampling]. 86 trendová studie typ longitudinálního výzkumu založený na zkoumání určité populace, která se v čase proměňuje [angl. trend study]. 27, 28 účelový výběr způsob výběru vzorku, který je plně založen na rozhodnutí badatele [angl. judgmental sample]. 86, 88 uzavřená otázka otázka, která respondentům nabízí možnosti odpovědi [angl. closed-ended questions]. 36, 37 validita míra, do jaké určitý výzkumný nástroj zkoumá to, co předpokládáme, že zkoumá [angl. validity]. 121,124 variační rozpětí specifikace variability dat pomocí nejnižší a nejvyšší naměřené hodnoty [angl. range]. 99 visual world paradigm technika kombinující zvukové stimuly s vizuálními scénami; účastníci slyší jazykový stimul (větu) a zaznamenávají se jejich oční pohyby při sledování scén, které obsahují objekty zmíněné ve stimulu spolu s necílovými distraktory [angl. visual world paradigm]. 66 vnitropoložkový design experimentální postup, v němž je každá položka (item) realizována jako soubor podmínek [angl. within-item design]. 25 vnitrosubjektový design experimentální strategie, v níž je každá zkoumaná jednotka vystavena všem hodnotám nezávislé proměnné [angl. within-subject design]. 24-26 vnější příčina proměnná, která ovlivňuje zkoumané proměnné, ale sama o sobě není zahrnuta do výzkumu [angl. confound]. 21 výběr z více možností typ nabízené odpovědi na uzavřené otázky, jenž představuje několik kategoriálně rozdílných variant odpovědi, z nichž respondent typicky vybírá jednu [angl. multiple choice item]. 37 věta se slepou kolejí lokálně víceznačná věta, při jejímž čtení nejprve vzniká mylná syntaktická interpretace, kterou je později potřeba přehodnotit, aby bylo dosaženo správného porozumění [angl. garden-path sentence]. 82 vzorek množina jednotek, které reálně podrobujeme výzkumu [angl. sample]. 83, 86-89 závislá proměnná proměnná, o které předpokládáme, že je ovlivňována jinou zkoumanou proměnnou [angl. dependent variable]. 8,19-21, 60 zúčastněné pozorování způsob pozorování, kdy se badatel stává součástí pozorovaného společenství a sleduje toto společenství zevnitř [angl. participant observation]. 59