7 Editorial Příliš dobré kauzální argumenty na to, aby byly pravdivé? Experimentální validita v postlacourovské době1 Lenka Hrbková, Roman Chytilek Monotematické číslo Sociálních studií „Experimenty“, kladoucí si za cíl představit práce českých a slovenských sociálních vědců, kteří při svém výzkumu běžně využívají experimentální přístup, se objevuje zhruba rok poté, co časopis Science publikoval článek Michaela LaCoura a Donalda Greena „When contact changes minds: An experiment on transmission of support for gay equality“ (Když kontakt změní názor: Experiment k přenosu podpory rovných práv homosexuálů). Jejich experimentální studie byla designována tak, aby mohla měřit, zda u aktivisty snažícího se přesvědčit v osobním kontaktu (door-to-door canvassing, typické metodě, jak se v USA artikulují a agregují zájmy) své spoluobčany hraje roli jeho osobní spjatost s kauzou, kterou prosazuje. V případě LaCourovy a Greenovy studie to byla sexuální orientace a výsledky experimentu, provedeného v Kalifornii na čtyřech skupinách s homosexuálními a heterosexuálními tazateli, byly robustní. Figuranti se snažili během polního experimentu přesvědčit experimentální subjekty buďto o prospěšnosti povolení sňatků homosexuálů, nebo o užitečnosti třídění odpadu. Zatímco u heterosexuálních figurantů (experimentálním jazykem „konfederátů“) se po jednom krátkém rozhovoru s aktivistou podpora oslovených pro každé z obou témat po krátkém výkyvu směrem nahoru začala v čase (při měřeních prováděných periodicky s odstupem několika měsíců) zase zmenšovat a vracet k původním hodnotám, u homosexuálních figurantů zůstala v tématu homosexuálních sňatků vysoká, a dokonce se přenesla i na jejich rodinné příslušníky. Studie si kromě publikace v časopise Science vydobyla i značnou sociální relevanci a byla například v politickém diskursu využita zastánci homosexuálních manželství v USA a Irsku. Zároveň byla podrobena diskusi i v odborné komunitě, která ji zpočátku přijala kladně. Jako překvapující bylo hodnoceno nikoliv to, že oba vědci doložili statisticky významný efekt spjatosti s tématem, jako spíše jeho velikost. Při úvahách, proč se postoje subjektů k tématu homosexuálních manželství posunuly u respondentů směrem k příznivějším na pětistupňové škále průměrně o 0,4 bodu, konstatoval například metodolog Andrew Gelman (2015a), že v tomto případě hrálo roli specifické téma, a vysvětlení směřoval k tomu, že LaCour a Green nezměřili ani tak postojovou změnu jako spíše aktivaci latentně dlouhodobě přítomných Sociální studia. Katedra sociologie FSS MU, 4/2015. S. 7–16. ISSN 1214-813X. 1 Tento text vznikl v rámci grantového projektu „Experimentální výzkum volebního chování a rozhodování ve vysoce personalizovaných volbách“ (P408/GA13-20548S). SOCIÁLNÍ STUDIA 4/2015 8 postojů v tradičně velmi liberální kalifornské společnosti. Samotný rozhovor byl jen katalyzátorem změny, a i proto by nebylo podle Gelmana realistické očekávat, že jakékoliv téma by v podobně designovaném experimentu obstálo stejným způsobem. Situace se prudce změnila v květnu 2015, kdy David Broockman, Joshua Kalla a Peter Aronow (Broockman et al. 2015) upozornili na fakt, že replikační matice kalifornského experimentu obsahuje řadu znaků, které vyvolávají otázky o jeho průběhu. Distribuce postojů k homosexuálům v kontrolní skupině se zcela shodovala s tím, co v roce 2012 naměřila studie Cooperative Campaign Analysis Project (CCAP), a distribuce výsledků měření ve všech následujících vlnách pak zavdávaly silné důvody se domnívat, že byly získány pomocí jednoduchých algoritmů softwarového generování dat, které jako základ rovněž využily CCAP. Méně kulantně řečeno, statistické „nepravidelnosti“ indikovaly, že polní experiment nikdy neproběhl a robustnost efektu zajistila spolupráce jednoduchého počítačového programu a toho, kdo mu udělil instrukce. Osud článku skončil jeho stažením ze Science poté, co se od něj distancoval i Donald Green s omluvou, že se nedostatečně zajímal o způsob získávání dat, za který byl zodpovědný jeho juniorní kolega. I po stažení článku aféra, nadále spojovaná především s LaCourem, pokračovala: LaCour výzkum nadále hájil, on i Green museli čelit následkům, které poznamenaly jejich vědecký život; pod drobnohledem se ocitl i časopis Science a jeho strategie publikování sociálněvědných článků, které pravidelně obsahují nádech senzace, ale zároveň jsou často vědecky pochybné (tabloid but fishy articles, srov. Gelman 2015b). LaCourův případ však především v souvislosti s diskusí o tom, co události znamenají z hlediska dobré sociálněvědné výzkumné praxe (srov. Van Noorden 2015; Gelman 2015b) vynesl do popředí oblast, kterou s ohledem na využívání experimentů v sociálních vědách, zejména v oblasti chování a rozhodování, považujeme za zcela klíčovou. Jde o problematiku spolehlivosti poznání získaného jejich prostřednictvím a další uplatnitelnosti výsledků experimentů mimo zkoumané subjekty, tedy obecně experimentální validitu. Jak široce, bez ohledu na kontext, lze například „věřit“ tomu, že ženy jsou více než muži náchylné volit kandidáty, kteří zakládají svou kampaň na klientelismu, jak to zjistil Wantchekon (2003) při polním experimentu, který se (ovšem) konal v Beninu? A platí i v České republice to, co zjistila v sérii experimentů Diana Mutz (2007), totiž že schopnost diváků reprodukovat a hodnotit argumenty kandidátů v televizních debatách je ovlivněna tím, zda se kandidáti vyjadřují nezdvořile a jsou kamerou zabíráni zblízka? A platí to vůbec někde jinde než mimo „laboratoř“ Diany Mutz – tedy mimo obývací pokoj, ve kterém experimentální subjekty sledovaly fiktivní debaty, ve kterých místo politiků účinkovali herci? Na tyto otázky je obtížné odpovědět bez snahy o poctivou dekonstrukci konceptu experimentální validity. O tu se snažíme v tomto textu s cílem zpřístupnit českému publiku úvahy a často i těžké volby, kterým experimentalisté čelí při přípravě svých experimentů. Ačkoliv byli sociální vědci z velké části vůči experimentům tradičně poněkud zdrženliví, postupně přeci jen došlo k rozvoji experimentální metodologie jako nástroje sociálněvědného výzkumu a stále více se prosazoval i názor, jejž vyjádřili Box, Hunter a Hunter: „Abyste mohli zjistit, co se stane, když něco změníte, je nezbytné to opravdu změnit“ (Box, Hunter a Hunter 1978: 3). Experiment se právě z tohoto důvodu ukázal být vhodným nástrojem ke studiu celé řady sociálních jevů a procesů a překročil některé limity tradičních observačních metod, především pak sociálním vědcům umožnil odhad kauzálních vztahů a dokonce 9 Lenka Hrbková, Roman Chytilek: Příliš dobré kauzální argumenty na to, aby byly pravdivé? identifikaci kauzálního mechanismu (Imai, Tingley a Yamamoto 2013). Jedinou sociální vědou s dlouhou tradicí experimentálního výzkumu je psychologie – první experiment byl publikován již v roce 1898 (Triplett 1898). Ostatní sociální vědy přijaly experimentální přístup později s větší či menší dynamikou. Jackson a Cox dokumentují, že nejvýraznější nárůst experimentálních studií v prestižních sociologických, politologických a ekonomických titulech se objevuje až po roce 2000, přičemž v roce 2010 činil jejich podíl 8,5 % celkové publikační kapacity sledovaných periodik (Jackson a Cox 2013).2 Akcelerující proces s sebou přinesl i využívání více teoretizujících pohledů na studovanou problematiku, čímž se otevřel prostor k rozšiřování interdisciplinární spolupráce napříč sociálními vědami, vycházející z experimentálního přístupu k vědeckému poznání. Existuje celá řada témat, která byla a jsou zkoumána experimentálně a která se zároveň nacházejí na pomezí více oborů, jako například problematika sociálních sítí a sociálního kontextu (např. Kearns, Suri a Montfort 2006), občanská deliberace (např. Simon a Sulkin 2002), témata etnické identity a mobilizace (např. Humphreys et al. 2002), genderových stereotypů (např. Sapiro 1981–2), rasové identity a politické participace (Davis 2011) či teorie demokracie a rozvoje (Olken 2010). Otázka platnosti poznání získaného pomocí experimentálního přístupu je tak stejně důležitá pro sociology, politology, mediální vědce, ekonomy či sociální psychology a úvahy o něm a příspěvky k tomu, jak chápat experimentální validitu, se vedou napříč disciplínami. Tradiční dělení (Campbell 1957) rozlišuje mezi interní validitou, vztaženou k pravdivosti poznání o zkoumané věci v rámci zkoumané populace, a externí validitou, vztaženou mimo zkoumanou populaci. Celé generace studentů se učí o vysoké interní a nízké externí validitě experimentů. Interní validita je přitom ztotožňována se schopností výzkumníka izolovat v laboratoři nezávislou proměnnou, která ho zajímá, a manipulovat s ní, zatímco nedostatečná externí validita reflektuje pochyby o tom, zda takto naměřené vztahy jsou přenositelné kamkoliv „ven“ z laboratoře. Jak poznamenávají Morton a Williams (2010: 255), toto dělení úvahy o validitě experimentů spíše komplikuje, protože od sebe oba typy validity příliš izoluje a maskuje, že mezi nimi existují těsné a často komplikované vztahy. To se ukáže především při dekonstrukci interní validity, která bývá na sekundární úrovni obvykle konceptualizována prostřednictvím kauzální, konstruktové a statistické validity. Z nich kauzální validita (posouzení toho, zda vztahy mezi nezávisle a závisle proměnnou ve zkoumané populaci mají kauzální charakter) asi nejvíce odpovídá původní definici interní validity a posuzuje, jak moc se výzkumné designy (bez ohledu na to, zda observační, či experimentální) přibližují ideálnímu, leč nedosažitelnému stavu, v němž bychom mohli u každého subjektu simultánně měřit hodnotu závisle proměnné v každém stavu světa nezávisle proměnné, který může nastat – tedy například rozhodnutí subjektu, který by byl zároveň zcela informovaný i zcela neinformovaný. Toho observační studie nejsou schopny, avšak to samé je nutno poznamenat i o experimentech, jejichž přínos lze spatřovat jednak v tom, že některé 2 Jedná se o tyto tituly: American Journal of Sociology, American Sociological Review, American Economic Review, Econometrica, American Journal of Political Science a American Political Science Review v rozmezí let 1990–2010. SOCIÁLNÍ STUDIA 4/2015 10 z experimentálních designů se ideálnímu stavu alespoň přibližují, a zejména v diskusi o tom, jak kauzální efekty měřit. Konstruktová validita je pojmem významně širším než validita kauzální. V jejím rámci se posuzuje pravdivost pozorování směrem k teorii či souboru předpokladů, které má experiment prověřovat. Jde tedy zejména o to, zda jsou nezávisle a závisle proměnná dobrými reprezentanty konceptů v teorii. Ačkoliv konstruktová validita bývá typicky ztotožňována s interní validitou, Morton a Williams poznamenávají, že verdikt o konstruktové validitě zároveň zcela zásadním způsobem ovlivňuje i externí validitu experimentu. Rovněž statistická validita je konceptem zatíženým nejrůznějšími nedorozuměními. Morton a Williams (2010: 256) ji definují jako posouzení toho, zda mezi proměnnými, které výzkumníka zajímají, existuje statisticky významná kovariance a zároveň velikost vztahu je dostatečně velká (sizable). Právě statistická validita se ocitá v centru pozornosti těch, kdo k experimentálnímu přístupu přistupují s opatrností. Výhrady shrnul při příležitosti založení časopisu Experimental Political Science Andrew Gelman (2013). Upozorňuje, že zejména experimenty na rozhraní sociální psychologie a politologie často pracují (ve srovnání s observačním výzkumem) s poměrně malými a nereprezentativními vzorky. Na hladině významnosti 0,05 pro ně není problém objevit statisticky významné, byť velikostí nedostatečně robustní vztahy kovariance, o kterých pak předčasně generalizují (jako extrémní příklad Gelman uvádí kovarianci mezi ovulací a politickými postoji). V nejhorším případě vzniká kovariance mezi jinými proměnnými, než výzkumníci původně očekávali, což vede i ke zpětné reformulaci kauzálních předpokladů. Problémem je, že všechny tyto operace se dějí dříve, než výzkumníci napíší o výzkumu jediný řádek akademického textu, a výsledkem jsou výstupy s generalizovanými kauzálními předpoklady, jejichž statistická validita je sporná. Kromě velikosti vzorků může být problémem i jejich složení, neboť nejčastějšími účastníky experimentů jsou vysokoškolští studenti, což dále komplikuje generalizování o velikosti naměřeného efektu, neboť charakteristiky této populace se mohou odlišovat od populace, o které má být generalizováno. Gelman (2013, 2015) proto jako dva postupy dobré praxe v oblasti statistické validity navrhuje jednak replikaci experimentů na jiné populaci s cílem znovu potvrdit původně naměřený kauzální efekt, jednak pečlivou dokumentaci průběhu experimentu s cílem usnadnit jeho replikovatelnost. Proces replikace ukazuje, jak úzce spolu souvisí interní a externí validita experimentu. Na jednu stranu jde o prostředek dobré praxe v oblasti statistické validity, zároveň však i o klíčový požadavek externí validity. Prakticky se tento požadavek začíná odrážet v praxi předních sociálněvědných časopisů (jako Political Psychology), které buďto přijímají k vydání studie, které již jsou replikací jiných experimentů, nebo původní experimenty, které jejich autoři několikrát zreplikovali (nepublikovaný výzkum autorů editorialu). Jak důležitým mechanismem posílení statistické validity replikace je, ukázal „experiment“ publikovaný v roce 2015 rovněž v časopise Science, během kterého bylo replikováno 100 významných psychologických experimentů. Ačkoliv 97 % původních studií konstatovalo statisticky významné vztahy kovariance, při replikaci statistickou významnost dosáhlo jen 63 % studií a původní výsledek zreplikovalo jen necelých 40 % studií (Nosek et al. 2015). Druhý požadavek (replikovatelnost) experimentalistická komunita dodržuje poměrně striktně. Běžným standardem je dodání datové matice společně s rukopisem již ve fázi recenzního 11 Lenka Hrbková, Roman Chytilek: Příliš dobré kauzální argumenty na to, aby byly pravdivé? řízení; časopisy jako Experimental Political Science mají i předepsanou strukturu rukopisu, která připomíná laboratorní protokol. Gelman kromě toho navrhuje, aby povinnou součástí návrhu experimentu při jeho schvalování etickými komisemi na univerzitách byl i kompletní výčet kauzálních předpokladů i statistických operací, které budou provedeny se získanými daty s cílem odhalit vztahy kovariance. Důraz na statistickou validitu souvisí s generalizovatelností výsledků mimo zkoumanou populaci, a tedy externí validitou. Je tomu tak proto, že navzdory velice specifickému prostředí experimentu (především laboratorního) jsou většinou předmětem výzkumného zájmu experimentalistů obecné sociální fenomény. Externí validita se týká hned několika aspektů výzkumu. Především toho, do jaké míry účastníci experimentu odpovídají aktérům, kteří jsou v reálném světě konfrontováni s daným typem stimulu, zda experimentální kontext odpovídá kontextu daného zkoumaného jevu, zda experimentální stimul odpovídá stimulům vyskytujícím se ve skutečném světě a zda měřený výsledek opravdu odpovídá výsledkům našeho ať už teoretického, či praktického zájmu (McDermott 2011). Za nejvýznamnější hrozbu pro externí validitu experimentálního výzkumu bývá považována umělost či nepřirozenost prostředí, ve kterém jsou experimentální subjekty testovány, a z toho vyplývající nízká míra analogie s reálným světem. Právě zde dochází ke kompromisu mezi externí a interní validitou. Vysoký stupeň kontroly nad proměnnými, které mohou ovlivnit výsledky (tedy důraz na kauzální validitu), je docílen na úkor tzv. realismu. Experimentátor zasahuje do systému generujícího data (tedy reálného života) a vytváří umělé situace, ve kterých experimentální subjekty operují. Především laboratorní experimenty pak čelí problému umělosti (prostředí a situací, kterým subjekty čelí v důsledku experimentální manipulace a které většinou nejsou zcela přesným obrazem reálného světa). Realismus experimentu pak zcela jistě souvisí s posuzováním validity daného experimentu a tím, zda jsou jeho závěry uplatnitelné napříč různým prostředím a různými populacemi. Hovoříme o tzv. experimentálním realismu, tedy o tom, zda je experiment pro zúčastněné subjekty opravdu realistický, tedy zda je zamýšlená situace vzhledem k subjektům skutečně vyvolána, zda ji subjekty berou vážně a zda je nějakým způsobem ovlivňuje (Aronson et al. 1985). Experimentální realismus odpovídá tomu, do jaké míry psychologická zkušenost experimentální situace odráží zkušenost, kterou by subjekty prožívaly v jiných prostředích. V experimentálním realismu je tedy klíčové, zda subjekty opravdu prožívají zamýšlenou situaci, např. stres, sociální vyloučení, kognitivní disonanci či další jevy, které má experimentátor v úmyslu sledovat. Druhou stranou realismu je tzv. věcný realismus, tedy míra toho, jak dané experimentální prostředí reflektuje skutečný svět, jak je pravděpodobné, že se experimentální situace odehraje v reálném světě. Tento typ realismu tedy souvisí spíše s ekologickou validitou. Věcný a experimentální realismus nejsou vzájemně se vylučující koncepty; některé experimentální techniky mohou vykazovat vysoký stupeň obou těchto typů realismu, zatímco jiné mohou vykazovat nízký experimentální i věcný realismus, některé pak třeba pouze jeden z nich. Ukázkou experimentu, který odráží každodenní život, avšak nevykazuje experimentální realismus, je studie autorů Walstera, Aronsona a Abrahamse (1966), ve které subjekty četly novinový článek o stíhání lidí podezřelých ze spáchání trestného činu v Portugalsku. Experimentální manipulace spočívala ve variaci autorství některých tvrzení v článku (autorem SOCIÁLNÍ STUDIA 4/2015 12 byl buď prokurátor, nebo stíhaný jedinec). Článek byl prezentován jako součást reálných novin. Čtení novin je přitom situace, ve které se lidé ocitají v reálném světě přirozeně často, tudíž zde lze předpokládat vysokou míru věcného realismu. Problémem s designem tohoto experimentu bylo ovšem to, že participanti – univerzitní studenti v USA – nebyli čtením textu o vzdáleném a poměrně neznámém Portugalsku nijak ovlivněni, tudíž tato procedura měla poměrně nízký experimentální realismus. Z tohoto důvodu je možné právě experimentální realismus považovat za základní předpoklad úspěchu experimentálního výzkumu (Kruglanski 1975), protože je to spíše psychologická zkušenost, která ovlivňuje chování lidí, nikoliv prostředí, ve kterém se odehrává. Příkladem může být slavný Milgramův experiment (Milgram 1974). Jeho procedura bývá kritizována z toho důvodu, že účastníci jednali ve zcela nestandardní situaci, která se v běžném životě nevyskytuje (v laboratoři za instrukcí přítomného odborníka měli za úkol dávat jinému člověku elektrošoky). Nicméně i přes umělé prostředí dokázala tato procedura v účastnících jasně vyvolat zamýšlenou úzkost a poslušnost vůči autoritě.3 Otázku toho, do jaké míry lze výsledky laboratorních experimentů zobecňovat mimo laboratoř, uchopili Dipboye a Flanagan (1979) empiricky. Porovnali výsledky 200 laboratorních a 300 polních experimentů, u kterých předpokládáme vysoký stupeň věcného realismu, v oblasti psychologie průmyslové organizace. Z jejich závěrů vyplývá, že výsledky obou typů experimentu se prakticky neliší. Odmítnutí laboratorních experimentů na základě toho, že jejich prostředí neodpovídá skutečnému světu, tedy není zcela na místě, stejně jako není na místě salutovat experimentům pro jejich vysokou interní validitu. Ani tu vždy nemají a stupeň uspokojení kteréhokoliv ze zde představených typů validity souvisí skoro výhradně s dobrou experimentální praxí. Výhody posuzování validity založeného na úvahách o věcném a experimentálním realismu a kauzální, konstruktové a statistické validitě lze ukázat na zmíněném článku LaCoura a Greena. Při uplatnění našich kategorií bychom asi konstatovali, že jejich design, jak byl původně představen, vykazoval vysoký věcný a experimentální realismus, především díky tomu, že se jednalo o polní experiment. U posuzování kauzální validity bychom se asi ztotožnili se závěrem, že velikost a trvalost změny postoje byla skutečně ovlivněna spjatostí toho, kdo vedl rozhovor, s kauzou, kterou prosazoval. Nemohli bychom však vyloučit „předurčení” tradičně liberálních Kaliforňanů, které by mohlo způsobit, že neměříme změnu, ale pouze aktivaci postoje, který je již latentně přítomen. Jinak řečeno, nemohli bychom si být jisti, zda trvalejší úprava postoje byla výsledkem působení aktivisty spjatého s kauzou, nebo latentních postojů subjektů a zároveň působení aktivisty. I proto bychom nemohli mít úplnou jistotu, zda by byl výsledek stejný, pokud by například figuranti obhajovali tradiční rodinu. To vše by vyvolalo jisté pochybnosti o konstruktové validitě, jejichž rozsah by pomohla objasnit replikace experimentu, například v jiném státě nebo s jinými tématy. I když by tedy výborný experimentální i věcný realismus napovídal tomu, že experiment má vysokou externí validitu, museli bychom s definitivnějším verdiktem počkat na jeho 3 Lze tedy spíše předpokládat, že v situacích v reálném životě, ve kterém lidem, kteří neuposlechnou příkaz, hrozí trest (např. v armádě), by efekty sledované Milgramem v umělém laboratorním prostředí mohly být ještě silnější. 13 Lenka Hrbková, Roman Chytilek: Příliš dobré kauzální argumenty na to, aby byly pravdivé? replikaci. U statistické validity bychom byli asi spokojeni jak s velikostí, tak variabilitou vzorku, stejně jako s velikostí naměřeného efektu, ale již nikoliv s kvalitou dat, kterou by odhalila replikační matice. I bez problému s daty, u nichž panuje obava, že nebyla získána opakovaným měřením postojů subjektů, by časopis Science při využití takto dekonstruované validity mohl (a vlastně měl) po LaCourovi a Greenovi požadovat replikování experimentu a jako výstup článek, který by srovnal výsledky obou experimentů. Jak si z hlediska validity stojí články, které naleznete v tomto čísle? Text Andreje Mentela a Romany Žihlavníkové se zabývá problematikou prosociálního chování a navazuje na poměrně dlouhou tradici výzkumu tohoto tématu v behaviorálním herně-teoretickém přístupu. To, zda lidské chování vychází pouze z egoistických motivů, nebo zda je ovlivňováno faktory odklánějícími se od přísně racionální logiky, je tradičně předmětem experimentálního výzkumu, ve kterém bývají využívány různé modifikace původní jednoduché hry Diktátor. Mentel a Žihlavníková se zaměřují na faktor dojmu, že je člověk pozorován. Efekt „dívajících se očí” byl v minulosti zdokumentován, otázkou však je to, jaký mechanismus tento efekt spouští. Předpokladem je to, že lidé, kteří mají pocit, že je někdo pozoruje, se chovají tak, aby předešli vzniku reputace porušování norem. Různé variace herně-teoretických experimentů jsou poměrně rozšířenou praxí. Široké spektrum různého nastavení parametrů experimentálních podmínek přispívá především k posilování externí validity experimentálního výzkumu prosociálního jednání. Nové poznatky o chování subjektů v upravených podmínkách experimentů umožňují další specifikaci teoretických konstruktů. Mentel a Žihlavníková replikují japonský experiment autorů Niwa, Hiraishi a Oda (2011) s upravenými parametry. Jejich úprava experimentální instrukce ke hře Diktátor umožňuje subjektům předpokládat, že se o jejich chování během experimentu nikdo nedozví, čímž nastavuje podmínky, které umožňují efektivní test vlivu dívajících se očí na chování subjektů z hlediska managementu reputace, což souvisí v rámci experimentálního designu především s vysokou úrovní konstruktové validity. Z hlediska externí validity je pro tuto studii podstatná replikace výsledků napříč dvěma různými vzorky u dvou odlišných populací. Uplatněním principu vědecké replikace s upraveným designem je tento text důležitým příspěvkem k posouzení externí validity poznatků o motivacích altruistického chování, především pak v kontextu původní japonské studie, která přinesla rozdílné výsledky. Matúš Kubák, Vladimír Gazda, Zuzana Lejková a Jozef Nemec se ve svém textu zabývají problematikou asymetrické informace. Jejich experiment vychází z ekonomické investiční hry, která se používá ke studiu důvěry a reciprocity v investičním prostředí. Autoři v experimentu sledují chování subjektů v podmínkách symetrické a asymetrické informace. Reportovaný experiment je replikací studie vlivu asymetrické informace na průběh investiční hry autorů Coricelli et al. (2006) a replikuje její hlavní závěry. Vzhledem k tomu, že vědecká replikace teoretických konstruktů se stejnými teoretickými implikacemi na různých populacích je nejsilnějším důkazem externí validity výsledků výzkumu, lze považovat právě externí validitu za přednost tohoto textu. Kubák a spol. do svého designu, na rozdíl od původní studie, přidali také srovnání hry v podmínce asymetrické informace s hrou v podmínce symetrické informace, což posiluje konstruktovou validitu inferencí v kontextu prezentované teorie. SOCIÁLNÍ STUDIA 4/2015 14 Článek Jiřího Špalka a Zuzany Špačkové prezentuje experiment, který testuje hypotézy související s ochotou občanů platit daně. Experiment vychází z poměrně rozsáhlého experimentálního výzkumu daňových úniků v zahraničí a jeho primárním cílem je vědecká replikace, aplikace stejných teoretických konstruktů a hypotéz, které byly využity v předchozím výzkumu, na populaci zatíženou českým socioekonomickým kontextem. Tento typ experimentu v první řadě zjišťuje, jakým způsobem se chovají subjekty v daňovém experimentu v českém prostředí, neboť, jak sami autoři konstatují, ochota platit daně do značné míry souvisí s kulturním pozadím a historickou zkušeností každé země. Zároveň testuje platnost obecných teoretických předpokladů. Experiment vykazuje především vysokou míru kauzální validity, neboť zkoumat vliv nastavení parametrů daňové kontroly na motivace jednotlivců platit daně v reálném světě pomocí neexperimentálních metod je velice problematické. Jednak z toho důvodu, že data o neplacení daní jsou v podstatě nedostupná, ale také proto, že do rozhodovacího procesu občanů jistě vstupuje celá řada dalších faktorů, které nelze mimo experimentální prostředí kontrolovat. Studie Silvie Kotherové se zabývá tématem, které – na rozdíl od ostatních studií v tomto čísle – zatím nemá příliš dlouhou výzkumnou experimentální tradici. S tímto faktem souvisí také skutečnost, že koncepty, kterými se Kotherová zabývá, jsou zatíženy celou řadou problémů, jež autorka ve své studii reflektuje. Jedním z problémů empirického výzkumu meditací je určitá normativní zátěž, kterou tento fenomén nese. Dále je třeba ve výzkumu meditací překonávat problémy s konceptuální nejednoznačností meditací, jež mohou zahrnovat řadu rozdílných technik. Dosavadní výzkum se potýká s nedostatkem evidence mechanismu kauzálních vztahů mezi studovanými koncepty, a proto zatím vykazuje spíše explorativní charakter. Problematický bývá také výběr vzorku, který může za určitých okolností zkreslovat výsledky pozorování. Z těchto důvodů se text Kotherové vypořádává především s úkolem efektivně posilovat úroveň konstruktové validity výzkumu meditací tak, aby mohla být inference založená na experimentálních datech považována pro sledované teoretické konstrukty za vskutku podstatnou. Konstruktová validita je totiž základním předpokladem k vyvození kauzality. Právě tento text – vzhledem k tomu, že se jedná o experimentálně méně zpracované téma – poskytuje významný prostor pro vědeckou replikaci a testování teoretických předpokladů na jiných populacích pro zvyšování externí validity závěrů. Věříme, že ani naše zvýšené zaujetí pro metodologii a dobrou výzkumnou praxi, patrné z editorialu, nezastíní při studiu článků v tomto čísle fakt, že experimentalisté nechávají ve výzkumu „se změnit“ hodnoty nezávisle proměnných s potenciálem vysvětlit skutečně důležité sociální jevy a odpovídají na intelektuálně hodnotné otázky. Přejeme všem, kdo přistupují k sociálněvědným experimentům s otevřenou myslí, příjemné (kritické) čtení. Literatura ARONSON, Elliot, Marilynn B. BREWER a Meryll J. CARLSMITH. 1985. „Experimentation in Political Psychology.“ Pp. 441‒486 in Gardner LINDZEY a Elliot ARONSON (eds.). Handbook of Social Psychology. 3rd Edition. New York: Random House. 15 Lenka Hrbková, Roman Chytilek: Příliš dobré kauzální argumenty na to, aby byly pravdivé? BOC, George E. P., William G. HUNTER a Stuart J. HUNTER. 1978. Statistics for Experimenters. An Introduction to Design, Data, Analysis and Model Building. New York: John Wiley and Sons. BROOCKMAN, David, Joshua KALLA a Peter ARONOW. 2015. Irregularities in LaCour (2014). Working paper. Cit. 30. listopadu 2015 (http://stanford.edu/~dbroock/broockman_kalla_aronow_ lg_irregularities.pdf). CAMPBELL, Donald T. 1957. „Factors relevant to the validity of experiments in social settings.“ Psychological Bulletin 54(4): 297–312. DAVIS, Darren. 2011. „Racial Identity and Experimental Methodology.“ Pp. 299–305 in James N. DRUCKMAN, Donald P. GREEN, James H. KUKLINSKI a Arthur LUPIA (eds.). Cambridge Handbook of Experimental Political Science. New York: Cambridge University Press. DIPBOYE, Robert L. a Michael F. FLANAGAN. 1979. „Research settings in industrial and organizational psychology: Are findings in the field more generalizible than in the laboratory?“ American Psychologist 34(2): 141–150. GELMAN,Andrew.2013.„JournalofExperimentalPoliticalScience.“TheMonkeyCage,16.července.Cit. 30. listopadu 2015 (http://themonkeycage.org/2013/07/journal-of-experimental-political-science). GELMAN, Andrew. 2015a. „Pushing at an open door: When can personal stories change minds on gay rights?“ The Washington Post. Monkey Cage blog, 19. prosince. Cit. 30. listopadu 2015 (https:// www.washingtonpost.com/blogs/monkey-cage/wp/2014/12/19/pushing-at-an-open-door-when- can-personal-stories-change-minds-on-gay-rights). GELMAN, Andrew. 2015b. „Fake study on changing attitudes: Sometimes a claim that is too good to be true, isn’t.“ The Washington Post. Monkey Cage blog, 20. května. Cit. 30. listopadu 2015 (https:// www.washingtonpost.com/blogs/monkey-cage/wp/2015/05/20/fake-study-on-changing-attitudes- sometimes-a-claim-that-is-too-good-to-be-true-isnt). HUMPHREYS, Macartan et al. 2002. „Ethnic Identity, Collective Action and Conflict: An Experimental Approach.“ Příspěvek prezentovaný na konferenci American Political Science Association, Boston, 26. srpna – 1. září. Cit. 30. listopadu 2015 (http://www.international.ucla.edu/cms/files/Ethnic%20 ID,%20Collective%20Action%20and%20Conflict1.pdf). IMAI, Kosuke, Dustin TINGLEY a Teppei YAMAMOTO. 2013. „Experimental designs for identifying causal mechanism.“ Journal of the Royal Statistical Society. Series A (Statistics in Society) 176(1): 5–51. JACKSON, Michelle a David R. COX. 2013. „The Principles of Experimental Design and TheirApplication in Sociology.” Annual Review of Sociology 39(1): 27–49. KEARNS, Michael, Siddharth SURI a Nick MONTFORT. 2006. „An Experimental Study of the Coloring Problem on Human Subject Networks.“ Science 313: 824–827. KRUGLANSKI, Arie W. 1975. „The Human Subject in the Psychology Experiment: Fact and Artifact.“ Advances in Experimental Social Psychology 8: 101–147. LACOUR, Michael J. a Donald GREEN. 2014. „When contact changes minds: An experiment on transmission of support for gay equality.“ Science 346(6215): 1366–1369. McDERMOTT, Rose. 2011. „Internal and External Validity.“ Pp. 27–40 in James N. DRUCKMAN, Donald P. GREEN, James H. KUKLINSKI a Arthur LUPIA (eds.). Cambridge Handbook of Experimental Political Science. New York: Cambridge University Press. MILGRAM, Stanley. 1974. Obedience to Authority: an experimental view. London: Tevistock. MORTON, Rebecca B. a Kenneth C. WILLIAMS. 2010. Experimental Political Science and the Study of Causality. From Nature to the Lab. Cambridge: Cambridge University Press. MUTZ, Diana. 2007. „Effects of ‚In-Your-Face‘ Television Discourse on Perceptions of a Legitimate Opposition.” American Political Science Review 101(4): 621–635. NIWA, Yuki, Kai HIRAISHI a Ryo ODA. 2011. „Mirror has no effect on giving in the dictator game.“ Allied Health and Behavioral Sciences 16(2): 16–19. SOCIÁLNÍ STUDIA 4/2015 16 NOSEK, Brian A. et al. 2015. „Estimating the reproducibility of psychological science.” Science 349 (6251): 943–954. OLKEN, Benjamin A. 2010. „Direct Democracy and Local Public Goods: Evidence from a Field Experiment in Indonesia.“ American Political Science Review 104(2): 243–267. SAPIRO, Virginia. 1981–2. „If U.S. Senator Baker Were a Woman: An Experimental Study of Candidate Images.“ Political Psychology 3(1/2): 485–494. SIMON, Adam F. a Tracy SULKIN. 2002. „Discussion’s Impact of Political Allocations: An Experimental Approach.“ Political Analysis 10(4): 403–412. TRIPLETT, Norman. 1898. „The dynamogenic factors in pacemaking and competition.“ American Journal of Psychology 9(4): 507–533. VAN NOORDEN, Richard. 2015. „Retracted gay-marriage study debated at misconduct meet-up.“ Nature 522(7554): 14–15. WALSTER, Elanie, Elliot ARONSON a Darcy ABRAHAMS. 1996. „On increasing the persuasiveness of a low prestige communicator.“ Journal of Experimental Social Psychology 2(4): 325–334. WANTCHEKON, Leonard. 2003. „Clientelism and Voting Behavior. Evidence from a Field Experiment in Benin.“ World Politics 55: 399–422.