Kapitola 3 Pozorování nepozorovatelného Od doby, co Američané vynalezla Richarda Nixona, neměl nikdy nikdo tolik trablů. Richard Condon, Banďtcoot Tohle bude krátká kapitola, ale obtiže, na něž tu narazíme, by stačily na celou knihu. V předchozí kapitole jsme hovořili o našem hlavním problému, o tom, že díky velikosti „přirozených systémů" v sociálních vědách není možné docílit úplného popisu a úplné analýzy reality. Redukce je naším nejdůležitějším, ne však jediným epistemologickým problémem. Tím druhým je problém transformace informací. V tomhle typu nepříjemností nejsme sami. Naprostá většina věd nedělá závěry přímo z analýzy reality, ale na základě záznamu, popisu této reality. To platí i pro přírodní vědy. Představa vědce, který zatřepe zkumavkou, obsah zkumavky změní barvu a vydá dramatický kouř a vědec začne tančit radostí, že jebo teorie byla potvrzena, patří dnes- spíše do světa televizní fikce. I zde jsou konečné závěry navrženy na základě popisu, na základě protokolů o mnoha experimentech či pozorováních. A popis nutně znamená transformaci, překlad reality do symbolů jazyka. přímým pozorováním bydliště respondenta, počet dětí, povolání, vlastnictví auta, pohlaví atd ale my se většmou na tyto věci respondenta jenom ptáme, prosté proto, že přímé sledování by bylo příliš časově náročné a nákladné. 3.1 A proč se neptat? Většinou nám nezbude nic jiného než se zeptat. Jenom nesmíme zapomenout, že každé nepřímé měřeni zvyšuje riziko zkresleni, a to tím více, čím více je kroků mezi zkoumaným fenoménem a naším protokolem, záznamem o tomto fenoménu. 1 v něčem zdánlivě tak jednoduchém, jako je proces odpovědi na otázku, je těch transformací požehnaně dost. Podívejme se silným zvětšovacím sklem na následující transformaci: otázka -» odpověď Mnoho kroků mezi těmito dvěma body má pro nás dostí důležitý význam. Měli bychom je mít stále na mysli, když kupř. připravujeme otázky pro interview nebo (nedej bože) pro dotazník. Cvičení 3.1 Některé vědy se obejdou bez tohoto kroku, bez transformace reality do jejího popisu. Zkuste jmenoval nějakou takovou šťastnou vědu a vysvětlete, proč nemusí analyzovat pouhý popis. Problém je v tom, že transformace informací je v různých vědách a pro různé pozorované problémy různě obtížná a různě spolehlivá. Určit pohlaví respondenta neni obvykle obtížný problém. Ale mnohé důležité sociologické koncepty nejsou dostupné přímému pozorování, například koncept odcizení. Jiné jsou dostupné pozorování, a přece je sledujeme obvykle jenom nepřímo. Jistě by bylo možné zjistit (0 Především, zkoumaná osoba musí naší otázce mšmi^mimĚi. To není vždycky tak jednoduché. „Správně porozumět" znamená, že respondent pochopí otázku přesně tak, jak to mél výzkumník na mysli, a dále to znamená, že všichni dotazovaní musí pochopit otázku naprosto stejným způsobem. Jde nám přece - alespoň v kvantitativním výzkumu -o srovnatelnost dat. 56 57 "n Zkreslení může vyvolat i představa pozitivní sankce. Respondent volí nepravdivou odpověď, aby se ukázal v nejlepším světle, nebo chce prostě tazatele potěšit. To dobře ilustruje naše pravdivá Pohádka 3. Pohádka pro odrostlejší děti 3 O vzorném tazateli a vzorné zkoumané osobě Byl jednou jeden rozsáhlý výzkum o využití volného času ve velkém průmyslovém městě. Bylo to velmi náročné pro respondenty. Žádali jsme je, aby po řadu dnů zaznamenávali v 15tnmutových intervalech, co dělali od probuzení do usnutí. Tazateli byli studenti naší fakulty. Mezi nimi Jirka. Na Jirku připadla také jedna velice stará pani. Když uslyšela, o co jde, posílala Jirku za sousedkou. „Ta je mladá, pořád je někde, chodí na schůze a tak..." Náš Jirka jí laskavě a moudře vysvětlil teorii konstrukce vzorku, význam sociologického výzkumu, a nakonec babička podlehla, a když Jirka po několika dnech přišel, aby odnesl záznam, byl moc překvapen. Babička byla v divadle, na výstavě, dokonce i na schůzích. Jirka ji moc pochválil a stará paní řekla: „Ale jsem moc ráda, že to mám za sebou. Já bych isž víc toho chození po těch candrbálech nevydržela." Tak to je vzácný případ toho, jak výzkum může zkreslit ne odpověď, ale chování zkoumané osoby, Všimněte si, že jsem známého sociologa průmyslu, dr. Jiřího Orta, vůbec nejmenoval. (4) í verbalizace odpovědi, zejména v rozhovoru, může být spojena s některými problémy. Pro respondenta může být nepřijatelné vysloviť určitou nepříjemnou alternativu, použít neobvyklé slovo. Obvykle jsme však schopni témto situacím předejít: i v řízeném rozhovoru můžeme u kritických otázek předložit dotazované osobě tištěný lístek se seznamem alternativních odpovědí a zeptat se, která alternativa nejlépe vystihuje její situaci. Pro respondenta může být příjemnější odpovědět třeba číslem 5 než vyslovit přímo, že jeho manželství je velice nešťastné a že již často uvažoval o rozvodu. (5) Záznam odpovědi může také vyvolat zkreslení. U otevřených otázek a zejména v kvalitativním výzkumu proces záznamu odpovědí - a někdy potřebujeme velice přesný záznam - může narušit přirozený charakter interakce mezi tazatelem a zkoumanou osoboví. V standardizovaném rozhovoru je hlavním zdrojem zkreslení seznam nabídnutých kategorií. Neúplný soubor alternativních kategorií a kategorie, které se překrývají, patří mezi naše obvyklé hříchy. K tomu ještě přistupuje méně častý omyl, výběr chybné kategorie, ať již tazatelem, nebo respondentem. Vidíme tedy, že i zdánlivě jednoduchý proces, jako je odpovídat na otázku, představuje celou řadu transformací, z nichž každá může být spojena s povážlivým zkreslením. Co si pak počneme se zkoumáním konceptů, které nemají přímou empirickou reprezentaci? A v sociologii máme takových konceptů opravdu mnoho. Odcizení, prestiž povoláni, třídní vědomi, autorita a stovky jiných konceptů, se kterými pracuje sociologická teorie, je téměř nemožné pozorovat přímo. 3.2 Jak nám respondent řekne to, co neví Ve většině věd jsou pozorováni a měřeni převážně nepřímá. Studovaný fenomén je reprezentován nějakým indikátorem. Kupř. tělesná teplota je indikována pozicí rtuti na stupnici teploměru, věk zkoumané osoby je reprezentován její odpovědí na příslušnou otázku. Čím větší je vzdálenost mezi tím, co chceme studovat, a indikátorem, který jsme schopni pozorovat, tím větší je riziko zkreslení V sociologii je tato vzdálenost značná a většinou zahrnuje dlouhou řadu transformací. Nalezení spolehlivého ukazatele je jednou z nejkritičtějších operací ve výzkumu. Dopustíme-li se omylu v této fázi, všechny následující operace budou neplatné. Měli bychom zde aplikovat rčení populární mezi lidmi kolem počítačů od dob, kdy počítače byly velké jako dům a byly jenom dva. Dnes se vlastně nepoužívá rčení, ale jen zkratka: GIGO. Znamená to „garbage in, garbage out". Volně přeloženo to znamená asi „svinstvo na vstupu dá svinstvo na výstupu". Výzkum můžeme pokazit kdykoliv, ale nezachycené omyly při konstrukci indikátoru jsou fatální. Abychom se mohli produktivně bavit o problémech s tím spojených, musíme zavést dva nové pojmy: pojem validity a pojem reliability. 60 61 WĚĚm -un ■111 Cvičení 3.2 Je s následující otázkou všechno v pořádku? - Jaký je nyní Váš příjem? Zamyslete se nad tím na chvíli častým hříchem při konstrukc, otázek je, že mylne generujeme náš spectfcky okruh znalostí na ceíou populaci. Můžeme si být i* H opravdu každý ví, co je HZDS? Můžeme H byt jisti, že opravdu každý používá určitý termín ve stejném smyslu jako my? Nékdy muzeme byt opravdu překvapeni: Pohádka pro odrostlejší déti 2 Egri Bikaver aneb Jak to nevyšlo Před mnoha a mnoha lety jsme dělali výzkum v jedné malé horské obci. Velice chudá obec to byla, s tak špatným JZD, že v něm nebylo ani co ukradnout. Byl to kvalitativní výzkum. Mimo jiné nás zajímal životní styl obyvatel. Ptali jsme se také: „Co nejčastěji pijete?" Odpověď prvního družstevníka nás lehce překvapila. Odpověď druhého, třetího, desátého nás prostě šokovala. Všechny odpovědi byly stejné. Všichni dotazovaní odpověděli, že nejčastěji pijí Egri Bikaver. To by) pro nás šok: tohle víno, maďarská Býčí krev, bylo v té době pěkně drahé. Rozhodně nad poměry lidi v téhle obci. Ovšem jsem si hned vykonstruoval teorii. Krásnou a chytrou, kompenzační. Velmi nízká životní úroveň deprimuje družstevníky, Pití je důležitou součásti místní kultury, a tak se lidé snaží udržet vysoký status alespoň v této oblasti, když všude jinde je jejich status zoufale nízký. Tak jsem se šel hned pochlubit se svojí teorií osobě, která rozuměla obci nejlépe, místnímu panu faráři. Když se pan farář přestal smát - a smál se moc dlouho -, vysvětlil mi jednu zvláštnost místního slovníku: Egri Bikaver se tu říká hořčáku, v té době nejlacinějšímu, příšernému ovocnému vínu. Říká se tomu tak proto, že „když se toho napijete, bolí vás hlava tak, že řvete jako bejk". A to byl zase jednou konec mé geniální teorie. (2) V dalším kroku se musí zkoumaná osoba rozhodnout, ^y^^oé^m^ na naši otázku. Některé otázky mohou být pro respondenta nepříjemné, může se citrt J-. ohrožen může chtít chránit své soukromí. Ne vždy jsme schopni takovou s.tuac, předvtdat. (3) Pak se náš respondent musí rozhodnout, jak odpoví. Odpoví pravdivě? Zná vůbec pravdivou odpověď na naši otázku? Institut fůr Demoskopie zjistil, že hlavní příčinou nepravdivých odpovědí v Německé spolkové republice v 60. letech byl prostý fakt, že respondent neznal pravdivou odpověď (Noelle 1967). Neznalost respondenta je velice častým zdrojem zkreslení; zkoumaná osoba nerada přiznává, že nezná odpověď, že nerozumí některému výrazu v otázce, a tak stejně odpoví. Přirozeně taková odpověď je pro náš výzkum neplatná, ale my o tom nevíme. Není příliš těžké empiricky dokázat, že riziko takového zkreslení je dost vysoké. Před několika lety moji studenti provedli následující test. Do krátkého dotazníku, zaměřeného na některé etické aspekty politického rozhodování, jsme zařadili vysloveně nesmyslnou otázku. Její český ekvivalent by zněl asi takto: - Domníváte se, že koncept kufanditní pumprdentnosti je: 1. mravně akceptovatelný 2. akceptovatelný jen někdy 3. neakceptovatelný 4. nevím Dotazník byl pak aplikován na malý a nereprezentativní vzorek posluchačů prvého ročníku a výsledky byly docela zajímavé. Jen menšina respondentů zvolila jedinou „pravdivou" alternativu čtyři. Nestálo by za to vyzkoušet, zda výsledky u nás by byly odlišné od výsledků z Kanady? Ovšem někdy je nepravdivá odpověď záměrná. Obvykle proto, že určitá alternativa odpovědi je pro respondenta spojena s představou nějaké sankce. V Severní Americe může být obtížné získat pravdivé informace o příjmu a finančních záležitostech vůbec. „Co kdyby tazatel měl nějaké spojení s daňovými úřady nebo s konkurencí?" U nás, v ne tak dávné minulosti, hrála silnou zkreslující úlohu obava z politického postihu. Předpovědět možnost takového zkreslení je často nesnadné, v jednom z našich prvých výzkumů, asi v roce 1966, jsme dostali v malých vesnicích na moravskoslovenském pomezí řadu „radioaktivních" odpovědí. Ale v jedné z obcí naprostá většina respondentů odmítla říci, co měli v neděli k obědu. Proč, to nevím. Dobře to vystihuje výrok jednoho mého kanadského kolegy: „Typický respondent se spíše přizná k manželské nevěře, než by připustil, že si nečistí pravidelně zuby." 58 59 L Validní měření je takové měření, které měří skutečně to, co jsme zamysleli merit. Beliabilní měření , , ie takové měření, které nám při opakované aplikaci dava shodne výsiedky, pokud se ovšem stav pozorovaného objektu nezměnil. Druhé velké nebezpečí je v narušení reliability. Je to podobná situace, jako bychom měřili délku měřítkem, které se tu zkracuje, tu prodlužuje, a my o tom nevíme. Uveďme si docela realistický příklad nereliabilní otázky, jakou čas od času potkáváme ve výzkumech: Chodíte do kina - často - ne tak často - občas - zřídka - vůbec ne Obě definice jsou jednoduché a nezní příliš vědecky. Ale uvidíme, že jsou velmi užitečným a pro výzkum nezbytným nástrojem. Podívejme se však nejdříve na některé příklady narušení validity a reliability. Naše pohádka č. 4 ilustruje takový příklad. Pohádka pro odrostlejší děti 4 O muzeu a validitě Bylo jednou v jednom krásném městě krásné Muzeum objevů vědy a techniky. Jeho ředitelem byl podnikavý a sečtělý mladý muž, a ten se jednou dočetl 0 studii podniknuté v jednom muzeu v Chicagu, která použila opotřebení koberce před jednotlivými exponáty jako ukazatele jejich popularity. Dočetl se také, že tato technika bySa použita i jinde, a tak se rozhodl, že ji použije 1 ve svém muzeu. Výsledky výzkumu byly poněkud překvapivé. Jako nejúspěšnější byl vyhodnocen exponát venovaný úspěchům čtyřletého plánu hospodářské výstavby, skříň s uprášenými diagTamy a plakáty, věcmi, o které v té době předstírali zdvořilý zájem jen reprezentanti nejvyšších mocenských orgánů. Výzkum byl publikován, ředíte! dostal vyznamenání a muzeum podstatně zvýšený rozpočet. Jenom několik set zasvěcenců vědělo, že kolem nejúspěšnější expozice vede jediný přístup k jediným toaletám v muzeu. Odpověď „často" může znamenat pro respondenta A .jednou za měsíc", pro respondenta B „dvakrát týdne", pro mě „dvakrát za rok" a znám jednoho televizního dramaturga, u kterého si význam odpovědi „často" vůbec netroufám odhadnout. V každém případě je tato otázka velice nereliabilní. Zkusme v následujícím cvičení, jak jsme porozuměli pojmům validity a relíabílity. Otázka v tomto cvičeni je jednoduchá, ale není právě nejlehčí. Cvičení 3.3 Může nereliabilní měřeni být validní? A co opačná situace: Může měření, které je nevalidní, být přesto reliabilní? Asi ano. Je to takové měření, které nám dává konstantní, aSe chybné výsledky. Je to podobné situaci ve fyzickém měření, kdy by naše měřítko bylo kalibrováno v jiných jednotkách, než se domníváme. Následující příklad je hodně přehnaný, ale vystihuje dobře náš problém: domníváme se, že měříme v centimetrech, a měřítko bylo kalibrováno v palcích. Při opakovaném měření stejného objektu dostaneme stejné výsledky, které však interpretujeme v centimetrech, a tak : jsou naše závěry nevalidní. Zajistit validitu pozorování je pro sociologický výzkum nesmírně důležité- My opravdu musíme často od zkoumané osoby získat informaci, kterou tato osoba vůbec nezná. Tedy alespoň ne v té formě, v jaké ji hodláme použít pro náš výzkum. Ptát se průměrného respondenta, zda se cítí alienován, bylo by zřejmě absurdní. Nejhorší na tom je, že mnoho respondentů by nám na tuto otázku stejně odpovědělo, třebas by nevěděli, co slovo alienace znamená; nechtěli by prostě přiznat svoji neznalost. I když mnozí z nás mají spíše skeptický názor na měření inteligence, IQ je stále užívaným konceptem. IQ měříme i u osob, které nikdy o tomto konceptu neslyšely. Na některé otázky dnes pravděpodobné nedostanete pravdivou odpověď. Jen málokterý respondent je ochoten přiznat, že je rasista, nebo že bije manželku. Proto se snažíme obdržet takovou informaci různými prostředky nepřímého měření. Povíme si o nich víc v příští kapitole. Ale už teď můžeme snadno odhadnout, že takové měření bude vystaveno značnému riziku zkreslení. V takových případech je nezbytné kontrolovat, zda navrhované měření je skutečně validní. Většina z následujícího výčtu technik pro kontrolu validity není snadná. Zdaleka ne všechny techniky, zejména ne ty nejúčhuiější, je možno aplikovat ve všech situacích. Testování validity přidává další krok do výzkumného procesu. Je to krok časově náročný, a tedy i nákladný. To by nás však nemělo odradit od aplikace těchto technik, kdykoliv to je jen trochu možné. Nezapomeňme na GIGO! První a pravděpodobně nejmocnéjší skupina technik pro kontrolu validity je založena na srovnání s nějakým vnějším kritériem. vysoké škole, je testována porovnáním výsledků testu se známkami, které student na univerzitě skutečně docílil. Jen tehdy, je-li shoda obou souborů dat dostatečná, je test prohlášen za validní a bude i nadále používán. Je zřejmé, že tento postup může být smysluplně použit pro testování měření, která mají být používána opakovaně, a nelze jej použít pro jednorázový výzkum. 3. Souběžná validita je testována tak, že měření téže vlastnosti je prováděno dvěma nebo více různými postupy. Můžeme třeba použít různé formulace nepřímých otázek, kombinovat je s projekčními otázkami (o těch hovoříme v příští kapitole) a můžeme v tomto souboru použít i přímou otázku. Čím větší je shoda mezi těmito různými přístupy k měření, tím je pravděpodobnější, že náš postup je validní. Velikou výhodou souběžné validity je, že tato technika je aplikovatelná takřka univerzálně. Určitou nevýhodou je však to, že plný test validity obdržíme teprve tehdy, když data byla sehrána a analyzována. V další skupině máme jen jednu techniku: 4. Konstruovaná validita V této technice je konstruován test hypotéz logicky spojujících zkoumanou vlastnost s technikou měření, kterou používáme. Ilustrujme si to na tomto příkladu: 1. Validita založená na členství ve známé skupině Logika této techniky je velice jednoduchá: zkoušíme náš nástroj na skupině, o níž vime, že má vlastnost, kterou má náš nástroj měřit. Tak např. otázky měřící rasismus by mohly být testovány na členech rasistických organizací. Jejich skóre by mělo být významně vyšší než skóre vzorku z obecné populace. Nepřímé otázky, které mají zjistit, zda respondent bije ženu, by mohly být vyzkoušeny na lidech odsouzených opakovaně pro tento delikt. Hlavní problém je zde existence a dostupnost takové skupiny. 2. Prediktivni validita porovnává předpověď založenou na testovaném měření se skutečnými výsledky. Např. validita škály, která má předpovídat pravděpodobnost úspěchu středoškolských studentů na 64 65 Profesor P, I. Toma vyvinul škáhi pro měření frustrace. Aby dokázal, že je tato škála validní, zkonstruoval soubor hypotéz předpovídajících, za jakých okolností můžeme očekávat vysokou úroveň frustrace: Hypotéza 1: Očekávání těžkého úkolu v blízké budoucnosti zvyšuje hladinu frustrace. Hypotéza 2: Čim negativněji je tento úkol vnímán, tím bude frustrace silnější. Hypotéza 3: Čím méně zajímavý je očekávaný úkol, tím vyšší bude frustrace. Studenti sociologie, očekávající zkoušku ze statistiky, byli testováni. Jejich frustrace byla významně vyšší než frustrace kontrolního vzorku studentů, kteří neočekávali žádnou zkoušku. Tomova škála byla přijata jako validtií ukazatel frustrace. (Adaptováno z Therese L. Baker, Doing Sociál Research, 1988) Poslední skupinu testů validity představují testy založené na obsahu měřeného jevu: 7. Zjevná validita (Face Validity! Většina učebnic výzkumných metod uvádí tuto techniku mezi jinými technikami testování validity. My se domníváme, že je to spíše popis situace, kdy kontrola validity není vyžadována. Kupř. jistě není třeba testovat validitu otázky v dotazníku zjišťující respondentovo pohlaví. Bohužel spoléhání na zjevnou validitu je aplikováno i na složitější situace. Babbie (1989, s. 124) uvádí tento přiklad: Počet stížností podaných dělníky odborové organizaci by mohl být použit jako ukazatel pracovní morálky. Asi bychom se shodli, že to může mít něco společného s měřenou vlastností. Mohli bychom se shodnout také na tom, že je to lepší ukazatel než řekněme počet knih, které si dělníci vypůjčili z veřejné knihovny. Potud Babbie. Zjevná validita je založena na tom, že intuitivně spoléháme na to, že existuje dostatečná spojitost mezi zkoumaným jevem a naším měřením. Vyjádřeno velice prostě: „Face Validity" je eufemisrrms pro situaci, kdy kontrola validity nebyla provedena vůbec. Někdy, jako tomu bylo v prvém příkladu v tomto odstavci, není na tom nic špatného. Ve složitějších situacích to může být nebezpečné. 5. Validita založená na mínění skupiny soudců Skupina zkušených knihovníků, učitelů literatury, nám může pomoci posoudit, zda naše posouzení čtenářské vyspělosti zkoumaných osob založené na výčtu přečtených knih je přijatelné. Důležité je, aby každý z členů poroty pracoval nezávisle na druhých. Shoda mezi výroky různých soudcuje pak dobrým ukazatelem validity. 6. Validita testovaná výčtem obsahu (Domain of Meaning) To je v podstatě test, zda naše měření dostatečně kryje doménu jevu, který zkoumáme. Tento test může být sotva použit pro valídizaci abstraktnějších konceptů. Výčet obsahu je užitečný zejména tehdy, kdy samotná definice zkoumaného konceptu není dostatečným nástrojem pro výzkumné operace. Kupř. srovnávat volný čas zkoumaných osob není snadný úkol. Prostý výčet aktivit, odpovídající definici tohoto testu validity, není dostatečným řešením: jedna a tatáž aktivita je pro jednoho respondenta milovanou rekreací a pro jiného velice nepříjemnou povinností. Proto jsme pro výzkum o využití volného času navrhli tento postup:. Po určitou dobu budou zaznamenávány všechny aktivity zkoumaných osob a jejich trvání. Pak budou respondenti dotazováni na každou aktivitu, zda ji považují za volný čas. Takový postup může poskytnout validní, srovnatelnou definici rozsahu volného času. Kdyby se vám snad po téhle kapitole zdálo, že náš profesionální život je příliš jednoduchý, přidejme nakonec ještě jednu nepříjemnou připomínku: Neexistuje nic takového jako univerzální validní měření určitého konceptu. Validita prokázaná v určitém kontextu a pro určitý účel je automaticky platná jen pro tento kontext a shodný úřel. Indikátor určitého jevu, který je perfektně validní pro jeden účel, může být nevalidní pro měření téhož jevu v jiné souvislosti a naopak. 66 67 Cvičení 3.4 V léto kapitole jíme diskutovali otázku měřicí frekvenci chození do lána v kategoriích „ často ne tak často" „občas- atd. Dospeli jsme k záveru, že tato otázka není reliabilm, a tedy nem "ani validní Umíme si představit situaci, ve které by byla validním měřením, To také znamená, že validní indikátory „necestuji" dobře: exportujeme-li validní indikátor ze země do země, z jedné kultury do jiné, snadno může ztratit svoji validitu. Kupř. jedna škála měřící validně odcizení v USA obsahuje mimo jiné otázky: Čtete pravidelně Reader's Digest? Chodíte pravidelné do kostela'? "Negativní odpověď na tyto otázky signalizuje přítomnost odcizení. Když je tato škála exportována třeba jenom do Kanady, výsledky měření jsou poněkud zkreslené: Reader's Digest není v Kanadě příliš populární, chození do kostela se zdá mít v kanadském kulturním kontextu jiný význam než v USA. Importovat takovou škálu v její původní formě k nám by bylo prostě absurdní. Uveďme si alespoň ješté jeden příkiad: v době, kdy se odehrála naše pohádka č. 5, byla ve výzkumu vztahů na pracovišti v USA ještě hojně používána škála zvaná SRA Attitude Survey (Dabas 1958). Tato škála byla považována za spolehlivé měřítko pracovni morálky, za „morale audit". Pohádka pro odrostlejší děti 5 Co by se mohlo stát... Náš oblíbený profesor P. I. Torna se rozhodl studovat, jaký vliv na dělníky má participace v dělnické samosprávě. Jeho základní hypotéza byla, že čím vyšší je tato participace, tím vyšší bude pracovní morálka dělníků. Pro měření závisle proměnné použii škálu z SRA. Attitude Survey. Analýza dat potvrdila, že existuje skutečně souvislost mezi participaci v samosprávě a morálkou dělníků. Vypočítané koeficienty byly překvapivě silné a velice významné. Problém byl v tom, že koeficienty byly negativní: Čím vyšší participace, tím nižší morálka. Profesor P. I. Torna přijal hypotézu, že participace v dělnické samosprávě podvrací pracovní morálku, zvyšuje jejich alienací, a je proto zavrženíhodná. Problém je v tom, že v SRA škále je považován za indikaci nízké pracovní morálky souhlas s tvrzeními jako: 29. Spatné pracovní podmínky mi znemožňují, abych podal nejlepší pracovní výkon. 42. Vedení nám nedává jasné příkazy a instrukce. 44. Vedení nás neinformuje o věcech, které bychom měli vědět. 62. Náš šéf by měl být přátelštější k zaměstnancům. Náš P. I. Torna si neuvědomil, že tato tvrzení, stejně jako mnoho jiných ve škále, vyjadřují postoje, které by měl mít každý člen dělnické samosprávy. Zřejmé mu na jeho univerzitě utajili, že posláním samosprávy je zaujímat kritický postoj k formálnímu vedeni závodu. Domníval se, že měří souvislost mezi členstvím v samosprávě a pracovní morálkou. Ve skutečnosti však měřil souvislost mezi členstvím a postoji, které jsou očekávány od členů samosprávy. Není tedy divu, že jeho koeficienty byly vysoké: koreloval jen dvě části jednoho jevu. Výzkum popsaný v naší pohádce nám tedy neřekl nic o vlivu samosprávy na pracovní morálku. Ale není bezcenný. Ukázal nám zřetelně, že měření, jehož validita byla uspokojivě prokázána v jednom sociálním prostředí, může být tragicky (či komicky) nevalidní na jiné populaci. . Do stejné kategorie patří i problémy třídního, sextstiekého a rasového zkreslení testů inteligence. Jejich výsledky snad mohou být validní pro bílé studenty z rodin vyšší střední třídy, 68 69 tedy v prostředí, ve kterém byly vyvinuty a ve kterém byla jejich validita nejčastěji testována. Aplikuj eme-li však tyto testy na černého kluka z ghetta, jehož negramotní rodiče živoří na veřejné podpoře, nebo na romskou ženu z východoslovenské cikánské vesnice, výsledky mohou být daleko méně validní. Pokud si snad myslíte, že našich trampot s logikou empirického výzkumu v sociologii není ještě dost, máme tu ještě jednu obzvláště peknou Jobovu zvěst. Měli bychom šiji velice dobře pamatovat: Všechny závěry z empirického výzkumu, statistické důkazy atd. se nevztahují na jevy, které chceme studovat, ale jen na jejich indikátory. Řekněme, že sledujeme vliv vzdělání na politickou participaci. Všechny pozorované vztahy, : souvislosti, statistické důkazy se skutečné nevztahují na tyto dva koncepty, ale jen na jejich ; ukazatele. Skutečně tedy měříme souvislost mezi léty formálního vzdělání a faktem, zda respondent hlasoval v posledních volbách, přispíval finančně na volební fond nějaké strany, chodil do průvodu a prapory vyvěšoval nebo přilepil volební heslo na nárazník svého auta. Někdy je rozdíl mezi indikátorem a studovaným konceptem zanedbatelný. Častěji je však zdravé pořádně se zamyslit nad vzdáleností mezi konceptem a jeho ukazateli. Ale k tomuto problému se v naší knize j eště několikrát vrátíme. -4 Řešení úkolů z kapitoly 3 Cvičení 3.1 Do této kategorie patří formální vědy jako matematika a formální logika. Jejich předmětem je čirá abstrakce, a tak kategorie překladu „reality" do jejího popisu tu není aplikovateiná. Cvičení 3.2 To je opravdu špatná otázka. Nemůžeme vědět, zda částka, kterou respondent uvedl, představuje jeho čistý nebo hrubý příjem, zda zahrnuje také příjem z vedlejšího povolání. Nevíme, zda je to týdenní, dvoutýdenní nebo měsíční příjem. Někteří respondenti nám odpovědí hodinovým příjmem. Rozhodně nám tato otázka neposkytne výsledky srovnatelné pro všechny osoby v našem vzorku. Cvičení 3.3 Měření, které není relíabilní, nám nedává stabilní výsledky. V každém pozorování měří něco jiného, nebo měří jinak. Taková operace tedy měří něco jiného, než má. Je tedy neval idní. Cvičení 3.4 Tato otázka je nevalidní jakožto ukazatel kvantity chození do kina. Mohla by však být valídním ukazatelem toho, jak je nasycena respondentova potřeba chodit do kina. V tom případě by bylo užitečné měřit frekvenci jinou, objektivnější otázkou, třeba: „Kolikrát jste byl za poslední měsíc v kině?" 70 71 Jak si nakreslit plán aneb Na co jsou hypotézy dedukce indukce výzkum jako testování hypotéz pracovní hypotézy operační hypotézy funkce pracovních hypotéz test zkoumatelnosti optimalizace redukce rozhodnutí o technice sběru dat rozsah výzkumu 73 Kapitola 4 Jak si nakreslit plán aneb Na co jsou hypotézy ľm short enough and ugly enough to succeed on my own. Woody Allen, Play it again Sam Až dosud jsme si jenom stěžovali. Stěžovali jsme si na nezvládnutelnou velikost přirozených systémů v sociálních vědách, na trampoty, které z toho vyplývají: na nutnost pracovat s neúplně popsaným a ještě neúplněji analyzovatelným systémem, na to, že jsme v důsledku této redukce vystaveni mnoha typům zkreslení. Stěžovali jsme si na to, že jsme schopni potvrdit existenci příčinné závislosti téměř výhradně jen experimentem. A stěžovali jsme si také na náš druhý veliký problém: na nutnost nepřímého měření, na to, že transformace studovaného jevu do indikátorů, ve kterých tento jev pozorujeme, měříme jj a analyzujeme, je mnohem delší a mnohem riskantnější než ve většině jiných věd. Naříkali jsme nad nejistou validitou našeho měření. f V téhle kapitole se podíváme na to, co se s tím dá dělat. Neočekávejte tu žádné zázračné [ recepty. Udělat slušný empirický výzkum, to dá fušku. Mnoho a mnoho hodin přemýšlení a psaní ještě předtím, než máme vůbec možnost ušpinit si ruce fakty. Dlouhé dny v terénu, dlouhé dny strávené analýzou dat, a to se nakonec může stát, že naše hypotéza bude fakty vyvrácena. Alespoň jsme zjistili, že tudy cesta nevede. Horší je, když ji naše výsledky ani nepotvrdí, ani nevyvrátí. I to se někdy stane. Ale přesto prese všechno je to veliká krása, dělat výzkum. Vždyť studovat vztahy mezi lidmi je velké dobrodružství. Pevnina sociálních vztahů a struktur je ještě jen málo prozkoumaná a zaplňovat prázdná místa na mapě je veiiké dobrodružství. Zkuste to, a uvidíte, že se vám to bude líbit. Ale pozor, je to návykové. V téhle kapitole se budeme zabývat spíše logickými pravidly výzkumu než podávat recepty, ' jak technicky připravit výzkum. Tím se zabývá celá řada jiných knih, Věříme však, že tato pravidla jsou důležitou pomůckou i pro optimalizaci rozhodnuti o mnohých technických krocích ve výzkumu. Ještě jednu důležitou poznámku, než opravdu začneme: v této kapitole, stejně jako v předchozích, se budeme zabývat hlavně kvantitativním výzkumem, a to ještě většinou v jeho silně standardizované verzi. Není to proto, že bychom tento typ výzkumu považovali za nadřazený. Jediný důvod pro tento popis je fakt, že v kvantitativním výzkumu jsou všechna naše zranitelná místa jasně viditelná. 4.1 Výzkum jako idiot Můžeme začít třeba pravdivou pohádkou z počítačového pravěku: Pohádka pro odrostlejší děti 6 O tom, co je počítač Před dávnými a dávnými časy byl představen tisku jeden z prvních počítačů. Byl obrovský, nesmírně drahý, pomalý a neuměl o moc víc než trochu lepší kalkulačka. Ale protože to bylo dávno a dávno, novináři byli okouzleni. Hovořili s jedním z tvůrců toho počítače: Novinář: „Pane profesore, ten počítač je génius!" Profesor: „Ale pánové, to se mýtíte. To je úplný idiot. Umí jen jednu věc: rozeznat nulu od jedničky. Ale umí to velmi rychle a nedělá chyby." 74 75 Empirický kvantitativní výzkum v sociologií je také takový idiot. Umí jenom rozeznat, zda existuje souvislost mezi dvěma nebo více proměnnými. Bohužel neumí to rychle a dělá mnoho chyb. Kvantitativní výzkum není nic jiného než testování hypotéz. Podívejme se blíže, co to vlastně znamená v termínech epistemologie vědy. Při produkci poznání zde užíváme v podstatě dva odlišné postupy: indukci a dedukci. Deduktivní metoda vychází z teorie nebo z obecně formulovaného problému. Teoretický nebo praktický problém je přeložen do jazyka hypotéz. Hypotézy navrhují, jaké spojení j mezi proměnnými bychom měli najít, je-li naše hypotéza pravdivá. Pak následuje sběr dat. í Odpovídají-li závislosti mezi sebranými daty vzorci předpovězenému v hypotézách, přijmeme ( hypotézy jako platné. Jinak musíme hypotézy odmítnout. Induktivní metoda je značně odlišná. Začíná pozorováním, ve kterém pátráme po pravidelnostech, vzorcích, které snad existují v objektivní realitě. Objevené pravidelnosti popíšeme ve formě předběžných závěrů. Ty pak ověřujeme dalším pozorováním. Konečným t produktem je nová teorie. . í A teď si zkusme, zda jsme rozdílům mezi dedukcí a indukcí dobře porozuměli: '< 1 Cvičení 4.1 f Klemu z těchto metod používal velmistr dedukce, slavný detektiv Sherlock Holmes? \ i I Tabulka 4.1 DEDUKCE INDUKCE Teorie Pozorování T Hypotézy Nalezené pravidelnosti ■v T Pozorován; Předběžné závěry ▼ ▼ Přijaté/zamítnuté hypotézy Teorie Kvantitativní výzkum používá deduktivní metodu. To znamená, že je schopen řešit jen určitou kategorii problémů: Kvantitativní výzkum může nalézt řešení jen pro takové problémy, které je možno popsat v termínech vztahů mezi pozorovatelnými proměnnými. 77 Přeformulovat problém tak, aby vyhovoval těmto podmínkám, přeložit teoretický problém do jazyka výzkumu, nemusí být snadné. Naštěstí máme nástroj, který nám tuto operaci podstatně ulehčí. Jsou to pracovní hypotézy. Je to velice užitečný nástroj, který nám pomůže minimalizovat problémy vyplývající z redukce a transformace informací, nevyhnutelné v sociologickém výzkumu. 4.2 Aby hypotézy nebyly jen hypotetické Cesta od teorie k výzkumu je dlouhá a musíme se snažit, aby nebyla příliš klikalá, První krok od teorie k výzkumu je obvykle formulace základních, ještě dost obecných hypotéz. Taková hypotéza může být definována třeba takto: „Hypotéza je očekávám o charakteru věci, vyvozené z teorie" (Babbie 1979). Uveďme si alespoň jeden příklad takové hypotézy: Hypotéza i Čím více podnětů týkajících se politiky osoba dostává, tím vyšší je pravděpodobnost, že bude participovat v politice. Lester W. Milbrath, Political Participation, Chicago 1965, s. 39 Tato hypotéza je mnohem konkrétnější než většina hypotéz na této úrovni. Přesto nemůže být ještě bezprostředním východiskem pro technickou konstrukci výzkumu a výzkumných nástrojů. Je třeba ji rozložit do souboru pracovních hypotéz. My definujeme pracovní hypotézu takto: Tabulka 4,2 1. Pracovní hypotéza je tvrzení předpovídající existenci souvislosti mezi dvěma nebo více proměnnými. 2. Všechny proměnné zmíněné v hypotéze musí mít validní operační definici. 3. Soubor pracovních hypotéz musízařirnovat nejen proměnné reprezentující zkoumané koncepty, ale i fy proměnné, které mohou významně zkreslit interpretací testovaných vztahů. Především si musíme ujasnit, co znamená termín „operační definice". Začněme jednoduchým příkladem. Co je vlastně kyselina? Chemik by nám nabídl definici popisující „kyselinu jako sloučeninu s vodíkovým atomem, který je schopen odštěpit se ve vodním roztoku jako vodíkový katión H+ a udělit roztoku kyselou reakci..." (Příruční slovník naučný, 1963, II. dli, s.741). Operační definice kyseliny by mohla znít asi takto: Kyselina je taková tekutina, která změní barvu lakmusového papírku z modré na červenou. Vidíme, že operační definice je mnohem méně precizní, daleko volněji spojená s teoretickými koncepty. Nevysvětluje nám vůbec, co kyselina je. Má však jednu velice užitečnou vlastnost: dává nám bezprostřední návod, jak poznat, co jo kyselina. V operační definici je koncept vyjádřen popisem operací, kterými bude měřen. Gýšem i operační definice musí být zakotvena v teorií. Problém je, že v sociálních vědách je vzdáleno-u mezi teoretickým konceptem a jeho operační definicí značná, a to může ohrozit validitu našich operací. Ale to všechno už známe: diskuse o operačních definicích je v podstatě opakováním naší diskuse o indikátorech z předchozí kapitoly. nemáme operační' definici a ještě nevíme, co znamená třetí podmínka zmíněná v tabulce. Je však zřejmé, že hypotéza 1 není pracovní hypotézou, že musí být do ní teprve přeložena. Podívejme se zde alespoň najeden klasický příklad operacionalizace. Emile Dürkheim uvedl ve své klasické knize Sebevražda (1897) koncept anomie. Anoroie je obvykle definována jako nepřítomnost norem. V dobách dramatických sociálních změn staré sociální normy ztrácejí platnost a nové normy nejsou ještě obecně přijímány. Jednotlivec si již není jist, co bude spojeno s negativní sankcí a co s odměnou. Dürkheim zvolil sebevraždu, „výsostne individualistický a osobní akt", za ukazatel anomie. Nesmírně komplexní teoretický koncept anomie byl silně redukován: anomie určité oblasti je operačně definována jako počet sebevražd za rok připadajících na každých sto tisíc obyvatel. I stručná úvaha nám ukáže, jak mnoho zajímavých a důležitých dimenzí původního konceptu je v této operacionalizaci ztraceno. Redukce informací je nevyhnutelné břemeno, které nás bude provázet na každém kroku výzkumných operací. To však nemusí být fatální. Zhoubné by to bylo tehdy, kdybychom uvěřili, že operační definice je perfektní reprezentací teoretického konceptu, že můžeme skutečně položit rovnítko mezi anomii a frekvenci sebevražd. Naštěstí praxe empirického sociologického výzkumu se obvykle zabývá koncepty značně jednoduššími, než je Durkheimova anomie. Uvidíme také brzy, že empirický výzkum není s to testovat platnost „grand theories" (a většinou ani teorií středního rozsahu) jako celku. Tyto operace jsou jednoznačně doménou teorie. A teď se už můžeme vrátil k mnohem skromnějším konceptům a zamyslet se nad jejich překladem do jazyka pracovních hypotéz. Vraťme se k Milbrathově hypotéze o participaci v politice: Hypotéza 1 Čím více podnětů týkajících se politiky osoba dostává, tím vyšší je pravděpodobnost, že bude participovat v politice. Podívejme se, jak tato hypotéza odpovídá naší definici pracovní hypotézy uvedené v tabulce 3.2. Hypotéza předpovídá existenci spojení mezi dvěma proměnnými, ale pro žádnou z nich Nejdříve můžeme začít s pátráním po měřitelných ukazatelích politické participace. Není těžké vyjmenovat jich celou řadu. Za krátkou dobu bychom mohli skončit se seznamem obsahujícím několik desítek přijatelných indikátorů. Ale které z nich vybrat? Takový seznam může obsahovat všechno, od faktu, že respondent je třeba předsedou vlády, kandiduje na politickou pozici, přes účast na demonstracích, až po prosté hlasováni ve volbách a všichni víte z nedávné minulosti, že stávka, účast na mši, na určitém divadelním představení nebo koncertě může být navýsost politickým aktem. Stejně dobře si umíte představit, že záměrná neúčast v oficiálních kanálech politické participace může být velice silným a významným vyjádřením politického postoje. Co tedy vybrat? Záleží předevšim na cíli výzkumu, na teoretickém rámci, ve kterém chceme politickou participaci studovat. Milbrathova hypotéza by mohla být použita právě tak ve studii zabývající se psychologickými a filozofickými dimenzemi politické participace jako ve výzkumu snažícím se porovnat participaci ve standardních politických kanálech u různých skupin obyvatelstva. Operační definice politické participace by ovšem musela být v obou případech různá. A ovšem definice závisí na konkrétním politickém a historickém kontextu. Operační definice politické participace obyvatel hlavního města Prahy 1991 by se podstatně lišila od definice participace na téže populaci o pět let dříve. Jiné indikátory musí být použity pro měření politické participace v různých politických systémech. Indikátory použitelné v demokratických zemích by sotva daly smysluplné výsledky, kdyby byly aplikovány v zemi, kde je demokracie silně omezena. I v zemích se shodným politickým systémem mohou být ukazatele platné v jedné zemi neplatné v jiné, stejně demokratické. Prostě se tyto země liší v politické kultuře, různé politické akty mohou mít různý význam anebo nemusí mít v určité zemi vůbec žádný význam. Participace v běžných formách politiky je v Severní Americe měřena často ukazateli podob-. nými těm uvedeným v naší tabulce 4.3. Tyto ukazatele bývají často exportovány do jiných zemí, bohužel často jen mechanicky, a to může vyvolat povážlivé zkreslení, nebezpečné ■zejména ve srovnávacím výzkumu. K tomu se vrátíme v jedné z našich budoucích pohádek. ; Bude to smutná pohádka, protože je pravdivá. Naše tabulka je adaptaci ukazatelů hierarchie politické participace navržených Milbrathem (Milbrath 1982, s. 18). Indikátory jsou razeny sestupně. První skupina zahrnuje aktivity, které jsou v angloamerické literatuře označovány jako „gladiátorské" aktivity, poslední skupina „divácké" aktivity. Prostřední reprezentuje přechod mezi oběma vyhraněnými typy. I když bychom pravděpodobně pro výzkum u nás některé z těchto ukazatelů vypustili, je zřejmé, že naše závisle proměnná, politická participace, musela být měřena v ceié řadě proměnných. Protože si nemůžeme být jisti, že každý z indikátorů odráží politickou participaci ve stejné míře, každý z indikátorů musí být použit ve zvláštní pracovní hypotéze. Tabulka 4.3 Výkon veřejné funkce nebo funkce v politické straně Kandidování na takovou pozici Vybírání peněz pro politické účely Participace na politických schůzích plánujících strategii Aktivní členství v politické straně Aktivní účast v předvolební kampani Účast na poíitických schůzích a shromážděních Peněžní dary politické straně nebo kandidátovi Psaní dopisů veřejným nebo politickým funkcionářům Politické plakáty na nárazníku auta, na trávníku před domem Přemlouvání druhých, aby hlasovali určitým způsobem Iniciování politické diskuse Hlasování Ponechme stranou otázku platnosti hierarchie jednotlivých ukazatelů a podívejme se na problém validity těchto ukazatelů v našich poměrech. Cvičení 4.2 Zkuste odhadnout, které z těchto ukazatelů by mohly vyvolat zkreslení, kdyby byly použitypro výzkum politické participace v našich poměrech. 82 Podívejme se teď na naši nezávisle proměnnou - expozici politickým stimulům. Ta by mohla být sledována kupř. následujícími ukazateli: - frekvence sledování politických pořadů v TV - frekvence sledování politických pořadů v rozhlase - frekvence čtení politických úvodníků - politické debaty v rodině - politické debaty s přáteli - odebírání nebo pravidelná četba politicky orientovaných periodik Jistě by bylo možno v tomto výčtu pokračovat. Tradice politické participace v rodůlě může být velmi silným politickým stimulem. Tento jev by ovšem musel být operacionalizován do několika proměnných (kupř. kdo z rodiny participoval v politice; jak; jak intenzivně; kdy atd.). Jiným, pravděpodobně silným, politickým stimulem by mohla být četba knih s politickou tematikou, a tak bychom mohli ještě hodnou chvíli pokračovat v našem výčtu. Pra jednoduchost předpokládejme, že pro popis politických stimulů použijeme jenom prvých šest proměnných. Každá z nich ovšem musí být použita v samostatné hypotéze; každý 7. těchto politických podnětů může mít různé silný vliv na různé typy politické participace. Řekněme, že bychom pro popis politické participace použili třeba jen šest proměnných. Některé z nich jsou u nás sotva validní, jak jste sami zjistili ve cvičení 4.2. U jiných je frekvence výskytu tak nízká, zeje v řadě výzkumů můžeme ignorovat (kupř. v USA v prvých třech typech „gladiátorské" participace působila méně než 2 % populace). ■;■ Máme tedy 6 proměnných popisujících politické stimuly a 6 dalších, popisujících politickou ; participaci. Naše pracovní hypotézy by mohly vypadat třeba takto: Osoby, které čtou pravidelně politické úvodníky, hlasují ve volbách častěji než osoby, které je nečtou. •>• Osoby, které čtou pravidelně politické úvodníky, jsou častěji aktivními členy politické strany než osoby ostatní, 83 Cím častěji respondent sleduje televizní politické pořady, tím vyšší je pravděpodobnost, že se bude aktivně podílet na předvolební agitaci. Abychom popsali všechny vlivy stimulů na všechny typy participace, museli bychom zformulovat 36 podobných pracovních hypotéz. Vidíme, že nám počet hypotéz požehnaně roste, a to ještě nejsme zdaleka u konce s naším úkolem. Zatím jsme se ještě ani nestačili vypořádat s třetí podmínkou z naší definice pracovní hypotézy; s nutností zahrnout do souboru hypotézy o proměnných, které by mohly podstatně zkreslit naši interpretaci vztahů mezi diskutovanými proměnnými. A opět je tu naše stará bolest: komplexnost přirozených systémů v sociálních vědách. Podívejme se alespoň na nejmarkantnější příklady: I kdyby čtení úvodníků nemělo vůbec žádný vliv na aktivní členství v politické straně, je vysoce pravděpodobné, že souvislost mezi čtením a členstvím stejně naměříme. Je to projev naší staré známé z prvé kapitoly - nepravé korelace. Ve většině demokratických společností vzdělanější osoby participují v politice více než lidé méně vzdělaní. Ale více vzdělaní respondenti budou také s daleko větší pravděpodobnosti vystaveni politickým stimulům. Je tedy možné, že souvislost mezi politickými stimuly a participací je zcela nebo částečně vyvolána vlivem vzdělání na obě diskutované proměnné. Podobnou roli může hrát kupř. i sociámě-ekonomícký status. Osoby v určitém ekonomickém postavení mohou být angažovány v politice, protože je to dobré pro jejich obchod. Z téhož důvodu pátrají po informaci o politických problémech a záměrně se tedy vystavují politickým stimulům. Takových situací, kde nějaká vnější proměnná ovlivňuje vztah mezi studovanými jevy, můře být mnoho. Naštěstí statistická analýza je schopna odizolovat vliv těchto vnějších proměnných. Můžeme toho však docílit jen tehdy, víme-Ii o každém respondentovi, jaké je jeho vzdělání, socioekonomický status atd, I kdyby náš výzkumný cíl byl velice úzký, kdybychom se zajímal jenom o vztah mezi politickými stimuly a participací, musíme do našeho souboru pracovníci hypotéz zahrnout třeba tyto; Čím vyšší je jednotlivcovo vzděláni, tím je vyšší pravděpodobnost, že bude navštěvoval politické schůze a shromáždění. Osoby s vyšším vzděláním čtou politické úvodníky častěji než osoby méně vzdělaně. S4 3ĚĚ Osoby, které vlastní v obci obchod, budou participovat v předvolební kampani pro místní volby častěji než osoby ostatní. Takových hypotéz budeme muset formulovat mnoho: víme z literatury i z denní zkušenosti, že účast v politických aktivitách je silně ovlivněna proměnnými jako pohlaví, věk, sociabilita jedince, jeho sociální sebedůvěra a mnoha dalšími a většina z těchto proměnných může být asociována s tím, jak silně je jedinec vystaven politickým stimulům. Soubor pracovních hypotéz musí zahrnout hypotézy o všech proměnných, které mohou mít významný vliv na závisle proměnnou a jsou přitom asociovány také s nezávisle proměnnou. A ještě jedna důležitá terminologická poznámka: termín „závislá" a „nezávislá" proměnná neznamená existenci kauzálni závislosti a často ani ne očekávaný směr vlivu. Většinou je to jen terminologická konvence, jejíž užitečnost vyplyne, až se budeme zabývat statistickou analýzou. Kupříkladu v našem případě kdyby naše obecná hypotéza byla potvrzena daty, tento výsledek může být interpretován v termínech expozice stimulům ovlivňujícím participaci stejně dobře jako vliv participace na expozici stimulům. Ale to všechno už dobře známe z diskuse kauzality a experimentu v prvé kapitole. 4.3 Je to k něčemu? Ted' už jasně vidíme, že konstrukce pracovních hypotéz je nesnadný úkol již jen vzhledem k pouhému počtu nezbytných hypotéz. Je to úkol náročný, většinou spíše nudný, avšak bohužel nezbytný. Pracovni hypotézy hrají ve výzkumu několik velice důležitých rolí: 1. Formulace pracovních hypotéz je testem, zda je výzkum vůbec možný V kvantitativním výzkumu můžeme zkoumat jen takové problémy, které je možné přeložit do jazyka pracovních hypotéz, tj. jen takové problémy, jež je možno vyjádřit jako vztahy mezi :. proměnnými, pro které máme validní operační definici. 85 2. Pracovní hypotézy jsou důležitým nástrojem pro optimalizaci redukce informaci Lék na naši nejnebezpečnější chorobu, nutnost pracovat s neúplným popisem reality, nebude asi nikdy vynalezen. Musíme se tedy naučit, jak optimálně s touhle nemocí žít. Musíme si být rozumně jistí, že jsme vybrali alespoň ty nejdůležitější proměnné, které ovlivňují zkoumaný problém, a zároveň se vyhnout sbírání informací, které nutně nepotřebujeme. Víme už sice, že zavedení proměnných, které nepatří do zkoumaného systému, nevyvolá zkreslení, ale každá proměnná navíc znamená investici času, peněz a energie, a to je něco, co si prostě nemůžeme dovolit. Většinou jsou naše limity překročeny ještě dříve, než jsme zahrnuli do výzkumu proměnné, které považujeme za nezbytné. Omyly tohoto typu jsou bohužel dosti časté. Náš výzkum má totiž ještě jednu populární dětskou nemoc; začíná zpravidla formulací otázek pro interview nebo dotazník. To je zajímavá, vzrušující a tvořivá činnost; zdaleka ne tak nudná jako formulace pracovních hypotéz. Skončíme se seznamem chytrých a zajímavých otázek, které s naším problémem nějak souvisejí. Bohužel při analýze dat zjistíme, že pro řadu proměnných nemáme žádné použití. To není moc dobré. Aie horší je, když při anaiýze zjistíme, že kdybychom položili jednu jedinou hloupou otázku navíc, mohli jsme opravdu něco objevit. To je opravdu nepříjemné, já vím. Sám jsem si to taky vyzkoušel. Pohádka pro odrostlejší děti 7 Pohádka v prvé osobě jednotného čísla Bylo, nebylo, byl jsem kdysi zodpovědný za metodologii mezinárodního srovnávacího výzkumu. V průběhu se k nám připojili kolegové zjedná půvabné země. Převzali většinu našich pracovních hypotéz, přidali několik svých, změnili několik operačních definic tam, kde by naše původní indikátory byly v jejich zemi neplatné, a pečlivě testovali validitu nových indikátorů. Připravili takřka perfektní výzkumný nástroj. Ale když přišla data na zpracování do Toronta, nevěřil jsem svým očím: Hledal jsem a hledal, ale nikde jsem nemohl najít údaj o pohlaví respondenta. Při přepisování dotazového archu vypadla rubrika pro záznam pohlaví. Nikdo si toho nevšiml, až bylo pozdě. U některých osob bylo možno pohlaví odhadnout. Uvedl-li respondent povolání „žena v domácnosti", pravděpodobně to nebyl muž. Ale ve většině případů museli tazatelé znovu do terénu. Nechtěl bych být v jejich kůži. Nemusí být právě příjemné zaklepat znovu na téměř tři sta dveří s pošetilou otázkou: Jste muž, nebo žena? A tak, máme-li smůlu, ani pracovní hypotézy nepomohou. 'i. Pracovní hypotézy obsahují základní informaci pro optimální rozhodnutí o technikách výzkumu Ovšem existence pracovních hypotéz, jak svědčí naše pravdivá pohádka č. 7, nemusí být automatickou pojistkou proti katastrofám tohoto typu. Tak jsme zase nazpátek u naší dětské nemoci „začněme s dotazníkem". Nejenže dotazník se v podmínkách postindustriální společnosti stává pomalu, ale jistě nepoužitelným monstrem, ale na samém začátku výzkumu nemáme prostě dostatek informací k rozhodnutí, kterou z dost bohaté pokladnice technik sběru informací vybrat. Teprve pracovní hypotézy nám umožni se optimálně rozhodnout. Tomuhle problému však věnujeme později celou kapitolu. Pracovní hypotézy, protože popisují strukturu spojení mezi proměnnými, ukáží nám, alespoň v hrubých obrysech, jaký typ statistických operací budeme potřebovat. I v tomto časovém stadiu výzkumu tak budeme schopni odhadnout, zda pro analýzu dat použijeme kalkulačku, osobní počítač, nebo zda budeme muset - je-li náš vzorek opravdu obrovský - bojovat o čas na střediskovém počítači. -i 86 87 4, Pracovní hypotézy jsou základem pro odhad rozsahu výzkumu Řešeni úkolů z kapitoly 4 Většinou teprve potom, když jsme připravili soubor pracovních hypotéz, jsme schopni alespoň přibližně odhadnout, jak náročný bude náš výzkum. Obvykle budeme překvapení; teprve proces formulace pracovních hypotéz nám ukáže, jak mnoho proměnných, a ještě více analyzovaných vztahů mezi nimi, potřebujeme pro řešení zdánlivě jednoduchého problému. Pracovní hypotézy jsou důležitým výchozím bodem pro časové, a tedy i finanční plánování výzkumu. A na závěr ještě jedno velice nevědecké, ale užitečné doporučení pro odhad času, který budeme potřebovat: udělejme nejdříve spíše pesimistický odhad, násobme odhadnutý čas třemi, a když všechno dobře půjde, snad tento nový termín splníme. Tenhle spíše prostoduchý recept se nám už často dobře osvědčil. Vidíme tedy, že ty nepříjemné pracovní hypotézy mohou být velice užitečné. Neměli bychom se jim vyhýbat. Alespoň ne ze začátku, alespoň ne po prvých deset dvacet let výzkumné praxe. Ale pak už je z toho návyk; dost zdravý a hlavně bezpečný. Cvičení 4.1 Bohužel tento mistr dedukce používal induktivní metodu. Snažil se najít vzorec, vysvětlení, které existuje ve fyzických stopách chování. Podívejte se pro potvrzení na kteroukoliv z Doyleových'povídek, ve které tento hrdina vystupuje, a pokud by vám tento důkaz nestačil, přečtěte si Skandál v Čechách, kde Holmes explicitně popisuje svoji gnozeologii. Ale s tím se v téhle knížce ještě setkáme. Cvičení 4.2 Některé z ukazatelů prostě neodpovídají naší politické kultuře a tradicím, nicméně jejich použití by nevyvolalo vážné zkreslení. Jen frekvence pozitivních odpovědí by byla nízká. Psaní dopisů veřejným činitelům, finanční příspěvky na politické účely jsou u nás mnohem řidší než v USA, kde byla tato stupnice vytvořena. Jedna z nej-bšžnějších forem amerického politického výrazu, „bumperstickers", a volební tabule umístěné na trávníku před rodinnými domky u nás téměř neexistují. Když však jsou takové indikátory použity beze změn ve srovnávacím výzkumu, vyvolají nebezpečné etnocentrické zkreslení. S jedním takovým případem se později seznámíme. 89 Kolik vran musíme pozorovat? populace vzorek hladina významnosti směrodatná chyba pravděpodobnostní výběr náhodný vzorek interval spolehlivosti jednoduchý náhodný výběr ^systematický výběr ; náhodný stratifikovaný výběr iýícestupňový výběr kvótní výběr anketa technika sněhové koule teoretická nasycenost vzorku zkreslení samovýběrera 91 Kapitola 5 Kolik vran musíme pozorovat? Když nevíš, co děláš, zeptej se někoho, kdo to ví. Jeny Paumelle, téměrv každám asie magazínu BYTE Tohle je opět kapitola o redukci informaci. Je to kapitola přece jen radostnějši než ty předchozí. Redukce populace na vzorek má dobře propracovanou teorii i dobře vypracované a spolehlivé recepty. Některé operace tu nejsou snadné, ale je mnoho lidí, kteří je znají a mohou nám poradit. Buďte tedy zadobře se statistiky. Touto kapitolou vstupujeme do spíše technické oblasti výzkumu. K tomu se nám může hodit dobrý pomocník. Dovolte, abych vám představil Dr. Watsona. Dr. Watson je svým způsobem chytrý muž na systemizovaném místě pitomce. Je to někdo, koho každý profesor touží mít ve třídě. Doktor Watson vždycky navrhne nějakou zdánlivě zřejmou, ale ve skutečností pitomoučkou odpověď, čímž umožní profesorovi nabídnout správnou odpověď, a tak se zaskviti svoji moudrostí a učenosti. Budeme služeb Dr. Watsona hodně používat. 5.1 Vzorek z nouze Začneme spíše stupidní otázkou: „Kolík vran musíme pozorovat, abychom mohli říci, 2«. všechny vrány jsou černé?" Odpověď je tak jednoduchá, že po ní nemusíme pátrat na konci kapitoly, a přirozeně zní: „Všechny!" Na druhé straně asi nikdo nikdy nepozoroval všechny vrány. Nezbývá nám nic jiného než se spokojit s tvrzením, že „většina vran je černých". Op< je to něco, co už známe: redukovaná analýza reality vede k tvrzením pravděpodobnostního charakteru. Skupiny, o které se v sociologickém výzkumu zajímáme, nejsou malé. V kvantitativní verzi výzkumu jsme schopni zkoumat celou skupinu jenom výjimečně. Pravidelně jedině sčítání lidu je studií celé populace. Většinou studujeme jen některé členy skupiny a doufáme, že naše závěry budou aplikovatelné i na ostatní, na ty nestudované. To nás přivádí k dvěma základním termínům, které potřebujeme pro tuhle kapitolu: populace a vzorek (výběrový soubor). Jejich definice je j ednoduchá: VZOREK: skupina jednotek, které skutečně pozorujeme POPULACE: (neboli základní soubor) je soubor jednotek, o kterém předpokládáme, že jsou pro něj naše závěry plamě Náš stěžejní úkol je najít postup, aby výsledky, které získáme na vzorku, byly co nejvíce podobné těm, které bychom získali na celé populaci. První věc, která nám přijde na mysl, je snažit se mít vzorek co největší. Ale naše následující pravdivá pohádka nám ukáže, že to není jen tak: Pohádka pro odrostlejší děti 8 O hodně velkém vzorku aneb Jak to nevyšlo Byl jednou v Americe velice rozšířený týdeník, který se jmenoval Literary Digest. Byl u svých čtenářů hodně oblíben. Byl proslulý také tím, že spolehlivě předpovídal výsledky prezidentských voleb. Jeho předpovědi byly založeny na obrovském vzorku dvou milionů voličů. (Dnes jsou podobné předpovědi založeny na v2orku tisíckrát menším.) Vzorek byl zkonstruován z mnoha zdrojů. Literary Digest si opatřil adresy voličů z celých USA. Používal pro to zdroje jako telefonní seznamy, městské adresáře, adresy držitelů řidičských průkazů, členské seznamy organizací, seznamy předplatitelů novin a časopisů atd. Předpovědi byly přesné a úspěšné ve volbách 1920, 1924, 1928, 1932. A pak přišly volby v roce 1936. Literary Digest předpověděl, že prezidentský kandidát Landon porazí Roosevelta rozdílem 14 %. Přišel volební den a s ním i konec slávy Literary Digestu: Frankiin Delano Roosevelt zvítězil drtivou většinou. 92 93 Cvičení 5.1 Reprezentoval vzorek použitý Literary Digestem dobre celou populaci voličů v USA? pohlaví, věku, vzdělání, povolání atd. Lze si snadno představit problém, pro který jsou důležitější jiné vlastnosti, takové, o kterých běžná statistická šetření údaje neshromažďují (kupř. věk, ve kterém se respondent poprvé zamiloval). Na daíší problém snadno přijdete sami: To nebylo tak těžké, že? Trochu složitější je otázka, jak je možné, že vzorek, který prakticky vyloučil z výzkumu voliče náležející k nižším sociálním třídám, fungoval dobře v předchozích volbách? Klíčem k řešení je rok: v roce 1935 vrcholila v USA hospodářská krize, a to vedlo k ostré polarizaci podle vertikální stratifikační osy. Předtím sociálně-ekonomický status nehrál příliš důležitou roli v otázce volebních preferencí. Daleko větší úlohu hrály takové faktory jako náboženství, zeměpisná poloha atd. Krize to všechno změnila: sociální status začal hrát důležitou roli. Pravděpodobně nejdůležitější bylo to, že krize přivedla k volebním urnám příslušníky nižších sociálně-ekonomických vrstev, kteří předtím příliš často nehlasovali. Můžeme tedy říci, že v letech 1920-32 předpovědi Literary Digestu vyšly jenom náhodou. Abychom byli schopní z chování vzorku předpovídat chování populace, musí struktura vzorku imitovat složení populace tak přesně, jak je to jen možné. Cvičení 5.2 Navrhněte prosím kritéria pro konstrukci kvótního vzorku pro populaci veksláků. Kvótní výběr může být použit jen na populaci, o které jsme dobře informováni, a to zdaleka není každá populace. Další obtíž je spojena s praktickou stránkou výběru přímo v terénu. Poslední krok obvykle závisí na tazateli, který vybírá jedince podle dané instrukce. Taková instrukce by mohla vypadat třeba takto: Dr. Watson: Ale to je přece docela lehké! Když je v populaci řekněme 51 % žen, tak vyberu také 51 % žen do vzorku, a když je v populaci 12% osob nad 65 let věku, vyberu také stejné procento starých osob do vzorku atd. Tentokrát má Dr. Watson pravdu. Technika konstrukce vzorku, tak jak ji popsal, se opravdu používá. Říká se tomu kvótní výběr. Kvóíní výběr imituje ve struktuře vzorku známé vlastnosti populace. Bohužel má tato technika některé nepříjemné vlastnosti. Jedna z nich souvisí se slovem r.:.^£ „známé" v naší definici. Pro většinu populací není problém zjistit jejich skladbu podle Jméno tazatele: Dr. Watson Respondent č. 1 muž, věk 3CM0, dokončené středoškolské vzdělání, povoláním úředník, ženatý, ale bezdětný, bydlící v rodinném domku, žijící v našem městě alespoň 5 let, ale který se narodil v obci pod pět set obyvatel... Respondent č. 2 žena, věk 60-65, alespoň s dokončeným základním vzděláním, důchodkyně, která, pokud byla ještě ekonomicky aktivní, měla dělnické povolání, která žije sama, v bytě alespoň o dvou místnostech a bydlí od narození v našem městě... Ták to si od nás Dr. Watson opravdu nezaslouží. Umíte si představit, na kolik dveří by musel zaklepat, než by našel osoby odpovídající zmíněným charakteristikám? Třeba by je itienašel vůbec, možná že vůbec neexistují. Ve skutečnosti je instrukce v kvótním výběru mnohem skromnější. Navrhuje jen několik málo proměnných, takových jako pohlaví, věk a povoláni. Lokalita a typ obce jsou obvykle dány působištěm tazatele. Jinak nejsou tyto proměnné vázány do určitých kombinací. Instrukce by mohla znít takto: „Hovořte s deseti osobami, z toho se šesti ženami a čtyřmi muži. Vyberte tři osoby ve věku pod 20 let, pět ve věku 21-50." O ostatních, pro nás třeba daleko důležitějších proměnných můžeme jenom doufat, že budou ve vzorku dostatečně správně reprezentovány. S rostoucí velikosří vzorku se rozdíl mezi strukturou populace a vzorku zmenšuje. Dr. Waíson: Co si s tím ale počneme? Nejdříve rychle, pak pomaleji a pomaleji. Úplné shody mezi strukturou populace dosáhneme teprve tehdy, když jsme zahrnuli všechny elementy populace do vzorku. Odpověď nám nabízí titul následujícího paragrafu. 5.2 Hodíme si korunou aneb Pravděpodobnost pro Dr. Watsona Dr. Waison: „Ale to je všechno nesmysl! Když je to pravda, jak je potom možné, ze obrovský vzorek použitý LUerary Digestem vedl k tak nesprávným výsledkům? " Představme si, že máme velikou krabici plnou kuliček a že všechny kuličky jsou zelené. Dobře krabicí zatřepeme a poslepu vybereme jednu kuličku. Jakou máme šanci, že vybraná kulička bude zeíená? To byla ale pitomá otázka, že ano? Tak si teď zkusme něco trochu složitějšího: Máme teď jinou populaci kuliček, sestávající ze zelených a červených kuliček. Těch zelených je 80 % a těch červených je ovšem 20 %. Ale počkejte, já se vás nebudu ptát, jaká je pravděpodobnost, že si náhodně vyberete červenou kuličku. To by byla otázka jen o máio méně pitomá než ta první, a všichni víme, že ta pravděpodobnost je 20 %, a chceme-li to vyjádřit učeněji, můžeme říci, že p = 0,20. My tu máme jiný úkol: zjistit, jaká je skladba populace, aniž bychom prohlíželi všechny kuiičky. Jinými slovy, hledáme metodu, jak vytvořit vzorek, který by dobře reprezentoval celou populaci kuliček. Můžeme zkusit třeba toto: Opět začneme tím, že krabicí dobře zatřeseme. To není vtip, to je opravdu nutné: každá kulička musí mít stejnou pravdě- ' \ podobnost, že bude vybrána. (Co kdyby všechny červené kuličky byly navrchu?) A teď vybereme poslepu 10 kuliček. Uvidíme třeba, že jsme vybraíi 6 červených a 4 zelené. To je dost daleko od dobré reprezentativity. Perfektní vzorek by měl přece obsahovat 20 % červených a 80 % zelených. Tedy vybereme opět poslepu dalších deset kuliček. Třeba 6 z nich bude zelených a 4 červené. Přidáme je k našemu původnímu vzorku. Nový, větši vzorek sestává z 10 červených a 10 zelených kuliček. Teď bychom odhadli, že v populaci je stejné procento červených jako zelených kuliček. To ještě není vůbec dobré. Museli bychom tedy pokračovat, přidávat další a další kuličky. Brzy bychom zpozorovali zajímavou věc: 96 -IfllB Asi už víte, co bychom mohli odpovědět na tuhle námitku: „Ale to je přece elementární, Watsone. Ti lidé z Literary Digestu zapomněti pořádné zatřást krabicí." Voliči z nižších socioekonomických vrstev měii mnohem menší šanci být vybráni do vzorku než voliči ze středních a vyšších vrstev, což dramaticky zkreslilo výsledky. My jsme tu totiž, aniž bychom o tom věděli, vytvořili náhodný vzorek „populace" kuliček. A náhodný vzorek, to je aristokrat mezi vzorky; má mnoho jedinečných a pro nás důležitých vlastností. Všechno, co budeme v tomto odstavci probírat, se týká jenom vzorků, které byly vytvořeny opravdu náhodným výběrem. Termín „náhodný" neznamená výběr nazdařbůh. I když náhodný výběr může být, jak brzy uvidíme, technicky velmi obtížný a často i nemožný, jeho definice je jednoduchá: Náhodný (pravděpodobnostní) výběr je takový výběr, ve kterém každý element populace má stejnou pravděpodobnost, že bude vybrán do vzorku. To se lépe řekne, než se to udělá. Ale dovolte, abych vás ještě dříve, než budeme mluvit o řadě trampot, dobře naladil popisem pozoruhodných vlastností náhodného vzorku. Snad 97 nej důležitější z nich, alespoň pro nás sociology - statistik by s námi možná nesouhlasil -, je tato vlastnost: Náhodný vzorek reprezentuje všechny známé i neznámé vlastnosti populace. Aještě dříve, než Dr. Watson začne namítat, uveďme si jednoduchý přiklad. Máme teď novou -i populaci kuliček. Jsou opět červené a zelené. Ale mají ještě jednu zajímavou vlastnost, o které my nevíme: Jsou duté a uvnitř každé je malý papírek a na každém tom lístku je něco napsáno, {Znáte „fortuně cookies" z čínských restaurací?) Třeba nějaké neslušné slovo. Když jsme vybrali dobrý náhodný vzorek kuliček, budou reprezentovat celou populaci kuliček nejen vzhledem k distribuci barev, ale i vzhledem k distribuci neslušných slov, i když o tom nevíme a třeba nikdy nebudeme vědět. Uveďme si jiný, užitečnější příklad. V náhodném vzorku obyvatelstva hlavního města Prahy budeme mít slušnou reprezentaci populace vzhledem k věku, pohlaví, vzdělání, povolání, politické orientaci, vzhledem ke všem postojům, ale i reprezentací i třeba vzhledem k oblíbeným jídlům, počtu zubních kazů, věku, kdy se lidé poprvé zamilovali, množství vypitého piva, počtu milenek, počtu veksláků, peněžní hodnotě nakradeného zboží, číslům bot, prostě vzhledem ke všemu, To neznamená, že tohle všechno budeme schopni měřit, J to je jiný problém. Ale znamená to, že ať už je naším cílem cokoli, víme, že promčnné, které \ jsou pro nás relevantní, budou mít v našem vzorku podobnou distribuci, jaká existuje v celé populaci, a naše závěry jsou tedy na tuto populaci aplikovatelné. I- Náhodný výběr má j eště j ednu pozoruhodnou vlastnost: f | U náhodného vzorku jsme schopni odhadnout, jak se vzorek liší od populace. Jinými slovy, jsme schopni určit, jak dobrý je náš vzorek. Teď je načase naučit se několik slov ' ■■" z odborné hantýrky, jednak abychom mohli oslnit přátele, jednak abychom rozuměli správně významu publikovaných statistických dat. Podívejme se na následující tabulku: " ■ Tabulka 5.1 Velikost vzorku a konfidenční interval na 95% hladině významnosti pro alternativní znaky při distribuci 50:50 Velikost vzorku Konfidenční interval 100 ±10% 400 ' ±5 % 1600 ±2,5 % Adaptováno z Babbie, Social Research for Consumer, 1982 To vypadá dost učeně, že? Ale nebojte se. Pochopit princip a vědět, jak se taková věc aplikuje, není těžké. Trochu obtížnějši je statistické zdůvodnění. Ale takové vysvětlení necháme pro někoho jiného, kdo vás uvede do zajímavého světa skutečné statistiky. Řekněme, že jsme vybrali náhodně 400 kuliček a zjistili jsme, že ve vzorku (neboli ve výběrovém souboru) je 78 % zelených kuliček. Protože jsme nevybrali všechny kuličky, musíme předpokládat, že jsme se dopustili určité chyby, že pozorovaná relativní četnost zelených kuliček ve vzorku se liší od procenta, které skutečně existuje v celé populaci (základním souboru). My však potřebujeme vědět, jak moc se mýlíme. A v tom nám pomůže ta nepřátelsky vyhlížející tabulka. Pozor! Tahle tabulka je jen ilustrací a platí jen tehdy, je-li v populaci právě tolik zelených jako červených kuliček. Platí jen pro alternativní (binomické) proměnné, to je pro takové znaky, které mají jen dvě kategorie, jako ANO a NE. V našem případě zelená a „nezelená" kulička. .Velikost našeho vzorkuje 400 a této velikosti vzorku odpovídá konfidenční interval (interval . spolehlivosti) 5 %. Odečteme tedy tuto hodnotu od pozorovaných 78 % a dostaneme tedy 73 %. Pak ji opět přičteme k pozorované hodnotě a dostaneme horní mez. A teď víme, že skutečná ; proporce zelených kuliček v celé populaci je mezi 73 a 83 %. Jenomže to nevime docela určitě, vždyť jsme nepozorovali všechny kuličky. Teď se dostáváme k tomu poněkud kryptickému výrazu v podtitulu naší tabulky: hladina významnosti. 98 99 V našem případě to znamená, že skutečná proporce, která existuje v populaci, se nalézá s 95% pravděpodobností uvnitř vypočítaného intervalu spolehlivosti. Kdybychom vytvořili 100 vzorků obdobné velikosti, jen v 5 vzorcích by bylo možné, že skutečná proporce zelených kuliček leží pod nebo nad vypočítaným konfidenčmm intervalem. O tom, jakou hladinu zvolit, rozhodne výzkumník, a podle tohoto rozhodnutí je interval vypočítáván. Toto rozhodnutí je svobodné ovšem jen z hlediska statistické teorie; ve skutečnosti je vázán míněním přijatým v příslušné vědecké komunitě. V sociologii je to obvykle 95 nebo 98 %. (Vidíte, i v sociologii máme malý kousek paradigmatu.) A teď se podívejme, jak by se takový interval mohl vypočítat. Není to tak, jak se to opravdu dělá. Ve skutečnosti neznáme distribuci proměnné, která existuje v populaci. Ale náš popis výpočtu nám dá alespoň nějaký vhled do logiky, která je skryta za pozoruhodnými vlastnostmi náhodného výběru. Protože jsem vám slíbil, že v naší knize nebudou (skoro) žádné vzorečky, popíšeme si výpočet slovně. Nejdříve musíme vypočítat veličinu, která má opravdu zajímavé vlastnosti a které se říká směrodatná chyba. Uvidíte, že je to nejen snadné vypočítat, ale také že není těžké rozumět většině kroků v tomto výpočtu. Vypočet směrodatné chyby: Vypočítaný násobek vydělíme velikostí vzorku. Čím větší vzorek, tím menší je směrodatná chyba a tím užší bude konfidenční interval. V případě, že by v populaci byla stejná proporce zelených a Červených kuliček, ve vzorku 100 pozorování by interval byl ±10 %; ve vzorku 400 pozorování by byl mnohem užší: ±5 % a ve vzorku 1000: ±3%. Nakonec vypočítáme druhou odmocninu z výsledku dělení. To je transformace do čísla zajímavých vlastností. Ti, kdo jsou trošku seznámeni se statistikou, vidí už teď souvislost s konceptem směrodatné odchylky. My ostatní to pochopíme trochu lépe, až budeme mluvit o směrodatné odchylce v naší statistické kapitole. A teď nám už zbývá jen jedno. Rozhodnout se, jakou hladinu významnosti chceme přijmout, a pak vypočítat interval spolehlivosti. CO UDĚLÁME Nejdříve vynásobíme proporci zelených kuliček v populaci proporcí červených. Tato proporce musí být vyjádřena jako desetinný vzorek, ne v procentech. (Tedy kdyby v populaci bylo 50 % červených a 50 % zelených, budeme počítat 0.5kráť 0.5.) CO TO ZNAMENÁ Homogenita vzorku má vliv na veíikost chyby. Čím nerovnoměrnější je distribuce ve vzorku, tím menší bude chyba a tím užší bude interval spolehlivosti. Kdyby například v populaci bylo 90 % zelených kuliček a velikost vzorku by byla 100, vypočítaný konfidenční interval by byl ±6 %. Kdyby ve stejně velkém vzorku byl stejný počet zelených jako červených kuliček, konfidenční interval by by! mnohem širší: ±10 %. 100 Směrodatná chyba má jednu pozoruhodnou vlastnost: do intervalu vymezeného ±1 standardní chybou od hodnoty pozorované ve vzorku připadne správná hodnota existující v populací přibližně v 68 případech ze sta. Tak bychom dostali interval spolehlivosti na 68% hladině významnosti. To ovšem není zdaleka dost vysoká pravděpodobnost. Abychom vypočítali interval spolehlivosti na úrovni, jaká je vyžadována v našem oboru, musíme přičíst a odečíst směrodatnou chybu dvakrát. Jinými slovy: interval spolehlivosti na 95% hladině významnosti je dán rozmezím ±2 směrodatné chyby od hodnoty naměřené ve vzorku. Rozmezí ±3 směrodatné chyby nám definuje ještě mnohem striktnější interval na hladi-ně 99.9 %. Ten je užíván zejména v přírodních vědách. A teď už víme dost, abychom mohli představit další, opravdu překvapivou vlastnost náhodného výběru: Velikost směrodatné chyby, a tedy i konfidenční interval (interval spolehlivosti) nezávisí vůbec na velikosti populace. 101 Jedině velikost vzorku a jeho homogenity ovlivňují velikost chyby. Dr. Watson: Počkejte, počkejte! Chcete mi namluvit, že řekněme vzorek 300 respondentů vykáže stejnou chybu, když reprezentuje populaci továrny s 800 dělníků, jako stejně velký vzorek, který reprezentuje město s 50 000 obyvatel, nebo dokonce zemi s 200 000 000 občanů? Já lomu prostě nevěřím! Neuvěřitelné, a přece je to pravda, pokud ovšem distribuce zkoumané proměnné je ve všech těch populacích stejně homogenní. A pokud mi ještě nevěříte, podívejte se znovu na popis výpočtu směrodatné chyby. Najdete tam zmíněnou proporcí zelených a červených kuliček, velikost vzorku a to je vše. Ani zmínka o populaci. To, co víme, by nám mohlo dát dostatečnou informaci, abychom mohli navrhnout velikost vzorku, jakou potřebujeme vzhledem k velikosti chyby, jakou jsme ochotni riskovat. V praxi to však není snadné: pro výpočet směrodatné chyby potřebujeme znát homogenitu populace vzhledem k našim proměnným, rozptyl těchto proměnných. Většinou tuto znalost nemáme. Existují sice techniky, které nám umožní tuto informaci odhadnout, ale tyto techniky jsou buďto nákladné, nebo nepřesné. co největší vzorek, jaký nám naše časové a finanční podmínky dovolují; ne však za cenu vážného narušení pravidel náhodného výběru. Doba pro aplikaci naší znalosti o intervalech spolehlivosti přichází v praxi teprve v etapě statistické analýzy sebraných dat. Pak je to ovšem velice důležité. A teď ještě jedno důležité varování: Velikost směrodatné chyby se týká jen zkreslení vyvolaného rozdíly mezi vzorkem a populací. Nevztahuje se, bohužel, na zkreslení vyvolané jinými typy redukce a transformace informací. Tato zkreslení jsou pro nás většinou mnohem nebezpečnější a my nemáme žádný nástroj, jak měřit velikost těchto omylů. 5.3 Jak správně házet korunou Dr. Watson: Já už vidím, že náhodný výběr je výborný. Hned to začnu používat. Vždycky jsem chtěl vědět, co si lidé v Praze mysli o moji politické straně. Hned začnu pracovat na hypotézách a otázkách pro rozhovor. Od pondělí budu každé dopoledne na Václaváku a budu se vyptávat náhodně vybrané osoby... A tak v tvrdé praxi denního života výzkumníka spoléháme na zkušenost a na zdravý rozum. Můžeme se třeba zamyslit nad tím, které kombinace proměnných jsou pro nás nejdůležitější. Představíme si, kolik poií bude mít tabulka (nebo tabulky), a navrhneme, kolik pozorování musí každé pole v těchto tabulkách obsahovat - prázdná pole nebo pole s málo pozorováními mohou podstatně zkreslit výsledky statistické analýzy. Zaměřme se raději na dost vysoké minimum; někdy navrhovaný průměr 10 pozorování na jedno pole tabulek může být nezdravě optimistický. Data ve skutečnosti nebudou do všech polí rozdělena rovnoměrně; některá pole budou přeplněna a jiná téměř prázdná. Nadto v každém výzkumu máme mnoho: ■ proměnných, s různým počtem kategorií, někdy nevíme předem, které kombinace proměnných přinesou nějaké zajímavé výsledky, a tak si zaslouží hlubší analýzy atd. Zkrátka teoretizovaní o velikosti vzorku patří spíše na stránky učebnic než do praxe sociologického výzkumu. 'I im aplikujeme následující, velice nevědecké, ale velice praktické pravidla: Snažme se vytvořit Pokud náš pošetilý přítel doufá, že jeho výsledky budou reprezentovat mínění pražské populace, je ještě mnohem pošetilejší, než jsme si mysleli. Víme přece, že při náhodném výběru každý člen populace musí mít stejnou pravděpodobnost, že bude vybrán. Watsonúv vzorek by byl silně zkreslený. Cvičení 5.3 Navrhněte prosím, jak by se Watsonúv vzorek lišil od pražské populace. Tedy jasně vidíme, že tento vzorek by snad mohl být reprezentativní pro populaci definovanou asi takto: osoby, které se nacházejí na Václaváku ve. všední den dopoledne, v dané nlíni době. Pro nějaké speciální účely by mohla být taková populace zajímavá: kupř. pro 102 103 plánovaní obchodních strategií pro obchody na Václaváku, rozhodně však ne pro problémy spojené s politickou orientací obyvatel. Ale i tak by byla náhodnost, a tedy i reprezentativnost takového výběru problematická. Dr. Watson, protože je v podstatě konzervativní, by se mohl ostýchat oslovit méně konvenčně oblečené osoby. Kdyby takový výběr prováděl můj syn, půvabné mladé ženy by byly ve vzorku přereprezentovány. Kdybych prováděl výběr já, pak by byly podreprezentovány, protože jsem stydlivý. Ono se vůbec zdá, že lidská mysl není schopna pracovat opravdu náhodně. Můžeme si to dost snadno vyzkoušet. Požádejte větší skupinu lidí - třeba třídu studentů -, aby každý napsal na kousek papíru jakékoliv číslo mezi 1 a 10. Bez dlouhého přemýšlení musí napsat to, co jim přijde na mysl. Je-ii skupina dost velká, je vysoká pravděpodobnost, že číslo 7 bude mít daleko nejvyšší frekvenci. Proč, to nevím, a předem můžete zavrhnout teorii vlivu sedmy v naší mariášnické kultuře; v Kanadě to funguje také, a jak! Snad to má něco dělat s tradiční mystikou čísel, ale v každém případě to krásně dokumentuje, že náš mozek je velice špatným generátorem náhodnosti. Musíme jej nahradit něčím neosobním. Hodit si koranou? Zatřepat krabicí? Pomůcky, které v praxi při výběni náhodného vzorku používáme, skutečně imitují takové mechanismy. Mohli bychom třeba napsat jména všech členů populace na papírky, dát do klobouku, kloboukem pořádně zatřepat a pak poslepu vytáhnout tolik papírků, kolik osob potřebujeme do vzorku. Ovšem většinou by to musel být pěkně velký klobouk a v každém případě je to dost nepohodlný postup. Můžeme jej však dobře imitovat. Prostě jednotlivce v seznamu populace očíslujeme a pak použijeme „něco", co produkuje náhodná čísla, a vybíráme ty jedince, jejichž číslo se s těmi náhodnými shoduje. Řiká se tomu prostý náhodný výběr Jednoduchá však v tom není generace těch náhodných čísel. Kdysi se k tomu užívala taková podivná „kostka", nmohohran s deseti stejnými plochami, na každé z nich byla jedna z číslic . od 0 do 9. Prý bylo obtížné vyrobit takovou „kostku", aby byla „poctivá", to je, aby každá číslice měla stejnou pravděpodobnost, že „padne". Ještě donedávna jsme používali tabulky : náhodných čísel, dost tlusté knihy číselných skupin, o nichž nám matematici řekli, že v nich za takových a takových okolností nebyli schopni objevit žádnou pravidelnost. Dodnes jsou výtahy z těchto tabulek přetiskovány téměř v každé učebnici výzkumných metod. Jejich správné používání rozhodně není nej zábavnější kratochvíle, ale někdy nám prostě nezbude nic jiného. Naštěstí dnes každá lepší kalkulačka a ovšem každý, i nejmenší osobní počítač umí produkovat náhodná (matematik by řekl „kvazináhodná") čísla. Tenhle přístup má velikou výhodu: program produkuje náhodná čísla jenom v tom rozsahu, v jakém je potřebujeme. Řekneme počítači, jak je velká populace, třeba 300, a program pro nás vyprodukuje náhodná čísla jenom v rozsahu od 1 do 300. Tabulky náhodných čísel jsou nejméně pěticiferné. Pro naši velikost populace použijeme ovšem jen první nebo poslední tři sloupce číslic, ale i tak sedm z deseti nalezených nebudeme s to použít. Kalkulačka nebo počítač jsou mnohem efektivnější, a když si s tím nevíte rady, obraťte se na sousedova syna, a pokud by neměl takový program, většina těch chytrých holek a kluků, kteří vlastní třeba i ten nejmenší Sinclair, je schopna napsat takový program v Basicu za několik minut. Dr. Watson: Ale já nemám kalkulačku a všichni sousedi jsou bezdětní. Tak bych si to chtěl zjednodušit. Populace má 500 členů a já chci vzorek ve velikosti 100. Proč bych nemohl vzít jednoduše každou pátou osobu ze seznamu? Tentokrát Dr. Watson promluvil pro změnu moudře. Technika, kterou navrhl, se opravdu používá. Říká sejí systematický výběr. Nenechte se však zmást tím názvem; je to opět technika náhodného výběru. Systematický výběr V systematickém výběru je do vzorku zahrnuta každá N-tá jednotka ze seznamu. Velikost kroku (N) dostaneme, když vydělíme velikost populace velikostí požadovaného vzorku. Důležité však je, aby první jedinec by! vybrán náhodně a teprve od tohoto výchozího bodu budeme vybírat každou N-tou jednotku. 104 105 Tento postup však nemůžeme použít, když jsou seznamy řazeny podle nějakého systematického schématu. Naše pohádka ilustruje něco, co se v praxi opravdu stává. Pohádka pro odrostlejší děti 9 0 výběru, který byl příliš systematický Bylo, nebylo, kdesi existovalo malé království, které se jmenovalo Org. Bylo to království, kde všechno bylo velice dobře zorganizováno, a přesto byl každý šťastný a spokojený. Každý, až na vojáky základní služby. Ti si stěžovali na plat, na stravu, na zacházení od představených, na všechno, a protože vše bylo dobře zorganizováno, vláda pozvala zahraničního odborníka, profesora P. I. Tomu, aby provedl výzkum postojů v armádě. P. I. Torna přijel, zkonstruoval výborný dotazník a vyzkoušel jeho validitu. Protože to království bylo tak malé, že se tam ani počítač nevešel a místní knihovny neměly tabulku náhodných čísel, rozhodl se použít pro konstrukci vzorku techniku systematického výběru. Armáda toho malého království byla taky malá, důstojníci, poddůstojníci i mužstvo dohromady jen 12 000 osoh. Profesor P. I. Toma odhadl, že vzorek 200 osob mu poskytne přijatelný interval spolehlivosti a zvolil tedy krok 60. Náhodně vybral prvého jedince. Byla to osoba č. 31 a pak vybíral každého dalšího šedesátého vojáka. Výsledky výzkumu byly prostě náramné. Ještě nikdo nikde nezkoumal tak spokojenou armádu. Každý byl šťastný v tom malém šťastném království - až do příštího jara, kdy začalo krvavé povstání vojáků základní síužby. Ale vy už víte. co se stalo: Prostě v království Org bylo vše dobře organizováno. I seznamy členů armády byly uspořádány po četách, v každé četě nejdříve dva důstojníci, pak tři poddůstojníci, pak mužstvo základní služby a každá četa měla ne více, ne méně než 30 osob. 1 náš profesor měl smůlu, protože zvolený krok se shodoval přesně nejen s dvojnásobkem velikosti čety, ale také proto, že první náhodně vybraná osoba byl důstojník a tedy každá následující osoba musela být také důstojník. Poddůstojníci a vojáci základní služby nebyli zahrnuti do vzorku vůbec. Nemysleme si, že takové zkreslení patří jen do absurdního světa pošetilých pohádek. Mnohé ze seznamů populací jsou systematicky uspořádány, kupř. žáci škol podle tříd, dělníci podle dílen atd. Někdy systém, podle kterého je seznam organizován, nemusí být na prvý pohled zřejmý; Kupř. byty na sídlištích ve velkých obytných budovách bývají identifikovány třícifemými čísly. Prvá číslice definuje podlaží, druhé dvě byt na podlaží. Protože půdorys se na každém podlaží opakuje, byty se stejnými posledními číslicemi budou mít obdobné vlastností, budou třeba větší či menší než byty ostatní, a to by opět při systematickém výběru mohlo produkovat zkreslení. Podívejme se teď na jiný typ náhodného výběru, který by býval mohl zachránit profesora '; P. 1. Tomu před zmíněnou blamáží: Náhodný stratifikovaný výběr: Populace je rozdělena do skupin homogenních vzhledem k nějakému jasnému kritériu a jedinci jsou vybíráni do vzorku náhodně z těchto skupin. Profesor Toma měl začít s třemi seznamy; se seznamem populace důstojníků, s jiným, zahrnujícím jen poddůstojníky, a konečně se seznamem vojáků základní služby. Z každé populace by pak byl vybrán náhodný vzorek, třeba technikou systematického výběru, a v našem malém království by k povstání třeba nedošlo. Ve skutečném světě, například při výzkumu studentů určité školy, bychom vybírali jedince zvlášť pro každý ročník. Při jiných výzkumech by populace mohla být stratifikována podle volebních obvodů, při výzkumu zaměstnanců továrny by mohl být výběr prováděn zvlášť mezi dělníky a zvlášť pro administrativu. Stratifikovaný náhodný výběr má ještě jednu dodatečnou výhodu; snižuje velikost směrodatné chyby, a tedy i interval spolehlivosti. Třeba si ještě pamatujete, že chyba klesá s rostoucí velikostí vzorku a s přirůstající homogennosti populace. Logika toho je zřejmá: když v populaci je pro kandidáta A 98 % voličů a pro kandidáta B jen 2 %, předpovědět, kdo vyhraje volby, je mnohem snadnější, než kdyby preference bylo třeba 55 % pro A a 45 % pro B. Ve stratifikova-ném výběru jsou vzorky podskupin zcela homogenní vzhledem k proměnné, podle které byly stratifikovaný: ve skupině jsou jenom vojáci základní služby nebo jenom posluchači druhého ročníku atd. Pro stratiflkační proměnnou je tedy směrodatná chyba nulová a pro všechny jiné proměnné, které jsou s touto proměnnou asociovány, bude tato chyba podstatně menší. A teď se podíváme na velmi zvláštní typ výběru, na vícestupňový náhodný výběr. Je to technika velice pracná, náročná a drahá, ale, jak hned uvidíme, velice důležitá a nenahraditelná. Vícestupňový náhodný výběr se provádí ve dvou nebo více krocích. Nejdříve jsou náhodně vybrána určitá přirozená seskupení, a pak teprve jsou náhodně vybíráni jedinci z oněch vybraných o seskupení. K čemu je to dobré? Pro ilustraci jednoho aspektu vás pozvu na výlet na jiný kontinent. Predstavte si, že bychom měli dělat výzkum na náhodném vzorku reprezentujícím dospělé obyvatelstvo Kanady. Kanada má něco přes dvacet milionů obyvatel, ale její plocha je téměř 106 107 10 000 000 čtverečných kilometrů. Řekněme že velikost vzorku by byla 1000 jedinců, a tak bychom teoreticky měli jednoho respondenta na deset tisíc čtverečných kilometrů. Ve skutečnosti by to bylo mnohem méně, obrovské rozlohy země jsou prázdné. Ale i tak jsou rozměry země obrovské a takové by byly i náklady. Při dané velikosti vzorku bychom měli nejmenší potíže s nej lidnatějšími provinciemi. V Quebeku bychom měli asi 290 respondentů, v Ontariu přibližně 350. Ale v Northwest Territories jednoho nebo dva a ti by nás přišli pěkně draho. Pokud bychom neměli velké štěstí, museli bychom, abychom je zastihli, najmout hydroplán, helikoptéru nebo psí spřežení. Ale i v nejlidnatějších provinciích anebo i v prostorově malé zemi s tak vysokou hustotou obyvatelstva, jako mělo Československo, rozptyl populace v prostoru podstatně zvyšuje náklady a nesmírně ztěžuje organizaci výzkumů. (Kupř. tazatelské týmy jsou organizovány a školeny lokálně; to snižuje cestovní náklady. Ale je jen omezený počet terénních center, která jsme schopni organizovat a financovat.) Tady je právě oblast uplatnění vícestupňového náhodného výběru. Můžeme postupovat třeba takto: 1. Nejdříve vybereme náhodně reprezentativní soubor okresů. 2. Pak v každém z vybraných okresů provedeme náhodný výběr obcí. 3. Ve velkých vybraných obcích zařadíme ještě další mezistupeň výběru: vybereme náhodně menší prostorové jednotky, třeba volební obvody. 4. Teprve pak vybíráme jedince. Tímto způsobem obdržíme mnohem kompaktnější vzorek. Respondenti nejsou rozptýleni po celém teritoriu, ale jsou koncentrováni do zvládnutelného počtu regionů. Je-li takový výběr proveden správně, žádné závažné zkreslení reprezentativnosti nehrozí. Nicméně existuje ještě jedna, dokonce důležitější doména použití tohoto výběru. Největším-problémem pro použití pravděpodobnostního výběru v sociologii je fakt, že pro mnoho zajímavých populací žádný seznam neexistuje. Pro mnoho těchto situací je vícestupňový náhodný výběr jediným řešením. Řekněme, že bychom chtěli vytvořit pravděpodobnostní vzorek celé země, a žádné spolehlivé seznamy obyvatelstva buď neexistují, nebo nejsou výzkumníkovi dostupné. To je mimochodem situace ve většině zemí světa. Postup by byl shodný v prvých třech krocích s předchozí tabulkou, ale pak by následovaly dva další, logicky jednoduché, ale pracovně náročné kroky: 4. Ve vybraných malých obcích nebo městských obvodech je proveden soupis všech sídelních jednotek (bytů, rodinných domků). 5. Pak je vytvořen náhodný vzorek těchto jednotek. 6. Je vytvořen seznam osob žijících ve vybraných jednotkách a pak jsou opět náhodně vybráni jedinci {nebo obvykle jedinec) do vzorku. Nejnáročnější je ovšem krok č. 4. Představuje obsáhlou práci jak v přípravě, tak j v terénu; záznamy se obvykle opožďují za skutečností, nemusí rozlišovat mezi jednotkami, které jsou obydleny, a těmi, které jsou používány pro jiné účely atd. Poslední krok je obvykle prováděn tazatelem přímo v terénu. Náhodnost musí být zaručena i při tomto kroku. Záznamový arch pro interview obsahuje instrukci, v jakém pořadí mají být členové domácnosti zaznamenáváni, a náhodně generované pořadové číslo osoby, která má být interviewována. Bez takové instrukce by tazatel vybral osobu, která je právě dosažitelná, aby se tak vyhnul numosti další návštěvy, nebo osobu, která je mu sympatická. Tak by byly kupř. podreprezentovány osoby, které během dne pracují mimo dům. Někdy aplikace vícestupňového výběru nemusí být obtížná a je přitom velice užitečná. Chtěli bychom třeba studovat na celostátním vzorku minění studentů dvou nejvyšších ročníků střední školy. Ústřední seznam středoškolských studentů asi neexistuje, ale existuje seznam všech Středních škol a každá škola má seznam žáků, sestavený pravděpodobně podle ročníků. Výběr by mohl být prováděn třeba takto: Náhodně by byly vybrány okresy, pak vzorek škol v těchto . okresech a jedinci do vzorku by byli náhodně vybráni ze seznamu žáků posledních dvou ročníků. Před časem jsme zkoumali postoje starších osob k možnosti vstoupit do institucí pro staré ■občany (Disman & Disman 1989). Naším cílem bylo sledovat vliv etnické kultury na tyto postoje; porovnávali jsme postoje Portugalců a Italů žijících v Torontu, ve věku 65 nebo .starších, s postoji stejně starých Kanaďanů, jejichž mateřským jazykem je angličtina. Vytvoření vzorku nebylo snadné. Osoby starší než 65 let představují II % torontské populace, -Z.tôchto starších osob je jen 5 % Italů a l % Portugalců. (To znamená, že Portugalci ve věku 65 a více představují asi 0.11 % z torontské populace.) Kdybychom tedy chtěli interviewovat 108 100 Italů a 100 Portugalců, museli bychom kontaktovat asi 100 000 domácností, a to je ovšem nemožné přinejmenším z finančních důvodů. Naštěstí jsme měli k dispozici seznamy osob pro daňové účely a tyto seznamy zahrnují prakticky všechny dospělé občany. Nadto tyto seznamy zahrnovaly také informaci o věku. Tato informace podstatně zúžila velikost vzorku pro vyhledávací fázi výzkumu. Ale í tak, abychom vyhledali vzorek 100 portugalských respondentů, museli bychom kontaktovat asi 10 000 domácnosti a i to by bylo nemožné. Zůstala pro nás tedy otevřena jediná možnost: kontaktovat osoby ze seznamu, jejichž jména znějí italsky nebo portugalsky. Jistě, tato metoda má některé nevýhody. Kupř. portugalské jméno může mít britská manželka portugalského manžela, ale tyto případy byly vyloučeny, v předběžném rozhovoru. Do vzorku nebyly zahrnuty osoby s etnicky netypickými jmény, i italské nebo portugalské manželky mužů jiného etnického původu atd. Nicméně toto zkreslení . - zejména vzhledem k silné tendenci obou národnostních skupin uzavírat sňatek uvnitř etnické \ skupiny (endogamy) - nebylo příliš vážné. Ale i tak - zejména vzhledem k úmrtnosti mezi staršími osobami, vinou nepřesnosti záznamů a vzhledem ke značné horizontální mobilitě - bylo nutno kontaktovat 652 portugalských adres s výtěžkem 161 jmen respondentů, odpovídajících í naší definici populace. V tomto případě jméno jako kritérium pro výběr - doufejme - nezpůsobilo vážné zkreslení. Ale nemusí tomu tak být vždycky. Mezi americkými sociology koluje hezká historka, kterou uvedeme v naší pohádce č. 10. Pohádka pro odrostlejší děti 10 O zrádném písmenu Bylo před místními volbami v jednom velkém místě na východním pobřeží USA a skupina politiků si objednala výzkum, předpověď výsledků voleb. V té době mělo město dobrý seznam voličů řazený abecedně. Kartotéky zaplňovaly několik místností. Pro konstrukci vzorku byla použita technika vícestupňového náhodného výběru. Nejdříve byia vybrána náhodně místnost, pak kartotéční skříň a ze zásuvek této. skříně byli vybráni technikou systematického výběru jedinci do vzorku. Výzkum skončil neslavně: jako vítěze vyhlásil kandidáta, který skončil daleko vzadu v poli poražených. Prostě výzkumník se dopustil omylu, ale zejména měl smůlu. Náhodně vybral začátek písmena M, a tak se stalo, že voliči irského a skotského původu, jejichž jména velice často začínají na Mac a Mc, byli silně přereprezentováni. Hlasování ve volbách v USA a Kanadě velmi často sleduje etnickou linii. Není proto divu, že výzkum mylně předpověděl vítězství irského kandidáta. Tomuto zkreslení bylo snadné zabránit, kdyby byl stejný počet voličů vybrán z více kartotéčních skříní. Je ale také pravda, že kdyby bylo vybráno jiné písmeno, ke zkreslení by asi nedošlo. 5.4 Když koruna nepracuje Zatím jsme viděli členy dvou rodin výběrových technik. Nejdůíežitější jsou pravděpodobnostní.techniky založené na náhodném výběru. Jsou velice mocné, zajišťují, že budou dobře reprezentovány všechny známé i neznámé vlastnosti populace. Nadto jen u nich jsme schopni prostředky statistiky odhadnout, nakolik se vzorek liší od populace. Bohužel zdaieka ne vždy jsme schopni tyto techniky použít. Někdy třeba proto, že pracnost a nákladnost těchto technik přesahuje rámec našich možností. Jindy proto, že neexistuje žádný seznam cílové populace. Nej častější překážkou je však kombinace obou těchto důvodů. Speciální populace, o kterou se zajímáme, může být rozptýlena mezi celou populací a mít velice nízkou frekvenci. Teoreticky by bylo jistě možné vytvořit veliký vzorek celé populace a pak, po předběžných rozhovorech, vybrat jen ty jedince, kteří odpovídají definici naší cílové populace. Jak jsme si ilustrovali na příkladu výběru starých Portugalců, z hlediska nákladů by to bylo prostě nemožné. My jsme měli štěstí, byli jsme schopni zimprovizovat seznam populace, ale to se .stává spíše výjimečně. Jako prvou techniku tvorby vzorku jsme v této kapitole diskutovali kvótni výběr. Reprezentuje druhou skupinu výběrových technik, které nejsou založeny na teorii pravděpodobnosti, ale na logickém úsudku. Kvótni výběr je pravděpodobně nejspolehlivější mezi těmito technikami, 110 111 ale opět ne vždy je možno jej použít. Může být aplikován jen tehdy, když máme dostatečnou znalost o populaci, abychom její strukturu mohli imitovat ve struktuře vzorku. Do téže skupiny patří účelový výběr, někdy i anketa, a bývá sem zařazována i technika sněhové koule (snowball sampling). Účelový výběr je založen pouze na úsudku výzkumníka o tom, co by mělo být pozorováno, a o tom, co je možné pozorovat. Jak vidíte, není to příliš vědecký přístup, ale velice často jediný, který nám zbývá. Je používán i profesionálními agenturami, které provádějí za úplatu výzkum trhu. Řekněme že byste při sobotním nákupu v Bílé labuti byli osloveni mladým mužem a dotazováni na to, co si myslíte o určité skupině výrobků. Na jakou populaci se výsledky takového výzkumu vztahují? Dr. Waíson: Ale to je přece jednoduché! Na lidi, kteří nakupují v obchodních domech! Jako obvykle, Dr. Watson je příliš optimistický. Takto konstruovaný vzorek by reprezentoval přinejlepším populaci osob, které nakupují v Bílé labuti v sobotu dopoledne a právě v této roční době. A kdybychom měli být opravdu přesní, museli bychom ještě dodat, že se závěry : vztahují jen na ty jedince z takto definované populace, kteří jsou ochotni odpovídat na otázky . daného typu. Není to příliš široká a dobře definovaná populace, ale pro účeiy výzkumu trhu by mohly být takto získané informace určitě užitečné. Účelový výběr nám téměř nikdy neumožní nějakou opravdu širokou generalizaci našich závěrů, ale to neznamená, že tyto závěry nejsou užitečné. Jen nesmíme předstírat jiným, a především ne sobě, že tyto závěry platí pro každého jedince ve vesmíru. Při použití účelového výběru musí výzkumník jasně, přesně a otevřeně deíinovat populaci, kterou jeho vzorek opravdu reprezentuje. Užití účelového výběru je pro některé populace jediným řešením. To platí kupř. pro etnické minority; snad v žádné zemi neexistují spolehlivé a vyčerpávající seznamy takových skupin. Pak nezbývá nic jiného než použít jako výchozí bod seznamy členů etnických organizací. Takový vzorek jistě nebude reprezentovat ty příslušníky etnické skupiny, kteří nejsou v žádné z takových skupin organizováni. Je pak na výzkumníkovi, aby posoudil, s použitím znalosti skupiny, jak dalece jsou jeho závěry zobecnitelné. Kupř. Pejovič (1990) zkoumal vzdělávací aspirace středoškolských studentů chorvatského původu, žijících v Torontu. Jeho závěry jsou velice zajímavé a závažné. Zdá se, že pro tuto skupinu neplatí obvyklé socioekonomické determinanty aspirací, které americká sociologie má tendenci považovat za univerzální. Pejovič užil techniku účelového výběru. Východiskem bylo členstvo různých chorvatských kulturních a sociáinich organizací, účastníci různých chorvatských společenských akcí atd. Pejovič nikde nepředstírá, že jeho závěry platí mimo jeho vzorek. Nicméně síla zjištěných souvislostí a známá fakta o kulturní a socioekonomické homogenitě této etnické skupiny naznačují, že je silně pravděpodobné, že podobné výsledky bychom mohli dostat i pro většinu jiných mladých Chorvatů žijících ve velkých kanadských městech. Důkaz pro to by ovšem mohl být získán jen opakováním výzkumu na vzorcích vytvořených z dalších populací. Tedy i technicky vzato nereprezentativní vzorek může někdy poskytnout hodnotné výsledky. Ne však vždycky a ne automaticky a musíme si být vědomi toho, že je jen náhražkou za pravděpodobnostní výběr. Některé techniky vytváření účelového vzorku jsou velice problematické. Bohužel stále je ■ hojně používána anketa. V anketě je výběr jedinců založen na rozhodnutí respondenta zodpovědět otázky uveřejněné v masových sdělovacích prostředcích. Definovat populaci, ke které se nálezy ankety vztahují, je skutečně nemožné. Nejsou to čtenáři .určitých novin nebo časopisů. To by bylo ještě dobré. Vzorek se však liši od celé populace préVě tím, že to jsou ti, kteří zodpověděli anketu. Maximálně můžeme říci, že lidé ve vzorku jsou vicc motivováni než ostatní čtenáři, a to je velice slabá definice. Ani velikost vzorku 112 113 nepomůže. Správně konstatuje Zich (1976, s. 207), že anketa Rudého práva, která získala vzorek větší než 110 tisíc, není reprezentativní, i když v základních demografických ukazatelích se dosti shodovala se strukturou celé dospělé populace. Problém je v samovýběru respondentů. Ale to už známe z našeho příkladu vojáků, filmu a postojů k USA. Poznávací hodnota ankety je podle mého názoru pod hodnotou dobře a zodpovědně napsaného fejetonu. A konečné tu máme techniku „snowball sampling", techniku sněhové koule. Podle mého názoru tato technika vůbec do této kapitoly nepatří. Je to technika identifikace populace, a ne vytvořeni reprezentativního vzorku. Ale všechny učebnice, které znám, ji zařazují mezi výběrové techniky, a tedy i my sledujeme toto schéma. Ale posuďte to sami. telným nástrojem pro zkoumání populací, které existovaly jen dočasně: účastníci určitých demonstrací, svědkové katastrofy nebo jiné řídké události atd. Zde většinou teoretické nasycenosti vzorku nedosáhneme a aplikace této techniky má opravdu charakter konstrukce účelového vzorku. Termín „teoretická nasycenost" byl uveden Giaserem a Strausem (1967) v souvislosti s jejich konceptem „grounded theory", snad nejdůležitějším epistemologickým nástrojem pro kvalitativní výzkum. Technika sněhové koule hraje pod jménem „teoretický výběr" velice důležitou úlohu. Má zde do jisté míry funkci ověřování validity. Ale k tomu se ještě vrátíme s celou řadou podrobností. Doufám, že to bude docela zajímavé. „Snowball technique" spočívá na výběru jedinců, při kterém nás nějaký původní informátor vede k jiným členům naší cílové skupiny. Nejlépe si to ukážeme na jednoduchém příkladu. Třeba bychom chtěli studovat mocenskou strukturu v malé obci. Identifikovat oficiální vlivné osoby, jejichž pozice je formálně -definována, by nebylo těžké. U nás by to byl třeba starosta, v nedávné minulosti straničtí funkcionáři, SNB atd. Ale vliv v obci mohou mít osoby, jejichž vliv není definován funkcí, a tato část souboru vlivných osob se liší podle místních okolností. V některé obci múze b51 vlivnou osobou ředitel školy ěi továrny, v jiné obci mohou být osoby v takových funkcích be ■ vlivu a významný vliv na rozhodování může mít kněz nebo vlivný a mocný rodák, který' v obe i již dlouhá léta nežij e. To vše je pro výzkumníka, který přichází z venku, neviditelné. Tady je na místě uplatnit výběr technikou sněhové koule. Výzkumník začne rozhovorem s jasně definovanou osobou, třeba starostou. V tomto rozhovoru požádá respondenta, aby jmenoval další vlivné osoby. Ty jsou pak interviewovány a každá z nich dostane i stejnou otázku o vlivných lidech. Po určitém počtu rozhovorů se již jména i, nových vlivných osob neobjevují. Výzkumník může prohlásit, že vzorek je „teoreticky nasycen". Populace vlivných osob v obci byla jasně identifikovaná a náš vzorek je totošiý s touto populací. Technika sněhové koule, kde jména dalších osob se v řetězci rozhovorů „nabalují", sněhová koule (taková, kterou je znázorňována lavina v kreslených vtipech), je nenahr.uli- ■"ŠIB 114 5.5 Koruna přece jen není všechno Techniky náhodného výběru opravdu produkují nejlepší možnou reprezentaci populace. Jenomže je reprezentativní pouze za předpokladu, že všichni vybraní jedinci se opravdu na výzkumu zúčastnili, to jest, že například zodpověděli naše otázky. Výpočet směrodatné chyby je plně založen na tomto očekávání. V příští kapitole uvidíme, že je to příliš optimistický předpoklad. V současné době procento osob, které odmítly tazatele nebo nevrátily dotazník, téměř všude roste. U dotazníku návratnost často nedosáhne ani padesáti procent. Dr. Watson: Ale to přece vůbec neni problém. Já vím, že nám v jedné z dalších kapitol řeknete, že dotazník je jednou z nejlevnéjšich technik sběru dat. Tak když potřebuji ve vzorku 300 jedinců, prostě rozešlu 900 dotazníků, a tak dostanu vzorek i větší, než skutečně potřebuji. Jisté, už vite, proč by tento recept nefungoval: populace, která odpověděla, není totožná s toui.která odmítla odpovědět. Liší se v něčem, co bylo důvodem pro toto rozhodnutí, a pravděpodobně ono „něco" je silně spojeno s problémy, na které je výzkum zaměřen. Obvykle jsme o těchto důvodech schopni jenom spekulovat. Obávám se, že tu musím uvést nový typ nepříjemné redukce informací: 115 Redukce negativním samovýběrern vzniká tehdy, když část jedinců, vybraných do vzorku, odmítla na výzkumu participovat. Tento typ redukce může vážně ohrozit reprezentativnost vzorku. Řešení úkolů z kapitoly 5 Toto je vážný problém. Tak vážný, že před několika lety byl ústředním tématem výročního zasedání Americké statistické společností. Vidíte, na začátku této kapitoly jsme si pochvalovali, [ že redukce populace na vzorek je logicky, technicky a metodologicky dobře propracovanou í operací, kde riziko zkreslení je menší než v jiných výzkumných operacích. Je to stále pravda, í ale přece i zde máme zranitelné místo. Neznáme žádný univerzální lék na tento neduh. Jediné í řešení je usilovat o co nejvyšší návratnost. U některých technik sběru informací je to snadnější, f_ f u některých je to téměř nemožné. Ale tohle už patří do příští kapitoly. f Cvičení 5.1 Jistěže ne. Lidé, kteří neměli telefon (a těch bylo v roce 1936 velice mnoho), ti, kteří nevlastnili auto, nebyli členy organizací, tedy lidé náležející do nižších socioekonomických vrstev byli ze vzorku opravdu vyloučeni. Cvičení 5.2 Tohle nebyla poctivá otázka. Kvótní výběr může být aplikován jen na populaci, jejíž vlastnosti relativně dobře známe. V našem případě bychom mohli nanejvýše navrhnout něco o taxikářích, vrátných v hotelech a prý i příslušnících bezpečnostních orgánů, aíe rozhodně by to nebylo dost pro konstrukci kvótního vzorku. t f t í í 117 Jak se to vlastně dělá technické kroky ve výzkumu pilotní studie ■pfedvýzkum .základní techniky sběru informací rozhovor dotazník pozorování analýza dokumentu jev indikátor. standardizované techniky otevřené a uzavřené otázky kategorizace standardizované pozorován zkreslení pozorovatelem měření jako zdroj změny stereotypní odpovědi interference se zkoumaným objektem použitelnost technik v experimentu 119 Kapitola 6 Jak se to vlastne dělá Podívejme se teď velice krátce na pilotní studii: 6.1 Co dřív? i 1 A teď už je načase se podívat na typický jízdní řád průměrného výzkumu. V kvantitativním | výzkumu se obvykle setkáme s těmito kroky: i 1. Formulace teoretického nebo praktického sociálního problému. 2. Formulace teoretické hypotézy. 3. Formulace souboru pracovních hypotéz. 4. Rozhodnutí o populaci a vzorku. 5. Pilotní studie. 6. Rozhodnutí o technice sběru informací. 7. Konstrukce nástrojů pro tento sběr. 8. Předvýzkum. 9. Sběr dat. 10. Analýza dat. 11. Interpretace, závěry, teoretické zobecnění. První čtyři kroky už známe a z prvých tří kapitol víme už dost pro to, abychom učinili poslední krok - interpretaci a zobecňování dat. Podívejme se teď na pátý krok. Definice pilotní studie a předvýzkumu se u různých autorů liší. My zde nabízíme definice používané ve většině americké literatury, i když jsou odchylné od definic užívaných u nás. Účelem pilotní studie je zjistit, zda je náš výzkum v dané populaci vůbec možný. Naproti tomu účelem předvýzkumu (bod 8 v našem schématu) je odzkoušení nástrojů (kupř. dotazníku), které jsme pro náš výzkum zkonstruovali. Pilotní studie je prováděna na malé skupině vybrané z populace, kterou hodláme studovat. Technika tohoto kroku se podstatně liší od techniky, kterou hodláme použít ve vlastním výzkumu; nejčastěji zde používáme kvalitativní postupy (kupř. nestandardizovaný rozhovor). Cílem pilotní studie je zjistit, zda informace, kterou požadujeme, v naší populaci vůbec existuje a zda je dosažitelná. Pokud nemáme opravdu hlubokou znalost o cílové populaci, zejména vzhledem ke studované problematice, pilotní studie je velice důležitá. Dr. Watson: Ale to my přece u nás vůbec nepotřebujeme! U nás přece neexistuji žádné neznámé populace! Bohužel mnoho lidí sdílí tenhle názor s Dr. Watsonem. Někdy to může být nebezpečné. Žádná společnost není kulturně homogenní a každý z nás má tendenci soudit jiné kultury či subkultury z pozic naši vlastní kultury. Říkáme tomu etnocentrismus a budeme o tom hovořit později. Když dva říkají totéž, nemusí to nutně totéž znamenat. Vzpomeňme si jen na náš příklad s Egri Bikaverem v naší pohádce č. 2. Dále to, co je v jedné skupině takovou informací, která může být snadno předána neznámému tazateli, v jiné subkultuře může být ■považováno za informaci, která „má zůstat v rodině". Různé profesionální subkultury mohou mít velice specifický systém hodnot, který je odlišný od hodnot existujících ve společnosti i obecné. Tyto skupinové neformální normy často zabraňují tomu, aby se podávaly jakékoliv .informace o nich všem nečlenům. Nemusí tu jít vůbec o nějaké ilegální skupiny: kupř. výzkum na populaci policistů je velmi obtížný všude na světě. Podobné problémy mohou být .spojeny se zkoumáním etnických kultur. Kvantitativní akce kupř. na populaci Romů by byla ■bez seriózní pilotní studie nezodpovědná. Pilotní studie je velmi často opomíjena, a to i v případech, kdy je to riskantní. Jako vždy je to problém času a peněz. Ale úspory v této etapě mohou být zaplaceny pochybnou validitou našich výsledků a mohou nakonec vyústit ve výzkumnou akcí, která je zcela nevalidní. Stejně nebezpečné je opominutí předvýzkumu: jména upozornit na to, jak a kde jsou ryto techniky nejzranitelnější. V této kapitole bychom chtěli také alespoň připomenout existenci některých méně obvyklých technik sběru. Tak a už máme nejvyšší čas začít. Dr. Watson si už hlasitě stěžuje, že by chtěl konečně začít s konstrukcí dotazníku. Predvýzkum je opět prováděn na malém vzorku naší cílové populace; tento vzorek je však obvykle větší než vzorek pro pilotní studii. Predvýzkum je testem nástrojů, které ve výzkumu hodláme použít. Cílem tu je obvykle testovat srozumitelnost a jednoznačnost otázek. To je jedna z těch podivných věcí, které potkáváme ve výzkumné praxi: Když čteme záznamový arch, který konstruoval někdo jiný, je poměmě snadné poznat, že určité otázky nejsou zceia srozumitelné, že jiným otázkám je možno porozumět více než jedním způsobem. Na druhé straně je téměř nemožné objevit stejné neduhy v otázkách, které jsme formulovali sami. Já to vim, sám jsem si s tím nejednou udělal ostudu. Ale nespoléhejme s revizí otázek na vlastní kolegy. Oni totiž většinou patří ke stejné kulturní skupině jako my, mají přibližně stejný okruh znalostí, podobný systém hodnot. Značná část naší cílové populace může být velice odlišná. Zatímco určitá otázka je pro nás zcela přijatelná, pro jiné skupiny v populaci může být velice iritující. Něco, co považujeme za běžnou znalost, nemusí být tak docela běžné. Jen predvýzkum na vzorku cílové populace může minimalizovat, i když určitě ne vyloučit, omyly tohoto typu. Zatímco opominuti pilotní studie nás v některých případech nemusí vytrestat vážným zkreslením, opomenutí předvýzkumu je nesmírně riskantní; predvýzkum by měl být nezbytnou součástí každé výzkumné akce. Když už pilotní studie byla skončena (a přirozeně ještě předtím, než můžeme začít s před výzkumem), vstupujeme do velice zajímavé, ale velice rozsáhlé a komplexní oblasti konstrukce výzkumných nástrojů a do oblastí strategie práce v terénu. Důkladné seznámení s touto oblastí by vyžadovalo celou knihu a my máme k dispozici jen jednu kapitolu. Zbývají nám tu jen dvě věci: odkázat na dostupnou (a někdy méně dostupnou) literaturu a nabídnout velice stručný pohled na základní techniky sběru informací, na oblasti jejich uplatnění. 122 -"f WĚ 6.2 Ptát se, nebo neptat? To je opravdu otázka. Mnohem širší a složitější, než by se na prvý pohled zdálo. Je mnoho a mnoho různých technik sběru dat. Vyjmenujme si tu alespoň několik z nich: standardizovaný rozhovor, nestandardizovaný rozhovor, skupinový rozhovor, dotazník, pozorování, telefonní výzkum, sociometrické techniky, sémantický diferenciál, sekundární analýza, zúčastněné pozorování a mnoho a mnoho jiných... Naštěstí téměř všechny z těchto postupů jsou aplikací následujících základních technik: prime pozorování rozhovor dotazník analýza dokumentů ■Podívejme se nejdříve na definice těchto technik: 123 Tabulka 6.1 Přímé pozorováni: To je zaměřené, dobře plánované vnímání vybraných jevů. To, co bylo vnímáno, je pečlivě a systematicky zaznamenáváno. Rozhovor: Vyžadované informace jsou získávány v př/mé interakci s respondentem. Rozhovor může být prováděn tváří v tvář nebo telefonicky. Dotazník: Respondent odpovídá písemně na otázky tištěného formuláře. Analýza dokumentů: To je analýza jakýchkoliv dokumentů, které nebyfy vytvořeny za účelem našeho výzkumu. Záznamem mohou být právě tak dobře psané dokumenty jako jakékoliv materiální stopy lidského chování. Podívejme se nejdříve na všechny tyto základní techniky najednou, na jejich aplikovatelnost v různých formách i přístupech, a srovnejme jejich epistemologické vlastnosti. O tom jsme již hovořili v prvých dvou kapitolách; v sociologickém výzkumu většinou nesledujeme samotný studovaný jev, ale pouze jeho indikátory. Jen v technice přímého pozorování, je-li studovaným jevem chování, jsme schopni sledovat studovaný fenomén přímo. Ze čtyř základních technik sběru informací mohou tři být použity v experimentu. Studium dokumentů však ne. Nezapomeňme, že ve smyslu naší definice považujeme za dokument jen takové zá2namy, které nebyly vytvořeny pro náš výzkum. To vylučuje možnost zachytit změny vyvolané manipulací s experimentální proměnnou. Pnme , . Rozhovor pozorovaní Dotazník Dokumenty Co ie sledováno: jev někdy ne ne ae indikátor ano ano ano ano Použitelnost v experimentu ano ano ano ne Forma standardizovaná r ano ano ano ano nestandardizovaná ano ano ne ano Interference se zkoumaným systémem | někdy J ano ano ne Väechny tyto základní techniky mohou být použity ve standardizované formě, tři z nich i v.nestandardizované; dotazník je přirozeně vždy standardizovaný. Koncept standardizace je 124 125 důležitý a je spojen s některými metodologickými problémy. Stojí za to, abychom se nad tímto konceptem na chvíli zamysleli. Standardizované techniky používají striktně jednotné podněty a také odpovědi jsou často omezeny na volbu z předem připraveného souboru kategorií. Pak hovoříme o „uzavřených otázkách". Kupř. ve striktně standardizovaném rozhovoru má tazatel vlastně velíce omezenou a nepříliš příjemnou funkci. Může jen přečíst otázku doslovně tak, jak je vytištěna v dotazovém archu. Když dotazovaný otázce nerozuměl, tazatel může otázku přečíst zvolna a zřetelně ještě jednou. Když ani tehdy respondent neporozumí, nezbývá tazateli nic jiného než zaškrtnout na archu kategorii „Neví/neodpověděl" a pak přejít k další otázce. Dr. Watson: Ale to přece nemůžete myslet vážně. Já bych určitě uměl přeformulovat otázku tak, že by každý porozuměl. Prostě bych otázku pokaždé změnil tak, že by „ seděla na tělo " každého respondenta. Jen si vyzkoušejte, kolika různými způsoby se můžete někoho zeptat, zda jí rád zmrzlinu. Lehce udiveně vyslovená otázka „Vy nejíte rád zmrzlinu?" určitě vyvolá jinou proporci pozitivních odpovědí než třeba otázka „Řekl byste, že máte rád zmrzlinu, nebo že ji nemáte rád?" Data získaná v nestandardizovaném rozhovoru různými tazateli mohou být nesrovnatelná. Tazateli v kvantitativním výzkumu nezbývá nic jiného než hrát obtížnou úlohu lidského magnetofonu. Standardizace otázek (nebo jiných stimulů) je vlastně dalším typem redukce informací. Bohužel v kvantitativním výzkumu musíme aplikovat stejný typ redukce i na odpovědi zkoumaných osob. Početní operace mohou být prováděny jen na datech seskupených do relativně homogenních skupin. Chceme-li kupř. dojit k závěru, že jen 18 % populace nemá rádo zmrzlinu a že s přibývajícím věkem obliba zmrzliny klesá, nezbude nám nic jiného než standardizovat odpovědi, redukovat množství kategorií, ve kterých odpovědi budou zaznamenány. Tak kupř. odpovědi „Já bych za zmrzlinu dala život" a „Někdy zmrzlina nemusí být špatná" budou zatříděny do stejné kategorie. Horší je, že podobnou ztrátu informace musíme přijmout i tehdy, jedná-li se o problémy daleko závažnější, než je zmrzlina. Nej obvyklejším nástrojem pro standardizaci odpovědí jsou „uzavřené otázky". Nepochybujeme, že Dr. Watson by to určitě uměl stejně jako většina studentů, zejména z oblasti sociálních věd. Jenže to je důvod, proč právě tito studenti j sou zpravidla nejhoršími tazateli; snaží se většinou totiž „vylepšovat" výzkum. (Mimochodem téměř všude na světě jsou nejlepšími tazateli ženy v domácnosti, se středoškolským vzděláním a ve věkové skupině 35-45 let. Neptejte se proč. Nevím a nikdo neví, je to prosté empirický fakt.) V kvantitativním výzkumu si prostě nemůžeme dovolit žádné vylepšování otázek: Kvantitativní výzkum je testování hypotéz o skupinách, a ne o jedincích. Analýza je prováděna na kumulovaných datech o mnoha jedincích a data můžeme kumulovat jen tehdy, jsou-li totožná. Nezbytnou podmínkou pro to je, aby alespoň stimuly (například otázky) byly totožné. Nestandardizované postupy mohou získat Sepsí informace o jednotlivci, nabízejí lepší porozumění, ale cílem kvantitativního výzkumu je testování hypotéz o sociálních skupinách. 126 Uzavřené otázky nabízejí soubor možných alternativ, ze kterých respondent vybere vhodnou odpověď. Ve standardizovaném rozhovoru můžeme použít místo uzavřených otázek otázky kódované respondentem. Ty mají formu normálních, „otevřených" otázek; výčet možných odpovědí není předložen zkoumané osobě, ale tazatel zaškrtává v záznamovém archu tu z připravených kategorií, která je nejbližší výroku respondenta. Příprava uzavřených otázek není snadná. Jednak navržené kategorie musí představovat .rozumný kompromis mezi ztrátou informace, která každou standardizaci nutně doprovází, a zvládnutelným počtem kategorií, jednak užité kategorie musí respektovat určitá formální kritéria: 127 Kategorie použité pro uzavřené otázky musí představovat soubor vyčerpávající všechny možné alternativy odpovědí. Všechny kategorie se musí vzájemně vylučovat; nesmí být možné zařadit odpověď do více než do jedné z kategorií. Vyhovět prvému požadavku může být snadné. Bohužel jen někdy. Jistě nebudeme váhat nad kategoriemi pro otázku po respondentově pohlaví. (Mimochodem tato otázka bude mít tři kategorie, musíme mít možnost sdělit počítači, že pro určitého respondenta nám odpověď na tuto otázku chybí: zkoumaná osoba zapomněla zodpovědět tuto otázku v dotazníku, tazatel opominul zaznamenat příslušnou informaci.) Ale představme si, jak by se připravovaly kategorie pro otázku na to, co dotazovaný dělá nejraději ve volném čase. Úplný výčet kategorií je zde skutečně nemožný. V takovém případě nezbývá nic jiného než zavést kategorii ,jmá odpověď". V dotazníku požádáme dotazované, aby ono „jiné" vypsali, a stejně instruujeme i tazatele. To nám umožní, poté co data byla sebrána, ověřit, zda se vyskytuje v této všeshmu-jící kategorii nějaká odpověď velice často. Pokud by se tak stalo, můžeme pak vytvořit novou kategorii a příslušná pozorování překódovat. Splnit druhý požadavek, vzájemnou výlučnost kategorií, je obvykle snazší. Nebezpečí zkreslení hrozí zejména tehdy, když musíme použít nějaké poměrně široké kategorie. Uveďme si alespoň jeden spíše extrémní příklad toho, co by se mohlo stát při zmíněném výzkumu volného času. Abychom se vyhnuli nepříjemnostem spojeným s dlouhým souborem kategorií, mohli bychom zavést několik málo velice obecných kategorií, jako „zábava", „poučení", „sport" atd. Kupř. luštění křížovek by někdo mohl zařadit do kategorie „zábava", někdo jiný do kategorie „poučení"; chození na fotbalové zápasy by se mohlo objevit právě tak : v kategorií „sport" jako v kategorii „zábava". Jistě, spojování kategorií je možné a může být velice užitečné pro teoretické zobecnění. Seskupování původních kategorií do menšího počtu kategorií obecnějšího charakteru může být provedeno bezpečně teprve poté, co data. byla sebrána. Předběžné zavedení širokých kategorií může být velice nebezpečné: sebraná data mohou být snadno sdružována do obecnějších kategorií, ale jejich dekompozice do užších kategorií je vyloučena. Později uvidíme, že nám statistika nabízí některé velice užitečné nástroje (jako kupř. faktorovou analýzu) pro optimalizaci tohoto procesu. Proti pravidlu o vzájemné výlučnosti kategorií se dá hřešit ještě jiným zajímavým způsobem. V anglickém odborném žargonu existuje pro tenhle hřích pěkné jméno „doubie-barrel question", tedy „dvouhlavňová" otázka. Je to taková otázka, která vyžaduje jednu odpověď o dvou nebo více věcech najednou. Tento omyl potkáte často ve výzkumech, které různé instituce provádějí vlastními prostředky. Kdyby instituce byla požádána, aby provedla výzkum znečištění ovzduší v jejích objektech, najme pro tento úkol experta. Když tatáž instituce chce vědět, co si o této instituci lidé myslí, pověří kteréhokoliv zaměstnance, který umí číst a psát, úkolem zkonstruovat dotazník. Výsledky jsou pak docela neužitečné, ale většinou dost zábavné, a to se děje i v Kanadě, doslova přesycené profesionálními institucemi zabývajícími se výzkumem komerčně: Pohádka pro odrostlejší děti 11 Jak se děiá demokracie Náš obvod reprezentovala svého času dáma, která byla nejen velice elegantní, byla nejen ministrem ve federální vládě, ale záleželo jí moc na tom, aby každý z voličů v jejím obvodu věděl, jak si váží našeho mínění, a takjsme dostávali asi tak třikrát ročně dotazník, krásně tištěný na těžkém křídovém papíře. Moc jsem se na to těšil. Byla to velice užitečná učební pomůcka pro mé kurzy ve výzkumné metodologii, klasický příklad toho, jak se výzkum nemá dělat. V těch dotaznících se vyskytovaly otázky tohoto typu: Jak jste spokojen s politikou federální vlády ve vztahu k USA a se zahraniční politikou naší vlády obecně? — velice spokojen - dosti spokojen — někdy spokojen, někdy ne - nespokojen V té době mnoho lidí by to v podstatě spokojeno s kanadskou zahraniční politikou právě s výjimkou submisivního vztahu k USA. Tito lidé neměli možnost tuto otázku pravdivě zodpovědět. Cvičení 6.1 ^Podívejme se znovu na znění otázky v naší pohádce č. 11. Víme, že se ptá na dvě věci najednou. Aleje to zkreslující otázka ještě z jednoho dalšího důvodu. Můžete vysvětlit proč? 128 129 Zatím jsme hovořili o redukci způsobené standardizaci v rozhovoru a dotazníku. Nicméně všechny čtyři základní techniky mohou existovat ve standardizované formě. (Dotazník přirozeně existuje jenom ve standardizované formě, pokud neuvažujeme nějakou velice speciální situaci, ve které by bylo nutno připravit pro každého respondenta speciální, na tělo šitou verzi dotazníku.) Příklad Bálešovy stupnice jasně ukazuje nejzranitelnější bod standardizovaného pozorování: problém reliability. Reliabilira jsme již dříve definovali jako takové měření, které při opakované aplikaci - pokud se ovšem pozorovaný objekt nezměnil - poskytne shodné výsledky. Pro situaci standardizovaného pozorování si můžeme definici reliability přeformulovat asi takto: Standardizované pozorování je formou pozorování, která je v kvantitativním výzkumu používána téměř výhradně. Pozorování mnoha jedinců nemůže být zvládnuto jediným pozorovatelem, a tak je nutno zajistit srovnatelnost postupů celého pozorovatelského týmu. Minimálním požadavkem pro to je připravit záznamový arch s kategoriemi, ve kterých bude pozorované chování zaznamenáváno. Klasickým příkladem kategorizace tohoto typu je Bálešova stupnice pro pozorování kooperativního chování v malé skupině. Zde jsou některé příklady použitých kategorií: 1. 2. 3. 4. 5. 10. 11. 12. Projevuje solidaritu, pozoruje jiné, pomáhá, odměňuje. Uvolňuje napětí, žertuje, směje se, ukazuje uspokojení. Souhlasí, pasivně přijímá, ukazuje pochopení, podílí se, přizpůsobuje se. Dává návrhy, poskytuje návod, respektuje však autonomnost ostatních. Vyjadřuje mínění, oceňuje, anaiyzuje, vyjadřuje pocity a přání. Udává orientaci, informuje, opakuje, vysvětluje, potvrzuje. Vyžaduje orientaci, informace, žádá o opakování nebo o potvrzení. Ptá se po mínění ostatních, po jejich postojích, hodnocení, analýze, sleduje výrazy jejich pocitů. Vyžaduje pro sebe návrhy, směrnice pro postup. Nesouhlasí, nesouhlas projevuje pasivně, spolupracuje jen formálně, neposkytuje, pomoc ostatním. Ukazuje napětí, žádá o pomoc, odtahuje se od činnosti. Projevuje antagonismus, snižuje ostatní, hájí se a prosazuje se. Podkladem pro konstrukci těchto tříd byl Bálešův teoretický model, sledující v podstatě dvě dimenze. Prvá sleduje sociální emoce od kladné oblasti (body 1 až 4) až do oblasti negativní (body 10 až 12). Dále tato škála sleduje komponenty chování při řešení kolektivního úkolu,' Tak kategorie 6 a 7 jsou zaměřeny na nutnou orientaci, kategorie 4 a 9 na problémy kontroly,;. 2 a 11 na vyrovnávání napětí atd. Pozorovatel kóduje pozorované chování na základě vcítěni se do role člena skupiny, představuje si, jak by pozorované chováni hodnotil, kdyby se opravdu ■ zúčastnil jako člen na řešení úkolu skupiny. Bálešova stupnice je výsledkem nesmíme rozsáhlé r teoretické a zejména empirické analýzy. Škála je doprovázena podrobnou instrukcí, definující, daleko zevrubněji použité kategorie, a uvádí příklady. I tak je nutné, aby pozorovatelé, JcteH?*a£ maj í tuto stupnici používat, prošlí intenzivním tréninkem. Reliabiiní je taková metoda pozorování, při jejíž aplikaci skupina pozorovatelů pozorujících nezávisle stejný jev dospěje k shodným závěrům. Jistě, většinou budeme pozorovat jednodušší jevy než R. F. Bales. Ale i tak je důsledná kontrola reliability nezbytnou podmínkou pro aplikaci standardizovaného pozorování. Konečně i analýza dokumentů může být prováděna ve standardizované formě. Jistě už slyšíte protestovat Dr. Watsona, že to není možné, že dokumenty ve smyslu naší definice jsou záznamy, které nevznikly pro náš výzkum, takže jsme nemohli ovlivnit jejich standardizaci. To je pravda, ale můžeme standardizovat jejich analýzu. Máme pro to dokonce speciální metodu, která se nazývá obsahová analýza a bývá definována jako objektivní, kvantitativní analýza sdělení jakéhokoliv druhu. Budeme sejí podrobněji zabývat později. Nesporně standardizace, stejně jako každá jiná redukce informací, reprezentuje povážlivou ztrátu informací: bohatý, životaplný, mnohotvárný a mnohodimenzionální charakter skutečného světa je proměněn do krajně zjednodušeného schématu několika málo proměnných a do velice omezeného počtu kategorií. Bohužel kvantitativní výzkum je příliš neohrabaným nástrojem k porozumění. Rozumět, to je úkolem kvalitativního výzkumu. Kvantitativní výzkum je jen spíše brutální a primitivní nástroj k testování hypotéz. Má však jednu nesmírně důležitou vlastnost: je nám schopen říci, jaká je pravděpodobnost, že jsme na omylu. To však vyžaduje srovnáváni údajů o mnoha jedincích. Srovnatelná data mohou být vyprodukována jedině standardizovanými postupy. Nestandardizované techniky sběru dat jsou tedy v kvantitativním výzkumu prakticky nepoužitelné. Interference se zkoumaným systémem To je další z opravdu velkých bolestí empirického výzkumu. Nejsme v tom samí, i naši kolegové v exaktní fyzice mají své problémy, když měřicí aparát ovlivňuje měřený systém. Již prvý pohled na naše čtyři základní techniky nám naznačí, že se rozpadají do dvou skupili s ohledem na to, jak silně mohou ovlivnit chování systému, který chceme studovat. Webb, Campbell, Schwartz a Sechrest (1969) navrhli zajímavou klasifikaci zkresleni vyvolaného výzkumnými stimuly: (1) Efekt morčete: zkreslení vzniklé tím, že zkoumané osoby jsou si vědomy toho, že jsou zkoumány. (2) Výběr role: zkoumaná osoba, která si je vědoma, že je zkoumána, nebude reagovat přirozeně, ale tak, aby se jevila v co nejlepším možném světle. (3) Měření jako zdroj změny: výzkumný proces může vyvolat ve zkoumaných osobách postoje, které předtím neexistovaly. (4) Stereotyp ve volbě odpovědí: volba alternativních odpovědí je ovlivněna jinými faktory než míněním respondenta. Zmínění autoři uvádějí ještě dvě další kategorie („interviewer effect" a „změny ve výzkumném nástroji"), které jsou podle jejich mínění vyvolány výzkumníkem. My se však domníváme, že jsou to kategorie podřazené prvým čtyřem a nebudeme je na tomto místě používat. Je zřejmé, že naše základní techniky se z hlediska prvé kategorie, zvané efekt morčete, rozpadají do dvou skupin. V případě rozhovoru a dotazníku zkoumaná osoba vždycky ví, že je předmětem výzkumu. Jsou to takzvané reaktivní metody (obtrusive ■ methods), kde v procesu sběru informací vyvoláváme reakci, kterou zamýšlíme analyzovat Naproti tomu pozorování a studium dokumentu je nereaktivní neagresivní metoda. Sběr informací zde nevyvolává, nebo by alespoň neměl vyvolávat žádnou reakci. (Ovšem některé. z dokumentů mohly být vytvořeny reaktivními technikami při jejich vzniku, mimo rámce: našeho výzkumu.) To ovšem neznamená, že pozorování je vždy nereaktivní: pozná-li zkoumaná osoba, že je. pozorována, stává se tato technika nutně reaktivní technikou. To se velmi často děje při experimentální manipulaci. Klasický je tzv. Hawthornský efekt. Roethlisberger a Dickson (1939) studovali produktivitu dělníků Western Electric v Chicagu a jejich spokojenost s pracovními podmínkami. Zlepšené osvětlení pracoviště se odrazilo ve zvýšené produktivitě a vyšší spokojenosti dělníků. Další zlepšení osvětlení vedlo opět k ještě vyšší produktivitě. Pak - jako experimentální kontrola - světlo bylo opět ztlumeno, a kupodivu, produktivita opět vzrostla. Rozhodujícím činitelem nebyla reakce na fyzické změny, ale reakce dělníků na pozornost, která jim byta věnována. Ale my už víme, že použití kontrolní skupiny ve skutečném experimentu může pro tento typ zkreslení vyloučit. Pod hlavičkou „výběr role" je skryt zdroj zkreslení, který je velice typický jak pro dotazník, tak i pro rozhovor. Zkoumané osoby mají přirozenou tendenci ukázat se v odpovědích v co nejlepším světle. V případě rozhovoru k tomu přistupuje ještě nový faktor, vyvolaný osobou tazatele; respondent může volit odpovědi tak, aby udělal co nejlepší dojem na konkrétní osobu, na tazatele. Pohádka pro odrostlejší děti 12 Historie téměř beze slov aneb O dvou tazatelích Tazatel 1; „Čtete rád poezii?" Respondent Pepík: „Zbláznil jste se?" Tazatel 2: „Čtete rád poezii? Respondent Pepík: „O, já miluji poezii!" 132 133 Tomuto zkreslení, nazývanému v anglicky psané literatuře „interviewer bias", je obtížné J 'Í předejít, Není vyvoláno jenom tím, jaký tazatel je, nejen tím, jak se chová, ale hlavně tím, jak J je respondentem vnimán. Chovaní tazatele může nechtě respondentovi nabídnout klíče ke ;.| konstrukci falešné či správné představy o tazateli, a tato představa ho pak vede k odpovědi, o které se domnívá, že na tazatele učiní co nej větší dojem. Neutrální chování tazatele je < nelehký úkol, zejména je-li pro něj obsah výzkumu nějak významný. Autor výzkumu může s si být proto velmi špatným tazatelem. Většina profesionálních výzkumných organizací používa t služby tazatelů, kteří mají své vlastní hlavni povolání, a je osvědčenou praktikou, že tazatelé, kteří jsou svým povoláním spojeni s předmětem určitého výzkumu, jsou z účasti na tomto výzkumu vyloučeni. Pojišťovací agent item-použit jako tazatel pro výzkum zabývající se pojištěním; těžko by zachoval „poker face" při nehorázné odpovědi respondenta, kterou já, : jako osoba zcela naivní v tomto oboru, klidně zaznamenám. [i Podobnou roli může hrát tzv. efekt záhlaví, to jest zkreslující efekt představy zkoumaných < osob o instituci, která výzkum pořádá nebo se kterou respondent daný výzkum asociuje. Následující pohádka není vtip, ale fakt z historie naší, či spíše východoevropské sociologie. í Zkreslení výběrem role se ovšem neomezuje jen na rozhovor, ale je vlastní i dotazníku. Respondent se neidealizuje vzhledem ke konkrétnímu tazateli, ale vzhledem k nějak zobecněným druhým lidem nebo vzhledem k instituci, kterou vidí či tuší za výzkumem. Naštěstí máme k dispozici některé technické postupy, které zvýší pravděpodobnost pravdivé odpovědi i na nepříjemné otázky. Tyto postupy nejsou bez problémů a budeme je probírat na následujících stránkách. . Horší je to se zkreslujícím vlivem měření jakožto zdroje změny. Krásný příklad jsme uvedli | v naší pohádce č. 3. Bohužel takové benigní připady jsou spíše výjimkou. Tazatelů tak efektivních jako Jirka není mnoho a tak obětavé a hodné babičky snad existují už jenom v pohádkách. Mnohem zhoubnější je vliv měření na postoje respondenta, zejména na postoji., které ještě nejsou pevně zakotveny v jeho vědomí. Naše výzkumy jsou často zaměřeny na problémy, o kterých někteří respondenti nikdy nepřemýšleli, které pro ně nejsou skutečnými problémy a nemají k nim vyhraněný postoj. Teprve naše otázka tento postoj vytvoří. Odpověď dotazované osoby není nepravdivá, ale vyjadřuje postoj, který je nový a asi značně nestabilní. Naší hlavní obranou je předvýzkum: jen ten je nám schopen říci, zda požadované informace skutečně v cílové populaci existují. Dále nám mohou pomoci filtrační otázky. To jsou otázky verifikující, jak dalece je respondent kvalifikován poskytnout žádanou informaci. Zjišťují třeba zkušenost respondenta z dané oblasti, jeho znalost atd. Pohádka pro odrostlejší děti 13 O dvou výzkumech To bylo vlastně dost dávno, kdy sociologie byla stále ještě nemravné slovo, které bylo opisováno mnoha různými způsoby, třeba jako vědecko-historický výzkum o přítomností. A přece v té době Erika K. dokázala připravit znamenitý výzkum o náboženství v některých oblastech Cech a Moravy. Použila velice moudrou techniku, která téměř dokonale zajišťovala anonymitu. Dotazníky byly osobně rozdávány a po několika hodinách se tazatel vrátil, dal respondentům frankovanou obálku a respondenti sami vyplněný dotazník vrátili poštou. Zajímavé je, že některé vrácené obálky měly razítka poštovních úřadů vzdálených mnoho desítek kilometrů od míst, ve kterých se výzkum konal. Erika tak docílila nejen neobyčejně vysoké návratnosti, ale získala i velice upřímné odpovědi. Její výsledky byly u mocných tehdejšího světa velice nepopulární. V té době navštívil Prahu jeden sociální vědec z jednoho nevelkého spřáteleného socialistického státu. Uviděl výzkum a řekl Erice: „To je velice zajímavé. Já ten výzkum zopakuji. Ale udělám ho lepší!1' A taky udělal. Když se asi o rok později vrátil do Prahy, prohlásil vítězně: „Neříkal jsem to, já mám mnohem lepší výsledky než Erika. Měl jsem stoprocentní návratnost, a náboženské předsudky u nás už vůbec neexistují." Možné je všechno, ale o perfektní návratnosti ještě nikdo nikdy neslyšel, a tak nám to ten soudruh profesor vysvětlil: „Já jsem vybral mnohem lepší tazatele, než měla Erika. Já jsem vybral ty osoby, které o obci nejvíce vědí a kterým každý důvěřuje: místní milicionáře!" Stereotyp ve volbě odpovědi je v literatuře znám pod jménem response set. Je to systematické seskupování odpovědí do určitých kategorií a toto seskupování nemá nic společného s obsahem otázky ani s postojem, míněním respondentů. Nicméně toto seskupování není 134 135 f náhodné. Jeden typ tohoto zkreslení je znám pod jménem acquiescence (podvolení, přitakání). Mnoho respondentů má tendenci s předloženým tvrzením souhlasit spíše než vyjádřit nesouhlas. To je zejména časté, když vyžadujeme odpověď ve formě souhlasu nebo nesouhlasu s předloženým tvrzením: ! ri Většině lidí je možno důvěřovat. - silně souhlasím j" - souhlasím \ - nevím | - nesouhlasím | - silně nesouhlasím | V rozsáhlejších výzkumech můžeme toto zkreslení minimalizovat tak, že na různých místech dotazníku nebo rozhovoru předložíme obsahově shodné tvrzení, jednou v pozitivní a jednou v negativní formě. Tak předchozí otázka by mohla být opakována takto: Lepší je nedůvěřovat nikomu. - silně souhlasím - souhlasím - nevím - nesouhlasím -silně nesouhlasím i Dalším zdrojem zkreslení je tendence mnoha zkoumaných osob volit střední, neutrální | kategorii v uzavřených otázkách. Řešením tu může být technika nucené volby. Střední, f§ neutrální kategorie („nevím" v našem příkladu) není prostě v uzavřené otázce pou a respondent se musí rozhodnout mezi kategoriemi popisujícími různé stupně souhlasu či í [ nesouhlasu. Pohádka pro odrostlejší děti 14 O zkreslení vpravdě tvořivém aneb Pohádka s mravním ponaučením Kdysi, kdesi, ale v podstatě po celém civilizovaném světě, byly pro poradenství ve volbě povolání používány různé dotazníky. Jeden z nich se snažil o co nejúplnější inventuru kandidátových zájmů. Byl to velmi dlouhý dotazník, obsahoval několik set položek. Každá z nich obsahovala stručný popis nějaké činnosti nebo prostředí. Vypadalo to asi takto: 112. Pracovat se zvířaty A a ? n N 113. Řešit složité problémy A a ? n N Respondenti byli instruováni zakroužkovat „A", když zmíněná činnost byla pro ně velice zajímavá, „a", když byla poněkud zajímavá, „'?" ani zajímavá, ani nudná, „n" reprezentovalo nudnou a „N" velice nudnou činnost. Viděli jsme vyplněné dotazníky z výzkumu na populaci učňů, který byl proveden v prvých poválečných letech, a bylo to velmi zajímavé čtení. Prvé stránky dotazníků byly vyplněny většinou pečlivě. Ale postupně přibývalo přeskočených otázek, zdaleka ne všichni respondenti se dostali až ke konci dotazníku. Ne všichni však podlehli v tomto zápase s nudou bez boje. Zaškrtnuté odpovědi začaly dostávat formu geometrických obrazců. Viděli jsme kolmice. Šikmé linky v nejrůznějších kombinacích a profesor Hyhlík pečlivě střežil dotazník vyplněný jakýmsi tvořivým mladým mužem, jehož odpovědi na posledních stránkách dotazníku vytvářely opakovaně populární nemravný obrázek. A tady je to slíbené mravní naučení: Je snadné předpovědět, že výzkumný proces, který je pro respondenty nudný, vyvolá nutně zkreslení. Třeba i ve formě response setu. Ale je vskutku nemožné odhadnout, jaký bude obsah tohoto zkreslení. Tak a teď už víme něco o základních nástrojích sběru informací. Ale nevíme ještě, jak a kdy je ipoužívat, Alespoň něco si o tom povíme v příští kapitole. Někdy „response set" může nabýt velice zajímavé formy: 136 137 Kapitola 7 Kulhavý poutník Absolutní znalost neexistuje. Každá informace je neúplná. Musíme k ní přistupovat pokorně. J J. Bronowski, The ascentofman í A teď je konečně čas prodrat se alespoň některými malými úseky džungle technických l aspektů sběru informací. Je to pěkně komplikovaná džungle a její spolehlivé zmapování | by vyžadovalo celou knihu. Na našich několika stránkách můžeme ukázat jen některé J z nejnebezpečnějšlch močálů, upozornit na některé důležité nebo zajímavé součásti naší f výzbroje a výstroje a podívat se alespoň stručně na to, jak tyto nástroje aplikovat. Tato kapi- f tola není návodem, který by vypočítával zevrubně všechny techniky, jejich aplikovatelnost |' a definoval pravidla jejich použití. Naše kapitola je spíš něco jako prodejní katalog velkého J obchodního domu, který chce inzerovat něco z toho, co má na skladě. Účelem není prodat, j ale přimět vážnějšího zájemce, aby se patřičně vyzbrojil na pořádnou expedici. Tato výzbroj není příliš složitá, chce to jenem číst. 7.1 Dotazník, nebo rozhovor? Dr. Walson: To je přece zbytečná otázka. Každý přece používá dotazník! Tak se na to podívejme zblízka. Tabulka 7.1 porovnává některé důležité vlastnosti obou technik, standardizovaného rozhovoru a dotazníku. Tabulka 7.1 Rozhovor Dotazník Velice pracná a nákladná technika sběru informací. Vysoce efektivní technika, která múze postihnout veliký počet jedinců při relativně malých nákladech. Rozhovor je časově velice náročný. Získat informace v rámci určitého časového limitu může být velice nákladné a často š nemožné. Dotazník umožňuje poměrně snadno získat informace od velkého počtu jedinců v poměrně krátkém čase a s poměrně malým nákladem. Rozhovor vyžaduje spolupráci dosti velikého poctu alespoň částečně vyškolených tazatelů v terénu. Spolupracovníci v terénu jsou nezbytní jen někdy {při použití osobně rozdělovaných a sbíraných dotazníků). Požadavky na jejich zaškolení jsou nízké. Výzkum na prostorově rozptýleném vzorku je nákladný. Náklady šetření na rozptýleném vzorku jsou relativně nízké. Anonymita výzkumu je pro respondenty málo přesvědčivá. Anonymita je relativně přesvědčivá. Rozdíly mezi tazateli a rozdíly v jejich chování mohou vyvolat „interviewer bias". Formální shodnost podnětové situace je vysoká; „interviewer bias" je prakticky vyloučen. Rozhovor klade menší nároky na iniciativu respondenta, pro respondenta je obtížnější vynechat odpovědi na některé otázky. Dotazník klade vysoké nároky na ochotu dotazovaného, je snadné „přeskočit" otázky nebo neodpovědět vůbec. V rozhovoru je téměř jisté, že dotazovaná osoba je ta, která byla vybrána do vzorku. U dotazníku je možné, že otázky byly zodpovězeny jiným členem rodiny, či, a to nejčastěji, celým rodinným týmem. Proporce úspěšně dokončených rozhovoru je podstatně vyšší než návratnost dotazníku. Návratnost je velice nízká. S výjimkou některých speciálních případů je tak nízká, že jakákoliv reprezentativnost vzorku je ztracena. .Že by měl Dr. Watson pravdu? Z devíti kritérií zmíněných v naší tabulce jich šest jednoznačně svědčí ve prospěch dotazníku. Některé důvody proti použití rozhovoru jsou závažné. Je to především existence zkreslení vyvolaného tazatelem a zejména vysoká nákladnost tohoto postupu. Náklady na rozhovor jsou ve srovnání s dotazníkem mnohonásobné. Nicméně jedna jediná vlastnost dotazníku naprosto znehodnocuje jeho dobré stránky; ■nesmírně nízká návratnost. To platí zejména o velice ekonomických, poštou distribuovaných dotaznících. I když použijeme všechny důmyslné triky zkonstruované ke zvýšení návratnosti :(o. některých z nich se zmíníme v následujících odstavcích), návratnost 50 % je považována ÍV- .mnoha průmyslových zemích za slušný úspěch. Nejvážnější na tom je, že taková 140 141 dramatická redukce velikosti vzorku má systematický charakter, že výsledky založené na takto zkomoleném vzorku se mohou velmi podstatně lišit od výsledků, které bychom dostali ve vzorku skutečně reprezentujícím zkoumanou populaci. Žádné zvýšení velikosti vzorku toto zkreslení neodstraní, a tak nám nezbývá než se smířit s tím, že dotazník, alespoň v této formě, je pro seriózní výzkum většinou nepoužitelný. Dr. Watson (Uše vzlyká) Tak to musíme našeho přítele alespoň trochu utěšit. Existují totiž i jiné techniky distribuce dotazníku než pošta. Dotazníky mohou být osobně distribuovány a sbírány, a to zaručuje návratnost srovnatelnou s rozhovorem; ovšem finanční a časové náklady jsou také srovnatelné. Někdy můžeme náklady spojené s osobní distribucí dotazníků minimalizovat. Je-li určitá populace prostorově koncentrována, můžeme použít techniku, pro kterou mají Němci krásné dlouhé jméno: Klassenzjmmerfragenbogen. Respondenti jsou shromážděni v místnosti, obdrži dotazník, který na místě výplni. Tato technika funguje velmi dobře na některých víceméně bezbranných populacích, jako jsou studenti, vojáci nebo zaměstnanci. Velice chytrá technika byla použita svého času studijním oddělením Čs. rozhlasu: dotazníky byly rozdělovány a sbírány poštovními doručovateli, a protože listonoši byli odměňováni podle počtu vyplněných dotazníku, návratnost byla vysoká. V tomto případě doručovatelé, vybírali respondenty sami, podle jednoduchých kritérií kvótnlho výběru. Snad by bylo možné použít tuto techniku i pro pravděpodobnostní vzorek, přičemž doručovatelé by distribuovali a sbírali dotazníky členům vzorku zkonstruovaného technikami náhodného výběru. Ale i poštou distribuovaný dotazník může být někdy relativně úspěšný, zejména je-li pro naši populaci předmět výzkumu důležitý nebo pokud se jedná o nějaký citlivý problém, kdy validita výsledků by mohla být podstatně ohrožena tim, že kupř. v rozhovoru není dostatečně zajištěna jejich anonymita. 142 I V každém případě musíme použít všechny prostředky, které mohou návratnost dotazníku zvýšit. Především musíme respondentovi co nejvíce ulehčit zodpovězení a vrácení dotazníku. Zanedbání některých základních kroků může vést k opravdu katastrofální návratnosti. Frankovaná obálka, slušná kvalita papíru, dostatek místa pro odpovědi, to jsou základní nezbytnosti. Důležitou úlohu hraje délka dotazníku: se vzrůstající délkou dotazníku návratnost klesá. Je zajímavé, že dosáhne-li dotazník délky asi deseti stránek, pak další růst délky nad tuto hranici zřejmě již žádný měřitelný vliv na návratnost nemá. Vliv na návratnost může mít i prestiž sponzora, pro kterého je výzkum prováděn. Ovšem jméno některých institucí může vyvolat systematické zkreslení. Např. uvedeme-li jako sponzora výzkumu o postoji k potratům jméno organizace dobře známé svým negativním postojem k potratům, pak ovšem tento fakt výběrově zvýší návratnost u těch respondentů, kteří sdílejí postoje takové organizace. Dobrou pomůckou je i doprovodný dopis, který vysvětli účeí výzkumu, jeho užitečnost pro respondenty, vysvětlí, jak byl respondent vybrán a jak je zajištěna jeho anonymita. Z dopisu by mělo být pro respondenta zřejmé, jak významnejšou pro nás jeho odpovědi. Z tohoto důvodu se používají stále častěji personalizované doprovodné dopisy. Prakticky všechny modernější programy pro automatické zpracování textu nám umožní připravit dopis, do kterého program automaticky víožl 2 připravené databáze adresu, oslovení atd. Jedním z nejefektivnějších nástrojů ke zvýšení návratnosti je odměna za vyplnění dotazníku. Obvykle nebývá příliš vysoká, jde zde spíše o její symbolický význam. V angličtině existuje běžně užívané rčení „Penny for your thought", což bychom mohli přeložit přibližně jako „Pěťák za to, co si myslíš". Lístek s touto frází a zbrusu nová jednocentová mince - nejnižší hodnota existující v měně USA - byíy připojeny k dotazníku. Tato jednoduchá a nenákladná akce zvýšila významně návratnost dotazníku. Jindy byl stručný dotazník vytištěn na rub šeku na malý obnos a vyinkasované šeky-dotazníky byly vráceny bankou výzkumníkovi. Častou odměnou za vyplnění dotazníku jsou losy asi v hodnotě 1 $, jindy jsou vyplněné dotazníky zařazeny do slosování o větší ceny. Ale pozor, nabídnutá odměna může někdy zkreslit naše :výsledky, jak je to ilustrováno v naší absurdní pohádce č. 15: Pohádka pro odrostlejší děti 15 Všeho moc škodí aneb Pohádka o absurdní návratnosti Byla jednou jedna země, ze které mohli cestovat do zahraniíí jen Ti Nejvybranější, a těch nebylo mnoho. Jednoho dne se Ti Nejvybranější rozhodli, že potřebují spolehlivou informaci o postojích zbytku obyvatelstva. Rozhodli se, že použijí techniku dotazníku, a protože se doslechli, že návratnost je důležitá, nabídli velkorysou odměnu: všechny vyplněné dotazníky budou zařazeny do slosování. První cena byla opravdu velkorysá: dvoutýdenní pobyt pro dva v jedné krásné a teplé cizí zemi. Tu cenu mohl získat každý, i ten, kdo nepatřil mezi Ty Nejvybranější. Výsledek byl vskutku epochálni. Z 2000 dotazníků se jich vrátilo 2400, a tak poprvé v dějinách návratnost překročila 100 %. To je pozoruhodné proto, že v té zemi byly všechny tiskařské stroje přísně kontrolovány. Ovšem nejúčinnější cesta ke zvýšení návratnosti rozesílaného dotazníku je velice pracná a prozaická. Jedná se o to, čemu se v anglicky psané literatuře říká foUow-ups. Po určitém počtu dnů, typicky po dvou týdnech, respondenti, kteří nevrátili dotazník, dostanou „upomínku", obvykle pěkně formulovaný text na korespondenčním lístku. Asi dva týdny poté můžeme těm, kteří ještě neodpověděli, poslat nový exemplář dotazníku a jsme-li opravdu vytrvalí, můžeme po určité době těm zbývajícím poslat doporučení další exemplář dotazníku. Ve skutečnosti to není tak jednoduché, jak to na první pohled vypadá. Tento postup vyžaduje, abychom měli přesnou evidenci o tom, kdo odpověděl a kdo ne, přitom však nesmíme porušit anonymitu výzkumu. Řešeni tohoto problému není těžké: ke každému dotazníku připojíme nejen frankovanou odpovědní obálku, ale i korespondenční lístek s respondentovou adresou a požádáme respondenty, aby tuto dopisnici odeslali, když odesílají dotazník. To všechno je ovšem velmi pracné a nákladné, zejména při výzkumech na velkém vzorku; osobní počítače nám i zde mohou práci podstatně ulehčit. Jak účinná je tato metoda, svědčí výsledky studie provedené v USA: návratnost na původně rozeslané dotazníky byla 23,8 %. Pak byly aplikovány všechny kroky popsané výše, a po sedmi týdnech návratnost dosáhla úctyhodných 72,4 % (Dilman, Christensen, Carpenter & Brooks 1974). Kdykoli je návratnost neuspokojující, měl by výzkumník vědět, jak se jeho vzorek liší od populace. Nejjednodušší je srovnat distribuci dat v dotazníku se známými daty o populau. Prakticky to budou téměř vždycky jen demografická data. Nesmíme však zapomenout, že i kdyby byla značná shoda mezi oběma skupinami dat, nezaručuje to, že ti, kteří zodpověděli dotazník, se neliší od těch, kteří neodpověděli v jiných, pro náš výzkum důležitějších dimenzích. Jsou-li naše výsledky opravdu důležité, mají-li třeba být podkladem pro nějakou sociální intervenci, může být prozíravé zjistit alespoň směr zkreslení v našem nedokonalém vzorku. K tomu opět potřebujeme mít evidenci o adresách těch, kteří neodpověděli. Pak můžeme na vzorku vybraném z těch, kteří neodpověděli, provést výzkum rozhovorem. To nám alespoň umožní odhadnout, kterým směrem se odchylují naše výsledky od těch, jež bychom obdrželi na nezkresleném vzorku. Tak doufejme, že se nám podařilo Dr. Watsona utěšit. A když už jsme v takové smířlivé náladě, podívejme se na to, zda můžeme něco udělat s nejzraniíetnějšími body v rozhovoru, s jeho nákladnosti a se zkreslením vyvolaným přítomností tazatele (interviewer bias). Nejshbnějším řešením se zdá být telefonní interview. Pro nás je to řešení prozatím jenom perspektivní; jak již samo jméno naznačuje, tento postup je omezen jen na populaci těch respondentů, kteří mají telefon, a tato populace se může podstatně lišit od ostatního obyvatelstva. (Pamatujete na blamáž, kterou utrpěl v roce 1936 Literary Digest? Ta byla vyvolána právě zkreslením tohoto typu. Možná že by bylo užitečné podívat se znovu na naši Pohádku č. 8.) V Severní Americe se telefonní interview stává v poslední době takřka rutinní metodou terénního sběru informací: v roce 1987 (U. S. Bureau of Census 1987) mělo více než 97 % amerických domácností telefon. Tento typ sběru informací má černé výhody: Je sice dražší než rozesílaný dotazník, ale mnohem levnější než rozhovor tváří v tvář. Kupříkladu v USA se náklady na dobrý' telefonní výzkum pohybují kolem 50 % nákladů na . rozhovor. Návratnost je mnohem lepší než u dotazníku. Nezodpovědět dotazník znamená :. pro potenciálního respondenta zůstat pasivní. Odmítnout telefonní interview vyžaduje akci; výslovně odmítnout nebo vymyslet si nějakou výmluvu. Třeba: „Někdo je u dveří, musím ..bohužel končit." Zvláště krásnou výmluvu cituje Babbíe (1989, s. 252): „Ježíši, prasata žerou ,.moje VOLVO." To se však stává většinou tehdy, je-li náš interview příliš dlouhý nebo když .překročíme dobu trvání rozhovoru, kterou jsme na začátku zkoumané osobě slíbili. Telefonní interview prakticky zamezí nepříjemnému fenoménu, velmi častému u dotazníku - vynechání odpovědi na některé otázky. Snižuje také pravděpodobnost, že otázky budou zodpovězeny jiným členem rodiny než tím, který byl vybrán do vzorku, nebo - což se v případě dotazníku stává velice často - celou rodinnou radou. Telefonní interview má také některé výhody ve srovnání s rozhovorem tváří v tvář: anonymita je v telefonním rozhovoru mnohem přesvědčivější. Kontakt mezi tazatelem a respondentem je omezen jen na hlasovou komunikaci, a tak „interviewer bias" je mnohem slabší. Telefonní 144 145 interview však zejména umožňuje menšímu počtu vyškolených tazatelů zvládnout velký, prostorově rozptýlený vzorek v poměrně krátkém čase a bez cestovních nákladů. Další výhoda je pro nás naštěstí snad zatím jenom hypotetická. S dramaticky rostoucí kriminalitou ve velkých severoamerických městech stále vyšší a vyšší procento lidí odmítá vpustit cizince - tazatele - do svého bytu a jsou zaznamenány i případy, že tazatel byl fyzicky napaden. Výzkumná agentura pak nese riziko žaloby o odškodné. Není proto překvapivé, že se telefonní interview zvolna stává základním nástrojem ratinního výzkumu. Bohužel rozmach této techniky je nyní brzděn kontaminací terénu „telemarketingem", obchodem po telefonu. Průměrný občan dostává alespoň tak šestkrát měsíčně telefonní nabídky, aby si nechal opravit střechu za neuvěřitelně výhodných podmínek, je mu gratulováno, že byl vylosován mezi několik šťastných, kteří mohou zakoupit za poloviční cenu kondominium na Floridě, nebo že může za pouhých $ 150 - a během jednoho měsíce získat doktorát teologie od Divine University v Moose Jaw. Tyto nabídky se často maskují jako výzkum, a to pak zvyšuje j pravděpodobnost odmítnutí i pro výzkum zcela legitimní. Můžeme to kompenzovat tím, že Q na telefonní výzkum upozorníme dopisem adresovaným vybranému tazateii. To však vylučuje J použití neobyčejně slibné varianty telefonního interview: CATI. :5 Dnes již existuje celá řada programů pro telefonní interview s pomocí počítače (Computer vij Assisted Telephone Interview). Ty pracují asi takto. Tazatel čte otázky z obrazovky a ukládá \| ihned odpovědi respondentů přímo do ústřední počítačové paměti, ve které jsou kumulovány ; 1 odpovědí shromážděné všemi tazateli. Po skončení kteréhokoliv interview jsou data .| okamžitě v takové formě, že mohou být bez jakýchkoliv dalších operaci podrobena statistické | analýze, a někdy jsou určité části této analýzy prováděny průběžně. V kterékoliv fázi sběru I informací můžeme třeba zjistit, kolik mužů a kolik žen jsme do této chvíle intervíewovali, "| jaký je průměrný věk respondentů, od nichž jsme až do této chvíle shromáždili odpovědi atd, „»-§ Kódování a vstup dat jako samostatné operace odpadají. Tyto operace jsou velice nudné a jsou 7* proto zdrojem častých chyb. Odpadá také nutnost tisknout tisíce stránek záznamových archů a manipulovat s nimi. Tím však výhody této metody nekončí. CATI program automatizuje * aplikaci strukturovaných, větvených otázek. Tazatel už nemusí sledovat instrukci: „Když odpověď na otázku č. 136 byla „NE", přejdi ihned k otázce č. 142." O to se teď postará •-->*•! počítač sám. Když tazatel zaznamenal „NE" jako odpověď na otázku 136, jako další otázka,, se na obrazovce automaticky objeví otázka 142. CATI programy jsou opravdu docela,J|š| chytré, kontrolují tazatele. Upozorní kupř., že v určité odpovědi byl použit „ilegální" kód:,,.,* v záznamu odpovědi na otázku, která má jen tři kategorie kódované 0,1 a 2, se tazatel překlepl j;^ a zaznamenal kód 3. Program je také schopen zachytit chybné odpovědi, které jsou zřejmě nemožné nebo velice nepravděpodobné, jako např. datum narození 29. února v roce, který není přestupný, nebo dokončené vysokoškolské vzdělání u respondenta, který udal, že jeho věk je dvanáct let. Počítač upozorní ihned tazatele na tyto nesrovnalosti. Tazatel se k těmto problémům vráti a na místě je opraví. Program je také schopen zabránit náhodnému vynechání otázek: další otázka se neobjevi, dokud tazatel nezaznamenal odpověď na předchozí otázku. Chceme-li, můžeme program instruovat, aby upozornil tazatele - zejména používáme-li kontrolní otázky - na nesrovnalosti v respondentových odpovědích. CATI program může zabránit zkreslení vyvolanému pořadím otázek. V rozhovoru jakákoliv otázka může ovlivnit odpověď na kteroukoliv z následujících otázek. CATI program nám umožní měnit náhodně pořadí otázek, nebo lépe bloků otázek, a tak minimalizovat toto zkreslení. (Viz Frey 1989 aLavrakas 19S7.) Ale snad nejdůležitějším důvodem pro rychlý růst popularity CATI programů je možnost aplikace náhodné volby telefonních čísel. Při tomto postupu se konstrukce vzorku, spolu s rozhovorem, kódováním a „čištěním" dat (jak jsme to diskutovali v předchozím odstavci) stávají jedinou, souběžnou operací. Logika, na které spočívá tato technika tvorby náhodného vzorku, je totožná s technikou vícestupňového náhodného výběru, o němž jsme mluvili v páté kapitole. Náhodná volba telefonních čísel má všechny výhody vícestupňového výběru a odstraňuje i jeho nákladnost a pracnost. Z geografické oblasti dané definicí populace jsou náhodně vybrány územní jednotky definované telefonními ústřednami a pak iniciativu přebírá počítač. Generuje náhodně potřebný počet číslic, a když volané číslo odpoví, předá slovo tazateli. Ten, poté co zjistil, že volané číslo je domácí, a ne obchodní nebo úřední .: telefon, začne otázkou: „Můžete mi říci, prosím, kolik osob žije ve vaší domácností," a pak pokračuje s náhodným výběrem uvnitř domácnosti stejně, jak jsme to popsali v souvislosti s vícestupňovým náhodným výběrem. Náhodná volba telefonních čísel je velice účinnou technikou konstrukce vzorku. Klečka a Tuchfarber (1978) ji aplikovali ve výzkumu -o postojích ke zločinu, jeho obětem a k policii a porovnali výsledky se studií provedenou :,v roce 1974 rozhovorem tváří v tvář (U. S. Bureau of Census). Výsledky obou studií byly velice podobné jak vzhledem k demografické skladbě vzorků, tak vzhledem k distribuci zkoumaných postojů. 146 147 7.2 Otázky o otázkách Konstrukce otázek, to je opravdu problém, hodně komplikovaný a riskantní. Některé základní gnozeologické problémy spojené s transformací informace jsme již probrali v kapitole 3. Technické stránky stavby otázek - to je sama o sobě dost složitá záležitost, o které byla napsána celá řada knih. V naší knížce máme na to jen málo místa, jen tolik, abychom uvedli několik nejdůležitějších, víceméně technických námětů, které mohou být užitečné při konstrukci otázek. Naprostá většina toho, o čem tu budeme mluvit, platí právě tak pro rozhovor jako pro dotazník. Takže jste-li svojí povahou náchylní k dobrodružství a dáváte-li (vzhledem k zdravotnímu stavu nebo k přeplněnosti lezeckých oblastí) přednost empirickému sociologickému výzkumu před horolezectvím, je zde řada otázek, které si musíte zodpovědět o každé otázce, kterou hodláte použít pro svůj standardizovaný rozhovor nebo dotazník.