Kolik vran musíme pozorovat populace vzorek hladina významnosti směrodatná chyba pravděpodobnostní výběr náhodný vzorek interval spolehlivosti jednoduchý náhodný výběr systematický výběr náhodný stratifikovaný výběr vícestupňový výběr kvótní výběr anketa technika sněhové koule teoretická nasycenost vzorku zkreslení samovýběrem 91 Kapitola 5. Kolik vran musíme pozorovat? Když nevíš co děláš, zeptej se někoho, kdo to ví. Jerry Pournelle, téměř v každém čísle magazínu BYTE Tohle je opět kapitola o redukci informací. Je to kapitola přece jen radostnější než ty předchozí. Redukce populace na vzorek má dobře propracovanou teorii i dobře vypracované a spolehlivé recepty. Některé operace tu nejsou snadné, ale je mnoho lidí, kteří je znají a mohou nám poradit. Buďte tedy zadobře se statistiky. Touto kapitolou vstupujeme do spíše technické oblasti výzkumu. K tomu nám může hodit dobrý pomocník. Dovolte, abych vám představil Dr. Watsona. Dr. Watson je svým způsobem chytrý muž na systemizovaném místě pitomce. Je to někdo, koho každý profesor touží mít ve třídě. Doktor Watson vždycky navrhne nějakou, zdánlivě zřejmou, ale ve skutečnosti pitomoučkou odpověď, čímž umožní profesorovi nabídnout správnou odpověď, a tak se zaskvíti svojí moudrostí a učeností. Budeme služeb Dr. Watsona hodně používat. 5.1. Vzorek z nouze Začneme spíše stupidní otázkou: "Kolik vran musíme pozorovat, abychom mohli říci, že všechny vrány jsou černé?" Odpověď je tak jednoduchá, že po ní nemusíme pátrat na konci kapitoly a přirozeně zní "Všechny!" Na druhé straně asi nikdo nikdy nepozoroval všechny vrány. Nezbývá nám nic jiného, než se spokojit s tvrzením, že "většina vran je černých". Opět je to něco, co už známe: redukovaná analýza reality vede k tvrzením pravděpodobnostního charakteru. 92 Skupiny, o které se v sociologickém výzkumu zajímáme, nejsou malé. V kvantitativní verzi výzkumu jsme schopni zkoumat celou skupinu jenom výjimečně. Pravidelně jedině sčítání lidu je studií celé populace. Většinou studujeme jen některé členy skupiny a doufáme, že naše závěry budou aplikovatelné i na ostatní, na ty nestudované. To nás přivádí k dvěma základním termínům, které potřebujeme pro tuhle kapitolu: populace a vzorek (výběrový soubor). Jejich definice je jednoduchá: VZOREK: skupina jednotek, které skutečně pozorujeme POPULACE (neboli základní soubor) je soubor jednotek, o kterém předpokládáme, že jsou pro něj naše závěry platné Náš stěžejní úkol je najít postup, aby výsledky, které získáme na vzorku, byly co nejvíce podobné těm, které bychom získali na celé populaci. První věc, která nám přijde na mysl, je, snažit se mít vzorek co největší. Ale naše následující pravdivá pohádka ním ukáže, že to není jen tak: Pohádka pro odrostlejší děti 8. O hodně velkém vzorku, aneb Jak to nevyšlo Byl jednou v Americe velice rozšířený týdeník, který se jmenoval Literary Digest. Byl u svých čtenářů hodně oblíben. Byl proslulý také tím, že spolehlivě předpovídal výsledky presidentských voleb. Jeho předpovědi byly založeny na obrovském vzorku dvou milionu voličů. (Dnes jsou podobné předpovědi založeny na vzorku tisíckrát menším.) Vzorek byl zkonstruován z mnoha zdrojů. Literary Digest si opatřil adresy voličů z celých USA. Používal pro to zdroje jako telefonní seznamy, městské adresáře, adresy držitelů řidičských průkazů, členské seznamy organizací, seznamy předplatitelů novin a časopisů atd. Předpovědi byly přesné a úspěšné ve volbách 1920, 1924, 1928, 1932, a pak přišly volby v roce 1936. Literary Digest předpověděl, že presidentský kandidát Landon porazí Roosevelta rozdílem 14%. Přišel volební den a s ním i konec slávy Literary Digestu: Franklin Delano Roosevelt zvítězil drtivou většinou. 93 Cvičení 4.1. Reprezentoval vzorek použitý Literary Digestem dobře celou populaci voličů v USA? To nebylo tak těžké, že? Trochu složitější je otázka, jak je možné, že vzorek, který prakticky vyloučil z výzkumu voliče náležející k nižším sociálním třídám, fungoval dobře v předchozích volbách? Klíčem k řešení je rok: v roce 1935 vrcholila v USA hospodářská krize, a to vedlo k ostré polarizaci podle vertikální stratifikační osy. Předtím sociálně ekonomický status nehrál příliš důležitou roli v otázce volebních preferencí. Daleko větší úlohu hrály takové faktory jako náboženství, zeměpisná poloha atd. Krize to všechno změnila: sociální status začal hrát důležitou funkci. Pravděpodobně nejdůležitější bylo to, že krize přivedla k volebním urnám příslušníky nižších sociálně ekonomických vrstev, kteří předtím příliš často nehlasovali. Můžeme tedy říci, že v letech 1920-1932 předpovědi Literary Digestu vyšly jenom náhodou. Abychom byli schopni z chování vzorku předpovídat chovám populace, musí struktura vzorku imitovat složení populace tak přesně, jak je to jen možné. Dr Watson: Ale to je přeci docela lehké! Když je v populaci řekněme 51% žen, tak vyberu také 51% žen do vzorku, a když je v populaci 12% osob nad 65 let věku, vyberu také stejné procento starých osob do vzorku, atd. Tentokrát má Dr. Watson pravdu. Technika konstrukce vzorku, tak jak ji popsal,se opravdu používá. Říká se tomu kvótní výběr. Kvótní výběr imituje ve struktuře vzorku známé vlastnosti populace. Bohužel má tato technika některé nepříjemné vlastnosti. Jedna z nich souvisí se slovem "známé" v naší definici. Pro většinu populací není problém zjistit jejich skladbu podle 94 pohlaví, věku, vzdělání, povolání atd. Lze si snadno představit problém, pro který jsou důležitější jiné vlastnosti, takové, o kterých běžná statistická šetření údaje neshromažďují (kupř. věk, ve kterém se respondent poprvé zamiloval). Na další problém snadno přijdete sami: Cvičení 4.2. Navrhněte prosím, kritéria pro konstrukci kvótního vzorku pro populaci veksláků. Kvótní výběr může být použit jen na populaci, o které jsme dobře informováni, a to zdaleka není každá populace. Další obtíž je spojena s praktickou stránkou výběru přímo v terénu. Poslední krok obvykle závisí na tazateli, který vybírá jedince podle dané instrukce. Taková instrukce by mohla vypadat třeba takto: Jméno tazatele: Dr. Watson Respondent č.1. muž, věk 30-40, dokončené středoškolské vzdělání, povoláním úředník, ženatý, ale bezdětný, bydlící v rodinném domku, žijící v našem městě alespoň 5 let, ale který se narodil v obci pod pětset obyvatel... Respondent č.2. žena, věk 60-65, alespoň s dokončeným základním vzděláním, důchodkyně, která pokud byla ještě ekonomicky aktivní, měla dělnické povolání, která žije sama, v bytě alespoň o dvou místnostech a bydlí od narození v našem městě... Tak, to si od nás Dr. Watson opravdu nezaslouží. Umíte si představit, na kolik dveří by musel zaklepat, než by našel osoby, odpovídající zmíněným charakteristikám. Třeba by je nenašel vůbec, možná, že vůbec neexistují. Ve skutečnosti je instrukce v kvótním výběru mnohem skromnější. Navrhuje jen několik málo proměnných, takových jako pohlaví, věk a povolání. Lokalita a typ obce je obvykle dán působištěm tazatele. Jinak nejsou tyto proměnné vázány do určitých kombinací. Instrukce by mohla znít takto: "Hovořte s deseti osobami, z toho se 95 šesti ženami a čtyřmi muži. Vyberte 3 osoby ve věku pod 20 let, 5 ve věku 21-50.." O ostatních, pro nás třeba daleko důležitějších proměnných můžeme jenom doufat, že budou ve vzorku dostatečně správně reprezentovány. Dr. Watson: Co si s tím ale počneme? Odpověď nám nabízí titul následujícího paragrafu. 5.2. Hodíme si korunou aneb Pravděpodobnost pro Dr. Watsona Představme si, že máme velikou krabici, plnou kuliček, a že všechny kuličky jsou zelené. Dobře krabicí zatřepeme a poslepu vybereme jednu kuličku. Jakou máme šanci, že vybraná kulička bude zelená? To byla ale pitomá otázka, že ano? Tak si teď zkusme něco trochu složitějšího: Máme teď jinou populaci kuliček, sestávající ze zelených a červených kuliček. Těch zelených je 80% a těch červených je ovšem 20%. Ale počkejte, já se vás nebudu ptát, jaká je pravděpodobnost, že si náhodně vyberete červenou kuličku. To byla otázka jen o málo méně pitomá, než ta první, a všichni víme, že ta pravděpodobnost je 20%, a chceme-li to vyjádřit učeněji, můžeme říci, že p = 0,20. My tu máme jiný úkol: zjistit, jaká je skladba populace, aniž bychom prohlíželi všechny kuličky. Jinými slovy, hledáme metodu, jak vytvořit vzorek, který by dobře reprezentoval celou populaci kuliček. Můžeme zkusit třeba toto: Opět začneme tím, že krabicí dobře zatřeseme. To není vtip, to je opravdu nutné: každá kulička musí mít stejnou pravděpodobnost, že bude vybrána. (Co kdyby všechny červené kuličky byly navrchu?) a teď vybereme poslepu 10 kuliček. Uvidíme třeba, že jsme vybrali 6 červených a 4 zelené. To je dost daleko od dobré reprezentativity. Perfektní vzorek by měl přeci obsahovat 20% červených a 80% zelených. Tedy vybereme opět poslepu dalších deset kuliček. Třeba 6 z nich bude zelených a 4 červené. Přidáme je k našemu původnímu vzorku. Nový, větší vzorek sestává z 10ti červených a 10ti zelených kuliček. Teď bychom odhadli, že v populaci je stejné procento červených, jako zelených kuliček. To ještě není vůbec dobré. Museli bychom tedy pokračovat, přidávat další a další kuličky. Brzy bychom zpozorovali zajímavou věc: 96 Sostoucí velikostí vzorku se rozdíl mezi strukturou populace a vzorku zmenšuje. Nejdříve rychle, pak pomaleji a pomaleji. Úplné shody mezi strukturou populace dosáhneme teprve tehdy, když jsme zahrnuli všechny elementy populace do vzorku. ÄC^L Dr.Watson: "Ale to je všechno nesmysl! Když je to pravda, jak je potom l Vra J možné, že obrovský vzorek použitý Literary Digestem vedl k tak nesprávným výsledkům?" Asi už víte, co bychom mohli odpověď na tuhle námitku: "Ale to je přece elementární, Watsone. Ti lidé z Literary Di gestu zapomněli pořádně zatřást krabicí." Voliči z nižších socioekonomických vrstev měli mnohem menší šanci býti vybráni do vzorku, než voliči ze středních a vyšších vrstev, což dramaticky zkreslilo výsledky. My jsme tu totiž, aniž bychom o tom věděli, vytvořili náhodný vzorek "populace" kuliček. A náhodný vzorek, to je aristokrat mezi vzorky; má mnoho jedinečných, a pro nás důležitých, vlastností. Všechno, co budeme v tomto odstavci probírat, se týká jenom vzorku, které byly vytvořeny opravdu náhodným výběrem. Termín "náhodný" neznamená'výběr nazdařbůh. I když náhodný výběr může být, jak brzy uvidíme, technicky velmi obtížný a často i nemožný, jeho definice je jednoduchá: Náhodný (pravděpodobnostní) výběr je takový výběr, ve kterém každý element populace má stejnou pravděpodobnost, že bude vybrán do vzorku. To se lépe řekne než se to udělá. Ale dovolte, abych vás ještě dříve než budeme mluvit o řadě trampot, dobře naladil popisem pozoruhodných vlastností náhodného vzorku. Snad 97 nejdůležitější z nich, alespoň pro nás sociology - statistik by s námi možná nesouhlasil - je tato vlastnost: Náhodný vzorek reprezentuje všechny známé i neznámé vlastnosti populace. A ještě dříve, než Dr. Watson začne namítat, uveďme si jednoduchý příklad. Máme teď novou populaci kuliček. Jsou opět červené a zelené. Ale mají ještě jednu zajímavou vlastnost, o které my nevíme: Jsou duté a uvnitř každé je malý papírek a na každém tom lístku je něco napsáno. (Znáte "fortune cookies" z čínských restaurací?) Třeba nějaké neslušné slovo. Když jsme vybrali dobrý náhodný vzorek kuliček, budou reprezentovat celou populaci kuliček nejen vzhledem k distribuci barev, ale i vzhledem k distribuci neslušných slov, i když o tom nevíme a třeba nikdy nebudeme vědět. Uveďme si jiný, užitečnější příklad. V náhodném vzorku obyvatelstva hlavního města Prahy budeme mít slušnou reprezentaci populace vzhledem k věku, pohlaví, vzdělání, povolání, politické orientaci, vzhledem ke všem postojům, ale i reprezentaci třeba vzhledem k oblíbeným jídlům, počtu zubních kazů, věku, kdy se lidé poprvé zamilovali, množství vypitého piva, počtu milenek, počtu veksláků, peněžní hodnotě nakradeného zboží, číslům bot, prostě vzhledem ke všemu. To neznamená, že tohle všechno budeme schopni měřit, to je jiný problém. Ale znamená to, že at už je naším cílem cokoli, víme, že proměnné, které jsou pro nás relevantní, budou mít v našem vzorku podobnou distribuci, jaká existuje v celé populaci a naše závěry jsou tedy na tuto populaci aplikovatelné. Náhodný výběr má ještě jednu pozoruhodnou vlastnost: U náhodného vzorku jsme schopni odhadnout, jak se vzorek liší od populace. Jinými slovy, jsme schopni určit, jak dobrý je náš vzorek. Teď je na čase naučit se několik slov z odborné hantýrky, jednak abychom mohli oslnit přátele, jednak abychom rozuměli správně významu publikovaných statistických dat. Podívejme se na následující tabulku: 98 Tabulka 5.1. Velikost vzorku a konfidenční interval na 95% hladině významnosti pro alternativní znaky při distribuci 50:50 Velikost vzorku Konfidenční interval 100 ± 10% 400 ±5% 1600 ± 2.5% Adaptováno z Babbie: Social Research tor Consumer, 1982 To vypadá dost učeně, že? Ale nebojte se. Pochopit princip, a vědět jak se taková věc aplikuje, není těžké. Trochu obtížnější je statistické zdůvodnění. Ale takové vysvětlení necháme pro někoho jiného, kdo vás uvede do zajímavého světa skutečné statistiky. Řekněme, že jsme vybrali náhodně 400 kuliček a zjistili jsme, že ve vzorku ( neboli ve výběrovém souboru) je 78% zelených kuliček. Protože jsme nevybrali všechny kuličky, musíme předpokládat, že jsme se dopustili určité chyby, že pozorovaná relativní četnost zelených kuliček ve vzorku se liší od procenta, které skutečně existuje v celé populaci (základním souboru). My však potřebujeme vědět, jak moc se mýlíme. A v tom nám pomůže ta nepřátelsky vyhlížející tabulka. Pozor! Tahle tabulka je jen ilustrací a platí jen tehdy, je-li v populaci právě tolik zelených jako červených kuliček. Platí jen pro alternativní (binomické) proměnné, to je pro takové znaky, které mají jen dvě kategorie, jako ANO a NE. V našem případě, zelená a "nezelená" kulička. Velikost našeho vzorku je 400 a této velikosti vzorku odpovídá konfidenční interval (interval spolehlivosti) 5%. Odečteme tedy tuto hodnotu od pozorovaných 78% a dostaneme tedy 73%. Pak ji opět přičteme k pozorované hodnotě a dostaneme horní mez. a teď víme, že skutečná proporce zelených kuliček v celé populaci je mezi 73 a 83% Jenomže to nevíme docela určitě, vždyt jsme nepozorovali všechny kuličky. Ted se dostáváme k tomu poněkud kryptickému výrazu v podtitulu naší tabulky: hladina významnosti. 99 Kapitola 6. Jak se to vlastně dělá 6.1. Co dřív? A teä už je načase se podívat na typický jízdní řád průměrného výzkumu. V kvantitativním výzkumu se obvykle setkáme s těmito kroky: 1. Formulace teoretického nebo praktického sociálního problému. 2. Formulace teoretické hypotézy. 3. Formulace souboru pracovních hypotéz. 4. Rozhodnutí o populaci a vzorku. ^ c;/^ 5. Pilotní studie. 6. Rozhodnutí o technice sběru informací. .:. : ^'h ' 7. Konstrukce nástrojů pro tento sběr. 8. Předvýzkum. s i ? -. 9. Sběr dat. 10. Analýza dat. 11. Interpretace, závěry, teoretické zobecnění. První čtyři kroky už známe a z prvých tří kapitol víme už dost proto abychom učinili poslední krok - interpretaci a zobecňování dat. Podívejme se teď na pátý krok. Definice pilotní studie a předvýzkumu se u různých autoru liší. My zde nabízíme definice používané ve většině americké literatury, i když jsou odchylné od definic užívaných u nás. účelem pilotní studie je zjistit, zda je náš výzkum vdané populaci vůbec možný. Naproti tomu účelem předvýzkumu (bod 8. v našem schématu) je odzkoušení nástrojů (kupř. dotazníku), které jsme pro náš výzkum zkonstruovali. 120 Podívejme se teď velice krátce na pilotní studii: Pilotní studie je prováděna na malé skupině vybrané z populace, kterou hodláme studovat. Technika tohoto kroku se podstatne liší od techniky, kterou hodláme použít ve vlastním výzkumu; nejčastěji zde používáme kvalitativní postupy (kupř. nestandardizovaný rozhovor). Cílem pilotní studie je zjistit, zda informace, kterou požadujeme, v naší populaci vůbec existuje a zda je dosažitelná. Pokud nemáme opravdu hlubokou znalost o cílové populaci, zejména vzhledem ke studované problematice, pilotní studie je velice důležitá. Dr. Watson: Ale to my přece u nás vůbec nepotřebujeme! U nás přece neexistují žádné neznámé populace! Bohužel, mnoho lidí sdílí tenhle názor s Dr. Watsonem. Někdy to může být nebezpečné. Žádná společnost není kulturně homogenní a každý z nás má tendenci soudit jiné kultury či subkultury z pozic naší vlastní kultury. Říkáme tomu etnocentrismus a budeme o tom hovořit později. Když dva říkají totéž, nemusí to nutně totéž znamenat. Vzpomeňme si jen na náš příklad s Egri Bikaverem v naší pohádce č. 2. Dále, to, co je v jedné skupině takovou informací, která může být snadno předána neznámému tazateli, v jiné subkultuře může být považováno za informaci, která "má zůstat v rodině". Různé profesionální subkultury mohou mít velice specifický systém hodnot, který je odlišný od hodnot existujících ve společnosti obecně. Tyto skupinové neformální normy často zabraňují tomu, aby se podávaly jakékoliv informace o nich všem nečlenům. Nemusí tu jít vůbec o nějaké ilegální skupiny: kupř. výzkum na populaci policistu je velmi obtížný všude na světě. Podobné problémy mohou být spojeny se zkoumáním etnických kultur. Kvantitativní akce kupř. na populaci Rómů by byla bez seriózní pilotní studie nezodpovědná. 121 Pilotní studie je velmi často opomíjena, a to i v případech, kdy je to riskantní. Jako vždy, je to problém času a peněz. Ale úspory v této etapě mohou být zaplaceny pochybnou validitou našich výsledků a mohou nakonec vyústit ve výzkumnou akci, která je zcela nevalidní. Stejně nebezpečné je opominutí předvýzkumu: Předvýzkum je opět prováděn na malém vzorku naší cílové populace; tento vzorek je však obvykle větší, než vzorek pro pilotní studii. Předvýzkum je testem nástrojů, které ve výzkumu hodláme použít. Cílem tu je obvykle testovat srozumitelnost a jednoznačnost otázek. To je jedna z těch podivných věcí, které potkáváme ve výzkumné praxi: Když čteme záznamový arch, který konstruoval někdo jiný, je poměrně snadné poznat, že určité otázky nejsou zcela srozumitelné, že jiným otázkám je možno porozumět více než jedním způsobem. Na druhé straně je téměř nemožné objevit stejné neduhy v otázkách, které jsme formulovali sami. Já to vím, sám jsem si s tím nejednou udělal ostudu. Ale nespoléhejme s revizí otázek na vlastní kolegy. Oni totiž většinou patří ke stejné kulturní skupině jako my, mají přibližně stejný okruh znalostí, podobný systém hodnot. Značná část naší cílové populace může být velice odlišná. Zatímco určitá otázka je pro nás zcela přijatelná, pro jiné skupiny v populaci může být velice iritující. Něco, co považujeme za běžnou znalost, nemusí být tak docela běžné. Jen předvýzkum na vzorku cílové populace může minimalizovat, i když určitě ne vyloučit, omyly tohoto typu. Zatímco opominutí pilotní studie nás v některých případech nemusí vytrestat vážným zkreslením, opomenutí předvýzkumu je nesmírně riskantní: předvýzkum by měl být nezbytnou součástí každé výzkumné akce. Když už pilotní studie byla skončena (a přirozeně ještě předtím, než můžeme začít s předvýzkumem) vstupujeme do velice zajímavé, ale velice rozsáhlé a komplexní oblasti konstrukce výzkumných nástrojů a do oblasti strategie práce v terénu. Důkladné seznámení s touto oblastí by vyžadovalo celou knihu a my máme k dispozici jen jednu kapitolu. Zbývají nám tu jen dvě věci: odkázat na dostupnou (a někdy méně dostupnou literaturu) a nabídnout velice stručný pohled na základní techniky sběru informací, na oblasti jejich uplatnění 122 a zejména upozornit na to, jak a kde jsou tyto techniky nejzranitelnější. V této kapitole bychom chtěli také alespoň připomenout existenci některých méně obvyklých technik sběru. Tak, a už máme nejvyšší čas začít. Dr. Watson si už hlasitě stěžuje, že by chtěl konečně začít s konstrukcí dotazníku 6.2. Ptát se nebo neptat? To je opravdu otázka. Mnohem širší a složitější, než by se na prvý pohled zdálo. Je mnoho a mnoho různých technik sběru dat. Vyjmenujme si tu alespoň několik z nich: standardizovaný rozhovor, nestandardizovaný rozhovor, skupinový rozhovor, dotazník, pozorování, telefonní výzkum, sociometrické techniky, sémantický diferenciál, sekundární analýza, zúčastněné pozorování a mnoho a mnoho jiných... Naštěstí, téměř všechny z těchto postupů jsou aplikací následujících základních technik: přímé pozorování rozhovor dotazník analýza dokumentů Podívejme se nejdříve na definice těchto technik: 123 Přímé pozorování: To je zaměřené, dobře plánované vnímání vybraných jevů. To, co bylo vnímáno, je pečlivě a systematicky zaznamenáváno. -X - rfXf) Rozhovor: Vyžadované informace jsou získávány v přímé interakci s respondentem. Rozhovor může být prováděn tváří v tvář nebo telefonicky. Dotazník: Respondent odpovídá písemně na otázky tištěného formuláře. Analýza dokumentů: To je analýza jakýchkoliv dokumentů, které nebyly vytvořeny za účelem našeho výzkumu. Záznamem mohou být právě tak dobře psané dokumenty jako jakékoliv materiální' stopy lidského qhování. .? ,, / t a ynf f Podívejme se nejdříve na všechny tyto základní techniky najednou, na jejich aplikovatelnost v různých formách i přístupech a srovnejme jejich epistemologické vlastnosti. Přímé a nepřímé sledování O tom jsme již hovořili v prvých dvou kapitolách; v sociologickém výzkumu většinou nesledujeme samotný studovaný jev, ale pouze jeho indikátory. Jen v technice přímého pozorování, je-li studovaným jevem chování, jsme schopni sledovat studovaný fenomén přímo. Experimentální a neexperimentálni aplikace Ze čtyř základních technik sběru informací mohou tři být použity v experimentu. Studium dokumentů však ne. Nezapomeňme, že ve smyslu naší definice považujeme za dokument jen takové záznamy, které nebyly vytvořeny pro náš výzkum. To vylučuje možnost zachytit změny, vyvolané manipulací s experimentální proměnnou. 124 Tabulka 6.1. Přímé pozorování Rozhovor Dotazník Dokumenty Co ie sledováno: jev někdy ne ne ne indikátor ano ano ano ano Použitelnost v experimentu ano ano ano ne Forma standardizovaná ano ano ano ano nestandardizovaná ano ano ne ano Interference se zkoumaným systémem někdy ano ano ne Standardizované a nestandardizované aplikace Všechny tyto základní techniky mohou být použity ve standardizované formě, tri z nich i v nestandardizované; dotazník je přirozeně vždy standardizovaný. Koncept standardizace je 125 Kapitola 10. Ten druhý výzkum aneb Dokázat nebo rozumět? Kvalitativní výzkumník: Mnoho lidí je dnes znuděno svou prací a jsou... Kvantitativní výzkumník (přerušuje): Jací lidé, kolik jich je, jak dlouho mají takové pocity, odkud jsou... Kvalitativní výzkumník: Zapomeň na to... John Van Mahnen (Patton 1980) 10.1. Nová pravidla Dosud jsme se zabývali asi takovýmito nálezy sociologického výzkumu: Nižší socioekonomický status etnických minorit je očekávaným faktem v Severní Americe. Nicméně rozdíly mezi v Kanadě narozenými starými občany na jedné straně a starými Italy na straně druhé jsou daleko silnější, než jsme očekávali. Průměrné vzdělání anglicky mluvících osob v naší věkové skupině, popsané v letech formálního vzdělání je přibližně čtyřikrát vyšší než vzdělání Italů a šestkrát vyšší než vzdělání Portugalců. Dvě třetiny našeho portugalského vzorku jsou bez jakéhokoliv formálneho vzdělání. Totéž je pravda jen pro desetinu Italů. Ani jediná osoba z anglického vzorku nespadá do této kategorie...Přibližně jedna třetina starých Italů je schopna komunikovat v angličtině "dobře", nebo "poměrně dobře". Jen o něco méně než jedna desetina Portugalců náleží do této kategorie. Více než třetina starých osob v portugalské subpopulaci není schopna komunikovat v angličtině vůbec. 284 Ale výsledky výzkumu mohou mít také docela jinou formu. Alfred Schutz ve své studii Cizinec (Schutz 1966) analyzuje proces, ve kterém se cizinec, řekněme emigrant, snaží proniknout do nové kultury, která je mu cizí. O problému jazyka říká toto: Aby člověk mohi zvládnout jazyk jako schéma výrazu, musel v něm psát své milostné dopisy. Musí vědět jak se modlit v tomto jazyce a jak proklínat a jak říkat věci tak, aby vyjádřily každý odstín vyžadovaný danou situací. Dr. Watson (zoufale): Ale to přece není věda. To je snad poezie, ale určitě ne věda! Ne tak zoufale, drahý doktore, to je jen jiný přístup k poznání sociální reality. Kvalitativní výzkum má jiné cíle, a tedy i jiná pravidla. Kvantitativní výzkum je schopen nabídnout hodně užitečné informace o mnoha emigrantech. Je schopen říci, jak zobecnitelné jsou naše výsledky, je schopen potvrdit nebo vyvrátit naše hypotézy, vypočítat, jaká je pravděpodobnost, že se mýlíme. Ale cena, kterou za tyto schopností kvantitativního výzkumu platíme, není nízká. Důkazem závažnosti tohoto problému jsou data o jazykových schopnostech starých Portugalců a Italů v Torontu. Ale taková data neosvetlí, co to pro člověka opravdu znamená komunikovat v jazyce, který není jeho vlastním. Dvě věty formulované Schützern mohou nabídnout mnohem silnější vhled do lidské dimenze sociální situace, než rozsáhlá kvantitativní empirická studie. V ní je mnohodimenzionální sociální a lidská realita redukována na omezený počet několika málo proměnných a na malý počet analyzovaných vztahů mezi nimi. V učebnicích můžeme najít desítky různých definicí kvalitativního výzkumu. Typická definice může znít třeba takto: Kvalitativní výzkum je nenumerické šetření a interpretace sociální reality. Cílem tu je odkrýt význam podkládaný sdělovaným informacím. 285 Pro pochopení rozdílů obou těchto postupů je vhodné uvědomit si formální rozdíly cílů: Cílem kvantitativního výzkumu je testování hypotéz. Cílem kvalitativního výzkumu je vytváření nových hypotéz, nového porozumění, vytváření teorie. Porovnejme si alespoň heslovitě základní epistemologické rozdíly mezi kvantitativním a kvalitativním výzkumem, vyplývající z této rozdílnosti v cílech. Podmínkou testování hypotéz je získání informace, která by byla reprezentativní pro celou cílovou populaci. Cílem kvalitativního výzkumu je porozumění. Porozumění pak vyžaduje vhled do co největšího množství dimenzí daného problému. Rozdíly v cílech pak kladou různé požadavky na optimalizaci redukce a transformace informací. Tabulka 10.1. shrnuje základní rozdíly mezi kvantitativním a kvalitativním výzkumem z hlediska redukce informace. Tabulka 10.1. Redukce informace v kvantitativním a kvalitativním výzkumu Kvantitativní výzkum Kvalitativní výzkum Omezený rozsah informace o velice mnoha jedincích Mnoho informace o velmi malém počtu jedinců. Silná redukce počtu pozorovaných proměnných a silná redukce počtu sledovaných vztahů mezi těmito proměnnými. Silná redukce počtu sledovaných jedinců. Generalizace na populaci je většinou snadná a validita této generalizace je měřitelná. Generalizace na populaci je problematická a někdy i nemožná. A teď se podívejme, jaké jsou rozdíly mezi oběma postupy z hlediska transformace informace. Především, testování hypotéz vyžaduje co nejvyšší formální srovnatelnost dat. Pro kvalitativní výzkum to však není notné. To pak má zajímavé epistemologické následky: 286 Kvantitativní výzkum Kvalitativní výzkum vyžaduje velice silnou standardizaci. Silná standardizace zajištuje Standardizace v kvalitativním výzkumu je slabá a proto má kvalitativní výzkum pomerne vysokou reliabilitu nízkou reliabilitu Silná standardizace vede nutně k silné redukci informace. Respondent, místo aby plně popsal svoje mínění, je omezen na volbu jediné kategorie z nabídnutého velice malého souboru kategorií.To nutně vede k Slabá standardizace kvalitativního výzkumu, volná forma otázek a odpovědí nevynucuje taková omezení, jaká existují v kvantitativním výzkumu. Potenciálně proto může mít kvalitativní výzkum pomerne nízké validitě vysokou validitu. Rozdíl v cíli obou metod je však především odrážen v jejích zásadně odlišné logice: Logika kvantitativního výzkumu je deduktivní. Na začátku je problém existující buď v teorii nebo sociální realitě. Tento problém je přeložen do hypotéz. Ty jsou základem pro výběr proměnných. Sebraná data jsou použita pro testování hypotéz a výstupem kvantitativního výzkumu je soubor přijatých nebo zamítnutých hypotéz. Ale to všechno už znáte, zejména ze čtvrté kapitoly. Naproti tomu kvalitativní výzkum používá induktivní logiku. Na začátku výzkumného procesu je pozorování, sběr dat. Pak výzkumník pátrá po pravidelnostech existujících v těchto datech, po významu těchto dat, formuluje předběžné závěry a výstupem mohou být nově formulované hypotézy nebo nová teorie. V kvantitativním výzkumu sbíráme jen ta data, která nutně potřebujeme k testování hypotéz. V kvalitativním výzkumu se snažíme sebrat "všechna data" (teď trochu přeháním) a nalézt struktury, pravidelnosti, které v nich existují. Můžeme si to představit třeba tak, jak je to znázorněno v grafu 10.1. a 10.2. 287 Graf 10.1. Kvantitavní výzkum: DEDUKCE Hypotéza: Data: Mají data formu písmene L? xxxxxxxxxxxxxxxxxxx xxxxx xxxxxxxxx xxxxx xxxxxxxxx xxxxx xxxxxxxxx xxxxx xxxxx xxxxx xxxxx xxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxxxxx Kvantitativní výzkum testuje hypotézy, které byly formulovány a priori. V našem grafickém znázornění pátrá po tvaru ve formě písmena L a jenom po tomto tvaru. Všechny ostatní možné konfigurace, at již jsou sebevýznamnější, jsou v testování hypotéz naprosto neviditelné. Jen náhodně se může stát, že výsledky analýzy jsou neočekávané a upozorní nás na přítomnost něčeho, co jsme nepředpokládali a co může být pro studovaný problém důležité. Na druhé straně je však kvantitativní výzkum schopen říci, jaká je pravděpodobnost, že konfigurace v podobě písmene L skutečně v populaci existuje, jak dobře pozorovaný tvar odpovídá tvaru předpověděnému v hypotéze a jiné velice důležité informace tohoto typu. Naproti tomu induktivní postup kvalitativního výzkumu (graf 10.2.) pátrá po jakékoliv struktuře, která existuje v proměnných v oblasti jeho zájmu. Teoreticky by kvalitativní výzkumník by neměl očekávat žádnou určitou konfiguraci. Deduktivní postup by v datech zobrazený v grafu 10.2. neobjevil žádnou strukturu, protože konfigurace v tvaru L v nich neexistuje, a po jiných tvarech kvantitativní výzkum nepátral. Graf 10.2. 288 Schopnost kvalitativního výzkumu nalézt i neočekávané pravidelnosti ve struktuře dat není ovšem zadarmo. Platíme za ní omezenou schopností generalizovat naše závěry na populaci, alespoň ne těmi klasickými postupy, které již známe. A samozřejmě nejsme schopni kvantitativně definovat pravděpodobnost, že naše závěry jsou platné. Dr.Watson: Já tomu nerozumím. Od začátku knížky zdůrazňujeme, že přirozené systémy v sociálních vědách jsou obrovské a že není prakticky možné sebrat všechny informace. Řekl jste nám mnohokrát, že úplný popis systému není možný, že každý popis, který provedeme, bude nutně redukovaný. Ale logika deduktivního postupu vyžaduje úplný popis! Tak tohle je opravdu závažná námitka. Nesmíme ale zapomenout, že posláním kvalitativního výzkumu je porozumění lidem v sociálních situacích. Kvalitativní výzkum by byl asi velice neohrabaným a málo produktivním nástrojem kupř. studia objektivních determinant jednotlivcova příjmu. Naproti tomu je kvalitativní výzkum nesmírně účinným nástrojem třeba pro studium subjektivních dimenzí příjmu; např. pro studium takových otázek, jakou částku 289 a proč respondent považuje za vysoký příjem, co a proč by splnilo jeho materiální sny, jak vnímá příjmy jiných lidí, co by podle respondenta mělo být kritériem spravedlivého peněžního odměňování. Jistě každý z nás by byl schopen naformulovat chytré uzavřené otázky, testující hypotézy týkající se všech zmíněných otázek. Problém je ale v tom, že je velice těžké určit předem, které proměnné jsou pro tyto problémy relevantní. Mnohé faktory jsou opravdu nepředvídatelné. Racionální kategorie, které je výzkumník nejspíše schopen zkonstruovat, nemusí být pro respondenta rozhodující, nicméně respondent vybere některou z kategorií, když "ta jeho" nebyla zahrnuta. Tak známe středočeskou vesnici, ve které je značná rivalita mezi "dolním" a "horním koncem". Zde se zdá, že důležitou komponentou spokojenosti s příjmem je to, zda je vyšší než příjem někoho v podobném postavení, kdo žije na opačném konci obce. V kvalitativním výzkumu výběr proměnných není prováděn výzkumníkem. V kvalitativním výzkumu o redukci dat de facto rozhodují zkoumané osoby. Výzkumník vede respondenta k tomu, aby mu řekl co nejvíce o příjmu a doufá, že zkoumaná osoba vybere vše, co je pro ni relevantní. "Přirozeným systémem" tu je respondentova znalost, zkušenosti, jeho postoje, pocity, prostě subjektivní dimenze daného problému, tedy prostor, který respondent dobře ovládá. Respondent není vtlačován do předem připravených schémat. Výzkumníkovou úlohou je pak naiézt významné struktury v množině všech proměnných, které respondent považuje za relevantní. V tom je právě největší síla kvalitativního výzkumu. 10.2. K čemu je to dobré? Kvantitativní a kvalitativní výzkum jsou vlastně vzájemně komplementární. Ideální epistemologická souhra mezi oběma postupy je znázorněna v grafu 10.3. Výstup z jednoho typu výzkumu je převzat druhou metodou a znalost tak může být kumulována a prohlubována v nekonečném kruhu, nebo snad lépe, spirále poznání. Ale i každá z těchto metodologií může být sama o sobě soběstačným poznávacím systémem. Podívejme se nejdříve na možnosti spolupráce mezi oběma postupy. Tradičně byl kvalitativní výzkum považován jen za pomocnou metodu, použitelnou snad jen v před výzkumu. Ale i tato poslužná role kvalitativního výzkumu byla, a bohužel stále ještě je, značně podceňována a zanedbávána. A to ovšem může být velice nebezpečné. 290 Graf 10.3. Kvalitativní výzkum nám pomáhá rozumět pozorované realitě. Kvantitativní výzkum testuje validitu tohoto porozumění. Sociolog se často podobá cizinci, jenž vstupuje do kultury, která není jeho vlastní. Budeme se tím zabývat v příští kapitole věnované srovnávacímu výzkumu, ale příměr "cizince" platí i pro výzkum v naší vlastní zemi. Sociolog, výzkumník zabývající se výzkumem trhu, administrativní pracovník, prostě každý, kdo se musí zabývat sociálními problémy, se setkává s kulturami, nebo chcete-li se subkulturami, které jsou mu alespoň částečně cizí. Mají třeba odlišné vzdělání, prošly jiným typem socializace, patří do jiné věkové skupiny, mají jinou historickou zkušenost atd. Každá kultura, ke které přistupujeme z vnějšku, se nám může zdát podivnou a je velice snadné takovou kulturu mylně interpretovat. To je problém velice povědomý, kulturním antropologům. Podívejme se tu alespoň na výňatky ze zajímavé antropologické studie. Horace Milner: Body Ritual among Nacirema, American Anthropologist, 58 (1956), str. 503-507. Parafrázováno W.C. Levinem v Sociological Ideas, 1988: str. 100-101. Nacirema mají velice extrémní' zvyk, rituál zaměřený na své tělo. Tento rituál... je založen na víře, že tělo je v podstatě ošklivé a mající tendenci k zániku. Nacirema se věnují složitým rituálům, pro které mají speciální svatyně, vestavěné do jejich sídlišt. V takové typické svatyni je řada významných objektů. Na stěně každé takové svatyně je speciálně konstruovaná skříňka, ve které jsou přechovávány magické roztoky a talismany.Ty jsou opatřovány od mocných šamanů, kteří instruují bylinkáře, jak tyto preparáty připravit. Tyto přípravky jsou velice drahé... 291