Metodologie – průzkum veřejného mínění •Cíl: kvantifikovat postoje •Nutnost: standardizace otázek •Dobrá explanace •Dobrá operacionalizace • Survey metoda •PAPI (pen and paper) •CAPI (computer assisted personal) •CATI (computer assisted telephone) •IRV (interactive voice response) •CASI (computer assisted self-interview) •CAWI (computer aided web interviewing) • Tazatel •Trénink •Zprostředkovatel mezi dotazníkem a respondentem •Musí znát dotazník •Problémy: Důvěra, interviewer bias •Neutralita, nereagovat na odpovědi •Může vysvětlit •Menší drop out rate •Citlivé otázky – lepší self-administered •PAPI: větší kontrola, ale musíte mít důvěru v tazatele •Použití karet •Drahý sběr •Kontrola? Nahrávky, gps.. • Většina dotazníků – výběrový soubor •Výsledek vždy nepřesný •Vždy zkreslení díky náhodě •Nelze jednoduše zobecnit •Odhad – ze vzorku na populace •Podmínka generalizace: dobrý sampling Sample survey •Element •Populace •Výzkumná populace •Sampling frame •Reprezentativita •Výběrová chyba Techniky vzorkování •Nepravděpodobnostní vzorky •Pravděpodobnostní vzorky •Můžete spočítat šanci, že se daný element dostane do vašeho vzorku •Lze spočítat pravděpodobnost, že je váš vzorek reprezentativní • Dostupné subjekty (convenience sample) •Lidé na ulici •Studenti •Co nejvíce dostupný soubor •Riziko •Nezobecňovat Purposive sample •Na základě vlastního úsudku •Podle povahy a cíle výzkumu •Často u pilotáže •Vlastní úsudek o tom, které subjekty jsou vhodné •Např.: lídři protestního hnutí •Studenti s pravicovou/levicovou orientací •Poslanci •Outliers Snowball •Kvalitativní výzkum •Explorační záměry •Nereprezentativní Kvótní výběr •Jednotky vybrány na základě charakteristik •Cíl: stejná ditribuce jako u cílové populace •Tabulka daných charakterisitk a proporce •Nepravděpodobnostní •Lze přidávat výhy podle proporce v popuaci 18-39 let 40-59 let 60+ let Muž Hlavní město 3.7% 7.7% 7.5% Město 2.8% 5.2% 3.1% Venkov 7.2% 5.4% 3.9% Žena Hlavní město 3.9% 8.6% 10.8% Město 4.0% 3.9% 4.5% Venkov 6.2% 6.3% 5.4% Kvóta •Je reprezentativní? Pravděpodobnostní výběr •Každá jednotka v populaci má známou nenulovou pravděpodobnost, že bude vybrána (není stejná pro všechny) Simple random sampling •Potřebujeme sampling frame, vybereme náhodně •(Excel, F = RAND nebo RANDBETWEEN) • • Systematic sampling with a random starting point •Sampling frame •Každý má unikátní číslo •Každý K-tý element bude vybrán •Sampling interval (population n/sample n) 20 000/100 = 200 (každý 200. element vybrán) •Náhodně vybráno číslo (56) •56, 256, 456…. •Je třeba mít tu populace opravdu náhodně seřazenou •Pozor na vzorce v řazení (např ročníky, abecední řazení podlele skupin atd.) Stratified sampling •Tabulka s populačními poměry •Podle toho stratifikujeme seznam •Vybíráme náhodně ze skupin •Je to doplňková technika v celkové strategii, ne samostatná procedura •Lze kombinovat •Chce to dimenze, které spolu nekorelují a jsou pro náš design přínosné Multistage cluster sampling •Když nemáme seznam všech element v populace •Nejprve samplink skupin elemetů (clusters) •Výběr clusterů, ze kterých vytvoříme seznamy a budeme vybírat •Národně reprezenativní vzorky Příklad •Systematický stratifikovaný výběr s náhodně určeným začátečním bodem – výběr města •1. seřadit města podle populace •2. sampling interval, náhodně stanovit první číslo a pak výběr na základě výběrového intervalu •3. náhodný výběr lidí ze seznamu obyvatel města Proporčnost počtu elementů •Pokud jsou clustery města) nestejně velké – mohlo by dojít k nadreprezentaci lidí z velkých měst • •STAGE I. Výběr skupin (e.g. obcí) podle velikosti Město se 40.000 obyvateli má 4x větší šanci, že se dostane do vzorku než město se 10 000 obyvateli •STAGE II. Výběr stejného počtu elementů z každého města. Např. 100 lidí z každého města •Pravděpodobnost jedince z jakéhokoliv města v zemi, že bude vybrán? •Příklad: země má 10 000 000 obyvatel a 3000 obcí: chceme vybrat 100 obcí a 100 lidí z každé obce, dohromady 10.000 lidí • • Šance, že bude vybráno malé mesto 100*(10.000/10.000.000)=0.1 Šance, bude-li vybráno malé město, že se do vzorku dostane jeho obyvatel: 100/10.000=0.01 Celková šance, že se člověk dostane do vzorku: : 0.1*0.01=0.001, thus 0,1% Šance, že bude vybráno velké mesto: 100*(40.000/10.000.000)=0.4 Šance, bude-li vybráno velké město, že se do vzorku dostane jeho obyvatel: 100/40.000=0.0025 Celková šance, že se člověk dostane do vzorku: 0.4*0.0025=0.001, thus 0,1% TOTÁLNÍ CHYBA VÝZKUMU •Survey research většinou produkuje nepřesnosti •https://zpravy.aktualne.cz/domaci/analyza-pruzkumy-na-pranyri-volby-ukazaly-kdo-je-umi/r~b3d2a54cb 71911e79090002590604f2e/ •https://interaktivni.rozhlas.cz/volebni-pruzkumy/ •Kolísavá kvalita •Pravděpodobnost chyby na všech úrovních procesu sběru, meření, analýzy a interpretace •Cíl co největší validita a reliabilita Coverage error •Pokud chci dělat generalizace •Pracuji s populace •Můj sampling frame vykazují systematický bias •Např. telefonní čísla vzhledem k target population = voliči nd 18 let Sampling error •Pokud mám vzorek •Když budu opakovat měření na jiném stejně velkém vzorku, budu mít jiný výsledek •Často jako tolerance chyby, margin of error •suma všech možných výběrových chyb kvantifikující nejistotu výsledků •Interval spolehlivosti (např 95% - rozpětí kolem naměřené hodnoty) Jsem si jistí, že naše data budou obsahovat z 95% skutečnou hodnotu Nonresponse error •Vybereme jedince do vzorku •Nedostaneme odpověď •Respondenti – pouze podvzorek •Liší se? • •Unit non-response •Item non-response Measurement error •Jak dobře měříme své teoretické koncepty? •Pretest •Cognitive pretesting