Výběr vzorku nejen pro SPP118 by Miroslav Suchanec with many thanks to et al. Proč vzorek? •….protože někdy je populace časově, prostorově, finančně nedostupná J • Co je vzorek? ….zkoumaná část populace populace vzorek Klíčové pojmy Na koho chceme zobecňovat? Jaká populace je nám přístupná? Jakým způsobem k ní máme přístup? Koho studujeme? Teoretická populace Přístupná populace Vzorkovací rámec (opora výběru) Vzorek Obecný proces výběru vzorku Teoretická populace Opora výběru (seznam nebo pravidlo) Seznam cílového vzorku Metoda výběru procedura Jednotka analýzy (lidé) Přístupná populace na níž zobecňujeme závěry definuje Potenciální vzorek Skutečný vzorek návratnost zobecnění Klíčová myšlenka Teoretická populace chceme zobecňovat Přístupná populace Můžeme zobecňovat Opora výběru (např. telefonní seznam) Klíčová role Obecné typy výběrů vzorku Pravděpodobnostní Náhodný - 1. prostý - 2. stratifikovaný - 3. systematický - 4. klastrový / shlukový - 5. kombinovaný/ víceúrovňový Nepravděpodobnostní (účelové neboli teoretické) -Kvótní -Extrémní / odchylující se případy - intenzivní případy -Maximální rozptyl (heterogenní) -Homogenní -Typický případ - Účelový stratifikovaný -Kritický případ -Sněhová koule / řetězový -Kriteriální -Účelový náhodný -Politicky důležité případy -Příležitostní -Nahodilý -na teorii založený - Pravděpodobnostní nebo nepravděpodobnostní? Pravděpodobnostní Obecně když… …chci zobecňovat/usuzovat ze vzorku na/o populaci …chci používat statistickou analýzu (kvantitativní (objektivistický) výzkum) …mám velkou populaci Nepravděpodobnostní (účelové neboli teoretické) …mě zajímají pouze zkoumané případy …nechci zobecňovat na populaci …populace není známá / nedostupná …když mě na základě výzkumného cíle zajímají jen určití vybraní lidé …když používám kvalitativní (interpretativní / subjektivistické) výzkumné metody Pravděpodobností výběr •využívá matematickou teorii pravděpodobnosti • •= každý člen populace má nenulovou a známou šanci dostat se do vzorku • •Klíčová úloha opory výběru = není-li člen populace na seznamu, má nulovou pravděpodobnost být vybrán • 1. Prostý náhodný Každý člen / kombinace členů populace má STEJNOU šanci být vybrán Např. jména losovaná z klobouku kouzelníka Pokustóna nebo jména ze seznamu vybrána pomocí tabulky/generátoru náhodných čísel /kostky 3. Systematický náhodný (1) • •Každý člen populace má stejnou šanci být vybrán ale kombinace členů mají šance různé • • •Velikost populace=N, požadovaná velikost vzorku=n, potom velikost kroku/intervalu k=N/n • • •Postup: náhodně vybrat číslo j mezi 1 a k, pak vybrat toto číslo j a dále každý k-tý člen j+k, j+2k,j+3k atd. • • •Př. Na obrázku: N=64, n=8, k=64/8=8, j=3 3. Systematický náhodný (2) = vykazuje stejnou chybu jako prostý náhodný výběr, pokud jsou členové seznamu náhodně seřazeni + poskytuje přínos implicitní stratifikace, pokud jsou členové seznamu seskupeni (př. obrázek) • ALE , riziko velké výběrové chyby pokud periodicita/uspořádání na seznamu kopíruje interval k • • • •Př. Obrázek •Každý 4-tý člen je červený a červený nikdy nebude vybrán, protože j=3 a k=8. •Jak by situace vypadala kdyby j=4? •Vybráni jen červení! • 3. Systematický náhodný (3) 2. Stratifikovaný náhodný •Rozdělíme populaci do skupin, které se liší pro výzkumný cíl (závisle proměnná) podstatným způsobem (např. podle pohlaví, etnika, věku) • •Dělící proměnná=stratifikační p. • •Poté vybereme náhodný vzorek z každé skupiny • •Př. Jaká je spokojenost se stavem v armádě? (Souvisí s hodností člena, dělíme na skupiny velitelů, podplukovníků, pěšáků, z každé vybereme náhodně vzorek) •Předpokládejme, že seznam je seřazen podle rot, proč ne systematický výběr? (vybráni jen rotmistři – zkresluje spokojenost) • •+ menší chyba než prostý náhodný, pokud se skupiny liší •Kompromis mezi zvýšenými náklady na stratifikaci a menší velikostí vzorku potřebnou ke stejně velké chybě •Přesamplování malých skupin zlepšuje meziskupinové srovnání • • 4. Klastrový / shlukový náhodný výběr (1) •Populace je rozdělená do srovnatelných skupin, obvykle geografických nebo organizačních (školy, města) • •Některé CELÉ skupiny jsou náhodně vybrány do vzorku • •Vykazuje větší chybu než prostý náhodný • •Relativně levný, pouze některé oblasti/organizace, • umožňuje velký vzorek • •Chyba je menší čím více jsou klastry vzájemně podobné (obrázek) •ALE chyba je velká, pokud se klastry liší (viz obrázek) – klastrování nevhodné! •Zcela opomeneme některé členy populace 4. Klastrový / shlukový náhodný výběr (2) 5a. Kombinovaný (stratifikovaný-klastrový) Postup: 1.Definujeme klastry 2.rozdělíme klastry podle podobnosti do skupin / strat 3. náhodně vybereme 1/více celých klastrů z každé straty (nebo pouze náhodně vybereme členy takto vybraných klastrů) Vlastnosti: 1. Využívá výhody stratifikovaného a klastrového výběru = Snižuje chybu klastrového výběru vytvořením strat a zároveň zachovává levnost klastrového výběru 5b. Kombinovaný víceúrovňový stratifikovaný-klastrový •Postup: •1. země je rozdělena na klastry (např. regiony) •2. některé konurbace jsou vybrány s jistotou, zbytek je rozdělen do strat podle velikosti (např. středně velká města, menší města, venkov) •3. náhodně vybereme klastry z každé straty •4. uvnitř každého vybraného území znovu definujeme klastry atd. až se dostaneme k domácnostem •5. Kombinovaný víceúrovňový náhodný • • 5c. Kombinovaný víceúrovňový stratifikovaný-klastrový Postup: 1. náhodně vybereme regiony, z vybraných regionů města, z měst čtvrtě atd. až k domácnostem • Problematika návratnosti •Obecně čím vyšší návratnost, tím nižší chyba • •Návratnost 90% OK, 50% ne OK -ohrožení zobecnitelnosti • •Pokud neodpověděli náhodně, pak OK, pokud systematicky (určitý typ lidí), pak zkreslení • • Velikost vzorku •Vyšší heterogenita populace (rozptyl), větší vzorek • •Vyšší přesnost (spolehlivost/výběrová chyba), větší vzorek • •Design vzorku (klastrový větší vzorek, stratifikovaný menší vzorek) • •Komplexnější analýza (více proměnných), větší vzorek • •pozor: přesnost vzorku závisí na jeho velikosti, nikoli na poměru vzorek / populace Obecné typy výběrů vzorku Pravděpodobnostní Náhodný - 1. prostý - 2. stratifikovaný - 3. systematický - 4. klastrový / shlukový - 5. kombinovaný/ víceúrovňový Nepravděpodobnostní (účelové neboli teoretické) -Kvótní -Extrémní / odchylující se případy - intenzivní případy -Maximální rozptyl (heterogenní) -Homogenní -Typický případ - Účelový stratifikovaný -Kritický případ -Sněhová koule / řetězový -Kriteriální -Účelový náhodný -Politicky důležité případy -Oportunistický -Nahodilý/příležitostní -Na teorii založený - Nepravděpodobnostní výběry •Nevyužívá matematickou teorii pravděpodobnosti, tudíž nelze usuzovat ze vzorku na populaci (na základě teorie pravděpodobnosti) • • •Předmět: informačně-bohaté případy • •Účel: dovědět se do hloubky spíše než zobecňovat • 1. Nahodilý / příležitostní / anketa •Jednotky jsou vybrány protože k nim máme snadný přístup •Př. Spolužáci ve třídě, lidé na ulici, kamarádi 2. Kvótní • Předem stanovím počet subjektů v jednotlivých kategoriích, tak aby kopírovaly rozložení v populaci (např. 100 mužů a 100 žen, když poměr M a Ž v populaci je 50/50) a tyto kvóty pak při výběru naplňuji •Problém? •Př. Předvolební průzkum: Víme že v populaci M/Ž 15/15 (M=modrá, Ž=červená), •proto kvóta pro výběr = 5 M + 5 Ž, kvóta OK reprezentativní • kvotni-chyba Vzorek = všichni volí křesťany! (černá) Populace = někdo křesťany, jiný přátelé piva (oranžová), zelené žáby, feministky a pohlavní rovnost (růžová) Aha! Stojím před kostelem J Pokud není kvótní výběr jinak kontrolován, pak = příležitostní výběr 3. Extrémní / odchylující se případy • = Výběr případů, které jsou neobvyklé / speciální (odchylky) nějakým způsobem, •(např. velký úspěch / neúspěch) » • •Např. •2 Školy - s vysokou vs. Nízkou úrovní násilí •2 programy – s vysokou vs. Nízkou úspěšností •Výzkum excelence průmyslových podniků (64 nejlepších podniků) •Obzvláště efektivní programy pro snižování chudoby •Deviantní chování u extrémních/specifických případů •Bestseller „7 zvyků vysoce efektivních lidí“ •Výzkum na malém vzorku lidí u nichž výjimečně HIV nepropuklo v AIDS •Evaluační studie „za jakých podmínek program selže / exceluje. • • •Důvod: Studie extrémních případů pomůže zlepšit více obvyklé (běžné) případy •Logika: Extrémní případy jsou informačně-bohaté, neboť tím, že jsou neobvyklé, mohou osvětlit obé – neobvyklé a typické. 4. Intenzivní případy •Logika: stejná jako u výběru extrémních případů, ale méně důrazu na extrémy, neboť extrémy mohou být tak extrémní, že mohou být ojedinělé a nejsou použitelné na typičtější případy • • 5. Maximální rozptyl Hledání společného mezi různými případy Logika: cokoli společného v jinak odlišných případech je pozoruhodné Postup: 1. Napřed si stanovím kritéria (různí lidi podle vzdělání, programy podle velikosti regionu atd.) 2. Všímám si jedinečností 3. Všímám si společného Př. Evaluační studie úspěšnosti inkluze studentů s postižením 1. Kritérium: různá velikost a charakter sídla (venkov, malé město, velkoměsto, předměstí) 2. Jedinečnost: schopnost oslovit a udržet kvalitní personál 3. Společné: zvýšená interakce mezi studenty s/bez postižení 6. Homogenní vzorek •Opak k maximálnímu rozptylu • • •Účel: popsat určitou podskupinu do hloubky • •Př. Program vzdělávání rodičů •Vedoucí programu chtějí informace o matkách samoživitelkách, neboť to je těžko dosažitelná a udržitelná skupina v programu • • •Doporučená strategie pro focus-group výzkum, neboť pokud jsou lidé heterogenní, m dostat prostor dominantnější lidé a převážit „dominantní“ pohled na věc •(např. focus-group s matkami s postiženými dětmi a administrátory programu zároveň) • • 7. Typický případ •Výběr typického / průměrného případu • •Účel: podat informaci o typických případech / např. typických zkušenostech s programem • •Postup: definovat kritéria typičnosti (př. věk, vzdělání, ale také výkon programu, spokojenost klientů) • •Př. Evaluační studie: Klíčoví rozhodovatelé o programu chtěli informace o programech, které jsou tak obyčejné, že se o nich neví… • 8. Kritický případ •Logika: „pokud se to stane zde, pak se to stane kdekoli“ •nebo „pokud se to nestane v tomto případě, pak se to nestane nikde“ •Nebo „pokud má tato skupina problém, pak si můžeme být jisti, že všichni mají problém“ • • •Např. Politici chtějí zahrnout místní obyvatele do rozhodování o způsobu fungování lokálního programu – budou lidé rozumět pravidlům rozhodování? •Kritérium pro kritický případ: úroveň vzdělání •Pokud vysoce vzdělaní lidé nebudou rozumět, pak méně vzdělaní vůbec. •Pokud málo vzdělaní rozumí, pak všichni budou rozumět • • •Galileo Galilei: Teorie gravitace. • Ovlivňuje váha objektu rychlost s jakou padá k zemi? • Kritický případ: porovnal pírko a minci zda padají stejnou rychlostí • 9. Metoda sněhové koule / řetězový • • •Proces nabalování lidí, kteří jsou posuzováni okolím za největší experty na daný problém • •Postup: Ptám se lidí, o kterých si myslím, že mají přehled (klíčoví informanti), kdo podle nich ví nejvíc. Dostávám seznam jmen. Ptám se lidí ze seznamu kdo podle nich víc nejvíc. Dostávám další jména – koule se nabaluje. Postupně se jména opakují až se opakují zcela – kruh se uzavírá. •Vyberu jména, která jsou opakovaně zmiňována různými lidmi. • • •Př. •Já: „Koho bych se měl zeptat? Kdo o tom podle vás ví nejvíc?“ •Odpověď: Lojza. •Já: „Lojzo, kdo o tom podle tebe ví nejvíc? •Lojza: Adam. •Já: „Adame, kdo o tom podle tebe ví nejvíc?“ •Adam: „Lojza“. •Já pro sebe: „Hm, koule se ještě nezačala pořádně nabalovat a už se kruh uzavírá, do vzorku jde Lojza a Adam.“ 10. Kriteriální •Postup: stanovím kritéria. Lidi kteří splní kritéria jdou do vzorku. • •Př. Očekávaná délka pobytu v léčebně je 4 až 26 týdnů. •Pacienti kteří překročí 28t jsou prozkoumání, aby se zjistil důvod. • •Př. Dramaticky stoupl počet žádostí o přestup ze základní na speciální školu. Výzkumník chce zjistit důvod (Odešel někdo z personálu ze ZŠ? Přišel nějaký expert na SŠ?) •Kritérium výběru: Studenti kteří byli odeslání na speciální školu v posledních 6 měsících. • •Př. Všichni klienti psychiatrické léčebny, kteří spáchali sebevraždu do 3 měsíců od propuštění. • •Př. Všichni studenti s absencí nad 25procent. • •Účel: Porozumění informačně-bohatým případům, kteří splňují kritéria, může odhalit chybu v programu a pomoci k nápravě. 11. Na teorii založený •Vychází z teorie (a její operacionalizace), kterou chci ověřovat. • •Př. Studium významu úzkosti – sociální faktory, které způsobují úzkost – nezaměstnanost – vybírám nezaměstnané • • 12. Oportunistický V kvalitativním / interpretativním výzkumu Doplňování vzorku v průběhu studie, reakce na situaci / příležitost. 13. Stratifikovaný účelový Kombinace typického případu a maximálního rozptylu Př. Vzorek nadprůměrných, průměrných a podprůměrných případů. (méně než maximální variance, ale více než typický případ) Účel: zachytit hlavní rozdíly, spíše než společné jádro. 14. Účelový náhodný • • •účel: ne reprezentativnost, ale důvěryhodnost • • •Př. Sexuální zneužívání na rezidenční škole pro hluché studenty •Účel: důvěryhodnost - studenti vybráni náhodně, ne na základě doporučení ředitele, •který by mohl mít zájem vybrat studenty, kteří by školu uvedli v „dobrém světle“ 15. Výběr politicky důležitých případů Účel: politická vhodnost Př. Program byl implementován v různých regionech. Evaluační studií chceme zjistit jeho efektivitu. Náhodný výběr může opomenout region, v kterém bydlí člověk, který „sedí na penězích“ pro program, což by nebylo „politicky prozíravé“.