ANALÝZA KATEGORIZOVANÝCH DAT V SOCIOLOGII - PŘÍKLADY Tomáš Katrňák Fakulta sociálních studií Masarykova univerzita Brno AKD TK 2 1. Příklad: Tabulka ukazuje názor na předmanželský sex podle vzdělání. Vypočítejte odpovídající relativní frekvence, všechna relativní rizika (RR), jednotlivé šance (O) a všechny poměry šancí (OR). Interpretujte je a ukažte, že substantivně ukazují jednu a tu samou věc, i když jsou numericky odlišné. Tabulka: ----------------------------- | souhlas s |předmanž. sexem vzdělání | ano ne -------------+--------------- bez maturity | 873 1190 s maturitou | 533 1280 ----------------------------- AKD TK 3 2. Příklad: Tabulka ukazuje podporu legalizovaných potratů podle pohlaví. Odpovězte na následující otázky: - Jaké jsou šance žen podporovat potraty oproti šancím mužů? - Jaké jsou šance žen nepodporovat potraty oproti šancím mužů? - Jaké jsou šance mužů oproti šancím žen podporovat potraty? - Jaké jsou šance mužů oproti šancím žen nepodporovat potraty? Tabulka: ----------------------------- | podpora |legal. potratů pohlaví | ano ne -------------+--------------- žena | 309 191 muž | 319 281 ----------------------------- AKD TK 4 3. Příklad: Tabulka ukazuje počet maturantů na střední škole v USA podle rasy, pohlaví a typu rodiny (úplná, neúplná), jedná se o náhodný výběr z celkového počtu maturantů. Výzkumná otázka: Je počet maturantů podmíněn těmito proměnnými? (zdroj: Powers, Xie, 2000, str. 44) Table: High school graduates by Race, Sex, and Family Structure yes num. yes num. yes num. yes num. White 843 982 864 931 168 243 161 208 Black 346 441 360 410 231 337 225 283 Hispanic 237 305 208 259 82 128 78 98 Intact Nonintact male female female female AKD TK 5 4. Příklad: Jaký je vztah mezi barvou pleti opakovaně obžalovaných z vraždy, uvalením trestu smrti na ně a barvou pleti jejich oběti? Neboli, jak poznamenává barva pleti u opakovaně obžalovaných rozhodnutí o jejich trestu smrti při kontrole barvy pleti oběti? (data pocházejí z amerického státu Florida, byla sebraná mezi lety 1976-1987, zdroj: Agresti, 1996, str. 56) Trest smrti Oběť Obžalovaný Ano Ne (%) Ano Běloši 53 414 11,3 Běloši Černoši 11 37 22,9 Běloši 0 16 0 Černoši Černoši 4 139 2,8 Běloši 53 430 11 Celkem Černoši 15 176 7,9 - co ukazuje marginální tabulka? - co ukazují parciální tabulky? - údaje z marginální tabulky vs. údaje z parciálních tabulek? - OR z marginálního vztahu vs. OR z parciálního vztahu AKD TK 6 5. Příklad: Marginální tabulky ukazují jednak dvě nemocnice, které aplikovaly naprosto stejnou léčbu pro drogově závislé, jednak výsledky, kterých dosáhly, a konečně výsledky podle léčby pro drogově závislé. Drogová léčba Nemocnice A B Praha 30 20 Brno 10 40 Výsledek Nemocnice + ­ Praha 30 20 Brno 10 40 Drogová Výsledek léčba + ­ A 20 20 B 20 40 Proč je drogová léčba A dvakrát úspěšnější než drogová léčba B v poslední marginální tabulce? AKD TK 7 6. Příklad: Jaké faktory podmiňují participaci žen na trhu práce (lfp)? Data jsou v individuální podobě na adrese: http://www.stata-press.com/data/lfr/binlfp2.dta Data pocházejí z americké populace (rok 1976), panelové šetření příjmové dynamiky amerických domácností, vzorek 753 bílých vdaných amerických žen ve věkovém rozmezí 30. až 60. let, vysvětlovaná proměnná je participace žen na trhu práce (lfp - labor force participation) data Mroz, T. A. (1987): ,,The sensitivity of an empirical model of married women's hours of work to economic and statistical assumptions." Econometrica 55(4), 765-799) Contains data from ./binlfp2.dta obs: 753 Data from 1976 PSID-T Mroz vars: 8 30 Apr 2001 16:17 size: 13,554 (99.9% of memory free) (_dta has notes) ------------------------------------------------------------------------------- storage display value variable name type format label variable label ------------------------------------------------------------------------------- lfp byte %9.0g lfplbl Paid Labor Force: 1=yes 0=no k5 byte %9.0g # kids < 6 k618 byte %9.0g # kids 6-18 age byte %9.0g Wife's age in years wc byte %9.0g collbl Wife College: 1=yes 0=no hc byte %9.0g collbl Husband College: 1=yes 0=no lwg float %9.0g Log of wife's estimated wages inc float %9.0g Family income excluding wife's ------------------------------------------------------------------------------- doporučený postup řešení: 1) natáhněte data do Staty: use http://www.stata-press.com/data/lfr/binlfp2.dta 2) analyzujte data ve Statě nebo převeďte data do SPSS pomocí programu STAT/TRANSFER a analyzujte je AKD TK 8 7. Příklad: Pacienti trpící rakovinou byli náhodně rozděleni do dvou skupin. Každá skupina absolvovala jiný typ léčby. Tabulka ukazuje výsledky léčby podle pohlaví a typu léčby. Jaká je evidence pro to, abychom mohli tvrdit, že rozdílné typy léčby vedou k rozdílným výsledkům? (zdroj: Holtbrugge, Schumacher 1991; Hand et al. 1994; Rabe-Hesketh, Everit, 2004) Výsledek léčby Typ chemoterapie Pohlaví Progrese nemoci Beze změny Částečné zlepšení Úplné uzdravení Muž 28 45 29 26 Sekvenční Žena 4 12 5 2 Muž 41 44 20 20 Alternativní Žena 12 7 3 1 AKD TK 9 8. Příklad: Tabulka ukazuje počet lidí kouřících marihuanu (m) podle kouření cigaret (c) a pití alkoholu (a). Výzkumná otázka: Souvisejí spolu tyto proměnné? Podmiňuje kouření kouření cigaret a pití alkoholu kouření marihuany? (zdroj: Agresti, 1996: 152) ------------------------------------ | c and a | --- ano -- --- ne --- m | ano ne ano ne ----------+------------------------- ano | 911 3 44 2 ne | 538 43 456 279 ------------------------------------ AKD TK 10 9. Příklad: Tabulka ukazuje počet lidí, kteří chodí k volbám (vote: 1 ano , 2 ne) podle jejich věku (age 1 mladí, 2 staří) a členství v církvi (relig 1 ano, 2 ne) a. Souvisejí spolu tyto proměnné? Podmiňuje věk a náboženská příslušnost politickou volbu. (zdroj: Hagenaars, 1990, table 2.3) ---------------------- age and | vote relig | 1 2 ----------+----------- 1 | 1 | 95 48 2 | 100 93 ----------+----------- 2 | 1 | 220 32 2 | 91 71 ---------------------- AKD TK 11