SOC108/708 LEKCE 7: ZÁKLADY BIVARIAČNÍ ANALÝZY: ROZLOŽENÍ DAT V KONTINGENČNÍ TABULCE (c) Petr Mareš a Ladislav Rabušic 2002 LEKCE07 ZÁKLADY BIVARIAČNÍ ANALÝZY: ROZLOŽENÍ DAT V KONTINGENČNÍ TABULCE PROCEDURA CROSSTABS KONTINGENČNÍ TABULKA (absolutní četnosti) proměnná A A = {a1, ..., ar} Mr a1 a2 ..... as ..... aS promě b1 n11 n1+ nná B B = {b1, ..., br} b2 n2+ ... ... ... ... br nrs nr+ ... ... bR nR+ Ms n+1 n+2 ..... n+s ..... n+S n KONTINGENČNÍ TABULKA (relativní četnosti) proměnná A A = {a1, ..., ar} Mr a1 a2 ..... as ..... aS prom b1 f11 f1+ ěnná B B = {b1, ..., br} b2 f2+ ... ... ... ... br fr+ ... ... bR fR+ Ms f+1 f+2 ..... f+s ..... f+S n Poznámka: Hodnoty fr+ a f+s se mohou lišit od původních jednorozměrných empirických rozložení díky vlivu vynechaných dat (missing date). JEN ABSOLUTNÍ ČETNOSTI? vztah mezi významem "porozumění a snášenlivosti (Q40_8)" a "vzájemné úcty a uznání (Q40_4)" pro úspěšnost manželství RELATIVNÍ PROCENTA SLOUPCŮ NEBO ŘÁDKŮ? Vztah mezi významem "porozumění a snášenlivosti (Q40_8)" a "vzájemné úcty a uznání (Q40_4)" pro úspěšnost manželství: OBOJÍ: Nelze jednoznačně určit závisle proměnnou a nezávisle proměnnou! SYMETRICKÝ VZTAH. "Co by měla společnost zajišťovat, aby byla považována za spravedlivou (Q76_1)" versus "společenská skupina (Q110C): ŘÁDKOVÉ. Určíme závisle proměnnou a nezávisle proměnnou (tou je řádková proměnná Q110C)! ASYMETRICKÝ VZTAH. PAMATUJME SI! pro asymetrické vztahy Spočítáme-li řádková procenta (nezávislá proměnná v řádcích jako v tomto případě), interpretujeme je ve sloupcích. Spočítáme-li sloupcová procenta (nezávislá proměnná ve sloupcích), interpretujeme je v řádcích. MÁ SMYSL POUŽÍVAT CELKOVÝCH PROCENT? KOLIK JE V SOUBORU PŘÍPADŮ URČITÉHO TYPU? KONKRÉTNĚ (kolik manželských párů pochází z úplných rodin)? Párů, kde ženich a nevěsta pocházejí oba z úplných původních rodin, je v našem souboru 62,4% našeho souboru (párů, kde oba pocházejí z neúplných rodin je zde 2,7% ...). Párů, ve kterých pochází ženich z úplné původní rodiny je zde 10,5% případů (co se týče nevěst, je to 12,4% případů .... MÁ SMYSL POUŽÍVAT CELKOVÝCH PROCENT? KOLIK JE V SOUBORU PŘÍPADŮ URČITÉHO TYPU? KONKRÉTNĚ (kolik, respektive jaký podíl, mužů či žen si myslí, že "žena musí mít děti, aby se naplnilo její poslání"?) Muži, kteří si to myslí že "ŽENA MUSÍ MÍT DĚTI, ABY SE NAPLNILO JEJÍ POSLÁNÍ" představují 20% souboru a ženy 24% souboru. POZOR: Nikoliv 20% mužů či 24% žen (abychom zjistili podíl tohoto názoru mezi muži a ženami, museli bychom vypočítat sloupcové četnosti), proto nemůžeme tato procenta srovnávat. To, že je v souboru více žen než mužů s tímto názorem může být dáno i tím, že je v něm vůbec více žen! CELKEM SI TO V NAŠEM SOUBORU MYSLÍ 44% OSOB. POZOROVANÉ A OČEKÁVANÉ HODNOTY A RESIDUÁLY proměnná A Mr a1 a2 ..... as ..... aS pro b1 f11 f1+ měn ná B b2 f2+ ... ... ... ... br fr+ ... ... bR fR+ Ms f+1=100 f+2=100 .... f+s=100 .... f+S=100 n=100 =100 =100 OČEKÁVANÉ HODNOTY PRO JEDNOTLIVÁ POLÍČKA celková četnost v řádku celková četnost ve sloupci (marginální řádková (marginální sloupcová četnost) četnost) (R) . (C) očekávané hodnoty = N celkový počet případů ¨v souboru POZOROVANÉ A OČEKÁVANÉ HODNOTY A RESIDUÁLY INTERPRETACE KONTINGENČNÍ TABULKY Z ROZLOŽENÍ ČETNOSTÍ 1. JE OBVYKLE PROVÁDĚNA Z ŘÁDKOVÝCH ČI SLOUPCOVÝCH RELATIVNÍCH ČETNOSTÍ (PROCENT). Na rozdíl od absolutních hodnot nám totiž umožňují vzít v úvahu počet případů v souboru. Příklad: Údaj o tom, že 20 žen v souboru má vysokoškolské vzdělání, zatímco mezi muži je vysokoškoláků jen 6 (ženy s vysokoškolským vzděláním se zde vyskytují častěji) může dostat zcela jiný výklad, uvědomíme-li si, že žen je v souboru 100 a mužů jen 10 (vysokoškolské vzdělání má v souboru 60% mužů, zatímco jen 20% žen). 2. URČÍME, KTEROU PROMĚNNOU BUDEME POVAŽOVAT ZA NEZÁVISLOU. Případy, jako je vztah pohlaví a spokojenosti s platem jsou jednoduché: na pohlaví závisí spokojenost s platem, spokojenost s platem pohlaví ovlivnit nemůže. V jiných případech je to složitější (nezávisle proměnnou určujeme arbitrárně). Příklad: Preference soukromého vlastnictví před státním některými lidmi může vést k tomu, že tito lidé volí pravicové strany a ne levicové (a naopak). Vede však tato preference k volební preferenci, nebo je to naopak volební preference, která je příčinou preference určitého typu vlastnictví? ? Pro analýzu VOLÍME PŘIMĚŘENÉ RELATIVNÍ ČETNOSTI (sloupcové, jsou-li varianty nezávisle proměnných ve sloupcích a řádkových, jsou-li v řádcích). ? POROVNÁME PROCENTA pro jednotlivé varianty nezávisle proměnné pro každou variantu závisle proměnné. ? Je-li nezávisle proměnná ve sloupcích, porovnáváme tyto sloupcová % v každém řádku. ? Je-li nezávislá proměnná v řádcích, porovnáváme řádková% v každém sloupci. Příklad: Spokojenost s platem u mužů a žen (vztah mezi pohlavím a spokojeností s platem) absolutní četn. PROMĚNNÁ A CELKEM řádkové % pohlaví sloupcové % celkové % muži ženy PROM spokojen/a 30 28 58 ĚNNÁ 52% 48% 100% B - 25% 40% spok 16% 14% ojen ost střed 30 30 60 50% 50% 100% 25% 43% 16% 16% nespokojen/a 60 12 72 83% 17% 100% 50% 17% 32% 6% CELKEM 120 70 190 100% 100% Všimněte si, že skutečně potřebujeme nikoliv absolutní, ale RELATIVNÍ ČETNOSTI (spokojených mužů je v absolutním počtu prakticky stejně jako spokojených žen).