Cvičení 12: Hodnocení kontingenčních tabulek Úkol 1.: Testování hypotézy o nezávislosti, měření síly závislosti V roce 1950 zkoumali Yule a Kendall barvu očí a vlasů u 6800 mužů. Barva vlasůBarva očí světlá kaštanová černá rezavá modrá 1768 807 180 47 šedá nebo zelená 946 1387 746 53 hnědá 115 438 288 16 Na asymptotické hladině významnosti 0,05 testujte hypotézu o nezávislosti barvy očí a barvy vlasů. Vypočtěte Cramérův koeficient. Simultánní četnosti znázorněte graficky. Postup ve STATISTICE: Otevřeme datový soubor oci_vlasy.sta o 12 případech a třech proměnných (OCI, VLASY, CETNOST). Před provedením testu je zapotřebí ověřit podmínky dobré aproximace: Statistiky – Základní statistiky/tabulky – Kontingenční tabulky - Specif. tabulky – List 1 OCI, List 2 VLASY, OK, Váhy - CETNOST, Stav zapnuto, OK – na záložce Možnosti zaškrtneme Očekávané četnosti – Výpočet. Souhrnná tab.: Očekávané četnosti (oci_vlasy.sta) Četnost označených buněk > 10 Pearsonův chí-kv. : 1088,15, sv=6, p=0,00000 OCI VLASY světlá VLASY kaštanová VLASY černá VLASY rezavá Řádk. součty modrá 1167,259 1085,976 500,902 47,8622 2802,000 šedá nebo zelená 1304,731 1213,875 559,895 53,4990 3132,000 hnědá 357,010 332,149 153,202 14,6388 857,000 Vš.skup. 2829,000 2632,000 1214,000 116,0000 6791,000 Podmínky dobré aproximace jsou splněny. Všechny teoretické četnosti jsou větší než 5. Nyní budeme testovat hypotézu o nezávislosti proměnných OCI, VLASY. Návrat do Výsledky; kontingenční tabulky – na záložce Detaily zaškrtneme Pearsonův & M-L Chi - kvadrát, Phi & Cramerovo V – Detailní výsledky – Detailní 2 rozm. tabulky. Statist. Chí-kvadr. sv p Pearsonův chí-kv. M-V chí-kvadr. Fí Kontingenční koeficient Cramér. V 1088,149 df=6 p=0,0000 1155,669 df=6 p=0,0000 ,4002923 ,3716246 ,2830494 Ve výstupní tabulce najdeme mj. hodnotu testové statistiky (Pearsonův chí-kv = 1088,149) s počtem stupňů volnosti (sv = 6) a odpovídající p-hodnotou (p = 0,0000), dále Cramérův koeficient (V = 0,283). Protože p-hodnota je mnohem menší než 0,05, nulovou hypotézu o nezávislosti barvy očí a barvy vlasů zamítáme na asymptotické hladině významnosti 0,05. Cramérův koeficient svědčí o slabé závislosti barvy očí a vlasů. Pro grafické znázornění četností se vrátíme do Výsledky; kontingenční tabulky – Detailní výsledky – 3D histogramy. Dvourozměrné rozdělení: OCI x VLASY svetla kastanova cerna rezava VLASYmodra seda nebo zelena hneda O CI 200 400 600 800 1000 1200 1400 1600 1800 2000 Početpozorování Úkol k samostatnému řešení: Na hladině významnosti 0,05 testujte hypotézu o nezávislosti pedagogické hodnosti a pohlaví a vypočtěte Cramérův koeficient vyjadřující intenzitu závislosti pedagogické hodnosti na pohlaví, jsou-li k dispozici následující údaje: pedagogická hodnostpohlaví odb. asistent docent profesor muž 32 15 8 žena 34 8 3 Výsledek: Podmínky dobré aproximace jsou splněny, pouze jediná teoretická četnost klesne pod 5. Testová statistika K nabývá hodnoty 3,5, p = 0,1739, tedy na asymptotické hladině významnosti 0,05 nezamítáme hypotézu o nezávislosti pedagogické hodnosti a pohlaví. Cramérův koeficient: V = 0,187. Úkol 2.: Fisherův faktoriálový test 100 náhodně vybraných mužů a žen bylo dotázáno, zda dávají přednost nealkoholickému nápoji A či B. Údaje jsou uvedeny ve čtyřpolní kontingenční tabulce. pohlavípreferovaný nápoj muž žena A 20 30 B 30 20 Na hladině významnosti 0,05 testujte pomocí Fisherova faktoriálového testu hypotézu, že preferovaný typ nápoje nezáleží na pohlaví respondenta. Návod: Otevřeme datový soubor napoje AB.sta Statistiky – Základní statistiky/tabulky – Kontingenční tabulky - Specif. tabulky – List 1 NAPOJ, List 2 POHLAVI, OK, Váhy - CETNOST, Stav zapnuto, OK – na záložce Možnosti zaškrtneme Fisher exakt, Yates, McNemar (2x2) – Detailní výsledky – Detailní 2-rozm. tabulky. Statist. : NAPOJ(2) x POHLAVI(2) (napoje AB.sta) Statist. Chí-kvadr. sv p Yatesův chí-kv. Fisherův přesný, 1-str. Fisherův přesný, 2-str. McNemarův chí-kv. (A/D) McNemarův chí-kv. (B/C) 3,240000 df=1 p=,07186 p=,03567 p=,07134 ,0250000 df=1 p=,87437 ,0166667 df=1 p=,89728 Ve výstupní tabulce je mimo jiné uvedena p-hodnota pro oboustranný a jednostranný test. V našem případě se jedná o oboustranný test (nevíme, zda muži více preferují nápoj A či nápoj B než ženy), zajímáme se tedy o Fisherův přesný, 2-str. Ta je 0,07134. Protože phodnota je větší než 0,05, nezamítáme na hladině významnosti 0,05 hypotézu, že preferovaný typ nápoje nezáleží na pohlaví respondenta. Úkol 3.: Podíl šancí Pro údaje z úkolu 2 vypočtěte podíl šancí a sestrojte 95% asymptotický interval spolehlivosti pro logaritmus podílu šancí. Pomocí tohoto intervalu spolehlivosti testujte na asymptotické hladině významnosti 0,05 hypotézu, že preferovaný typ nápoje nezáleží na pohlaví respondenta. Návod: Nejprve zopakujme teorii: Ve čtyřpolních tabulkách používáme charakteristiku bc ad OR = , která se nazývá podíl šancí (odds ratio). Můžeme si představit, že pokus se provádí za dvojích různých okolností a může skončit buď úspěchem nebo neúspěchem. okolnostiVýsledek pokusu I II nj. úspěch a b a+b neúspěch c d c+d n.k a+c b+d n Poměr počtu úspěchů k počtu neúspěchů (tzv. šance) za 1. okolností je c a , za druhých okolností je d b . Podíl šancí je bc ad OR = . Považujeme ho za odhad teoretického podílu šancí oρ. Pomocí 100(1-α)% asymptotického intervalu spolehlivosti pro logaritmus teoretického podílu šancí ln oρ (nebo přímo pro oρ) lze na asymptotické hladině významnosti α testovat hypotézu o nezávislosti nominálních veličin X a Y. Upozornění: Aby byly výpočty korektní, musí být splněny podmínky dobré aproximace. Asymptotický 100(1-α)% interval spolehlivosti pro přirozený logaritmus teoretického podílu šancí má meze: 2/1u d 1 c 1 b 1 a 1 ORln α−+++± . Jestliže interval spolehlivosti nezahrne 0, pak hypotézu o nezávislosti zamítneme na asymptotické hladině významnosti α. Pokud test provedeme pomocí intervalu spolehlivosti pro oρ, výše uvedené meze odlogaritmujeme a sledujeme, zda tento interval pokrývá hodnotu 1. V našem případě podíl šancí vypočteme ručně: 4,0 9 4 3030 2020 bc ad OR == ⋅ ⋅ == . Dolní a horní mez intervalu spolehlivosti pro ln oρ zjistíme pomocí STATISTIKY. Ověříme splnění podmínek dobré aproximace a zjistíme, že všechny teoretické četnosti jsou 25. Vytvoříme datový soubor o dvou proměnných DM a HM a dvou případech. Do Dlouhého jména proměnné DM napíšeme vzorec pro dolní mez: =log(4/9)-sqrt(1/20+1/30+1/30+1/20)*VNormal(0,975;0;1) a analogicky do Dlouhého jména proměnné HM napíšeme vzorec pro horní mez: =log(4/9)+sqrt(1/20+1/30+1/30+1/20)*VNormal(0,975;0;1) 1 DM 2 HM 1 -1,61108 -0,01078 Výsledek: -1,61108 < ln oρ < -0,01078 s pravděpodobností přibližně 0,95. Protože tento interval spolehlivosti neobsahuje 0, na asymptotické hladině významnosti 0,05 zamítáme hypotézu, že preferovaný typ nápoje nezáleží na pohlaví respondenta. Ke stejnému výsledku dospějeme, pokud použijeme Pearsonův chí-kvadrát test o nezávislosti. Tento výsledek je v rozporu s výsledkem, ke kterému dospěl Fisherův přesný test. Fisherův test má obecně menší sílu než chí-kvadrát test. Úkoly k samostatnému řešení: 1. 225 průmyslově chovaných králíků bylo vyšetřeno na výskyt protilátek proti toxoplasmose pomocí metody IFAT. Králíci nevykazovali žádné klinické příznaky onemocnění. Krevní vzorek byl považován za pozitivní, pokud metoda IFAT poskytla hodnotu aspoň 50. Králíci byli rozděleni do skupin podle věku. Počty testovaných a počty séropozitivních králíků jsou uvedeny v tabulce: Věková kategorie (měsíce) Počet testovaných králíků Počet pozitivních králíků 2 – 4 59 4 ≥ 5 – 6 66 8 ≥ 7 – 12 74 10 ≥ 13 – 30 26 3 Na hladině významnosti 0,05 testujte hypotézu, že výskyt protilátek proti toxoplasmose nezávisí na věku králíka. Vytvořte kontingenční tabulku, kde roli řádkové proměnné bude hrát alternativní proměnná Y (Y = 1 pro pozitivního jedince, Y = 2 pro negativního jedince) a roli sloupcové proměnné pak věk. Spočtěte rovněž sloupcově podmíněné relativní četnosti. Uveďte hodnotu testové statistiky, příslušnou p-hodnotu a rozhodnutí o nulové hypotéze. Nezapomeňte ověřit splnění podmínek dobré aproximace. Vypočtěte Cramérův koeficient. Návod Příslušný datový soubor má tvar: 1 Y 2 X 3 cetnost 1 2 3 4 5 6 7 8 ano 2-4 4 ano 5-6 8 ano 7-12 10 ano 13-30 3 ne 2-4 55 ne 5-6 58 ne 7-12 64 ne 13-30 23 Kontingenční tabulka absolutních a sloupcově podmíněných relativních četností: Y X 2-4 X 5-6 X 7-12 X 13-30 Řádk. součty Četnost Sloupc. četn. Četnost Sloupc. četn. Četnost ano 4 8 10 3 25 6,78% 12,12% 13,51% 11,54% ne 55 58 64 23 200 93,22% 87,88% 86,49% 88,46% Vš.skup. 59 66 74 26 225 Kontingenční tabulka teoretických četností: Y X 2-4 X 5-6 X 7-12 X 13-30 Řádk. součty ano 6,55556 7,33333 8,22222 2,88889 25,0000 ne 52,44444 58,66667 65,77778 23,11111 200,0000 Vš.skup. 59,00000 66,00000 74,00000 26,00000 225,0000 Podmínky dobré aproximace jsou splněny, pouze 1 z 8 teoretických četností (tj. 12,5 %) klesla pod 5, ale neklesla pod 2. Výsledek Pearsonova chí-kvadrát testu nezávislosti: Statist. Chí-kvadr. sv p Pearsonův chí-kv. M-V chí-kvadr. 1,626185 df=3 p=,65347 1,760548 df=3 p=,62356 Hypotézu o nezávislosti výskytu protilátek proti toxoplasmose na věkové kategorii králíků nezamítáme na asymptotické hladině významnosti 0,05, protože p-hodnota je 0,6535, což je větší než 0,05. Znamená to, že rozdíly mezi 6,78 %, 12,12 %, 13,51 % a 11,54 % lze na hladině významnosti 0,05 vysvětlit působením náhodných vlivů. Cramérův koeficient: Statist. Chí-kvadr. Cramér. V ,0850146 Vidíme, že mezi výskytem protilátek proti toxoplasmose a věkovou kategorií králíků existuje jen zanedbatelně slabá závislost. 2. Následující kontingenční tabulka ukazuje výsledky velmi slavného lékařského experimentu ze čtyřicátých let, který se zabýval účinkem streptomycinu při léčbě plicní tuberkulózy. Údaje z radiologického hodnocení po 6 měsících byly porovnány s tím, zda pacient patřil do léčené, nebo kontrolní skupiny. Lze na hladině významnosti 0,05 prokázat vztah mezi léčbou a výsledkem? Výsledek: Testová statistika 26,96 je větší než kritická hodnota 15,09, nulovou hypotézu zamítáme na asymptotické hladině významnosti 0,05. 3. V průzkumu o kuřáctví bylo dotázáno 92 osob. Z 64 mužů jich kouří 19 a z 28 žen jich kouří 6. a) Na hladině významnosti 0,05 testujte hypotézu, že kouření se vyskytuje stejně často u mužů a žen. Použijte Pearsonův chí-kvadrát test i Fisherův přesný test. b) Vypočtěte a interpretujte podíl šancí a stanovte meze 95% intervalu spolehlivosti pro podíl šancí. Výsledek: Ad a) Před provedením Pearsonova chí-kvadrát testu je zapotřebí ověřit splnění podmínek dobré aproximace. Je to v pořádku, všechny čtyři teoretické četnosti jsou větší než 5. Testová statistika Pearsonova chí-kvadrát testu je 0,6714, což je menší než kritická hodnota 3,84, nulovou hypotézu nezamítáme na asymptotické hladině významnosti 0,05. Pro Fisherův přesný test vyjde p-hodnota 0,4576, což je větší než hladina významnosti 0,05, nulovou hypotézu nezamítáme na hladině významnosti 0,05. Ab b) Podíl šancí je 1,55, což znamená, že u mužů je šance na kouření 1,55 x vyšší než u žen. 0,5418 < oρ < 4,4239 s pravděpodobností aspoň 0,95. 4. 36 mužů onemocnělo určitou chorobou. Někteří z nich se léčili, jiní ne. Někteří se uzdravili, jiní zemřeli. Údaje jsou uvedeny ve čtyřpolní kontingenční tabulce. léčenípřežití ano ne ano 10 6 ne 12 8 Vypočtěte a interpretujte podíl šancí. Pomocí intervalu spolehlivosti pro podíl šancí testujte na asymptotické hladině významnosti 0,05 hypotézu, že přežití nezávisí na léčení proti tvrzení, že léčení zvyšuje šance na přežití. Výsledek: 1,1OR = , nulovou hypotézu nezamítáme asymptotické hladině významnosti 0,05, protože levostranný 95% asymptotický interval spolehlivosti pro teoretický podíl šancí je (0,3576; ∞).