Párový neparametrický test •Wilcoxonův test: obdobně seřadíme diference a testujeme proti kritické hodnotě daného testu • •Výpočet pomocí STATISTICY • Dieta laboratorních krys •Máme dva typy diety. Zkontrolujte předpoklad párovosti a vhodnosti použití parametrického testu (r=0,98) • •můžeme použít oba testy – nicméně, zde použijeme nepárovou variantu testu. • C:\Users\User\Desktop\MTR2fa016_krysa038.jpg [korelace ü, Normalita diferencí ü (nicméně 0.094 je vcelku málo, šly by použít oba testy), parametrický: p=0.102 ð nezamítáme H0 Neparametricky: Wilcoxon : p=0.056 ð nezamítáme H0 Znaménkový test: p=0.080 ð nezamítáme H0] Obdoba – jednovýběrový neparametrický test •Wilcoxonův znaménkový test •ve STATISTICE není naimplementovaný •nicméně porovnáváme hodnotu mediánu jednoho výběru proti nějaké hodnotě •můžeme využít Wilcoxonův test pro párové uspořádání testu tak, že druhý výběr bude sestávat pouze z hodnoty, s kterou chceme porovnávat náš původní výběr Vrtačka •Vrtacka.sta •Testujte na hladině významnosti 0,05 , že výdrž jednoho vrtáku ve vrtačce je 500 otáček • C:\Users\User\Desktop\drill8726.jpg Kontingenční tabulky Typy dat - opakování •Kvalitativní (kategoriální) data: •Binární data • •Nominální data • •Ordinální data • • •Kvantitativní data: •Intervalová data • •Poměrová data Kontingenční tabulka •Frekvenční sumarizace dvou binárních, nominálních nebo ordinálních proměnných. •Obecně: R x C kontingenční tabulka (R – počet kategorií jedné proměnné, C – počet kategorií druhé proměnné). •Speciální případ: 2 × 2 tabulka = čtyřpolní tabulka. • Ano Ne S Ano 20 82 102 Ne 10 54 64 S 30 136 166 gen … Kontingenční tabulky – hypotézy •Nezávislost (Pearsonův chí-kvadrát test) •Jeden výběr, dvě charakteristiky – obdoba nepárového uspořádání •Př.: pacienti s AD – pohlaví × vzdělání (VŠ, SŠ, ZŠ) •Shoda struktury (Pearsonův chí-kvadrát test) •Více výběrů, jedna charakteristika – obdoba nepárového uspořádání •Př.: pacienti s AD v několika nemocnicích × věková struktura •Symetrie (McNemarův test) •Jeden výběr, opakovaně jedna charakteristika – obdoba párového uspořádání •Př.: Známky z testu A a z testu B (Jsou testy stejně obtížné?) • Pearsonův chí-kvadrát test •Založen na myšlence srovnání pozorovaných a očekávaných četností kategorií dvou proměnných. •Pozorované četnosti jednotlivých kategorií první proměnné a druhé proměnné nám vyjadřují nij. •Očekávané četnosti jednotlivých kategorií lze vypočítat pomocí: • 1 2 S 1 n11 n12 n1. 2 n21 n22 n2. S n.1 n.2 n X Y 1 2 S 1 e11 e12 e1. 2 e21 e22 e2. S e.1 e.2 e X Y POZOROVANÉ ČETNOSTI OČEKÁVANÉ ČETNOSTI Pearsonův chí-kvadrát test •Výpočet testové statistiky: • • • •Nulovou hypotézu o nezávislosti dvou kategoriálních proměnných zamítáme na hladině významnosti α, když • • • •r – počet řádků c – počet sloupců • Předpoklady Pearsonova chí-kvadrát testu •Nezávislost jednotlivých pozorování •Alespoň 80 % buněk musí mít očekávanou četnost (eij) větší než 5 •100 % buněk musí mít očekávanou četnost (eij) větší než 2 • •Může nám pomoci slučování kategorií, ale můžeme slučovat jen slučitelné kategorie! • Příklad I. nezávislost •Máme 74 pacientů s krevní skupinou A0. Naším cílem je zjistit, zda u těchto pacientů je věk nezávislý na přítomnosti sledovaného onemocnění. A0 <25 25-40 >40 Celkem nemoc 9 16 6 31 zdravý 13 25 5 43 Celkem 22 41 11 74 A0 <25 25-40 >40 Celkem nemoc 9,22 17,18 4,61 - zdravý 12,78 23,82 6,39 - Celkem - - - - Očekávané četnosti Nezamítáme nulovou hypotézu. Tedy u těchto pacientů je věk nezávislý na daném onemocnění. Pozorované četnosti C:\Users\Matyas\Desktop\krevni-skupina_201211112127479.jpg Řešení STATISTICA •2 možné vstupy každý případ z tabulky odpovídá jednomu řádku každá kombinace má přiřazený počet výskytů I II zvolit proměnné (vek a stav) V případě, že je vstupem tabulka II,pak je třeba jako váhu nastavit počet výskytů dané kombinace kategorií Řešení STATISTICA ZKONTROLOVAT PŘEDPOKLADY !!! 1.tabulka – pozorované četnosti 2.tabulka – očekávané četnosti 3.tabulka – statistiky Příklad II. nezávislost •Na hladině významnosti 0,05 testujte hypotézu o nezávislosti pedagogické hodnosti a pohlaví [X2 =3,5 ; p=0,1739] C:\Users\Matyas\Desktop\industrial-organizational-psychology-degrees.jpg Příklad III. •Máme data z dotazníku od 100 mužů, kteří odpovídali na to, jaké sporty dělají. Zjistěte, zda se preference pro americký fotbal dají srovnávat s preferencemi baseballu. [nejsou splněny podmínky dobré aproximace – poslučování (Always + Usually), (Sometimes+Never) -> X2 =33,15 ; p<0.001] C:\Users\Matyas\Desktop\goofy baseball.gif Příklad I. shoda struktury •Máme údaje o barvě očí u třech ročníku. Rozhodněte, zda se na hladině významnosti 0,05 liší procentuální zastoupení jednotlivých barev očí v těchto ročnících. modre hnede zelene 1 rocnik 15 25 15 2 rocnik 10 18 15 3 rocnik 10 26 16 [X2 =1,54 ; p=0,819] vizualizace procentualni zastoupeni: C:\Users\Matyas\Desktop\eye.jpg Příklad II. shoda struktury •Zjistěte, zda se liší intenzita kouření s rozdílným postavením ve firmě… Nekuřák Lehký Střední Těžký Sr. Manager 8 4 6 4 Jr. Manager 8 6 14 8 Sr. Empl 25 10 12 4 Jr. Empl 18 24 33 13 Secretar 10 6 7 2 [X2 =18,88 ; p=0,092] C:\Users\Matyas\Desktop\zeman_prazsky_hrad.jpg McNemarův test – test symetrie •obdoba párového testu – pouze čtyřpolní tabulky •Testová statistika pro čtyřpolní tabulku: • • • • •Zaměřuje se pouze na pozorování, u kterých jsme při opakovaném měření zaznamenali rozdílné výsledky – za platnosti H0 by jejich četnosti (označeny b a c) měly být stejné. • •Testová statistika pro obecnou čtvercovou kontingenční tabulku: • • • • Veličina X Veličina Y Y = 1 Y = 2 Celkem X = 1 a b a + b X = 2 c d c + d Celkem a + c b + d n Příklad I. •Liší se tlak před podáním a po podání léku? • v normě zvýšený v normě 15 8 zvýšený 16 23 po C:\Users\Matyas\Desktop\krevni_tlak2701.jpg Výpočet ve STATISTICE stejně jako obyčejný chí test, pouze v možnostech zašktneme McNemara STATISTICA používá korekci pro nespojitost, proto trochu jiný výsledek … Příklad II. •Máme zjistit, zda požití alkoholu ovlivňuje schopnost řidičů projet nějakou trasu. [X2 =8 ; p≈0,005] C:\Users\Matyas\Desktop\alkoprofimedia-0133616259-5086c22dc31a9_250x365.jpg Příklad III. •Zjišťování přítomnosti onemocnění před a po provedení léčby Disease [Chi-square = 20.67, p<0.001] C:\Users\Matyas\Desktop\tumblr_inline_mg8sxoYztD1qckyc3.jpg Malý počet • •Pokud čtyřpolní tabulka – Fisherův exaktní test • •Jinak pokusit se kategorie smysluplně poslučovat • • • Fisherův exaktní test •Určen pro čtyřpolní tabulky, je vhodný i pro tabulky s malými četnostmi – pro ty, které nesplňují předpoklad Pearsonova chí-kvadrát testu. •Založen na výpočtu „přesné“ p-hodnoty (pravděpodobnosti, s jakou bychom dostali stejný nebo ještě extrémnější výsledek při zachování součtu řádků i sloupců v tabulce). •Příklad: Chceme ověřit vztah dvou typů nežádoucích účinků, které jsou sumarizovány následující tabulkou: •Postup: Všechny varianty tabulky při zachování součtu řádků a sloupců: • • 2 3 6 4 NÚ I NÚ II ano ne ano ne 0 5 8 2 1 4 7 3 2 3 6 4 3 2 5 5 4 1 4 6 5 0 3 7 Pravděpodobnosti výskytu jednotlivých tabulek: 0,007 0,093 0,326 0,392 0,163 0,019 Oboustranná p-hodnota (sečtení pravděpodobností stejných nebo menších než je pravděpodobnost pozorované varianty): p = 0,326 + 0,093 + 0,007 + 0,163 + 0,019 = 0,608 Příklad I. – Fisherův exaktní test •V náhodném výběru 50 obézních dětí byla zjišťována obezita rodičů. X – obezita matky, Y-obezita otce. Na hladině významnosti 0,05 ověřte, zda lze zamítnout hypotézu o nezávislosti veličin X a Y. C:\Users\Matyas\Desktop\detska-obezita.jpg