Neparametrické testy oparametrické a neparametrické testy opořadové neparametrické testy otest Chí-kvadrát ntest nezávislosti proměnných ntest dobré shody Parametrické testy ot-testy a analýza rozptylu jsou tzv. parametrické testy oparametr = charakteristika populace (průměr, rozptyl) oparametrické testy používají při výpočtech charakteristiky populace (parametry) Parametrické testy oparametrické testy pracují s předpoklady o charakteristikách populace onapř. u t-testu předpokládáme, že směrodatné odchylky výběrů mohou posloužit jako odhad pro směrodatnou odchylku populace opodobně počítají s normálním rozdělením měřeného znaku Parametrické testy opokud nejsou tyto předpoklady splněny, můžeme dojít k nepřesným výsledkům Neparametrické testy oneparametrické testy nezávisí na charakteristikách populace ani o nich nečiní žádné závěry onení vyžadováno normální rozdělení znaku oproto jsou tyto testy označovány také jako „distribution-free“ testy Neparametrické testy oproč potom vůbec používat parametrické testy? nmnoho parametrických testů je poměrně „odolných“ (tzv. robustních) vůči narušení předpokladů testu (např. menší odchylky od normálního rozdělení výsledky nezkreslí) nparametrické testy mají větší statistickou sílu než neparametrické (větší pravděpodobnost zjištění rozdílu, pokud skutečně existuje) npro některé typy analýz neparametrické metody nejsou (např. neexistuje obecně přijímaná neparametrická faktoriální ANOVA) Neparametrické testy ohlavní výhody neparametrických testů nnejsou omezeny předpokladem normálního rozdělení njsou často založeny na pořadí, dají se použít i pro ordinální data (kde můžeme spočítat pouze medián, nikoli průměr) i pro nominální (test Chí-kvadrát) nnejsou citlivé na extrémní hodnoty (jsou většinou založeny na mediánu) n Neparametrické testy ohlavní nevýhody neparametrických testů nmenší statistická síla npro složitější analýzy často není neparametrická varianta metody k dispozici n Neparametrické testy opřehled neparametrických ekvivalentů parametrických testů nt-test pro nezávislé výběry – Mann-Whitney U test nt-test pro závislé výběry – Wilcoxon test nanalýza rozptylu – Kruskall-Wallis test nopakovaná měření (ANOVA) – Friedman Rank Test n n Mann-Whitney U test - příklad ochceme zjistit, zda se levoruké a pravoruké osoby liší v prostorových schopnostech onáhodně vybereme 10 leváků a 10 praváků (podobného věku, stejný počet mužů a žen) a zadáme jim test prostorových schopností Mann-Whitney U test - příklad ojaká bude naše hypotéza? Mann-Whitney U test - příklad ojaká bude naše hypotéza? nskóry v testu prostorových schopností se liší u leváků a praváků n Mann-Whitney U test - příklad ojaká bude nulová hypotéza? Mann-Whitney U test - příklad ojaká bude nulová hypotéza? nskóry v testu prostorových schopností se u leváků a praváků neliší o otestujeme nulovou hypotézu (začneme s předpokladem, že platí a ptáme se: jaká je pravděpodobnost pozorovaných rozdílů, pokud H0 platí?) n n leváci praváci 87 47 94 68 56 92 74 73 98 71 83 82 92 55 84 61 76 75 - (nedostavil se) 85 Mann-Whitney U test - příklad Mann-Whitney U test - příklad o Mann-Whitney U test - příklad ona základě takto malého vzorku nemůžeme rozhodnout, zda je rozdělení skorů z testu prostorových schopností normální opočty osob ve skupinách jsou příliš malé (9 a 10) ovhodnější než t-test bude proto neparametrický test Mann-Whitney U test - příklad ovýpočetní postup - 1. krok nseřadit skóry podle velikosti - bez ohledu na skupinu na přidělit jim pořadí (rank) n leváci praváci skór pořadí skór pořadí 87 15 47 1 94 18 68 5 56 3 92 16,5 74 8 73 7 98 19 71 6 83 12 82 11 92 16,5 55 2 84 13 61 4 76 10 75 9 - - 85 14 S R1 = 114,5 S R2 = 75,5 Logika výpočtu U ou každého člena skupiny 1 určíme, kolik členů druhé skupiny má vyšší skór než on npoté sečteme u všech členů skupiny 1 a dostaneme U1 oto stejné pro skupinu 2 a získáme U2 omenší z U používáme pro testování hypotézy (porovnání s kritickou hodnotou) 47 1 P 9 55 2 P 9 56 3 L 61 4 P 8 68 5 P 8 71 6 P 8 73 7 P 8 74 8 L 75 9 P 7 76 10 L 82 11 P 6 83 12 L 84 13 L 85 14 P 4 87 15 L 92 16,5 P 2,5 92 16,5 L 94 18 L 98 19 L U2= 69,5 47 1 P 55 2 P 56 3 L 8 61 4 P 68 5 P 71 6 P 73 7 P 74 8 L 4 75 9 P 76 10 L 3 82 11 P 83 12 L 2 84 13 L 2 85 14 P 87 15 L 1 92 16,5 P 92 16,5 L 0,5 94 18 L 0 98 19 L 0 U1= 20,5 Logika výpočtu U opro kontrolu: nU1 + U2 = n1 * n2 nU1 + U2 = 9 * 10 nU1 + U2 = 90 n69,5 + 20,5 = 90 n oJaké je U, když jsou mezi skupinami největší rozdíly? oJaké je U, když mezi skupinami nejsou rozdíly? o o o o Mann-Whitney U test - příklad ovýpočetní postup - 2. krok nsečíst pořadí v obou skupinách o S R1 = 114,5 o S R2 = 75,5 o (pokud se leváci a praváci neliší, průměrné pořadí skórů by mělo být u obou skupin podobné) n Mann-Whitney U test - příklad ovýpočetní postup - 3. krok nvypočítat U pro obě skupiny npodle vzorce oU1 = (n1)(n2) + n1 (n1+1)/2 - S R1 o oU2 = (n1)(n2) + n2 (n2+1)/2 - S R2 o Mann-Whitney U test - příklad ovýpočet U o oU1 = (n1)(n2) + n1 (n1+1)/2 - S R1 oU1 = (9)(10) + 9 (9+1)/2 – 114,5 oU1 = 20,5 o o oU2 = (n1)(n2) + n2 (n2+1)/2 - S R2 oU2 = (9)(10) + 10(10+1)/2 – 75,5 oU2 = 69,5 Mann-Whitney U test - příklad ovýpočetní postup - 4. krok nvybrat menší z vypočítaných U nv našem příkladu je to U1 (=20,5) ovýpočetní postup - 5. krok nnajít v tabulce kritickou hodnotu U pro zvolenou hladinu významnosti npro a = .05, při n1 = 9 a n2 = 10 n Ukrit.=20 n Mann-Whitney U test - příklad o6. krok nporovnat vypočítanou hodnotu U a kritickou hodnotu U nu tohoto testu je rozdíl statisticky významný, pokud je vypočítaná hodnota menší než kritická hodnota U n20,5 není menší než 20 à nemůžeme zamítnout nulovou hypotézu o n Mann-Whitney U test - příklad ozávěr: rozdíl mezi leváky a praváky v testu prostorových schopností není statisticky významný oneznamená to nutně, že kdybychom prozkoumali celou populaci leváků a praváků, nebyl by mezi nimi rozdíl – pouze se nám tento rozdíl nepodařilo prokázat (hlavně díky malému N) o Test Chí-kvadrát ochí-kvadrát může být použit npro testování rozdělení jedné proměnné (test dobré shody) ntestování nezávislosti dvou proměnných Test Chí-kvadrát ochí-kvadrát pro testování nezávislosti proměnných se používá pro nominální nebo ordinální proměnné odata jsou uspořádána do tzv. kontingenční tabulky (viz příklad) Příklad ozajímá nás, jak souvisí model manželství s jeho vydařeností nmodel manželství má kategorie: dominance žena, dominance muž, kooperace nvydařenost má 3 kategorie – vydařené, průměrné, nevydařené opozn.: jde o manželství rodičů respondentů, tak jak je posuzují oni (zdroj dat – výzkum doc. Plaňavy) Příklad ootázka zní: liší se podíl vydařených, průměrných a nevydařených manželství u rodin, kde dominovala matka, rodin, kde dominoval otec a u rodin, kde nedominoval ani jeden z nich? Kontingenční tabulka o Test Chí-kvadrát ochí-kvadrát porovnává očekávané a pozorované četnosti oočekávané jsou četnosti za předpokladu, že proměnné jsou nezávislé o Příklad ov našem příkladu bylo 42,2% vydařených manželství opokud by proměnné (model a vydařenost manželství) byly vzájemně nezávislé, poměr vydařených manželství v jednotlivých modelech manželství by měl být přibližně stejný (a odrážet celkový podíl) – 42% opodobně ostatní kategorie… Test Chí-kvadrát oočekávané četnosti – výpočet: nOij = (ři sj )/ N o o (pro každé políčko tabulky se vynásobí celkové četnosti z příslušného řádku se sloupcovými četnostmi a vydělí celkovým počtem osob) Kontingenční tabulka oPozorované četnosti Příklad opro první políčko tabulky (vydařená manželství s dominantní matkou) je očekávaná četnost nOij = (ři sj )/ N nO11 = (ř1 s1 )/ N nO11 = (69*65 )/ 154 nO11 = 29,12 o Očekávané četnosti o Test Chí-kvadrát ochí-kvadrát porovná očekávané četnosti s pozorovanými o nc2 = S [(pozor. četnosti – oček.)2/oček.] Příklad nc2 = S [(pozor. četnosti – oček.)2/oček.] nc2 = (-7,1)2/29,1 +3,92/25,1 + 3,22/14,8 + (-4.6)2/18,6 + 32/16 + 1,62/9,4 + 11,72/17,3 + (-6,9)2/14,9 + (-4,8)2/8,8 nc2 = 18, 71 Test Chí-kvadrát opro vyhledání kritické hodnoty c2 v tabulce musíme vypočítat ještě počet stupňů volnosti (df) o df = (ř-1) (s-1) o o (tj. počet řádků -1 krát počet sloupců -1) Příklad odf = (ř-1) (s-1) o df = (3-1) * (3-1) o df = 4 ov tabulkách vyhledáme kritickou hodnotu c2 pro df = 4 a 5% hladinu významnosti oc2 krit = 9,49 o o Příklad oc2 krit = 9,49 oc2 = 18,71 ozávěr: vypočítaná hodnota je větší než kritická hodnota - očekávané a pozorované četnosti se liší na 5% hladině významnosti (tj. je malá pravděpodobnost, že proměnné jsou nezávislé) o Test Chí-kvadrát v SPSS o Chí-kvadrát pro 1 proměnnou otzv. test dobré shody (goodness-of-fit test) oopět porovnává očekávané a pozorované četnosti opředpokladem očekávaných četností není tentokrát nezávislost proměnných (máme jen 1) Test dobré shody ojak určíme očekávané četnosti? o2 způsoby: npředpoklad vyplývá z teorie (např. u genetických dat – poměr osob s projevem dominantní a recesivní alely) nnebo můžeme předpokládat náhodné rozdělení do kategorií n n Příklad oje počet sebevražd stejný každý den v týdnu? ozjistíme data pro rok 2000 (ČR) o Příklad pondělí 255 úterý 247 středa 240 čtvrtek 206 pátek 236 sobota 192 neděle 226 Příklad oočekávané četnosti nstejný počet sebevražd pro každý den v týdnu ncelkem 1602 sebevražd nočekávaná četnost pro každý den je 228,9 Příklad Příklad ovzorec pro výpočet je stejný oc2 = 13,44 odf = k -1 (počet kategorií -1) odf = 6 opro df =6 a 5% hladinu významnosti je c2 krit = 12,59 orozdíl je statisticky významný Příklad Omezení Chí-kvadrátu o2 potenciální problémy: nmalý počet osob – pokud má velké % políček tabulky očekávanou četnost menší než 5 (v ideálním případě by všechna měla mít oček. četnost nejméně 5 osob) npříliš velký počet osob – čím vyšší N, tím vyšší c2 (vyjdou významné i malé rozdíly) Prezentace výsledků okontingenční tabulka - uvést vždy počet osob otabulka by měla být přehledná – uvést jen jeden nebo dva druhy relativních četností ou Chí-kvadrátu se zapisuje jeho hodnota, počet stupňů volnosti a hladina významnosti nChíkv.=18.65, df=4, p<0.010 o Prezentace výsledků opříklad kontingenční tabulky a výsledků testu Chí-kvadrát v tabulce a v textu – viz pdf soubory ve Studijních materiálech o Kontrolní otázky ohlavní rozdíl mezi parametrickými a neparametrickými testy ovýhody a nevýhody neparametrických testů okdy je možno využít chí–kvadrát jako test nezávislosti proměnných? (pro jaké typy proměnných?) okdy se chí–kvadrát využívá jako test dobré shody? o Literatura oHendl kapitola 5.4 oHendl kapitola 8