Neparametrické testy o parametrické a neparametrické testy o pořadové neparametrické testy o test Chí-kvadrát n test nezávislosti proměnných n test dobré shody Parametrické testy o t-testy a analýza rozptylu jsou tzv. parametrické testy o parametr = charakteristika populace (průměr, rozptyl) o parametrické testy používají při výpočtech závěry o hodnotě nějakého parametru pravděpodobnostního rozdělení Parametrické testy o např. u t-testu předpokládáme, že směrodatné odchylky výběrů mohou posloužit jako odhad pro směrodatnou odchylku populace o podobně počítají s normálním rozdělením měřeného znaku o pokud nejsou tyto předpoklady splněny, můžeme dojít k nepřesným výsledkům Neparametrické testy o neparametrické testy nezávisí na charakteristikách populace ani o nich nečiní žádné závěry o není vyžadováno normální rozdělení znaku o proto jsou tyto testy označovány také jako "distribution-free" testy, nezávislé na rozdělení Neparametrické testy o proč potom vůbec používat parametrické testy? n mnoho parametrických testů je poměrně "odolných" (tzv. robustních) vůči narušení předpokladů testu (např. menší odchylky od normálního rozdělení výsledky nezkreslí) n parametrické testy mají větší statistickou sílu než neparametrické (větší pravděpodobnost zjištění rozdílu, pokud skutečně existuje) n pro některé typy analýz neparametrické metody nejsou (např. neexistuje obecně přijímaná neparametrická faktoriální ANOVA) Neparametrické testy o hlavní výhody neparametrických testů n nejsou omezeny předpokladem normálního rozdělení n jsou často založeny na pořadí, dají se použít i pro ordinální data (kde můžeme spočítat pouze průměr, nikoli medián) i pro nominální (test Chí-kvadrát) n nejsou citlivé na extrémní hodnoty Neparametrické testy o využívají se v těchto situacích: n proměnné jsou měřeny na ordinální úrovni n velikost souboru je malá n hodnoty měřeného znaku nejsou rozděleny normálně n pro zvýšení validity závěrů z parametrických metod Neparametrické testy o přehled neparametrických ekvivalentů parametrických testů n t-test pro nezávislé výběry -- Mann-Whitneyův U test, Wilcoxonův test n t-test pro závislé výběry -- Wilcoxonův test n analýza rozptylu -- Kruskall-Wallisův test n opakovaná měření (ANOVA) -- Friedmanův pořadový test Test Chí-kvadrát o používá se při analýze kategoriálních dat o chí-kvadrát může být použit n pro testování rozdělení jedné proměnné (test dobré shody) n testování nezávislosti dvou proměnných Test Chí-kvadrát o chí-kvadrát pro testování nezávislosti proměnných se používá pro nominální nebo ordinální proměnné o data jsou uspořádána do tzv. kontingenční tabulky (viz příklad) Příklad o zajímá nás, jak souvisí model manželství s jeho vydařeností n model manželství má kategorie: dominance žena, dominance muž, kooperace n vydařenost má 3 kategorie -- vydařené, průměrné, nevydařené o pozn.: jde o manželství rodičů respondentů, tak jak je posuzují oni (zdroj dat -- výzkum doc. Plaňavy) Příklad o otázka zní: liší se podíl vydařených, průměrných a nevydařených manželství u rodin, kde dominovala matka, rodin, kde dominoval otec a u rodin, kde nedominoval ani jeden z nich? Kontingenční tabulka (SPSS) Test Chí-kvadrát o chí-kvadrát porovnává očekávané a pozorované četnosti o očekávané jsou četnosti za předpokladu, že proměnné jsou nezávislé Příklad o v našem příkladu bylo 42,2% vydařených manželství o pokud by proměnné (model a vydařenost manželství) byly vzájemně nezávislé, poměr vydařených manželství v jednotlivých modelech manželství by měl být přibližně stejný (a odrážet celkový podíl) -- 42% o podobně ostatní kategorie... Test Chí-kvadrát o očekávané četnosti -- výpočet: O[ij] = (ř[i] s[j] )/ N (pro každé políčko tabulky se vynásobí celkové četnosti z příslušného řádku se sloupcovými četnostmi a vydělí celkovým počtem osob) Příklad Příklad o pro první políčko tabulky (vydařená manželství s dominantní matkou) je očekávaná četnost O[ij] = (ř[i] s[j] )/ N O[11] = (ř[1] s[1] )/ N O[11] = (69*65 )/ 154 O[11] = 29,12 Očekávané četnosti Test Chí-kvadrát o chí-kvadrát porovná očekávané četnosti s pozorovanými c^2 = S [(pozor. četnosti -- oček.)^2/oček.] Příklad c^2 = S [(pozor. četnosti -- oček.)^2/oček.] c^2 = (-7,1)^2/29,1 +3,9^2/25,1 + 3,2^2/14,8 + (-4.6)^2/18,6 + 3^2/16 + 1,6^2/9,4 + 11,7^2/17,3 + (-6,9)^2/14,9 + (-4,8)^2/8,8 c^2 = 18, 71 Test Chí-kvadrát o pro vyhledání kritické hodnoty c^2 v tabulce musíme vypočítat ještě počet stupňů volnosti (df) o df = (ř-1) (s-1) (tj. počet řádků -1 krát počet sloupců -1) Příklad o df = (ř-1) (s-1) df = (3-1) * (3-1) df = 4 o v tabulkách vyhledáme kritickou hodnotu c^2 pro df=4 a 5% hladinu významnosti o c^2 [krit] = 9,49 Příklad o c^2 [krit] = 9,49 o c^2 = 18,71 o závěr: vypočítaná hodnota je větší než kritická hodnota - očekávané a pozorované četnosti se liší na 5% hladině významnosti (tj. je malá pravděpodobnost, že proměnné jsou nezávislé) Test Chí-kvadrát v SPSS Chí-kvadrát pro 1 proměnnou o tzv. test dobré shody (goodness-of-fit test) o testuje, zda se rozdělení hodnot blíží předpokládanému rozdělení o opět porovnává očekávané a pozorované četnosti o předpokladem očekávaných četností není tentokrát nezávislost proměnných (máme jen 1) Test dobré shody o jak určíme očekávané četnosti? o např.: n předpoklad vyplývá z teorie (např. u genetických dat -- poměr osob s projevem dominantní a recesivní alely) n nebo můžeme předpokládat stejné rozdělení do kategorií, tzv. předpoklad homogenity Příklad o je počet sebevražd stejný každý den v týdnu? o zjistíme data pro rok 2000 (ČR) Příklad Příklad o očekávané četnosti n stejný počet sebevražd pro každý den v týdnu n celkem 1602 sebevražd n očekávaná četnost pro každý den je 228,9 Příklad Příklad o vzorec pro výpočet je stejný o c^2 = 13,44 o df = k -1 (počet kategorií -1) o df = 6 o pro df =6 a 5% hladinu významnosti je c^2 [krit] = 12,59 o rozdíl je statisticky významný Výstup v SPSS Omezení Chí-kvadrátu o 2 potenciální problémy: n malý počet osob -- pokud má velké % políček tabulky očekávanou četnost menší než 5 (v ideálním případě by všechna měla mít oček. četnost nejméně 5 osob) n příliš velký počet osob -- čím vyšší N, tím vyšší c^2 (vyjdou významné i malé rozdíly) Kontrolní otázky o výhody a nevýhody neparametrických testů o kdy je možno využít chí--kvadrát jako test nezávislosti proměnných? (pro jaké typy proměnných?) o kdy se chí--kvadrát využívá jako test dobré shody? Literatura o Hendl kapitola 8 o příklad použití testu Chí-kvadrát v empirické studii: n Samuels J., Bienvenu O.J., Cullen B., Costa P.T. Jr, Eaton W.W., Nestadt G. (2004). Personality dimensions and criminal arrest. Comprehensive Psychiatry, 45, 275-280.