11 Hodnocení kontingenčních tabulek Příklad 11.1. Pearsonův \2 test V roce 1950 zkoumali Yule a Kendall barvu očí a vlasů u 6800 mužů (viz tabulka 1; soubor vlasy_oci.csv). Tabulka 1: Absolutní četnosti barvy vlasů a barvy očí mužů Barva očí Barva vlasů světlá kaštanová černá rezavá modrá šedá/zelená hnědá 1768 807 189 47 946 1387 746 53 115 438 288 16 Na asymptotické hladině významnosti a = 0.01 zjistěte, zda mezi barvou očí a vlasů u mužů existuje závislost. Řešení příkladu 11.1 • Hq : Barva očí a barva vlasů ................................. stochasticky nezávislé. • Hi : Barva očí a barva vlasů ................................. stochasticky nezávislé. • Hladina významnosti a = ................ 1 data <- read.delim(..., header = T, row.names = 1) # načteni datového souboru 2 n <- sum(...) # rozsah náhodného vyberu [1] 6800 Datový soubor obsahuje údaje o barvě očí a barvě vlasů .......................... mužů. Podmínka dobré aproximace Pearsonův \2 test můžeme provést, jedi splněna podmínka dobré aproximace (alespoň 80% očekávaných četností je větších nebo rovných 5 a zbylých 20% očekávaný četností neklesne pod hodnotu 2). 4 roundCchisq.test(data, correct = F)$expected, 1) # tabulka očekávaných četnosti svetla kaštanová cerna rezavá modra 1169.5 1088.0 505 . 6 48.0 seda/zelena 1303.0 1212.3 563.3 53.4 hneda 356.5 331.7 154. 1 14.6 Podmínka dobré aproximace.................... splněna. Všechny teoretické četnosti jsou Pearsonův \2 test 9 chisq.test C data, correct = F) # Pearsonův chi-kvadrátový test 10 alpha <- ... # hladina významnosti alpha 11 r <- ... # počet variant znaku X (barva oci) 12 s <- ... # počet variant znaku Y (barva vlasu) 13 q <- qchisq(.......) # dolni hranice kritického oboru než 5. Pearson1suChi-squaredutest data:uudata X-squaredu=u1073.5,udfu=u6,uP_valueu