7 Jednovýběrové parametrické testy 7.1 Test o rozptylu a2 Nechť X\,... Xn je náhodný výběr z N(fi, a2), kde p neznáme a tjg je konstanta. Na hladině významnosti a = 0.05 testujeme jednu z následujících tří hypotéz oproti příslušné alternativní hypotéze. ířoi '■ a'2 = a'o oproti Hii : a2 ^ a\ (pravostranná alt.) ířo3 : cr2 > (Tg oproti .H13 :a'1 U a2 W = kde x2_i(tt/2), Xn-i(l ~~ a/2), Xn-i(a)i X2-i(l ~~ a) Jsou kvantily x2 rozdělení o n — 1 stupních volnosti, jejichž hodnoty získáme pomocí softwaru ® a implementované funkce qchisq(). Interval spolehlivosti má podle zvolené alternativní hypotézy jeden z následujících tvarů (n — l)s2 (n — l)s2 Hn : a2 ± al (d, h) H12 :a2>al (d, oo) = -5-—--- , 00 X2_i(l-«/2)' X2_i(«/2) i x2_i(i-«) Poznámka: Protože parametr a2 je vždy větší než 0, můžeme dolní hranici pravostranného intervalu spolehlivosti zvolit 0 namísto mínus nekonečna. p-hodnota má v závislosti na zvolené alternativní hypotéze jeden z následujících tvarů Hn : a2 ^ a2 p-hodnota = 2min{Pr(Fw < fw), Pr(Fw > fw)} H12 :a2>al p-hodnota = Yr(Fw > fw) = 1 - Pr(Fw < fw) H13 : a2 < tTg p-hodnota = Pr(Fw < fw) kde Fyy je náhodná veličina, fw je realizace testovací statistiky Fyy (viz vzorec 7.1), tedy konkrétní číslo, a Pr(i fw)} = 2min{Pr(Fw < fw), 1 - Pr(rV < fw)} = 2min{Pr(!ZV < 154.7599), 1 - Pr(Tw < 154.7599)} = 2min{0.00057779, 0.9994222} = 2 x 0.00057779 = 0.00115558 = 0.001156 4 Chi-Squared Te st on Variance data: skull.LM Chi-Squared = 154.76, df = 216, p-value = 0.001156 alt ernat ive hypothe sis : true variance is not equal to 56.64068 99 percent confidence interval: 32.07525 52.73553 sample estimates: vari ance 40.58197 intervalu spolehlivosti 32.07525 a 52.73553 a p-hodnota p-value = 0.001156. Jediné, co musíme stanovit zvlášť, jsou dolní a horní hranice kritického oboru. 5 Příklad 7.2. Test o rozptylu a2 Mějme datový soubor 18-more-samples-variances-clavicle.txt a proměnnou cla.L popisující největší délku klíční kosti z pravé strany v mm (viz sekce ??). Dále máme k dispozici údaje o největší délce klíční kosti z pravé strany mužů z populace severozápadní Indie {mnwj = 146.89 mm, snwj = 9.23 mm, nnwj = 100). Na hladině významnosti a = 0.05 zjistěte, zda je rozptyl největší délky klíční kosti z pravé strany u mužů populace z Amritsaru menší než rozptyl největší délky klíční kosti z pravé strany mužů populace severozápadní Indie. Řešení příkladu 7.2 Příkazem read.delim() načteme datový soubor a pomocí operátoru [] vybereme z datové tabulky naměřené délky klíční kosti (cla.L) mužů populace z Amritsaru (pop == 'indl'). Nakonec z vektoru naměřených hodnot odstraníme chybějící údaje (na.omit()) a zjistíme jeho délku (length()). 26 data <- read.delim('00-Data//18-more-samples-variances-clavicle.txt') 27 data <- na.omit(data) 28 cla.LI <- data[data$pop == 'indl', 'cla.L'] 29 n <- length(cla.LI) # 120 Datový soubor obsahuje údaje o délce klíční kosti z pravé strany u 120 mužů populace z Amritsaru. Naším úkolem ze zadání je porovnat rozptyly dvou indických populací, přičemž u mužů z populace z Amritsaru známe naměřené hodnoty. Na základě těchto hodnot můžeme zjistit, zda náhodný výběr pochází z normálního rozdělení. Druhá populace, a sice ze sevenrí Indie je reprezentována pouze hodnotou aritmetického průměru {mnwj = 146.89 mm) a směrodatnou odchylkou {snwj = 9.23 mm). O jejím rozdělení přesnější informace nemáme. Řešení příkladu vede na případ, kdy rozptyl jednoho náhodného výběru porovnáváme s konkrétním číslem, tedy na jed-novýběrový test o rozptylu a2. Předpokladem k použití tohoto testu je normalita náhodného výběru délek klíčních kostí z pravé strany u mužů z populace z Amritsaru. Před použitím testu je třeba tento předpoklad ověřit. Jelikož rozsah náhodného výběru je větší než 30, ověříme předpoklad normality Lillieforsovým testem (a = 0.05). Grafické ověření provedeme kvantilovým diagramem a histogramem (viz obrázek 2). Datový soubor rozdělíme do osmi ekvidistatních intervalů s šířkou 6 mm prostřednictvím stanovených hranic 122,130,..., 170. 125 137 149 161 -2 -1 0 1 2 teoreticky kvantil délka klicni kosti z pravé strany (v mm) Lillieforsuv test: p-hodnota =0.0956 Obrázek 2: Histogram a kvantilový diagram největší délky klíční kosti z pravé strany u mužů z populace v Amritsaru Protože p-hodnota = 0.0956 je větší než 0.05, nulovou hypotézu o normalitě dat nezamítáme na hladině významnosti a = 0.05. Z histogramu na obrázku 2 vidíme, že naměřené hodnoty kopírují vhodně tvar křivky hustoty normálního rozdělení. Na kvantilovém diagramu je zřejmý trend odlehlosti bodů od referenční křivky na pravé i levé straně. Tato odlehlost však není fatální pro předpoklad normality náhodého výběru. Náhodný výběr délek klíčních kostí z pravé strany u mužů z populace z Amritsaru pochází z normálního rozdělení. 6 Jelikož je předpoklad normality náhodného výběru splněn, můžeme hypotézu ze zadání otestovat pomocí parametrického testu o rozptylu a2. Naším úkolem je zjistit, zda je rozptyl nej větší délky klíční kosti z pravé strany u mužů populace z Amritsaru menší než rozptyl nej větší délky klíční kosti z pravé strany mužů populace severozápadní Indie. Tato věta je zněním alternativní hypotézy. Nulovou hypotézu stanovíme jako doplněk k tomuto tvrzení. 1. Stanovení hypotéz • slovní formulace nulové a alternativní hypotézy Hq : Rozptyl největší délky klíční kosti z pravé strany u mužů populace z Amritsaru je větší nebo roven rozptylu největší délky klíční kosti z pravé strany mužů z populace severozápadní Indie. Hi : Rozptyl největší délky klíční kosti z pravé strany u mužů populace z Amritsaru je menší než rozptyl největší délky klíční kosti z pravé strany mužů z populace severozápadní Indie. • matematická formulace nulové a alternativní hypotézy H0:a2 > cr2, kde cr2 = 9.232 Hi : a2 < ctq, kde tjg = 9.232 (levostranná alternativa) 2. Volba hladiny významnosti • Hladinu významnosti volíme v souladu se zadáním jako a = 0.05. 3. Testování kritickým oborem • Testovací statistika (n-l)S2 (120 - 1)8.7334322 119 x 76.27283 = ST" = "-9^-= 85.1929 = 106-5402- 30 alpha <- 0.05 31 sigma_0 <- 9.23 32 s <- sd(cla.LI) 33 fw <- ((n - 1) * s " 2) / (sigma_0 " 2) # 106.5402 • Kritický obor W= (0;xLi(«)> = (0;x?2o-i(0-05)) = (0; 94.8112) 34 qchisq (alpha , n - 1) # 94.81124 • Závěr testování Protože realizace testovací statistiky fw = 106.5402 nenáleží do kritického oboru, tj. fw ^ W, Hq nezamítáme na hladině významnosti a = 0.05. 4. Testování intervalem spolehlivosti • Interval spolehlivosti xLi(«/2) (120 - 1)8.7334322 ' X220-i(0.05) 119 x 76.27283\ ' 94.81124 / (0, 95.73197) 7 35 hh <- (n - 1) * s " 2 / qchisq(alpha, n - 1) # 295.73197 • Závěr testování Protože (Tg = 9.232 = 85.1929 náleží do Waldova 95% empirického pravostranného intervalu spolehlivosti, tj. ctq = 85.1929 G IS, Hq nezamítáme na hladině významnosti a = 0.05. 5. Testování p-hodnotou • p-hodnota p-hodnota = Pr(Tw < 106.5402) = 0.2135755 = 0.2136 36 p.val <- pchisq(fw, n - 1) # 0.2135755 • Závěr testování Protože p-hodnota = 0.2136 je větší než a = 0.05, Hq nezamítáme na hladině významnosti a = 0.05. 6. Interpretace výsledků Za základě všech tří typů testování nezamítáme nulovou hypotézu na hladině významnosti a = 0.05. Rozptyl největší délky klíční kosti z pravé strany u mužů z populace z Amritsaru není statisticky významně menší než rozptyl délky klíční kosti z pravé strany u mužů z populace severozápadní Indie. Poznámka: Test rozptylu a2 můžeme provést pomocí funkce varTest() z knihovny EnvStats. Vstupními parametry budou vektor reprezentující náhodný výběr (cla.LI), hodnota parametru tTg (argument sigma.squared = 9.232), hodnota hladiny významnosti a zadaná prostřednictvím koeficientu spolehlivosti 1 — a (argument conf.level = 0.95) a typ zvolené alternativní hypotézy (levostranná; argument alternativě = 'less'). 37 EnvStats: :varTest(cla.LI , sigma.squared = 9.23"2 , alt = 'less') Chi-Squared Te st on Variance data: cla.LI Chi-Squared = 106.54, df = 119, p-value = 0.2136 alt ernat ive hypothe sis : true variance is less than 85 . 1929 95 percent confidence interval: 0.00000 95.73197 sample estimates: vari ance 76.27283 38 39 40 41 42 43 44 45 46 47 48 Součástí výstupu je hodnota výběrového rozptylu variance = 76.27283, hodnota testovací statistiky Chi-squared = 106.54, počet stupňů volnosti Studentova rozdělení df = 119, hranice 95% Waldova empirického pravostranného intervalu spolehlivosti 0 a 95.73197 ap-hodnota p-value = 0.2136. Jediné, co musíme stanovit zvlášť, je horní hranice kritického oboru. 8 Příklad 7.3. Test o směrodatné odchylce a Mějme datový soubor ll-two-samples-means-skull.txt a proměnnou skuli.H popisující basion-bregmatickou výšku lebky v mm jedinců starověké egyptské populace (viz sekce ??). Dále máme k dispozici údaje o basion-bregmatické výšce lebky mužů novověké egyptské populace (mm = 133.977 mm, sm = 5.171 mm, nm = 87). Na hladině významnosti a = 0.05 zjistěte, zda jsou směrodatné odchylky basion-bregmatické výšky lebky mužů starověké a novověké egyptské populace shodné. Řešení příkladu 7.3 Nejprve načteme datový soubor. Pomocí operátoru [] vybereme z datové tabulky naměřené basion-bregmatické výšky lebky (skuli.H) mužů (sex == 'm'). Nakonec z vektoru naměřených hodnot odstraníme chybějící údaje a zjistíme počet naměřených údajů. 49 data <- read.delim('00-Data//11-two-samples-means-skuli.txt') 50 skuli.HM <- data[data$sex == 'm', 'skuli.H'] 51 skuli.HM <- as.numeric(na.omit(skuli.HM)) 52 n <- length(skuli.HM) # 215 Datový soubor obsahuje údaje o basion-bregmatické výšce lebky 215 mužů starověké egyptské populace. Naším úkolem ze zadání je porovnat směrodatné odchylky dvou egyptských populací, přičemž u mužů ze starověké egyptské populace máme k dispozici naměřené hodnoty. Na základě těchto hodnot můžeme zjistit, zda náhodný výběr pochází z normálního rozdělení. Druhá, novověká egypská populace je reprezentována pouze hodnotou aritmetického průměru (mm = 133.977 mm) a směrodatnou odchylkou (sm = 5.171 mm). O jejím rozdělení přesnější informace nemáme. V rámci příkladu tedy porovnáváme směrodatnou odchylku jednoho náhodného výběru s konkrétním číslem. K tomu, po vhodné modifikaci nulové a alternativní hypotézy, použijeme jednovýběrový test o rozptylu a2. Jediným předpokladem k použití tohoto testu je normální rozdělení náhodného výběru basion-bregmatických výšek lebky mužů starověké egyptské populace. Před použitím testu tedy tento předpoklad ověříme. Vzhledem k rozsahu náhodného výběru ověříme předpoklad normality Lillieforsovým testem (a = 0.05)Graficky zhodnotíme náhondý výběr kvantilovým diagramem a histogramem (viz obrázek 3). Datový soubor rozdělíme do devíti ekvidistatních intervalů s šířkou 3 mm prostřednictvím stanovených hranic 119,122,..., 146. 120.5 126.5 132.5 138.5 144.5 -3 -2 -1 0 1 2 3 teoreticky kvantil basion-bregmaticka vyska lebky (v mm) Lillieforsuv test: p-hodnota =0.1263 Obrázek 3: Histogram a kvantilový diagram basion-bregmatické výšky lebky mužů starověké egyptské populace Protože p-hodnota = 0.1263 je větší než 0.05, nulovou hypotézu o normalitě dat nezamítáme na hladině významnosti a = 0.05. Z histogramu na obrázku 3 vidíme, že naměřené hodnoty věrně kopírují tvar křivky hustoty normálního rozdělení. Na kvantilovém diagramu je viditelná příchylnost bodů k referenční křivce. Náhodný výběr basion-bregmatické výšky lebky mužů ze starověké egyptské populace tedy pochází z normálního rozdělení. Protože náhodný výběr pochází z normálního rozdělení, můžeme hypotézu ze zadání otestovat pomocí paramet- 9 rického testu. Naším úkolem je zjistit, zda jsou směrodatné odchylky basion-bregmatické výšky lebky mužů starověké a novověké egyptské populace shodné. Jelikož rozptyl není nic jiného než mocnina směrodatné odchylky, můžeme bez újmy na obecnosti znění této věty modifikovat na otázku, zda jsou rozptyly basion-bregmatické výšky lebky mužů starověké a novověké egyptské populace shodné. Tato věta potom bude součástí Hq, neboť shoda implikuje rovnost a rovnost je vždy součástí nulové hypotézy. Alternativní hypotézu potom stanovíme jako doplněk nulové hypotézy. 1. Stanovení hypotéz • slovní formulace nulové a alternativní hypotézy Hq : Rozptyl basion-bregmatické výšky lebky mužů starověké egyptské populace a rozptyl basion-bregmatické výšky lebky novověké egyptské populace jsou shodné. Hi : Rozptyl basion-bregmatické výšky lebky mužů starověké egyptské populace a rozptyl basion-bregmatické výšky lebky novověké egyptské populace nejsou shodné. • matematická formulace nulové a alternativní hypotézy H0:a2 = cr2, kde cr2 = 5.1712 Hi : a2 7^ ctq, kde Og = 5.1712 (oboustranná alternativa) 2. Volba hladiny významnosti • Hladinu významnosti volíme v souladu se zadáním jako a = 0.05. 3. Testování kritickým oborem • Testovací statistika = (n - 1)52 = (215 - 1)4.8354942 = 214 x 23.382 = W cr2 5.1712 26.73924 53 alpha <- 0.05 54 sigma_0 <- 5.171 55 s <- sd(skull.HM) 56 fw <- ((n - 1) * s " 2) / (sigma_0 " 2) # 187.1313 • Kritický obor W=(0; xI-Áol/2)) U ctq, kde Og = 5.3612 (pravostranná alternativa) 2. Volba hladiny významnosti • Hladinu významnosti volíme v souladu se zadáním jako a = 0.10. 3. Testování kritickým oborem • Testovací statistika FW = = ; '''-'f'"1* = 108 X 22'05233 = 82.86796 = 82.8680. cr2 5.3612 28.74032 78 alpha <- 0.05 79 sigma_0 <- 5.361 80 s <- sd(skull.BF) 81 fw <- ((n - 1) * s " 2) • Kritický obor / (sigma_0 " 2) # 82.86795 w = (xLi(i-"/2);oo) = Mo oproti oproti oproti Hu Hl2 H13 M 7^ Mo (oboustranná alt.) M > Mo (pravostranná alt.) M < Mo (levostranná alt.) Test nazýváme jednovýběrový Z-test. Testovací statistika má tvar M -no Z-a /n, (7.2) kde M je výběrový průměr, a = ycř2 je známá směrodatná odchylka, n je rozsah náhodného výběru a po je konstanta z nulové hypotézy. Za platnosti nulové hypotézy pochází statistika Zyy ze standardizovaného normálního rozdělení, tj. M — no i— h0 , . Zw =-Vn ~ N(0,1). a Kritický obor podle zvolené alternativní hypotézy má tvar Hl2 H13 M 7^ Mo M > Mo M < Mo = (-00 ; ua/2) U Mo í/"i3 : M < Mo (d, /i) = (cí, oo) = (—oo, h) -oo, m■ "l-a/2 , m Ul-a,( 'J-a/2 p-hodnota má v závislosti na zvolené alternativní hypotéze jeden z následujících tvarů Hu ■ M Mo p-hodnota = 2min{Pr(Zw < zw), Pľ(Zw > zw)} Hv2 : M > Mo p-hodnota = Pľ(Zw > zw) = 1 — Pľ(Zw < zw) íři3 : M < Mo p-hodnota = Pr(Zv^ < zvk) kde je náhodná veličina, je realizace testovací statistiky Zw (viz vzorec 7.2), tedy konkrétní číslo, a Pľ(Zy\r < zw) je distribuční funkce standardizovaného normálního rozdělení, jejíž hodnotu získáme pomocí a implementované funkce pnorm(). Poznámka: Teorie k testu o parametru p když a2 známe slouží zejména jako základ pro odvozování pokročilých testovacích statistik a intervalů spolehlivosti (zejména jde o skóre a věrohodnostní testy či intervaly spolehlivosti) nebo jako základ pro různé simulační studie. Ty využíváme k hlubšímu studiu testovacích statistik a jejich rozdělení, ke zkoumání aktuální hladiny významnosti nebo aktuální hodnoty koeficientu spolehlivosti a v mnoha dalších 18 případech. Při analýze reálných dat tento test však nevyužíváme, jelikož skutečnou hodnotu parametru a2 neznáme. Proto dáváme přednost testu uvedenému v sekci 7.3, který neznalost skutečného rozptylu a2 zohledňuje. Protože však znalost testu o parametru /i když a2 známe patří k základnímu statistickému vzdělání, uvádíme zde alespoň jeden ilustrační příklad pro získání povědomí o tomto testu, jeho zkonstruování a použití. Příklad 7.6. Test o /i když zw)} = 2mm{Pľ(Zw < zw), 1 - Pr(Zw < zw)} = 2mm{Pľ(Zw < -1.717117), l-Pľ(Zw < -1.717117)} = 2min{0.04297892, 0.9570211} = 2 x 0.04297892 = 0.08595784 = 0.08596 115 p.val <- 2 * min (pnorm(zw), 1 - pnorm(zw)) # 0.08595784 • Závěr testování Protože p-hodnota = 0.08596 je větší než a = 0.05, Hq nezamítáme na hladině významnosti a = 0.05. 6. Interpretace výsledků Za základě všech tří typů testování nezamítáme nulovou hypotézu na hladině významnosti a = 0.05. Mezi skutečnou a deklarovanou hmotností balení hydroxidu draselného neexistuje statisticky významný rozdíl. 7. Grafická vizualizace výsledku testování Porovnání náhodného výběru s konstantou /in = 1 zobrazíme pomocí krabicového diagramu (viz obrázek 7). 116 par(mar = c(2, 4, 1, 1), family = 'Times') 117 boxplot (weight , col = ' peachpuf f 1 ' , ylim = c (0.977, 1.014), 118 xlab = '', ylab = 'hmotnost baleni (v mm)', las = 1, 119 medcol = 'orange4' , border = 'sienna3') 120 points(mean(weight), bg = 'darkred', pch = 21, cex = 1.3, col = 'darkred') 121 pointsd, bg = ' dodgerblue4 ' , pch = 21, cex = 1.3, col = 'black') 122 legend('topright', fill = c('darkred', 'dodgerblue4'), bty = 'n', 123 legend = c('skutečna hmotnost', 'deklarovaná hmotnost')) ★ 21 •a 1.01 - s s ž í.oo - o o o S J3 0.99 0.98 skutečna hmotnost deklarovaná hmotnost Obrázek 7: Krabicový diagram hmotnosti balení hydroxidu draselného 22 7.3 Test o parametru ji když a2 neznáme Nechť Xi,... Xn je náhodný výběr z N(p, a2), kde a2 neznáme a po je konstanta. Na hladině významnosti a = 0.05 testujeme jednu z následujících tří hypotéz oproti příslušné alternativní hypotéze. H01 H02 #03 p = po oproti H n p < po oproti Hi2 H > Ho oproti Tíi 3 H 7^ Ho (oboustranná alt.) H > Ho (pravostranná alt.) H < Ho (levostranná alt.) Test nazýváme jednovýběrový í-test. Testovací statistika má tvar M — Ho r ,„ =-^—Vn, (7.3) kde M je výběrový průměr, S je výběrová směrodatná odchylka, n je rozsah náhodného výběru a Ho Je konstanta z nulové hypotézy. Za platnosti nulové hypotézy pochází statistika Tyy ze Studentova rozdělení o n — 1 stupních volnosti, tj. m - ho r h0 = -g-V« ~ ín-l- Kritický obor podle zvolené alternativní hypotézy má tvar H Ž Mo W = (-00 ; í„_i(a/2)> U (í„_i(l - a/2); oo) H> Ho W = (í„_i(l - a); oo) P < Po = (-oo; í„_i(a)) kde íij_i(qí/2), í„_i(l — a/2), í„_i(a) a í„_i(l — a) jsou kvantity Studentova rozdělení o n — 1 stupních volnosti, jejichž hodnoty získáme pomocí r:: a implementované funkce qt(). Interval spolehlivosti má podle zvolené alternativní hypotézy jeden z následujících tvarů í s s Hu ■ H ŕ Mo (d, h) = Im - -^=í„_i(l - a/2), m - -==í„_i(a/2) -Hl2 : H > Mo (cí, oo) = ( m--=í„_i(l — a), oo V V™ í/"i3 : h < Ho (—°°, /i) = ( —00 , TO--^ín-i(a) V v™ p-hodnota má v závislosti na zvolené alternativní hypotéze jeden z následujících tvarů Hu Hl2 H13 p 7^ Po p-hodnota = 2min{Pr(7V < tw), Pr(7V > tw)} H > Ho p-hodnota = Pr(Tw > tw) = 1 — Pr(Tw < tw) H < Ho p-hodnota = Pr(2V < tw) kde Tyy je náhodná veličina, tyy je realizace testovací statistiky Tyy (viz vzorec 7.3), tedy konkrétní číslo, a Pr(Tw < tw) je distribuční funkce Studentova rozdělení o n — 1 stupních volnosti, jejíž hodnotu získáme pomocí a implementované funkce pt(). Poznámka: Princip testu o střední hodnotě p když rozptyl a2 neznáme používáme také při analýze párových dat. Blíže se této situaci věnujeme v sekci 7.4. 23 Příklad 7.7. Test o střední hodnotě p když a2 neznáme Mějme datový soubor 18-more-samples-variances-clavicle.txt a proměnnou cla.L popisující největší délku klíční kosti z pravé strany v mm u mužů indické populace z Amritsaru (viz sekce ??) naměřené v roce 1966. Dále máme k dispozici údaje ze studie (Kaur et al.) z roku 1997, v rámci které byly měřeny délky klíční kosti z pravé strany mužů ze severoindické populace (mjj = 146.89 mm, sjj = 9.23 mm, rij{ = 100). Na hladině významnosti a = 0.05 zjistěte, zda existuje rozdíl mezi největší délkou klíční kosti mužů indické populace z Armitsaru a mužů severoindické populace. Řešení příkladu 7.7 Pomocí příkazu read.delim() načteme datový soubor a pomocí operátoru [] vybereme z datové tabulky údaje o největší délce klíční kosti z pravé strany (cla.L) u jedinců indické populace z Amritsaru (pop == 'indľ). Z vektoru naměřených hodnot odstraníme chybějící údaje (na.omit()) zjistíme rozsah náhodného výběru (length(). 124 data <- read.delim('00-Data//18-more-samples-variances-clavicle.txt') 125 cla.Li <- data[data$pop == 'indl' , 'cla.L'] 126 cla.Li <- as.numeric(na.omit(cla.Li)) 127 n <- length(cla.Li) # 120 Datový soubor obsahuje údaje o největší délce klíční kosti z pravé strany u 120 jedinců indické populace z Amritsaru. Naším úkolem ze zadání je porovnat střední hodnoty dvou indických populací, přičemž u jedné populace (indická populace z Amritsaru) máme k dispozici naměřené hodnoty. Na základě těchto hodnot můžeme zjistit, zda náhodný výběr pochází z normálního rozdělení, tj. zda náhodná veličina X popisující největší délku klíční kosti z pravé strany u mužů indické populace v Amritsaru pochází z normálního rozdělení, tj. X ~ N(p,a2), kde skutečný rozptyl a2 neznáme. Druhá populace (severoindická populace) je reprezentována pouze hodnotou aritmetického průměru (mjj = 146.89mm) a směrodatnou odchylkou (sjj = 9.23mm). O jejím rozdělení žádné další informace nemáme. Řešení příkladu tedy vede na situaci, kdy střední hodnotu jednoho náhodného výběru (jehož skutečnou hodnotu rozptylu neznáme) porovnáváme s konkrétním číslem, tedy na jednovýběrový test o střední hodnotě p při neznámém rozptylu a2. Jediným předpokladem k použití tohoto testu je normalita náhodného výběru naměřených délek klíčních kostí. Před použitím testu tedy tento předpoklad ověříme. Hladinu významnosti a pro test normality stanovíme štandartne, tj. a = 0.05. Protože rozsah náhodného výběru je větší než 30, ověříme předpoklad normality Lillieforsovým testem. Grafické ověření provedeme na základě kvantilového diagramu a histogramu superponovaného křivkou normálního rozdělení, jejíž parametry odhadneme pomocí výběrového průměru a výběrového rozptylu. Datový soubor rozdělíme do osmi ekvidistatních intervalů s šířkou 8 mm prostřednictvím stanovených hranic 122,130,..., 170. n-1-1-1-1-1— -1-1-1-1-r 126 134 142 150 158 166 -2 -1 0 1 2 teoreticky kvantil délka pravé klicni kosti (v mm) Lillieforsuv test: p-hodnota =0.0956 Obrázek 8: Histogram a kvantilový diagram délky pravé klíční kosti u mužů indické populace Protože p-hodnota = 0.0956 je větší než 0.05, nulovou hypotézu o normalitě dat nezamítáme na hladině významnosti 24 a = 0.05. Náhodný výběr největších délek klíčních kostí z pravé strany u jedinců indické populace z Amritsaru pochází z normálního rozdělení. Protože náhodný výběr pochází z normálního rozdělení, můžeme hypotézu ze zadání otestovat pomocí parametrického testu o střední hodnotě jj, když rozptyl a2 neznáme. Testování provedeme v posloupnosti sedmi kroků. Naším úkolem je zjistit, zda existuje rozdíl mezi největší délkou klíční kosti z pravé strany u mužů indické populace z Armitsaru a u mužů severoindické populace. Tato věta bude součástí alternativní hypotézy, neboť rozdíl implikuje nerovnost a nerovnost je vždy součástí alternativní hypotézy. Nulovou hypotézu potom stanovíme jako doplněk k alternativní hypotéze. 1. Stanovení hypotéz • slovní formulace nulové a alternativní hypotézy Hq : Střední hodnota největší délky klíční kosti na pravé straně mužů indické populace z Amritsaru je shodná se střední hodnotou největší délky klíční kosti na pravé straně mužů severoindické populace. Hi : Střední hodnota největší délky klíční kosti na pravé straně mužů indické populace z Amritsaru není shodná se střední hodnotou největší délky klíční kosti na pravé straně mužů severoindické populace. • matematická formulace nulové a alternativní hypotézy Hq : /i = fi0, kde /i0 = 146.89 H\ : jj, ^ jj,q, kde fj-o = 146.89 (oboustranná alternativa) 2. Volba hladiny významnosti • Hladinu významnosti volíme v souladu se zadáním jako a = 0.05. 3. Testování kritickým oborem • Testovací statistika M - no r- 145.5667 - 146.89 r— -1.3233 Tw =-—ypn =-V120 =- x 10.95445 = -1.659831 = -1.6598 W S V 8.733432 8.733432 128 alpha <- 0.05 129 mu_0 <- 146.89 130 m <- mean(cla.Li) 131 s <- sd(cla.Li) 132 tw <- (m - mu_0) / s * sqrt(n) # -1.659873 • Kritický obor W = (-00; í„_i(a/2)> U (í„_i(l - a/2); oo) = (-00; íiao-i(0.05/2)) U (íi20-i(l - 0.05/2); oo) = (-oo; ín9(0.025)> U (í119(0.975); oo) = (-oo ; -1.9801) U (1.9801; oo) 133 qt(alpha/2, n - 1) # -1.9801 134 qt(l - alpha/2, n - 1) # 1.9801 • Závěr testování Protože realizace testovací statistiky tyy = —1.6598 nenáleží do kritického oboru, tj. tyy ^ W, Hq nezamítáme na hladině významnosti a = 0.05. 4. Testování intervalem spolehlivosti 25 • Interval spolehlivosti (d, h) = íi2o-i(0.05/2) = (145.5667 - 0.7972497 x 1.9801, 145.5667 - 0.7972497 x (-1.9801)) = (143.9881, 147.1453) 135 dh <- m - s / sqrt(n) * qt(l - alpha / 2, n - 1) # 143.988 136 hh <- m - s / sqrt(n) * qt(alpha / 2, n - 1) # I47.I453 • Závěr testování Protože fig = 146.89 náleží do Waldova 95% empirického oboustranného intervalu spolehlivosti, tj. po = 146.89 G IS, Hq nezamítáme na hladině významnosti a = 0.05. 5. Testování p-hodnotou 137 p.val <- 2 * min (pt(tw , n - 1), 1 - pt (tw, n - 1)) # 0.09957296 • Závěr testování Protože p-hodnota = 0.09957 je větší než a = 0.05, H0 nezamítáme na hladině významnosti a = 0.05. 6. Interpretace výsledků Za základě všech tří typů testování nezamítáme nulovou hypotézu na hladině významnosti a = 0.05. Mezi střední hodnotou největší délky klíční kosti na pravé straně u mužů indické populace z Amritsaru a u mužů severoindické populace neexistuje statisticky významný rozdíl. 7. Grafická vizualizace výsledku testování Porovnání náhodného výběru s konstantou po = 146.89 zobrazíme nejlépe pomocí krabicového diagramu (viz Poznámka: Test o střední hodnotě p při neznámém rozptylu a2 můžeme provést pomocí funkce t.test(). Vstupními parametry budou vektor reprezentující náhodný výběr (cla.Li), hodnota parametru po z nulové hypotézy zadaná argumentem mu = 146.89, hodnota hladiny významnosti a zadaná prostřednictvím koeficientu spolehlivosti 1 — a nastavením hodnoty argumentu conf.level = 0.95 a typ zvolené alternativní hypotézy (oboustranná) zadaný pomocí argumentu alternativě = 'two.sideď. 138 t.test(cla.Li, mu = 146.89, conf.level = 0.95, alternativě = 'two.sided') • p-hodnota p-hodnota = 2min{Pr(7V < tw), Pr(Tw > tw)} = 2min{Pr(!ZV < tw), 1 - Pr(Tw < tw)} = 2min{Pr(!ZV < 146.89), 1 - Pr(Tw < 146.89)} = 2min{0.04978648, 0.9502135} = 2 x 0.04978648 = 0.09957296 = 0.09957 obrázek 9). 26 s s o 180 -r 170 160 - 150 - □ indická populace z Amritsaru ■ severoindická populace t: wo ca 130 H Obrázek 9: Krabicový diagram délky klíční kosti z pravé strany u mužů indické populace z Amritsaru a u mužů severoindické populace One Sample t-test data: cla.Li t = -1.6599, df = 119, p-value = 0.09957 alternative hypothesis: true mean is not equal to 146.89 95 percent confidence interval: 143.9880 147.1453 sample estimates: mean of x 145.5667 139 140 141 142 143 144 145 146 147 148 149 Součástí výstupu je hodnota testovací statistiky t = -1.6599, počet stupňů volnosti Studentova rozdělení df = 119, hranice 95% Waldova empirického oboustranného intervalu spolehlivosti 143.9880 a 147.1453 a p-hodnota p-value = 0.09957. Jediné, co musíme stanovit zvlášť, jsou dolní a horní hranice kritického oboru. 27 Příklad 7.8. Test o střední hodnotě p když a2 neznáme Mějme datový soubor 01-one-sample-mean-skull-mf.txt a proměnnou skuli.B popisující největší šířku mozkovny mužů starověké egyptské populace (viz sekce ??). Dále máme k dispozici údaje o největší šířce mozkovny novověké egyptské mužské populace (mm = 136.402 mm, sm = 6.411 mm, nm = 87). Na hladině významnosti a = 0.01 zjistěte, zda je šířka mozkovny starověké egyptské mužské populace větší než šířka mozkovny novověké egyptské mužské populace. Řešení příkladu 7.8 Pomocí příkazu read.delim() načteme datový soubor a operátorem [] vybereme z datové tabulky údaje o největší šířce mozkovny (skuli.B) mužů (sex == 'm'). Z vektoru naměřených údajů odstraníme příkazem na.omit() NA hodnoty a příkazem length() zjistíme rozsah náhodného výběru. 150 data <- read.delim('00-Data//01-one-sample-mean-skuli-mf.txt ' ) 151 skuli.BM <- data[data$sex == 'm', 'skuli.B'] 152 skuli.BM <- as.numeric(na.omit(skuli.BM)) 153 n <- length(skuli.BM) # 216 Datový soubor obsahuje údaje o největší šířce mozkovny u 216 mužů starověké egyptské populace. Naším úkolem ze zadání je porovnat šířku mozkovny mužů novověké a starověké egyptské populace. U starověké populace máme k dispozici naměřené hodnoty, pomocí kterých můžeme zjistit, zda náhodný výběr pochází z normálního rozdělení, tj. zda náhodná veličina X popisující největší šířku mozkovny mužů starověké egyptské populace pochází z normálního rozdělení, tj. X ~ N(fi, c2), kde skutečný rozptyl a2 neznáme. Druhá, novověká populace je reprezentována pouze aritmetickým průměrem (mm = 136.402 mm) a směrodatnou odchylkou (sm = 6.411 mm). O jejím rozdělení žádné další informace nemáme. Řešení příkladu vede na jednovýběrový test o střední hodnotě p při neznámém rozptylu a2. Před použitím tohoto testu musíme nejprve ověřit vyžadovaný předpoklad normálního rozdělení náhodného výběru. Protože rozsah náhodného výběru je větší než 30, ověříme předpoklad normality Lillieforsovým testem (a = 0.05). Graficky zhodnotíme potenciální normalitu náhodného výběru kvantilovým diagramem a histogramem. Datový soubor rozdělíme do devíti ekvidistatních intervalů s šířkou 3 mm prostřednictvím stanovených hranic 123,126,..., 150. 124.5 130.5 136.5 142.5 148.5 -3 -2 -1 0 1 2 3 teoreticky kvantil nejvetsi sirka mozkovny (v mm) Lillieforsuv test: p-hodnota =0.0766 Obrázek 10: Histogram a kvantilový diagram délky pravé klíční kosti u mužů indické populace Protože p-hodnota = 0.0766 je větší než 0.05, nulovou hypotézu o normalitě dat nezamítáme na hladině významnosti a = 0.05. Z obrázku 10 je patrné, že histogram naměřencýh hodnot dostatečným způsobem kopíruje křivku hustoty normálního rozdělení a že body v kvantilovém diagramu se pohybují velmi blízko referenční křivky. Závěr tedy je, že náhodný výběr největších šířek mozkovny mužů starověké egyptské populace pochází z normálního rozdělení. 28 Protože náhodný výběr pochází z normálního rozdělení, můžeme hypotézu ze zadání otestovat pomocí parametrického testu o střední hodnotě /i když rozptyl a'1 neznáme. Naším úkolem je zjistit, zdaje šířka mozkovny starověké egyptské mužské populace větší než šířka mozkovny novověké egyptské mužské populace. Tato věta bude součástí alternativní hypotézy, nulová hypotéza bude potom doplňkem k alternativní hypotéze. 1. Stanovení hypotéz • slovní formulace nulové a alternativní hypotézy Hq : Střední hodnota největší šířky mozkovny starověké egyptské mužské populace je menší nebo rovna střední hodnotě šířky mozkovny novověké egyptské mužské populace. H\ : Střední hodnota největší šířky mozkovny starověké egyptské mužské populace je větší než střední hodnota šířky mozkovny novověké egyptské mužské populace. • matematická formulace nulové a alternativní hypotézy Hq : /i < Hq, kde Ho = 171.962 H\ : jj, > fio, kde Ho = 171.962 (pravostranná alternativa) 2. Volba hladiny významnosti • Hladinu významnosti volíme podle zadání a = 0.01. 3. Testování kritickým oborem • Testovací statistika M-u0 r- 137.1852 - 136.402 ,- 0.7832 TW = = 4.824642 V216 = x 14.69694 = 2.385803 = 2.3858 154 alpha <- 0.01 155 mu_0 <- 136.402 156 m <- mean(skull.BM) 157 s <- sd(skull.BM) 158 tw <- (m - mu_0) /s * sqrt(n) # 2.385757 • Kritický obor W= (í„_i(l -a); oo) = (íaxe.^l-O.Ol); oo) = (Í2i5(0.99); oo) = (1.6520; oo) 159 qt(l - alpha, n - 1) # 2.343817 • Závěr testování Protože realizace testovací statistiky tyy = 2.385757 náleží do kritického oboru, tj. tyy e W, Hq zamítáme na hladině významnosti a = 0.01. 4. Testování intervalem spolehlivosti 29 • Interval spolehlivosti (d, in f ty) = ( m--r=íIJ_1(l — a/2), oo v n 4 824642 137.1852 - " _ ŕ2i6-i(l - 0.01/2), oo v 216 4 824642 137-1852 -ir69694Í215(°-995)'°° (137.1852 - 0.3282753 x 2.343817, oo) (136.4158, oo) 160 dh <- m - s / sqrt(n) * qt(l - alpha, n - 1) # 136.4158 • Závěr testování Protože jj,q = 136.402 nenáleží do Waldova 99% empirického levostranného intervalu spolehlivosti, tj. po = 136.402 (/ IS, Hq zamítáme na hladině významnosti a = 0.09. 5. Testování p-hodnotou • p-hodnota p-hodnota = Pr(Tw > tw) = 1 - Pr(Tw < tw)) = 1 - Pr(Tw < 136.402) = 0.008956 161 p.val <- 1 - pt(tw, n - 1) # 0. 008955785 • Závěr testování Protože p-hodnota = 0.008956 je menší než a = 0.01, Hq zamítáme na hladině významnosti a = 0.01. 6. Interpretace výsledků Za základě všech tří typů testování zamítáme nulovou hypotézu na hladině významnosti a = 0.01. Největší šířka lebky starověké egyptské mužské populace je statisticky významně větší než největší šířka lebky novověké egyptské mužské populace. 7. Grafická vizualizace výsledku testování Rozdíl mezi starověkou a novověkou egyptskou mužskou populací zobrazíme krabicovým diagramem (viz obrázek 11). 162 par(mar = c(2, 4, 1, 1), family = 'Times') 163 boxplot(skull.BM , col = 'slategray1' , xlab = '', 164 xlab = '', ylab = 'nejvetsi sirka mozkovny (v mm)', las = 1, 165 ylim = c(124, 155), medcol = 'midnightblue', border = 'dodgerblue4') 166 points(mean(skull.BM), bg = 'mintcream', pen = 21, cex = 1.3, col = 'black') 167 points (136.402 , bg = 'red', pen = 21, cex = 1.3, col = 'red4') 168 legend('topright', fill = c('slategrayl', 'red'), bty = 'n', 169 legend = c('staroveká egyptská populace', 'novoveká egyptská populace')) Poznámka: Test o střední hodnotě p při neznámém rozptylu a2 můžeme provést pomocí funkce t.test(). Vstupními parametry budou vektor reprezentující náhodný výběr (skuli.BM), hodnota parametru po z nulové hypotézy (mu = 136.402), hodnota hladiny významnosti a zadaná prostřednictvím koeficientu spolehlivosti 1 — a (conf.level = 0.99) a typ zvolené alternativní hypotézy (alternativě = 'greater'). 30 s s o > o M N O S 155 - 150 - 145 - 140 135 - □ staroveká egyptská populace □ novoveká egyptská populace 130 - 125 - Obrázek 11: Krabicový diagram největší šířky mozkovny mužů starověké a novověké egyptské populace One Sample t-test data: skull.BM t = 2.3858, df = 215, p-value = 0.008956 alternative hypothesis: true mean is greater than 136.402 99 percent confidence interval: 136.4158 Inf sample estimates: mean of x 137.1852 171 172 173 174 175 176 177 178 179 180 181 170 t.test(skuli.BM, mu = 136.402, conf.level = 0.99, alternativě = 'greater') Součástí výstupu je hodnota testovací statistiky t = 2.3858, počet stupňů volnosti Studentova rozdělení df = 215, hranice 99% Waldova empirického oboustranného intervalu spolehlivosti 136.4158 a Inf a p-hodnota p-value = 0.008956. Jediné, co musíme stanovit zvlášť, je dolní hranice kritického oboru. 31 Příklad 7.9. Test o střední hodnotě p když a2 neznáme Mějme datový soubor ll-two-samples-means-skull.txt a proměnnou skuli.H popisující basion-bregmatickou výšku lebky žen starověké egyptské populace (viz sekce ??). Dále máme k dispozici údaje o basion-bregmatické výšce lebky žen novověké egyptské populace (uif = 126.942 mm, s f = 4.430 mm, rif = 52). Na hladině významnosti a = 0.05 testujte hypotézu, že basion-bregmatická výška lebky žen starověké egyptské populace je větší nebo rovna basion-bregmatické výšce lebky žen novověké egyptské populace. Řešení příkladu 7.9 Nejprve načteme datový soubor a vybereme z datové tabulky údaje o basion-bregmatické výšce lebky (skuli.H) žen (sex == 'f). Z vektoru naměřených hodnot odstraníme chybějící údaje a zjistíme počet naměřených hodnot. 182 data <- read.delim('00-Data//11-two-samples-means-skuli.txt') 183 skuli.HF <- data[data$sex == 'i', 'skuli.H'] 184 skuli.HF <- as.numeric(na.omit(skuli.HF)) 185 n <- length(skuli.HF) # 107 Datový soubor obsahuje naměřené hodnoty basion-bregmatické výšky lebky 107 žen starověké egyptské populace. Naším úkolem je porovnat výšku lebky žen dvou egyptských populací. U starověké populace máme k dispozici naměřené hodnoty, pomocí kterých můžeme zjistit, zda náhodný výběr pochází z normálního rozdělení, kde skutečný rozptyl a2 neznáme. Druhá, novověká populace je reprezentována pouze aritmetickým průměrem (rrif = 126.942mm) a směrodatnou odchylkou (sf = 4.430mm). O jejím rozdělení žádné další údaje nemáme. Řešení příkladu vede na jednovýběrový test o střední hodnotě p při neznámém rozptylu a2. Před použitím tohoto testu musíme ověřit předpoklad normality náhodného výběru. Protože rozsah náhodného výběru je větší než 30, ověříme normální rozdělení náhodného výběru Lillieforsovým testem (a = 0.05). Graficky zhodnotíme rozdělení náhodného výběru kvantilovým diagramem a histogramem (viz obrázek 12). Datový soubor rozdělíme do osmi ekvidistatních intervalů s šířkou 3 mm prostřednictvím stanovených hranic 114,117,..., 138. teoreticky kvantil basion-bregmaticka vyska lebky (v mm) Lillieforsuv test: p-hodnota =0.0989 Obrázek 12: Histogram a diagram basion-bregmatické výšky lebky žen starověké a novověké egyptské populace Protože p-hodnota = 0.0989 je větší než 0.05, nulovou hypotézu o normalitě dat nezamítáme na hladině významnosti a = 0.05. Z obrázku 12 vidíme, že histogram naměřených hodnot je oproti křivce hustoty normálního rozdělení mírně posunutý doprava. Taktéž v kvantilovém diagramu vidíme, že body umístěné na koncích se vzdalují od referenční křivky. Naštěstí tyto odchylky nejsou tak závažné, aby fatálně narušily normální rozdělení datového souboru. Náhodný výběr basion-bregmatické výšky lebky žen starověké egyptské populace tedy pochází z normálního rozdělení. Protože náhodný výběr naměřených hodnot splňuje předpoklad normality, můžeme hypotézu ze zadání otestovat 32 pomocí parametrického testu o střední hodnotě p když rozptyl a'1 neznáme. V zadání příkladu máme tentokrát přímo uvedené znění nulové hypotézy. Zbývá tedy dodefinovat alternativní hypotézu tak, aby byla doplňkem k nulové hypotéze. 1. Stanovení hypotéz • slovní formulace nulové a alternativní hypotézy H0 : Střední hodnota basion-bregmatické výšky lebky žen starověké egyptské populace je větší nebo rovna střední hodnotě basion-bregmatické výšky lebky žen novověké egyptské populace. H\ : Střední hodnota basion-bregmatické výšky lebky žen starověké egyptské populace je menší než střední hodnota basion-bregmatické výšky lebky žen novověké egyptské populace. • matematická formulace nulové a alternativní hypotézy H0 : p > p0, kde p0 = 126.942 H\ : p < po, kde po = 126.942 (levostranná alternativa) 2. Volba hladiny významnosti • Hladinu významnosti volíme v souladu se zadáním jako a = 0.05. 3. Testování kritickým oborem • Testovací statistika M — po r 125.6822 - 126.942 r— -1.2598 TW = -^Vn = 4.653256 V107 = I^ x 10.34408 = -2.800506 = -2.8005 186 alpha <- 0.05 187 mu_0 <- 126.942 188 m <- mean(skull.HF) 189 s <- sd(skull.HF) 190 tw <- (m - mu_0) / s * sqrt (n) # -2.800^1 • Kritický obor W = (-oo; í„_i(a)> = (-oo; Íio7-i(0.05)> = (-oo; -1.659356) 191 qt(alpha, n - 1) # -1.659356 • Závěr testování Protože realizace testovací statistiky tyy = —2.8005 náleží do kritického oboru, tj. tyy e W, Hq zamítáme na hladině významnosti a = 0.05. 4. Testování intervalem spolehlivosti 33 • Interval spolehlivosti (—00; h) = ( —00 , m — —j=tn_i{a) -00, 125.6822 - 4-^^6ŕ107_1(0.05) -00, 125.6822 - 4'653256ŕ106(0.05) 10.34408 06 v ' (-00 , 125.6822 - 0.4498473 x (-1.659356)) (-00, 126.4287) 192 hh <- m - s / sqrt (n) * qt (alpha, n - 1) # 126.4.287 • Závěr testování Protože jj,q = 126.942 nenáleží do Waldova 95% empirického pravostranného intervalu spolehlivosti, tj. po = 126.942 ^ IS, Hq zamítáme na hladině významnosti a = 0.05. 5. Testování p-hodnotou • p-hodnota p-hodnota = Pr(Tw < tw) = Pr(Tw < -2.80041) = 0.003033381 = 0.003033 193 p.val <- pt(tw, n - 1) # 0.003033381 • Závěr testování Protože p-hodnota = 0.003033 je menší než a = 0.05, Hq zamítáme na hladině významnosti a = 0.05. 6. Interpretace výsledků Za základě všech tří typů testování zamítáme nulovou hypotézu na hladině významnosti a = 0.05. Basion-bregmatická výška lebky žen starověké egyptské populace je statisticky významně menší než basion-bregmatická výška lebky žen novověké egyptské populace. 7. Grafická vizualizace výsledku testování Rozdíl středních hodnot basion-bregmatické výšky lebky žen obou populací zobrazíme pomocí krabicového diagramu (viz obrázek 13). Poznámka: Test o střední hodnotě p při neznámém rozptylu a2 můžeme provést pomocí funkce t.test() s argumentty mu = 126.942, conf.level = 0.95 a alternativě = 'less'. 194 t.test(skuli.HF, mu = 126.942, conf.level = 0.95, alternativě = 'less') Součástí výstupu je hodnota testovací statistiky t = -2.8004, počet stupňů volnosti Studentova rozdělení df = 106, hranice 95% Waldova empirického oboustranného intervalu spolehlivosti -Inf a 126.4287 a p-hodnota p-value = 0.003033. Jediné, co musíme stanovit zvlášť, je horní hranice kritického oboru. 34 s s M 140 - 135 - □ staroveká egyptská populace ■ novoveká egyptská populace 130 S u I O 125 120 - Obrázek 13: Krabicový diagram basion-bregmatické výšky lebky žen starověké a novověké egyptské populace One Sample t-test data: skull.HF t = -2.8004, df = 106, p-value = 0.003033 alternative hypothesis: true mean is less than 126.942 95 percent confidence interval: -Inf 126.4287 sample estimates: mean of x 125.6822 195 196 197 198 199 200 201 202 203 204 205 35 Příklad 7.10. Test o střední hodnotě \x když a2 neznáme Mějme datový soubor 15-anova-means-skull.txt a proměnnou upface.H popisující výšku horní části tváře mužů německé populace (viz sekce ??). Dále máme k dispozici údaje o výšce horní části tváře mužů Cernj achovské kultury z území dnešní Ukrajiny (mck = 70.00 mm, nck = 99). Na hladině významnosti a = 0.10 testujte hypotézu, že výška horní části tváře německé mužské populace je menší nebo rovna výšce horní části tváře mužské populace z Cernj achovské kultury. Řešení příkladu 7.10 Nejprve načteme datový soubor a z datové tabulky vybereme údaje o výšce horní části tváře (upface.H) mužů německé populace (pop == 'nem'). Dále z vektoru naměřených hodnot odstraníme NA hodnoty a zjistíme rozsah náhodného výběru. 206 data <- read.delim('00-Data//15-anova-means-skuli.txt ' ) 207 upface.HN <- data[data$pop == 'nem', 'upface.H'] 208 upface.HN <- as.numeric(na.omit(upface.HN)) 209 n <- length(upface.HN) # 19 Datový soubor obsahuje údaje o výškách horní části tváře 19 mužů německé populace. Naším úkolem je porovnat výšku horní části tváře u mužů ze dvou různých populací. U německé populace známe naměřené hodnoty, pomocí kterých můžeme zjistit, zda náhodný výběr pochází z normálního rozdělení s nám neznámým rozptylem a2. U mužské populace z Cernj achovské kultury známe pouze aritmetickým průměr (mck = 70.00 mm). Rozdělení náhodného výběru, na základě kterého byly publikované statistiky získány, nám není známé. Řešení příkladu vede na jednovýběrový test o střední hodnotě jj, při neznámém rozptylu a2. Před použitím tohoto testu ověříme předpoklad normality náhodného výběru. Protože rozsah náhodného výběru výšek horní části tváře mužů německé populace je menší než 30, ověříme normalitu tohoto náhodného výběru Shapiro-Wilkovým testem (a = 0.05). Graficky zhodnotíme rozdělení náhodného výběru kvantilovým diagramem a histogramem (viz obrázek 14). Datový soubor rozdělíme do pěti ekvidistatních intervalů s šířkou 3 mm prostřednictvím stanovených hranic 61, 64,..., 76. Obrázek 14: Histogram a diagram výšky horní části tváře mužů německé populace Protože p-hodnota = 0.0419 je menší než 0.05, nulovou hypotézu o normalitě dat zamítáme na hladině významnosti a = 0.05. Z obrázku 14 vidíme, že histogram naměřených hodnot nekopíruje tvar křivky hustoty normálního rozdělení. Odchylka nastává zejména na pravém konci, kde oproti očekávání nedochází ke snížení počtu hodnot. Kvantilový diagram vizualizuje odlehlost bodů od referenční přímky na pravém i na levém chvostu. Náhodný výběr výšky horní části tváře mužů německé populace tedy nepochází z normálního rozdělení. Protože náhodný výběr naměřených výšek horní části tváře mužů německé populace nesplňuje předpoklad normality, 36 nemůžeme k otestování hypotézy ze zadání použít parametrický test o střední hodnotě /i když rozptyl a'1 neznáme. Hypotézu bychom otestovali vhodnou metodou z kapitoly ??. 37 7.4 Párový test Nechť (X\, Yi)T ... (Xn, Yn)T je náhodný výběr z N-2ÍH, E) , kde {i = (hi, H2)T a S = ^ a'x Pai&2^j ^ pfjčemž Hi je střední hodnota náhodné veličiny X, /j-2 je střední hodnota náhodné veličiny Y, a\ je rozptyl náhodné veličiny X, trf je rozptyl náhodné veličiny Y a p je korelační koeficient. Potom náhodný výběr Z = (Z\,..., Zn)T, kde Zi = Yi — Yi, i = l,...,n, pochází z normálního rozdělení se střední hodnotou h = Pi ~~ P2 a rozptylem cr2 = 1/cr2 + cr| + 2pt7icr2, tj. Z ~ N(h, Po (pravostranná alt.) ířo3 : M > Mo oproti .H13 : /i < Ho (levostranná alt.) kde h je střední hodnota rozdílů Z\,..., Zn a Ho je konstanta, jejíž hodnotu nejčastěji volíme jako /líq = 0. Tato volba odpovídá hypotéze, že rozdíl mezi X & Y neexistuje (resp. hypotéze, že střední hodnota náhodné veličiny X je menší, resp. větší, než střední hodnota náhodné veličiny Y). Vzhledem k tomu, že jde o test hypotézy o parametru h, přičemž skutečná hodnota rozptylu a2 rozdílů Zi,..., Zn není známá, testujeme hypotézy o střední hodnotě rozdílu X — Y pomocí jednovýběrového í-testu, analogicky jako je uvedeno v sekci 7.3. Výše popsaný test, v rámci kterého převádíme problém porovnávání dvou náhodných veličin X a Y na problém srovnávání jejich rozdílů Z s konstantou Ho a následně jej řešíme pomocí jednovýběrového í-testu, nazýváme párový Studentův í-test. Poznámka: Jak již bylo zmíněno v úvodu kapitoly, předpokladem k použití parametrického párového testu je normální rozdělení rozdílů X — Y, tj. normální rozdělení náhodné veličiny Z. V praxi bývá často tento předpoklad mylně zaměňován s předpokladem normality náhodné veličiny X a předpokladem normality náhodné veličiny Y. Otestování předpokladu normality zvlášť pro každý z obou náhodných výběrů je však hrubá chyba ukazující na nepochopení základního principu párového testu. Poznámka: Jak napovídá název testu, nejčastější realizace párového testu je v situacích, kdy na jednom jedinci porovnáváme sledovaný párový znak ze dvou stran. Typickým příkladem je například porovnání délkových nebo šířkových rozměrů na pravé a levé straně těla jedince (porovnání délky pravé a levé klíční kosti, porovnání míry přilehlosti ušního lalůčku na pravé a levé straně nebo porovnání 2D:4D poměru na pravé a levé ruce). Trochu netypickým ale i tak dobře fungujícím příkladem využití párového testu může být také porovnání sledovaného znaku u sourozenců (resp. dvojčat). Sledovaný znak u mladšího a staršího sourozence (dvojčete) považujeme též za párový případ, kdy subjektem spojujícím "obě strany"párového znaku je společná matka obou sourozenců (konkrétně si uveďme kupříkladu pórování porodní hmotnosti staršího a mladšího dvojčete, porovnání výše inteligenčního kvocientu osmiletých dvojčat, nebo porovnání výšky v 15 letech u staršího a mladšího sourozence). V neposlední řadě používáme párový test na porovnání měření téhož znaku na týž jedincích dvěma rýznými výzkumníky, tedy na zjištění interindividuální chyby měření, nebo na porovnání dvou opakovaných měření téhož znaku na týchž jedincích jedním výzkumníkem, tedy na zjištění intraindividuální chyby měření. V obou případech je subjektem spojujícím "obě strany"párového testu jedinec, na kterém byla opakovaná měření (ať už jedním výzkumníkem dvakrát, nebo dvěma výzkumníky jednou) provedena. 38 Příklad 7.11. Párový test Máme datový soubor 02-paired-means-clavicle.txt obsahující údaje o hodnotách vertikálního průměru středu délky těla klíční kosti z pravé a levé strany (clavicula) z pohřebiště u S v. Jakuba v Brně, převážně z období středověku, naměřené jedním výzkumníkem ve dvou opakovaných měřeních (hodnoty naměřené při prvním opakování jsou uloženy v proměnné simd.l, hodnoty naměřené při druhém opakování jsou uloženy v proměnné simd.2) a naměřené druhým výzkumníkem v jednom měření (simd). Více informací viz sekce ??. Na hladině významnosti a = 0.01 testujte hypotézu o shodě střední hodnoty měření vertikálního průměru středu délky těla klíční kosti na levé straně provedené prvním a druhým výzkumníkem. Řešení příkladu7.11 Nejprve příkazem read.delim() načteme datový soubor a pomocí operátoru [] z něj vybereme pouze údaje naměřené prvním výzkumníkem (sloupce simd.l a simd.2) a druhým výzkumníkem (simd) na pravé straně side == 'R'. Údaje vložíme do proměnné data.l2R. Z datové tabulky následně odstraníme chybějící údaje a zjistíme rozsah náhodného výběru. 210 data <- read.delim('00-Data\\02-paired-means-clavicle.txt') 211 data.l2L <- data[data$side == ' L ' , c('simd.l', 'simd.2', 'simd')] 212 data.l2L <- na.omit(data.12L) 213 dim(data.12L) # 38x3 Datový soubor obsahuje 38 opakovaných měření vertikálního průměru středu délky těla klíční kosti z levé strany, a to dvakrát prvním výzkumníkem a jedenkrát druhým výzkumníkem. Nyní pomocí funkce apply() vytvoříme z obou měření prvního výzkumníka aritmetické průměry (simd.AL), které budeme následně porovnávat s naměřenými údaji druhého výzkumníka (simd.BL). 214 simd.AL <- apply(data.12L [, c('simd.l', 'simd.2')], 1, mean) 215 simd.BL <- data.12L$simd Naším úkolem ze zadání je porovnat měření provedená dvěma různými výzkumníky. Jde ale o měření stejného znaku sledovaného na stejných subjektech, proto je vhodné použít na tuto situaci párový test. Prvním krokem k provedení tohoto testu je vytvoření rozdílů hodnot naměřených prvním a druhým výzkumníkem. V druhém kroku je potřeba ověřit jediný předpoklad, který musí být splněn, abychom mohli párový test provést, a sice ověřit normální rozdělení těchto rozdílů. Vzhledem k rozsahu náhodného výběru (n = 39 > 30) použijeme k ověření normality rozdílů Lillieforsův test (a = 0.05). Graficky zhodnotíme rozdělení náhodného výběru kvantilovým diagramem a histogramem (viz obrázek 15). Datový soubor rozdělíme do šesti ekvidistatních intervalů s šířkou 0.51 mm prostřednictvím stanovených hranic -2.195,-2.405,..., 0.865. 216 simd.ABL <- simd.AL - simd.BL 217 nortest::lillie.test(simd.ABL)$p.val # 0.0523^526 Protože p-hodnota = 0.0523 je větší než 0.05, nulovou hypotézu o normalitě dat nezamítáme na hladině významnosti a = 0.05. Z grafů vidíme, že normalita náhodného výběru není příliš přesvědčivá, však jsme byli pouze kousek k zamítnutí hypotézy o normálním rozdělení náhodného výběru. Lillierofsův test však přiklonil zrníčko vah směrem k normálnímu rozdělení, proto v souladu s výsledkem testu předpoklad normality výběru rozdílů hodnot měření obou výzkumníků nezamítáme. Předpoklad normality pro použití parametrického testu je tedy splněn. Naším úkolem je otestovat (nulovou) hypotézu o shodě střední hodnoty měření prvního a druhého výzkumníka. Tento problém jsme převedli na analogický problém, kdy porovnáváme střední hodnotu rozdílů měření prvního a druhého výzkumníka s konstantou po = 0. Původní i analogické tvrzení jsou zněním nulové hypotézy. Zbývá dodefinovat alternativní hypotézu. Proces testování si předvedeme v posloupnosti sedmi kroků. 1. Stanovení hypotéz • slovní formulace nulové a alternativní hypotézy 39 -1.94 -0.92 0.10 rozdíl mereni výzkumníku 1 a 2 (v mm) -2-10 1 2 teoreticky kvantil Lillieforsuv test: p-hodnota =0.0523 Obrázek 15: Histogram a diagram rozdílů měření prvního a druhého výzkumníka hodnot vertikálního průměru středu délky těla klíční kosti na levé straně Hq : Střední hodnota rozdílů měření prvního a druhého výzkumníka je rovná nule. H\ : Střední hodnota rozdílů měření prvního a druhého výzkumníka není rovná nule. • matematická formulace nulové a alternativní hypotézy H0 : fi = Mo, kde /io = 0 H\ : jj, ^ jj,q, kde jj,q = 0 (oboustranná alternativa) Volba hladiny významnosti • Hladinu významnosti volíme v souladu se zadáním jako a = 0.01. Testování kritickým oborem • Testovací statistika TW = = -°-4273684 -°v/38 = -°-4273684 x 6.164414 = -3.892136 = -3.8921 W S V 0.6768715 0.6768715 218 alpha <- 0.01 219 mu_0 <- 0 220 m <- mean(simd.ABL) 221 s <- sd(simd.ABL) 222 tu <- (m - mu_0) / s * sqrt (n) # -3.892136 • Kritický obor W = (-00; í„_i(o!/2)> U <*„_i(l - a/2); oo) = (-oo; Í38-1 (0.01/2)) U (í38-i(l - 0.01/2); oo) = (-oo; í37(0.005)) U (í37(0.995); oo) = (-oo ; -2.7154) U (2.7154 ; oo) 223 qt(alpha / 2, n - 1) # -2.715409 224 qt(l - alpha / 2, n - 1) # 2.715409 40 • Závěr testování Protože realizace testovací statistiky tyy na hladině významnosti a = 0.01. 4. Testování intervalem spolehlivosti • Interval spolehlivosti -3.8921 náleží do kritického oboru, tj. tyy e W, Hq zamítáme (d, h) -0.4273684 í„_i(l - a/2), m 0.6768715 L (a/2) '38 0.6768715 í38-i(l - 0.01/2), -0.4273684 - °'67^-715r38_1(0.01/2) -°-4273684 " :6l644lfÍ37(°-995)' -°-4273684 " °SSh7{0m5) (-0.4273684 - 0.1098031 x 2.715409 , -0.4273684 - 0.109803 x (-2.715409)) (-0.7255287, -0.1292083) 225 dh <- m - s / sqrt(n) * qt(l - alpha / 2, n - 1) # -0.7255286 226 hh <- m - s / sqrt (n) * qt (alpha / 2, n - 1) # -0.1292082 • Závěr testování Protože fig = 0 nenáleží do Waldova 99% empirického oboustranného intervalu spolehlivosti, tj. po = 0 IS, Hq zamítáme na hladině významnosti a = 0.01. 5. Testování p-hodnotou • p-hodnota p-hodnota = 2min{Pr(Tw < tw), Pr(Tw > tw)} = 2min{Pr(!ZV < tw), 1 - Pr(Tw < tw)} = 2min{Pr(!ZV < -3.892136), 1 - Pr(Tw < -3.892136)} = 2min{0.0001999986, 0.9998} = 2 x 0.0001999986 = 0.0003999972 = 0.0004 227 p.val <- 2 * min (pt (tw , n - 1), 1 - pt(tw, n - 1)) # 0.0003999971 • Závěr testování Protože p-hodnota = 0.0004 je menší než a = 0.01, Hq zamítáme na hladině významnosti a = 0.01. 6. Interpretace výsledků Za základě všech tří typů testování zamítáme nulovou hypotézu na hladině významnosti a = 0.01. Mezi střední hodnotou měření vertikálního průměru ve středu délky těla klíční kosti na levé straně u prvního a druhého výzkumníka existuje statisticky významný rozdíl. 7. Grafická vizualizace výsledku testování Porovnání měření obou výzkumníků nejlépe vizualizujeme pomocí krabicového diagramu. Vybrat si můžeme mezi dvěma variantami diagramů. Prvním, který porovnává vzájemně měření prvního a druhého výzkumníka, a druhým který porovnává rozdíly s konstantou po = 0. Poznámka: Párový test můžeme provést pomocí funkce t.test(). Vstupními parametry budou vektor reprezentující měření prvního výzkumníka (simd.AL), vektor reprezentující měření druhého výzkumníka (simd.BL), argument 41 14 - 12 - 10 • aritmeticky prumer - median -1- výzkumník cl -1- výzkumník c.2 I 8 8 0 - -1 - -2 - Obrázek 16: Krabicový diagram rozdílů měření prvního a druhého výzkumníka hodnot vertikálního průměru ve středu délky těla klíční kosti na levé straně paired = T určující, že oba vektory považujeme za párová pozorování, hodnota hladiny významnosti a zadaná prostřednictvím koeficientu spolehlivosti 1 — a nastavením hodnoty argumentu conf.level = 0.99 a typ zvolené alternativní hypotézy (oboustranná) zadaný pomocí argumentu alternative = 'two.sideď. 228 t.test(simd.AL, simd.BL, paired = T, conf.level = 0.99, alternative = 'two.sided') Paired t-test data: simd.AL and simd.BL t = -3.8921, df = 37, p-value = 4e-04 alternative hypothesis: true difference in means is not equal to 0 99 percent confidence interval: -0.7255286 -0.1292082 sample estimates: mean of the differences -0.4273684 229 230 231 232 233 234 235 236 237 238 239 Součástí výstupu je hodnota testovací statistiky t = -3.8921, počet stupňů volnosti Studentova rozdělení df = 37, hranice 99% Waldova empirického oboustranného intervalu spolehlivosti -0.7255286 a -0.1292082 a p-hodnota p-value = 4e-04. Jediné, co musíme stanovit zvlášť, jsou dolní a horní hranice kritického oboru. Druhou možností provedení párového testu je opět pomocí funkce t.testQ, kde vstupními parametry budou vektor rozdílů naměřených hodnot prvního a druhého výzkumníka (simd.ABL), argument mu = 0 určující, že rozdíly porovnáváme s konstantou po = 0, hodnota hladiny významnosti a zadaná prostřednictvím koeficientu spolehlivosti 1 — a (conf.level = 0.99) a typ zvolené alternativní hypotézy (alternativě = 'two.sideď). 240 t.test(simd.ABL, mu = 0, conf.level = 0.99, alternativě = 'two.sided') Výstup tohoto příkazu je totožný s výše uvedeným výstupem. Záleží tedy na nás, jakou syntaxi k zadání párového testu použijeme. 42 One Sample t-test data: simd.ABL t = -3.8921, df = 37, p-value = 4e-04 alternative hypothesis: true mean is not equal to 0 99 percent confidence interval: -0.7255286 -0.1292082 sample estimates: mean of x -0.4273684 241 242 243 244 245 246 247 248 249 250 251 43 Příklad 7.12. Párový test Máme datový soubor 03-paired-means-clavicle2.txt obsahující údaje o délkách klíční kosti (clavicula) z pravé strany (length.R) a levé strany (length.L) z anglického souboru dokumentovaných skeletů (Parsons, 1916, viz soubor D-03-paired-means-clavicle2). Na hladině významnosti a = 0.05 zjistěte, zdaje střední hodnota délky klíční kosti u mužů z levé strany větší než střední hodnota délky klíční kosti u mužů z pravé strany. Řešení příkladu 7.12 Nejprve příkazem read.delim() načteme datový soubor a pomocí operátoru [] z něj vybereme pouze údaje o délce klíční kosti z levé strany (sloupce length.L resp. z pravé strany (length.R) u mužů sex == 'm'. Údaje vložíme do proměnné length.LRM. Z datové tabulky následně odstraníme chybějící údaje a zjistíme rozsah náhodného výběru. 252 data <- read.delim('00-Data\\03-paired-means-clavicle2.txt') 253 data.LRM <- data[data$sex == 'm', c('length.L', 'length.R')] 254 data.LRM <- na.omit(data.LRM) 255 dim(data.LRM) # 50x2 Datový soubor obsahuje údaje o délce klíční kosti z levé a pravé strany u 50 mužů. Úkolem ze zadání je porovnat naměřené hodnoty na levé a pravé straně. Jde tedy o měření stejného znaku (délka klíční kosti) sledovaného na stejných subjektech (muži), proto použijeme na tuto situaci párový test. Prvním krokem k tohoto testu je vytvoření rozdílů hodnot naměřených na levé a pravé straně. V druhém kroku je potřeba ověřit předpoklad normality rozdílů. Vzhledem k rozsahu náhodného výběru použijeme k ověření normality rozdílů Lillieforsův test (a = 0.05)v kombinaci s kvantilovým diagramem a histogramem (viz obrázek 17). Datový soubor rozdělíme do šesti ekvidistatních intervalů s šířkou 0.51 mm prostřednictvím stanovených hranic —2.195, —2.405,..., 0.865. 256 length.RM <- data.LRM[, 'length.R'] 257 length.LM <- data.LRM[, 'length.L'] 258 length.LRM <- length.LM - length.RM -8.5 -2.5 3.5 6.5 9.5 -2 -1 0 1 2 teoreticky kvantil rozdil mereni z leve a pravé strany (v mm) Lillieforsův test: p-hodnota =0.1776 Obrázek 17: Histogram a diagram rozdílů měření délky klíční kosti na levé a na pravé straně u mužů Protože p-hodnota = 0.1776 je větší než 0.05, nulovou hypotézu o normalitě dat nezamítáme na hladině významnosti a = 0.05. Zatímco histogram křivku hustoty normálního rozdělení přesně nevystihuje, v kvantilovém diagramu je zřejmá dostatečná příchylnost bodů k referenční přímce a výjimkou tří bodů na pravém chvostu. Náhodný výběr rozdílů délek klíčních kostí z levé a pravé strany tedy pochází z normálního rozdělení. Naším úkolem je zjistit, zda je střední hodnota délky klíční kosti u mužů z levé strany větší než střední hodnota délky klíční kosti u mužů z pravé strany. Tento problém převedeme na analogický problém, kdy porovnáme střední hodnotu rozdílů měření z levé a pravé strany s konstantou po = 0. Původní i analogické tvrzení jsou zněním alternativní hypotézy a zbývá dodefinovat znění nulové hypotézy. 44 1. Stanovení hypotéz • slovní formulace nulové a alternativní hypotézy H0 : Střední hodnota délky klíční kosti u mužů z levé strany menší nebo rovná střední hodnote délky klíční kosti u mužů z pravé strany. Hi : střední hodnota délky klíční kosti u mužů z levé strany větší než střední hodnota délky klíční kosti u mužů z pravé strany. • matematická formulace nulové a alternativní hypotézy Hq : /i < fíg, kde /io = 0 Hi : jj, > jj,q, kde /íq = 0 (pravostranná alternativa) Volba hladiny významnosti • Hladinu významnosti volíme a ■■ Testování kritickým oborem • Testovací statistika M-fio r- T, w S 0.05 (viz zadání příkladu). 1.86-0 3.854549 50 : 1.86 3.854549 x 7.071068 = 3.412121 = 3.4121 259 alpha <- 0.05 260 mu_0 <- 0 261 m <- mean(length.LRM) 262 s <- sd(length.LRM) 263 tw <- (m - mu_0) / s * sqrt (n) # 3.41212 • Kritický obor W = (í„_i(l - a); oo) (í50-i(l-0.05); oo) (í49(0.95); oo) 264 qt(l - alpha, n - 1) # 1.676551 • Závěr testování Protože realizace testovací statistiky tyy = 3.4121 náleží do kritického oboru, tj. tyy e W, Hq zamítáme na hladině významnosti a = 0.05. 4. Testování intervalem spolehlivosti • Interval spolehlivosti (eř, h) = — —j=tn-i(l — a/2), oo lg6_ 31854549 3,854549 7.071068 9V (1.86 - 0.5451155 x 1.676551, oo) (0.9460861, oo) 45 265 dh <- m - s / sqrt(n) * qt(l - alpha, n - 1) # 0.9460859 • Závěr testování Protože jj,q = 0 nenáleží do Waldova 95% empirického levostranného intervalu spolehlivosti, tj. po = 0 ^ IS, Hq zamítáme na hladině významnosti a = 0.05. 5. Testování p-hodnotou • p-hodnota p-hodnota = 1 - Pr(Tw < tw)} = 1 - Pr(Tw < 3.41212)} = 0.0006503568 = 0.0006504 266 p.val <- 1 - pt(tw, n - 1) # 0.0006503568 • Závěr testování Protože p-hodnota = 0.0006504 je menší než a = 0.05, Hq zamítáme na hladině významnosti a = 0.05. 6. Interpretace výsledků Za základě všech tří typů testování zamítáme nulovou hypotézu na hladině významnosti a = 0.05. Střední hodnota délky klíční kosti mužů na levé straně je statisticky významně větší než střední hodnota délky klíční kosti mužů na pravé straně. 7. Grafická vizualizace výsledku testování Porovnání měření obou výzkumníků nejlépe vizualizujeme pomocí krabicového diagramu. o ca •a 190 180 - 170 - 160 - 150 140 - 130 - • aritmeticky prumer - medián T T o M 10 - 5 - 0 - -5 - • naměřené rozdíly • M-o = 0 leva strana pravá strana Obrázek 18: Krabicový diagram rozdílů délky klíční kosti u mužů na levé a na pravé straně Poznámka: Párový test provedeme také pomocí funkce t.test(). Vstupními parametry budou vektor reprezentující měření délky klíční kosti na levé straně (length.LM), vektor reprezentující měření délky klíční kosti na pravé straně (length.RM), volba párového testu (paired = T), hodnota hladiny významnosti a (conf.level = 0.95) a volba pravostranné alternativní hypotézy (alternativě = 'greater'). 267 t.test(length.LM, length.RM, paired = T, conf.level = 0.95, alternativě = 'greater') Součástí výstupu je hodnota testovací statistiky t = 3.4121, počet stupňů volnosti Studentova rozdělení df = 49, hranice 95% Waldova empirického oboustranného intervalu spolehlivosti 0.9460859 a Inf a p-hodnota p-value = 0.0006504. Jediné, co musíme stanovit zvlášť, je dolní hranice kritického oboru. 46 Paired t-test data: length.LM and length.RM t = 3.4121, df = 49, p-value = 0.0006504 alternative hypothesis: true difference in means is greater than 0 95 percent confidence interval: 0.9460859 Inf sample estimates: mean of the differences 1.86 268 269 270 271 272 273 274 275 276 277 278 47 Příklad 7.13. Párový test Máme datový soubor 02-paired-means-clavicle.txt obsahující údaje o hodnotách vertikálního průměru středu délky těla klíční kosti z pravé a levé strany (clavicula) z pohřebiště u Sv. Jakuba v Brně, převážně z období středověku, naměřené jedním výzkumníkem ve dvou opakovaných měřeních (viz sekce ??). Hodnoty naměřené při prvním opakování jsou uloženy v proměnné simd.l, hodnoty naměřené při druhém opakování jsou uloženy v proměnné simd.2. Můžeme zjistit, že aritmetický průměr hodnot získaných v rámci prvního měření je větší než aritmetický průměr hodnot získaných v rámmci druhého měření. Na hladině významnosti a = 0.05 zjistěte, zda je střední hodnota prvního měření větší než střední hodnota druhého měření vertikálního průměru délky těla klíční kosti na levé straně provedené tímto výzkumníkem. Řešení příkladu 7.13 Nejprve příkazem read.delim() načteme datový soubor a pomocí operátoru [] z něj vybereme pouze údaje naměřené sledovaným výzkumníkem (sloupce simd.l a simd.2) na levé straně side == 'U. Údaje vložíme do proměnné data.l2L. Z datové tabulky následně odstraníme chybějící údaje a zjistíme rozsah náhodného výběru. 279 data <- read.delim('00-Data\\02-paired-means-clavicle.txt') 280 data.l2L <- data[data$side == ' L ' , c('simd.l', 'simd.2')] 281 data.l2L <- na.omit(data.12L) 282 dim(data.12L) # 40x2 Datový soubor obsahuje 40 opakovaných měření délky těla klíční kosti z levé strany. Protože naším úkolem ze zadání je porovnat opakovaná měření provedená na jednom subjektu, použijeme k tomuto porovnání párový test. Prvním krokem k provedení tohoto testu je vytvoření rozdílů hodnot získaných v prvním a druhém měření. V druhém kroku je potřeba ověřit jediný předpoklad, který musí být splněn, abychom mohli párový test provést, a sice ověřit normální rozdělení těchto rozdílů. Vzhledem k rozsahu náhodného výběru (n = 40 > 30) použijeme k ověření normality rozdílů Lillieforsův test (a = 0.05). Graficky zhodnotíme rozdělení náhodného výběru kvantilovým diagramem a histogramem (viz obrázek ??). Datový soubor rozdělíme do šesti ekvidistatních intervalů s šířkou 0.36 mm prostřednictvím stanovených hranic -0.57,-0.21,..., 1.59. Obrázek 19: Histogram a diagram rozdílů prvního a druhého měření hodnot vertikálního průměru ve středu délky těla klíční kosti na levé straně provedené jedním výzkumníkem Protože p-hodnota = 0.00020223 je menší než 0.05, nulovou hypotézu o normalitě rozdílů zamítáme na hladině významnosti a = 0.05. Histogram naměřených hodnot ukazuje na vyšikmení rozdílů směrem doleva s prodlouženým pravým koncem. Kvantilový diagram ukazuje na odlehlost bodů od referenční přímky a minimálně jeden extrémně odlehlý bod na pravé straně. Náhodný výběr rozdílů hodnot získaných v prvním a druhém měření nepochází z normálního rozdělení. Předpoklad normality pro použití parametrického testu není splněn, proto není možné trvzení ze zadání ověřit po- 48 mocí parametrického párového testu. Jednou z možností, jak příklad dále řešit je zkusit odstranit rozdíl s nejvyšší hdonotou vyskytující se ve vektoru simd.l2L. Vypsáním vektoru rozdílů simd.l2L můžeme zjistit, že odlehlé pozorování nabývá hodnoty 1.57 a je umístěno na 36. pozici ve vektoru simd.l2L. Pomocí operátoru [] toto pozorování odstraníme a provedeme opětovně Lillieforsův test normality a zobrazíme histogram a kvantilový diagram (viz obrázek 20). 283 simd.!2L2 <- simd.12L [-36] -0.445 -0.025 0.395 -2 -1 0 1 2 teoreticky kvantil rozdil prvního a druhého mereni (v mm) Lillieforsův test: p-hodnota = 0.0302 Obrázek 20: Histogram a diagram rozdílů prvního a druhého měření hodnot vertikálního průměru ve středu délky těla klíční kosti na levé straně po odstranění nejodlehlejšího pozorování Protože p-hodnota = 0.0302 je menší než 0.05, nulovou hypotézu o normalitě rozdílů zamítáme na hladině významnosti a = 0.05. Histogram zobrazující rozdíly prvního a druhého měření sice vypadá lépe, ale u kvantilového grafu stále vidíme fatální odchylky bodů od referenční přímky. Náhodný výběr rozdílů hodnot získaných v prvním a druhém měření nepochází z normálního rozdělení. Předpoklad normality pro použití parametrického testu není ani po odstranění nejodlehlejšího rozdílu splněn, proto není možné trvzení ze zadání ověřit pomocí parametrického párového testu. Otázku ze zadání bychom tedy ověřili pomocí neparametrické alternativy párového testu, tj. metodami uvedenými v kapitole ??. 49 7.5 Test o korelačním koeficientu p Nechť (Xi, Yi)T ... (Xn, Yn)T je náhodný výběr z A^//, £) a nechť po Je konstanta. Na hladině významnosti a testujeme jednu z následujících tří hypotéz oproti příslušné alternativní hypotéze. Hqi : p = po oproti Hu : p ^ po (oboustranná alt.) Hq2 '■ p < po oproti H12 : p > po (pravostranná alt.) Hq3 : p > po oproti H13 : p < po (levostranná alt.) Test nazýváme jednovýběrovým Z-testem o korelačním koeficientu p. Testovací statistika má tvar Zw = V^3(ZR-to), (7.4) kde ZR = ^ ln jzžji je Fisherova Z-transformace výběrového korelačního koeficientu R a £0 = \ m je Fisherova Z-transformace konstanty po z nulové hypotézy a n je rozsah náhodného výběru. Testovací statistika Zw pochází asymptoticky (n > 10) ze standardizovaného normálního rozdělení, tj. Zw = V^3(ZR - Co) ~ ÍV(0,1). Kritický obor podle zvolené alternativní hypotézy má tvar Hn-.p^po W = (-00; ua/2) U («i_a/2 ; 00) H12 : p > po W = ; 00) H13 : p < po W=(-oo;ua) kde ua/2, Mi-a/2, ua, wi-a jsou kvantily standardizovaného normálního rozdělení, jejichž hodnoty získáme pomocí Qt a implementované funkce qnorm(). Interval spolehlivosti má podle zvolené alternativní hypotézy jeden z následujících tvarů Hu:pr Po (d, h) = (tanh (zR - ^=§) ; tanh (zR - ^)) H12 : p > po (d, 1) = (tanh (zR - ; l) Hla:p zw)} H12 : p > po p-hodnota = Pr(Zw > zw) = 1 — Pr(Zw < zw) H\z : p < po p-hodnota = Pr(Zw < zw) kde Zw je náhodná veličina, zw je realizace testovací statistiky Zw (viz vzorec 7.4), tedy konkrétní číslo, a Pľ(Z\y < z\y) je distribuční funkce standardizovaného normálního rozdělení, jejíž hodnotu získáme pomocí a implementované funkce pnormQ. 50 Příklad 7.14. Test o korelačním koeficientu p Mějme datový soubor 05-one-sample-correlation-skull-mf.txt, proměnnou skuli.pH popisující největší výšku mozkovny a proměnnou face.H popisující morfologickou výšku tváře (viz sekce ??) starověké egyptské populace. Současně máme k dispozici hodnotu korelačního koeficientu mezi oběma znaky a údaje o počtu případů ze vzorku novověké egyptské mužské populace. Na hladině významnosti a = 0.05 testujte hypotézu o shodě korelačního koeficientu největší výšky mozkovny a morfologické výšky tváře u mužů starověké a novověké egyptské populace. Řešení příkladu 7.14 Datový soubor načteme příkazem read.delim(). Pomocí operátoru [] vybereme z tabulky údaje o největší výšce mozkovny (skuli.pH) a morfologické výšce tváře face.H u mužů sex == 'm'. Údaje vložíme do proměnné data.M. Pomocí příkazu na.omit() odstraníme z tabulky data.M chybějící údaje. Nakonec příkazem dim() zjistíme rozsah náhodného výběru a příkazem range() rozsahy naměřených hodnot obou proměnných. 284 data <- read.delim('00-Data\\05-one-sample-correlation - skuli-mf.txt') 285 data.M <- data[data$sex == 'm', c('skuli.pH', 'face.H')] 286 data.M <- na.omit(data.M) 287 skuli.pHM <- data.M$skuli.pH 288 face.HM <- data.M$face.H 289 range(skuli.pHM) # 127-149 290 range(face.HM) # 100-136 Datový soubor obsahuje údaje o největší výšce mozkovny a morfologické výšce tváře u 164 mužů, přičemž naměřené největší výšky mozkovny nabývají hodnot v rozmezí 127-149 mm a naměřené morfologické výšky tváře nabývají hodnot v rozmezí 100-136 mm. Naším úkolem je porovnat korelančí koeficienty dvou egyptských populací, přičemž u mužů ze starověké egyptské populace známe naměřené hodnoty. Na základě těchto hodnot můžeme zjistit, zda náhodný výběr pochází z dvourozměrného normálního rozdělení. Druhá, novověká egyptská populace je reprezentována pouze hodnotou ko-relačníko koeficientu (tq = 0.251). O jejím rozdělení přesnější informace nemáme. Řešení příkladu vede na případ, kdy korelační koeficient jednoho náhodného výběru porovnáváme s konkrétním číslem, tedy na jednovýběrový test o korelančím koeficientu p. Předpokladem k použití tohoto testu je dvourozměrná normalita náhodného výběru největších výšek mozkovny a morfologických výšek tváře mužů starověké egyptské populace. Před použitím testu je třeba tento předpoklad ověřit. Závěr o dvourozměrné normalitě obou náhodných výběrů stanovíme na základě Mardiova testu (a = 0.05) v kombinaci s grafickou vizualizací dat pomocí 3D grafu a tečkového diagramu superponovaného 95 % elipsou spolehlivosti, analogicky, jako je uvedeno v sekci ??. 291 MVN::mvn(data.M, mvnTest = 'mardia')$multivariateNormality 292 # sikmost: 0.3852790 # spicatost : 0.1998495 Protože p-hodnota testu o nevýznamnosti koeficientu šikmosti, tj. 0.3853, je větší než 0.05, hypotézu o ne-významnosti koeficientu šikmosti nezamítáme na hladině významnosti a = 0.05. Dále protože p-hodnota testu o nevýznamnosti koeficientu špičatosti, tj. 0.1998, je větší než 0.05, nezamítáme hypotézu o nevýznamnosti koeficientu špičatosti. Protože náhodný výběr nevykazuje statisticky významné známky zešikmení ani zešpičatění, nezamítáme na hladině významnosti a = 0.05 hypotézu o dvourozměrné normalitě náhodného výběru největších výšek mozkovny a morfologických výšek tváře u mužů starověké egyptské populace. Ke stejnému závěru bychom došli také použitím Henze-Zirklerova testu (p-hodnota = 0.64065 > 0.05) i Roystonova testu (p-hodnota = 0.05850 > 0.05). Nyní se podíváme na grafickou vizualizaci náhodného výběru (viz graf 21) prostřednictvím 3D grafu obarveného pomocí 20 odstínů z palety matlab.like2 z knihovny colorRamps. 3D graf nám ukazuje kopcovitý tvar náhodného výběru složený z vyššího a nižšího kopce, které splývají v jeden objekt. Vzhledem k tomu, že rozsah náhodného výběru je 164, požadujeme, aby elipsa spolehlivosti pokrývala alepsoň 156 bodů. Zbylých 8 bodů smí ležet mimo elipsu spolehlivosti. V našem případě leží mimo elipsu spolehlivosti právě osm bodů, což podporuje výsledek Mardiova testu. Náhodný výběr největších výšek mozkovny a morfologických výšek tváře u mužů starověké egytské populace pochází z dvourozměrného normálního rozdělení. 51 Obrázek 21: 3D graf a tečkový diagram s 95% elipsou spolehlivosti pro největší výšku mozkovny a morfologickou výšku tváře mužů starověké egyptské populace (v mm) Jelikož je předpoklad dvourozměrné normality náhodného výběru splněn, můžeme hypotézu ze zadání otestovat pomocí parametrického testu o korelačním koeficientu p. Naším úkolem otestovat (nulovou) hypotézu o shodě korelačního koeficientu největší výšky mozkovny a morfologické výšky tváře u mužů starověké a novověké egyptské populace. Zbývá tedy stanovit znění alternativní hypotéz tak, aby bylo doplňkem k nulové hypotéze. Testování provedeme v posloupnosti sedmi kroků. 1. Stanovení hypotéz • slovní formulace nulové a alternativní hypotézy Hq : Korelační koeficient proměnných největší výška mozkovny a morfologická výška tváře u mužů starověké egyptské populace je rovný hodnotě 0.251. Hi : Korelační koeficient proměnných největší výška mozkovny a morfologická výška tváře u mužů starověké egyptské populace není rovný hodnotě 0.251. • matematická formulace nulové a alternativní hypotézy Hq : p = po, kde po = 0.251 Hi : p po, kde po = 0.251 (oboustranná alternativa) 2. Volba hladiny významnosti • Hladinu významnosti volíme v souladu se zadáním a = 0.05. 3. Testování kritickým oborem • Fisherova Z-transformace výběrového korelačního koeficientu K výpočtu Fisherovy Z-transformace potřebujeme znát hodnotu výběrového korelačního koeficientu. Tuto hodnotu získáme pomocí příkazu cor() s nastaveným argumentem method == 'pearson'. Výběrový korelační koeficient největší výšky mozkovny a morfologické výšky tváře mužů starověké egyptské populace r = 0.33064. Nyní můžeme vypočítat Fisherovu Z-transformaci korelačního koeficientu a Fisherovu Z-tranformaci konstanty po = 0.251 z nulové hypotézy. Zo = — m- 2 1-R 1. 1 + 0.3306431 1, 1.3306431 1 - In- = - ln- = - ln 1.987943 2 1 - 0.3306431 2 0.6693569 2 0.5 x 0.6871002 = 0.3435501 = 0.3436 52 llnl + Po 2 1-po 1 , 1 + 0.251 1 , 1.251 1 , _ „„„„„„ - In- = - In- = - In 1.670227 2 1 - 0.251 2 0.749 2 0.5 x 0.5129595 = 0.2564798 = 0.2565 293 alpha <- 0.05 294 n <- length(skull.pHM) 295 rhoO <- 0.251 296 r <- cor(skull.pHM , face.HM, method = 'pearson') 297 zR <- 1 / 2 * log((l + r) / (1 - r)) # 0.3435501 298 ksiO <- 1 / 2 * log((l + rhoO) / (1 - rhoO)) # 0.2564798 • Testovací statistika _ ZR - £o \/n — 3 = (0.3435501 - 0.2564798)^164 - 3 = 0.0870703 x v^ěl = 0.0870703 x 12.68858 = 1.104798 299 Zw <- (zR - ksiO) * sqrt(n - 3) # 1.104799 • Kritický obor W = (-00 ; ua/2) U (u1_a/2 ; oo) = (-oo ; «0.05/2) U («1-0.05/2 ; 00) = (-00 ; M0.025) U («0.975 ; 00) = (-00; -1.959964) U (1.959964; 00) 300 qnorm(alpha / 2) # -1.959964 301 qnormCl - alpha / 2) # 1.959964 • Závěr testování Protože realizace testovací statistiky zyy = 1.1048 nenáleží do kritického oboru, tj. zyy ^ W, Hq nezamítáme na hladině významnosti a = 0.05. 4. Testování intervalem spolehlivosti • Interval spolehlivosti 53 (d, h) = (tanh [zR - ^j) ; tanh [zR - -^=) ) = ( tanh ( 0.3435501 - Ml~°-°5/2 ) ; tanh ( 0 3435501 M°-°5/2 V164 - 3 (tanh ( 0.3435501 - ^=^1 ] ; tanh ( 0.3435501 M°025 161 / V V161 f f 1.959964 \ / -1.959964\\ (tanh (0.3435501 - j ; tanh (o.3435501 - j j (tanh (0.3435501 - 0.1544668) ; tanh (0.3435501 - (-0.1544668))) (tanh (0.1890833) ; tanh (0.4980169)) (0.1869; 0.46056) 302 dh <- tanh(zR - qnorm(l - alpha / 2) / sqrt(n - 3)) # 0.1868617 303 hh <- tanh(zR - qnorm(alpha / 2) / sqrt(n - 3)) # 0.4605561 • Závěr testování Protože po = 0.251 náleží do Waldova 95% empirického oboustranného intervalu spolehlivosti, tj. po = 0.251 G IS, Hq nezamítáme na hladině významnosti a = 0.05. 5. Testování p-hodnotou • p-hodnota p-hodnota = 2min{Pr(Zíil < zw),Pr(Zw > zw)} = 2 min{Pr(Zíi, < zw), 1 - Vľ(Zw < zw)} = 2mm{Pľ(Zw < 1.104799), 1 -Pr(Zw < 1.104799)} = 2 min{0.8653766, 0.1346234} = 2 x 0.1346234 = 0.2692467 = 0.2692 304 2 * min(pnorm(Zw), 1 - pnorm(Zw)) # 0.2692467 • Závěr testování Protože p-hodnota = 0.2692 je větší než a = 0.05, Hq nezamítáme na hladině významnosti a = 0.05. 6. Grafická vizualizace výsledků testování Vhodným grafem ukazujícím míru závislosti mezi největší výškou mozkovny a morfologickou výškou tváře je tečkový diagram superponovaný lineární regresní přímkou prokládající zobrazené body. Nejprve příkazem plot() vykreslíme body největší výšky mozkovny a morfologické výšky tváře mužů starověké egyptské populace. Koeficienty lineární regresní přímky získáme pomocí funkce lm(), jejímž jedniným argumentem bude vztah face.HM skuli.pHM, tj. vztah vyjadřující závislost mezi proměnnou face.HM na ose y a proměnnou skuli.pHM na ose x. Koeficienty regresní přímky, které jsou vloženy v položce coefficients, získáme z výstupu funkce Im pomocí odkazu $coef. Dále vytvoříme posloupnost tisíce bodů x v rozsahu hodnot proměnné skuli.pHM a vypočítáme hodnoty regresní přímky v bodech posloupnosti x, které vložíme do proměnné y. Nakonec vykreslíme lineární regresní přímku v bodech x,y příkazem lines(). Nakonec do grafu doplníme pod osu x popisek obsahující hodnotu výběrového korelačního koeficientu r = 0.33064 (příkaz mtext()). 305 par(mar = c(5, 4, 1, 1), family = 'Times') 54 306 plot(skull.pHM, face.HM, xlab = '', ylab = 'morfologická výska tvare (v mm)', 307 xlim = c(125, 150), ylim = c(98, 138), 308 las = 1, pch = 21, col = 'dodgerblue4', bg = 'aliceblue') 309 k <- lm(face.HM ~ skull.pHM)$coef 310 x <- seq(min(skull.pHM), max(skull.pHM), length = 1000) 311 y <- k[l] + x * k[2] 312 lines (x , y , col = ' midnightblue ' , lwd = 2) 313 314 r <- round(r, digit = 4) 315 mtext('nej vet si vyska mozkovny (v mm) ' , side = 1, line = 2.3) 316 mtext(bquote(paste(rho == . (r),)), side = 1, line = 3.7) o H-1-1-1-1-T 125 130 135 140 145 150 nejvetsi vyska mozkovny (v mm) p = 0.3306 Obrázek 22: Tečkový diagram s lineární regresní přímkou pro největší výšku mozkovny a morfologickou výšku tváře mužů starověké egyptské populace (v mm) 7. Interpretace výsledků: Na základě všech tří způsobů testování nezamítáme hypotézu o shodě korelačních koeficientů pro největší výšku mozkovny a morfologickou výšku tváře mužů starověké a novověké egyptské populace. Mezi korelačním koeficientem největší výšky mozkovny a morfologické výšky tváře mužů starověké a novověké egyptské populace neexistuje statisticky významný rozdíl. Mezi největší výškou mozkovny a morfologickou výškou tváře mužů starověké egyptské populace existuje nízký stupeň přímé lineární závislosti (pi = 0.33064). Taktéž mezi největší výškou mozkovny a morfologickou výškou tváře mužů starověké egyptské populace existuje nízký stupeň přímé lineární závislosti (p2 = 0.2510) (viz stupnice míry závislosti pro Pearsonův korelační koeficient, kapitola ??). ★ 55 Příklad 7.15. Test o korelačním koeficientu p Mějme datový soubor 13-two-samples-correlations-trunk.txt, proměnnou lowex.L popisující délku dolní končetiny (v mm) a proměnnou tru.L popisující délku trupu (v mm) (viz sekce ??). Na hladině významnosti a = 0.01 zjistěte, zda mezi délkou dolní končetiny a délky trupu žen existuje statisticky významná přímá lineární závislost. Řešení příkladu 7.15 Datový soubor načteme příkazem read.delim(). Pomocí operátoru [] vybereme z tabulky údaje o délce dolní končetiny (lowex.L) a délce trupu tru.L žen sex == 'f. Údaje vložíme do proměnné data.F. Z tabulky data.F odstraníme chybějící údaje (na.omit()). Nakonec zjistíme rozsah náhodného výběru (dim()) a rozsahy naměřených hodnot obou proměnných (range()). 317 data <- read.delim('00-Data\\13-two-samples-correlations-trunk.txt') 318 data.F <- data [data$ sex == 'f', c ( ' lowex . L ' , 'tru.Ľ)] 319 data.F <- na.omit(data.F) 320 dim(data.F) # 100x2 321 322 lowex.LF <- data.F$lowex . L 323 tru.LF <- data.F$tru.L 324 range(lowex.LF) # 836-1076 325 range(tru.LF) # 323-^92 Datový soubor obsahuje údaje o délce dolní končetiny a délce trupu u 100 žen, přičemž naměřené délky dolní končetiny nabývají hodnot v rozmezí 836-1 076 mm a naměřené délky trupu nabývají hodnot v rozmezí 323-492 mm. Naším úkolem je porovnat korelační koeficient populace žen s konstantou po = 0- Řešení příkladu tedy vede na jednovýběrový test o korelačním koeficientu p. Předpokladem k použití tohoto testu je dvourozměrná normalita náhodného výběru délek dolní končetiny a délek trupu žen. Před použitím testu je třeba tento předpoklad ověřit. Závěr o dvourozměrné normalitě obou náhodných výběrů stanovíme na základě Henze-Zirklerova testu (a = 0.05) v kombinaci s grafickou vizualizací dat pomocí 3D grafu a tečkového diagramus 95 % elipsou spolehlivosti. 326 MVN::mvn(data.F, mvnTest = 'hz')$multivariateNormality # 0.587225 Protože p-hodnota Henze-Zirklerova testu, tj. 0.587225, je větší než 0.05, hypotézu o dvourozměrné normalitě náhodného výběru délek dolních končetin a délek trupu žen nezamítáme na hladině významnosti a = 0.05. Ke stejnému závěru bychom došli také použitím Mardiova testu (p-hodnota pro koeficient šikmosti = 0.1769 > 0.05, p-hodnota pro koeficient špičatosti = 0.8360 > 0.05) i Roystonova testu (p-hodnota = 0.6339 > 0.05). Nyní se podíváme na grafickou vizualizaci náhodného výběru (viz graf 23) prostřednictvím 3D grafu obarveného 20 odstíny z palety matlab.like2. Odstíny tentokrát používáme v obráceném pořadí (viz funkce revQ). 3D graf nám ukazuje kopcovitý tvar s několika málo odlehlými hodnotami. Vzhledem k tomu, že rozsah náhodného výběru je 100, je třeba, aby elipsa spolehlivosti pokrývala alepsoň 95 bodů. Zbylých 5 bodů se smí realizovat mimo 95 % elipsu spolehlivosti. Z tečkového diagramu vidíme, že mimo elipsu spolehlivosti se realizují pouze 4 body. Na základě Henze-Zirklerova testu a grafické vizualizace docházíme k závěru, že náhodný výběr délek dolních končetin a délek trupu pochází z dvourozměrného normálního rozdělení. Jelikož je předpoklad dvourozměrné normality náhodného výběru splněn, můžeme použít parametrický testu o rkorelačním koeficientu p. Naším úkolem zjistit, zda mezi délkou dolní končetiny a délky trupu žen existuje statisticky významná přímá lineární závislost. Protože ukazatelem přímé závislosti je kladná hodnota korelačního koeficientu, je naším úkolem zjistit, zda je korelační koeficient délky dolní končetiny a délky trupu žen větší než 0. Analogicky jako v předchozích příkladech je toto tvrzení je zněním alternativní hypotézy. Nulovou hypotézu dodefinujeme jako doplněk k tomuto trvzení. 1. Stanovení hypotéz • slovní formulace nulové a alternativní hypotézy Hq : Korelační koeficient proměnných délka dolní končetiny a délka trupu je menší nebo rovný 0. Hi : Korelační koeficient proměnných délka dolní končetiny a délka trupu je větší než 0. 56 délka dolni končetiny (v mm) Obrázek 23: 3D graf a tečkový diagram s 95% elipsou spolehlivosti pro délku dolní končetiny a délku trupu žen (v mm) • matematická formulace nulové a alternativní hypotézy Ho : p< po, kde p0 = 0 Hi : p > po, kde po = 0 (pravostranná alternativa) 2. Volba hladiny významnosti • Hladinu významnosti volíme podle zadání a = 0.01. 3. Testování kritickým oborem • Fisherova Z-transformace výběrového korelačního koeficientu K výpočtu Fisherovy Z-transformace zjistíme nejprve hodnotu výběrového korelačního koeficientu pomocí příkazu cor(). Výběrový korelační koeficient délky dolní končetiny a délky trupu žen r = 0.2853. Nyní můžeme vypočítat Fisherovu Z-transformaci korelačního koeficientu a konstanty po = 0 z nulové hypotézy. 7 :1 1+R lln1 + °-285256 = 1 In 1^ = 1 In 1.798205 2 1 - 0.285256 2 0.714744 2 0.5 x 0.5867888 = 0.2933944 = 0.2934 llnl+Po 2 1 - po 1, 1 + 0 - In-= 2 1-0 0.5 x 0 = 0 ■lni 327 alpha <- 0.01 328 n <- length(lowex.LF) 329 rhoO <-0 330 r <- cor(lowex.LF , tru.LF, method = 'pearson') 331 zR <- 1 / 2 * log((l + r) / (1 - r)) # 0.2933943 332 ksiO <- 1 / 2 * log((l + rhoO) / (1 - rhoO)) # 0 57 • Testovací statistika _ ZR - £o \/n — 3 = (0.2933943 - 0)^100-3 = 0.2933943 x V97 = 0.2933943 x 9.848858 = 2.889599 = 2.8896 333 Zw <- (zR - ksiO) * sqrt (n - 3) # 2.889599 • Kritický obor W = («i_„ ; oo) = (mi-o.oi ; oo) = («0.99 ; oo) = (2.326348; oo) 334 qnorm(l - alpha) # 2.326348 • Závěr testování Protože realizace testovací statistiky zyy = 2.8896 náleží do kritického oboru, tj. zyy e W, Hq zamítáme na hladině významnosti a = 0.01. 4. Testování intervalem spolehlivosti • Interval spolehlivosti (d, 1) = ^tanh ^ ui-a , . zr - ,-- ; 1 \Jn - 3 (tanh ( 0.2933943 Ul 001 f tanh f 0.2933943 -V V V97 V100 - 3 1 ( í 2.326348 \ (tanh (0.2933943 -^^j;! (tanh (0.2933943 - 0.2362048) ; 1) (tanh (0.0571895) ; 1) (0.05712723; 1) 335 dh <- tanh(zR - qnorm(l - alpha) / sqrt(n - 3)) # 0.05712723 • Závěr testování Protože po = 0 nenáleží do Waldova 99% empirického levostranného intervalu spolehlivosti, tj. po = 0 ^ IS, Hq zamítáme na hladině významnosti a = 0.01. 58 5. Testování p-hodnotou • p-hodnota p-hodnota = 1 — ~Pr(Zw < zw) = 1 - Pr(Zw < 2.889599) = 0.001928667 = 0.001929 336 1 - pnorm(Zw) # 0.001928667 • Závěr testování Protože p-hodnota = 0.001929 je menší než a = 0.01, Hq zamítáme na hladině významnosti a = 0.01. 6. Grafická vizualizace výsledků testování Míru závislosti mezi délkou dolní končetiny a délkou trupu vizualizujeme tečkovým diagramem superponovaným lineární regresní přímkou, která prokládá zobrazené body. Nejprve vykreslíme body délky dolní končetiny a délky trupu (příkaz plot()). Koeficienty lineární regresní přímky získáme pomocí funkce lm(), jejímž argumentem bude vztah tru.LF lowex.LF, tj. vztah vyjadřující závislost mezi proměnnou tru.LF na ose y a proměnnou lowex.LF na ose x. Koeficienty regresní přímky získáme z výstupu funkce Im pomocí odkazu $coef. Dále vytvoříme posloupnost tisíce bodů x v rozsahu hodnot proměnné lowex.LF a vypočítáme hodnoty regresní přímky v bodech posloupnosti x, které vložíme do proměnné y. 337 par(mar = c(5, 4, 1, 1), family = 'Times') 338 plot(lowex.LF, tru.LF, xlab = '', ylab = 'délka trupu (v mm)', 339 xlim = c(820, 1080), ylim = c(320, 500), 340 las = 1, pch = 21, col = 'firebrick', bg = 'khaki') 341 k <- lm(tru.LF " lowex.LF)$coef 342 x <- seq(min(lowex.LF) , max(lowex.LF) , length = 1000) 343 y <- k[l] + x * k [2] 344 lines(x, y , col = 'firebrick3', lwd = 2) 345 346 r <- round(r, digit = 4) 347 mtext('delka dolni končetiny (v mm)', side = 1, line = 2.3) 348 mtext(bquote(paste(rho == . (r),)), side = 1, line = 3.7) 7. Interpretace výsledků: Na základě všech tří způsobů testování zamítáme hypotézu Hq. Korelační koeficient délky dolní končetiny a délky trupu žen je statisticky významně větší než 0. To znamená, že mezi délkou dolní končetiny a délkou trupu žen existuje statisticky významná přímá závislost. Interpretací výběrového korelačního koeficientu můžeme stanovit, že mezi oběma znaky existuje nízký stupeň přímé lineární závislosti (pi = 0.2853), který je statisticky významný. ★ 59 Obrázek 24: Tečkový diagram s lineární regresní přímkou pro délku dolní končetiny a délku trupu žen (v mm) 60 Příklad 7.16. Test o korelačním koeficientu p Mějme datový soubor 06-lin-uhl-fm.txt, proměnnou skuli.H popisující výšku lebky v mm a proměnnou base.B popisující šířku lebeční báze na spojnici obou bodů porion v mm (viz sekce ??). Na hladině významnosti a = 0.10 , zda mezi výškou lebky a šířkou lebeční báze žen existuje významná nepřímá závislost. Řešení příkladu 7.16 Nejprve načteme datový soubor a vybereme z něj údaje o výšce lebky (skuli.H) a šířce lebeční báze base.B žen sex == 'f. Údaje vložíme do proměnné data.F. Z tabulky data.F následně odstraníme NA hodnoty a zjistíme rozsah náhodného výběru a rozsahy naměřených hodnot obou proměnných. 349 data <- read.delim('00-Data\\06-lin-uhl-fm.txt') 350 data.F <- data [data$ sex == 'f', cCskull.H', 'base.B')] 351 data.F <- na.omit(data.F) 352 dim(data.F) # 20x2 353 skuli.HF <- data.F$skuli . H 354 base.BF <- data.F$base.B 355 range (skuli . HF) # 115. 4675 - 1J±2. 0617 356 range(base.BF) # 108.5226-123.0860 Datový soubor obsahuje údaje o výšce lebky a šířce lebeční báze u 20 žen, přičemž naměřené výšky lebky nabývají hodnot v rozmezí 115.46-142.062 mm a naměřené šířky lebeční báze nabývají hodnot v rozmezí 108.523-123.086 mm. Naším úkolem je porovnat korelační koeficient populace žen s konstantou po = 0- Řešení příkladu tedy vede na jednovýběrový test o korelačním koeficientu p. Před použitím tohoto testu je třeba ověřit předpoklad normality náhodného výběru výšek lebky a šířek lebeční báze žen. Předkoklad normality ověříme Roystonovým testem (a = 0.05) v kombinaci s 3D grafem a tečkovým diagramem s 95 % elipsou spolehlivosti. 357 MVN::mvn(data.F, mvnTest = 'royst on')$multivariateNormality # O.6845OI4 Protože p-hodnota Roystonova testu, tj. 0.6845, je větší než 0.05, hypotézu o dvourozměrné normalitě náhodného výběru výšek lebky a šířek lebeční báze žen nezamítáme na hladině významnosti a = 0.05. Ke stejnému závěru bychom došli také použitím Mardiova testu (p-hodnota pro koeficient šikmosti = 0.7607 > 0.05, p-hodnota pro koeficient špičatosti = 0.3897 > 0.05) i Henze-Zirklerova testu (p-hodnota = 0.3559 > 0.05). Nyní se podíváme na grafickou vizualizaci náhodného výběru (viz graf 25). vyska lebky (v mm) Obrázek 25: 3D graf a tečkový diagram s 95% elipsou spolehlivosti pro výšku lebky a šířku lebeční báze žen (v mm) Grafy na obrázku 25 podporují výsledek testování. 3F graf zobrazuje normální rozdělení náhodného výběru tvořené jedním pospolitým kopcem bez výraznějších odlehlých pozorování. Z tečkového diagramu je navíc patrné, 61 že všechny body leží uvnitř elipsy spolehlivosti. Náhodný výběr výšek lebky a šířek lebeční báze žen pochází z dvourozměrného normálního rozdělení. Jelikož je předpoklad dvourozměrné normality náhodného výběru splněn, můžeme použít parametrický testu o korelačním koeficientu p. Naším úkolem zjistit, zda mezi výškou lebky a šířkou lebeční báze žen existuje statisticky významná nepřímá lineární závislost. Protože ukazatelem nepřímé závislosti je záporná hodnota korelačního koeficientu, je naším úkolem zjistit, zdaje korelační koeficient výšky lebky a šířky lebeční báze žen menší než 0. Analogicky jako v předchozích příkladech je toto tvrzení je zněním alternativní hypotézy. Nulovou hypotézu dodefinujeme jako doplněk k tomuto trvzení. 1. Stanovení hypotéz • slovní formulace nulové a alternativní hypotézy Hq : Korelační koeficient výšky lebky a šířky lebeční báze žen je větší nebo rovný 0. Hi : Korelační koeficient výšky lebky a šířky lebeční báze žen je menší než 0. • matematická formulace nulové a alternativní hypotézy Ho : p> po, kde p0 = 0 Hi : p < po, kde p0 = 0 (levostranná alternativa) 2. Volba hladiny významnosti • Hladinu významnosti volíme v souladu se zadáním a = 0.10. 3. Testování kritickým oborem • Fisherova Z-transformace výběrového korelačního koeficientu Nejprve vypočítáme hodnotu výběrového korelačního koeficientu R výšky lebky a šířky lebeční báze (r = —0.1713). Nyní můžeme vypočítat Fisherovu Z-transformaci korelačního koeficientu a Fisherovu Z-tranformaci konstanty po = 0. Zo = — In- 2 1-R 1, 1 + (-0.1712964) 1, 0.8287036 1 , 2 ln 1 - (-0.1712964) = 2 ln Tl71296" = 2 ln °-7°751 0.5 x (-0.3460036) = -0.1730018 = -0.1730 llnl + Po 2 1 1 m 2 1 Po 1 + 0 ■lni = 0.5 x 0 = 0 358 alpha <- 0.10 359 n <- lengthCskull.HF) 360 rhoO <- 0 361 r <- cor(skull.HF , base.BF, method = 'pearson') # -0.1712964 362 zR <- 1 / 2 * log((l + r) / (1 - r)) # -0.173002 363 ksiO <- 1 / 2 * log((l + rhoO) / (1 - rhoO)) # 0 • Testovací statistika 62 ry ZR - CO W ~ I-Q V n — 3 = (-0.173002 - 0)^20-3 = -0.173002 x VŤ7 = -0.173002 x 4.123106 = -0.7133056 = -0.7133 364 Zw <- (zR - ksiO) * sqrt(n - 3) # -0.7133054 • Kritický obor W = (—oo ; ua) = (-00; M0.io) = (-oo; -1.281552) 365 qnorm(alpha) # -1.281552 • Závěr testování Protože realizace testovací statistiky zyy = —0.7133 nenáleží do kritického oboru, tj. zyy ^ W, Hq nezamítáme na hladině významnosti a = 0.10. 4. Testování intervalem spolehlivosti • Interval spolehlivosti ( —1, h) = I — 1; tanh I zr \/n — 3 -1; tanh I -0.173002 M°10 1; tanh -0.173002 v^O - 3 -1.281552\ )) 4.123106 (-1; tanh (-0.173002 - (-0.310822))) (-1; tanh (0.13782)) (-1; 0.136954) 366 hh <- tanh(zR - qnorm(alpha) / sqrt(n - 3)) # 0.1369539 • Závěr testování Protože po = 0 náleží do Waldova 90% empirického pravostranného intervalu spolehlivosti, tj. po = 0 G IS, Hq nezamítáme na hladině významnosti a = 0.10. 5. Testování p-hodnotou 63 • p-hodnota p-hodnota = Pr(Zw < zw) = Pr(Zw < -0.7133054) = 0.2378284 = 0.2378 367 pnorm(Zw) # 0.2378284 • Závěr testování Protože p-hodnota = 0.2378 je větší než a = 0.10, Hq nezamítáme na hladině významnosti a = 0.10. 6. Grafická vizualizace výsledků testování Míru závislosti mezi výškou lebky a šířkou lebeční báze vizualizujeme tečkovým diagramem superponovaným lineární regresní přímkou, která prokládá zobrazené body. Koeficienty lineární regresní přímky získáme pomocí funkce lm(), jejímž argumentem bude vztah base.BF skuli.HF, tj. vztah vyjadřující závislost mezi proměnnou base.BF na ose y a proměnnou skull.HF na ose x. Dále vytvoříme posloupnost bodů x v rozsahu hodnot proměnné skull.HF a vypočítáme hodnoty regresní přímky v bodech této posloupnosti. 368 par(mar = c(5, 4, 1, 1), family = 'Times') 369 plot(skuli.HF, base.BF, xlab = '', ylab = 'sirka lebecni baze (v mm)', 370 xlim = c(114, 144), ylim = c(107, 124), 371 las = 1, pch = 21, col = 'red3', bg = 'yellow') 372 k <- lm(base.BF " skuli.HF)$coef 373 x <- seq(min(skull.HF), max(skull.HF), length = 1000) 374 y <- k[l] + x * k [2] 375 lines (x , y , col = ' red3 ' , lwd = 2) 376 377 r <- round(r, digit = 4) 378 mtext('vyska lebky (v mm)', side = 1, line = 2.3) 379 mtext(bquote(paste(rho == . (r),)), side = 1, line = 3.7) Obrázek 26: Tečkový diagram s lineární regresní přímkou pro výšku lebky a šířku lebeční báze žen (v mm) 7. Interpretace výsledků: Na základě všech tří způsobů testování nezamítáme hypotézu Hq. Korelační koeficient výšky lebky a šířky 64 lebeční báze žen není statisticky významně menší než 0. To znamená, že mezi výškou lebky a šířkou lebeční báze neexistuje statisticky významná nepřímá závislost. Interpretací výběrového korelačního koeficientu můžeme stanovit, že mezi oběma znaky existuje nízký stupeň nepřímé lineární závislosti (pi = —0.1713), který není statisticky významný. ★ 65 Příklad 7.17. Test o korelačním koeficientu p Mějme datový soubor 16-anova-head.txt, proměnnou bigo.W popisující šířku dolní čelisti v mm a proměnnou bizyg.W popisující šířku tváře v mm (viz sekce ??). Na hladině významnosti a = 0.10 testujte hypotézu o nepřímé závislosti mezi šířkou dolní čelisti a šířkou tváře u mužů. Řešení příkladu 7.17 Nejprve načteme datový soubor a vybereme z něj údaje o šířce dolní čelisti (bigo.W) a šířce tváře bizyg.W mužů sex == 'm'. Údaje vložíme do proměnné data.M. Z tabulky data.M následně odstraníme chybějící údaje, zjistíme rozsah náhodného výběru a rozsahy naměřených hodnot obou proměnných. 380 data <- read.delim('00-Data\\16-anova-head.txt') 381 data.M <- data [data$ sex == 'm', c('bigo.W', 'bizyg.W')] 382 data.M <- na.omit(data.M) 383 dim(data.M) # 75x2 384 bigo.WM <- data.M$bigo.W 385 bizyg.WM <- data.M$bizyg.W 386 range(bigo.WM) # 94 126 387 range(bizyg.WM) # 113-155 Datový soubor obsahuje údaje o šířce dolní čelisti a šířce tváře 75 mužů, přičemž naměřené šířky dolní čelisti nabývají hodnot v rozmezí 94-126 mm a naměřené šířky tváře nabývají hodnot v rozmezí 113-155 mm. Naším úkolem je porovnat korelační koeficient populace mužů s konstantou po = 0. Řešení příkladu vede na jednovýběrový test o korelačním koeficientu p. Před použitím tohoto testu je třeba ověřit předpoklad normality náhodného výběru šířek dolní čelisti a šířek tváře mužů. Předkoklad normality ověříme Henze-Zirklerovým testem (a = 0.05) v kombinaci s 3D grafem a tečkovým diagramem s 95 % elipsou spolehlivosti. 388 MVN::mvn(data.M, mvnTest = 'hz')$multivariateNormality # 0.006343478 Protože p-hodnota Henze-Zirklerova testu, tj. 0.006343, je menší než 0.05, hypotézu o dvourozměrné normalitě náhodného výběru šířek dolní čelisti a šířek tváře mužů zamítáme na hladině významnosti a = 0.05. Ke stejnému závěru bychom došli použitím Mardiova testu (p-hodnota pro koeficient šikmosti = 0.002218 < 0.05, p-hodnota pro koeficient špičatosti = 0.05248 > 0.05) i Roystonova testu (p-hodnota = 0.006445 < 0.05). Před stanovením závěru o dvourozměrné normalitě vyhodnotíme také grafickou vizializace náhodného výběru (viz graf 27). sirka dolni čelisti (v mm) Obrázek 27: 3D graf a tečkový diagram s 95% elipsou spolehlivosti pro výšku lebky a šířku lebeční báze žen (v mm) 3D graf zobrazuje dvourozměrné normální rozdělení tvořené jedním vrcholem s několika odlehlými hodnotami a jedním výrazně odlehlým pozorováním. Zda je počet odlehlých pozorování únosný pro předpoklad normlaity 66 ověříme na základě tečkového diagramu. Aby data pocházela z dovurozměrného normálního rozdělení, je potřeba, aby alespoň 71 bodů (95% bodů) leželo uvnitř elipsy spolehlivosti. Zbylé čtyři body mohou ležet mimo elipsu spolehlivosti. Bohužel mimo elipsu spolehlivosti se tentokrát nachází 5 bodů. Náhodný výběr šířek dolní čelisti a šířek lebeční báze žen nepochází z dvourozměrného normálního rozdělení. Jelikož předpoklad dvourozměrné normality náhodného výběru není splněn, nemůžeme k otestování hypotézy ze zadání použít jednovýběrový test o korelačním koeficientu p. Poznámka: V současné chvíli se nabízí více postupů, jak dále řešit nastalou situaci. Jedním z nich by bylo odstranění nej odlehlejšího pozorování a následná kontrola, zda se odstraněním tohoto pozorování nespravila normalita náhodného výběru. V případě, že ano, můžeme nový datový soubor s rozsahem 74 hodnot použít k otestování hypotézy ze zadání pomocí parametrického testu o korelačním koeficientu p, analogicky jako v příkladech 7.14, 7.15 a 7.16. V případě, že odstranění nevedlo k zlepšení normality náhodného výběru, mohli bychom vyzkoušet odstranění dalších odlehlých pozorování a to až do výše 10% naměřených hodnot. Pokud předpoklad normality stále není splněn, vrátíme se k původnímu souboru 75 naměřených hodnot a k otestování hypotézy ze zadání použijeme neparametrický test o korelačním koeficientu založený na Speramanově koeficientu pořadové korelace (viz kapitola ??). ★ 67 7.6 Test o nulovém korelačním koeficientu p (Test o nezávislosti) Nechť (Xi, Yi)T ... (Xn, Yn)T je náhodný výběr z N2{^, £). Na hladině významnosti a testujeme jednu z následujících tří hypotéz oproti příslušné alternativní hypotéze. H01 H02 H03 p = 0 p < 0 p > 0 oproti oproti oproti H12 H13 p 7^ 0 (oboustranná alt.) p > 0 (pravostranná alt.) p < 0 (levostranná alt.) Test nazýváme jednovýběrovým testem o nezávislosti. Testovací statistika má tvar Tw = 7í=W (7-5) kde R je výběrový korelační koeficient n je rozsah náhodného výběru. Testovací statistika Tw pochází ze Studentova í-rozdělení o n — 2 stupních volnosti, tj. T\Y — i, „„ľ ~ t-n-2- Vl-R'2 Kritický obor podle zvolené alternativní hypotézy má tvar H12 H13 p^O p > 0 p < o W = (-00; í„_2(a/2)) U (í„_2(l - a/2); oo) W= (í„_2(l-a); oo) = (-oo; tn_2(a)) kde íIJ_2(a/2), í„_2(l — a/2), í„_2(a), í„_2(l — a) jsou kvantity Studentova rozdělení o n — 2 stupních volnosti, jejichž hodnoty získáme pomocí r:: a implementované funkce qt(). Interval spolehlivosti má podle zvolené alternativní hypotézy jeden z následujících tvarů ff . /Q (j h) - Í . r-2(°/2) • , «n-2(l-a/2) \ Hi2:p>0 (-l,h)=(-l; /2t"?(1"°) 1 H13 : p < 0 (d, 1) = f /at"-2(°) ,; ll Poznámka: Při testování hypotézy o nulovém korelačním koeficientu p pomocí intervalu spolehlivosti rozhodujeme o zamítnutí nebo nezamítnutí Hq v závislosti na tom, zda hodnota výběrového korelačního koeficientu R náleží nebo nenáleží do intervalu spolehlivosti, nikoli v závislosti na tom, zda po = 0 náleží nebo nenáleží do intervalu spolehlivosti. Jedná se o výjimku. Poznámka: Protože parametr p je korelační koeficient, platí, že p € ( — 1; 1). Proto levostranný interval spolehlivosti omezíme shora hodnotou 1, namísto nekonečnem, a pravostranný interval spolehlivosti omezíme zdola hodnotou -1, namísto mínus nekonečnem. p-hodnota má v závislosti na zvolené alternativní hypotéze jeden z následujících tvarů Hn:pjíO p-hodnota = 2 min{Pr(Tw < tw), Pr(Tw > tw)} H12 : p > 0 p-hodnota = Pľ(Tw > tw) = 1 - Pt{Tw < tw) H13 : p < 0 p-hodnota = Pr(7V < tw) kde Tw je náhodná veličina, tw je realizace testovací statistiky Tw (viz vzorec 7.5), tedy konkrétní číslo, a Pr(Tw < tw) je distribuční funkce Studentova rozdělení o n — 2 stupních volnosti, jejíž hodnotu získáme pomocí CŘÍ a implementované funkce pt(). 68 Příklad 7.18. Test o korelačním koeficientu p Mějme datový soubor 19-more-samples-correlations-skull.txt, proměnnou nose.B popisující šířku nosu a proměnnou intorb.B popisující interorbitální šířku (viz sekce ??) malajské populace. Na hladině významnosti a = 0.05 testujte hypotézu o nezávislosti šířky nosu a interorbitální šířky u mužů malajské populace. Řešení příkladu 7.18 Datový soubor načteme příkazem read.delim(). Pomocí operátoru [] vybereme z tabulky údaje o šířce nosu (nose.B) a interorbitální šířce intorb.B u mužů malajské populace pop == 'maľ. Údaje vložíme do proměnné data.M. Pomocí příkazu na.omit() odstraníme z tabulky data.M chybějící údaje. Nakonec příkazem dim() stanovíme rozsah náhodného výběru a příkazem range() zjistíme rozsahy naměřených hodnot obou proměnných. 389 data <- read.delim('00-Data\\19-more-samples-correlations-skuli.txt') 390 data.M <- data[data$pop == 'mal', c('nose.B', 'intorb.B')] 391 data.M <- na.omit(data.M) 392 dim(data.M) # 73x2 393 nose.BM <- dat a.M$nose.B 394 intorb.BM <- data.M$intorb.B 395 range(nose.BM) # 21-30 396 range(intorb.BM) # 18-29 Datový soubor obsahuje údaje o šířce nosu a interorbitální šířce 73 mužů malajské populace, přičemž naměřené šířky nosu nabývají hodnot v rozmezí 21-30 mm a naměřené interorbitální šířky nabývají hodnot v rozmezí 18-29 mm. Naším úkolem je porovnat korelační koeficient malajské populace s konstantou po = 0, která reprezentuje nezávislost obou znaků. U mužů malajské populace máme k dispozici náhodný výběr naměřených hodnot. Na základě těchto hodnot můžeme zjistit, zda náhodný výběr pochází z dvourozměrného normálního rozdělení. Řešení příkladu vede na jednovýběrový test o nulovém korelačním koeficientu (neboli na test o nezávislosti). Předpokladem k použití tohoto testu je dvourozměrná normalita náhodného výběru šířek nosu a interorbitálních šířek mužů malajské populace. Před použitím testu je třeba tento předpoklad ověřit. Závěr o dvourozměrné normalitě obou náhodných výběrů stanovíme na základě Henze-Zirklerova testu (a = 0.05) v kombinaci s 3D grafem a tečkovým diagramem superponovaným 95 % elipsou spolehlivosti, analogicky, jako je uvedeno v sekci ??. 397 MVN::mvn(data.M, mvnTest = 'hz')$multivariateNormality # 0.269426 Protože p-hodnota Henze-Zirklerova testu, tj. 0.2694, je větší než 0.05, hypotézu o dvourozměrné normalitě náhodného výběru šířek nosu a interorbitálních šířek nezamítáme na hladině významnosti a = 0.05. Ke stejnému závěru bychom došli použitím Mardiova testu (p-hodnota pro koeficient šikmosti = 0.54502 > 0.05, p-hodnota pro koeficient špičatosti = 0.2638 > 0.05). Na základě Rystonova testu bychom dvourozměrnou normalitu náhodného výběru zamítli (p-hodnota = 0.02814 < 0.05). Před vytvořením závěru o dvourozměrné normalitě zhodnotíme ještě grafickou vizualizaci náhodnégho výběru (viz graf 28). 3D graf zobrazuje pospolitý kopcovitý tvar náhodného výběru bez viditelných odlehlých pozorování. Na tečkovém diagramu vidíme, že přeci jen dvě odlehlá pozorování jsou součástí náhodného výběru. Vzhledem k tomu, že pro podpoření předpokladu normality stačí, aby mimo elipsu spolehlivosti ležely nejvýše tři body (alespoň 69 bodů se má realizovat uvnitř elipsy spolehlivosti), je normalita náhodného výběru z hlediska odlehlých pozorování v pořádku. Náhodný výběr šířek nosu a onterorbitálních šířek u mužů malajské populace pochází z dvourozměrného normálního rozdělení. Jelikož je předpoklad dvourozměrné normality náhodného výběru splněn, můžeme hypotézu ze zadání otestovat pomocí parametrického testu o nezávislosti. Naším úkolem otestovat (nulovou) hypotézu o nezávislosti šířky nosu a interorbitální šířky, tj. hypotézu o shodě korelačního koeficientu šířky nosu a interorbitální šířky s konstantou p = 0. Zbývá tedy stanovit znění alternativní hypotézy tak, aby bylo doplňkem k nulové hypotéze. Testování provedeme v posloupnosti sedmi kroků. 1. Stanovení hypotéz 69 sirka nosu (v mm) Obrázek 28: 3D graf a tečkový diagram s 95% elipsou spolehlivosti pro šířku nosu a interorbitální šířku mužů malajské populace (v mm) • slovní formulace nulové a alternativní hypotézy Hq : Korelační koeficient proměnných šířka nosu a interorbitální šířka tváře je rovný 0. Hi : Korelační koeficient proměnných šířka nosu a interorbitální šířka tváře není rovný 0. • matematická formulace nulové a alternativní hypotézy H0 : p = 0 H1 : p ± 0 (oboustranná alternativa) 2. Volba hladiny významnosti • Hladinu významnosti volíme v souladu se zadáním a = 0.05. 3. Testování kritickým oborem • Testovací statistika K výpočtu testovací statistiky potřebujeme nejprve stanovit hodnotu výběrového korelačního koeficientu. K tomu využijeme funkci cor() s argumentem method = 'pearson'. Hodnota výběrového korelačního koeficientu mezi šířkou nosu a interorbitální šířkou je r = 0.41753. Nyní již můžeme vypočítat hodnotu testovací statistiky _ y73 - 2 x 0.4175294 Vl - 0.41752942 _ VŤ1 x 0.4175294 ^0.8256692 _ 8.42615 x 0.4175294 ~ 0.9086634 = 3.871803 = 3.8718 398 alpha <- 0.05 399 r <- cor(nose.BM, intorb.BM, method = 'pearson') 400 n <- length(nose.BM) 401 tw <- sqrt(n - 2) * r / sqrt(l - r " 2) # 3.871803 70 • Kritický obor W = (-00; í„_2(a/2)> U (í„_2(l - a/2); 00) = (-00 ; í73-2(0.05/2)) U (í73-2(l - 0.05/2); 00) = (-00; í7i (0.025)) U (Í71 (0.975); 00) = (-00 ; -1.9939) U (1.9939 ; 00) 402 qt(alpha / 2 , n - 2) #-1 . 99394.3 403 qt(l - alpha / 2, n - 2) # 1.993943 • Závěr testování Protože realizace testovací statistiky tyy = 3.8718 náleží do kritického oboru, tj. tyy e W, Hq zamítáme na hladině významnosti a = 0.05. Testování intervalem spolehlivosti • Interval spolehlivosti (d, h) ,Xa/2) í„_2(l-a/2) ^ti_2{a/2)+n-2 y/t2n_2(l - a/2) + n - 2J Í73-2(0.05/2) í73_2(l -0.05/2) ^í?3-2(0-05/2) + 73 - 2' ^23.2(1-0.05/2) + 73-2 Í71 (0.025) í7i(l - 0.025) ^^(0.025) + 71 ' ^71 (! - 0.025)+ 71 -1.993943 1.993943 v/(-1.993943)2 + 71 ' v/1.9939432 + 71 -1.993943 _ 1.993943 \ ^74.97581 ' ^74.97581 / -1.993943 _ 1.993943 \ 8.658857 ' 8.658857 / (-0.2302779; 0.2302779) 404 dh <- qt (alpha / 2, n - 2) / sqrt (qt (alpha / 2 , n - 2) ~2 + n-2) # -0.2302779 405 hh <- qt(l - alpha / 2, n - 2) / sqrt(qt(l - alpha / 2, n - 2) ~2+n-2) # 0.2302779 • Závěr testování Protože r = 0.4175 nenáleží do Waldova 95% empirického oboustranného intervalu spolehlivosti, tj. r = 0.4175 ^ IS, Hq zamítáme na hladině významnosti a = 0.05. Testování p-hodnotou 71 • p-hodnota p-hodnota = 2min{Pr(Tíi, < tw),Pr(Tw > tw)} = 2min{Pr(TíiI < tw), 1 - Pr(Tw < tw)} = 2min{Pr(Tíi, < 3.871803), 1 - Pr(Tw < 3.871803)} = 2min{0.999946, 5.401663e - 05} = 2 x 5.401663e - 05 = 0.0001080333 = 0.000108033 406 2 * min(pnorm(tw), 1 - pnorm(tw)) # 0.0001080333 • Závěr testování Protože p-hodnota = 0.0001080333 je menší než a = 0.05, Hq zamítáme na hladině významnosti a = 0.05. 6. Grafická vizualizace výsledků testování Míru závislosti mezi šířkou nosu a interorbitální šířkou vizualizujeme tečkovým diagramem superponovaným lineární regresní přímkou prokládající zobrazené body. Nejprve příkazem plot() vykreslíme body šířky nosu a interorbitální šířky mužů malajské populace. Koeficienty lineární regresní přímky získáme pomocí funkce lm(), jejímž jedniným argumentem bude vztah intorb.BM nose.BM, tj. vztah vyjadřující závislost mezi proměnnou intorb.BM na ose y a proměnnou nose.BM na ose x. Koeficienty regresní přímky, které jsou vloženy v položce coefficients, získáme z výstupu funkce Im pomocí odkazu $coef. Dále vytvoříme posloupnost tisíce bodů x v rozsahu hodnot proměnné nose.BM a vypočítáme hodnoty regresní přímky v bodech posloupnosti x, které vložíme do proměnné y. Nakonec vykreslíme lineární regresní přímku v bodech x, y příkazem lines(). Nakonec do grafu doplníme pod osu x popisek obsahující hodnotu výběrového korelačního koeficientu r = 0.4175 (příkaz mtext()). 407 par(mar = c(5, 4, 1, 1), family = 'Times') 408 plot(skuli.pHM, face.HM, xlab = '', ylab = 'interorbitalni sirka (v mm)', 409 xlim = c(125, 150), ylim = c(98, 138), 410 las = 1, pch = 21, col = 'dodgerblue4', bg = 'aliceblue') 411 k <- lm(face.HM ~ skuli.pHM)$coef 412 x <- seq(min(skull.pHM), max(skuli.pHM), length = 1000) 413 y <- k[l] + x * k[2] 414 lineš (x , y , col = ' midnightblue ' , lwd = 2) 415 416 r <- round(r, digit = 4) 417 mtext (' sirka nosu (v mm)', side = 1, line = 2.3) 418 mtext(bquote(paste(rho == . (r),)), side = 1, line = 3.7) 7. Interpretace výsledků: Na základě všech tří způsobů testování zamítáme hypotézu o shodě korelačního koeficientu šířky nosu a interorbitální šířky u mužů malajské populace s nulou. Mezi šířkou nosu a interorbitální šířkou mužů malajské populace existuje statisticky významná závislost. Interpretací výběrového korelačního koeficientu zjistíme, že mezi šířkou nosu a interorbitální šířkou existuje mírný stupeň přímé lineární závislosti (p2 = 0.4175) (viz stupnice míry závislosti pro Pearsonův korelační koeficient, kapitola ??). ★ 72 Obrázek 29: Tečkový diagram s lineární regresní přímkou pro šířku nosu a interorbitální šířku mužů malajské populace (v mm) 73 Příklad 7.19. Test o korelačním koeficientu p Mějme datový soubor 13-two-samples-correlations-trunk.txt, proměnnou lowex.L popisující délku dolní končetiny (v mm) a proměnnou tru.L popisující délku trupu (v mm) (viz sekce ??). Na hladině významnosti a = 0.01 zjistěte, zda mezi délkou dolní končetiny a délky trupu žen existuje statisticky významná přímá lineární závislost. Řešení příkladu 7.19 Žádání příkladu je shodné se zadáním příkladu 7.15. Taktéž datový soubor je totožný. Naším úkolem je porovnat korelační koeficient populace žen s konstantou po = Oj tentokrát prostřednictvím jednovýběrového testu o nezávislosti. Předpokladem k použití tohoto testu je dvourozměrná normalita náhodného výběru délek dolní končetiny a délek trupu žen. Splnění tohoto předpokladu jsme ověřili v rámci řešení příkladu 7.15. Ze zadání příkladu víme, že máme zhodnotit, zda mezi délkou dolní končetiny a délky trupu žen existuje statisticky významná přímá lineární závislost. Protože ukazatelem přímé závislosti je kladná hodnota korelačního koeficientu, je naším úkolem zjistit, zda je korelační koeficient délky dolní končetiny a délky trupu žen větší než 0. Toto tvrzení je opět zněním alternativní hypotézy, zatímco nulovou hypotézu dodefinujeme jako doplněk k tomuto trvzení. 1. Stanovení hypotéz • slovní formulace nulové a alternativní hypotézy Hq : Korelační koeficient proměnných délka dolní končetiny a délka trupu je menší nebo rovný 0. Hi : Korelační koeficient proměnných délka dolní končetiny a délka trupu je větší než 0. • matematická formulace nulové a alternativní hypotézy H0 : p < 0 Hi : p > 0 (pravostranná alternativa) 2. Volba hladiny významnosti • Hladinu významnosti volíme a = 0.01 (viz zadání příkladu). 3. Testování kritickým oborem • Testovací statistika K výpočtu testovací statistiky potřebujeme nejprve stanovit hodnotu výběrového korelačního koeficientu (viz funkce cor()). Hodnota výběrového korelačního koeficientu mezi šířkou nosu a interorbitální šířkou je r = 0.2853. Nyní již můžeme vypočítat hodnotu testovací statistiky _ V100 - 2 x 0.285256 Vl - 0.2852562 _ x 0.285256 ^0.918629 _ 9.899495 x 0.285256 ~ 0.9584514 = 2.946305 = 2.9463 419 data <- read .del im('00-Data\\13-two-samples -correlations-trunk.txt ' ) 420 data.F < - dat a[data$sex == 'f', c( 'lowex.Ľ , 'tru.L')] 421 data.F < - na .omit(data.F) 422 dim(data • F) # 100x2 423 lowex.LF <- data.F$lowex.L 424 tru.LF <- data.F$tru.L 425 alpha <- 0.01 426 r <- cor(lowex.LF, tru.LF, method = 'pearson') # 0.285256 427 n <- lengthdowex . LF) # 100 428 tw <- sqrt(n - 2) * r / sqrt(l - r ~ 2) # 2.946305 74 • Kritický obor W=(tn_2(l-a);) = <*ioo-2(l -0.01); oo) = (í98(0.99); oo) = (2.365002; oo) 429 qt(l - alpha, n - 2) # 2.365002 • Závěr testování Protože realizace testovací statistiky tw = 2.9463 náleží do kritického oboru, tj. tw £ W, Hq zamítáme na hladině významnosti a = 0.01. 4. Testování intervalem spolehlivosti • Interval spolehlivosti {-l,h)=(-l; í-^1-a) ^ /**_2(l-a)-w-2 i; -i; V v/*ioo-2(l-0-01) + 100 -2/ í98(0.99) 7^(0.99)+ 98 ( 2.365002 \ ' ^103.5932/ 2.365002 \ -i; 10.17807, (-1; 0.2323625) 430 hh <- qt(l - alpha, n - 2) / sqrt(qt(l - alpha, n-2)"2+n-2)# 0.2323624 • Závěr testování Protože r = 0.2853 nenáleží do Waldova 99% empirického pravostranného intervalu spolehlivosti, tj. r = 0.2853 ^ IS, Hq zamítáme na hladině významnosti a = 0.01. 5. Testování p-hodnotou • p-hodnota p-hodnota = Pr(7V > tw) = 1 - Pr(Tw < tw) = 1 - Pr(Tw < 2.946305) = 0.002009162 = 0.00200916 431 1 - pt(tw, n - 2) # 0. 002009162 75 • Závěr testování Protože p-hodnota = 0.00200916 je menší než a = 0.01, Hq zamítáme na hladině významnosti a = 0.01. 6. Grafická vizualizace výsledků testování Viz příklad 7.15. 7. Interpretace výsledků: Na základě všech tří způsobů testování zamítáme hypotézu Hq. Korelační koeficient délky dolní končetiny a délky trupu žen je statisticky významně větší než 0. To znamená, že mezi délkou dolní končetiny a délkou trupu žen existuje statisticky významná přímá závislost. Mezi oběma znaky existuje nízký stupeň přímé lineární závislosti (pi = 0.2853), který je statisticky významný. Ke stejnému závěru jsme dospěli též v příkladu 7.15. ★ 76 Příklad 7.20. Test o korelačním koeficientu p Mějme datový soubor 06-lin-uhl-fm.txt, proměnnou skuli.H popisující výšku lebky v mm a proměnnou base.B popisující šířku lebeční báze na spojnici obou bodů porion v mm (viz sekce ??). Na hladině významnosti a = 0.10 zjistěte, zda mezi výškou lebky a šířkou lebeční báze žen existuje významná nepřímá závislost. Řešení příkladu 7.20 Žádání příkladu je shodné se zadáním příkladu 7.20. Stejně tak datový soubor je totožný. Naším úkolem je porovnat korelační koeficient populace žen s konstantou po = 0, a to prostřednictvím jednovýběrového testu o nezávislosti. Jeho jediným předpokladem je dvourozměrná normalita náhodného výběru výšek lebky a šířek lebeční báze žen, kterou jsme ověřili v rámci řešení příkladu 7.20. Podle zadání máme zjistit, zda mezi výškou lebky a šířkou lebeční báze žen existuje statisticky významná nepřímá lineární závislost. Ukazatelem nepřímé závislosti je záporná hodnota korelačního koeficientu. Naším úkolem je tedy zjistit, zda je korelační koeficient výšky lebky a šířky lebeční báze žen menší než 0, což je znění alternativní hypotézy. 432 data <- read.delim('00-Data\\06-lin-uhl-fm.txt') 433 data.F <- data [data$ sex == 'f', cCskull.H', 'base.B')] 434 data.F <- na.omit(data.F) 435 dim(data.F) # 20x2 436 skuli.HF <- data.F$skuli . H 437 base.BF <- data.F$base.B 438 range (skuli . HF) # 115. 4675 - 1J±2. 0617 439 range(base.BF) # 108.5226-123.0860 1. Stanovení hypotéz • slovní formulace nulové a alternativní hypotézy Hq : Korelační koeficient výšky lebky a šířky lebeční báze žen je větší nebo rovný 0. Hi : Korelační koeficient výšky lebky a šířky lebeční báze žen je menší než 0. • matematická formulace nulové a alternativní hypotézy Ho : p > po, kde p0 = 0 Hi : p < po, kde po = 0 (levostranná alternativa) 2. Volba hladiny významnosti • Hladinu významnosti volíme v souladu se zadáním a = 0.10. 3. Testování kritickým oborem • Testovací statistika Nejprve vypočítáme hodnotu výběrového korelačního koeficientu R výšky lebky a šířky lebeční báze (r = —0.1713). Nyní můžeme vypočítat testovací statistiku. VrT=2R _ V20 - 2 x (-0.1712964) sj\ - (-0.1712964)2 _ VTŠ x (-0.1712964) ^0.9706575 _ 4.242641 x (-0.1712964) ~ 0.9852195 = -0.737652 = -0.7377 440 alpha <- 0.1 441 r <- cor(skull . HF , base.BF, method = 'pearson') # -0.1712964 77 442 n <- length(skull.HF) 443 tw <- sqrt(n - 2) * r / sqrtQ - r " 2) # -0.737652 • Kritický obor W = (-00; í„_2(a/2)> = (-oo; Í2o-2(0.10/2)> = (-oo; íis(0.05)> = (-oo; -1.33039) 444 qt(alpha, n - 2) # -1.330391 • Závěr testování Protože realizace testovací statistiky tyy = —0.737652 nenáleží do kritického oboru, tj. tyy ^ W, Hq nezamítáme na hladině významnosti a = 0.10. Testování intervalem spolehlivosti • Interval spolehlivosti (d,l) ^Jť2n_2(a)+n-2 Í20-2(0.10) ; i ^10-2(0.10)+ 20-2' íis(O.lO) v/í?8(0.10) + 18' -1.330391 v/(-1.330391)2 + 18 -1.330391 l ^19.76994 ' -1.330391 ; 1 4.44634 ' 0.2992104; 1) 445 dh <- qt(alpha, n - 2) / sqrt(qt(alpha, n- 2) ~2+n-2) # -0.2992103 • Závěr testování Protože r = —0.1713 náleží do Waldova 90% empirického levostranného intervalu spolehlivosti, tj. r 0.1713 G IS, Hq nezamítáme na hladině významnosti a = 0.10. Testování p-hodnotou • p-hodnota p-hodnota = T>r(Tw < tw) = Pr(Tw < -0.737652) = 0.230363 = 0.23036 78 446 pnorm(tw) # 0.230363 6. Grafická vizualizace výsledků testování Viz příklad 7.16. 7. Interpretace výsledků: Na základě všech tří způsobů testování nezamítáme hypotézu Hq. Korelační koeficient výšky lebky a šířky lebeční báze žen není statisticky významně menší než 0. Mezi výškou lebky a šířkou lebeční báze neexistuje statisticky významná nepřímá závislost. Interpretací výběrového korelačního koeficientu můžeme stanovit, že mezi oběma znaky existuje nízký stupeň nepřímé lineární závislosti (pi = —0.1713), který není statisticky významný. Ke stejnému závěru jsme dospěli také v příkladu 25. ★ 79 7.7 Test o parametru p alternativního rozdělení Nechť Xi,... Xn je náhodný výběr sledující nastání úspěchu (Xi = 1), nebo nastání neúspěchu (Xi = 0) v i-tém náhodném pokusu, i = 1,...,N. Náhodný výběr Xi,... X^ potom pochází z alternativního rozdělení, tj. X ~ Alt(p), kde p je pravděpodobnost nastání úspěchu v jednom náhodném pokusu. Na hladině významnosti a = 0.05 testujeme jednu z následujících tří hypotéz oproti příslušné alternativní hypotéze. H: p = po oproti Hn :p^po (oboustranná alt.) Ho'i : p < po oproti H12 : p > po (pravostranná alt.) H03 : p > po oproti H13 : p < po (levostranná alt.) Test nazýváme testem o pravděpodobnosti p. Testovací statistika má tvar M — po Zw = (7.6) . /po(l-po) V N kde M = ^2^=1 X{, kde Xi nabývá hodnot 0 nebo 1, je výběrový průměr, A" je rozsah náhodného výběru a po je konstanta z nulové hypotézy. Testovací statistika Zw pochází asymptoticky ze standardizovaného normálního rozdělení, tj. Zw= Mzgg_a ^(0,1). / po(l-po) iV To znamená, že pro malý rozsah náhodného výběru A" nemusí mít rozdělení statistiky Zyy charakter standardizovaného normálního rozdělení. To je ale problém, neboť testování kritickým oborem, intervalem spolehlivosti i p-hodnotou je založeno na předpokladu, že Zyy má charakter standardizovaného normálního rozdělení. Proto pro malý rozsah náhodného výběru nemůžeme statistiku Zyy k testování nulové hypotézy použít, neboť závěry takového testování by mohly být mylné. S rostoucím rozsahem náhodného výběru A" se však rozdělení statistiky Zyy čím dál více blíží ke standardizovanému normálnímu rozdělení, získává tak všechny jeho vlastnosti a závěry testování se stávají spolehlivě správnými. Zda máme dostatečný počet pozorování k provedení testu o pravděpodobnosti p prověříme podmínkou dobré aproximace. Ta má tvar A^0(l-Po)>9 (7.7) a pokud je splněna, můžeme test o pravděpodobnosti p použít, aniž bychom se vystavili riziku zavádějících výsledků testování. Pokud by však podmínka dobré aproximace nebyla splněna, nemůžeme test použít, dokud nerozšíříme náš datový soubor o další pozorování a nezvýšíme tak rozsah náhodného výběru A^. Poznámka: Problému s nedostatkem pozorování při použití testu o pravděpodobnosti p se můžeme vyvarovat, pokud si ve fázi plánování experimentu spočítáme minimální potřebný rozsah náhodného výběru N.Ve fázi sběru dat si potom již snadno ohlídáme, aby náš datový soubor obsahoval potřebný počet pozorování, ideálně s nějakou rezervou. K výpočtu minimálního rozsahu náhodného výběru potřebujeme znát pouze předpokládanou hodnotu pravděpodobnosti po (viz příklady 7.25 a 7.26). Kritický obor podle zvolené alternativní hypotézy má tvar Hu-.p^po W = (-00; ua/2) U (u1_a/2; 00) H12 ■ P > Po W = ; 00) Hiz-P Po (d, h) = (d, 1) = (0,h) = Poznámka: Protože parametr p značí pravděppodobnost úspěchu v jednom pokusu, platí, že p G (0; 1), a tedy horní hranice levostranného intervalu spolehlivosti je 1. Analogicky dolní hranice pravostranného Waldova empirického intervalu spolehlivosti je 0. p-hodnota má v závislosti na zvolené alternativní hypotéze jeden z následujících tvarú Hu ■ P 7^ Po p-hodnota = 2min{Pr(Zw < zw), Pľ(Zw > zw)} Hv2 : p > po p-hodnota = Pľ(Zw > zw) = 1 — Pľ(Zw < zw) H13 : p < po p-hodnota = Yľ{Zw < kde Zw je náhodná veličina, zyy je realizace testovací statistiky Zyy (viz vzorec 7.6), tedy konkrétní číslo, a Pľ(Zy\r < zw) je distribuční funkce standardizovaného normálního rozdělení, jejíž hodnotu získáme pomocí a implementované funkce pnorm(). 81 Příklad 7.21. Test o parametru p alternativního rozdělení Mějme datový soubor 25-one-sample-probability-dermatoglyphs.txt obsahující údaje o frekvenci výskytu dermatogly-fického vzoru smyčka na prstech 235 jedinců populace z Bagathů z Araku Valley (viz sekce ??). Současně máme k dispozici hodnotu pravděpodobnosti výskytu dermatoglyfického vzoru smyčka u jedinců z populace Lambadis (Pm = 0.5618, pf = 0.6233). Na hladině významnosti a = 0.05 zjistěte, zda existuje rozdíl mezi frekvencemi výskytu dermatoglyfického vzoru smyčka u mužů bagathské populace z Araku Valley a mužů z populace Lambadis. Řešení příkladu 7.21 Příkazem read.delim() načteme datový soubor, přičemž nastavením argumentu row.names = 1 specifikujeme, že první sloupec tabulky má být zvolen jako záhlaví řádků. Pomocí funkce sum() zjistíme celkový počet všech pozorování. Dále, aplikováním funkce FUN = sum na sloupce (MARGIN = 2) tabulky data prostřednictvím příkazu apply() zjistíme počet údajů pro muže a pro ženy. 447 (data <- read.delim('00-Data\\25-one-sample-probability-dermatoglyphs.txt', 448 row.names = 1)) m f whorl 1053 880 loop 1246 1349 arch 51 121 449 450 451 452 453 sum(data) # 4700 454 apply(data, MARGIN = 2, FUN = sum) # m 2350 # f 2350 Z tabulky vidíme, že z celkového počtu 4 700 otisků patří 2 350 otisků mužům, čemuž odpovídá 10 otisků prstů na jednoho jedince mužského pohlaví. Z celkového počtu 2 350 otisků byl na 1246 otiscích rozpoznán vzor smyčka a na zbylých 1104 otiscích byl rozeznán jiný vzor než smyčka (tj. obloučeknebo vír). Rozsah náhodného výběru TV = 2350. Naším úkolem je porovnat frekvenci výskytu dermatoglyfického vzoru smyčka dvou indických populací. U bagathské populace máme k dispozici počet úspěchů, tj. počet výskytů vzoru smyčka na 2 350 prstech. Náhodná veličina X popisující frekvenci výskytu vzorů smyčka u mužů bagathské poulace tedy pochází z alternativního rozdělení, tj. X ~ Alt(p), kde p je pravděpodobnost nastání úspěchu, tedy pravděpodonost výskytu vzoru smyčka. Druhá, populace z Lambadis je reprezentována pouze pravděpodobností (pm = 0.5618). Řešení příkladu vede na situaci, kdy pravděpodobnost p porovnáváme s konstantou 0.5618, tedy na jednovýběrový test o parametru p alternativního rozdělení. K použití tohoto testu je nejprve potřeba ověřit podmínku dobré aproximace pro náhodný výběr mužů bagathské populace, což znamená ověřit, zda platí Npo(l — po) > 5, kde po = 0.5618. Np0(l-p0) = 2350 x 0.5618 x (1 - 0.5618) = 2350 x 0.5618 x 0.4382 = 578.5248. Jelikož 578.5248 > 5, je podmínka dobré aproximace pro muže bagathské populace splněna. 455 N <- 2350 456 x <- 1246 457 pO <- 0.5618 458 N*p0*(l-p0) # 578.5248 Protože je podmínka dobré aproximace pro muže bagathské populace splněna, můžeme se zaměřit na otázku ze zadání. Naším úkolem je zjistit, zda existuje rozdíl mezi frekvencemi výskytu dermatoglyfického vzoru smyčka u mužů bagathské populace z Araku Valley a mužů z populace Lambadis. Toto tvrzení je zněním alternativní hypotézy, neboť rozdíl implikuje nerovnost a nerovnost je vždy součástí alternativní hypotézy. Zbývá dodefinovat nulovou hypotézu. Proces testování provedeme v posloupnosti šesti kroků. 1. Stanovení hypotéz • slovní formulace nulové a alternativní hypotézy Hq : Frekvence výskytu dermatoglyfického vzoru smyčka u mužů bagahtské populace a populace Lambadis 82 jsou shodné. Hi : Frekvence výskytu derrnatoglyfického vzoru smyčka u mužů bagahtské populace a populace Lambadis nejsou shodné. • matematická formulace nulové a alternativní hypotézy Hq : p = po, kde po = 0.5618 H\ : p 7^ Po, kde po = 0.5618 (oboustranná alternativa) 2. Volba hladiny významnosti • Hladinu významnosti volíme v souladu se zadáním a 3. Testování kritickým oborem • Testovací statistika 0.05. w M-po po(l-po) JV 0.5302128 - 0.5618 0.5618(1-0.5618) 2350 -0.0315872 0.5618x0.4382 2350 -0.0315872 ^0.0001047578 -0.0315872 0.01023512 -3.086158 -3.08616 459 alpha <- 0.05 460 m <- x / N #0.5302128 461 zw <- (m - pO) / (sqrt(pO * (1 - pO) / N)) # -3.08616 • Kritický obor W = (-00 ; ua/2) U («i_q/2 ; oo) = (-oo ; «0.05/2) U (mi_o.o5/2 ; 00) = (-00 ; m0.025) U («0.975 ; 00) = (-00 ; -1.9560) U (1.9560 ; 00) 462 qnorm(alpha / 2) # -1.959964 463 qnormCl - alpha / 2) # 1.959964 • Závěr testování Protože realizace testovací statistiky zw = zamítáme na hladině významnosti a = 0.05. 4. Testování intervalem spolehlivosti -3.08616 náleží do kritického oboru, tj. Zyy € W, H0 83 • Interval spolehlivosti M(l-M) . „ /M(l-M) (d,h)=[M- \ —^—-V-«/2 ; M N V N -u, a/2 ,0.5302128(1 - 0.5302128) /0.5302128(1 - 0.5302128) 0.5302128 - \l-y—--«1-0.05/2; 0.5302128 - ^-y—-V05/2 „ ,„™^n , 0.5302128 x 0.4697872 „ /0.5302128 x 0.4697872 0.5302128 - \/-—-«0.975 ; 0.5302128 - ^-—-u0.025 0.5302128 - ^0.0001059945 x 1.959964; 0.5302128 - ^0.0001059945 x (-1.959964) = (0.5302128 - 0.01029536 x 1.959964; 0.5302128 - 0.01029536 x (-1.959964)) = (0.5100343; 0.5503913) 464 dh <- m - sqrt (m * (1 - m) / N) * qnorm(l - alpha / 2) # 0.5100342 465 hh <- m - sqrt (m * (1 - m) / N) * qnorm (alpha / 2) # 0.5503913 • Závěr testování Protože po = 0.5618 nenáleží do Waldova 95% empirického oboustranného intervalu spolehlivosti, tj. Po = 0.5618 ^ IS, Hq zamítáme na hladině významnosti a = 0.05. 5. Testování p-hodnotou • p-hodnota p-hodnota = 2min{Pr(ZvK < zw), Pr(Zw > zw)} = 2mm{Pľ(Zw < zw), 1 - Pr(Zw < zw)} = 2min{Pr(ZvK < -3.08616), 1 - Pr(Zw < -3.08616)} = 2min{0.001013798, 0.9989862} = 2 x 0.001013798 = 0.002027595 = 0.0020276 466 p.val <- 2 * min (pnorm(zw), 1 - pnorm(zw)) # 0.002027595 • Závěr testování Protože p-hodnota = 0.0020276 je menší než a = 0.05, Hq zamítáme na hladině významnosti a = 0.05. 6. Grafická vizualizace výsledků testování Výsledek testování vizualizujeme pomocí sloupcového diagramu relativních četností, který vygenerujeme příkazem rel.barplot(). Funkce rel.barplot() je implementována v RSkriptu Sbirka-AS-l-2018-funkce.R. Před použitím samotné funkce je tedy potřeba načíst RSkript příkazem source(). 467 source ( ' Sbirka - AS -1-2018 - f unkce . R ' ) 468 par(mar = c(5, 4, 1, 1), family = 'Times') 469 rel.barplot(c(x, N - x), col = c('orange2', 'darkseagreen3'), 470 border = 'goldenrod4' , 471 names = c('smyčka', 'jiny (oblouček, vir)'), 472 density = 60, main = '', 473 xlab = 'dermatoglyficky vzor', ylab = 'relativní četnost') 7. Interpretace výsledků: Na základě všech tří způsobů testování zamítáme hypotézu Hq. Mezi frekvencí výskytu dermatoglyfického znaku smyčka u mužů baghatské populace z Araku Valley a frekvencí výskytu vzoru smyčka u mužů z populace Lambadis existuje statisticky významný rozdíl. 84 1.0 -, 0.9 0.8 0.7 -H 0.6 -I 0.5 0.4 0.3 -H 0.2 -| 0.1 0.0 1104; 46.98% 1246; 53.02% ■ jiny (oblouček, vir) ■ smyčka dermatoglyficky vzor Obrázek 30: Sloupcový diagram relativních četností zastoupení dermatoglyfického vzoru smyčka v populaci ba-gathských mužů z Araku Valley ★ 85 Příklad 7.22. Test o parametru p alternativního rozdělení Mějme k dispozici údaje o frekvenci výskytu epigenetického znaku sutura metopica (binomické proměnná) na lebkách Ainů z ostrova Hokkaido (viz datový soubor 09-one-sample-probability-sutmet.txt a jeho popis v sekci ??). Dále mějme k dispozici údaje o výskytu epigenetického znaku sutura metopica na lebkách jedinců ze současné japonské populace (pjaP = 0.091). Na hladině významnosti a = 0.01 zjistěte, zda je frekvence výskytu epigenetického znaku sutura metopica u populace Ainů statisticky významně nižší než u současné japonské populace. Řešení příkladu 7.21 Příkazem read.delim() načteme datový soubor, přičemž nastavením argumentu row.names = 1 specifikujeme, že první sloupec tabulky má být zvolen jako záhlaví řádků. 474 (data <- read.delim('00-Data/09-one-sample-probability-sutmet.txt', 475 row.names = 1)) n met 476 Ain 184 6 477 Z tabulky vidíme, že z celkového počtu 184 lebek populace Ainů byl zaznamenán výskyt epigenetického znaku sutura metopica) na 6 lebkách. Rozsah náhodného výběru lebek Ainské populace N = 184. Naším úkolem je porovnat frekvenci výskytu epigenetického znaku sutura metopica dvou japonských populací. U populace Ainů máme k dispozici počet úspěchů, tj. počet výskytů epigenetického znaku sutura metopica u 184 lebek. Náhodná veličina X popisující frekvenci výskytu znaku sutura metopica u mužů populace Ainů tedy pochází z alternativního rozdělení, tj. X ~ Alt(p), kde p je pravděpodobnost nastání úspěchu, tedy pravděpodonost výskytu znaku sutura metopica. Současná japonské populace je oproti tomu reprezentována pouze pravděpodobností (pjaP = 0.091). Řešení příkladu vede na situaci, kdy pravděpodobnost p porovnáváme s konstantou 0.091, tedy na jednovýběrový test o parametru p alternativního rozdělení. Před použitím tohoto testu nejprve ověříme podmínku dobré aproximace pro náhodný výběr mužů populace Ainů, tj. A^po(l — Po) > 5, kde po = 0.091. Np0(l - po) = 184 x 0.091 x (1 - 0.091) = 184 x 0.091 x 0.909 = 15.2203. 478 N <- 184 479 x <- 6 480 pO <- 0.091 481 N * pO * (1 - pO) # 15.2203 Jelikož číslo 15.2203 > 5, je podmínka dobré aproximace pro populaci Ainů splněna a my se můžeme zaměřit na řešení otázky ze zadání. Zde poznamenejme, že v zadání příkladu není zmínka o znění nulové hypotézy, pouze o záměru zjistit, zda je frekvence výskytu znaku sutura metopica u populace Ainů nižší než u současké japonské populace. Toto tedy bude znění alternativní hypotézy, zatímco nulovou hypotézu musíme vhodně dodefinovat. 1. Stanovení hypotéz • slovní formulace nulové a alternativní hypotézy H0 : Frekvence výskytu epigenetického znaku sutura metopica u populace Ainů je vyšší nebo rovna frekvenci znaku sutura metopica u současné japonské populace. Hi : Frekvence výskytu epigenetického znaku sutura metopica u populace Ainů je nižší než u současné japonské populace. • matematická formulace nulové a alternativní hypotézy H0 :p>Po, kde po =0.091 Hi:p< po, kde p0 = 0.091 (levostranná alternativa) 2. Volba hladiny významnosti • Hladina významnosti a = 0.01 (viz zadání příkladu). 86 3. Testování kritickým oborem • Testovací statistika M-po M(l-M) iV 0.0326087 - 0.091 0.091(1-0.091) 184 -0.0583913 0.082719 184 -0.0583913 ^0.0004495598 -0.0583913 0.02120283 -2.753939 = -2.75394 482 alpha <- 0.01 483 m <- x / N # 0.0326087 484 zw <- (m - p0) / (sqrt(p0 * (1 - pO) / N)) # -2.75394 • Kritický obor W = (—oo ; ua) = (-oo; M0.oi) = (-oo; -2.3263) 485 qnorm(alpha) # -2.326348 • Závěr testování Protože realizace testovací statistiky zyy = —2.75394 náleží do kritického oboru, tj. zyy e W, Hq zamítáme na hladině významnosti a = 0.01. 4. Testování intervalem spolehlivosti • Interval spolehlivosti (-l,h)= [0;m-\/ KN >uc , 0.0326087(1 - 0.0326087) 0 ; 0.0326087 - \/-K—-^«0.oi 0 ; 0.0326087 - ^0.0001714422 x (-2.326348) (0 ; 0.0326087 - 0.01309359 x (-2.326348)) (0; 0.06306895) = (0; 0.063069) 486 HH <- m - sqrt (m * (1 - m) / N) * qnorm (alpha) # 0.06306895 87 • Závěr testování Protože po = 0.091 nenáleží do Waldova 99% empirického pravostranného intervalu spolehlivosti, tj. Po = 0.091 ^ IS, Hq zamítáme na hladině významnosti a = 0.01. 5. Testování p-hodnotou • p-hodnota p-hodnota = Pr(Zyy < Zyy) = Pr(Zw < -2.326348) = 0.002944129 = 0.002944 487 p.val <- pnorm(zw) # 0.002944129 • Závěr testování Protože p-hodnota = 0.002944 je menší než a = 0.01, Hq zamítáme na hladině významnosti a = 0.01. 6. Grafická vizualizace výsledků testování Výsledek testování vizualizujeme pomocí sloupcového diagramu relativních četností, který vygenerujeme příkazem rel.barplot(). 488 source ( ' Sbirka - AS -1-2018 - f unkce . R ' ) 489 par(mar = c(l, 4, 1, 1), family = 'Times') 490 rel.barplot(c(N - 6, 6), col = c('goldenrodl' , 'firebrickl ' ) , 491 border = 'goldenrod4' , 492 names = c('vyskyt s.metopica' , 'absence s.metopica') , 493 density = 60, main = ' ' , 494 xlab = '', ylab = 'relativní četnost') 1.0 0.9 H 0.8 0.7 H f 0.6 O 'S 0-5 > 'M 0.4 H 0.3 0.2 H 0.1 0.0 -1 ■ absence s.metopica □ výskyt s.metopica Obrázek 31: Sloupcový diagram relativních četností zastoupení epigenetického znaku sutura metopica v populaci Ainů 7. Interpretace výsledků: Na základě všech tří způsobů testování zamítáme hypotézu Hq. Frekvence výskytu epigenetického znaku sutura metopica u populace Ainů je statisticky významně menší než u současné japonské populace. 88 Příklad 7.23. Test o parametru p alternativního rozdělení Pravděpodobnost narození chlapce je o něco málo vyšší, než pravděpodobnost narození děvčete (obecný poměr je 51:49). V datovém souboru 08-one-sample-probability-sexratio.txt jsou uvedeny údaje o pohlaví novorozenců narozených během jednoho roku v jedné krajské nemocnici (viz sekce ??). Potvrzují nasbírané údaje tvrzení, že se v tomto okresu rodí statisticky významně více chlapců než děvčat? Hladinu významnosti zvolte a = 0.05. Řešení příkladu 7.23 Příkazem read.delim() načteme datový soubor. Pomocí funkce head() vypíšeme první čtyři řádky z načtené tabulky. Tabulka obsahuje pouze jeden sloupec sex obsahující údaje o binární proměnné pohlaví s kódováním m = muž a f = žena. Pomocí příkazu table() zjistíme, kolik pozorování přísluší každé variantě znaku sex. 495 data <- read.delim('00-Data\\08-one-sample-probability-sexratio.txt') 496 head(data, n = 4) 497 498 499 500 501 502 table(data) data 503 f m 504 674 729 505 V krajské nemocnici se v průběhu jednoho roku narodilo celkem 729 chlapců a 674 děvčat. Rozsah náhodného výběru N = 1403. Naším úkolem je porovnat frekvenci výskytu narození chlapců s konstantou 0.5. Ta reprezentuje 50% šanci na narození chlapce a 50% šanci na narození děvčete. K dispozici máme počet úspěchů, tj. počet narozených chlapců z 1403 narozených jedinců. Náhodná veličina X popisující narození chlapce tedy pochází z alternativního rozdělení, tj. X ~ Alt(p), kde p je pravděpodobnost nastání úspěchu, tedy pravděpodonost narození chlapce. Řešení příkladu vede na situaci, kdy pravděpodobnost p porovnáváme s konstantou 0.5, tedy na jednovýběrový test o parametru p alternativního rozdělení. K použití tohoto testu je nejprve potřeba ověřit podmínku dobré aproximace, tj. ověřit, zda platí Npo(l — po) > 5, kde po = 0.5. Np0(l-p0) = 1403 x 0.5 x (1 - 0.5) = 1403 x 0.5 x 0.5 = 350.75. Jelikož 350.75 > 5, je podmínka dobré aproximace splněna. 506 N <- 1403 507 x <- 729 508 pO <- 0.5 509 N * pO * (1 - pO) # 350.75 Protože podmínka dobré aproximace je splněna, můžeme se zaměřit na otázku ze zadání. Naším úkolem je zjistit, zda se ve sledovaném okrese rodí statisticky významně více chlapců než děvčat. Toto tvrzení odpovídá hypotéze, že frekvence narození chlapců je větší 0.5 a je zněním alternativní hypotézy, neboť v zadání není zmínka, že máme testovat hypotézu nebo nulovou hypotézu. Zbývá tedy dodefinovat znění Hq. 1. Stanovení hypotéz • slovní formulace nulové a alternativní hypotézy Hq : Frekvence výskytu narození chlapce je menší nebo rovna 0.5. Hi : Frekvence výskytu narození chlapce je větší než 0.5. 89 • matematická formulace nulové a alternativní hypotézy Hq : p < po, kde po = 0.5 Hi : p > po, kde po = 0.5 (pravostranná alternativa) 2. Volba hladiny významnosti • Hladinu významnosti volíme v souladu se zadáním a = 0.05. 3. Testování kritickým oborem • Testovací statistika _ M-po Zjw — —, V iv _ 0.5196009 - 0.5 /p.5(1-0.5) V 1403 _ 0.0196009 / D.2Ô V 1403 _ 0.0196009 ~~ ^0.0001047571 0.0196009 _ 0.01334877 = 1.468367 = 1.4684 510 alpha <- 0.05 511 m <- x / N # 0.5196009 512 zw <- (m - pO) / (sqrt(pO * (1 - pO) / N)) # 1.468364 • Kritický obor W = (ui-a ; oo) = (mi-o.05 ; oo) = («0.95; oo) = (1.6449; oo) 513 qnorm(l - alpha) # 1.644854 • Závěr testování Protože realizace testovací statistiky zw = 1.4684 nenáleží do kritického oboru, tj. zw ^ w, Hq nezamítáme na hladině významnosti a = 0.05. 4. Testování intervalem spolehlivosti 90 • Interval spolehlivosti (d, h)=(^m- \jm(1n M)«i-a/2; = (0.5196009 - ^0.0001779158 x 1.644854; 1 = (0.5196009 - 0.01333851 x 1.644854; 1) = (0.497661; 1) M0.95 ; i «1-0.05; i ) ) ) 514 dh <- m - sqrt(m * (1 - m) / N) * qnorm(l - alpha) # 0.497661 • Závěr testování Protože po = 0-5 náleží do Waldova 95% empirického levostranného intervalu spolehlivosti, tj. po = 0.5 G IS, Hq nezamítáme na hladině významnosti a = 0.05. 5. Testování p-hodnotou 515 p.val <- 1 - pnorm(zw) # 0.07100263 • Závěr testování Protože p-hodnota = 0.07100263 je větší než a = 0.05, Hq nezamítáme na hladině významnosti a = 0.05. 6. Grafická vizualizace výsledků testování Výsledek testování vizualizujeme pomocí sloupcového diagramu relativních četností. 516 source ( ' Sbirka - AS -1-2018 - f unkce . R ' ) 517 par(mar = c(4, 4, 1, 1), family = 'Times') 518 rel.barplot(c(x, N - x), col = c('dodgerblue', 'tomato'), 519 border = 'goldenrod4 ' , 520 names = c('chlapci', 'divky'), 521 density = 40, main = '', 522 xlab = 'pohlavi novorozenců', ylab = 'relativní četnost') 7. Interpretace výsledků: Na základě všech tří způsobů testování nezamítáme hypotézu Hq. Nasbírané údaje nepotvrzují, že by se ve sledovaném kraji rodilo statisticky významně více chlapců než děvčat. • p-hodnota p-hodnota = 1 - Pr(Zw < zw)} = 1 - Pr(Zw < 1.468364)} = 0.07100263 = 0.0710026 ★ 91 1.0 -i 0.9 - 0.8 - 0.7 - o a 0.6 - o '2 0.5 - J3 0.4 - 0.3 - 0.2 - 0.1 - 0.0 - divky chlapci pohlaví novorozenců Obrázek 32: Sloupcový diagram relativních četností zastoupení narození chlapce a děvčete v krajské nemocnici během jednoho roku 92 Příklad 7.24. Test o parametru p alternativního rozdělení Mějme k dispozici údaje o frekvenci výskytu epigenetického znaku sutura metopica (binomické proměnná) na lebkách jedinců z Anatolské populace z oblasti Erzurum. Z celkového počtu 47 jedinců byl zaznamenán výskyt tohoto znaku u 7 jedinců. Dále mějme k dispozici údaje o výskytu epigenetického znaku sutura metopica na lebkách jedinců z moderní Anatolské populace (pa = 0.093). Na hladině významnosti a = 0.10 testujte hypotézu, že frekvence výskytu epigenetického znaku sutura metopica u Anatolské populace z oblasti Erzurum je menší nebo rovna frekvenci výskytu epigenetického znaku sutura metopica u moderní Anatolské populace. Řešení příkladu 7.23 Nejprve si do proměnné N vložíme celkový počet jedinců (rozsah náhodného výběru TV = 47) a do proměnné x vložíme počet úspěchů, tj. počet výskytů epigenetického znaku sutura metopica na 47 zkoumaných lebkách (x = 7). Náhodná veličina X popisující počet výskytů epigenetického znaku sutura metopica pochází z Alternativního rozdělení, tj. X ~ Alt(p), kde p je pravděpodobnost úspěchu, tj. pravděodobnost výskytu epigenetického znaku sutura metopica. 523 N <- 47 524 x <- 7 Naším úkolem je porovnat frekvenci výskytu epigenetického znaku sutura metopica u dvou Anatolských populací. U populace z oblasti Erzurum máme k dispozici počet úspěchů. Naopak u moderní Anatolské ppopulace máme k dispozici pouze pravděpodobnost výskytu (pa = 0.093). Řešení příkladu vede na situaci, kdy pravděpodobnost p porovnáváme s konstantou 0.093, tedy na jednovýběrový test o parametru p alternativního rozdělení. Před použitím testu nejprve ověříme podmínku dobré aproximace, tj. zda Npo(l — po) > 5, kde po = 0.093. Np0(l -po) = 47 x 0.093 x (1 - 0.093) = 47 x 0.093 x 0.907 = 3.9645. Jelikož 3.9645 < 5, podmínka dobré aproximace není splněna a k otestování hypotézy ze zadání není tedy možné použít test o parametru p alternativního rozdělení. Poznámka: Protože rozsah náhodného výběru není dostatečně velký, nemůžeme k testování hypotézy ze zadání použít parametrický test. V opačném případě by získané výsledky nebyly spolehlivé. Jedinou možností, jak získat spolehlivé výsledky je rozšířit datový soubor o další pozorování. Tomuto procesu bychom se vyhnuli, kdybychom v počáteční fázi plánování experimentu spočítali, jak minimálně velký rozsah náhodného výběru je potřeba získat, aby byla podmínka dobré aproximace splněna a výsledky stanovně za základě testu o parametru p byly spolehlivé (viz příklady 7.25 a 7.26). 93 Příklad 7.25. Test o parametru p alternativního rozdělení Mějme k dispozici údaje o frekvenci výskytu Polydaktylie u jedinců Československé populace z roku 1966 (pcs = 0.0005, ./Vcs = 20 074). Dále předpokládejme, že náhodný výběr X popisující výskyt Polydaktylie u jedinců Polské populace pochází z Alternativního rozdělení, tj. X ~ Alt(p), kde p je pravděpodobnost výskytu Polydaktylie u jedinců Polské populace. Vypočítejte, jak velký minimální rozsah náhodného výběru je potřeba k otestování hypotézy o shodě frekvence výskytu polydaktilie u jedinců Československé a Polské populace. Řešení příkladu 7.25 Naším úkolem je porovnat frekvenci výskytu Polydaktylie u Československé a Polské populace, přičemž momentálně jsme ve fázi plánování experimentu. Zatímco u Polské populace budeme mít po nasbírání dat k dispozici údaje o počtu úspěchů, tj. o počtu výskytů polydaktilie u Československé populace máme k dispozici údaj o výskytu Polydaktylie z roku 1966 (p = 0.0005). Celá studie spěje k situaci, kdy budeme porovnávat pravděpodobnost p s konstantou 0.0005, tedy na jednovýběrový test o parametru p alternativního rozdělení. K tomu, abychom tento test mohli použít, potřebujeme, aby byla splněna podmínka dobré aproximace, tj. aby A^po(l — Po) > 5, kde po = 0.0005. Z nerovnice si tedy vyjádříme a následně dopočítáme hodnotu N. Np0(l-po) > 5 Po(l - Po) 0.0005(1 - 0.0005) 0.0005 x 0.9995 N > 10 005 525 pO <- 0.0005 526 5 / (pO * (1 - pO)) # 10005 Aby byla splněna podmínka dobré aproximace, je potřeba získat jako základ k otestování nulové hypotézy ze zadání náhodný výběr o rozsahu alespoň 10 006 jedinců. 94 Příklad 7.26. Test o parametru p alternativního rozdělení Mějme k dispozici údaje o frekvenci výskytu dermatoglyfického vzoru wrna palci pravé ruky u mužů České populace (pcs = 0.533). Dále předpokládejme, že náhodný výběr X popisující výskyt dermatoglyfického vzoru nrna palci pravé ruky u mužů Slovenské populace pochází z Alternativního rozdělení, tj. X ~ Alt(p), kde p je pravděpodobnost výskytu dermatoglyfického vzoru vír na palci pravé ruky u mužů Slovenské populace. Vypočítejte, jak velký minimální rozsah náhodného výběru je potřeba k otestování hypotézy, že frekvence výskytu vzoru vír na palci pravé ruky mužů Slovenské populace je větší nebo rovna frekvenci výskytu vzoru vír na palci pravé ruky mužů České populace. Řešení příkladu 7.26 Naším úkolem je porovnat frekvenci výskytu vzoru vír na palci pravé ruky mužů České a Slovenské populace, přičemž jsme teprve ve fázi plánování experimentu. Zatímco u Slovenské populace budeme mít po nasbírání dat disponovat údaji o počtu úspěchů, tj. o počtu výskytů dermatoglifického vzoru vír na palci pravé ruky u mužů Slovenské populace, u mužů České populace máme k dispozici pouze pravděpodobnost výskytu vzoru vír na palci pravé ruky (p = 0.533). Celá studie spěje k případu porovnávání pravděpodobnosti p s konstantou 0.533, tedy na jednovýběrový test o parametru p alternativního rozdělení. K použití tohoto testu, potřebujeme splnit podmínka dobré aproximace, tj. zajistit, aby Npo(l — po) > 5, kde po = 0.533. Np0(l -po) > 5 Po(l - Po) 0.533(1 - 0.533) 0.533 x 0.467 N > 20.0875 527 pO <- 0.533 528 5 / (pO * (1 - pO)) # 20.0875 Aby byla splněna podmínka dobré aproximace, je potřeba získat jako základ k otestování nulové hypotézy ze zadání náhodný výběr o rozsahu alespoň 21 jedinců. Poznámka: Z příkladů 7.25 a 7.26 vidíme, že rozsah náhodného výběru závisí pouze na očekávané pravděpodobnosti Po z nulové hypotézy. Čím je po blíže k 0 nebo 1, tím větší počet pozorování bude potřeba k zajištění podmínky dobré aproximace. Naopak, čím bude hodnota po blíže k číslu 0.5, tím menší rozsah náhodného výběru je potřebný ke splnění podmínky dobré aproximace. 95