8 Testování hypotéz • Datový soubor = Náhodný výběr —> stanovíme předpoklady —> ověřujeme, zda platí; — předpoklady * o charakteristikách: /i, a2, a, ... * o rozdělení: normální, poissonovo, exponenciální,... * o nezávislosti dvou náh. výběrů... • REÁLNÁ DATA —> jsou variabilní —> dva náhodné výběry zkoumající totéž —> výsledek nikdy nevyjde stejný • zkoumáme, zda se vzorky liší pouze variabilitou, nebo je skutečně rozdíl v hodnotách parametru Postup testování hypotéz: 1. Formulace problému ... přesná, jednoznačná 2. stanovení nulové hypotézy Hq • hypotéza o níž test rozhodne, zda se zamítne, nebo ne • 1 náhodný výběr a publikovaná hodnota c; Hq : fi = c 3. stanovení alternativní hypotézy H\ • alt. hypotézu přijímáme, pokud Hq zamítáme 4. volba hladiny významnosti a • pst(riziko), že Hq zamítneme, když platí - snažíme se tuto hodnotu snížit na minimum 5. provedení měření 6. Testování Hq (tři různé způsoby): • Kritický obor • Interval spolehlivosti • p-hodnot a 7. rozhodnutí o zamítnutí/nezamítnutí Hq 8. interpretace výsledků H\ : fii 7^ c (oboustranná alt.); H\ : fi± < c (levostranná alt.); H\ : fii > c (pravostranná alt.). 1 8.1 Testování pomocí kritického oboru • vybereme vhodnou testovací statistiku To • vypočítáme hodnotu testovací statistiky íq • stanovíme kritický obor W: — oboustranná alt.: W = (Tmin;Ka/2) U (K1_a/2; Tmax) — pravostranná alt.: W = (K\-a;Tmax) — levostranná alt.: W = (Tmin\ K a) • Pokud íq £ W, Hq zamítáme na hladině význ. a. 8.2 Testování pomocí IS: • Testujeme hypotézu Hq : 6 = c oproti H\ : 0 7^ c {0 < c; 6 > c) • Sestrojíme 100(1 - a)% IS: — oboustranná alt. —> oboustranný IS — levostranná alt. —> pravostranný IS — pravostranná alt. —> levostranný IS • pokud c G IS, Hq nezamítáme na hladině význ. a. Testování pomocí p-hodnoty • p-hodnota: — pro oboustrannou alt.: p = 2min{P(To < to); P (To > to)} — pro levostrannou alt.: p = P (To < to) — pro pravostrannou alt.: p = P (To > to) = 1 — P (To < to) • Je-li p < a, Hq zamítáme na hladině význ. a. 2 Příklad 8.1. Víme, že výška hochů ve věku 9.5 až 10 let má normální rozdělení s neznámou střední hodnotou fi a známým rozptylem a2 = 39.112 cm2. Dětský lékař náhodně vybral 15 hochů uvedeného věku, změřil je a vypočítal realizaci výběrového průměru m = 139.13 cm. Podle jeho názoru by výška hochů v tomto věku neměla přesáhnout 142 cm s pravděpodobností 0.95. Lze tvrzení lékaře akceptovat? Testujeme Hq : fi > 142 proti H\ : fi < 142 na hladině významnosti a = 0.05. a) Test provedeme pomocí kritického oboru. Pro úlohy o střední hodnotě normálního rozdělení při známém rozptylu používáme pivotovou statistiku tf = ^~JV(0,l). Testovací statistika bude mít tedy tvar 10 = ^^-^(0,1). Vypočítáme realizaci testového kritéria: 139.13- 142 t0 =-;-— = -1.7773. V39.112 15 sigma <- sqrt (39.112) n <- 15 m <- 139.13 c <- 142 alpha <- 0.05 # ad a) tO <- (m-c)/(sigma/sqrt(n)) qnorm(alpha) Stanovíme kritický obor: W £ (—oo,ua) = (—00,^0.05) = (—°°, — ^0.95} = (—00,—1.6449). Protože — 1.7773 £ W, nulovou hypotézu Hq zamítáme na hladině významnosti a = 0.05. Tvrzení lékaře lze tedy akceptovat s rizikem omylu 5 %. b) Test provedeme pomocí intervalu spolehlivosti. Meze 100(1 — a) % empirického pravostranného intervalu spolehlivosti pro střední hodnotu fi při známém rozptylu a2 jsou (—00, h) = (—00, m---=ua). \/n V našem případě dostáváme: V39.112 V39.112 h = 139.13 - u0 05 = 139.13 + ^_ 1.645 = 141.79. y/TE ' y/TE hh <- m-(sigma/sqrt(n))*qnorm(alpha) Protože 142 ^ (—00; 141.79), Hq zamítáme na hladině významnosti 0.05. c) Test provedeme pomocí p-hodnoty. v = Pr(T0 < t0) = $(-1.7773) = 0.0378 pval <- pnorm(tO) Jelikož 0.0378 < 0.05, nulovou hypotézu zamítáme na hladině významnosti 0.05. 3 Testování normality • Normalita = nepostradatelný předpoklad parametr, testů (jednovýběrových, párových, dvouvýběrových, •••) • Testování normality — Hq: Data pochází z normálního rozd. — H\ : Data nepochází z normálního rozd. • Testy normality — Shairo-Wilkův test shapiro.test() — Lillie-Forsův test lillie.test() [nortest] — Anderson-Darlingův test ad.test() [nortest] • výstup testů = p-hodnota: p > a —> Hq nezamítáme; p < a —> Hq zamítáme • grafické ověření normality: — Q-Q plot qqnorm a qqline. Párový test: • porovnání rozdílů párových součástí objektu, párových orgánů člověka • porovnání délky uší, výšky/šířky nadočnicového oblouku, zkoumání podobných rysů dvojčat apod. • Nechť (Xi, Yi)... (Xn, Yn) je náh. výběr z dvourozměrného norm. rozd., přičemž n > 2. Střední hodnota znaku X je pi, střední hodnota znaku Y je fi2- • Hq : /xi = p,2 fJ-i ~ Aí2 = 0 • Hi : m / /i2 /íi - /í2 / 0 • utvoříme rozdíly Z\ = X\ — Y±,..., Zn = Xn — Yn. • Zi,... Zn je náh. výběr z norm. rozdělení —> jednovýběrový test o /í, když a2 neznáme. 4