Kapitola 1.: Základní pojmy matematické statistiky Cíl kapitoly Po prostudování této kapitoly budete rozumět pojmu „náhodný výběr" znát vlastnosti důležitých statistik odvozených z náhodného výběru znát vlastnosti bodových a intervalových odhadu parametru a parametrických funkcí - umět formulovat nulovou a alternativní hypotézu o parametru či parametrické funkci znát tři způsoby, jak testovat nulovou hypotézu proti alternativní hypotéze na dané hladině významnosti schopni správně naplánovat pokus rozeznávat jednoduché, dvojné a mnohonásobné pozorování - v rámci dvojného pozorování rozlišovat dvouvýběrové a párové porovnávání - v rámci mnohonásobného pozorování rozlišovat mnohovýběrové a blokové porovnávání Časová zátěž Na prostudování této kapitoly a splnění úkolů s ní spojených budete potřebovat asi 10 hodin studia. 1.1. Motivace Při aplikaci metod popisné statistiky dospíváme pomocí zjištěných dat k závěrům, které se týkají pouze výběrového souboru. Naproti tomu matematická statistika nám umožňuje na základě znalosti náhodného výběru a statistik z něj odvozených (tj. např. výběrového průměru, výběrového rozptylu, výběrového koeficientu korelace, hodnoty výběrové distribuční funkce apod.) učinit závěry o parametrech nebo tvaru rozložení, z něhož daný náhodný výběr pochází. Často se jedná o bodové či intervalové odhady parametrů a parametrických funkcí a testování hypotéz o nich. Abychom mohli správně vyhodnotit výsledky pokusu, musí být pokus dobře naplánován. V závislosti na záměrech experimentátora rozeznáváme několik typů uspořádání pokusů: jednoduché pozorování (zkoumají se hodnoty náhodné veličiny pozorované za týchž podmínek), dvojné pozorování (zkoumá se rozdílnost hodnot náhodné veličiny pozorované za dvojích různých podmínek) a mnohonásobné pozorování (zkoumá se rozdílnost hodnot náhodné veličiny pozorované za r > 3 různých podmínek). Podle typu uspořádání pokusu pak volíme vhodnou statistickou metodu. V tomto textu probereme pouze ty nejjednodušší typy uspořádání pokusů. 1.2. Náhodný výběr a statistiky odvozené z náhodného výběru 1.2.1. Pojem náhodného výběru Nechť Xi, ..., Xn jsou stochasticky nezávislé náhodné veličiny, které mají všechny stejné rozložení L(ô ). Řekneme, že Xi, ..., Xn je náhodný výběr rozsahu n z rozložení L(ô ). (Číselné realizace xi, ..., xn náhodného výběru Xi, ..., Xn uspořádané do sloupcového vektoru představují datový soubor.) Nechť (Xi,Yi), ..., (Xn,Yn) jsou stochasticky nezávislé dvourozměrné náhodné vektory, které mají všechny stejné dvourozměrné rozložení L2(ô). Řekneme, že (Xi,Yi), ..., (Xn,Yn) je dvourozměrný náhodný výběr rozsahu n z dvourozměrného rozložení L2(ô ). (Číselné reali- 1 n Statistika S2 =-------yi(Xi ~M)2 výběrový rozptyl, n-ltf zace (xi,yi), ..., (xn,yn) náhodného výběru (Xi,Yi), ..., (Xn,Yn) uspořádané do matice typu 2xn představují dvourozměrný datový soubor.) Analogicky lze definovat p-rozměrný náhodný výběr rozsahu n z p-rozměrného rozložení Lp(ô). 1.2.2. Pojem statistiky, příklady důležitých statistik Libovolná funkce T = T(Xi, ..., Xn) náhodného výběru Xi, ..., Xn (resp. p-rozměrného náhodného výběru) se nazývá statistika. a) Nechť Xi, ..., Xn je náhodný výběr, n > 2. 1 n Statistika M = -YXi se nazývá výběrový průměr, 1 n I 1=1 Statistika S = v S2 výběrová směrodatná odchylka. Pro libovolné, ale pevně zvolené reálné číslo x je statistikou též hodnota výběrové distribuční funkce Fn(x) = -card{i;Xi 2,...,nr >2. Celkový rozsah je n = ^nj • Označme Ml3...,Mr výběrové j=i průměry a S, ,..., Sr výběrové rozptyly j ednotlivých výběrů. Nechť Cj,..., cr j sou reálné konstanty, aspoň jedna nenulová r Statistika ^ CjMj se nazývá lineární kombinace výběrových průměrů. i («,-!>;- Statistika S» =------------------ se nazývá vážený průměr výběrových rozptylů. n-r c) Nechť (Xi,Yi), ..., (Xn,Yn) je náhodný výběr z dvourozměrného rozložení. Označme M1=Í2Xi»M2=-ÉYi n i=i n i=1 1 n Statistika S12 =-------V (Xj - Mj \Y1 - M2) je výběrová kovariance, n - 1 i=i proSjSj ^0 0 jinak 1 »XrM, Y1-M2 statistika R12 = \ n -1 i=1 S: S2 výběrový koeficient korelace. (Číselné realizace m, s2, s, Si2, ri2 statistik M, S2, S, Si2, R12 odpovídají číselným charakteristikám znaků v popisné statistice, ale u rozptylu, směrodatné odchylky, kovariance a koeficientu korelace je multiplikativní konstanta-------, nikoli —Jak tomu bylo v popisné statistice.) n -1 n 1.3. Bodové a intervalové odhady parametrů a parametrických funkcí Vycházíme z náhodného výběru Xi, ..., Xn z rozložení L(ô ), které závisí na parametru ô . Množinu všech přípustných hodnot tohoto parametru označíme S. Parametr ô neznáme a chceme ho odhadnout pomocí daného náhodného výběru (případně chceme odhadnout nějakou parametrickou funkci h(ô )). Bodovým odhadem parametrické funkce h(ô) je statistika Tn = T(Xi, ..., Xn), která nabývá hodnot blízkých h(ô ), ať je hodnota parametru ô jakákoliv. Existují různé metody, jak konstruovat bodové odhady (např. metoda momentů či metoda maximální věrohodnosti, ale těmi se zde zabývat nebudeme) a také různé typy bodových odhadů. Omezíme se na odhady nestranné, asymptoticky nestranné a konzistentní. Intervalovým odhadem parametrické funkce h(ô ) rozumíme interval (D, H), jehož meze jsou statistiky D = D(Xi, ..., Xn), H = H(Xi, ..., Xn) a který s dostatečně velkou pravděpodobností pokrývá h(ô), ať je hodnota parametru ô jakákoliv. 1.3.1. Typy bodových odhadů Nechť Xi, ..., Xn je náhodný výběr z rozložení L(ô ), h(ô ) je parametrická funkce, T, Ti, T2, ...jsou statistiky. a) Řekneme, že statistika T je nestranným odhadem parametrické funkce h( ô), j estliže VSgS: E(T) = h(ô). (Význam nestrannosti spočívá v tom, že odhad T nesmí parametrickou funkci h(ô ) systematicky nadhodnocovat ani podhodnocovat. Není-li tato podmínka splněna, jde o vychýlený odhad.) b) Jsou-li Ti, T2 nestranné odhady téže parametrické funkce h(ô), pak řekneme, že Ti je lepší odhad než T2, jestliže VS g S : D(Ti) < D(T2). c) Posloupnost {Tn }"=1 se nazývá posloupnost asymptoticky nestranných odhadů parametrické funkce h( ô), jestliže V3eS:limE(Tn) = h(3). n—>co (Význam asymptotické nestrannosti spočívá v tom, že s rostoucím rozsahem výběru klesá vychýlení odhadu.) d) Posloupnost {Tn }"=1 se nazývá posloupnost konzistentních odhadů parametrické funkce h( ô), jestliže VS g SVs > 0 : lim P(jTn - h(S)| > s) = 0. (Význam konzistence spočívá v tom, že s rostoucím rozsahem výběru klesá pravděpodobnost, že odhad se bude realizovat daleko od parametrické funkce h(ô).) Lze dokázat, že z nestrannosti odhadu vyplývá jeho asymptotická nestrannost a z asymptotické nestrannosti vyplývá konzistence, pokud posloupnost rozptylů odhadu konverguje k nule. 1.3.2. Vlastnosti důležitých statistik a) Nechť Xi, ..., Xnje náhodný výběr z rozložení se střední hodnotou u, rozptylem c2 a distribuční funkcí O(x). Nechť n > 2 Označme Mn výběrový průměr, Sn2 výběrový rozptyl a pro libovolné, ale pevně dané x g R Fn(x) hodnotu výběrové distribuční funkce. 2 Pak Mn je nestranným odhadem \x (tj. E(Mn) = u) s rozptylem D(m) = —, Sn2 je nett stranným odhadem c2 (tj. E(Sn2) = g2), ať jsou hodnoty parametrů u, g2 jakékoli. Dále platí, že pro libovolné, ale pevně dané x g R je výběrová distribuční funkce Fn(x) nestranným odhadem 2, ..., nr > 2 z rozložení se středními hodnotami ui, ..., \xr a rozptylem c2. Cel- r kový rozsah je n = ^rij . Nechť Ci, ..., cr jsou reálné konstanty, aspoň jedna nenulová. Pak pro libovolné hodnoty parametru ui, ..., Ur a g2 platí: fr \ r V H J H E(S*2) = g2. r Znamená to, že lineární kombinace výběrových průměrů ^CjMj je nestranným odha- r dem lineární kombinace středních hodnot ^c^ a vážený průměr výběrových rozptylů S»2 = —-------------je nestranným odhadem rozptylu g2, ať je rozptyl g2 jakýkoliv. n-r c) Nechť (Xi,Yi), ..., (Xn,Yn) je náhodný výběr z dvourozměrného rozložení s kovariancí Gi2 a koeficientem korelace p. Pak výběrová kovariance Si2 je nestranným odhadem kovariance gi2, ať je kovariance 012 jakákoli, avšak E(Ri2) je rovno p pouze přibližně (shoda je vyhovující pro n > 30), ať je korelační koeficient p jakýkoli. 1.3.3. Pojem intervalu spolehlivosti Nechť Xi, ..., Xn je náhodný výběr z rozložení L(ô ), h(ô ) je parametrická funkce, ae (0,1), D = D(Xi, ..., Xn), H = H(Xi, ..., Xn) jsou statistiky. a) Interval (D, H) se nazývá 100(l-a)% (oboustranný) interval spolehlivosti pro parametrickou funkci h(ô), jestliže: VS g S :P(D < h(u) < H) > 1-a. b) Interval (D, co) se nazývá 100(l-a)% levostranný interval spolehlivosti pro parametrickou funkci h(ô), jestliže: VS g S : P(D < h(d)) > 1-a. c) Interval (-co, H) se nazývá 100(l-a)% pravostranný interval spolehlivosti pro parametrickou funkci h(ô), jestliže: VS g S :P(h(d) < H) > 1-a. d) Číslo a se nazývá riziko (zpravidla a = 0,05, méně často 0,1 či 0,01), číslo 1 - a se nazývá spolehlivost. 1.3.4. Postup při konstrukci intervalu spolehlivosti a) Vyjdeme ze statistiky V, která je nestranným bodovým odhadem parametrické funkce HH b) Najdeme tzv. pivotovou statistiku W, která vznikne transformací statistiky V, je monotónní funkcí h($ ) a přitom její rozložení je známé a na h($ ) nezávisí. Pomocí známého rozložení tzv. pivotové statistiky W najdeme kvantily wa/2, wi_a/2, takže platí: VS g S : P(wa/2 < W < wi.o/2) > 1 - a. c) Nerovnost wa/2 < W < wi_a/2 převedeme ekvivalentními úpravami na nerovnost D 2 a rozptyl g2 známe. Sestrojte Řešení: V tomto případě parametrická funkce h(ô) = [i. Nestranným odhadem střední hodnoty je vý- 1 n běrový průměr (viz 1.3.(a)) M = — T]X . Protože M je lineární kombinací normálně rozlože- n i=i ných náhodných veličin, bude mít také normální rozložení se střední hodnotou E(M) = [i a 2 rozptylem d(m) = —. Pivotovou statistikou W bude standardizovaná náhodná veličina n U =----------Nip,!). Kvantil wa/2 = ua/2 = -ui_a/2, wi_a/2 = ui_a/2. /n VSeS:l-a< P(-ui.a/2 < U < ui.a/2) f \ M-n Ul-a/2 <—— h-d = m + M-oc/2 m M-oc/2 2a M-oc/2 Z této podmínky 4 2 2 dostaneme, že n >-------'~"/2 . Za rozsah výběru zvolíme nejmenší přirozené číslo vyhovující A této podmínce. 1.4. Úvod do testování hypotéz Nulovou hypotézou rozumíme nějaké tvrzení o parametrech nebo typu rozložení, z něhož pochází náhodný výběr. Nulová hypotéza vyjadřuje nějaký teoretický předpoklad, často skeptického rázu a uživatel ji musí stanovit předem, bez přihlédnutí k datovému souboru. Proti nulové hypotéze stavíme alternativní hypotézu, která říká, co platí, když neplatí nulová hypotéza. Např. nulová hypotéza tvrdí, že střední hodnota hmotnosti balíčků cukru balených na automatické lince se nezměnila seřízením automatu, zatímco alternativní hypotéza tvrdí opak. Postup, který je založen na daném náhodném výběru a s jehož pomocí rozhodneme o zamítnutí či nezamítnutí nulové hypotézy, se nazývá testování hypotéz. 1.4.1. Nulová a alternativní hypotéza Nechť Xi, ..., Xn je náhodný výběr z rozložení L(ô ), kde parametr ô e S neznáme. Nechť h(ô) je parametrická funkce a c daná reálná konstanta. a) Oboustranná alternativa: Tvrzení H0: h(ô ) = c se nazývá jednoduchá nulová hypotéza. Proti nulové hypotéze postavíme složenou alternativní hypotézu Hi: h(ô ) ^ c. b) Levostranná alternativa: Tvrzení H0: h(ô ) > c se nazývá složená pravostranná nulová hypotéza. Proti jednoduché nebo složené pravostranné nulové hypotéze postavíme složenou le-vostrannou alternativní hypotézu Hi: h(ô ) < c. c) Pravostranná alternatíva: Tvrzení H0: h(ô ) < c se nazývá složená levostranná nulová hypotéza. Proti jednoduché nebo složené levostranné nulové hypotéze postavíme složenou pravostrannou alternatívni hypotézu Hi: h(ô ) > c. Testováním H0 proti Hi rozumíme rozhodovací postup založený na náhodném výběru Xi, ..., Xn, s jehož pomocí zamítneme či nezamítneme platnost nulové hypotézy. 1.4.2. Chyba 1. a 2. druhu Při testování H0 proti Hi se můžeme dopustit jedné ze dvou chyb: chyba 1. druhu spočívá v tom, že Ho zamítneme, ač ve skutečnosti platí a chyba 2. druhu spočívá v tom, že Ho nezamítneme, ač ve skutečnosti neplatí. Situaci přehledně znázorňuje tabulka: skutečnost rozhodnutí Ho nezamítáme Ho zamítáme H0 platí správné rozhodnutí chyba 1. druhu H0 neplatí chyba 2. druhu správné rozhodnutí Pravděpodobnost chyby 1. druhu se značí a a nazývá se hladina významnosti testu (většinou bývá a = 0,05, méně často 0,1 či 0,01). Pravděpodobnost chyby 2. druhu se značí ß. Číslo 1-ß se nazývá síla testu a vyjadřuje pravděpodobnost, s jakou test vypoví, že H0 neplatí. 1.4.3. Testování pomocí kritického oboru Najdeme statistiku T0 = T0(Xi, ..., Xn), kterou nazveme testovým kritériem. Množina všech hodnot, jichž může testové kritérium nabýt, se rozpadá na obor nezamítnutí nulové hypotézy (značí se V) a obor zamítnutí nulové hypotézy (značí se W a nazývá se též kritický obor). Tyto dva obory jsou odděleny kritickými hodnotami (pro danou hladinu významnosti a je lze najít ve statistických tabulkách). Jestliže číselná realizace t0 testového kritéria T0 padne do kritického oboru W, pak nulovou hypotézu zamítáme na hladině významnosti a a znamená to skutečné vyvrácení testované hypotézy. Jestliže to padne do oboru nezamítnutí V, pak jde o pouhé mlčení, které platnost nulové hypotézy jenom připouští. Pravděpodobnosti chyb 1. a 2. druhu nyní zapíšeme takto: P(To g W/Ho platí) = a, P(T0 e V /Hi platí) = ß. Stanovení kritického oboru pro danou hladinu významnosti a: Označme tmin (resp. tmax) nejmenší (resp. největší) hodnotu testového kritéria. Kritický obor v případě oboustranné alternativy má tvar W = (tmm,Ka/2(T)) ^J(K^/2(T),tmax), kde Ka/2(T) a Ki.a/2(T) jsou kvantily rozložení, jímž se řídí testové kritérium T0, je-li nulová hypotéza pravdivá. Kritický obor v případě levostranné alternativy má tvar: W = (tmm,Ka(T)>. Kritický obor v případě pravostranné alternativy má tvar: W = (K1_a(T),tmax). Doporučuje se dodržovat následující postup: - Stanovíme nulovou hypotézu a alternativní hypotézu. Přitom je vhodné zvolit jako alternativní hypotézu ten předpoklad, jehož přijetí znamená závažné opatření a mělo by k němu dojít jen s malým rizikem omylu. - Zvolíme hladinu významnosti a. Zpravidla volíme a = 0,05, méně často 0,1 nebo 0,01. - Najdeme vhodné testové kritérium a na základě zjištěných dat vypočítáme jeho realizaci. - Stanovíme kritický obor. - Jestliže realizace testového kritéria padla do kritického oboru, nulovou hypotézu zamítáme na hladině významnosti a. V opačném případě nulovou hypotézu nezamítáme na hladině významnosti a. 1.4.4. Testování pomocí intervalu spolehlivosti Sestrojíme 100(l-a)% empirický interval spolehlivosti pro parametrickou funkci h(ô). Pokryj e-li tento interval hodnotu c, pak H0 nezamítáme na hladině významnosti a, v opačném případě Ho zamítáme na hladině významnosti a. Pro test H0 proti oboustranné alternativě sestrojíme oboustranný interval spolehlivosti. Pro test Ho proti levostranné alternativě sestrojíme pravostranný interval spolehlivosti. Pro test H0 proti pravostranné alternativě sestrojíme levostranný interval spolehlivosti. 1.4.5. Testování pomocí p-hodnoty p-hodnota udává nejnižší možnou hladinu významnosti pro zamítnutí nulové hypotézy. Je-li p-hodnota < a, pak H0 zamítáme na hladině významnosti a, j e-li p-hodnota > a, pak H0 nezamítáme na hladině významnosti a. Způsob výpočtu p-hodnoty: Pro oboustrannou alternativu p = 2 min{P(T0 < to), P(T0 > to)}. Pro levostrannou alternativu p = P(T0 < t0). Pro pravostrannou alternativu p = P(T0 > to). p-hodnota vyjadřuje pravděpodobnost, s jakou číselné realizace xi, ..., xn náhodného výběru Xi, ..., Xn podporují Ho, je-li pravdivá. Statistické programové systémy poskytují ve svých výstupech p-hodnotu. Její výpočet vyžaduje znalost distribuční funkce rozložení, kterým se řídí testové kritérium T0, je-li H0 pravdivá. Vzhledem k tomu, že v běžných statistických tabulkách j sou uvedeny pouze hodnoty distribuční funkce standardizovaného normálního rozložení, bez použití speciálního software jsme schopni vypočítat p-hodnotu pouze pro test hypotézy o střední hodnotě normálního rozložení při známém rozptylu. Ilustrace významu p-hodnoty pro test nulové hypotézy proti oboustranné, levostranné a pravostranné alternativě: p-hodnota p-hodnotí * 0 "to til tjj í u (Zvonovitá křivka reprezentuje hustotu rozložení, kterým se řídí testové kritérium, je-li nulová hypotéza pravdivá.) 1.4.6. Příklad 10 x nezávisle na sobě byla změřena jistá konstanta [i. Výsledky měření byly: 2 1,8 2,1 2,4 1,9 2,1 2 1,8 2,3 2,2. Tyto výsledky považujeme za číselné realizace náhodného výběru Xi, ..., Xio z rozložení N(u, 0,04). Nějaká teorie tvrdí, že [i = 1,95. Proti nulové hypotéze H0: (J, = 1,95 postavíme oboustrannou alternativu Hi: [i ^ 1,95. Na hladině významnosti 0,05 testujte H0 proti Hi všemi třemi popsanými způsoby. Řešení: m = —(2 +... + 2,2) = 2,06, g2 = 0,04, n = 10, a = 0,05, c = 1,95 a) Test provedeme pomocí kritického oboru. Pro úlohy o střední hodnotě normálního rozložení při známém rozptylu používáme pivotovou statistiku U =----------N(0, 1) (viz 1.3.5.). Testové kritérium tedy bude T0 =------- a bude 'n vn mít rozložení N(0, 1), pokud je nulová hypotéza pravdivá. Vypočítáme realizaci testového 2,06-1,95 0,2 kritéria: t0 = ——-^-^— = 1,74 . Stanovíme kritický obor: /10 W = (tmm,Ka/2(T))^(K1_a/2(T),tmax)= (-oo,ua/2>^(Ul_a/2,oo) = (- °°, - u^/2) u (Ul_a/2, oo) = (- oo, - u0 975 > u (u0 975, oo) = (- oo,-l,96) ^j (1,96, oo). Protože 1,74 £ W, H0 nezamítáme na hladině významnosti 0,05. b) Test provedeme pomocí intervalu spolehlivosti. Meze 100(l-a)% empirického intervalu spolehlivosti pro střední hodnotu [i při známém rozptylu g2 jsou (viz 1.3.5.): (d, h) = (m - —= ui_a/2, m + —= ui_a/2). 02 02 V našem případě dostáváme: d = 2,06 - -^u0975 = 2,06 - —.= .1,96 = 1,936, h = 2,184. VI0 ' V10 Protože 1,95 e (1,936; 2,184), H0 nezamítáme na hladině významnosti 0,05. c) Test provedeme pomocí p-hodnoty. Protože proti nulové hypotéze stavíme oboustrannou alternativu, použijeme vzorec p = 2 min{P(To < t0), P(T0 > to)} = 2 min {P(T0 < 1,74), P(T0 > 1,74)} = = 2 min { 0,05, nulovou hypotézu nezamítáme na hladině významnosti 0,05. 1.5. Uspořádání pokusů Zaměříme se na situaci, kdy zkoumáme hmotnostní přírůstky stejně starých selat téhož plemene při různých výkrmných dietách. Určitou výkrmnou dietu aplikujeme např. po dobu půl roku. Každý den zjišťujeme hmotností přírůstky každého selete a po uplynutí půl roku vypočteme pro každé sele průměrný hmotnostní přírůstek. 1.5.1. Jednoduché pozorování Náhodná veličina je pozorována za týchž podmínek. Situace je charakterizována jedním náhodným výběrem Xi, ..., Xn. (Náhodně vybereme n stejně starých selat téhož plemene, podrobíme je jediné výkrmné dietě a zjistíme hmotnostní přírůstky. Tak dostaneme realizaci jednoho náhodného výběru.) Pokud lze očekávat, že náhodný výběr pochází z normálního rozložení, můžeme např. konstruovat interval spolehlivosti pro neznámou střední hodnotu, neznámý rozptyl či směrodatnou odchylku průměrných denních hmotnostních přírůstků nebo testovat hypotézu, že střední hodnota průměrných denních hmotnostních přírůstků neklesne pod určitou hranici. (Tyto úkoly budeme řešit ve 3. kapitole.) 1.5.2. Dvojné pozorování Zkoumá se rozdílnost hodnot náhodné veličiny pozorované za dvojích různých podmínek. Existují dvě odlišná uspořádání tohoto pokusu. a) Dvouvýběrové porovnávání Situace j e charakterizována dvěma nezávislými náhodnými výběry Xn,..., Xln a X21,..., X2n . (Z populace všech dostupných stejně starých selat téhož plemene náhodně vybereme ni + n2 jedinců. Náhodně je rozdělíme na dva soubory o rozsazích ni a n2, první podrobíme výkrmné dietě č. 1 a druhý výkrmné dietě č. 2. Tak dostaneme realizace dvou nezávislých náhodných výběrů.) Za předpokladu, že dané náhodné výběry pocházejí z normálních rozložení, lze např. konstruovat interval spolehlivosti pro rozdíl středních hodnot či podíl rozptylů průměrných denních hmotnostních přírůstků nebo testovat hypotézu o stejné účinnosti obou výkrmných diet. (Tyto úkoly budeme řešit ve 4. kapitole.) b) Párové porovnávání Situace je charakterizována jedním náhodným výběrem (Xn,Xi2), ..., (Xni,Xn2) z dvourozměrného rozložení. Párem se rozumí dvojice (Xi,X2), i = 1, ..., n . Úloha se zpravidla převádí na jednoduché pozorování náhodného výběru rozdílů Xi - Xi2, kde i = 1, ..., n. (Náhodně vybereme n vrhů stejně starých selat téhož plemene a z nich vždy dva sourozence a náhodně jim přiřadíme 1. a 2. výkrmnou dietu. Tak dostaneme realizaci náhodného výběru z dvourozměrného rozložení.) Lze-li dvourozměrný náhodný výběr považovat za výběr z dvourozměrného normálního rozložení, budeme se zabývat konstrukcí intervalu spolehlivosti pro rozdíl středních hodnot průměrných denních hmotnostních přírůstků nebo testovat hypotézu o stejné účinnosti obou výkrmných diet. (Řešení úkolů tohoto typuje popsáno ve 3. kapitole.) 1.5.3. Mnohonásobné pozorování Zkoumá se rozdílnost hodnot náhodné veličiny pozorované za r > 3 různých podmínek. Existují dvě odlišná uspořádání tohoto pokusu. a) Mnohovýběrové porovnávání Situace j e charakterizována r nezávislými náhodnými výběry Xn,...,Xln , ..., Xrl,...,Xm . (Z populace všech dostupných stejně starých selat téhož plemene náhodně vybereme ni + n2 + ... + nr jedinců. Náhodně je rozdělíme na r souborů o rozsazích ni, n2, ..., nr. Selata z prvního souboru podrobíme výkrmné dietě č. 1, ..., selata z r-tého souboru podrobíme výkrmné dietě č. r. Tak dostaneme realizace r nezávislých náhodných výběrů.) Za předpokladu, že všechny náhodné výběry se řídí normálním rozložením s týmž rozptylem, můžeme testovat hypotézu o stejné účinnosti všech r výkrmných diet. (Tomuto problému je věnována 5. kapitola.) b) Blokové porovnávání Situace je charakterizována jedním náhodným výběrem (Xn,Xi2, ..., Xir), ..., (Xni,Xn2, ..., Xnr) z r-rozměrného rozložení. Blokem se rozumí r-tice (Xi,X2, ..., Xr), i = 1, ..., n. (Náhodně vybereme n vrhů starých selat téhož plemene a z nich vždy r sourozenců a náhodně jim přiřadíme 1. až r-tou výkrmnou dietu. Tak dostaneme realizaci náhodného výběru z r-rozměrného rozložení.) Vyhodnocení výsledků při blokovém porovnávání se provádí např. pomocí Friedmanova testu. Jeho popis se již vymyká náplni předmětu Statistika II. Poučení lze nalézt v doporučené literatuře [Hendl] na str. 360. Shrnutí Ústředním pojmem matematické statistiky je pojem náhodného výběru, a to jednorozměrného i vícerozměrného. Transformací jednoho nebo více náhodných výběrů vzniká náhodná veličina zvaná (výběrová) statistika. K nejdůležitějším statistikám patří výběrový průměr, výběrový rozptyl, výběrová směrodatná odchylka, hodnota výběrová distribuční funkce, výběrová kovariance, výběrový koeficient korelace. Jelikož statistika je náhodná veličina, má smysl počítat její střední hodnotu a rozptyl. Ukázali jsme si vlastnosti střední hodnoty a rozptylu výběrového průměru či hodnoty výběrové distribuční funkce a střední hodnoty výběrového rozptylu, výběrové kovariance a výběrového koeficientu korelace. Na základě znalosti náhodného výběru aproximujeme neznámou hodnotu parametru či parametrické funkce bodovým odhadem parametrické funkce. Zpravidla požadujeme, aby tento odhad měl jisté žádoucí vlastnosti. K těm patří nestrannosti resp. asymptotická ne-strannost či konzistence, pokud pracujeme s posloupností bodových odhadů téže parametrické funkce. Bodové odhady však mají jednu značnou nevýhodu - nevíme, s jakou pravděpodobností odhadují hodnotu neznámé parametrické funkce. Tuto nevýhodu odstraňují intervalové odhady parametrické funkce: jsou to intervaly, jejichž meze jsou statistiky a které s předem danou dostatečně velkou pravděpodobností pokrývají hodnotu neznámé parametrické funkce. Pokud do vzorců pro meze 100(l-a)% intervalu spolehlivosti pro danou parametrickou funkci dosadíme číselné realizace náhodného výběru, dostaneme 100(l-a)% empirický interval spolehlivosti. Tvrzení o parametrech rozložení, z něhož pochází daný náhodný výběr, nazýváme nulovou hypotézou. Proti nulové hypotéze stavíme alternativní hypotézu, která říká, co platí, když neplatí nulová hypotéza. Při testování nulové hypotézy proti alternativní hypotéze se můžeme dopustit buď chyby 1. druhu (nulovou hypotézu zamítneme, ač ve skutečnosti platí) nebo chyby 2. druhu (nulovou hypotézu nezamítneme, ač ve skutečnosti neplatí). Pravděpodobnost chyby 1. druhu se značí a a nazývá se hladina významnosti testu. Klasický přístup k testování hypotéz spočívá v nalezení vhodného testového kritéria. Množina hodnot, jichž může testové kritérium nabýt, se rozpadá na obor nezamítnutí nulové hypotézy a na kritický obor. Tyto dva neslučitelné obory jsou odděleny kritickými hodnotami. Pokud se testové kritérium realizuje v kritickém oboru, nulovou hypotézu zamítáme na hladině významnosti a a přijímáme alternativní hypotézu. V opačném případě nulovou hypotézu nezamítáme na hladině významnosti a. Tím jsme ovšem neprokázali její pravdivost, můžeme pouze říci, že naše data nejsou natolik průkazná, abychom mohli nulovou hypotézu zamítnout. Test nulové hypotézy proti alternativní hypotéze lze též provést pomocí intervalu spolehlivosti. Máme-li k dispozici statistický software, můžeme vypočítatp-hodnotu jako nejmenší možnou hladinu významnosti pro zamítnutí nulové hypotézy. Existují tři základní způsoby uspořádání pokusů: - jednoduché pozorování (náhodná veličina j e pozorována za týchž podmínek), dvojné pozorování (náhodná veličina j e pozorována za dvoj ich různých podmínek, přičemž lze použít buď dvouvýběrovéporovnávání - výsledkem jsou dva nezávislé náhodné výběry nebo párové porovnávání - výsledkem jej eden náhodný výběr z dvourozměrného rozložení) mnohonásobné pozorování (náhodná veličina j e pozorována za r >3 různých podmínek, přičemž lze použít buď mnohovýběrové porovnávání - výsledkem je r >3 nezávislých náhodných výběrů nebo blokové porovnávání - výsledkem je jeden náhodný výběr z r-rozměrného rozložení). Správnému uspořádání pokusuje zapotřebí věnovat patřičnou pozornost, neboť při nevhodném uspořádání nelze efektivně využít informace obsažené v datech a prostředky vynaložené na jejich získání jsou znehodnoceny. Kontrolní otázky 1. Vysvětlete pojem „náhodný výběr" a „statistika" a uveďte příklady důležitých statistik. 2. K čemu slouží bodový odhad parametrické funkce a jaké typy bodových odhadů znáte? 3. Definujte interval spolehlivosti a popište způsob jeho konstrukce. 4. Jaký vliv na šířku intervalu spolehlivosti má riziko a jaký vliv má rozsah výběru? 5. Co rozumíme pojmem „testování hypotéz"? 6. Popište nulovou a alternativní hypotézu. 7. Vysvětlete rozdíl mezi chybou 1. a 2. druhu. 8. Popište tři způsoby testování hypotéz. 9. Popište tři způsoby plánování pokusů. 10. Jak se liší dvouvýběrové a párové porovnávání? 11. Jak se liší mnohovýběrové a blokové porovnávání? Auto korekční test 1. Která z následujících tvrzení j sou pravdivá? a) Náhodným výběrem rozumíme objekty základního souboru, které byly vybrány do výběrového souboru náhodně, např. losováním. b) Náhodným výběrem rozumíme posloupnost stochasticky nezávislých a stejně rozložených náhodných veličin či vektorů. c) Číselné realizace náhodného výběru uspořádané do vektoru či matice tvoří datový soubor. 2. Která z následujících tvrzení jsou pravdivá? a) Výběrový rozptyl je aritmetickým průměrem kvadrátů centrovaných složek náhodného výběru. b) Číselné realizace výběrového průměru se mohou výběr od výběru lišit. c) V definici váženého průměru výběrových rozptylů hrají roli vah rozsahy jednotlivých náhodných výběrů. 3. Která z následujících tvrzení jsou pravdivá? a) Statistikaje nestranným odhadem parametrické funkce, pokudjejí střední hodnotaje rovna této parametrické funkci, ať je hodnota parametru jakákoliv. b) Posloupnost statistik je posloupností konzistentních odhadů parametrické funkce, pokud s rostoucím rozsahem náhodného výběru roste pravděpodobnost, že odhady se budou realizovat daleko od parametrické funkce, ať je hodnota parametru jakákoliv. c) Máme-li dva nestranné odhady téže parametrické funkce, tak za lepší považujeme ten, který má větší rozptyl, ať je hodnota parametru jakákoliv. 4. Která z následujících tvrzení jsou pravdivá? a) Výběrový průměr je nestranným odhadem střední hodnoty. b) Výběrová směrodatná odchylka je nestranným odhadem směrodatné odchylky. c) Výběrový koeficient korelace je nestranným odhadem koeficientu korelace. 5. Která z následujících tvrzení jsou pravdivá? a) Při konstrukci intervalu spolehlivosti pro parametrickou funkci musíme znát statistiku, která je nestranným bodovým odhadem této parametrické funkce. b) Empirický 100(l-a)% interval spolehlivosti slouží jako odhad neznámého parametrické funkce v tomto smyslu: pravděpodobnost, že tento interval pokrývá skutečnou hodnotu parametrické funkce, je aspoň 1-a. c) Při konstantním riziku a klesá šířka empirického 100(l-a)% intervalu spolehlivosti s rostoucím rozsahem náhodného výběru. 6. Která z následujících tvrzení jsou pravdivá? a) Kritický obor a obor nezamítnutí nulové hypotézy jsou vždy disjunktní. b) Pravděpodobnost chyby 2. druhu lze určit na základě znalosti rizika a.. c) Pokud byla nulová hypotéza zamítnuta na hladině významnosti 0,01, byla by zamítnuta i na hladině významnosti 0,05. 7. Z následujících tří možností vyberte správnou: Pokud u několika osob měříme krevní tlak před zátěží a po zátěži, jedná se o a) jednoduché pozorování b) dvouvýběrové porovnávání c) párové porovnávání. 8. Z následujících tří možností vyberte správnou: Náhodně vybereme dostatečný počet rodin s dětmi a zkoumáme, zda počet dětí ovlivňuje průměrné roční výdaje rodiny na průmyslové zboží. V tomto případě se jedná o a) párové porovnávání b) mnohovýběrové porovnávání c) blokové porovnávání. 9. Z následujících tří možností vyberte správnou: Náhodně vybereme dostatečný počet mužů a žen se stejným pracovním zařazením. Zkoumáme, zda pohlaví má vliv na výši průměrného ročního platu. Pro tuto situaci využijeme a) blokové porovnávání b) párové porovnávání c) dvouvýběrové porovnávání. Správné odpovědi: lb), c) 2b) 3a) 4a) 5a) ,b), c) 6a), c) 7c) 8b) 9c) Příklady 1. Nezávisle opakovaná laboratorní měření určité konstanty j sou charakterizována náhodným výběrem Xi, ..., Xn z rozložení se střední hodnotou \x a rozptylem g2. Uvažme statistiky 1 n X + X M = -VX1,L = —!-------. Dokažte, že M a L j sou nestranné odhady konstanty [i a zjistěte, n i~t 2 který z nich j e lepší. Výsledek: Výpočtem zjistíme, že E(M) = u, E(L) = u, tudíž statistiky M a L jsou nestranné odhady 2 2 konstatnty [i. Pro posouzení kvality vypočteme D(M) = —, D(L) = — . Vidíme tedy, že pro n 2 n > 3 je lepším odhadem výběrový průměr M. 2. Nechť Xi, ..., Xn je náhodný výběr z rozložení N(u.;0,04). Jaký musí být nejmenší rozsah náhodného výběru, aby šířka 95% empirického intervalu spolehlivosti pro neznámou střední hodnotu [i nepřesáhla číslo 0,16? Výsledek: 25 3. Nechť Xi, ..., X9 je náhodný výběr z rozložení N(u.;0,01). Realizace výběrového průměru je m = 3. Sestrojte 100(l-a)% empirický interval spolehlivosti pro neznámou střední hodnotu u, je-li a) a = 0,01, b) a = 0,05, c) a = 0,1. Výsledek: ad a) 2,914 mm < u. < 3,086 mm s pravděpodobností aspoň 0,99. ad b) 2,935 mm < u. < 3,065 mm s pravděpodobností aspoň 0,95. ad c) 2,945 mm < u. < 3,055 mm s pravděpodobností aspoň 0,90. Vidíme, že s rostoucím rizikem klesá šířka intervalu spolehlivosti. 4. Nechť Xi, ..., Xn je náhodný výběr z rozložení N(u.;0,01). Realizace výběrového průměru je m = 3. Sestrojte 95% empirický interval spolehlivosti pro neznámou střední hodnotu u, je-li a) n = 4, b) n = 9, c) n = 16. Výsledek: ad a) 2,902 mm < u. < 3,098 mm s pravděpodobností aspoň 0,95. ad b) 2,935 mm < u. < 3,065 mm s pravděpodobností aspoň 0,95. ad c) 2,951 mm < u. < 3,049 mm s pravděpodobností aspoň 0,95. Vidíme, že s rostoucím rozsahem výběru klesá šířka intervalu spolehlivosti. 5. Je známo, že výška hochů ve věku 9,5 až 10 let má normální rozložení s neznámou střední hodnotou \x a známým rozptylem g2 = 39,112 cm2. Dětský lékař náhodně vybral 15 hochů uvedeného věku, změřil je a vypočítal realizaci výběrového průměru m = 139,13 cm. Podle jeho názoru by výška hochů v tomto věku neměla přesáhnout 142 cm s pravděpodobností aspoň 0,95. Lze tvrzení lékaře akceptovat? Výsledek: Testujeme H0: u. < 142 proti Hi: [i > 142 na hladině významnosti 0,05. Testování pomocí kritického oboru: W = (l,6449,oo), realizace testového kritéria j e -1,7773. Protože testové kritérium se nerealizuje v kritickém oboru, nulovou hypotézu nezamítáme na hladině významnosti 0,05. Testování pomocí intervalu spolehlivosti: 95% empirický levostranný interval spolehlivosti pro střední hodnotu [i je (136,47;co). Protože číslo 142 patří do tohoto intervalu, nulovou hypotézu nezamítáme na hladině významnosti 0,05. Testování pomocí p-hodnoty: p = 0,9622. Protože p-hodnotaje větší než hladina významnosti 0,05, nulovou hypotézu nezamítáme na hladině významnosti 0,05.