3.3.1 Testy Kolmogorovova-Smirnovova typu.................. 112 3.3.2 jŕ-testy dobré shody.......................... 114 3T4 Robustní metody............................... 116 3.4.1 Úvod................................. 116 3.4.2 Robustní odhady parametru polohy a měřítka................ 123 3.4.3 Robustní odhady v lineárním modelu................... 139 3.4.4 Výpočet robustních odhadu v lineárním modelu............... 145 3.5 Neparametrické odhady hustot a regresních křivek................. 148 3.5.1 Neparametrické odhady hustoty..................... 149 3.5.2 Neparametrické odhady regresních křivek................. 153 3.6 Adaptivní postupy.............................. 160 3.6.1 Adaptivní testy............................. 160 3.6.2 Adaptivní odhady........................... 166 4 Simulování náhodných veličin a jejich aplikace ve statistice............. 168 4.1 Úvodem o náhodě.............................. 168 4.2 Obecné metody pro generování náhodných veličin................. 170 4.2.1 Metoda inverzní transformace...................... 171 4.2.2 Zamítací metoda............................ 175 4.2.3 Doplnková přijímací metoda....................... 179 4.2.4 Kompoziční metoda........................... 182 4.2.5 Vybrané metody pro generování diskrétních náhodných veličin........ 184 4.3 Generování uspořádaných výběrů........................ 188 4.4 Výběry z konečných souborů.......................... 195 4.4.1 Prostý náhodný výběr.......................... 196 4.4.2 Výběry při nestejných pravděpodobnostech zahrnutí............. 201 4.4.3 Oblastní a vícestupňový výběr...................... 207 5 Programové zabezpečení pro statistickou analýzu dat................ 209 5.1 Stručná historie výpočetní statistiky....................... 209 5.2 Výpočetní prostředí pro statistiku........................ 212 5.3 Programové zabezpečení pro statistickou analýzu dat................ 214 Příloha: Vybrané statistické tabulky......................... 221 Poznámky k užívání tabulek......................... 221 Kvantily u„ standardizovaného normálního rozdělení N(0,1)........... 223 KvantUy xl(a) rozdělení ^......................... 224 Kvantily t„(a) Studentova rozdělení í„.................... 228 Kvantily /v„(a) Fisherova-Snedecorova rozdělení F„_„.............. 230 Kritické hodnoty znaménkového testu.................... 246 Kritické hodnoty jednovýběrového Wilcoxonova testu.............. 247 Kritické hodnoty dvouvýběrového Wilcoxonova testu.............. 248 Funkce K(z)............................... 254 Funkce K,(z)............................... 255 Funkce L i y J—°~-\........................... 256 Rozdělení mediánové statistiky SM...................... 258 Kritické hodnoty pro Spearmanovu statistiku................. 268 Literatura.................................... 269 Další doporučená literatura............................. 273 Vřený rejstřík................................... 276 8 SEZNAM SYMBOLU N množina přirozených čísel Rl množina reálnych čísel Rk reálny fc-rozměrný euklidovský prostor m prostor všech permutací posloupnosti {1,...,«} :£' výběrový prostor Ml, Lp-norma x,y,... a,ß,... vektory A, B, matice 1 jednotková matice 0 nulová matice A' transponovaná matice A1 inverzní matice A" pseudoinverzní matice h(A) hodnost matice |A|, detA determinant matice tr(A) stopa matice HA« euklidovská norma matice iMl indikátor množiny A Au B sjednocení množin An B průnik množin A- B rozdíl množin 0 prázdná množina a prostor elementárních jevů (O elementární jev .ď tř-algebra m (7-algebra borelovských množin (Q, 98, P) pravděpodobnostní prostor (Q, 08, Pe, 0 e <9) pravděpodobnostní prostor s množinou pravděpodobnost nich měr 9 P(i4) pravděpodobnost jevu A X y,... náhodné veličiny X,Y,... náhodné vektory /-g.- hustoty F, G,... distribuční funkce F~\ G"1,... kvantilové funkce (inverzní distribuční funkce) E střední hodnota cov (X, Y) kovariance náhodných veličin A* a y var A" rozptyl náhodné veličiny X ■ var JIT varianční matice náhodného vektoru X í m m*) Lebesgueúv-Stieltjesúv integrál Bi(n,p) binomické rozdělení ¥{X)~ Bi{n,p) náhodná veličina X se řídí rozdělením Bi(n,p) M(n,ply...,pk) multinomické rozdelení Po{X) Poissonovo rozdělení /?{1,-.., «} rovnoměrné rozdělení (diskrétní) B(a,ß) beta rozdělení B(a, b) beta funkce F m.n Fisherovo-Snedecorovo rozdělení o m a n stupních volnosti n«, ä gamma rozdělení r(*), gamma funkce ú chí-kvadrát rozdělení o n stupních volnosti LNfao2) logaritmicko-normální rozdělení N(ft,o2) normální rozdělení *(*) distribuční funkce standardizovaného normálního rozdělení *,(M> 2) mnohorozměrné normální rozdělení W(fl, fc) rovnoměrné rozdělení (spojité) '„ Studentovo rozdělení /„on stupních volnosti «a a-kvantil standardizovaného normálního rozdělení N(0,1) U«) a-kvantil Studentova rozdělení t„ Ä«) a-kvantil rozdělení £„ *V-(°) a-kvantil Fisherova-Snedecorova rozdělení Fm/1 ľi koeficient šikmosti Yi koeficient špičatosti Xo modus x medián f - budeme nazývat elementárními jevy, množinu všech možných výsledků náhodného pokusu označíme Q a nazveme prostorem elementárních jevů. Podmnožinám prostoru Q se říká jevy. Z matematického hlediska je výhodné pracovat s jevy, které tvoří o^algebru. Tyto jevy nazveme náhodné. Náhodným jevům můžeme přiřadit pravděpodobnost P. Podle axiomatické definice je pravděpodobnost nezáporná, CT-aditivní množinová funkce, která prostoru Q přiřazuje hodnotu P(fl) — 1. Prostoru Q se také říká jev jistý. OznaČíme-li symbolem j^o^algebru vytvořenou z podmnožin fl, získáme trojici (fí, sč, P), jíž se říká pravděpodobnostní prostor a která představuje matematický model náhodného pokusu. Většina náhodných pokusů je taková, že je vhodné charakterizovat jejich výsledky reálnými čísly. Pro tento účel se zavádí pojem náhodné veličiny X(aj), která je definována jako měřitelná funkce z (ß, ,s/, P) do (R1, ář), kde /?' je reálná přímka a .# je (ř-algebra borelovských množin na přímce. Každé borelovské množině B e m lze přiřadit pravděpodobnostní míru P(X'\B)) - P(w e ß: X(w) e .#). Tato míra se nazývá zákon rozdělení náhodné veličiny X, krátce rozdělení K jednoznačnému určení rozdělení náhodné veličiny není třeba znát P(X~\B)) pro všechny B e .#, nýbrž stačí jejich znalost pro intervaly typu (— °°,x), x e R1. 11 vání X x,..., X„ náhodné veličiny X. Hypotéze 6 e <9„ c © se říká nulová, k ní alternativní hypotézou (krátce alternativou) je B e © — í?„ — &v Rozhodnutí-íesŕ hypotézy - provedeme tak, že předem stanovíme množinu IV c i?", které se říká kritický obor. Jestliže (XU...,X„)'£ W, hypotézu zamítneme, při (Xlt..., X„) £ R" — W nezamítneme. Jestliže zamítneme hypotézu, ačkoliv je správná, dopustíme se tzv. chyby prvního druhu. Jestliže nezamítneme hypotézu, ačkoliv správná není, jde o tzv. chybu druhého druhu. Kritický obor volíme tak, aby pravděpodobnost chyby prvního druhu nepřekročila předem dané Číslo a, 0 < a < 1 (obvykle mezi 0,01 až 0,05), tak zvanou hladinu významnosti testu. Skutečná hladina testu muže být nižší než nominální (tj. a), zpravidla pro diskrétm rozdělení. Aby se dosáhlo předem stanovené hladiny významnosti, je možné užít znáhodněného testu. Je dána funkce h(xu..., x„) = h(x), 0 < h(x) < 1, xe Rn, a předpis, podle něhož máme přijmout hypotézu s pravděpodobností 1 — h(x) a zamítnout s pravděpodobností h(x), jestliže náhodný vektor (Jf„ ..., X„)' složený z pozorování náhodné veličiny X nabyl hodnoty x To znamená, že po získám n pozorování náhodné veliěiny X je třeba ještě provést dodatečný pokus se dvěma možnými výsledky, které mají pravděpodobnost h(x) a 1 — h{x). Vhodnou volbou h se dosáhne toho, že se využije celá hladina významnosti. V praxi se ale znáhodněného postupu užívá jen zřídka. Jestliže je ß pravděpodobnost chyby druhého druhu, říká se číslu 1 — ß síla testu. U síly se snažíme, aby byla co největší. Přesněji řečeno, bylo by žádoucí, aby síla byla alespoň rovna předem dané hodnotě 1 — ß při zachování předepsané hladiny. Jen málokdy toho však lze dosáhnout. Často se při testování neví, s jakou silou test pracuje. Někdy lze požadavku na sílu, která obecně závisí na parametru 6, vyhovět pro některé alternativní hodnoty 8 vhodnou volbou počtu pozorování n. Úlohy, které jsme zde popsali, se dají přirozeně modifikovat pro rozdělení náhodného vektoru a vektorový parametr. Statistické hypotézy se mohou týkat i rozdělení jako takového, například nezávislosti složek náhodného vektoru, a nemusí být pouze parametrické. O takových hypotézách se zmíníme později ve 3. kapitole. 1.3 Přehled vybraných rozdělení a jejich základních charakteristik Tento odstavec shrnuje definice a základní charakteristiky nejdůležitějších rozdělení, s nimiž se ve statistice setkáváme. S výjimkou mnohorozměrného normálního a multinomického rozdělení se jedná o rozdělení jednorozměrná. Pro jednotlivá rozdělení uvádíme následující charakteristiky (existují-li): hustotu /, střední hodnotu E X, rozptyl var X, modus x^ medián £ (pouze pro spojitá rozdělení), koeficient šikmosti yu koeficient špičatosti y2) r-tý centrální moment fir, 16 resp. r-tý obecný moment fi\ a momentovou vytvořující funkci m(t). V momentů vždy volíme ten typ, který umožňuje přehlednější zápis. U tvaru hustoty se ne vždy snažíme o maximálně možnou obecnost jejího vyjádření (zpravidla vynecháváme parametr posunutí). V případě, že je některá z charakteristik příliš složitá, odkazujeme na citovanou literaturu. Pro zvýšení názornosti jsou vybraná rozdělení doplněna též grafy odpovídajících hustot pro typické hodnoty parametrů. O vlastnostech uvedených rozdělení, jejich původu, metodách odhadu parametrů, použití apod. se čtenář může dozvědět více např. z [77]-[79], [115] či [116]. 1.3.1 Diskrétní rozdělení (A) Binomické rozdělení - Bi(n, p) /(*;«. p)= ("W-^""*' Jt-0,l,...,n; 0(rt + 1), 1-2/7 ľi ľi V«/j(i - p) l-6p(l- p) "/K1 - P) H, = np(l - p) Y, i J fr - P Z ľ . J /*,+! , r > 1 , /n(í) - (1 - P + P C)". Poznámka: Rozdělení Bi{\, p) se nazývá alternativní (Bernoulliho). (B) Hypergeometrické rozdělení \, dp 1-p "3, m(t) _ In (1 - p e') «(!-/>) t < In-. P 18 (D) Multinomické rozdělem — M(n,pu...,pk) k p*' f(xu...,xk; Pi,...,pA) = n! U -7» * 0 š x,, x, e W, í - 1,.... A:, £ *ŕ = n ; i-l 0(') = (Z/>.e")\ #-(ř„...,ř*)'6A*. i-l (E) Negativně binomické rozdělení /í+JC-l\ f(x;s,p)=\ x \p^-py} x-0,1,...; 0 1, \l-(l-p)e'J Poznámka: Při volbě j - 1 dostaneme geometrické rozdelení 19 (F) Poissonovo rozdělení - Po(A) A'e"' A* , «-y x! » ex '- A, var * = a, x0: A- 1 á *o š A, ľi ' 1 y%' _ i a' x-0,1,...; A>0; m(t) - exp {A(e' - 1)}. (G) Rovnoměrné rozdělení (diskrétní) - /?{1,..., n f(x; n)-----, x~ l,...,n; «e N; n EJť = n + 1 2 varJť «2- 1 12 j y x -1 0, ľ2- 6/n2+l\ sW-xľ Wr-I -o, r-1,2..... 1/ ER _ - - lf fhr 2 )' sinh (nt/2) m(t) ... cfl.-n« (nř/2) sinh (r/2) r= 1,2,..., (í/2) 20 1.3.2 Spojitá rozdělení (H) Beta rozdělení - B(a, ß) a'V2,fi=3 ^-1,fl = 3 *.2,fl"3 -{£-)'• ,<ß- Poznámka: 1. Rozdělení I\\, ß) se nazývá exponenciálne 2. Rozdělení í\n, ß), n * N, se nazývá Erlangovo. (J) Gumbelovo rozdělení (rozdělení extrémních hodnot) f(x; a,ß)~-exVUlZüJ.«p{-e-c*->«)f ß { ß I EX - a + y*/3, kde y* s 0,5772 je Eulerova konstanta, v «V var .Y - ——, 6 Ab- a, í - a - 0 In (In 2) , y, = Vl,29857 ( y2 a 2,4, 'ft, a ^; viz [78], m(ř)-ea'r(l-/30. '< ^ (K) Chí-kvadrát rozdělení - £ /(x; n)- -----L_^-»c-/2, *>0; n-1,2,...; 2"'2r(ä EX- n, var X —2n, Ab-n-2, n > 2, ft"2í- 12 ft- — n 24 2Ti + , /*, m(/) 1 _ 9A«n' (1 - 20 r- 1,2,..., 1 í < -. 2 Poznámka: Jedná se o speciální případ gamma rozdělení pro a — n/2 a ß-\. f(x;n> 0 z t 6 « 10 12 H 16 Obr. 3. Chí-kvadrát rozdílení (L) Laplaceovo (dvojitě exponenciální) rozdělení /(*; ß,B)~^exp{-ß\x- 0)}, x« Ä1; 0«Ä!, >3 > 0; E*« 0, *- e, ľ.-o, y2 - 3> /i2r_, -0, r- 1,2,..., 25 f*2r m(t) (2r)! ß ar ' r- 1,2..... 2 ' (M) Logaritmicko-normální rozdělení - LN(fi, o) /(*; P, o) 1 ox J2k exp (In x - m)2 2o2 x > 0; /íe R1 , a>0 EX D exp /i + — , t 2 J var X — ö>(0; 26 ea:= ô, var* ßW x0= e, x= e, ľi = o, ya- 1,2, /ťr a //; viz [78], m(/) - exp {8t\. (nßt cosec (nßt)) . fix) [SAO - 0,75 . \/3"0,2S \ /3-0(5 0,2 5 VV V\_ ß -1,0 ^, , i r>-—i "^^"i -2,0 "1,0 0 1,0 2,0 Obr. 5. Logistické rozdělení (0 - 0) (O) Mocninné rozdělení C Ix] f(x; d, c)--l-l , O<-t<0; 0>O, e >0; 0 w/ e* var* c0 c+ 1 rť? (c + 2)(c+l) aó - &, c > 1, e 2' X — 27 Y\ 2(i - c) jm P + c)fc ' 3(3^- c+ 2) (c+ 2) y2 - -i----------------íl--------í - 3 c(c + 3)(c + 4) tf- P c+ r , r- 1,2,.... (P) Normální jednorozměrné rozdělení - N{fi, <ř) * J-<^> /(x; p, o2) - ——-exp a 72it [ EJT-/I, var A-™ a2, *-/*, K -o, ^-i -0, r= 1,2,..., {2r)\ o2r 2a- x*Rx; pe R\ o2 >0 /*2, r! 2 —» '■-1.2,..., /77(ř) - exp tfi + 2„2 ťa 4 -3 -2 -1 0 12 3* Obr. 6. Normální rozdělení 28 (Q) Normální dvourozměrné rozdělení náhodného vektoru X - (Xu Xz)' 1 /(*»>; t*xi PP ° *> ° y> Q) =------------. .- 2noxayijl ~ o *e/?>, >e/?'; ^ejř1, ^eJř1, ox>0, oy>0, o,oy EXi = P*> EX2 = /*,» var XK = a\, var A"2 — a2,. (R) Normální mnohorozměrné rozdělení náhodného vektoru x-(xu...,xpy-np(ii,x) *=(*„...,*,)'e R"; p-fa...,?,)'*!?, I-^íX-y je symetrická pozitivně definitní matice řádu pXp a |E| je determinant matice£. var X - L , cov(^ř,A/) = oí/, lší/Sř. Nechť vektor X = (A"lf..., A"p)' má rozdělení 9tp(/*, £). Potom marginální rozdělení vektoru Xt *= (A";i,..., Xh)', kde 1 Ú j\ < ... < jk ^ p, je opět fc-rozměrné normální rozdělení Wt(/i„ £*), kde ^ * — (/í>(, ..., /*,,)' a £, - (o,,), y, l" h,...Jk. Poznámka: Je-li £ symetrická pozitivně semidefinitní matice hodnosti h(£) = r < p, neexistuje inverzní matice £~\ takže hustotu nelze vyjádřit způsobem obdobným jako výše. Takové rozdělení nazýváme singulární normální rozdělení. Přitom opět ft má význam vektoru středních hodnot a £ je varianční matice veličin Xu ..., Xp; více viz např. monografie [122], kapitola 8. Pro p *= 1 se v takovém případě jedná o degenerované rozdělení, tj. rozdělení náhodné veličiny X, jež nabývá hodnoty fi s pravděpodobností 1. 29 /(*„...,*„; /<,£) 1 (2kY1 IE (1/2 exp -iö' " " 0,0 ' ' ' 3,r3'6 Obr. 7. Dvourozměrné normální rozdčlenf - hustota a průměty řezů hustoty rovinami z — 0,01: z - 0,05; -- - 0,09; z - 0,13; - - 0,17; 2 - 0,21. a) o - 0,0 b) o------0,35 c) o« 0.75 30 Dvourozměrné normální rozdělení je singulární v případě $ -■ 1 nebo oj ™ 0 (S) Paretovo rozdělení /(*; ft, a) - -^ , * ž ft > 0 ; a > 0 ; x" ak EX =-------, a > 1, a — 1 aft2 var X =--------------------, a > 2, (a-2) (a-l)2 X{) — K , x=k2u\ Yi> ľz viz [78], //, =-------, a > r; r = 1, 2,.... a — r (T) Rovnomerné spojité rozdělení - R(a, b) 1 b- a f(x; a, b) = -------, -/2 EX-0, n > 1, var X-----------, n > 2, n - 2 *-0, y, = 0, n > 3, 6 xeR1; n -1,2, Vj n-4 n >4, //j, - nr-----------------------, n>2r, r-1,2,..., 4 í) /íj,,., -0, n >2r-l, r- 1,2,.... Poznámka: Rozdělení ^ se nazývá Cauchyho rozděleni -3-2-1 0 1 2 3 Obr. 8. Studentovo í-rozdélcní (V) Weibuuovo rozdělení - W(a, b) f{x\ a, b) - abxb-lexp{-axb\, x > 0 ; a > 0, b >0; 32 EX- varJť H ,'/* rKHK) ,2/* .1/* Ji iV ta afr/ (t)" y„ y2 viz [78], /*r .r/b , r-1,2,.... f (x,a,b) 1 2 Obr. 9. Weibullovo rozdelení 33