AKADEMIE VED CESKE REPUBLIKY Psychologický ústav Veveři 97, 602 00 Brno telefon, fax 05/ 74 46 67 ¥ r Receptář jednoduchých metod statistické indukce Lída Osecká & Pavel Osecký 1996 č. 3 ISSN: 1211-2631 Obsah A Třídění indukčních receptů 3 A.l Typy porovnávání dat....................... . 3 A.2 Stupně kvantifikace.......................... 5 A.3 Seznam charakteristik........................ 5 A.4 Typy procedur............................ 6 A.5 Kód receptu.............................. 8 B Recepty statistické indukce 9 Tabelované hodnoty............................ 9 Ia. Jednovýběrove vyšetřování alternativní proměnné.......... 9 Přesný interval spolehlivosti pro pravděpodobnost výskytu .... 9 Přibližný interval spolehlivosti pro pravděpodobnost výskytu . . 10 Minimální rozsah výběru pro pravděpodobnost výskytu..... 10 Přesnější test hypotézy o pravděpodobnosti výskytu....... 11 Přibližnější test hypotézy o pravděpodobnosti výskytu...... 11 Iaa. Jednovýběrove vyšetřování závislosti alternativních proměnných . 12 Test nezávislosti dvou alternativních proměnných......... 12 Test hypotézy o koeficientu alternativní korelace......... 13 In. Jednovýběrove vyšetřování nominální proměnné........... 13 Test o rozložení jedné nominální proměnné............ 14 Inn. Jednovýběrove vyšetřování závislosti dvou nominálních proměnných 14 Test o nezávislosti dvou nominálních proměnných......... 15 li. Jednovýběrove vyšetřování intervalové proměnné.......... 15 Interval spolehlivosti pro střední hodnotu............. 16 Mimmální rozsah výběru pro střední hodnotu........... 16 Test hypotézy o střední hodnotě.................. 17 Interval spolehlivosti pro směrodatnou odchylku ......... 17 Minimální rozsah výběru pro směrodatnou odchylku....... 18 Test hypotézy o směrodatné odchylce................ 18 Inn. Jednovýběrove vyšetřování závislosti intervalových proměnných . 19 Test hypotézy pro koeficient korelace................ 19 Ha. Dvojvýběrové porovnávání alternativní proměnné......... 19 Interval spolehlivosti pro rozdíl pravděpodobností výskytu .... 20 Minimální počet pozorování pro rozdíl pravděpodobností výskytu 20 Přesnější test hypotézy o rozdílu dvou pravděpodobností výskytu 21 Přibližnější test hypotézy o rozdílu dvou pravděpodobností výskytu 22 lín. Dvou výběrové porovnávání nominální proměnné.......... 22 Test hypotézy o shodnosti dvou rozložení ............. 23 1 11i. Dvouvýbérové porovnávání intervalové proměnné.......... 23 Interval spolehlivosti pro rozdíl středních hodnot......... 24 Minimální počty pozorování pro rozdíl středních hodnot..... 25 Test hypotézy o rozdílu středních hodnot ............. 26 Interval spolehlivosti pro podíl směrodatných odchylek...... 27 Minimální rozsah výběru pro podíl směrodatných odchylek ... 27 Test hypotézy o podílu směrodatných odchylek.......... 28 Ilii. Dvouvýběrové porovnávání závislosti intervalých proměnných . . 29 Test hypotézy o rovnosti dvou koeficientů korelace........ 29 Hin. Vícevýběrové porovnávání nominální proměnné.......... 30 Test hypotézy o shodnosti několika rozložení............ 30 IVa. Párové porovnávání alternativní proměnné............. 31 Test hypotézy o rovnosti dvou pravděpodobností výskytu .... 31 IVi. Párové porovnávání intervalové proměnné ............. 32 Interval spolehlivosti pro rozdíl středních hodnot......... 32 Minimální rozsah výběru pro rozdíl středních hodnot....... 33 Testování hypotézy pro rozdíl středních hodnot.......... 33 Testování hypotézy o podílu směrodatných odchylek....... 34 C Statistické tabulky 36 Tabulka Poissonovy pravděpodobnostní funkce............. 37 Tabulka normální standardizované distribuční funkce.......... 38 Tabulka normálních standardizovaných kvantilu............. 40 Tabulka Studentových kvantilu...................... 41 Tabulka Pearsonových kvantilu..................... . 42 Tabulka Fisherových-Snedecorových kvantilu.............. 44 Tabulka arkussinové transformace.................... 52 Tabulka entropické transformace..................... 53 Tabulka Fisherovy transformace ..................... 54 2 A Třídění indukčních receptů Následující text obsahuje základní hlediska, podle nichž se můžeme orientovat v receptech statistické indukce. Neočekávejme však, že tak dospějeme k jejich vyčerpávající a jednoznačné systematice. A.l Typy porovnávání dat Recepty jsou především roztříděny podle situace, ve které porovnáváme data získaná za různých podmínek. I = jednovýběrové vyšetřování: Vyšetřujeme jediný datový soubor, který neumožňuje porovnávat data popř. jejich závislost za různých podmínek. Datový soubor má tvar «i «2 popř. «i y i «2 V2 « n V n II = dvouvýběrové porovnávání: Porovnáváme data popř. jejich závislost ve dvou nezávisle získaných datových souborech, které mají tvar r «12 211 «22 «21 _ Xn\l «n22 popr. «21 ž/21 «12 2/12 «22 y22 «no2 2Mo2 3 Ill = vícevýběrové porovnávání: Porovuáváme data popř. jejich závislost, v g nezávisle získaných datových souborech, které mají tvar »12 »u »22 «21 . Snil . Xn^-2 »lc ■ngg J popr. »n yn «21 1/21 »nil 2/n].! »12 í/12 »22 2/22 »n02 yn22 »ig yiff »2ff y2ff _ »ngff 2/ngff _ IV = párové porovnávání: Porovnáváme data v prvním a druhém sloupci jediného párového datového souboru, který vznikl buď zkoumáním nějakých přirozených párů nebo dvojím vyšetřováním týchž objektů. Párový datový soubor má tvar »11 »12 »12 »22 »ni »n2 4 A.2 Stupně kvantifikace Recepty jsou dále tříděny podle úrovně kvantifikace, které dosahuje zkoumaná proméná. Mohou být použity i na vyšších úrovních měření, ne však na nižších. a = alternativní proměnná: Nabývá jen hodnot 0 a 1, znamenajích nepřítomnost nebo výskyt nějakého jevu. Podle okolností může být ztotožněna s kterýmkoliv dále uvedeným typem proměnné. n = nominální proměnná: Věcný význam má jen různost a totožnost dvou číselných hodnot, které jsou pouhým kódem kvalitativních pojmenování. o = ordinální proměnná: Navíc má věcný význam i větší nebo menší číselná hodnota, ne však velikost jejich rozdílu. i = intervalová proměnná: I větší nebo menší délka intervalu mezi dvěma číselnými hodnotami má věcný význam, ne však poměr obou těchto hodnot. p = poměrová proměnná: Konečně lze připsat věcný význam i poměru dvou číselných hodnot. Jde o kvantitativní měření v plném slova smyslu. A.3 Seznam charakteristik Detailní třídění receptů odpovídá teoretické statistické charakteristice, na niž se induktivní úloha zaměřuje. 9 = pravděpodobnost výskytu Ol ~ do = rozdíl dvou pravděpodobností výskytu On = koeficient alternativní korelace Ti"(a;) = pravděpodobnostní funkce jedné proměnné ~{x.y) = simultánní pravděpodobnostní funkce dvou proměnných 7Ti(ar), 77-2(2/) = marginální pravděpodobnostní funkce obou složek 771(a,')..... TTgix) = porovnávané pravděpodobnostní funkce Oi = Spearmanův koeficient pořadové korelace ji = střední hodnota ji\ — (.Li — rozdíl dvou středních hodnot (7 = směrodatná odchylka ťJi/ťJ-2 = podíl dvou směrodatných odchylek o = koeficient lineární korelace Oj — 0-2 = rozdíl dvou koeficientů lineární korelace A.4 Typy procedur Pro různé typy otázek jsou ve statistice vypracovány odpovídající procedury, které představují poslední hledisko třídění statistických receptů. S = stanovení intervalu spolehlivosti: Protože informace o přesné hodnotě teoretické charakteristiky \) je zpravidla nedostupná, bývá aspoň z výběrových dat sestrojován takový interval o dolní popř. horní hranici d popř. h, který by s velkou pravděpodobností 1 — a tuto neznámou charakteristiku pokrýval; číslo a představuje přijatelné riziko nepravdivého stanovení tohoto intervalu a volí se nejčastěji rovno 0,05 nebo 0,01. Podle potřeby vystupuje interval spolehlivosti v levostranné, oboustranné popř. pravostranné formě, charakterizované postupně jednou ze tří pravděpodobností P{d < ů ) > 1 - a P(d < ů < h) > 1-a P{ d < h) > 1-a — Ve standardních statistických programech se zpravidla uvádějí oboustranné intervaly spolehlivosti. N = určení potřebného rozsahu výběru: Je žádoucí, aby oboustranný interval spolehlivosti vycházel co možno úzký. Jestliže uživatel zvolí jeho maximální ještě přijatelnou šířku 5 při stanoveném riziku a, poskytne mu v některých případech statistická procedura vzorec pro minimální rozsah výběru, kterého je zapotřebí ke s plnění jeho požadavků. Někdy se přijatelná šířka intervalu spolehlivosti vyjadřuje podílem k jeho horní a dolní hranice. P = stanovení predikčního intervalu: Tak jako má interval spolehlivosti pokrýt s velkou pravděpodobností neznámou teoretickou charakteristiku í), pokrývá predikční interval o dolní popř. horní hranici d* popř. h* nějaké dosud nepozorované statistiky m*. Vyskytuje se rovněž ve třech formách charakterizovaných postupně pravděpodobnostmi P{d, < m. ) > 1-a P(d„ < m. < h*) > 1-a P{ m, < A„) > 1-a kde číslo a vyjadřuje riziko nepravdivého stanovení predikčního intervalu a volí se nejčastěji jako 0,05 nebo 0,01. 6 H = testovaní statistické hypotézy: Nějaký vnější, na analyzovaných datech nezávislý důvod nás nutí uvažovať, o domněnce, že neznáma hodnota teoretické charakteristiky ů se rovná danému číslu c. Toto tvrzení ů = c se nazýva testovanou hypotézou a konkuruje s hypotézou alternativní, která opět nesmí záviset na analyzovaných datech a bývá uváděna v Ie-vostranné, oboustranné popŕ. pravostranné formě ■§ < c : d ^ c : c < d Do role testované hypotézy dosazujeme často skeptické tvrzení, které si ve skutečnosti prejeme vyvrátit, nebo naopak vztah, který podmiňuje zamýšlené použití nějakého matematického modelu. Alternativní hypotézy se nejčastěji užívá v její oboustranné formě, kdežto levostrannou či pravostrannou formu zvolíme v případě, že opačné jednostranné tvrzení je předem vyloučeno nebo nás nezajímá. V této situaci matematická statistika odvozuje vzorce pro kritický obor W, což je nějaká číselná množina, a pro testovou statistiku ť, což je náhodná veličina. Platí pro ně implikace tvrdící, že v případě pravdivosti testované hypotézy nepřesáhne pravděpodobnost P(t e W) < a číslo a, které se nazývá rizikem neoprávněného zamítnutí testované hypotézy a volí se nejčastěji rovno 0,05 nebo 0,01. Jestliže se tedy testová statistika t navzdory této nepatrné pravděpodobnosti přece jenom realizuje v kritickém oboru W, zamítáme testovanou hypotézu pro její rozpor s daty. Realizuje-li se testová statistika mimo kritický obor, k žádnému rozporu nedochází a testovanou hypotézu přijímáme jako nadále podrži-telnou. Kritické obory pro shora uvedené formy alternativních hypotéz mají formu intervalů nebo jejich sjednocení a jsou vymezeny po řadě kritickými podmínkami t < ta : t < taj2 nebo t\—a/2 < t "■ H-a/2 < t Testování statistické hypotézy se nemusí týkat jen číselných, ale i funkcionálních teoretických charakteristik, jako jsou např. pravděpodobnostní funkce či hustoty pravděpodobnosti: tím se mohou obměnit i uváděné formy testovaných a alternativních hypotéz. — Ve standardních statistických programech se netisknou kritické obory, ale ekvivalentně tzv. dosažené hladiny průkaznosti p vyjadřující riziko, jež by bylo třeba volit, aby testová statistika padla právě na hranici kritického oboru. Testovaná hypotéza se pak zamítá v případě p < a T = stanovení intervalu tolerance: Označme symbolem G(d#,h#) podíl všech hodnot zkoumané náhone veličiny, který Ježí v intervalu o dolní popř. horní hranici d# popř. h#. Tyto hranice vsak jsou sestrojeny z výběrových hodnot tak, aby zmíněný podíl dosahoval alespoň hodnoty 7, a to s velkou pravděpodobností 1 —a. Riziko nepravdivého stanovení intervalu tolerance a volíme nejčastěji 0,05 nebo 0,01, hodnotu 7 podle potřeby kdekoliv mezi hodnotami od 0 do 1. Interval tolerance se opět vyskytuje ve třech formách charakterizovaných pravděpodobnostmi P(G(-co,/i#) >7) > l-a P{G{d#,h# )>7)> 1-a P{G{d#, 00) >7) > l-a A.5 Kód receptu Na základě čtyř právě uvedených hledisek byly recepty statistické indukce v kapitole B roztříděny takto: — Nadpisy částí receptáře obsahují římské číslo vyjadřující typ porovnávání dat a malé latinské písmeno odpovídající stupni kvantifikace zkoumané proměnné. Zdvojení tohoto písmene odkazuje na charakteristiku závislosti mezi dvěma proměnnými. — Kódy jednotlivých receptů jsou uvedeny v rámečku a sestávají z římského čísla vyjadřujícího typ porovnávání dat, z řeckého označení pojednávané teoretické charakteristiky a konečně z velkého latinského písmene odpovídajícího hledanému typu statistické procedury. \ *z 'ľ f y .''j 1 ,'">•" 1 -- /... z7' jf'^~ / /'/ „ i. f í! p /■■■■ :■• 4* // <&r É$ /-v /\ h... • ; C ■ " ■ " "-'"■ * : /Q: ., -* -• XT /tŕ" / #&^ ,/ j-,'- ''■a- 4 ,/' ■ XI B Recepty statistické indukce Tabelované hodnoty ul-a/2i Ul-a = kvantily stand, normálního rozložení XI-a/2(Z/)- XÍ-a(v) = kvantily Pearsonova rozložení h-allty), íl-a(^) = kvantily Studentova rozložení Fi-*fi{v\.,V2), F1^a{ul,U2) = kvantily Fisherova-Snedecorova rozl. a = 2 arcsin(-v/p) = arkussinová transformace z = i^(rS) = Fisherova transformace la. Jednovyběrove vyšetřování alternativní proměnné 9 - pravděpodobnost výskytu n — rozsah výběru nx = absolutní četnost výskytu n0 = absolutní četnost absence P = relativní četnost výskytu = ni/n X - 1 0 ni no v n I 9 S Přesný interval spolehlivosti pro pravděpodobnost výskytu 9 ® Najdi označení la. » Zvol jednu ze tří forem intervalu spolehlivosti a riziko a. • Vypočti pomocné údaje a vyhledej kvantily: ^ = 2(n0+l) z/j = 2ni ir1_a/2(^! v'2\ Fi_a(j>{, i/2) v'{ - 2{ni + 1) VH = 2n0 -Fi^/o^i', vó') Fi-a(v\; ,v%) • Dosaď do zvolené formy intervalu spolehlivosti: ni ni + (n0 + l)Fi_Q(z/^.^) ___________"j___________ ni 4- ("o + l)Fi-a/2[v'L, ^ój < < < < (nL + 1)^1-^2(^1', vy) ^0 + (n: + l)Fi.a./2{^i, v? - -■{ni- + -l)-Fi-~a{i*[!yi/X} - - "0 + ("1 + l)Fi-a{vi\ »2 ) 9 í 9 S Přibližný interval spolehlivosti pro pravděpodobnost výskytu 9 • Najdi označení Ia a ověř předpoklady receptu: n > 30 a 0 96 9 7a 1 • Zvol jednu ze tří forem intervalu spolehlivosti a riziko a. 9 Vypočti pomocný údaj a vyhledej kvantiiy: /P(l-P) SO = \/------------- "l-a/2 "1-a * Dosaď do zvolené formy intervalu spolehlivosti: p — ui-asQ < 9 p— Ul_a/2S0 < 9 < P + Wl-a/2-So 9 < p + ui-aSQ I 9 N Minimální rozsah výběru pro pravděpodobnost výskytu 9 « Najdi označení Ia a ověř předpoklady receptu: 0 ^ 9 ýi 1 « Zvol přípustnou délku oboustranného intervalu spolehlivosti 5 a riziko o.-. ® Vyhledej kvantu iíi_a/2 a pokud není o 9 předem nic známo, polož A = 1/2 Víš-li předem, že nemůže platit 9 « 1/2, stanov hranici A tak, aby byla splněna jedna z nerovností O<0. 10 • Zvol riziko a, specifikuj číslo c v testované hypotéze 0 = c a zvol jednu ze tří alternativních hypotéz: 9 30 a 0 76 9 tft 1 • Zvol riziko a, specifikuj číslo c v testované hypotéze 9 = c a zvol jednu ze tří alternativních hypotéz: 9 3 pro všechna j, k • Zvol riziko a, testovanou hypotézu o nezávislosti obou proměnných ir(x,y) = ~i(x) ~2(y) pro všechna x, y a alternativní hypotézu, že předešlá rovnost neplatí pro některá x.y. » Vyhledej kvantu x\-a{v) Pro v — \. • Vypočti testovou statistiku: 2 (i"n"oo - "io"oi| - 1/2|)2 X = "------------------------------------ "l."0.".l".0 • Zamítni testovanou hypotézu, pokud je splněna tato kritická podmínka: r >xi-a{v) 12 I o H Test hypotézy o koeficientu alternativní korelace o a Najdi označení laa a ověř predpoklady receptu: n.jk > 3 pro všechna j\ k ® Zvol riziko a, užij testované hypotézy 5 = 0 a zvoljednu ze tří alternativních hypotéz: Q<0 g^O 0 < g ® Vyhledej kvantily: ui_Q/2 "i-a « Vypočti testovou statistiku: u = vn y/nino.n.in.o • Zamítni testovanou hypotézu, pokud je splněna ta ze tří kritických podmínek, která se pořadím shoduje se zvolenou hypotézou alternativní: ■u < —«i-a u < —U\-a/2 nebo t 4 a no > 4 a ... a nv > 4 • Zvol riziko a, specifikuj čísla ci, C2,..., cv v testované hypotéze x{x[i]) = ci a ^(^pl) = c2 a ... a 7r(ar[w]) = c„ a užij alternativní hypotézy, že aspoň jedna z předešlých rovností neplatí. • Vypočti pomocné hodnoty a vyhledej kvantil: ňj = ncj pro j = l,...,v v = v - 1 Xi-aM- • Vypočti testovou statistiku: o Y~^ (1%" ~ nil ~~ 1/2)" i=i J • Zamítni testovanou hypotézu, je-i splněna tato kritická podmínka: X2 >Xi-a(v) Inn. Jednovýběrové vyšetřování závislosti dvou nominálních proměnných ic{x,y) - pravděpodobnostní funkce dvojice alternativních proměnných. TTi(x) = pravděpodobnostní funkce první proměnné *2{y) = pravděpodobnostní funkce druhé proměnné n = rozsah výběru njk = absolutní četnost dvojice x\j],y[k] nj. absolutní četnost hodnoty x[j] první proměnné n.k = absolutní četnost hodnoty y^k} druhé proměnné X\Y m m ■ • • í/M v XM nu «12 ■ • Tlím "l. X[l] «21 «22 ■ ■ n2w Tin. x[v] nvi nV2 ■ ■ nVUT nv. v n.i n.2 ■ • nw n 14 I TT {x, y) H Test hypotézy o nezávislosti dvou nominálních proměnných * Najdi označení Inn a ověř předpoklady receptu: n j k > 2 pro všechna j, k * Zvol riziko a, užij testované hypotézy o nezávislosti dvou proměnných Tr(x.y) — TT\.{x) iTiiy) pro všechna x, y a alternativní hypotézy, že předešlá rovnost je pro některá ar, y porušena. 9 Vypočti pomocné hodnoty a vyhledej kvantu: ljk = Tij.n.k pro všechna j,k v — [v — l)(w — 1) Xl-aiu UjU.k Vypočti testovou statistiku x2 = n[ (ŽĚ *j* -1 J=1Á=1 J Zamítni testovanou hypotézu, je-li splněna tato kritická podmínka: X" > XÍ-aM li. Jednovýběrove vyšetřování intervalové proměnné /i = teoretická střední hodnota CT = teoretická směrodatná odchvlka n = rozsah vvýbéru m — výberový průměr s — výběrová směrodatná odchýlka 15 I /i 5 Interval spolehlivosti pro střední hodnotu \l • Najdi označení li a ověř předpoklady receptu: normální rozložení nebo n > 30 • Zvol jednu ze tří forem intervalu spolehlivosti a riziko a. • Vypočti pomocné údaje a vyhledej kvantily: ß So = -7= í/ =71-1 *l-a(v) h-af2{v) y/U 9 Dosaď do zvolené formy intervalu spolehlivosti: m - H_a/2Í>) So < li < m + íi-a/oí^) So /i < m + ť1_a(t/)s0 / \x N Minimální rozsah výběru pro střední hodnotu \i 9 Najdi označení li a ověř předpoklady receptu: normalita rozložení 9 Zvol riziko a a přípustnou délku oboustranného intervalu spolehlivosti S. 9 Z předběžného výběru o rozsahu n* v mezích asi od 5 do 30 vypočti výběrový rozptyl sj; a v tabulkách vyhledej kvantu v* — n — 1 tl_a/2{v~) 9 Doplň předběžný výběr na rozsah daný vzorcem: 4r?_Q/2K)s°; "* -------p------- 16 [pH Test hypotézy o střední hodnotě p • Najdi označení ti a ovéř předpoklady receptu: normální rozložení nebo n > 30 * Zvol rlniziko a, specifikuj číslo c v testované hypotéze p — c a zvol jednu ze tří alternativních hypotéz: p < c : p i=- c : c < p @ Vypočti pomocné hodnoty a vyhledej kvantily: g SO = -7= V - n- l tl-a/liv) tl-a{v) Vn ® Vypočti testovou statistiku: m — c t = -------- so • Zamítni testovanou hypotézu, pokud je splněna ta ze tří kritických podmínek, která se pořadím shoduje se zvolenou hypotézou alternativní: I a S Interval spolehlivosti pro směrodatnou odchylku a- © Najdi označení li a ověř předpoklady receptu: normální rozložení nebo n > 30 ® Zvol jednu ze tří forem intervalu spolehlivosti a riziko a. 9 Vypočti pomocné údaje a vyhledej kvantily: V = n-1 Xa/jí") XaH Xl-aM Xl-a/sM ® Dosaď do zvolené formy intervalu spolehlivosti: / n-1 5\ H-----7-T < cr n — l n — l ;--------— < (T < S xi-a/sM V x;/o(^ /n-1 30 a n2 > 30 a 0 $é 9X $ 1 a 0 96 92 # 1 • Zvol jednu ze tří forem intervalu spolehlivosti a riziko a. 9 Vypočti pomocnou hodnotu a najdi kvantily: • /Pi(l-Pi) , P2(l-Pa) S0 = W-----------------1----------------- «l-a/2 U!_a y «1 n2 Dosaď do zvolené formy intervalu spolehlivosti: Pl — P2 — Ul-aSo < 9\ — 9n pl -P2 — y-l-a/2^0 < 9i — 92 < Pl — P2 + «l-a/2^0 9i — 92 < Pl — P2 +W1-Q.50 JJ #i - 02 N Minimální počet pozorování pro rozdíl pravděpodobností výskytu 9\ — 92 9 Najdi označení IIa a ověř předpoklady receptu: 0 gé 0i 9Ž 1 a 0^02^1 » Zvol riziko a a přípustnou délku oboustranného intervalu spolehlivosti 6. « Vyhledej kvantil ui_Q/2- ♦ Minimální rozsah vyberu je dán vzorcem: II 9\ - Q? H Přesnější test hypotézy o rozdílu dvou pravděpodobností výskytu 9\_ — 92 • Najdi označení Ha a ovér předpoklady receptu: ni > 10 a n2 > 10 a 0 $ 9X ^ 1 a 0 jk 92 # 1 • Užij testované hypotézy zvol riziko a a jednu ze tří alternativních hypotéz: 0i - 92 < 0 : di - 9o £ 0 : 0 < 9X - 92 • Vypočti pomocné hodnoty a vyhledej kvantily: 1 1 s0 = ni n2 cti = 2 arcsin(v/pi) a2 = arcsin(-v/p2) ^i-a/2 ^í-a Vypočti testovou statistiku: a\ — an u = --------- Zamítni testovanou hypotézu, pokud je splněna ta ze tří kritických podmínek, která se pořadím shoduje se zvolenou hypotézou alternativní: u < —ui_a : u < —ui-a/2 nebo ui_a/o < u : ííi_a < '" 21 II #L — 9'2 H Přibližnější test hypotézy o rozdílu dvou pravděpodobností výskytu 0i — 0o • Najdi označení IIa a ověř předpoklady receptu: ni > 30 a n2 > 30 a 0 96 9X 96 1 a 0 96 92 ffi 1 • Specifikuj číslo c v testované hydpotéze 0i - 02 = 0 zvol riziko a a jednu ze tří alternativních hypotéz: 0i - 02 < 0 : 0i - 02 #■ 0 : 0 < 0i - 02 • Vypočti pomocné hodnoty a vyhledej kvantily: so = Pl(l-Pl) , P2(l-ř>2) Tli + "l-a/2 "1-Q Vypočti testovou statistiku: P1-P2-C «o • Zamítni testovanou hypotézu, pokud je splněna ta ze tří kritických podmínek, která se pořadím shoduje se zvolenou hypotézou alternativní: u < —ui_a : v, < —Ui_a/2 nebo «i_a/2 < u : «i-« < u lín. Dvouvýběrove porovnávání nominální proměnné íTi(ar), "2(ar) «j* n.A n porovnávané pravděpodobnostní funkce absolutní četnost hodnoty ar^-j v k—tém výběru celková absolutní četnost hodnoty x^ v obou výběrech rozsah k—tého výběru celkový rozsah obou výběrů *\# 1 2 u X[í] X[l] X[v] nu "•21 7112 "■22 n-v2 "i, ft2. V n.i ft. 2 n ">2 ÍI 7T[(j;), 7T2{ar) H Test hypotézy o shodnosti dvou rozložení tT[ (x). tt^Íx) ® Najdi označení íln a ověř předpoklady receptu: Tijk > 2 pro všechna j, k » Zvol riziko a, užij testované hypotézy o shodnosti obou pravděpodobnostních funkcí 7Ti(ar) = ir2{x) pro všechna x a alternativní hypotézy, že tato rovnost je pro některá x porušena. • Vyhledej kvantily Xl-a/oM Xl-a(") • Vypočti testovou statistiku 7 i v i ■/T'N- \r> 1 x—^ (w.l^jl'-^.Tí^^j^j X = E ,7=1 J •/~ Zamítni testovanou hypotézu, pokud je splněna kritická podmínka 2 -^ 2 /' \ Ili. Dvouvýběrove porovnávání intervalové proměnné A*it ^2 = porovnávané střední hodnoty ffi, <72 = porovnávané teoretické směrodatné odchylky Tli, • «2 = rozsahy porovnávaných výběrů ■mi ffl] = porovnávané výběrové průměry 51, So = porovnávané výběrové směrodatné odchylky 23 // ßi — /Jo S Interval spolehlivosti pro rozdíl středních hodnot ßi — ß? • Najdi označení líi a ověř předpoklady receptu: normálni rozložení nebo ni > 30 u prvního výběru a normální rozložení nebo no > 30 u druhého výběru 9 Zvol jednu ze tří forem intervalu spolehlivosti a riziko a. • Je-li předem známo, že variabilita u obou výběrů je stejná, tj. že Najdi označení Hi a ověř předpoklady receptu: normální rozložení nebo ni > 30 u prvního výběru a normální rozložení nebo n2 > 30 u druhého výběru Specifikuj číslo c v testované hypotéze \l\ — /Í2 = c zvol jednu ze tří alternativních hypotéz Pí ~ Pí < c : ßi — ß2 7= c : c < ni — fj,2 a riziko a. Je-li předem známo, že variabilita u obou výběrů je stejná, tj. že o~\ = V2) Fl-a{v2,V\) Fi-a/2(vi, V?) ^1-0/2(^,^1) a Dosaď do zvolené formy intervalu spolehlivosti: íl / l < £. Si 1 < Sx < —\M-a/2(^2,^l) ~~ S2\j Fi_a/2{^l,V2) ^ S2 Si II cti/<72 N Minimální rozsah výběru pro podíl směrodatných odchylek (Ti/cxn ® Najdi označení Ili a ověř předpoklady receptu: normalita rozloženi • Zvol přípustn podíl horní a dolní meze oboustranného intervalu spolehlivosti k a riziko a. 9 V tabulkách kvantilů najdi zkusmo co nejmenší počet stupňů volnosti v vyhovující vztahu Fl-i = ni — 1 un — no — 1 ^1-0(^1,^2) -^1-0(^2,^1) ^i-a/2^1,^2) ^1-0/2(^2,^1) • Vypočti testovou statistiku: ^ = ~ • Zamítni testovanou hypotézu, pokud je splněna ta ze tří kritických podmínek, která se pořadím shoduje se zvolenou hypotézou alternativní: F < f^Jvm) • F < fx.^Wi) nebo ^1-/2(^1, "2) < F : Fl.a{ul,u2) < F 28 [Hi. Dvouvýběrové porovnávání závislosti intervalových proměnných 9i, 3 pro všechna j, k • Zvol riziko a a testuj hypotézu o shodě všech rozložení 7Ti(a?) = ... = irg{x) proti alternativní hypotéze, že alespoň jedna z rovností je pro některá x porušena. • Vypočti pomocné hodnoty a vyhledej kvantily: v=(v-l)(g-l) x\-M ® Vypočti testovou statistiku: v g 2 / i'" 5.^'- Zamítni testovanou hypotézu, pokud je splněna kritická podmínka 30 IVa. Párové porovnávání alternativní proměnné 0i, h n Tljk Tlj. n.k = porovnávané pravděpodobnosti rozsah výběrového souboru absolutní četnost dvojice hodnot j, k absolutní četnost hodnoty j u první proměnné absolutní četnost hodnoty k u druhé proměnné X\Y 1 0 yj 1 0 nu "ío. "01 "00 "i. "0. v n.i n.o n IV 91 — 02 H Test hypotézy o rovnosti dvou pravděpodobností výskytu 9\ — #2 ® Najdi označení IVa a ověř předpoklady receptu: noi > 2 a nio > 2 « Zvol riziko a, užij testované hypotézy 9i - 92 = 0 a alternativní hypotézy Vyhledej kvantil Vypočti testovou statistiku 9i - 92 ž 0 *=1 Xi-a{v) X" - |"io - "oi| - l)2 "10 + "01 • Zamítni testovanou hypotézu, pokud je splněna kritická podmínka Xl-a(ľ) < X2 31 IVi. Párové porovnávání intervalové proměnné ßl, ß2 — porovnávané střední hodnoty CT[ , (To — porovnávané teoretické sm. odchylky n — rozsah porovnávaného párového výběru mi, mi — porovnávané výběrové průměry «li s2 — porovnávané výběrové směrodatné odchylky r 12 — koeficient lineární korelace v párovém výběru m - průměr rozdílového výběru — rnl — m2 s — směrodatná odchylka rozdílového výběru — x/sf + So — 2 S\ Sn 7*12 (První a druhá složka párového výběru je odlišena indexy 1, 2. Vytvoříme-li z každého páru rozdíl, vzniká rozdílový výběr.) Interval spolehlivosti pro rozdíl středních hodnot /zt — /j,2 • Zvol jednu ze tří forem intervalu spolehlivosti a riziko a. • Najdi označení IVi a ověř předpoklady receptu: normalita rozložení nebo n > 30 • Vypočti pomocné hodnoty a vyhledej kvantily: SO = -7= V = n-1 ti_a(ľ) íl-a/2(^) V Ti • Dosaď do zvolené formy intervalu spolehlivosti: m — ti-a{v)so < P1 — P2 m — ti-a/2{l/)SQ < ßl — /io < rn + tl-a/2(1/)s0 Pi — ß2 < m + ťi_a(í/)s0 IV fii — H2 s 32 IV fil — fi2 N Minimální rozsah výběru pro rozdíl středních hodnot pii — fi2 » Najdi označení IVi a ověř předpoklady receptu: normalita rozloženi nebo n > 30 * Zvol riziko a a přípustnou délku oboustranného intervalu spolehlivosti S. ® Z předběžného rozdílového výběru o rozsahu n. v mezích asi od 5 do 30 vypočti výběrový rozptyl si a v tabulkách vyhledej kvantil f* = n» tl-a/2^) ® Doplň předběžný párový výběr na rozsah daný vzorcem: IV fii — fj,2 H Testování hypotézy pro rozdíl středních hodnot fxi — ß2 • Najdi označení IVi a ověř předpoklady receptu: normalita rozloženi nebo n > 30 • Zvol riziko a, užij testované hypotézy ß\ — P2 — 0 a vyber jednu ze tří alternativních hypotéz: fii — H2 < 0 : \i\ — \i2 t^ 0 : 0 < ßi — pt2 • Vypočti pomocné hodnoty a vyhledej kvantily: V = n- 1 tl-a{v) tl-a/2{v) • Vypočti testovou statistiku: mi — mn — c í = —--------=------ so • Zamítni testovanou hypotézu, pokud je splněna ta ze tří kritických podmínek, která se pořadím shoduje se zvolenou hypotézou alternativní: t < -ťi_a(ľ) : t < -tl-a/2{v) nebo ti-a/2{v) < * •' Íl-a{v) < t 33 IV er 11 an H Testovaní hypotézy o podílu směrodatných odchylek • Najdi označení IVi a ovéř předpoklady receptu: normalita rozložení nebo n > 30 • Zvol riziko a, užij testované hypotézy CTi/čTo = 1 a vyber jednu z alternativních hypotéz 0"i/tf"2 < 1 : (Ti/cro ^1 •' 1 < cri/^2 • Vypočti pomocné hodnoty a vyhledej kvantily: u-n-2 ti-a(^) *l-<*/2(W • Vypočti testovou statistiku: — (gi ~ ^Í)v/72 ~ 2 2V/sisÍ(1 ~r12) Zamítni testovanou hypotézu, pokud je splněna ta ze tří kritických podmínek, která se pořadím shoduje se zvolenou hypotézou alternativní: t < — tl-a(v) '- t < — H-alliy) nebo ťi_a/2(2/) < i '■ ti-a(v) < t 34 Kritické oblasti pro testovaní hypotéz a = riziko neoprávněného zamítnutí testované hypotézy ua o o u,_fl o x. 0Xa/2 ta 0 ta/2 0 t,_a/2 0 t,-o 0 • f;. Ua =- U|. ta(^) = -t,-a(l/) f°^^TTM 35 C Statistické tabulky Poissonova pravděpodobnostní funkce Normální standardizovaná distribuční funkce Normální standardizované kvantily Studentovy kvantily Pearsonovy kvantily Fisherovy-Snedecorovy kvantily Arkussinová transformace Entropická transformace Fisherova transformace 36