Vzorová písemná zkouška z předmětu Aplikovaná statistika I Úkol 1.: Pro kontingenční tabulku 3 x 3, kterou jsme vytvořili na základě náhodného výběru (X1, Y1), …, (X858, Y858), byla spočtena testová statistika K = 464 pro test nezávislosti veličin X, Y. Určete Cramérův koeficient. Řešení: Cramérův koeficient = 0,52 Úkol 2.: U 200 náhodně vybraných absolventů jisté VŠ, mezi nimiž bylo 73 žen, bylo zjišťováno, zda pracují v řídicí funkci. V řídicí funkci pracuje 57 mužů a 24 žen. Vypočtěte a interpretujte podíl šancí mužů a žen na práci v řídicí funkci. Řešení: Sestavíme čtyřpolní kontingenční tabulku simultánních absolutních četností: pohlaví respondentaPráce v ŘF muž žena nj. ano 57 24 81 ne 70 49 119 n.k 127 73 200 66,1 7024 4957 bc ad OR = ⋅ ⋅ == což znamená, že muži mají 1,66x vyšší šanci na práci v řídicí funkci než ženy. Úkol 3.: Je dána neúplná tabulka ANOVA. Místo otazníků doplňte chybějící čísla. zdroj variability součet čtverců stupně volnosti podíl FA skupiny ? 2 ? ? reziduální 16,033 ? ? celkový 17,301 35 - - Řešení: zdroj variability součet čtverců stupně volnosti podíl FA skupiny 1,268 2 0,634 1,304 reziduální 16,033 33 0,486 celkový 17,301 35 - Úkol 4.: Získali jsme náhodný výběr rozsahu 18 z dvourozměrného rozložení, jímž se řídí náhodný vektor (X,Y). Je známo, že náhodné veličiny X a Y jsou ordinálního typu a že součet kvadrátů odchylek pořadí ( )∑= =− 18 1i 2 ii 502QR . Na hladině významnosti 0,05 testujte hypotézu, že náhodné veličiny X a Y jsou pořadově nezávislé proti oboustranné alternativě. Uveďte hodnotu testové statistiky, kritický obor a rozhodnutí o nulové hypotéze. Řešení: Na hladině významnosti 0,05 testujeme H0: X, Y jsou pořadově nezávislé náhodné veličiny proti oboustranné alternativě H1: X, Y jsou pořadově závislé náhodné veličiny. Vypočteme realizaci testové statistiky: ( ) ( ) ( ) 4819,0 969 467 502 11818 6 1QR 1nn 6 1r 2 n 1i 2 ii2S == − −=− − −= ∑= V tabulkách najdeme kritickou hodnotu: rS,0,975(18) = 0,4716. Protože 0,4819 > 0,4716, nulovou hypotézu zamítáme na hladině významnosti 0,05. Úkol 5.: Náhodný výběr rozsahu 400 pochází z normálního rozložení s neznámou střední hodnotou µ a rozptylem 01,02 =σ . Výběrový průměr nabyl hodnoty 0,01. Jaká je hodnota testové statistiky pro test hypotézy H0: 0=µ proti alternativě H1: 0≠µ ? Odpověď: 2 400 1,0 001,0 n cm t0 = − = σ − = Úkol 6.: Pomocí mediánového testu testujeme na hladině významnosti 0,01 hypotézu, že 7 nezávislých náhodných výběrů, které mají všechny rozsah 11, pochází z téhož rozložení. Stanovte kritický obor pro test této hypotézy. Řešení: ( ) ) ( ) ) )∞=∞χ=∞−χ= α− ,812,16,6,1rW 99,0 2 1 2 Úkol 7.: Pro náhodný výběr (Xi, Yi) , i = 1, ..., 27 z dvourozměrného normálního rozložení byl vypočten výběrový koeficient korelace 0,77. Na hladině významnosti 0,01 testujte hypotézu o nezávislosti veličin X, Y proti pravostranné alternativě. Řešení: Testová statistika 034,6 77,01 22777,0 R1 2nR T 22 12 12 = − − = − − = , kritický obor pro pravostrannou alternativu ( ) ) ( ) ) )∞=∞=∞−= α− ,462,2,25t,2ntW 99,01 . Protože testová statistika se realizuje v kritickém oboru, nulovou hypotézu zamítáme na hladině významnosti 0,01 ve prospěch levostranné alternativy. Úkol 8.: V 500 po sobě jdoucích zápisech v matrice narozených je 266 chlapců a 234 dívek. Lze na asymptotické hladině významnosti 0,1 zamítnout hypotézu, že narození dívky a chlapce je stejně pravděpodobné? Řešení: Zavedeme náhodný výběr X1, …, X500, přičemž Xi = 1, když i-té narozené dítě je chlapec a Xi = 0, když i-té narozené dítě je dívka, i = 1, .., 500. Tyto náhodné veličiny tvoří náhodný výběr z rozložení ( )ϑA . Na asymptotické hladině významnosti 0,1 testujeme hypotézu H0: ϑ = 0,5 proti H1: ϑ ≠ 0,5. Ověření podmínky dobré aproximace: 488,124 500 234 500 266 500 =⋅⋅ , což je větší než 9, podmínka je splněna. Realizace testové statistiky: ( ) ( ) 4311,1 500 5,015,0 5,0532,0 n c1c cm t0 = − − = − − = Kritický obor: ( ) ( )∞∪−∞−=∞∪−∞−= ,28155,128155,1,,uu,W 95,095,0 Protože testová statistika se realizuje v kritickém oboru, nulovou hypotézu zamítáme na asymptotické hladině významnosti 0,1. S rizikem omylu nejvýše 0,1 jsme tedy prokázali, že pravděpodobnost narození chlapce a dívky se liší. Upozornění: Každý úkol je hodnocen maximálně 7 body. Pro úspěšné absolvování písemné části zkoušky je nutné získat aspoň 30 bodů.