Zadání příkladů — Statistická inference II — 2017 Příklad 1. Směs dvou normálních rozdělení Nechť náhodná veličina X pochází ze směsi dvou normálních rozdělení X ~ \pN(/j,\, a'f) + (1 — p)N(fi2, ^i)]- Potom marginální hustota náhodné veličina X má tvar f(xi,o)= Yl f(xl,bl,e) = f(xl,i,e1) + f(Xl,o,e2), b,e{o,i} kde f(xi, 1, 6»i) = exp V^crx V 2cri je sdružená hustota za podmínky, že data pochází z první skupiny a /(Zi, 0, 02) = r— exp V 2ct22 ^2 je sdružená hustota za podmínky, že data pochází z druhé skupiny. Logaritmická věrohodnostní funkce náhodné veličiny X má tvar L(0ix)=n/(*i,0). i=l Příklad 2. Odhad parametrů směsi dvou normálních rozdělení 1. Načtěte datový soubor faithfuI obsahující údaje o době čekání na erupci (waiting) a o době trvání erupce (eruption), přičemž se zaměřte na proměnnou waiting. 2. Nakreslete histogram doby čekání na erupci a superponujte jej křivkou jádrového odhadu. 3. Pomocí funkce optim() odhadněte parametry p, yui, /i2, o\, o\ smíšeného rozdělení \pN(fii, a'()+(l—p)N({i2, náhodné proměnné waiting. 4. Pomocí funkce optim() nalezněte rozptyly odhadů parametrů p, fí{, a'f, /io (pravostranná); c) 7ío3 : /i > /io oproti .H13 : jj, < jj,q (levostranná). 1. Odvoďte tvary silofunkcí pro všechny tři typy hypotéz (a)-(c), t.j. tvary /^(/i), /3Í2(m) a /3*3(/lí). 2. Nakreslete silofunkce pro všechny tři typy hypotéz (a)-(c), kde jj,q = 0, a a2 = 1. Do jednoho obrázku zakreslete vždy tvary silofunkcí pro n = 10, n = 30, n = 50 a n = 100. Hladinu významnosti a zvolte 0.05. Hodnoty jj, volte rozumně, např. v intervalu ( —1.5; 1.5). -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5 -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5 -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5 11 Příklad 9. Rozdělení testovací statistiky pro test o střední hodnotě /i, když a2 neznáme 1. Nechť náhodný výběr X pochází z normálního rozdělení, t.j. X ~ N(p,a2), kde jj = 600 a a2 = 1002. Rozsah náhodného výběru n = 20. Pomocí simulační studie v CĚt porovnejte rozdělení testovací statistiky pro test 'nepřesně zvolené' nulové hypotézy Hq: jj < 500 (alternativní hypotéza H\: jj > 500), když rozptyl a2 neznáme, s rozdělením testovací statistiky nulové hypotézy Hq: jj < 600 (alternativní hypotéza H\: jj > 600), opět když a2 neznáme. Nasimulujte M pseudonáhodných výběrů, M=l,... ,10 000 a pro každý vypočítejte realizaci testovací statistiky = Xm~fí° ^Jn pro nulovou hypotézu Hq: jj < 500 oproti Hi: \j > 500. Histogram superponujte jednak křivkou hustoty necentrálního í-rozdělení sn-1 stupni volnosti a parametrem necentrality A (A = , kde jji je vzatá z alternativní hypotézy) a jednak křivkou hustoty centrálního studentova rozdělení. Obě křivky potom vzájemně okometricky porovnejte. 2. Nechť nyní X pochází ze směsi dvou normálních rozdělení, t.j. X ~ \pN(p, 1002) + (1 — p)N(/j, 1502)], kde p = 0.9 a jj = 600. Proveďte simulační studii popsanou v bodě (1) pro tento náhodný výběr. Rozděleni testovaci statistiky Tw X~N(600,100A2) □ statistiky Tw ■ centrálni rozd. ■ necentralni rozd. 0 5 Centrálni a simulovane necentralni t-rozdeleni 10 n = 20; 1-p12 = 0.9961 =0.9935 Rozděleni testovaci statistiky Tw X~0.9N(600,100A2)+0.1N(600, 150A2) □ statistiky Tw ■ centrálni rozd. ■ necentralni rozd. -1-1-1 0 5 10 Centrálni a simulovane necentralni t-rozdeleni n = 20; 1 - p12 = 0.9961 = 0.9935 12 Příklad 10. empirická a exaktní silofunkce testu; pokračování příkladu č.9 1. Nechť náhodný výběr X pochází z normálního rozdělení, t.j. X ~ N(pi, a2), kde /ii = 470, 480,..., 590, 600 a a2 = 1002. Rozsah náhodného výběru n = 20. Použijte CŠT na simulaci empirické silofunkce pro jednovýběrový Studentův í-test nulové hypotézy Hq: jj, < 500 oproti H\: jj, > 500. Vygenerujte m = 1 000 pseudonáhodných výběrů a pro každý stanovte hodnotu testovací statistiky tm, m = 1,..., 1 000. Dále vypočítejte p-hodnotu korespondující s tm a porovnejte ji s hladinou významnosti a = 0.05. Tak získáte empirickou silofunkci 1 — /3(/ii) pro zvolenou alternativní hypotézu. Do grafu zakreslete 1 — /3(/ii) i její standardizované chyby SE[1 - /3(^i)] = \J0--h^)P(ěA v podobě chybové úsečky 1 - /3(^i) ± SE[1 - P(fii)}. Do grafu vkreslete také teoretickou silofunkci 1 — /3(/ii), fii G (470; 600) (na její výpočet použijte funkci power.t.test()). 2. Nechť nyní X pochází ze směsi dvou normálních rozdělení, t.j. X ~ \pN(/j,\, 1002) + (1 — p)N(fii, 2002)], kde p = 0.9 a /Líi = 470,..., 600. Proveďte simulační studii popsanou v bodě (1) pro tento náhodný výběr. 13 Příklad 11. Přesná a přibližná silofunkce — Jednovýběrový Z-test o střední hodnotě Uveďte tvary přesné silofunkce /3*2 a přibližné silofunkce /3*2 pro test Hq : /i = /j,q oproti H\ : /i 7^ /j,q když a2 známe. Nakreslete křivky obou silofunkcí do jednoho grafu, kde na ose x budou různé hodnoty parametru jj, na ose y vynesená silofunkce, a porovnejte jejich tvary. Výsledek slovně okomentujte. Hodnotu n zvolte 20, /io = 0 a a2 = 4. Rozsah osy x volte rozumně, pro globální pohled např. (—1.5 ; 1.5), pro lokální zaměření rozdílů zvolte rozsah osy x (—0.8 ; 0.8). 14