Zadání příkladů - cvičení č.l - 15-9-23 Příklad č.l (porovnání dvou typů modelů) (přednáška) Model rozděleni pravděpodobností je modelem náhodné proměnné X, např. (1) model rozdělení pravděpodobnosti náhodné proměnné X šířka dolní čelisti, nebo (2) model rozdělení pravděpodobnosti náhodné proměnné X hrubost kožních řas u dospělých zdravých žen. Statistický model je modelem náhodné proměnné Y\X (Y kauzálně závisí na X), např. (1) model závislosti náhodné proměnné Y šířka dolní čelisti na proměnné X pohlaví, nebo (2) model závislosti náhodné proměnné Y hrubost kožních řas u dospělých zdravých žen na proměnné X BMI. Všimněme si, že náhodné proměnné označujeme X anebo Y podle toho, jaký model je charakterizuje. Příklad č.2 (jednoduchý náhodný výběr) V jednoduchém náhodném výběru o rozsahu n z populace s konečným rozsahem N má každý prvek stejnou pravděpodobnost vybrání. Pokud vybíráme bez vracení (opakování), mluvíme o jednoduchém náhodném výběru bez vraceni (Dalgaard, 2008). Pokud vybíráme s vracením, mluvíme o jednoduchém náhodném výběru s vracením. Mějme množinu M. s N = 10 prvky a chceme z ní vybrat n = 3 prvky (a) bez vracení, (b) s vracením. Kolik máme možností? Jak vypadá jedna takováto možnost, pokud M = {1,2,..., 10}? Zopakujte to samé pro N = 100, n = 30 a množinu M = {1,2,..., 100}. Příklad č.3 (jednoduchý náhodný výběr) Mějme skupinu lidí označených identifikačními čísly (ID) od 1 do 30. Vyberte (a) náhodně 5 lidí z 30-ti bez návratu, (b) náhodně 5 lidí ze 30-ti s návratem a nakonec (c) náhodně 5 lidí ze 30-ti bez návratu, přičemž lidé s ID od 28-mi do 30-ti mají pravděpodobnost vybrání 4x vyšší než lidé s ID od 1 do 27. Příklad č.4 (normální rozdělení) Mějme náhodnou proměnnou X (může to být např. výška postavy desetiletých dívek) a předpokládejme, že tato náhodná proměnná má normální rozdělení s parametry fi (střední hodnota) a a2 (rozptyl), což zapisujeme jako X ~ N(fi,a2), fi = 140.83, a2 = 33.79. Normální rozdělení představuje model rozdělení pravděpodobnosti pro tuto náhodnou proměnnou. Vypočítejte pravděpodobnost Pr(a < X < b) = Pľ(X < b) - PľX < a) = Fx{b) - Fx(a), kde a = - ka, b = + ka, k = 1, 2, 3. Nakreslete hustotu rozdělení pravděpodobnosti, vybarvěte oblast mezi body a a b a popište osy x a y tak, jako je uvedeno na obrázku 1. 1 Obrázek 1: Míry normálního rozdělení; křivka hustoty s vybarveným obsahem pod touto křivkou mezi příslušnými kvantily na ose x; obsah je rovný pravděpodobnosti výskytu subjektů s danou výškou v rozpětí těchto kvantilů. Dostaneme pravidlo 68.27 — 95.45 — 99.73 (tzv. míry normálního rozdělení. Příklad č.5 (normální rozdělení) Mějme X ~ N(fi, a2), kde fi = 150, a2 = 6.25. Vypočítejte a = fi — Xi_a/2 O, j = 1,2, p G (—1,1) jsou parametry. Potom 6 = (pi, p2, o"2, o"|, p). Výraz v exponentu můžeme zapsat jako _ 1 / x - pi \T / o\ paľa2 \ 1 í x - pi \ 2 V y - ^2 y v po-i^ o-! y V y - ^ ) Marginální rozdělení1 jsou X ~ N (pi, ít2) a "K ~ N (p2, (t|), p je koeficient korelace2(Viz obrázek 5) Příklad č.15 (dvojrozměrné normální rozdělení) (1) Nakreslete hustotu dvojrozměrného normálního rozdělení A^A*, S) pomocí funkce image() a superponujte ho s konturovým grafem hustoty toho stejného rozdělení pomocí funkce contour(). (2) Nakreslete hustotu dvojrozměrného normálního rozdělení N2(n, S) pomocí funkce persp(). Hustotu rozsekejte na 12 intervalů, kde hodnoty v těchto intervalech budou odpovídat barvám terrain.colors(12). Použijte následující parametry: • Pl = 0, A*2 = o, (Ti = 1,0"2 = 1. >P = 0; • Pl = 0, = o, (Ti = 1,0"2 = 1. >P = 0.5; • Pl = 0, P2 = 0, (Ti = 1.2, (T2 = l,p = 0.5 Vzorové řešení je uvedeno na obrázku 5. 1 Marginální rozdělení je rozdělení náhodné proměnné, zde X nezávisle na y a naopak Y nezávisle na X. 2Z tohoto příkladu je zřejmé, že na dostatečný popis dvojrozměrného normálního rozdělení potřebujeme pět parametrů, t.j. střední hodnotu a rozptyl pro marginální rozdělení náhodných proměnných X a Y a korelační koeficient p = p(X, Y) popisující sílu lineárního vztahu X a Y. 6 I-1-1-1-1-1-1 I-1-1-1-1-1-1 I-1-1-1-1-1-1 -3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3 h1 =0, h2 = 0, cm = 1 , G2 = 1, p = 0 111 = 0, 112 = 0, O]=1,O2=1,p = 0.5 Hi =0,112 = 0, Cm = 1 , G2 = 1.2, p = 0.5 = 0, n2 = O, o, = 1, o2 = 1, p = 0 = 0, n2 = 0, o, = 1, o2 = 1, p = 0.5 = 0, n2 = 0, o, = 1, o2 = 1.2, p = 0.5 Obrázek 5: Hustoty dvojrozměrného normálního rozdělení při různých parametrech (první řádek -konturový graf; druhý řádek - perspektivní trojrozměrný graf v podobě plochy); čím je p odlišnější od nuly, tím více se kontury liší od kruhů (mění se na elipsy); se zvyšujícím se rozdílem mez o\ a o"2 se zvětšuje rozdíl rozptýlení koncentrických kruhů ve směru jednotlivých os (říkáme, že rozdíl variability proměnných laľse zvětšuje.) 7