M5VM05 Statistické modelování 2. Základní pojmy matematické statistiky Jan Koláček (kolacek@math.muni.cz) Ustav matematiky a statistiky, Přírodovědecká fakulta, Masarykova univerzita, Brno podzim 2013 Jan Koláček (PřF MU) M5VM05 Statistické modelování podzim 2013 1/40 Motivace V teorii pravděpodobnosti se předpokládá, že • je známý pravděpodobnostní prostor (CÍ,A,P) • a že také známe rozdělení pravděpodobnosti náhodných veličin (resp. náhodných vektorů), které na tomto pravděpodobnostním prostoru uvažujeme. V matematické statistice však • máme k dispozici výsledky n nezávislých pozorování hodnot sledované náhodné veličiny X, které se ve statistice říká statistický znak, tj. máme xi = x{i),...,xn = x{n), (jů\,...,(jon e n • a na základě těchto pozorování chceme učinit výpověď o rozdělení zkoumané náhodné veličiny. Jan Koláček (PřF MU) M5VM05 Statistické modeloval podzim 2013 2/40 Náhodný výběr Definice 1 Náhodný vektor X = (X^,..■ ,Xn)' nazýváme náhodným výběrem z rozdělení pravděpodobnosti P, pokud (i) Xi,... ,Xn jsou nezávislé náhodné veličiny, (ii) Xi, ...,Xn mají stejné rozdělení pravděpodobnosti P. Číslo n nazýváme rozsah náhodného výběru. Libovolný bod x = (xi,... ,x„)', kde x,-je realizace náhodné veličiny X,- (i = l,...,n), budeme nazývat realizací náhodného výběru X = (Xi,... ,Xn)'. ■ Nechť náhodný výběr X = (Xi,..., Xn)' je z rozdělení, které je dáno distribuční funkcí F(x, 6), 6 E O. Zkráceně budeme značit: -iL{Xi.....X„} ~F(x;6). Cílem teorie odhadu je na základě náhodného výběru odhadnout • rozdělení pravděpodobnosti, • popřípadě některé parametry tohoto rozdělení, • anebo nalézt odhad nějaké funkce parametrů 6, tj. 7(6). Jan Koláček (PřF MU) M5VM05 Statistické modelování podzim 2013 3 / 40 Výběrové charakteristiky Definice 2 Libovolnou náhodnou veličinu T„, která vznikne jako funkce náhodného výběru X = (Xi,... ,Xn)', budeme nazývat statistikou, tj. Tn = T{X\,... ,Xn)'. Definice 3 Nechť X = (Xi,..., Xn)' je náhodný výběr rozsahu n z rozdělení s distribuční funkcí F(x; 6), 6 6 0. Potom statistika i " Xn = X = j- £ X,- se nazývá výběrový průměr výběrový rozptyl výběrová směrodatná odchylka výběrová (empirická) distribuční fce F«W = i Ľ !(-<»,*)(X,-) Jan KoláCek (PřF MU) M5VM05 Statistické modeloval podzim 2013 4 / 40 Bodové odhady Bodovým odhadem parametrické funkce 7(0) budeme rozumět nějakou statistiku Tn = T(Xi,... ,X„Y, která bude pro různé náhodné výběry kolísat kolem 7(0). Definice 4 Nechť X = (Xi,..., X„Y je náhodný výběr z rozdělení pravděpodobnosti Pg, kde 6 je vektor neznámých parametrů. Nechť 7(6) je daná parametrická funkce. Řekneme, že statistika Tn = T(X\,... ,Xn)' je odhadem nestranným (nevychýleným) pokud pro V0 £ O platí EgTn = 7(6). kladně vychýleným EgTn > 7(6). záporně vychýleným EeT„ < 7(6). asymptoticky nestranným lim EgT,, = 7(6). n—»00 (slabě) konzistentním pokud pro Ve > 0 platí lim P„(|T„ - 7(0)1 > e) = 0, tj. T„ 7(0) Jan KoláCek (PřF MU) M5VM05 Statistické modelování podzim 2013 5 / Bodové odhady Poznámka 5 Vlastnost nestrannosti (tj. nevychýlenosti) ještě neposkytuje záruku dobrého odhadu, pouze vylučuje systematickou chybu. Poznámka 6 Používaní konzistentních odhadu zaručuje — malou pravděpodobnost velké chyby v odhadu parametru, pokud rozsah výběru dostatečně roste; — volbou dostatečně velkého počtu pozorování lze učinit chybu odhadu libovolně malou. Jan Koláček (PřF MU) M5VM05 Statistické modeloval podzim 2013 6/40 Odhady střední hodnoty a rozptylu Věta 7 Necht X = (Xi,..., Xn)' je náhodný výběr z rozdělení, které má střední hodnotu }i(6) proMd E O. Pak výběrový průměr je nestranným odhadem střední hodnoty, tj. EeX = F(0). Věta 8 Nechi X = (Xi,..., X„Y je náhodný výběr z rozdělení, které má rozptyl cr2(Q) pro M d E O. Pak výběrový rozptyl je nestranným odhadem rozptylu, tj. EeS2 = cr2(d). Jan KoláCek (PřF MU) M5VM05 Statistické modeloval podzim 2013 7 / 40 Postačující podmínka konzistence Věta 9 Nechí statistika Tn = T(X\,... ,Xn)' je nestranný nebo asymptoticky nestranný odhad parametrické funkce 7(0) a platí lim DqT„ = 0. Pak je statistika Tn = T(X\,... ,Xn) konzistentním odhadem parametrické funkce 7(0). Jan KoláCek (PřF MU) M5VM05 Statistické modeloval podzim 2013 8/40 Důsledky Důsledek 10 Necht X = (Xi,..., x„Y je náhodný výběr z rozdělení, které má pro V0 6 0 střední hodnotu jí(6) a rozptyl cr2{Q), tj. Hx1.....x„}~£(}i(e),a2(e)). Potom je-li }i(6) < co, pak výběrový průměr X je slabě konzistentním odhadem ]i(d). Důsledek 11 Nechí X = (Xi,..., xn)' je náhodný výběr z rozdělení, které má pro V0 e 0 střední hodnotu jí(6) a rozptyl cr2(6), tj. Hxľ.....x„} ~£(}i(e),a2(e)). Potom je-li a2(8) < oo, pak výběrový rozptyl S2 je slabě konzistentním odhadem cr2(d). Jan KoláCek (PřF MU) M5VM05 Statistické modeloval podzim 2013 9/40 Více nestranných odhadů Definice 12 Nechť T„ je nestranný odhad parametrické funkce 7(0) a pro všechna 6 E © platí DeTn < DeT*n, kde T* je libovolný nestranný odhad parametru 7(6). Potom odhad Tn nazveme (rovnoměrně) nejlepším nestranným odhadem parametrické funkce 7(6). Příklad 13 Nalezněte nejlepší nestranný lineární odhad střední hodnoty Ji (6). Jan Koláček (PřF MU) M5VM05 Statistické modeloval podzim 2013 10 / 40 Intervalové odhady Odhady, jimiž jsme se doposud zabývali, se někdy nazývají bodové odhady parametrické funkce 7(6). Je tomu tak proto, že pro danou realizaci náhodného výběru X\,... ,xn představuje odhad daný statistikou Tn(x\,... ,xn) jediné číslo (bod), které je v jistém smyslu přiblížením ke skutečné hodnotě parametrické funkce 7(6). Úlohu odhadu však lze formulovat i jiným způsobem. Jde o to, sestrojit na základě daného náhodného výběru takový interval, jehož hranice jsou statistiky, a který se s dostatečně velkou přesností pokryje skutečnou hodnotu parametrické funkce 7(0). V tomto případě mluvíme o intervalovém odhadu parametrické funkce 7(0). Jan KoláCek (PřF MU) M5VM05 Statistické modelováni Definice Definice 14 Nechť -U-{Xi,... ,X„} ~ F(x; 6) je náhodný výběr rozsahu n z rozdělení o distribuční funkci F(x;6), 6 E O. Dále mějme parametrickou funkci 7(6), m e (0,1) a statistiky D = D(X1,...,X„) a H = H(Xlr... ,X„). Potom intervaly (D,H) nazveme 100(1 — a) % intervalem spolehlivosti pro parametrickou funkci 7(6) jestliže Pe(D(X1.....X„) < 7(0) < H(Xx.....X„)) = 1 - a Jestliže Pfl(D(X!.....X„) <7(e)) = l-a, pak statistiku D = D(Xi,...,Xn) nazýváme dolním odhadem parametrické funkce 7(6) se spolehlivostí 1 — a (nebo s rizikem a). Jestliže Pfl(7(0) <«(Xi.....X„)) = l-a pak statistiku H = H(Xi,... ,Xn) nazýváme horním odhadem parametrické funkce 7(6) se spolehlivostí 1 — a (nebo s rizikem a). Jan Koláček (PřF MU) M5VM05 Statistické modeloval podzim 2013 12 / 40 Konstrukce intervalových odhadů O Najdeme nějakou tzv. pivotovou statistiku, tj. funkci \hj náhodného výběru X= (Xi,... ,Xn)' a parametrické funkce 7(6), tedy náhodnou veličinu fe(X/7(fl)), tak aby její rozdělení již nezáviselo na parametru 8. O Nechť qa/2 a cj\-a/2 Jsou kvantily rozdělení statistiky ft(X,7(0)). Pak pro všechna 8 platí Pe(qa/2 < h(X,7(8)) < qi_a/2) = l-tx Q Jestliže lze nerovnosti v závorce převést ekvivalentními úpravami na tvar, kde mezi nerovnostmi stojí jen 7(6), pak jsme sestrojili intervalový odhad D„(X) <7(0) distribuční funkce standardizovaného normálního rozdělení Gn distribuční funkce rozdělení x1 o n stupních volnosti Hn distribuční funkce Studentova rozdělení o n stupních volnosti Qn,m distribuční funkce Fisherova-Snedecorova rozdělení o n a m stupních volnosti ua kvantily standardizovaného normálního rozdělení XÍ{y) kvantily rozdělení^2 o v stupních volnosti ta(v) kvantily Studentova rozdělení o v stupních volnosti Fa(vi,V2) kvantily Fisherova-Snedecorova rozdělení o V\ a V2 stupních volnosti Jan Koláček (PřF MU) M5VM05 Statistické modelování podzim 2013 15 / 40 Dobrá vlastnost Je-li distribuční funkce F absolutně spojitá a ryze monotónní a je-li příslušná hustota / sudá funkce, pak platí F(x) = l-F(-x) igR a odtud Xa = —X1_a OL E (0,1), což speciálně platí pro normální a Studentovo rozdělení Jan Koláček (PřF MU) M5VM05 Statistické modelováni Odhady parametrů normálního rozdělení Normální rozdělení s hustotou X ~ N(ii,cr2) ~f(x) = i e-K2^) x e R má střední hodnotu EX = jí a rozptyl DX = a2 Jan KoláCek (PřF MU) M5VM05 Statistické modelováni podzim 2013 17 / 40 Vlastnosti Nechť k,n e'N, v, v\, v2,..., vk e N, b0,bi,...,bn e ÍR, 3 i e {!,...,n} :bi^0 -u- {Xi.....X„} A X,- ~ N(m, a?) b0 + £ biXi ~ N f ft0 + Ľ E &^ í'=i V í=i í=i / X^N(ji,a2) U = ^ ~N(0,1) ^2 rozdělení: jl{Líi,...,Lív}~N(0,l) K= !J2 + --- + !J2~a:2(v) -"-{^i ~X2(vi).....Kfc~^(vfc)} K = K1 + ---+ÍC;t-x2(vi + ---+v;t) Studentovo t-rozdělení: U ~N(0,l) -LK~ x2(v) T=-^=~ŕ(v) Fisherovo F-rozdělení: Jan KoláCek (PřF MU) M5VM05 Statistické modelovaní podzim 2013 18 / 40 Důsledek Věta 15 n Mějme -U-{Xi,..., X„} ~ N(ji, o2) a výběrový průměr X = i £ X, a výběrový i=l rozptyl Sz = ^ E (X,- - X)2. Pak platí i=l (1) Výběrový průměr X ~ ^(F'1t) (2) Statistika U = ^-^ň ~ N(0,1) (3) Statistika K = ^-Sz ~ x2(« - 1) (4) Statistika T = ^-^/ň ~ ř(n - 1) Jan KoláCek (PřF MU) M5VM05 Statistické modeloval podzim 2013 19 / 40 Pivotové statistiky Statistiky u_, \k\ a \T\ se nazývají pivotové statistiky, přičemž u = ^-^-^Jn je pivotovou statistikou pro ]i při známém a neznámý parametr k = n-l C2 X-fi ji při neznámem £7 Jan Koláček (PřF MU) M5VM05 Statistické modelováni podzim 2013 20 / 40 Interval spolehlivosti pro střední hodnotu při známém rozptylu Důsledek 16 Mějme -U-{Xi,.. . ,X„} ~ N{ji,a2), kde ji je neznámý parametr a o2 E IR je známé reálné číslo. Pak (X — u1_a/2-y=,X + u1_a/2-n=) - je 100(1 — a) % interval spolehlivosti pro střední hodnotu jí při známém o2 je dolní odhad střední hodnoty ji X + «i-„^ při známém c2 se spolehlivostí 1 — cc je horní odhad střední hodnoty ji při známém c2 se spolehlivostí 1 — cc Jan Koláček (PřF MU) M5VM05 Statistické modeloval podzim 2013 21 / 40 Důkaz Za pivotovou statistiku zvolíme statistiku U=UX= ^-Vň ~ N(0,1). Počítejme 1 — a = Piu* < U < «i «) V 2 — — 1 2 1 = P(X - «i-a/2^ < F < X + "l-a/2^) Jan KoláCek (PřF MU) M5VM05 Statistické modelováni podzim 2013 22 / 40 Příklad Příklad 17 Rychlost letadla byla určována v 5 zkouškách a z jejich výsledků byl vypočten odhad x = 870,3 m/s. Najděte 95% interval spolehlivosti pro \i, je-li známo, že rozptýlení rychlosti letadla se řídí normálním rozdělením se směrodatnou odchylkou a = 2, lm/s. Řešení X ± «0,975 —/= 870,3 ±1,959964 ^4 y/5 ,46; 872,14). Jan Koláček (PřF MU) M5VM05 Statistické modelováni Interval spolehlivosti pro střední hodnotu při neznámém rozptylu Důsledek 18 Mějme -U-{Xi,.. . ,X„} ~ N{ji,a2), kde ji a a2 jsou neznámé parametry. Pak pro střední hodnotu VjT\ (X-ři-^íw-lJ^X+ř^/aín-l)-^) - je 100(1 - ol)% interval spolehlivosti pro střední hodnotu ji při neznámém o2 X- h_a(n je dolní odhad střední hodnoty ji při neznámém o2 se spolehlivostí 1 — ol X+ ři_a(n je horní odhad střední hodnoty ji při neznámém o2 se spolehlivostí 1 — ol Jan Koláček (PřF MU) M5VM05 Statistické modeloval podzim 2013 24 / 40 Interval spolehlivosti pro rozptyl Důsledek 19 Mějme -U-{Xi,.. .,X„} ~ N{ji,a2), kde ]i a cr2 jsou neznámé parametry. Pak pro rozptyl c (w-l)S2 (w-l)S2 X\ a(n-l)'xl(n-l) (w-l)S2 (n-l)S2 v'e 100(1 — cl)% interval spolehlivosti pro rozptyl o2 je dolní odhad rozptylu cr2 se spolehlivostí 1-m je horní odhad rozptylu cr2 se spolehlivostí 1-m Jan KoláCek (PřF MU) M5VM05 Statistické modelováni podzim 2013 25 / 40 Příklad Příklad 20 Deset balíčků mouky pocházejících z balícího stroje mělo hmotnosti v gramech: 987, 1 001, 993, 994, 993, 1 005, 1 007, 999, 995, 1 002. Sestrojte 95% interval spolehlivosti pro střední hodnotu a rozptyl hmotnosti (předpokládejte normální rozdělení). Řešení Vypočteme průměr x = 997,6 a směrodatnou odchylku s = 6,2397. IS pro \i: c 6 2397 x±t0/975(9)-^= = 997,6 ±2,26 ' = (993,14; 1002,06). 10 10 IS pro o2 9sz _9s± (n-l)S2 (n-l)S2 \ ^ ("-!)'J V4"7s(9)' 4o2s(9) = (18,42; 129,76). Jan Koláček (PřF MU) M5VM05 Statistické modelováni podzim 2013 26 / 40 Dva výběry Věta 21 Necht -u-{Xi,..., Xni} ~ N(jii, a2), X výběrový průměr a S2 výběrový rozptyl. Dále necht -u-{Yi,..., y„2} ~ N(jí2/ ^2)' Y výběrový průměr a S\ výběrový rozptyl. Předpokládejme XI Y. Pak (1) Statistika Ux_?=*-?-^~ri ~N(0,1). '£1 + £i «1 «2 (2) Pokud cr2 = d\ = cr2, pak statistika _ X-Y-(Fl-F2) / nin2 2 _ (Bl-i)S2+(B2_1 Tx-r--^-V^T^I í(m + n2-2),s12- „i+„2_2 (3) Statistika S2 o2 S2£72 2 2 ■ " F(nl ~ 1'"2 - !)• Jan KoláCek (PřF MU) M5VM05 Statistické modelování podzim 2013 27 / 40 IS pro ]i\ — }i2 Důsledek 22 Necht -u-{Xi,..., Xni} ~ N(fii, o2), X výběrový průměr a S2 výběrový rozptyl. Dále necht -u-{Yi,..., Y„2} ~ N(ji2r °2 )< ^ výběrový průměr a S2 výběrový rozptyl. Předpokládejme X _L Y. Pa/c jsou-li o2 a o2 známé pak 100(1 — a) % /S pro — ]i2 X-Y-U, «\ TT + TTrX-Y + Ui «\ TT + TT l-2 V "1 "2' X~2 V "1 "2 Jestliže o2 a o2 neznáme a platí CTn = c-, = c , pak 100(1 - a) % IS X — Y — tl_«(n1+n2-2) S12J^,X - Y+ tx_« (n1+n2-2) S 12 ni+n2 «l«2 kde s2 = (^-l^ + ^-ljS2 12 ni + n2 - 2 Jan Koláček (PřF MU) M5VM05 Statistické modelováni podzim 2013 28 / 40 Příklad Příklad 23 Bylo vylosováno 11 stejně starých selat téhož plemene, šest z nich bylo krmeno směsí A, zbývajících pět bylo krmeno směsí B. Denní přírůstky váhy selat (v dkg) byly při krmení směsí A : 62, 54, 55, 60, 53, 58, u směsi B : 52, 56, 50, 49, 51. Předpokládáme, že neznámé směrodatné odchylky si budou rovny u obou skupin. Sestrojte interval spolehlivosti pro rozdíl neznámých středních hodnot \i\ — ^2 pf> riziku a = 0,05. Řešení Vypočteme průměry x = 57, y = 51,6 a směrodatné odchylky si = 3,58, x - y ± t0/975(6 + 5 - 2)s12J f£ = 5,4±2,26-3,22- J$ = (0,99; 9,81). s2 = 2,7, s 12 = 3,22. IS pro jíi — Jan Koláček (PřF MU) M5VM05 Statistické modeloval podzim 2013 29 / 40 Důsledek 24 Nechi -u-{Xi,..., Xni} ~ N(jii, a2), X výběrový průměr a S2 výběrový rozptyl. Dále nechi -u-{Yi,..., Yn2} ~ ^{Hir )' Y výběrový průměr a S\ výběrový rozptyl. Předpokládejme XI Y. Pak Při neznámých ]1\,]i2,cf2,cf\ je 100(1 — ct)% IS roven S2 S2 F1_í(n1-l,n2-í)' S2 Fí(n1-l,n2-l) Alternativně Jan KoláCek (PřF MU) M5VM05 Statistické modeloval podzim 2013 30 / 40 Příklad Příklad 25 V tabulce jsou uvedeny výsledky analýz niklu získané dvěma analytickými metodami. Stanovte interval spolehlivosti pro podíl směrodatných odchylek obou metod při riziku cc = O,05, jestliže tyto výsledky považujeme za realizace náhodných výběrů z normálního rozdělení. Metoda I 3,26 3,26 3,27 3,27 Metoda II 3,23 3,27 3,29 3,29 Řešení Vypočteme směrodatné odchylky Si = 0,0058, s2 = 0,028. IS pro \. '2 (If^TO'^975 14"1'4"1') = t0'0027'0'643)' odtud dostáváme IS pro ^: Jan Koláček (PřF MU) M5VM05 Statistické modeloval podzim 2013 31 / 40 Párové výběry (K) aL = °2 ) kde Věta 26 NechíXi = (Xi,Yi)',... ,X„ = (Xn,Yn)' je náhodný výběr z dvourozměrného normálního rozděleníN2 (//,£) s parametry ji jii,ji2 e IR, cr? > 0, cr| > 0 a p 6 (0,1)-Pro z = 1,... ,n označme Pak Zi = Xi Y Ž = i Ľ"=i Z; H^ELi^-Ž)2. S2 Ž-ř, «(ř!-l)^:,Ž + ř, «ÍH-1)^: jV 'y/ň lK y/ň je intervalový odhad parametrické funkce — \ii o spolehlivosti 1 Jan Koláček (PřF MU) M5VM05 Statistické modelováni podzim 2013 32 / 40 Příklad Příklad 27 U 6 aut bylo zjištěno ojetípředních pneumatik (v mm) L 1,8 1,0 2,2 0,9 1,5 1,6 P 1,5 1,1 2,0 1,1 1,4 1,4 Určete 95 % interval spolehlivosti pro rozdíl středních hodnot ojetí levé a pravé pneumatiky. Řešení Vypočteme rozdíl ojetí na každém autě z = (0,3; -0,1;0,2; -0,2;0,1;0,2) a průměr 2 = 0,083 a směrodatnou odchylku s = 0,194. IS pro fii — ji2'- ž ± ř0/975 ( 6 - 1) -4- = 0,083 ± 2,57 ■ ^ = (-0,120; 0,287). Jan Koláček (PřF MU) M5VM05 Statistické modeloval podzim 2013 33 / 40 Odhady založené na centrálni limitní větě pro n h(X,7(0)) má N (0,1) . tj. fc(X,7(0)) ~ n(0,1) Přitom rozdělení, z něhož výběr pochází - nemusí splňovat požadavky spojitosti a ryzí monotonie distribuční funkce, - může být i diskrétní. Věta 28 Mějme AL{Xlr...rXn} ~ £(^(0),£72(0)) a výběrový průměr X = \ E X,-. A/ed/ť í'=i S2 = S2(X) je fslaběj konzistentním odhadem rozptylu c2(0). Pa/c statistika u* = ^m^ £ n(o,i). Jan KoláCek (PřF MU) M5VM05 Statistické modeloval podzim 2013 34 / 40 Důsledky Důsledek 29 (Binární náhodné výběry) Nechí -u-{Xi,... ,X„} ~ -A(p) Je náhodný výběr s alternativním (binárním) rozdělením. Potom intervalovým odhadem parametru JpJ o asymptotické spolehlivosti 1 — ol je interval (x-^-iV^^i-iV^)- Důsledek 30 (Poissonovské náhodné výběry) Nechí -u-{Xi,... ,X„} ~ Po(A) je náhodný výběr s Poisonovým rozdělením. Potom intervalovým odhadem parametru [X] fO < A < oo) o asymptotické spolehlivosti 1 — ol je interval (^-"i-fV^ + Hi-fV7!)- Jan KoláCek (PřF MU) M5VM05 Statistické modeloval podzim 2013 35 / 40 Příklad Příklad 31 Z 42 náhodně vybraných účastníků sportovního odpoledne bylo 16 dívek a 26 chlapců. Určete 95 % interval spolehlivosti pro podíl dívek mezi účastníky. Řešení Označme X,-, i = 1,.. .,42 náhodnou veličinu nabývající hodnoty 1, pokud vybraný účastník je dívka a hodnoty 0, pokud vybraný účastník je chlapec. Zřejmě X,- ~ A(p). Vypočteme průměr x = || = 0,38 a směrodatnou odchylku s = ^/x{\ - x) = 0,4856. IS pro p: x ± u0/975 -j= = 0,38 ± 1,96 ■ = (o, 234; 0,527). Jan KoláCek (PřF MU) M5VM05 Statistické modeloval podzim 2013 36 / 40 Úlohy k procvičení Příklad 1.1 Při zjišiovánípřesnosti nově zaváděné metody pro stanovení obsahu manganu v oceli bylo rozhodnuto provést 4 nezávislá měření. Stanovte dolní odhad pro a s rizikem 0,05, když výsledky měření byly: 0,31%; 0,30%; 0,29%; 0,32%. [0,00799] Příklad 1.2 Ze základního souboru byl proveden náhodný výběr s naměřenými intervalovými hodnotami a jejich četnostmi sledovaného znaku Xj (15,17) (17,19) (19,21) (21,23) (23,25) (25,27) tli 10 30 50 70 60 30 Určete a) interval ve kterém se nachází střední hodnota \i s pravděpodobností 0,95 b) interval ve kterém se nachází rozptyl o2 s pravděpodobností 0,95. _ [a) (21,5094; 22,1706), b) (5,952; 8,464)] Jan Koláček (PřF MU) M5VM05 Statistické modelování podzim 2013 37 / 40 Úlohy k procvičení Příklad 1.3 V tabulce jsou uvedeny hodnoty odporu (v ohmech) vzorků drátů A a B. Je známo, že výsledky takových zkoušek mají normální rozdělení s rozptyly o2 = 4 ■ 10~6, 02=9 ■ 10~6. Stanovte dolní odhad pro rozdíl středních hodnot odporu drátů při riziku cc = 0,05. A 0,140 0,138 0,143 0,142 0,144 0,137 B 0,135 0,140 0,142 0,136 0,138 [-0,000116] Příklad 1.4 Bylo vylosováno 6 vrhů selat a z nich vždy dva sourozenci. Jeden z nich vždy dostal náhodně dietu č. 1 a druhý dietu č. 2. Přírůstky (v dkg) jsou následující: (62; 52), (54; 56), (55; 49), (60; 50), (53; 51), (58; 50). Sestrojte 95% interval spolehlivosti pro \i\ — \i2. j [(0,626; 10,707)] Jan Koláček (PřF MU) M5VM05 Statistické modeloval podzim 2013 38 / 40 Úlohy k procvičení Příklad 1.5 V tabulce jsou uvedeny výsledky analýz niklu získané dvěma analytickými metodami. Stanovte horní odhad pro podíl směrodatných odchylek obou metod při riziku cc = 0,05, jestliže tyto výsledky považujeme za realizace náhodných výběrů z normálního rozdělení. Metoda I 3,26 3,26 3,27 3,27 Metoda II 3,23 3,27 3,29 3,29 [0,622] Příklad 1.6 Mezi 160 pracovníky (náhodně vybranými z 8000 pracujících v závodě) 48 cestuje do práce vlakem. Napište bodový odhad a 95% interval spolehlivosti pro podíl a počet zaměstnanců dopravujících se vlakem. Jan Koláček (PřF MU) [podíl: 0,3; (0,229;0,371), počet: 2400; (1832;2968)] M5VM05 Statistické modelování podzim 2013 39 / 40 Úlohy k procvičení Příklad 1.7 Naprogramujte funkci uhol. R, která pro jediný vstupní parametr n vygeneruje n-rozměrný datový soubor z normálního rozděleníN(1/2,1) a na základě vygenerovaných dat sestrojí 95% interval spolehlivosti pro střední hodnotu \i. Sledujte, pro jak velká n tento interval obsahuje nulu a jak se mění šířka intervalu. Dokážete interpretovat pozorované jevy? Jan Koláček (PřF MU) M5VM05 Statistické modeloval podzim 2013 40 / 40