Zadání 13. cvičení, podzim 2019 Popisná statistika, nerovnosti, limitní věty Exponenciální rozdělení Exp(A) je rozdělení s hustotou JO for x < 0, )\e-Xx forx>0. /(*) " 1 , -—\x Mar kovová nerovnost. Pro libovolnou nezápornou náhodnou veličinu X se střední hodnotou E(X) platí p(x > s) < Bil pro všechna e > 0. Čebyševova nerovnost. Pro libovolnou náhodnou veličinu X se střední hodnotou E(X) a roztylem D(X) platí P(X-E(X))>£)<^P nebo ekvivalentně P(X-E(X)) 1 D(X) pro všechna e > 0. £2 Centrální limitní věta. Uvažujme posloupnost nezávislých náhodných veličin Xi, které mají společnou střední hodnotu EXi = fi, společný rozptyl varXj = a2 > 0 a stejně omezený třetí absolutní moment < C. Pro rozdělení náhodných veličin n „ sn = Y. ^ ■t=i *,no platí limitní vztah limP(5n je distribuční funkce normovaného normálního rozdělení N(0,1). Moivreova-Laplaceova věta je speciálním případem centrální limitní věty: Nechť Xn jsou náhodné veličiny s binomickým rozdělením Bi(n,p). Pak pro normované náhodné veličiny _ Xn - np Vnp(l -p) platí vztah lim P(Sn je distribuční funkce normovaného normálního rozdělení N(0,1). Příklad 1. Byly naměřeny následující hodnoty nějakého znaku 10; 7; 7; 8; 8; 9; 10; 9; 4; 9; 10; 9; 11; 9; 7; 8; 3; 9; 8; 7. Určete aritmetický průměr, medián, kvartily, rozptyl. Příklad 2. Mějme nezápornou náhodnou veličinu X se střední hodnotou fi. (1) Bez dalších informací o rozdělení X odhadněte P{X > 3/x). (2) Víte-li, že X ~ Ex(±), vypočtěte P{X > 3/x). i 2 Příklad 3. Určete pravděpodobnost, že při 1200 hodech kostkou padne šestka alespoň 150 krát a nejvýše 250 krát a) pomocí Cebyševovy nerovnosti, b) pomocí de Moivreovy-Laplaceovy věty. Příklad 4. Průměrná rychlost větru je na určitém místě 20 km/hod. a) Bez ohledu na rozdělení rychlosti větru jako náhodné veličiny určete pravděpodobnost, že při jednom pozorování rychlost větru nepřesáhne 60 km/h. b) Určete interval, v němž se bude rychlost větru nacházet s pravděpodobností alespoň 0,9, víte-li navíc, že směrodatná odchylka o = 1 km/hod. Příklad 5. Na FI je 10% studentů s prospěchem do 1,2. Jak velkou skupinu je třeba vybrat, aby s pravděpodobností0,95 v ní bylo 8-12% studentů s prospěchem do 1,2? Úlohu řešte zvlášť pomocí Cebyševovy a zvlášť pomocí Moivreovy-Laplaceovy věty. Příklad 6. Dokažte, že pro kvantily normovaného normálního rozdělení platí vztah —us. = U-I_a. 2 2 Příklad 7. Pravděpodobnost, že se zasazený strom ujme, je 0,8. Jaká je pravděpodobnost, že z 500 zasazených stromů se jich ujme aspoň 380 ? Výsledek. 0,987. Příklad 8. Pravděpodobnost, že semeno vyklíčí, je 0,9. Kolik semen je třeba zasadit, aby s pravděpodobností aspoň 0,995 vyklíčilo cca 90% semen (což přesněji formulujeme se zpřesňujícím požadavkem, aby odchylka podílu vyklíčených semen od 0,9 nepřevýšila 0,034,). Výsledek, n ~ 614. Příklad 9. Životnost (v hodinách) určité elektrické součástky má exponenciální rozdělení s parametrem A = . Pomocí centrální limitní věty odhadněte pravděpodobnost, že celková životnost 100 takových součástek bude mezi 900 a 1050 hodinami. Výsledek, ii = 10, a2 = 100, P(900 < J2*í < 1050) = P < Ef^"M < = í>(0,5) - $(-1) « 0,533. náhodný výběr z normálního rozdělení Náhodným výběrem rozsahu ti rozuniiniG Ti-tici nGzavislycli nab.od.nycb. vGličin X\,..., Xn, které mají totéž rozdělení. S náhodným výběrem se obvykle setkáváme při opakovaném provádění téhož pokusu. Statistika je náhodná veličina vzniklá transformací náhodného výběru. • Výběrový průměr M = -^ľ=i^*' a Jsou-li navíc X±,... ,Xn ~ N(fi,a2), pak M ~ N(fi,a2/n). . Výběrový rozptyl S2 = ^ £?=i(*« " M)2 = ^ (£?=i X? -nM),S = VŠ2. Intervalovým odhadem parametru 9 rozumíme interval (Ti, Tu), kde Tl(X±, ..., Xn) a Tjj(Xi, ..., Xn) jsou statistiky výběru (X±,..., Xn). Platí-li P{TL 1- a. 3 Dolním odhadem 9 na hladině významnosti 1 — a je pak statistika L, pro niž P(L <9)>l-a. Případ, kdy je X\,... ,Xn náhodný výběr z normálního rozdělení N(fi,a2): • M a S2 jsou nezávislé náhodné veličiny. • M ~ N(fi,a2/n), a tedy U = (M - fi)/(a/y/n) ~ ÍV(0,1). • K = (n-l),S2/(72~x2(^-l)- • E(^-/i)2/^2~X2H. • T={M - fj,)/(S/y/n) ~ í(n - 1). Intervaly spolehlivosti: /i (známe cr2) (M - ^Ul_a/2,M + ^Ul_a/2) /i (neznáme cr2) (M - -%h_a/2(n - 1),M + -%h_a/2(n - 1)) cr2 (neznáme fi) / (n-l)S2 (n-l)S2 \ \xLa/2(n-l)^ X2a/2(n-l) ) a2 (známe fi) ( TAXi-n)2 TAXi-n)2 \ \x{_a/2{n)' X2a/2(n) ) í1! ~ A*2 (známe a2, a2) M1-M2±y/£ + £-u1_a/2 í1! ~ A*2 (neznáme a\ = a2) M1-M2±S^± + l- ti_a/2{m + n - 2) podíl rozptylů a\ja\ / s2/s'2 \ V^i-c«/2(m-l,n-l)' Fa/2(m-l,n-l) ) Příklad 10. Při 600 hodech kostkou padla jednička pouze 45 krát. Rozhodněte, jestli je možné tvrdit, že jde o ideální kostku na hladině a = 0,01. Vše zdůvodněte a svůj závěr explicitně formulujte. Příklad 11. Do bedny ukládáme výrobky se střední hodnotou 3 kg a směrodatnou odchylkou 0,8 kg. Jaký maximální počet výrobků můžeme do bedny uložit, aby celková hmotnost s pravděpodobností 0,9738 nepřekročila jednu tunu? Výsledek, n ~ 324. Příklad 12. Odběratel provádí kontrolu jakosti námi dodaných výrobků namátkovou kontrolou testovaného rozměru u 21 náhodně vybraných výrobků. Dodávka bude přijata, pokud nebude výběrová směrodatná odchylka překračovat hodnotu 0,2 mm. Víme přitom, že naše stroje produkují výrobky, u nichž má sledovaný rozměr normální rozdělení tvaru ]V(10mm; 0, 0737mm2). S využitím statistických tabulek určete pravděpodobnost, s níž bude dodávka přijata. Jak se změní odpověď, pokud odběratel kvůli nákladům na testy začne testovat pouze 4 výrobky? (V případě chybějících údajů v tabulce hodnoty, které máte k dispozici, lineárně interpolujte). Výsledek. Při 21 testech je pravděpodobnost %2o(10>9) = 0,05, při 4 testech x|(l,63) = 0,24. Příklad 13. Ze základního souboru, z rozdělení N"(/i, a2), kde a2 = 0,06 jsme pořídili náhodný výběr s realizacemi 1,3; 1,8; 1,4; 1,2; 0,9; 1,5; 1,7. Určete oboustranný 95% interval spolehlivosti pro neznámou střední hodnotu. Výsledek. 1,22 < /x < 1,58. Příklad 14. Náhodný veličina X má normální rozdělení N'(/x, a2), kde fJ,,a2 nejsou známy. V následující tabulce jsou uvedeny četnosti jednotlivých realizací této náhodné veličiny. 8 11 12 H 15 16 17 18 20 21 četnost 1 2 3 4 7 5 4 3 2 1 4 Vypočtěte: a) výběrový průměr, b) výběrový rozptyl a výběrovou směrodatnou odchylku, c) 99% interval spolehlivosti pro střední hodnotu fi. Výsledek. 13,954 < (i < 16,671 Příklad 15. Nechť X±,..., Xn je náhodný vvběr z rozdělení N(fi, 0,04). Určete nejmenší počet měření, která je třeba provést, aby šířka 95% intervalu spolehlivosti pro fi nepřesáhla 0,16. Výsledek. 25 Příklad 16. Byla provedena čtyři nazávislá měření obsahu manganu u dvou vzorků oceli a byly získány výsledky: 1. vzorek 0,31% 0,30% 0,29% 0,32% 2. vzorek 0,59% 0,57% 0,58% 0,57% Stanovte 95% interval spolehlivosti pro rozdíl středních hodnot fi± — fi2 za předpokladu, že jde o realizace náhodného výběru z normálního rozdělení s neznámými, ale shodnými rozptyly. 1. Testování hypotéz: Testování hypotéz umožňuje na základě náhodného výběru s danou pravděpodobností ověřovat domněnky o rozdělení, z něhož pochází daný náhodný výběr. Hypotézou budeme rozumět nějaké tvrzení o parametrech tohoto rozdělení. Hq ... nulová hypotéza (např. 6 = c, kde c je domněnka o hodnotě parametru 9) H\ ... (oboustranná) alternativní hypotéza (obvykle negace nulové) Testováním Hq oproti alternativní hypotéze rozumíme postup založený na náhodném výběru, s jehož pomocí platnost Hq zamítneme nebo nezamítneme (= připouštíme). Chyba 1. druhu ... Hq platí a my ji zamítneme (závažnější) Chyba 2. druhu ... Hq neplatí a my ji nezamítneme Pravděpodobnost chyby 1. druhu se nazývá hladina významnosti (a, obvykle a = 0,05), pravděpodobnost chyby 2. druhu se značí (3 a číslo 1 — (3 se nazývá síla testu. Hypotézy budeme testovat pomocí příslušnosti do intervalu spolehlivosti - na základě realizace náhodného výběru sestrojíme 100(1 — a)% interval spolehlivosti pro neznámý parametr 9 a zjistíme, zda c patří do tohoto intervalu. Pokud ano, hypotézu Hq nezamítáme (v opačném případě zamítáme) na hladině významnosti a. Příklad 17. Z velkého souboru resistorů téhož typu bylo náhodně vybráno 16 kusů s výběrovým průměrem hodnot odporu 9,3 kíž. Na hladině významnosti 0,05 testujte hypotézu, že výběr pochází z normálního rozdělení se střední hodnotou fi = lOkíž, za předpokladu, že: a) a2 = Aktt, b) a2 není známo a S2 = 6,25 kíž. Výsledek, a) nezamítáme, b) nezamítáme. Příklad 18. Na dvou soustruzích se vyrábějí tytéž součástky, u nichž se měříme vnitřní průměr (předpokládá se normální rozdělení se stejnými rozptyly u obou soustruhů). Byl pořízen náhodný výběr rozsahu 16 z produkce prvního soustruhu a rozsahu 25 z produkce druhého soustruhu. Příslušné výběrové průměry jsou 37,5 mm, resp. 36,8 mm a výběrový rozptyly 1,21 mm2, resp. 1,44 mm2. Testujte hypotézu o rovnosti střední hodnoty kontrolovaných rozměrů v produkci obou strojů oproti oboustranné alternativě při a = 0,1. 5 Příklad 19. Na šachový turnaj má být vybrán jeden zástupce ze dvou oddílových šachistů, a to ten, jehož výkon je stabilnější (má menší rozptyl). Procentuální úspěšnost z posledních turnajů je: A 49,6 59,4 59,5 76,8 69,4 70,9 68,1 66,3 B 38,5 51,2 79,5 72,3 86,5 Na hladině významnosti 0,05 testujte, zda je možno rozhodnout o tom, který z hráčů se má turnaje zúčastnit.