Cvičení 11: Nerovnosti, Popisná statistika a normálni rozdělení Teorie: Datový soubor tvoří naměřené hodnoty: Po seřazení označujeme X(l) < X(2) < ■■■< X(n). Aritmetický průměr: x = m = ^ Yľi=i x*- Modus x je nejčastější hodnota znaku. Průměrná odchylka: o Rozptyl s2 = - Yľi=i(xi ~ XÝsměrodatná odchylka s = yfs*. Modifikovaný rozptyl ^rjs2. Centrované hodnoty xt — x, , standardizované hodnoty jo-kvantil (0 < p < 1) je 1 y-m I - p X([np]+i pro np Z \{x{nP) + X(nP)+i) pro np G Z, kde [a] značí celou část čísla a. Speciálně žo,5 je medián, žo,25, resp. xojs, dolní, resp. horní kvartil, xo,i, žo,2i • • •, ^0,9 decily apod. Mezikvartilové rozpětí je definováno jako Q = £0,75 — žo,25- Pro dvourozměrný datový soubor [xl,yl], kde 1 < í < n definujeme kovarianci prvního a druhého znaku jako a koeficient korelace mezi prvním a druhým znakem jako r 12 = ^7-. Krabicový diagram (box plot): dolní a horní strana základního obdélníka (krabice) odpovídá dolnímu a hornímu kvartilu, vodorovná čára uvnitř krabice mediánu (výška krabice je tedy mezikvartilové rozpětí). Dolní svislá úsečka (dolní fous) odpovídá hodnotám, které leží „pod krabicí" ve vzdálenosti nejvýše 1,5 násobku její výšky, obdobně horní fous. Mimo fousy se znázorňují ostatní body (tzv. odlehlá pozorování). Křížek uvnitř krabice znázorňuje aritmetický průměr. Příklad 1. Byly naměřeny následující hodnoty nějakého znaku Určete aritmetický průměr, medián, kvartily, rozptyl a příslušný krabicový diagram. Příklad 2. Mějme nezápornou náhodnou veličinu X se střední hodnotou \i. i=i 10; 7; 7; 8; 8; 9; 10; 9; 4; 9; 10; 9; 11; 9; 7; 8; 3; 9; 8; 7. 1 1. Bez dalších informací o rozdělení X odhadněte P(X > 3//). 2. Víte-li, že X ~ Ex(±), vypočtěte P(X > 3/i). Příklad 3. Určete pravděpodobnost, že při 1200 hodech kostkou padne šestka alespoň 150 krát a nejvýše 250 krát 1. pomocí Cebyševovy nerovnosti, 2. pomocí de Moivre-Laplaceovy věty. Příklad 4. Průměrná rychlost větru je na určitém místě 20 km/hod. • Bez ohledu na rozdělení rychlosti větru jako náhodné veličiny určete pravděpodobnost, že při jednom pozorování rychlost větru nepřesáhne 60 km/h. • Určete interval, v němž se bude rychlost větru nacházet s pravděpodobností alespoň 0,9, víte-li navíc, že směrodatná odchylka o = 1 km/hod. Příklad 5. Na FI je 10% studentů s prospěchem do 1,2. Jak velkou skupinu je třeba vybrat, aby s pravděpodobností 0,95 v ní bylo 8-12% studentů s prospěchem do 1,2? Úlohu řešte zvlášť pomocí Cebyševovy a zvlášť pomocí Moivre-Laplaceovy věty. Řešení. Nechť X značí náhodnou veličinu udávající počet studentů s prospěchem do 1,2 z n náhodně vybraných studentů. Pak X ~ Bi(n, 0.1). Podmínku ze zadání můžeme přepsat jako 0, 08n < X < 0,12n. Celkem tak máme podmínku ,-0,02n X-OAn -0,02nx 0,95 = PO, 08n 1 - a, 2 dolním odhadem 6 na hladině významnosti 1 — a je pak statistika L, pro níž P(L <6)>l-a. Případ, kdy je Xľ,..., Xn náhodný výběr z normálního rozdělení N(fi, a2): • M a S2 jsou nezávislé náhodné veličiny. • M ~ a2/n), a tedy U = (M - fj,)/(a/y/ň) ~ ÍV(0,1). • K= {n-l)S2/a2 ~x2(n-l). • E(^-/í)V^~x2(n). • T = (M-(j,)/(S/y/K)~t(n-l). Příklad 6. Pravděpodobnost, že zasazený strom se ujme, je 0,8. Jaká je pravděpodobnost, že z 500 zasazených stromů se jich ujme aspoň 380? Výsledek. 0,987. Příklad 7. Ke každému jogurtu běžné značky je náhodně (rovnoměrně) přibalen obrázek některého z 26 hokejových mistrů světa. Kolik jogurtů si fanynka Věrka musí koupit, aby s pravděpodobností 0,95 získala alespoň 5 kartiček Jaromíra Jágra? Příklad 8. Při 600 hodech kostkou padla jednička pouze 45 krát. Rozhodněte, jestli je možné tvrdit, že jde o ideální kostku na hladině a = 0,01. Vše zdůvodněte a svůj závěr explicitně formulujte. Příklad 9. Předpokládejme, že výška desetiletých chlapců má normální rozdělení N(fi, a2). S neznámou střední hodnotou [i a rozptylem o2 = 39,112. Změřením výšky 15 chlapců jsme určili výběrový průměr M = 139,13. Určete a) 99% oboustranný interval spolehlivosti pro parametr /i, b) dolní odhad /i na hladině významnosti 95%. Výsledek, a) (134,97; 143,29); b) 136,474. 3