Cvičení 11: Nerovnosti, Popisná statistika a normálni rozdělení Teorie: Datový soubor tvoří naměřené hodnoty: Po seřazení označujeme X(l) < X(2) < ■■■< X(n). Aritmetický průměr: x = m = ^ Yľi=i x*- Modus x je nejčastější hodnota znaku. Průměrná odchylka: o Rozptyl s2 = - Yľi=i(xi ~ XÝsměrodatná odchylka s = yfs*. Modifikovaný rozptyl ^rjs2. Centrované hodnoty xt — x, , standardizované hodnoty jo-kvantil (0 < p < 1) je 1 y-m I - p X([np]+i pro np Z \{x{nP) + X(nP)+i) pro np G Z, kde [a] značí celou část čísla a. Speciálně žo,5 je medián, žo,25, resp. xojs, dolní, resp. horní kvartil, xo,i, žo,2i • • •, ^0,9 decily apod. Mezikvartilové rozpětí je definováno jako Q = £0,75 — žo,25- Pro dvourozměrný datový soubor [xl,yl], kde 1 < í < n definujeme kovarianci prvního a druhého znaku jako a koeficient korelace mezi prvním a druhým znakem jako r 12 = ^7-. Krabicový diagram (box plot): dolní a horní strana základního obdélníka (krabice) odpovídá dolnímu a hornímu kvartilu, vodorovná čára uvnitř krabice mediánu (výška krabice je tedy mezikvartilové rozpětí). Dolní svislá úsečka (dolní fous) odpovídá hodnotám, které leží „pod krabicí" ve vzdálenosti nejvýše 1,5 násobku její výšky, obdobně horní fous. Mimo fousy se znázorňují ostatní body (tzv. odlehlá pozorování). Křížek uvnitř krabice znázorňuje aritmetický průměr. Příklad 1. Byly naměřeny následující hodnoty nějakého znaku Určete aritmetický průměr, medián, kvartily, rozptyl a příslušný krabicový diagram. Příklad 2. Mějme nezápornou náhodnou veličinu X se střední hodnotou \i. i=i 10; 7; 7; 8; 8; 9; 10; 9; 4; 9; 10; 9; 11; 9; 7; 8; 3; 9; 8; 7. 1 1. Bez dalších informací o rozdělení X odhadněte P(X > 3/i). 2. Víte-li, že X ~ Ex(±), vypočtěte P(X > 3/i). Příklad 3. Určete pravděpodobnost, že při 1200 hodech kostkou padne šestka alespoň 150 krát a nejvýše 250 krát 1. pomocí Cebyševovy nerovnosti, 2. pomocí de Moivre-Laplaceovy věty. Příklad 4. Průměrná rychlost větru je na určitém místě 20 km/hod. • Bez ohledu na rozdělení rychlosti větru jako náhodné veličiny určete pravděpodobnost, že při jednom pozorování rychlost větru nepřesáhne 60 km/h. • Určete interval, v němž se bude rychlost větru nacházet s pravděpodobností alespoň 0,9, víte-li navíc, že směrodatná odchylka o = 1 km/hod. Příklad 5. Na FI je 10% studentů s prospěchem do 1,2. Jak velkou skupinu je třeba vybrat, aby s pravděpodobností 0,95 v ní bylo 8-12% studentů s prospěchem do 1,2? Úlohu řešte zvlášť pomocí Cebyševovy a zvlášť pomocí Moivre-Laplaceovy věty. Náhodným výběrem rozsahu n rozumíme n-tici stochasticky nezávislých a náhodných veličin X±,... , Xn, které mají totéž rozdělení. S náhodným výběrem se obvykle setkáváme při opakovaném provádění téhož pokusu. Statistika je náhodná veličina vzniklá transformací náhodného výběru. • Výběrový průměr M = - Y^=i Xi, a jsou-li navíc Xi,..., Xn ~ N(fi, a2), pak M ~ N(fjL,a2/n). . Výběrový rozptyl S2 = ^ £ľ=i{X% - M)2 = ^(£?=i X2-nM),S = v7^. Intervalovým odhadem parametru 6 rozumíme interval (Tl, Tu), kde Tl(Xi, ..., Xn) a Tjj(Xi, ..., Xn) jsou statistiky výběru (Xi,..., Xn). Platí-li P{TL < 6 < Tu) = 1 - a, říkáme, že (Tu, Tu) je 100 • (1 — a)% interval spolehlivosti pro parametr 6. Horním odhadem parametru 6 na hladině významnosti 1 — a je statistika U, pro níž P(6 < U) > 1 - a, dolním odhadem 6 na hladině významnosti 1 — a je pak statistika L, pro níž P(L <6)>l-a. Případ, kdy je Xi,..., Xn náhodný výběr z normálního rozdělení N(fi, a2): 2 • M a S2 jsou nezávislé náhodné veličiny. • M ~ a2/n), a tedy U = (M - fj,)/(a/y/n) ~ ÍV(0,1). • K= {n-l)S2/a2 ~x2(n-l). • E(^i-/í)V^~X2W. • T = {M-n)/{Sly/íi) ~í(n-l). Příklad 6. Pravděpodobnost, že zasazený strom se ujme, je 0,8. Jaká je pravděpodobnost, že z 500 zasazených stromu se jich ujme aspoň 380? Příklad 7. Ke každému jogurtu běžné značky je náhodně (rovnoměrně) přibalen obrázek některého z 26 hokejových mistrů světa. Kolik jogurtů si fanynka Věrka musí koupit, aby s pravděpodobností 0,95 získala alespoň 5 kartiček Jaromíra Jágra? Příklad 8. Při 600 hodech kostkou padla jednička pouze 45 krát. Rozhodněte, jestli je možné tvrdit, že jde o ideální kostku na hladině a = 0,01. Vše zdůvodněte a svůj závěr explicitně formulujte. Příklad 9. Předpokládejme, že výška desetiletých chlapců má normální rozdělení N(fi, a2). S neznámou střední hodnotou /i a rozptylem a2 = 39,112. Změřením výšky 15 chlapců jsme určili výběrový průměr M = 139,13. Určete a) 99% oboustranný interval spolehlivosti pro parametr /i, b) dolní odhad /i na hladině významnosti 95%. 3