Cvičení ke 12. sadě Vzorečky Náhodný výběr n hodnot X\,..., Xn náhodné veličiny X. Předpokládáme, že náhodná veličina X má střední hodnotu E(X) = /x, rozptyl a2. Řešení spočívá v převedení X na transformovanou normovanou náhodnou veličinu Z, která má standardizované rozložení se střední hodnotou 0. Podle toho, jestli známe rozptyl a2 (resp. jeho odmocninu a = směrodatnou odchylku), nebo ne, jde o normální rozdělení, nebo o Studentovo rozdělení se stupněm volnosti n—í. Podrobnosti tohoto převodu (= teorie) je v materiálech o statistice (matikaIV-statistikal3Jiypotezy.zip). Nyní k praktickým výpočtům: Počítáme k% interval spolehlivosti pro skutečnou hodnotu náhodné veličiny X. To znamená interval, ve kterém se náhodná veličina na k% vyskytuje. Předpokládáme, že je distribuční funkce $x symetrická podle přímky x = E(X). Takže když najdeme interval, který je umístěný symetricky podle této přímky a pravděpodobnost, že X padne vlevo od něj je (100 — -|)%, víme, že pravděpodobnost, že X padne vpravo od něj je také (100 — f)%, a X padne do intervalu s pravděpodobností k%. K počítání intervalu spolehlivosti potřebujeme: M = -(X1 + ... + Xn) n Když neznáme rozptyl měření, tak místo a2 vezmeme výběrový rozptyl S2 spočítaný z výběru takto: S2 = -^ ((Xi - M)2 + ... + (Xn - M)2) n ■ Vzoreček pro k% interval spolehlivosti (D, H) (D - dolní mez, H - horní _k_y 100-'• mez, označíme riziko a = 1 k • Pokud známe a: D = M - -^= •«!_-V" H = M+4= -Mi-2, vn 2 kde «i-« je takové číslo u G (0,1), pro které je hodnota distribuční funkce normálního standardizovaného rozložení <ř(w) = 1 — f • Toto číslo najdeme v tabulkách pro normální rozdělení. • Pokud neznáme a: Pokud neznáme a, použijeme místo toho S a místo normálního rozdělení použijeme Studentovo rozdělení se stupněm volnosti n—í. £> = M-4L-t(n-l)i_f F = M+-|.í(n-l)1_f, kde t(n — l)i-^ je takové číslo t G (0,1), pro které je hodnota distribuční funkce Studentova rozložení se stupněm volnosti n — í rovna <ř(w) = 1 — ^. Toto číslo najdeme v tabulkách pro Studentovo rozložení. 1 Jak hledat v tabulkách, které máte v ISu • Normální rozdělení: V názvech řádků jsou desetinná místa z, v názvech sloupců setiny z, uvnitř tabulky hodnoty P(0 < Z < z) = ${z) - \. • Studentovo rozdělení: V i.těm řádku jsou absolutní hodnoty kvantilu (|Äo,i| = —Äo,i) |Äo,os| = —í^o,05, • • •) Studentova rozdělení s i stupni volnosti. Aneb hodnoty — $~1(0,1), .... Důvod toho mínusu je to, že Studentovo rozložení je uvažováno se střední hodnotou v nule a jde symetricky do záporných a kladných čísel. (Kdyby tedy byly v tabulce uvedeny přímo kvantily, musely by být napsané včetně minusu). Příklady 1. Máme zadané hodnoty pěti měření (neboli výběr) vlhkosti vzduchu v místnosti 70%, 77%, 71%, 75%, 72%. Rozptyl měření je 3%2 (směrodatná odchylka je zadaná v %). Úkolem je určit 95% interval spolehlivosti skutečné vlhkosti vzduchu v místnosti. Řešení: (Procenta jsou jen jednotky: 70j,..., 72j. Hledáme 95% interval spolehli- 95 100 vosti. a = 1 — -M; = 0,05.) Spočítáme si M M = -(0,70 + 0,77 + 0,71+0,75 + 0,72) = 0,73 5 Je zadáno a = -y/3j2 = 1, 732j. Potřebujeme ještě najít v tabulce takové u-,_o!os, že pro distribuční funkci 1 2 standardizovaného normálního rozdělení platí $(«1_o2o5) = 1-----'— = 0,975. Hledáme uvnitř tabulky číslo 0, 975—0, 5 = 0, 475. To se nachází ve sloupci označeném 0, 06 a řádku označeném 1, 9. Součet těchto dvou čísel je 1, 96 ($(1,96) = 0,975). Všechno to dosadíme do vzorečku pro D a H: D = M-------= • u-, o,o5 = a/5 ľ ~ 1 732 = 73 - ^—=- • 1, 96 = 73 - 1, 5 = 71, 5 v5 H = 73 + 1, 5 = 74, 5 95% interval spolehlivosti je (71, 5; 74, 5). 2. Teď ten stejný úkol, ale pro neznámý rozptyl měření. Řešení: Postupujeme stejně, jen místo a budeme dosazovat S a budeme hledat v tabulce pro Studentovo rozdělení se stupněm volnosti (n — 1) = 5 — 1 = 4. 2 To S si musíme spočítat 1 Sz - ((70 - 73)2 + (77 - 73)2 + (71 - 73)2 + (75 - 73)2 + (72 - 73)2) 34 = T = 8,5 S= v/8ľ5 = 2,915. V tabulce pro Studentovo rozdělení chceme najít hodnotu t(n — l)i_« = t(4)1_o1o5. Pro stupeň volnosti 4 hledáme na řádku označeném čtyřkou. V tabulce uvnitř jsou čísla z, pro která je pravděpodobnost jednoho nebo dvou ocásků taková, jaký je popis sloupečku v prvním nebo druhém řádku tabulky. Jinými slovy např. pro stupeň volnosti 1 je pravděpodobnost, že se náhodná veličina se Studentovým rozdělením stupně volnosti 1 nachází mimo interval (—3,078; 3.078) - neboli v některém ze dvou ocásků - rovna 0, 20. Pravděpodobnost, že se náhodná veličina se Studentovým rozdělením stupně volnosti 1 nachází jen vpravo (dalo by se také říci jen vlevo, je to symetrické) od intervalu (—3, 078; 3.078) - neboli v jednom ze dvou ocásků -rovna 0,10. Hledáme v řádku označeném stupněm volnosti 4 hodnotu, pro kterou je pravděpodobnost dvou ocásků (two tails) - neboli pravděpodobnost, že je náhodná veličina mimo interval ( — hodnota, +hodnota) rovna a = 0, 05 (nebo pravděpodobnost jednoho ocásku rovna f = 0,025). To je právě hledaná hodnota í(4)i_o,o25- Našli jsme třetí sloupec í(4)i_o,o25 = 2, 776. Všechno to dosadíme do vzorečku pro D a H: D = M--|.((4)l_f = = 73 - -^-=^ ■ 2, 776 = 73 - 3, 62 = 69, 38 a/5 H = 73 + 3, 62 = 76, 62 95% interval spolehlivosti pro neznámý rozptyl je (69, 38; 76, 62). 3