Příklady z popisné statistiky Příklad 1.: Hodnoty znaku X mají průměr -3 a rozptyl 4. Najděte průměr a rozptyl hodnot znaku Y = 1 ­ 5X. Řešení: Podle 5.17. a) dostáváme: m2 = 1 - 5m1 = 1 ­ 5.(-3) = 16, s2 2 = 52 .s1 2 = 25.4 = 100. Příklad 2.: Hodnoty znaku X mají aritmetický průměr 20 a směrodatnou odchylku 10. Najděte aritmetický průměr hodnot znaku Y = X2 . Řešení: Průměr hodnot znaku Y je == == n 1i 2 i n 1i i2 x n 1 y n 1 m . Průměr součtu kvadrátů hodnot znaku X se objeví ve výpočetním vzorci pro rozptyl hodnot znaku X: 2 1 n 1i 2 i 2 1 mx n 1 s -= = . Odtud dostaneme 5002010msx n 1 m 222 1 2 1 n 1i 2 i2 =+=+== = Příklad 3.: V datovém souboru zvýšíme každou hodnotu o 10%. O kolik procent se zvýší rozptyl a o kolik % se zvýší koeficient variace? Řešení: Transformace X na Y je dána vzorcem Y = 1,1X. Tedy podle 5.17. a) m2 = 1,1m1 a s1 2 = 1,12 s1 2 = 1,21s1 2 . Vidíme, že rozptyl se zvýší o 21%. Podle 5.25 je koeficient variace znaku Y roven 1 1 1 1 2 2 m s m1,1 s1,1 m s == . Koeficient variace se tedy nezmění. Příklad 4.: Znak X nabývá variant 0 a 1, přičemž varianta 0 se vyskytuje v 80% případů. Vypočtěte průměr a směrodatnou odchylku znaku X. Řešení: Podle 5.18. a) je vážený průměr [ ] [ ] == == r 1j jj r 1j jj xpxn n 1 m . V našem případě varianta x[1] = 0, její relativní četnost p1 = 0,8, varianta x[1] = 1, její relativní četnost p2 = 0,2. Po dosazení máme: m = 0,8.0 + 0,2.1 = 0,2. Podle 5.18. a) je vážený rozptyl [ ]( ) [ ]( == -=-= r 1j 2 jj r 1j 2 jj 2 mxpmxn n 1 s ) . Po dosazení máme: s2 = 0,8(0 ­ 0,2)2 + 0,2(1 ­ 0,2)2 = 0,8.0,04 + 0,2.0,64 = 0,16, 4,016,0s == Příklad 5.: Vážený aritmetický průměr činil 1500 a vážený rozptyl 90000. Varianty x[j] byly transformovány vztahem: h ax y ]j[ ]j[ - = , j = 1, ..., r. Po této transformaci byl vážený aritmetický průměr 5 a vážený rozptyl 9. Určete konstanty a a h. Řešení: Podle 5.17. a) je průměr lineární kombinace Y = a + bX roven m2 = a + bm1. V našem případě tedy h a1500 5 - = . Podle 5.17. a) je rozptyl lineární kombinace Y = a + bX roven s2 2 = b2 s1 2 . V našem případě tedy 2 h 90000 9 = . Odtud h1 = 100, h2 = -100. Z první rovnice dostaneme a1 = 1500 ­ 5.100 = 1000, a2 = 1500 + 5.100 = 2000. Příklad 6.: Rozptyl součtů hodnot dvou znaků je 350, rozptyl rozdílů je 700. Vypočtěte koeficient korelace, víte-li, že oba znaky mají stejné rozptyly. Řešení: Podle 5.17. b) je rozptyl součtu U = X + Y roven s3 2 = s1 2 + s2 2 + 2s12 a analogicky rozptyl rozdílu V = X - Y roven s4 2 = s1 2 + s2 2 - 2s12. Společnou hodnotu rozptylů znaků X a Y označíme s2 . Dostáváme tedy dvě rovnice pro dvě neznámé: 2s2 + 2s12 = 350 2s2 - 2s12 = 700 Odtud vypočteme s2 = 262,5 a s12 = -87,5. Koeficient korelace se počítá podle vzorce 21 12 12 ss s r = , v našem případě 3 1 5,262 5,87 s s r 2 12 12 -=-== Příklad 7.: Máme k dispozici údaje od šesti obchodníků o poptávce (v kusech) po určitém výrobku loni a letos: č. obchodníka 1 2 3 4 5 6 poptávka loni 20 60 70 100 150 260 poptávka letos 50 60 60 120 230 320 Pro úsporu času máte uvedeny číselné charakteristiky: m1 = 110, m2 = 140, s1 2 = 6066,7, s2 2 = 10300, r12 = 0,972. a) Stanovte parametry regresní přímky, která vystihuje závislost letošní poptávky na loňské. b) Byla-li loňská poptávka 110 kusů, jaký je regresní odhad letošní poptávky? Řešení: Nejprve nakreslíme dvourozměrný tečkový diagram. 0 20 40 60 80 100 120 140 160 180 200 220 240 260 280 X 0 50 100 150 200 250 300 350 Y Ze vzhledu tohoto diagramu lze soudit, že regresní přímka bude vhodným modelem závislosti letošní poptávky (znak Y) na loňské (znak X). ad a) Podle 6.9. máme: 2665,1 7,6066 10300 972,0 s sr s ssr s s b 1 212 2 1 2112 2 1 12 1 == = == 685,01102665,1140mbmb 1120 =-=-= Regresní přímka má tedy rovnici y = 0,685 + 1,2665x. ad b) 1401102665,1685,0y =+= ) Příklad 8.: Závislost mezi vnější teplotou a teplotou ve skladišti je popsána regresní přímkou y = 8+0,6x. Při jaké vnější teplotě klesne teplota ve skladišti pod bod mrazu? Řešení: 0 = 8 + 0,6x, tedy 3,13 6,0 8 x -=-= . Teplota ve skladišti klesne pod bod mrazu při vnější teplotě -13,3°C. Příklad 9.: Jak se změní směrnice regresní přímky, když každou hodnotu závisle proměnného znaku zvětšíme o 10 % ? Řešení: Původní regresní přímka má rovnici y = b0 + b1x, nová regresní přímka má rovnici 1,1y = 1,1(b0 + b1x), tedy úsek i směrnice se zvýší o 10%. Příklad 10.: V datovém souboru, z něhož byl vypočten průměr 110 a rozptyl 800, byly zjištěny 2 chyby: místo 85 má být 95 a místo 120 má být 150. Ostatních 18 údajů je správných. Opravte průměr a rozptyl. Řešení: Bez újmy na obecnosti lze předpokládat, že prvních 18 hodnot je správných. Původní průměr: 19951208511020x12085x 20 1 x 20 1 m110 18 1i i 18 1i i 20 1i i1 =--= ++=== === Nový průměr: ( ) 112150951995 20 1 15095x 20 1 m 18 1i i2 =++= ++= = Původní rozptyl: 800 = 236375x11012085x 20 1 mx 20 1 18 1i 2 i 222 18 1i 2 i 2 1 20 1i 2 i =- ++=- === Nový rozptyl: ( ) 85111215095236375 20 1 m15095x 20 1 s 2222 2 22 18 1i 2 i 2 2 =-++=- ++= =