M5120 - cvičení Číselné charakteristiky náhodného výběru a grafická zobrazení Ondřej Pokora (pokora@math.muni.cz) Ustav matematiky a statistiky, Přírodovědecká fakulta, Masarykova univerzita, Brno (podzim 2015) Ondřej Pokora, PřF MU (2015) Výběrové momenty, histogram, ECDF — i n Výběrový průměr: X = — Xj n , i=l 1 n —2 Výběrový rozptyl: S| = ——j- Yu (Xi ~ X) i=l Výběrová (empirická) distribuční funkce (ECDF): 1 F(x) = Fn(x) = -1{i £ 1,...,n : Xj < x}| n Konstrukce histogramu: Rozpětí náhodného výběru rozdělíme na vhodný počet k (doporučeno k « y^ž) intervalů šírky r. V každém z nich pak počítáme relativní četnost fj = ^. Histogram se skládá z obdélníků o základnách délky r určených f. dělením rozpětí na intervaly a výškách J-j. M5120 - cvičení - Číselné charakteristiky Výběrové kvantily #-kvantil xa je číslo, rozdělující uspořádaný náhodný výběr X^ < • • • < na dolní úsek, obsahující aspoň podíl oc všech dat a na horní úsek obsahující aspoň podíl 1 — oc všech dat. Algoritmus výpočtu výběrového #-kvantilu: noc f celé číslo c -~ _XW+X(c+1) [necelé číslo =^> xa = X^, kde c = [noc Pro speciálně zvolená a: užíváme názvů: Xq,50 ~~ medián, Xq,25 ~~ dolní kvartil, Xq,75 - horní kvartil, Xq,1/• • • /xo,9 ~ decily, Xo,oi/• • • /*o,99 ~~ percentily. Charakteristikou variability je kvartilová odchylka: q = Xq,75 — x0,25 (interquartile range, IQR). Krabicový graf (boxplot) je grafické znázornění číselných charakteristik *0,50 — 1/ 5 q < Xo,25 < *0,50 < *0,75 < *0,50 + 1,5 í/. Pozor, různé softwary (včetně /?) vykreslují boxploty různými způsoby! Ondřej Pokora, PřF MU (2015) M5120 - cvičení - Číselné charakteristiky 3/5 histogram a hustota (výberová) distribuční funkce Ondřej Pokora, PřF MU (2015) M5120 - cvičení - Číselné charakteristiky