Normální rozdělení a ověření normality dat Normalita Opakování  Jaké znáte typy dat? Uveďte příklady…  Jak popisujeme data? Normální rozdělení I • Nejklasičtějším modelovým rozložením, od něhož je odvozena celá řada statistických analýz je tzv. normální rozložení, známé též jako Gaussova křivka. • Popisuje rozdělení pravděpodobnosti spojité náhodné veličiny: např. výška v populaci, chyba měření… • Je kompletně popsáno dvěma parametry: μ – střední hodnota σ2 – rozptyl Označení: N(μ, σ2) • Normalita je klíčovým předpokladem řady statistických metod • Pro ověření normality existuje řada testů a grafických metod Normální rozdělení II • V rozmezí μ ± 3σ by se mělo vyskytovat 99,7 % všech hodnot • Použití: zhodnotíme tvar rozdělení a přítomnost odlehlých hodnot 99,7 % všech hodnot Standardizované normální rozdělení Tabelovaná podoba z = x - µ σ 2 2 2 )( . 2. 1 )( σ µ πσ ϕ − − = x ex 2 2 . .2 1 )( z ez − = π ϕ N (0,1) ϕ(z) 0 z ϕ(x) N (µ,σ) µ x Vzorec pro hustotu normálního rozdělení Vzorec pro hustotu standardizovaného normálního rozdělení • Normální rozdělení se střední hodnotou nula a jednotkovým rozptylem Vizuální ověření normality  Pro hodnocení tvaru rozložení lze využít histogram (nevýhoda: nutné určit „vhodný“ počet sloupců)  Vhodnější jsou: 1. Q-Q graf (kvantil-kvantilový graf) 2. P-P graf (pravděpodobnostně-pravděpodobnostní graf) 3. N-P graf (normální-pravděpodobnostní graf) Opakování: Co je kvantil? Řešení v softwaru Statistica I 1 2 • V menu Graphs zvolíme 2D Graphs • V případě, že máme v datech několik stejných hodnot, je vhodné odškrtnout Neurčovat průměrnou pozici svázaných pozorování Výběr rozdělení 3 Rozdíl mezi N-P, Q-Q, P-P grafem • Pouze výměna os • Znázorněn pozorovaný a teoretický kvantil ??? • Vykresleno kumulativní rozdělení PAMATUJ: Pocházejí-li data z normálního rozložení, pak body budou ležet okolo přímky Vizualizace I. Zešikmená (nesymetrická) data Špičatost Vizualizace II. Odlehlé hodnoty Diskrétní rozdělení