Induktivní statistika o normální rozdělení o rozdělení výběrových průměrů Normální rozdělení o normální rozdělení je symetrické, unimodální, zvonovitého tvaru o označuje se i jako Gaussova křivka Normální rozdělení Normální rozdělení o 34.13% skórů spadá mezi průměr a 1 směr. odchylku o 13.59% hodnot spadá mezi 1. a 2. směr. odchylku o 2.28% hodnot spadá nad 2. směr. odchylku Normální rozdělení o tabulka normálního rozdělení (z rozdělení) o důležitý nástroj, obvykle jako apendix v učebnicích statistiky (spolu s dalšími tabulkami) o umožňuje zjistit hustotu oblasti pod křivkou (tj. pravděpodobnost) pro jednotlivé z-skóry Normální rozdělení Normální rozdělení - příklady o postup při zjišťování pravděpodobnosti z tabulky: n načrtnout si normální rozdělení, s hodnotou průměru a směr. odch. n zakreslit hledanou hodnotu (v přibližné vzdálenosti od průměru), vystínovat hledanou oblast n převést hodnotu X na z-skór n najít v tabulce pravděpodobnost Normální rozdělení - příklady o Jaká je pravděpodobnost, že náhodně vybraná osoba z populace bude mít IQ 130 nebo vyšší? (m = 100, s =15) Normální rozdělení - příklady o z = 2 Normální rozdělení - příklady o Jaká je pravděpodobnost, že náhodně vybraná osoba z populace bude mít IQ 130 nebo vyšší? o z = 2 o p = 1 – (0.50 +0.4772) = 0.0228 tj. 2,3% Normální rozdělení - příklady o Jaká je pravděpodobnost, že náhodně vybraná osoba z populace bude mít IQ 85 nebo nižší? Normální rozdělení - příklady o z = -1 Normální rozdělení - příklady o Jaká je pravděpodobnost, že náhodně vybraná osoba z populace bude mít IQ 85 nebo nižší? o z = -1 o p = 1 - (0.50+0.3413) = 0.1587 tj. 15,9% Normální rozdělení - příklady o postup při zjišťování z-skóru z tabulky: n načrtnout si normální rozdělení n vystínovat oblast odpovídající zadané pravděpodobnosti n v tabulce vyhledat příslušný z-skór n vypočítat z něj hrubý skór Normální rozdělení - příklady o Jakou minimální hodnotu IQ musí člověk mít, aby patřil mezi 5% osob s nejvyššími hodnotami IQ? Normální rozdělení - příklady o p = 0.05 Normální rozdělení - příklady o Jakou minimální hodnotu IQ musí člověk mít, aby patřil mezi 5% osob s nejvyššími hodnotami IQ? o p = 0.05 o z tabulky (hledáme hodnotu nejbližší 0.50-0.05, tj. 0.45): z = 1.65 o X = (1.65)x(15) + 100 = 124.75 Normální rozdělení - příklady o někdy chceme zjistit pravděpodobnost, že skór bude spadat do určitého intervalu o postup: n načtrtnout graf a vystínovat zadanou oblast n oba (ohraničující) skóry převést na z-skóry n vyhledat pravděpodobnosti < nebo > skóru n sečíst či odečíst pravděpodobnosti Normální rozdělení - příklady o Jaká je pravděpodobnost, že náhodně vybraný student bude v testu z psychologie skórovat mezi 300 a 650 body? (m = 500, s =100) Normální rozdělení - příklady Normální rozdělení - příklady o Jaká je pravděpodobnost, že náhodně vybraný student bude v testu z psychologie skórovat mezi 300 a 650 body? (m = 500, s =100) o p(300 < x < 650) = 0.4772 + 0.4332 = 0.9104 Normální rozdělení - příklady o příklad: kolik procent osob má nižší hodnoty IQ než člověk s IQ 130? Normální rozdělení - příklady o z = 2 Normální rozdělení - příklady o Kolik procent osob má nižší hodnoty IQ než člověk s IQ 130? o z tabulky: pro z = 2 p = 0.50 + 0.4772 = 0.9772 97.72% osob má nižší skór Rozdělení výběrových průměrů o cílem induktivní statistiky je odhadnout parametry populace z charakteristik vzorku (výběrového souboru) o např. odhadem průměru populace bude průměr vzorku o odhad je vždy zatížen určitou výběrovou chybou Rozdělení výběrových průměrů o předpokládejme, že z jedné populace vybereme 3 různé vzorky o budou se nejspíš navzájem lišit ve tvaru rozdělení hodnot, průměru i variabilitě o jak se rozhodneme, který z nich zvolit pro odhad průměru populace ?? Rozdělení výběrových průměrů Rozdělení výběrových průměrů o pokud bychom spočítali průměry ze všech možných výběrů o určité velikosti n, budou tvořit tzv. rozdělení výběrových průměrů (sampling distribution) Rozdělení výběrových průměrů o příklad: populace hodnot 2, 4, 6, 8 o průměr m = 5 o předpokládejme, že průměr neznáme a pokoušíme se ho odhadnout ze vzorku n=2 o v tabulce jsou uvedeny všechny možné výběrové soubory Rozdělení výběrových průměrů Rozdělení výběrových průměrů Rozdělení výběrových průměrů o jaká je pravděpodobnost, že z této populace vybereme vzorek s průměrem vyšším než 7? Rozdělení výběrových průměrů Rozdělení výběrových průměrů o jaká je pravděpodobnost, že z této populace vybereme vzorek s průměrem vyšším než 7? o v rozdělení výběrových průměrů je takový vzorek jen 1 ze 16 – tj. pravděpodobnost takového vzorku je 1/16 = 0.0625, tj. 6% Rozdělení výběrových průměrů o jaká je pravděpodobnost, že náhodně vybraný vzorek 2 čísel z této populace bude mít průměr roven průměru populace, tj. 5? Rozdělení výběrových průměrů Rozdělení výběrových průměrů o jaká je pravděpodobnost, že náhodně vybraný vzorek 2 čísel z této populace bude mít průměr roven průměru populace, tj. 5? o tato pravděpodobnost je 4/16, tj. 25% Rozdělení výběrových průměrů o většina populací i vzorků je mnohem větší o ale existují určité základní vlastnosti rozdělení výběrových průměrů (RVP) o tvar – RVP se při dostatečně velkém vzorku (>30 případů) blíží normálnímu rozdělení Rozdělení výběrových průměrů o průměr tohoto rozdělení (=průměr průměrů všech teoretických výběrů) je roven průměru populace o označuje se také jako očekávaná hodnota průměru vzorku Rozdělení výběrových průměrů o variabilita – směrodatná odchylka RVP se označuje jako výběrová nebo standardní/směrodatná chyba průměru (standard error) o jde o směrodatnou odchylku výběrových průměrů od průměru populace o ukazuje, jak spolehlivý je odhad populačního průměru z průměru vzorku – tj. jak velkou chybou je odhad zatížen Rozdělení výběrových průměrů o velikost výběrové chyby je dána dvěma charakteristikami: n variabilitou znaku v populaci n velikostí výběru o variabilita znaku v populaci: čím je vyšší, tím je vyšší i variabilita výběrových průměrů Rozdělení výběrových průměrů Rozdělení výběrových průměrů o velikost výběru – čím větší výběr (n), tím méně průměrů výběrů se výrazně odchyluje od průměru populace (= výběrová chyba je menší) Rozdělení výběrových průměrů o vzorec pro výpočet výběrové chyby: s[x] = s/√n Rozdělení výběrových průměrů o platí zjednodušení tzv. centrálního limitního teorému – pro každou populaci o průměru m a směrodatné odchylce s se bude rozdělení výběrových průměrů výběrů (pro rozsah výběru jdoucí do nekonečna) blížit normálnímu rozdělení s průměrem m a směrodatnou odchylkou s[x] = s/√n Rozdělení výběrových průměrů o příklad: když vybereme z populace náhodně vzorek 9 osob, jaká je pravděpodobnost, že jejich průměrné IQ bude větší nebo rovno 112? Rozdělení výběrových průměrů o ptáme se vlastně: jaká je pravděpodobnost, že vzorek 9 osob z populace o průměru 100 bude mít průměr 112 nebo vyšší? o a k tomu potřebujeme znát odpověď na otázku jaké je rozdělení výběrových průměrů pro populaci s průměrem 100, sd 15 a velikost vzorku 9? Rozdělení výběrových průměrů o musíme zjistit charakteristiku rozdělení výběrových průměrů pro tuto velikost vzorku (N=9) u populace s m = 100, s= 15 o průměr RVP = 100 o směrodatná odchylka = výběrová (směrodatná) chyba: s[x] = s/√n = 15/3 = 5 Rozdělení výběrových průměrů Rozdělení výběrových průměrů o známe průměr a směrodatnou odchylku rozdělení, převedeme tedy skór 112 na z-skór o m = 100, s[x] = 5 o z = (112-100)/ s[x] = 12/5 = 2.4 Rozdělení výběrových průměrů Rozdělení výběrových průměrů o pak najdeme v tabulce z-rozdělení pravděpodobnost pro z=2.4 Tabulka z-rozdělení Rozdělení výběrových průměrů o pak najdeme v tabulce z-rozdělení pravděpodobnost pro z=2.4 o 0.4918 o přičteme 50% (záporná strana z-rozdělení) = 0.9918 o hodnoty do z=2.4 tvoří 99.18% výběrových průměrů o zbývá 1-0.9918 = 0.0082 Rozdělení výběrových průměrů Rozdělení výběrových průměrů o příklad: když vybereme z populace náhodně vzorek 9 osob, jaká je pravděpodobnost, že jejich průměrné IQ bude větší nebo rovno 112? o řešení: p = 0,0082 (0,82%) Příklad 2 o IQ (m=100, s=15) o jaká je pravděpodobnost, že průměr výběru o velikosti n=25 bude mezi hodnotami 94 a 106? Rozdělení výběrových průměrů o musíme zjistit charakteristiku rozdělení výběrových průměrů pro tuto velikost vzorku (N=25) u populace s m = 100, s= 15 o průměr RVP = 100 o směrodatná odchylka = výběrová (směrodatná) chyba: s[x] = s/√n = 15/5 = 3 Příklad 2 o IQ (m=100, s=15) o jaká je pravděpodobnost, že průměr výběru o velikosti n=25 bude mezi hodnotami 94 a 106? o z = (94-100) / (15/ √25) = -6/3 = -2 o z = (106-100) / (15/ √25) = 6/3 = 2 Příklad 2 o najdeme v tabulce normovaného normálního rozdělení hodnotu pravděpodobnosti pro z=2 a z=-2 Tabulka z-rozdělení Příklad 2 o hodnota pravděpodobnosti je 0.4772 o sečteme levou a pravou stranu: 0.4772 + 0.4772 o výsledek 0,9544 Příklad 2 o IQ (m=100, s=15) o jaká je pravděpodobnost, že průměr výběru o velikosti n=25 bude mezi hodnotami 94 a 106? o pravděpodobnost takového průměru je 95,4% Příklad 3 o IQ (m=100, s=15) o v jakém rozsahu hodnot bude pravděpodobně 80% všech průměrů výběrů o velikosti n=25? Příklad 3 o IQ (m=100, s=15) o v jakém rozsahu hodnot bude pravděpodobně středních 80% všech průměrů výběrů o velikosti n=25? o potřebujeme zjistit hodnotu z, která odděluje pravděpodobnost 10% na obou stranách rozdělení Příklad 3 Tabulka z-rozdělení Příklad 3 o IQ (m=100, s=15) o v jakém rozsahu hodnot bude pravděpodobně středních 80% všech průměrů výběrů o velikosti n=25? o z = 1,28 a -1,28 převedeme na hodnoty IQ Příklad 3 _ x = m + z (s/√n) _ x = 100 + 1,28 (15/√25) = 100+1,28(3) = 103,84 _ x = 100 + (-1,28) (15/√25) = 100-1,28(3) = 96,16 Příklad 3 o IQ (m=100, s=15) o v jakém rozsahu hodnot bude pravděpodobně středních 80% všech průměrů výběrů o velikosti n=25? o 80% výběrových průměrů bude v rozsahu hodnot 96,16 - 103,84 Kontrolní otázky o výpočet a především interpretace z-skórů o normální rozdělení – charakteristiky o rozdělení výběrových průměrů o výpočet směrodatné chyby Literatura o Hendl: kapitoly 4 a 5