Induktivní statistika - úvod opravděpodobnost oz-skóry onormální rozdělení orozdělení výběrových průměrů o o o o o Pravděpodobnost opostupy induktivní statistiky vycházejí z teorie pravděpodobnosti opravděpodobnost, že nastane určitý výsledek, definujeme jako podíl o n počet pokusů, kdy nastal jev A nP (A) = n celkový počet jevů Pravděpodobnost - příklady ojaká je pravděpodobnost, že si z balíčku 52 karet vytáhneme určitou kartu (např. pikovou dámu) ? Pravděpodobnost - příklady ojaká je pravděpodobnost, že si z balíčku 52 karet vytáhneme určitou kartu (např. pikovou dámu) ? o oP (piková dáma) = f/N = 1/52 = 0,019= 1,9% Pravděpodobnost - příklady ojaká je pravděpodobnost, že při hodu kostkou padne trojka nebo šestka ? o Pravděpodobnost - příklady ojaká je pravděpodobnost, že při hodu kostkou padne trojka nebo šestka ? o oP (3 n. 6) = f/N = 2/6 = 0,333= 33,3% Pravděpodobnost opravděpodobnost bývá uváděna nejčastěji jako podíl (0,33), zlomek (1/3) nebo procento (33,3%) opravděpodobnost určitého jevu nebo třídy jevů můžeme odhadnout z rozdělení hodnot (četností) Pravděpodobnost - příklady opředstavme si, že máme krabici se 40 očíslovanými žetony s čísly 1 – 5 ov tabulce jsou uvedeny absolutní i relativní četnosti jednotlivých čísel žetonů o Pravděpodobnost X f p 1 4 0,10 2 8 0,20 3 16 0,40 4 10 0,25 5 2 0,05 Pravděpodobnost prst1 Pravděpodobnost - příklady ovaším úkolem je vytáhnout 1 žeton ojaká je pravděpodobnost, že vytáhnete žeton s číslem 3? Pravděpodobnost X f p 1 4 0,10 2 8 0,20 3 16 0,40 4 10 0,25 5 2 0,05 Pravděpodobnost ovaším úkolem je vytáhnout 1 žeton ojaká je pravděpodobnost, že vytáhnete žeton s číslem 3? op (3) = f/N = 16/40 =0,40 o nebo 2/5 či 40% Pravděpodobnost oJaká je pravděpodobnost, že vytáhnete žeton s číslem vyšším než 2? Pravděpodobnost X f p 1 4 0,10 2 8 0,20 3 16 0,40 4 10 0,25 5 2 0,05 Pravděpodobnost oJaká je pravděpodobnost, že vytáhnete žeton s číslem vyšším než 2? o p(X > 2) = ? o 0,05 + 0,25 + 0,40 = 0,70 o o prst2 Pravděpodobnost oJaká je pravděpodobnost, že vytáhnete žeton s číslem nižším než 5? Pravděpodobnost X f p 1 4 0,10 2 8 0,20 3 16 0,40 4 10 0,25 5 2 0,05 Pravděpodobnost oJaká je pravděpodobnost, že vytáhnete žeton s číslem nižším než 5? o p(X < 5) = ? o 0,10 + 0,20 + 0,40 + 0,25 = 0,95 o o prst3 Pravděpodobnost oJaká je pravděpodobnost, že vytáhnete žeton s číslem nižším než 4 a vyšším než 1? Pravděpodobnost X f p 1 4 0,10 2 8 0,20 3 16 0,40 4 10 0,25 5 2 0,05 Pravděpodobnost oJaká je pravděpodobnost, že vytáhnete žeton s číslem nižším než 4 a vyšším než 1? o p(4 > X > 1) = ? o 0,20 + 0,40 = 0,60 o o prst4 Pravděpodobnost opravděpodobnost odpovídá hustotě oblasti pod křivkou pro daný interval o o Z-skóry oumožňují najít a popsat pozici každé hodnoty v rámci rozdělení hodnot oa také srovnávání hodnot pocházejících z měření na rozdílných stupnicích ohrubé skóry jsou převedeny na standardizovanou stupnici (jednotkou je směrodatná odchylka) o o Z-skóry - příklad onapř. skóry ze dvou testů – biologie a psychologie ostudent získal 26 bodů z biologie a 620 z psychologie. Ve kterém předmětu byl lepší? Z-skóry - příklad zskory1 Z-skóry opřímé porovnání není snadné – skóry z obou testů mají rozdílné průměry i směrodatné odchylky oz skór =odchylka skóru od průměru vzhledem k velikosti směrodatné odchylky oz = odch. od průměru/směr. odch. Z-skóry - příklad oskór z biologie: (26-18)/6 = 1,33 oskór psychologie: (620-500)/100=1,2 ov biologii byl student lepší – 1,33 směrodatné odchylky nad průměrem Z-skóry oz-skór přesně udává pozici každé hodnoty vzhledem k ostatním hodnotám oznaménko (+ nebo -) ukazuje, zda je hodnota nad nebo pod průměrem rozdělení ohodnota z-skóru upřesňuje, kolik směrodatných odchylek byla hodnota od průměru vzdálena Z-skóry oprůměr rozdělení z-skórů je vždy 0 osměrodatná odchylka je 1 z skóry Z-skóry ovzorec pro výpočet z-skóru hodnoty X o ou populace: z = (X – μ) /σ o ou vzorku: z = (X - m) / s Z-skóry opodobně můžeme i z-skór převést na hrubý skór, známe-li průměr a směrodatnou odchylku Z-skóry onapř. u stupnice IQ om = 100, s = 15 opro osobu se z=-3 (3 směrodatné odchylky pod průměrem) bude IQ ? Z-skóry onapř. u stupnice IQ m = 100, s = 15 opro osobu se z=-3 (3 směrodatné odchylky pod průměrem) bude IQ o o X = Z . s + m o X = -3 . 15 + 100 o X = 55 Rozdělení z-skórů otvar rozdělení z-skórů je stejný jako tvar původního rozdělení hrubých skórů oprůměr je 0, směrodatná odchylka 1 otransformace změní jen označení hodnot na ose X Normální rozdělení o onormální rozdělení je symetrické, unimodální, zvonovitého tvaru ooznačuje se i jako Gaussova křivka o Normální rozdělení prst5 Normální rozdělení o34.13% skórů spadá mezi průměr a 1 směr. odchylku o13.59% hodnot spadá mezi 1. a 2. směr. odchylku o2.28% hodnot spadá mezi 2. a 3. směr. odchylku prst6 Normální rozdělení otabulka normálního rozdělení (z rozdělení) odůležitý nástroj, obvykle jako apendix v učebnicích statistiky (spolu s dalšími tabulkami) oumožňuje zjistit hustotu oblasti pod křivkou (tj. pravděpodobnost) pro jednotlivé z-skóry o Normální rozdělení z levá strana pravá strana 0.00 0.5000 0.5000 0.01 0.5040 0.4960 … … … 0.30 0.6179 0.3821 0.31 0.6217 0.3783 … … … 1.00 0.8413 0.1587 … … … prst7 Normální rozdělení - příklady opostup při zjišťování pravděpodobnosti z tabulky: nnačrtnout si normální rozdělení, s hodnotou průměru a směr. odch. nzakreslit hledanou hodnotu (v přibližné vzdálenosti od průměru), vystínovat hledanou oblast npřevést hodnotu X na z-skór nnajít v tabulce pravděpodobnost n n Normální rozdělení - příklady oJaká je pravděpodobnost, že náhodně vybraná osoba z populace bude mít IQ 130 nebo vyšší? (m = 100, s =15) Normální rozdělení - příklady oJaká je pravděpodobnost, že náhodně vybraná osoba z populace bude mít IQ 130 nebo vyšší? (m = 100, s =15) oz = (130 – 100)/15 oz = 2 o Normální rozdělení - příklady oz = 2 o norm1 Normální rozdělení z levá strana pravá strana 0.00 0.5000 0.5000 0.01 0.5040 0.4960 … … … 0.30 0.6179 0.3821 0.31 0.6217 0.3783 … … … 2.00 0.9772 0.0228 … … … o Normální rozdělení - příklady oJaká je pravděpodobnost, že náhodně vybraná osoba z populace bude mít IQ 130 nebo vyšší? oz = 2 op = 0.0228 tj. 2,3% o Normální rozdělení - příklady oJaká je pravděpodobnost, že náhodně vybraná osoba z populace bude mít IQ 85 nebo nižší? Normální rozdělení - příklady oz = -1 o norm2 Normální rozdělení z levá strana pravá strana 0.00 0.5000 0.5000 0.01 0.5040 0.4960 … … … 0.30 0.6179 0.3821 0.31 0.6217 0.3783 … … … 1.00 0.8413 0.1587 … … … o Normální rozdělení - příklady oJaká je pravděpodobnost, že náhodně vybraná osoba z populace bude mít IQ 85 nebo nižší? oz = -1 op = 0.1587 tj. 15,9% o Normální rozdělení - příklady opostup při zjišťování z-skóru z tabulky: nnačrtnout si normální rozdělení nvystínovat oblast odpovídající zadané pravděpodobnosti nv tabulce vyhledat příslušný z-skór nvypočítat z něj hrubý skór n n Normální rozdělení - příklady oJakou minimální hodnotu IQ musí člověk mít, aby patřil mezi 5% osob s nejvyššími hodnotami IQ? Normální rozdělení - příklady op = 0.05 norm3 Normální rozdělení z levá strana pravá strana 0.00 0.5000 0.5000 0.01 0.5040 0.4960 … … … 0.30 0.6179 0.3821 0.31 0.6217 0.3783 … … … 1.65 0.9505 0.0495 … … … o Normální rozdělení - příklady oJakou minimální hodnotu IQ musí člověk mít, aby patřil mezi 5% osob s nejvyššími hodnotami IQ? op = 0.05 oz tabulky: z = 1.65 oX = (1.65).(15) + 100 = 124.75 Normální rozdělení - příklady opomocí tabulky normálního rozdělení je možno nalézt také hodnotu percentilu opříklad: kolik procent osob má nižší hodnoty IQ než člověk s IQ 130? Normální rozdělení - příklady oz = 2 norm6 Normální rozdělení z levá strana pravá strana 0.00 0.5000 0.5000 0.01 0.5040 0.4960 … … … 0.30 0.6179 0.3821 … … … 1.50 0.8413 0.1587 2.00 0.9772 0.0228 … … … o Normální rozdělení - příklady oz = 2 norm6 Normální rozdělení - příklady oKolik procent osob má nižší hodnoty IQ než člověk s IQ 130? oz tabulky: pro z = 2 op = 0.9772 o97.72% osob má nižší skór Rozdělení výběrových průměrů ocílem induktivní statistiky je odhadnout parametry populace z charakteristik vzorku (výběrového souboru) onapř. odhadem průměru populace bude průměr vzorku oodhad je vždy zatížen určitou výběrovou chybou Rozdělení výběrových průměrů opředpokládejme, že z jedné populace vybereme 3 různé vzorky obudou se nejspíš navzájem lišit ve tvaru rozdělení hodnot, průměru i variabilitě ojak se rozhodneme, který z nich zvolit pro odhad průměru populace ?? Rozdělení výběrových průměrů samp1 Rozdělení výběrových průměrů opokud bychom spočítali průměry ze všech možných výběrů o určité velikosti n, budou tvořit tzv. rozdělení výběrových průměrů (sampling distribution) o Rozdělení výběrových průměrů opříklad: populace hodnot 2, 4, 6, 8 oprůměr m = 5 opředpokládejme, že průměr neznáme a pokoušíme se ho odhadnout ze vzorku n=2 ov tabulce jsou uvedeny všechny možné výběrové soubory o Rozdělení výběrových průměrů výběr první skór druhý skór průměr vzorku 1 2 2 2 2 2 4 3 3 2 6 4 4 2 8 5 5 4 2 3 6 4 4 4 7 4 6 5 8 4 8 6 9 6 2 4 10 6 4 5 11 6 6 6 12 6 8 7 13 8 2 5 14 8 4 6 15 8 6 7 16 8 8 8 Rozdělení výběrových průměrů samp2 Rozdělení výběrových průměrů ojaká je pravděpodobnost, že z této populace vybereme vzorek s průměrem vyšším než 7? Rozdělení výběrových průměrů samp2 Rozdělení výběrových průměrů ojaká je pravděpodobnost, že z této populace vybereme vzorek s průměrem vyšším než 7? ov rozdělení výběrových průměrů je takový vzorek jen 1 ze 16 – tj. pravděpodobnost takového průměru vzorku je 1/16 = 0.0625 Rozdělení výběrových průměrů ovětšina populací i vzorků je mnohem větší oale existují určité základní vlastnosti rozdělení výběrových průměrů (RVP) otvar – RVP se při dostatečně velkém vzorku (30 a více) blíží normálnímu rozdělení Rozdělení výběrových průměrů oprůměr – průměr průměrů všech teoretických výběrů je roven průměru populace ooznačuje se také jako očekávaná hodnota průměru vzorku Rozdělení výběrových průměrů ovariabilita – směrodatná odchylka RVP se označuje jako výběrová chyba (standard error) průměru ojde o směrodatnou odchylku výběrových průměrů od průměru populace oukazuje, jak spolehlivý je odhad populačního průměru z průměru vzorku – tj. jak velkou chybou je odhad zatížen Rozdělení výběrových průměrů ovelikost výběrové chyby je dána dvěma charakteristikami: variabilitou v populaci a velikostí výběru ovariabilita znaku v populaci: čím je vyšší, tím je vyšší i variabilita výběrových průměrů o o Rozdělení výběrových průměrů samp3 samp4 Rozdělení výběrových průměrů ovelikost výběru – čím větší výběr (n), tím lépe jeho průměr reprezentuje průměr populace Rozdělení výběrových průměrů ovzorec pro výpočet výběrové chyby: o sx = s/√n Rozdělení výběrových průměrů ocentrální limitní věta – pro každou populaci o průměru m a směrodatné odchylce s se bude rozdělení výběrových průměrů výběrů (pro rozsah výběru jdoucí do nekonečna) blížit normálnímu rozdělení s průměrem m a směrodatnou odchylkou sx = s/√n Rozdělení výběrových průměrů opříklad: když vybereme z populace náhodně vzorek 9 osob, jaká je pravděpodobnost, že jejich průměrné IQ bude větší nebo rovno 112? Rozdělení výběrových průměrů opříklad: když vybereme z populace náhodně vzorek 9 osob, jaká je pravděpodobnost, že jejich průměrné IQ bude větší nebo rovno 112? om = 100, s= 15 ovýpočet výběrové chyby: nsx = s/√n = 15/3 = 5 Rozdělení výběrových průměrů samp10 Rozdělení výběrových průměrů opříklad: když vybereme z populace náhodně vzorek 9 osob, jaká je pravděpodobnost, že jejich průměrné IQ bude větší nebo rovno 112? om = 100, sx = 5 oz = (112-100)/ sx = 12/5 = 2.4 o Rozdělení výběrových průměrů opříklad: když vybereme z populace náhodně vzorek 9 osob, jaká je pravděpodobnost, že jejich průměrné IQ bude větší nebo rovno 112? om = 100, sx = s/√n = 15/3 = 5 oz = (112-100)/ sx = 12/5 = 2.4 oz tabulky P(Z > 2.4) = 0.0082