Odhady oodhady obodové a intervalové odhady okonstrukce intervalu spolehlivosti pro průměr oodhady podílů (kategoriální proměnné) o o o o o Rozdělení výběrových průměrů otvar – RVP se při dostatečně velkém vzorku (30 a více) blíží normálnímu rozdělení oprůměr – průměr průměrů všech teoretických výběrů je roven průměru populace ovariabilita – směrodatná odchylka RVP se označuje jako výběrová chyba (standard error) průměru o o Rozdělení výběrových průměrů ovelikost výběrové chyby je dána dvěma charakteristikami: nvariabilita znaku v populaci: čím je vyšší, tím je vyšší i variabilita výběrových průměrů nvelikost výběru – čím větší výběr (n), tím lépe jeho průměr reprezentuje průměr populace o o o Rozdělení výběrových průměrů ovzorec pro výpočet výběrové chyby: o sx = s/√n Rozdělení výběrových průměrů opříklad: když vybereme z populace náhodně vzorek 9 osob, jaká je pravděpodobnost, že jejich průměrné IQ bude větší nebo rovno 105? Rozdělení výběrových průměrů opříklad: když vybereme z populace náhodně vzorek 9 osob, jaká je pravděpodobnost, že jejich průměrné IQ bude větší nebo rovno 105? om = 100, s= 15, n=9 ovýpočet výběrové chyby: nsx = s/√n = 15/3 = 5 Rozdělení výběrových průměrů 5 Rozdělení výběrových průměrů opříklad: když vybereme z populace náhodně vzorek 9 osob, jaká je pravděpodobnost, že jejich průměrné IQ bude větší nebo rovno 105? om = 100, sx = 5 oz = (105-100)/ sx = 5/5 = 1.0 o Rozdělení výběrových průměrů opříklad: když vybereme z populace náhodně vzorek 9 osob, jaká je pravděpodobnost, že jejich průměrné IQ bude větší nebo rovno 112? om = 100, sx = s/√n = 15/3 = 5 oz = 1.0 oz tabulky P(Z > 1.0) = 0.1587 Rozdělení výběrových průměrů opříklad: když vybereme z populace náhodně vzorek 100 osob, jaká je pravděpodobnost, že jejich průměrné IQ bude větší nebo rovno 105? Rozdělení výběrových průměrů opříklad: když vybereme z populace náhodně vzorek 100 osob, jaká je pravděpodobnost, že jejich průměrné IQ bude větší nebo rovno 105? om = 100, s= 15, n=100 ovýpočet výběrové chyby: nsx = s/√n = 15/10 = 1.5 Rozdělení výběrových průměrů 15 Rozdělení výběrových průměrů opříklad: když vybereme z populace náhodně vzorek 100 osob, jaká je pravděpodobnost, že jejich průměrné IQ bude větší nebo rovno 105? om = 100, sx = 1.5 oz = (105-100)/ sx = 5/1.5 = 3.33 o Rozdělení výběrových průměrů opříklad: když vybereme z populace náhodně vzorek 100 osob, jaká je pravděpodobnost, že jejich průměrné IQ bude větší nebo rovno 112? om = 100, sx = 1.5 oz = 3.33 oz tabulky P(Z > 3.33) = 0.0005 Příklad 1 oIQ (m=100, s=15) ojaká je pravděpodobnost, že průměr výběru o velikosti n=25 bude mezi hodnotami 94 a 106? Příklad 1 oIQ (m=100, s=15) ojaká je pravděpodobnost, že průměr výběru o velikosti n=25 bude mezi hodnotami 94 a 106? om = 100, s= 15, n=25 ovýpočet výběrové chyby: nsx = s/√n = 15/5 = 3 Příklad 1 oIQ (m=100, s=15) ojaká je pravděpodobnost, že průměr výběru o velikosti n=25 bude mezi hodnotami 94 a 106? oz = (94-100) / 3 = -6/3 = -2 oz = (106-100) / 3 = 6/3 = 2 Příklad 1 onajdeme v tabulce normovaného normálního rozdělení hodnotu pravděpodobnosti pro z=2 a z=-2 Obrázek1 Příklad 1 ohodnota je 0,023 odohromady 0,046 oodečteme od 1,00 ovýsledek 0,954 Obrázek2 Příklad 1 oIQ (m=100, s=15) ojaká je pravděpodobnost, že průměr výběru o velikosti n=25 bude mezi hodnotami 94 a 106? opravděpodobnost takového průměru je 95,4% Příklad 2 oIQ (m=100, s=15) ov jakém rozsahu hodnot bude pravděpodobně 80% všech průměrů výběrů o velikosti n=25? Příklad 2 oIQ (m=100, s=15) ov jakém rozsahu hodnot bude pravděpodobně středních 80% všech průměrů výběrů o velikosti n=25? opotřebujeme zjistit hodnotu z, která odděluje pravděpodobnost 10% na obou stranách rozdělení o 80 Příklad 2 oIQ (m=100, s=15) ov jakém rozsahu hodnot bude pravděpodobně středních 80% všech průměrů výběrů o velikosti n=25? oz = 1,28 a -1,28 převedeme na hodnoty IQ pro rozdělení výběrových průměrů o Příklad 2 o _ o x = m + z*(s/√n) o _ o x = 100 + 1,28*(15/√25) = 100+1,28(3) = 103,84 o _ o x = 100 + (-1,28)*(15/√25) = 100-1,28(3) = 96,16 o Příklad 2 oIQ (m=100, s=15) ov jakém rozsahu hodnot bude pravděpodobně středních 80% všech průměrů výběrů o velikosti n=25? o80% všech výběrových průměrů bude v rozsahu hodnot 96,16 - 103,84 o Odhady ov předchozích příkladech jsme znali hodnoty průměru a rozptylu populace oobvykle tomu ale bývá přesně naopak: známe hodnoty (statistiky) výběru a neznáme hodnoty (parametry) populace oty chceme z výběru odhadnout Odhady o2 typy odhadů: bodové a intervalové obodový odhad: použijeme průměr vzorku a odhadneme, že se rovná průměru populace Bodový odhad obodový odhad je problematický v tom, že dva různé výběry nám mohou dát dva různé odhady obodový odhad neobsahuje žádnou informaci o jeho přesnosti či spolehlivosti ona čem závisí přesnost odhadu? Bodový odhad opřesnost odhadu závisí na dvou charakteristikách nvelikost výběru (čím větší n, tím menší výběrová chyba) nvariabilita hodnot v populaci (čím vyšší, tím vyšší i výběrová chyba) Intervalový odhad oposkytuje rozsah (interval) hodnot, který s určitou pravděpodobností obsahuje hledanou hodnotu parametru Intervalový odhad oje založen na: nbodovém odhadu nvelikosti výběru nvariabilitě znaku v populaci (známé nebo rovněž odhadované) Intervalový odhad optáme se: jaká je hodnota m ? Intervalový odhad optáme se: jaká je hodnota m ? ovýběrový průměr určité hodnoty může pocházet z populací o různých průměrech oproto nemůžeme jednoznačně určit hodnotu m Intervalový odhad obrázek3 Intervalový odhad otakže se místo toho snažíme určit, jaký je možný rozsah hodnot m ojaké populace (tj. s jakou hodnotou průměru) by mohly být pravděpodobným zdrojem našeho vzorku? Intervalové odhady oze které populace nejpravděpodobněji pochází výběr, jehož průměr je v následujícím grafu naznačen svislou čarou? RVP pro populace I-IV Intervalové odhady ovýběr pochází nnejpravděpodobněji z populace II nebo III nméně pravděpodobně z populace I na velmi málo pravděpodobně z populace IV Intervalové odhady ointervalový odhad spočívá v konstrukci tzv. intervalu spolehlivosti (confidence interval) – rozsahu hodnot, ve kterém s určitou pravděpodobností leží průměr populace Interval spolehlivosti onejprve je třeba si stanovit tuto pravděpodobnost – tj. úroveň přesnosti(spolehlivosti); oobvyklá je např. 95% - snažíme se najít interval hodnot, ve kterém s 95% pravděpodobností leží průměr populace opak jde o tzv. 95% interval spolehlivosti Interval spolehlivosti opoté najít hodnotu z pro tuto pravděpodobnost – tj. rozsah, ve kterém bude ležet středních 95% hodnot (výběrových průměrů) o2,5% na každé straně rozdělení Interval spolehlivosti obrázek5 Interval spolehlivosti otomu odpovídají hodnoty z=-1,96 z=1,96 o Interval spolehlivosti Interval spolehlivosti - výpočet Interval spolehlivosti obrázek4 Interval spolehlivosti ointerpretace intervalu spolehlivosti: máme 95% pravděpodobnost, že se v tomto intervalu nachází průměr populace opokud bychom z populace vybrali 100 náhodných výběrů o velikosti n a pro každý z nich sestrojili tento interval, 95 intervalů by obsahovalo průměr populace a 5 nikoliv Interval spolehlivosti ooblíbený omyl: nv 95% intervalu spolehlivosti leží 95% hodnot populace (NEPLATÍ!) n okromě 95% intervalu spolehlivosti se používá také např. 99% a 90% pravděpodobnost n n Příklad 3 onáhodný výběr 36 dětí, průměrné IQ vzorku = 96 ona základě tohoto zjištění odhadněte průměrné IQ populace, ze které děti pocházejí (sestavte 95% interval spolehlivosti) o Příklad 3 oPostup: nbodový odhad: m=96 nvýpočet výběrové chyby (směrodatné odchylky RVP): s/√n = 15/√36 = 15/6 = 2,5 nstanovení úrovně spolehlivosti: 95% nnajít hodnotu z pro 95% pravděpodobnost n Příklad 3 obrázek5 Příklad 3 ov tabulce normálního rozdělení najdeme hodnoty z ohodnoty z pro 95% : 1,96 a -1,96 o o Příklad 3 ok výběrovému průměru přičteme (pro horní hranici intervalu) a odečteme (pro spodní hranici) výběrovou chybu, vynásobenou hodnotou z o Příklad 3 opro 95% : o m = 96 + 1,96*2,5 = 100,90 o m = 96 - 1,96*2,5 = 91,10 o o95% interval spolehlivosti je 91,1 – 100,9 bodů IQ Příklad 3 opro 99% interval spolehlivosti oz = 2,57 o Příklad 3 opro 99% : o m = 96 + 2,57*2,5 = 102,43 o m = 96 - 2,57*2,5 = 89,58 o99% interval spolehlivosti je 89,6 – 102,4 bodů IQ Interval spolehlivosti ohodnoty z pro nejčastěji užívané pravděpodobnosti: n90% (zbývá 5% + 5%) z= +/- 1,645 n95% (zbývá 2,5% + 2,5%) z= +/- 1,96 n99% (zbývá 0,5% + 0,5%) z= +/- 2,57 Interval spolehlivosti ov předchozích příkladech jsme předpokládali, že známe hodnotu variability znaku v populaci ove skutečnosti je tomu tak však zřídka oje proto nutno odhadnout zároveň s průměrem i hodnotu směrodatné odchylky Interval spolehlivosti o pro známé hodnoty směrodatné odchylky v populaci: Studentovo rozdělení opokud za s nahradíme s (směr. odchylku výběrového průměru), pak musíme při konstrukci intervalu spolehlivosti místo z rozdělení použít tzv. Studentovo t rozdělení Interval spolehlivosti o pro neznámé hodnoty směrodatné odchylky v populaci: Studentovo rozdělení omá také zvonovitý tvar, ale je více ploché než normální rozdělení oje symetrické kolem průměru (0) opro každou velikost výběru (počet stupňů volnosti, df) existuje odlišné t rozdělení df = n-1 Studentovo rozdělení osrovnání s normálním rozdělením Studentovo rozdělení osrovnání s normálním rozdělením: nt rozdělení má vyšší variabilitu nvíce plochy na okrajích, méně ve středu nvzhledem k vyšší variabilitě budou intervaly spolehlivosti širší než u normálního rozdělení njsou uváděny df obvykle jen do 100, protože pro n=100 se t rozdělení blíží normálnímu rozdělení Studentovo rozdělení otabulka t-rozdělení: nkaždý řádek udává hodnoty t pro celé rozdělení pro daný počet stupňů volnosti (tj. n-1) nsloupce pro nejdůležitější percentily n Studentovo rozdělení o Odhady podílů ou kategoriálních proměnných nemůžeme počítat průměry oodhadujeme proto podíly jednotlivých kategorií proměnné Odhady podílů onapř. podíl kuřáků v populaci českých adolescentů opodíl pacientů s rakovinou plic, kteří přežijí 5 let od diagnózy opodíl chlapců mezi dětmi s poruchou pozornosti Odhady podílů opokud zkoumáme místo celé populace pouze výběr z ní, nezajímá nás tolik, jaký je podíl kategorií proměnné ve výběru (četnost p) oale spíše jaký je skutečný podíl v populaci – četnost p Odhady podílů opři dostatečně velkém n platí i pro rozdělení podílů centrální limitní věta orozdělení výběrových podílů je normální rozdělení, s průměrnou četností p a směrodatnou odchylkou (výběrovou chybou) Příklad 4 ochceme zjistit, jaká je podpora odsunu hlavního nádraží v Brně onáhodný výběr z populace brněnských občanů starších 18 let n=1000 osob o585 osob se vyjádřilo pro op=0,585 oodhadněte s 95% spolehlivostí podporu odsunu nádraží Odhady podílů ointerval spolehlivosti pro podíly se spočítá podobně jako pro průměry: Odhady podílů onemůžeme však spočítat výběrovou chybu, protože neznáme p ov tomto případě je však možné dosadit místo toho p a přitom použít normální rozdělení (pokud je n>30) opokud je n<30, pak dosadíme místo p hodnotu 0,5 Příklad 4 op=0,585 oz=1,96 oSE(p)= [0,585(1-0,585)/1000] o=0,156 ointerval spolehlivosti 0.585 ± 1.96(0.0156) o 0.585 ± 0,0305 o--- přesnost odhadu je ± 3% o o o Příklad 4 os 95% pravděpodobností je podíl osob souhlasících se odsunem nádraží mezi 55.4% a 61.6% otj. máme 95% pravděpodobnost, že kdyby se v době průzkumu hlasovalo, bude většina pro Odhady podílů ovztah mezi velikostí vzorku a přesností odhadu nn=100 ± 10% nn=200 ± 7% nn=400 ± 5% nn=1000 ± 3% nn=2400 ± 2% nn=9600 ± 1% Odhady podílů opožadovaná velikost vzorku roste mnohem rychleji než spolehlivost odhadu (pro zdojnásobení spolehlivosti je nutné asi čtyřnásobně zvětšit vzorek) odůležité při plánování výzkumu – jakou přesnost potřebujeme? jaké budou náklady? opodobný vztah platí pro odhad průměrů Kontrolní otázky o2 typy odhadů ona čem závisí šířka intervalu spolehlivosti? (není nutno znát zpaměti vzorce, ale je třeba chápat princip výpočtu) ovztah velikosti výběru a spolehlivosti odhadu