Testování hypotéz 1.vymezení základních pojmů 2.testování hypotéz o rozdílu průměrů 3.jednovýběrový t-test 1. 1. Testování hypotéz oproces, kterým rozhodujeme, zda přijmeme nebo zamítneme nulovou hypotézu Obecný postup testování hypotéz o1. Určení statistické hypotézy o2. Určení hladiny chyby a o3. Výpočet testovací statistiky o4. Rozhodnutí Nulová hypotéza ohypotéza, kterou se snažíme vyvrátit (falzifikovat) oKarl Popper (1968) tvrdil, že platnost hypotézy nemůže být nikdy prokázána pouhou generalizací příkladů, které ji potvrzují njak říká filozof Bertrand Russel, krocan-vědec by mohl zobecnit tvrzení "každý den mě krmí", protože tato hypotéza je potvrzována den po dni celý jeho život. Tato generalizace ovšem neposkytuje žádnou jistotu, že krocan bude nakrmen i další den - některý den se pravděpodobně on sám stane pokrmem Nulová hypotéza oPopper došel k závěru, že jedinou možnou metodou je falsifikace hypotézy - nalezení jednoho příkladu, který stačí k jejímu vyvrácení ovědci se proto snaží své hypotézy vyvrátit a tak potvrdit hypotézy opačné - alternativní o Nulová hypotéza onulová hypotéza je opakem naší výzkumné hypotézy oobvykle zní: mezi dvěma průměry není rozdíl, korelace je nulová apod. onapř. průměrná výška mužů a žen se neliší ooznačuje se H0 Alternativní hypotéza oH1 oalternativní vzhledem k nulové, tj. naše výzkumná hypotéza onapř. nprůměrná výška mužů a žen se liší (tzv. oboustranná hypotéza) nnebo nprůměrná výška mužů je větší než průměrná výška žen (tzv. jednostranná hypotéza) Příklad testování hypotéz o rozdílu průměrů ochceme zjistit, jaký vliv má v raném věku dítěte(<6 měsíců) hospitalizace bez matky na IQ dítěte v 7 letech ovyšetříme vzorek 36 dětí náhodně vybraných z této populace ozjistíme průměrné IQ 96 se směrodatnou odchylkou 15 bodů Příklad testování hypotéz o rozdílu průměrů oMůžeme na základě těchto výsledků tvrdit, že průměrné IQ dětí hospitalizovaných v raném věku bez matky se liší od průměrného IQ populace všech dětí (=100)? o Příklad testování hypotéz o rozdílu průměrů oNulová hypotéza (H0 ): průměrné IQ dětí hospitalizovaných v raném věku bez matky je stejné jako průměrné IQ populace všech dětí o ojinými slovy: není nepravděpodobné, že vzorek 36 dětí má čistě náhodou průměr 96, pokud je průměr populace 100 a směrodatná odchylka 15 Příklad testování hypotéz o rozdílu průměrů oAlternativní hypotéza (H1): průměrné IQ dětí hospitalizovaných v raném věku bez matky je nižší než průměrné IQ populace všech dětí o opůjde o jednostranné testování hypotéz o Hladina významnosti ohladina významnosti je úroveň pravděpodobnosti, kterou používáme při rozhodování, zda zamítnout nebo přijmout nulovou hypotézu ooznačuje se alfa (a) oobvyklá hladina významnosti je 5% nebo 1% - volíme podle vlastního uvážení o o Chyba I. druhu ozvolíme-li hladinu významnosti 5%, pak se rozhodneme zamítnout nulovou hypotézu tehdy, když existuje pouze 5% pravděpodobnost našich dat v případě, že H0 platí ojde vlastně o 5% riziko, že nulová hypotéza platí a my ji přitom zamítneme –uděláme tzv. chybu I. druhu o Chyba II. druhu oopak chyby I. druhu – riziko, že nezamítneme nulovou hypotézu, která ve skutečnosti neplatí ooznačuje se beta (b) o o Chyby typu I a II nulová hypotéza platí nulová hypotéza neplatí zamítneme nulovou hypotézu chyba I. druhu správné rozhodnutí nezamítneme nulovou hypotézu správné rozhodnutí chyba II. druhu Příklad testování hypotéz o rozdílu průměrů oHladina významnosti: v našem příkladu použijeme a =5% = 0,05 opokud je pravděpodobnost získání vzorku o průměru 96 z populace o průměru 100 menší než 5%, pak zamítneme H0 opokud je pravděpodobnost získání vzorku o průměru 96 větší než 5%, pak H0 nezamítneme o Výpočet testovací statistiky ozávisí na povaze dat a hypotéze opro testy hypotéz o rozdílu průměrů se používá standardizovaná vzdálenost odhadu od nulové hypotézy otestovací statistika = o (bodový odhad – hypotetická hodnota) / směrodatná chyba odhadu Příklad testování hypotéz o rozdílu průměrů oz = (x – m0 ) / sx oz = (x – m0 ) / (s /√n) o oz = (96-100) / (15/√36) oz = -4 / 2,5 oz = - 1,6 Příklad testování hypotéz o rozdílu průměrů oRozdělení výběrových průměrů zdist_p07_1 Rozhodnutí o závěru testování hypotéz o2 možnosti o1) převedeme testovací statistiku na tzv. hodnotu významnosti p onebo o2) srovnáme testovací statistiku s tzv. kritickou mezí Hodnota významnosti p opravděpodobnost realizace testovací statistiky za předpokladu, že platí nulová hypotéza („jestliže platí H0, jaká je pravděpodobnost, že získáme tuto vypočítanou hodnotu?“) opokud je p menší než hladina významnosti a nebo stejná, pak můžeme nulovou hypotézu zamítnout Příklad testování hypotéz o rozdílu průměrů ojaká je hodnota významnosti p pro z = -1,6? ov tabulce z-rozdělení najdeme pravděpodobnost pro z ≤ -1,6 Příklad testování hypotéz o rozdílu průměrů oRozdělení výběrových průměrů zdist_p07_2 Příklad testování hypotéz o rozdílu průměrů op = 0,0548 op > a onemáme dostatečné důkazy pro to, abychom zamítli nulovou hypotézu o Srovnání s kritickou mezí okritická mez se stanoví na základě hladiny významnosti (a) ntzv. kritická oblast nebo oblast zamítnutí ojestliže je testovací statistika v této kritické oblasti, pak můžeme zamítnout nulovou hypotézu Příklad testování hypotéz o rozdílu průměrů onajdeme v tabulce z-rozdělení hodnotu z, která odděluje nejnižších 5% případů oz = -1,64 o= kritická mez pro jednostranný test hypotézy při a = 0,05 Příklad testování hypotéz o rozdílu průměrů oRozdělení výběrových průměrů zdist_p07_3 Příklad testování hypotéz o rozdílu průměrů ovypočítaná hodnota z = -1,6 nespadá do kritické oblasti onemůžeme tedy zamítnout nulovou hypotézu Kritická mez pro oboustranný test oz = -1,96 a z = +1,96 Rozhodnutí o závěru testování hypotéz onemůžeme-li nulovou hypotézu zamítnout, neznamená to nutně, že platí – pouze nemáme dostatek důkazů pro její zamítnutí ohodnota významnosti p není pravděpodobnost, že nulová hypotéza platí Testování hypotéz o rozdílu průměrů o4 možné typy problémů: nporovnáváme průměr vzorku s průměrem populace à jednovýběrový t-test nporovnáváme průměry dvou vzorků à t-test pro nezávislé výběry nporovnáváme dva průměry jednoho vzorku à t-test pro závislé výběry (tzv. párový t-test) nporovnáváme více průměrů à analýza rozptylu n Jednovýběrový t-test - příklad oRozhodujeme se mezi jazykovými školami v Brně. Podaří se nám zjistit, že při zkouškách na Britské radě získávají absolventi různých jazykových škol průměrně 85 bodů, ale neznáme směrodatnou odchylku průměru. oJedna ze škol – ABC - se chlubí, že její absolventi dosahují nadprůměrných výsledků. Jednovýběrový t-test - příklad oZjistíme, že posledních zkoušek se účastnilo 10 absolventů školy ABC s těmito výsledky: o 80 91 92 87 89 88 86 80 90 89 oMůžeme na základě výsledků tohoto vzorku 10 absolventů dojít k závěru, že škola ABC má lepší průměrné výsledky než ostatní školy v Brně? o Jednovýběrový t-test oprůměr vzorku je 87.2 osměrodatná odchylka 4.18 oznáme průměr populace (m=85), ale nikoli směrodatnou odchylku populace (místo ní použijeme jako odhad směrodatnou odchylku vzorku) o o Jednovýběrový t-test - příklad oNulová hypotéza: průměrné výsledky absolventů školy ABC se neliší od výsledků absolventů ostatních škol ojinými slovy: není nepravděpodobné, že vzorek má čistě náhodou průměr 87.2, pokud je průměr populace 85 a směrodatná odchylka 4.18 Jednovýběrový t-test oAlternativní hypotéza: průměrné výsledky absolventů školy ABC jsou lepší než výsledky absolventů ostatních škol o Jednovýběrový t-test oHladina významnosti: použijeme a =5% opokud je pravděpodobnost získání vzorku o průměru 87.2 menší než 5%, pak zamítneme H0 opokud je pravděpodobnost získání vzorku o průměru 87.2 větší než 5%, pak H0 nezamítneme o Jednovýběrový t-test opotřebujeme spočítat, jaká je pravděpodobnost získání vzorku (n=10) o průměru 87.2 z populace o průměru 85 a směrodatné odchylce 4.18 ovzhledem k tomu, že velikost směrodatné odchylky jsme odhadli ze vzorku, nemůžeme pro rozdělení výběrových průměrů použít z-rozdělení, ale Studentovo rozdělení t Studentovo rozdělení opokud za s nahradíme s (směr. odchylku výběrového průměru), pak musíme při konstrukci rozdělení výběrových průměrů místo z rozdělení použít tzv. Studentovo t rozdělení Rozdělení výběrových průměrů o pro neznámé hodnoty směrodatné odchylky v populaci: Studentovo rozdělení omá také zvonovitý tvar, ale je více ploché než normální rozdělení oje symetrické kolem průměru (0) opro každou velikost výběru (počet stupňů volnosti, df) existuje odlišné t rozdělení df = n-1 Studentovo rozdělení osrovnání s normálním rozdělením Studentovo rozdělení osrovnání s normálním rozdělením: nt rozdělení má vyšší variabilitu nvíce plochy na okrajích, méně ve středu nvzhledem k vyšší variabilitě budou intervaly spolehlivosti širší než u normálního rozdělení njsou uváděny df obvykle jen do 100, protože pro n=100 se t rozdělení blíží normálnímu rozdělení Studentovo rozdělení otabulka t-rozdělení: nkaždý řádek udává hodnoty t pro celé rozdělení pro daný počet stupňů volnosti (tj. n-1) nsloupce pro nejdůležitější percentily n Studentovo rozdělení o Studentovo rozdělení o Jednovýběrový t-test opotřebujeme spočítat, jaká je pravděpodobnost získání vzorku (n=10) o průměru 87.2 z populace o průměru 85 a směrodatné odchylce 4.18 ovzhledem k tomu, že velikost směrodatné odchylky jsme odhadli ze vzorku, nemůžeme použít z-rozdělení, ale Studentovo rozdělení t Jednovýběrový t-test Jednovýběrový t-test ot = (87.2-85) / (4.18/ 10) t = 2.2/1.32 t = 1.66 odf = n-1 = 10 – 1 = 9 (počet stupňů volnosti pro vyhledání pravděpodobnosti v tabulce t-rozdělení) o Jednovýběrový t-test okritická hodnota t pro a=5% je 1,833 ozískaná hodnota t je 1,66 Tabulka t-rozdělení df α = 0.1 0.05 0.025 0.01 0.005 0.001 0.0005 1 3.078 6.314 12.706 31.821 63.656 318.289 636.578 2 1.886 2.920 4.303 6.965 9.925 22.328 31.600 3 1.638 2.353 3.182 4.541 5.841 10.214 12.924 4 1.533 2.132 2.776 3.747 4.604 7.173 8.610 5 1.476 2.015 2.571 3.365 4.032 5.894 6.869 6 1.440 1.943 2.447 3.143 3.707 5.208 5.959 7 1.415 1.895 2.365 2.998 3.499 4.785 5.408 8 1.397 1.860 2.306 2.896 3.355 4.501 5.041 9 1.383 1.833 2.262 2.821 3.250 4.297 4.781 10 1.372 1.812 2.228 2.764 3.169 4.144 4.587 11 1.363 1.796 2.201 2.718 3.106 4.025 4.437 Jednovýběrový t-test ov našem příkladě je 1,66<1,883 otj. nemůžeme zamítnout nulovou hypotézu (rozdíl průměrů není tzv. statisticky významný) oa náš závěr: nemůžeme tvrdit, že výsledky absolventů školy ABC se liší od průměru brněnských škol (je vyšší než 5% pravděpodobnost, že průměrný výsledek 87,2 deseti jejích absolventů je lepší jen náhodou) Jednovýběrový t-test v SPSS Kontrolní otázky ovysvětlete pojmy nnulová a alternativní hypotéza ntestování hypotéz nchyba I. druhu a chyba II. druhu ojaké testy se používají pro testování hypotéz o rozdílu průměrů? o