Testování hypotéz • vymezení základních pojmů • testování hypotéz o rozdílu průměrů • jednovýběrový t-test Testování hypotéz o proces, kterým rozhodujeme, zda přijmeme nebo zamítneme nulovou hypotézu Obecný postup testování hypotéz o 1. Určení statistické hypotézy o 2. Určení hladiny chyby a o 3. Výpočet testovací statistiky o 4. Rozhodnutí Nulová hypotéza o hypotéza, kterou se snažíme vyvrátit (falzifikovat) o Karl Popper (1968) tvrdil, že platnost hypotézy nemůže být nikdy prokázána pouhou generalizací příkladů, které ji potvrzují n jak říká filozof Bertrand Russel, krocan-vědec by mohl zobecnit tvrzení "každý den mě krmí", protože tato hypotéza je potvrzována den po dni celý jeho život. Tato generalizace ovšem neposkytuje žádnou jistotu, že krocan bude nakrmen i další den - některý den se pravděpodobně on sám stane pokrmem Nulová hypotéza o Popper došel k závěru, že jedinou možnou metodou je falsifikace hypotézy - nalezení jednoho příkladu, který stačí k jejímu vyvrácení o vědci se proto snaží své hypotézy vyvrátit a tak potvrdit hypotézy opačné - alternativní Nulová hypotéza o nulová hypotéza je opakem naší výzkumné hypotézy o obvykle zní: mezi dvěma průměry není rozdíl, korelace je nulová apod. o např. průměrná výška mužů a žen se neliší [o ]označuje se H[0] Alternativní hypotéza o H[1] o alternativní vzhledem k nulové, tj. naše výzkumná hypotéza o např. n průměrná výška mužů a žen se liší (tzv. oboustranná hypotéza) nebo n průměrná výška mužů je větší než průměrná výška žen (tzv. jednostranná hypotéza) Příklad testování hypotéz o rozdílu průměrů o chceme zjistit, jaký vliv má v raném věku dítěte(<6 měsíců) hospitalizace bez matky na IQ dítěte v 7 letech o vyšetříme vzorek 36 dětí náhodně vybraných z této populace o zjistíme průměrné IQ 96 se směrodatnou odchylkou 15 bodů Příklad testování hypotéz o rozdílu průměrů o Můžeme na základě těchto výsledků tvrdit, že průměrné IQ dětí hospitalizovaných v raném věku bez matky se liší od průměrného IQ populace všech dětí (=100)? Příklad testování hypotéz o rozdílu průměrů o Nulová hypotéza (H[0] ): průměrné IQ dětí hospitalizovaných v raném věku bez matky je stejné jako průměrné IQ populace všech dětí o jinými slovy: není nepravděpodobné, že vzorek 36 dětí má čistě náhodou průměr 96, pokud je průměr populace 100 a směrodatná odchylka 15 Příklad testování hypotéz o rozdílu průměrů o Alternativní hypotéza (H[1]): průměrné IQ dětí hospitalizovaných v raném věku bez matky je nižší než průměrné IQ populace všech dětí o půjde o jednostranné testování hypotéz Hladina významnosti o hladina významnosti je úroveň pravděpodobnosti, kterou používáme při rozhodování, zda zamítnout nebo přijmout nulovou hypotézu o označuje se alfa (a) o obvyklá hladina významnosti je 5% nebo 1% - volíme podle vlastního uvážení Chyba I. druhu o zvolíme-li hladinu významnosti 5%, pak se rozhodneme zamítnout nulovou hypotézu tehdy, když existuje pouze 5% pravděpodobnost našich dat v případě, že H[0 ]platí o jde vlastně o 5% riziko, že nulová hypotéza platí a my ji přitom zamítneme –uděláme tzv. chybu I. druhu Chyba II. druhu o opak chyby I. druhu – riziko, že nezamítneme nulovou hypotézu, která ve skutečnosti neplatí o označuje se beta (b) Chyby typu I a II Příklad testování hypotéz o rozdílu průměrů o Hladina významnosti: v našem příkladu použijeme a =5% = 0,05 [o ]pokud je pravděpodobnost získání vzorku o průměru 96 z populace o průměru 100 menší než 5%, pak zamítneme H[0] o pokud je pravděpodobnost získání vzorku o průměru 96 větší než 5%, pak H[0 ]nezamítneme Výpočet testovací statistiky o závisí na povaze dat a hypotéze o pro testy hypotéz o rozdílu průměrů se používá standardizovaná vzdálenost odhadu od nulové hypotézy o testovací statistika = (bodový odhad – hypotetická hodnota) / směrodatná chyba odhadu Příklad testování hypotéz o rozdílu průměrů o z = (x – m[0 ]) / s[x] o z = (x – m[0 ]) / (s /√n) o z = (96-100) / (15/√36) o z = -4 / 2,5 o z = - 1,6 Příklad testování hypotéz o rozdílu průměrů o Rozdělení výběrových průměrů Rozhodnutí o závěru testování hypotéz 2 možnosti o 1) převedeme testovací statistiku na tzv. hodnotu významnosti p nebo o 2) srovnáme testovací statistiku s tzv. kritickou mezí Hodnota významnosti p o pravděpodobnost realizace testovací statistiky za předpokladu, že platí nulová hypotéza („jestliže platí H[0], jaká je pravděpodobnost, že získáme tuto vypočítanou hodnotu?“) o pokud je p menší než hladina významnosti a nebo stejná, pak můžeme nulovou hypotézu zamítnout Příklad testování hypotéz o rozdílu průměrů o jaká je hodnota významnosti p pro z = -1,6? o v tabulce z-rozdělení najdeme pravděpodobnost pro z ≤ -1,6 Příklad testování hypotéz o rozdílu průměrů o Rozdělení výběrových průměrů Příklad testování hypotéz o rozdílu průměrů o p = 0,0548 o p > a o nemáme dostatečné důkazy pro to, abychom zamítli nulovou hypotézu Srovnání s kritickou mezí o kritická mez se stanoví na základě hladiny významnosti (a) n tzv. kritická oblast nebo oblast zamítnutí o jestliže je testovací statistika v této kritické oblasti, pak můžeme zamítnout nulovou hypotézu Příklad testování hypotéz o rozdílu průměrů o najdeme v tabulce z-rozdělení hodnotu z, která odděluje nejnižších 5% případů o z = -1,64 o = kritická mez pro jednostranný test hypotézy při a = 0,05 Příklad testování hypotéz o rozdílu průměrů o Rozdělení výběrových průměrů Příklad testování hypotéz o rozdílu průměrů o vypočítaná hodnota z = -1,6 nespadá do kritické oblasti o nemůžeme tedy zamítnout nulovou hypotézu Kritická mez pro oboustranný test o z = -1,96 a z = +1,96 Rozhodnutí o závěru testování hypotéz o nemůžeme-li nulovou hypotézu zamítnout, neznamená to nutně, že platí – pouze nemáme dostatek důkazů pro její zamítnutí o hodnota významnosti p není pravděpodobnost, že nulová hypotéza platí Testování hypotéz o rozdílu průměrů o 4 možné typy problémů: n porovnáváme průměr vzorku s průměrem populace à jednovýběrový t-test n porovnáváme průměry dvou vzorků à t-test pro nezávislé výběry n porovnáváme dva průměry jednoho vzorku  t-test pro závislé výběry (tzv. párový t-test) n porovnáváme více průměrů  analýza rozptylu Jednovýběrový t-test - příklad o Rozhodujeme se mezi jazykovými školami v Brně. Podaří se nám zjistit, že při zkouškách na Britské radě získávají absolventi různých jazykových škol průměrně 85 bodů, ale neznáme směrodatnou odchylku průměru. o Jedna ze škol – ABC - se chlubí, že její absolventi dosahují nadprůměrných výsledků. Jednovýběrový t-test - příklad o Zjistíme, že posledních zkoušek se účastnilo 10 absolventů školy ABC s těmito výsledky: 80 91 92 87 89 88 86 80 90 89 o Můžeme na základě výsledků tohoto vzorku 10 absolventů dojít k závěru, že škola ABC má lepší průměrné výsledky než ostatní školy v Brně? Jednovýběrový t-test o průměr vzorku je 87.2 o směrodatná odchylka 4.18 o známe průměr populace (m=85), ale nikoli směrodatnou odchylku populace (místo ní použijeme jako odhad směrodatnou odchylku vzorku) Jednovýběrový t-test - příklad o Nulová hypotéza: průměrné výsledky absolventů školy ABC se neliší od výsledků absolventů ostatních škol o jinými slovy: není nepravděpodobné, že vzorek má čistě náhodou průměr 87.2, pokud je průměr populace 85 a směrodatná odchylka 4.18 Jednovýběrový t-test o Alternativní hypotéza: průměrné výsledky absolventů školy ABC jsou lepší než výsledky absolventů ostatních škol Jednovýběrový t-test o Hladina významnosti: použijeme a =5% [o ]pokud je pravděpodobnost získání vzorku o průměru 87.2 menší než 5%, pak zamítneme H[0] [o ]pokud je pravděpodobnost získání vzorku o průměru 87.2 větší než 5%, pak H[0 ]nezamítneme [] Jednovýběrový t-test o potřebujeme spočítat, jaká je pravděpodobnost získání vzorku (n=10) o průměru 87.2 z populace o průměru 85 a směrodatné odchylce 4.18 o vzhledem k tomu, že velikost směrodatné odchylky jsme odhadli ze vzorku, nemůžeme pro rozdělení výběrových průměrů použít z-rozdělení, ale Studentovo rozdělení t Studentovo rozdělení o pokud za s nahradíme s (směr. odchylku výběrového průměru), pak musíme při konstrukci rozdělení výběrových průměrů místo z rozdělení použít tzv. Studentovo t rozdělení Rozdělení výběrových průměrů pro neznámé hodnoty směrodatné odchylky v populaci: Studentovo rozdělení o má také zvonovitý tvar, ale je více ploché než normální rozdělení o je symetrické kolem průměru (0) o pro každou velikost výběru (počet stupňů volnosti, df) existuje odlišné t rozdělení df = n-1 Studentovo rozdělení srovnání s normálním rozdělením Studentovo rozdělení o srovnání s normálním rozdělením: n t rozdělení má vyšší variabilitu n více plochy na okrajích, méně ve středu n vzhledem k vyšší variabilitě budou intervaly spolehlivosti širší než u normálního rozdělení n jsou uváděny df obvykle jen do 100, protože pro n=100 se t rozdělení blíží normálnímu rozdělení Studentovo rozdělení o tabulka t-rozdělení: n každý řádek udává hodnoty t pro celé rozdělení pro daný počet stupňů volnosti (tj. n-1) n sloupce pro nejdůležitější percentily Studentovo rozdělení Studentovo rozdělení Jednovýběrový t-test o potřebujeme spočítat, jaká je pravděpodobnost získání vzorku (n=10) o průměru 87.2 z populace o průměru 85 a směrodatné odchylce 4.18 o vzhledem k tomu, že velikost směrodatné odchylky jsme odhadli ze vzorku, nemůžeme použít z-rozdělení, ale Studentovo rozdělení t Jednovýběrový t-test Jednovýběrový t-test o t = (87.2-85) / (4.18/ 10) t = 2.2/1.32 t = 1.66 o df = n-1 = 10 – 1 = 9 (počet stupňů volnosti pro vyhledání pravděpodobnosti v tabulce t-rozdělení) Jednovýběrový t-test o kritická hodnota t pro a=5% je 1,833 o získaná hodnota t je 1,66 Tabulka t-rozdělení Jednovýběrový t-test o v našem příkladě je 1,66<1,883 o tj. nemůžeme zamítnout nulovou hypotézu (rozdíl průměrů není tzv. statisticky významný) o a náš závěr: nemůžeme tvrdit, že výsledky absolventů školy ABC se liší od průměru brněnských škol (je vyšší než 5% pravděpodobnost, že průměrný výsledek 87,2 deseti jejích absolventů je lepší jen náhodou) Jednovýběrový t-test ve Statistice Kontrolní otázky o vysvětlete pojmy n nulová a alternativní hypotéza n testování hypotéz n chyba I. druhu a chyba II. druhu o jaké testy se používají pro testování hypotéz o rozdílu průměrů?