ANABNR2 1 8_Testování hypotéz ANABNR2 Výrok: „Všechny vrány jsou černé“ Je možné dokázat tento výrok? Nikoli - nelze pozorovat všechny vrány Řešení = Falzifikace výroku: pokud najdeme nečernou vránu, ukážeme že ne všechny vrány jsou černé Jediné pozorování může vést k závěru že výrok je nepravdivý: metoda modus tollens H0: všechny vrány jsou černé H1: ne všechny vrány jsou černé Snažíme se falzifikovat H0 Testování hypotéz: filozofický úvod ANABNR2 Aplikace na příklad s IQ n n nPř. Výsledky IQ testu jsou aproximovány (blíží se) normálním rozložením o průměru μ = 100 a σ=16. Třída 36 dětí dosáhne průměru 105 bodů. Učitel si myslí že děti patří do populace μ > 100 n nH 0: μ = 100 n H 1: μ > 100 n nSnažíme se falzifikovat H0, statisticky řečeno zamítnout H0 n nKdy zamítáme? Když máme dostatečnou evidenci n nZamítnutí H0 založíme na náhodě/riziku/šanci nŠanci, že najdeme výběrový průměr 105 nebo vyšší pokud je vzorek vybrán z populace s μ = 100. nPokud je šance malá (menší než α) zamítáme H0. n ANABNR2 Účel testování hypotéz nPomocí pravděpodobnosti zjistit zda data ve vzorku podporují určitý předpoklad/stanovisko (=hypotézu) o populaci nStatistická hypotéza = výrok o populaci (např. že parametr (průměr nebo proporce) nabývá určité konkrétní hodnoty) n n ANABNR2 Nulová a alternativní hypotéza nNulová hypotéza (H0) n= tvrzení že parametr nabývá určité konkrétní hodnoty (např. parametry jsou si rovny, efekt proměnné je roven 0, mezi proměnnými v populaci není vztah) nHodnota nulové hypotézy obvykle představuje absenci efektu nAlternativní hypotéza (H1) n= tvrzení, že parametr nabývá jiné hodnoty (obvykle nějakého intervalu hodnot) než v H0 npředstavuje efekt určitého druhu n ANABNR2 Testovaná statistika (z nebo t-skór) n= určuje jak daleko leží bodový odhad od populačního parametru za předpokladu že platí H0 nVzdálenost měřena pomocí směrodatných chyb např. t=1,87 znamená že bodový odhad leží 1,87 SE od průměru nVýpočet statistiky závisí na typu výzkumného problému (např. predikce hodnoty populační proporce nebo průměru) nH0: μ = 100, pak n nH0: p = 0,26, pak t = \frac{\overline{x} - \mu_0}{s/\sqrt{n}} ANABNR2 P - hodnota n= podmíněná pravděpodobnost (pokud platí H0) že testovaná statistika (z nebo t) je rovna pozorované hodnotě nebo hodnotě extrémnější nČím je p-hodnota nižší, tím větší „důkaz“ proti H0 máme ANABNR2 Hladina významnosti (alfa-α) n= určitá námi zvolená hodnota (pravděpodobnost / riziko) nPokud je p-hodnota testované statistiky nižší nebo rovna této hodnotě, pak zamítáme H0 a říkáme , že výsledek je statisticky významný na hladině α nPokud je p-hodnota testované statistiky vyšší než tato hodnota, pak nezamítáme H0 nHladina významnosti se obvykle stanovuje na 0.05 nebo přísněji na 0.01 n ANABNR2 Testování hypotéz: postup 1. 1. 1. n1. Učiníme předpoklad o hodnotě parametru, např. populačního průměru a tímto stanoví nulovou hypotézu H0 n2. Za předpokladu že H0 je pravdivá, zkonstruujeme distribuci všech možných (potenciálních) hodnot statistiky vzorku, zde průměru vzorku, když vybírá jednoduchý náhodný vzorek o velikosti N z populace o průměru předpokládaném H0. Takto vzniká výběrová distribuce statistiky, zde výběrová distribuce průměru.Tvar této distribuce může být odvozen nezávisle na tvaru populační distribuce (centrální limitní věta) jako normální s průměrem rovným populačnímu průměru, přičemž tvar se blíži normálnímu s rostoucí velikostí vzorku n3. S výběrovou distribucí průměru stanovujeme podmíněnou pravděpodobnost (p-hodnotu), s jakou se daná nebo extrémnější hodnota výběrového průměru vyskytne za předpokladu že H0. je pravdivá n4. Pokud je p-hodnota nižší než α (alfa), tj. námi předem stanovená kritická hodnota (též riziko chyby 1.druhu), říkáme: „Pokud je H0 pravdivá, tak podmíněná pravděpodobnost že najdu danou hodnotu výběrového průměru nebo extrémnější je nižší než α. Tato pravděpodobnost je tak nízká (tj. je velmi neobvyklé, že bych dostal takovýto výsledek, pokud by H0 platila), že již nedůvěřujeme H0 a zamítáme ji. n5. Pokud je p-hodnota větší než α, pak říkáme: „Pokud je H0 pravdivá, tak podmíněná pravděpodobnost že najdu danou hodnotu výběrového průměru nebo extrémnější je vyšší než α. Proto nemáme potřebnou jistotu (dostatečnou evidenci) a H0 nezamítáme. n n n n n ANABNR2 Formulace H1 a regiony zamítnutí nAlternativní hypotézy H1 mohou být formulovány jednosměrně nebo obousměrně nPř. Obousměrně : H0=100, H1≠100 n (průměry H1 mohou být menší nebo větší než 100, proto obousměrně) nPř. Jednosměrně: H0=100,H1>100 n (zajímají nás průměry H1 pouze větší než 100, proto jednosměrně) n nJednosměrně – jednostranný test α=0.05 nObousměrně – oboustranný test α=0.05 = (0.025 spodní interval + 0.025 horní interval) n n Tabulka z-hodnot pod 1-straným a 2-straným testem (viz tabulka z-skoru) n Test \ α 0.05 0.01 0.001 1-straný 1.645 F(z) = .95 2.33 F(z) = .99 3.09 F(z) = .999 2-straný 1.96 F(z) = .975 2.58 F(z) = .995 3.29 F(z) = .9995 ANABNR2 1-stranný test pvalue3 •Jednosměrně – jednostranný test α=0.05 ANABNR2 2-stranný test pvalue1 oboustranný test pro α=0.05 = α / 2 = (0.025 spodní interval + 0.025 horní interval) ANABNR2 Chyby 1. a 2. druhu n nIkdyž podmíněná pravděpodobnost vytáhnutí daného nebo extrémnějšího průměru vzorku bude menší než alfa a člověk důsledkem toho zamítne H0, stále existuje pravděpodobnost, ikdyž nízká (menší než α), že daný průměr pochází z populace s H0a člověk se tak rozhodnu špatně – učiní chybu 1. druhu. n n n nStejně tak existuje situace kdy podmíněná pravděpodobnost vytáhnutí daného nebo extrémnějšího průměru vzorku bude větší než alfa a člověk důsledkem toho nezamítne H0, ikdyž existuje pravděpodobnost (v závislosti na alternativní hypotéze H1) že daný průměr pochází z populace H1a člověk také učiní špatné rozhodnutí – chybu 2. druhu β. ANABNR2 Čtyři možné situace a síla testu skutečnost H0 H1 rozhodnutí „H0“ p(„H0“ | H0) 1 – α Chyba 2. typu (β) riziko chybného nezamítnutí nulové hypotézy p(„H0“ | H1) „H1“ Chyba 1.typu (α) riziko chybného zamítnutí nulové hypotézy p(„H1“ | H0) p(„H1“ | H1) Síla testu (1 – β)