PSY117/454 Statistická analýza dat v psychologii Přednáška 8 Statistické testování hypotéz Země je kulatá (p<0,05). Jacob Cohen Hypotézy Příklady (statistických) hypotéz H: = 100 : Populační průměr IQ je roven 100. H: = 10 : Populační směrodatná odchylka je 10. H: 1 ­ 2 = 0 : Populační průměry 1 (psychotici) a 2 (zdraví) jsou stejné. H: xy= 0 : Proměnné X (pití piva) a Y (dominance) spolu nekorelují Vezměme si tu první hypotézu konfrontujme s daty: Na vzorku 1000 náhodně vybraných dospělých jsme zjistili průměrné IQ rovné 105 (s =14). AJ: statistical hypotheses testing, hypothesis, hypothesis supported by data Statistický test hypotézy Statistické testování založeno na p-nosti Známe-li pravděpodobnostní rozložení statistik můžeme usuzovat, jak pravděpodobná je určitá výběrová statistika vzhledem k hypotéze: P (D |H ) D : např. m=9,78 H : např. =10, P (D |H ) je P (m=9,78 | =10 ) Je-li P (D |H ) vysoká, je tím hypotéza podpořena. Je-li P (D |H ) nízká, je tím hypotéza ,,činěna méně p-nou" Jak ,,vysokánízká" je vysokánízká pravděpodobnost, abychom hypotézu podpořilivyvrátili? Jak vysoká P(D |H ) je nutná k přijetí H? Bayesovský přístup ­ otázka není relevantní s H je spojena určitá p-nost a ta se díky P (D |H) zvyšuje či snižuje Bayesův teorém ­ P (H |D ) = P (H ) * P (D |H ) / P (D ) Fisher, Pearson, Neyman ­ otázka je relevantní Popper ­ princip falzifikace ­ H nelze potvrdit, pouze vyvrátit My ale nechceme své hypotézy vyvracet, spíš potvrzovat P-N: princip vzájemně se doplňujících konkurenčních hypotéz Vytvořme takovou H, kt. bude logickou negací naší vědecké hypotézy a říkejme jí nulová H. Když se nám podaří nulovou H vyvrátit, znamená to jakousi podporu pro naší vědeckou hypotézu. Vyvrácení H0: P(D |H0) < 0,05; 0,01; 0,001; 0,0001 podle zvyku Terminologická vložka H0 : nulová (statistická) hypotéza logická negace (doplněk) vědecké hypotézy H1 : vědecká, alternativní hypotéza ta, o kterou nám primárně jde; P (H0 H1) = 1 P (D |H0), kdy H0 zamítáme: úroveň/hladina statistické významnosti (průkaznosti) , udává se často v procentech: 5%, 1% značí se i p nebo Sig. p-nost chybného zamítnutí H0 - chyba prvního typu chyba, jejíž velikost jsme ochotni tolerovat Jednostranné vs. oboustranné hypotézy jednostranné, směrové: 23, 0, z různých důvodů se jim vyhýbáme oboustranné: = 23 AJ: null hypothesis, scientific/alternative hypothesis, level of statistical significance, type I error, one-tailed, two-tailed, directional Postup testování statistické hypotézy 1. Formulujte statistickou hypotézu, kterou budete testovat (vyvracet) (H0: = 0) 2. Zvolte hladinu statistické významnosti, tj. míru rizika, že dojde k chybě 1. typu (např. = 0,05) 3. Hledáme p-nost získání naší výběrové statistiky nebo extrémnější hodnoty, za předpokladu, že H0 je pravdivá: P(D|H0), p, Sig. cesta vede přes znalost výběrového rozložení statistiky např. m = 0,5. P (|m|=0,5|=0) obvykle je nutný přepočet na tzv. testovou statistiku, např. t, z... 4. Vyneseme rozhodnutí o H0: zamítnutí či přijetí je-li P(D|H0) < , pak H0 zamítáme je-li P(D|H0) , pak H0 nezamítáme Příklad ­ jednovýběrový t-test Terapie nevhodného chování. Rozdíl před-po: m=2,7; s=3,5; N=10 H : Terapie má efekt. ( 0) 1. H0 : Terapie nemá efekt: = 0 2. V sociálních vědách běžně =0,05 3. P (|m|2,7|=0) = ? sm=3,5/odm(10)=1,1 t =(m-)/sm=2,7/1,1= 2,45 P (|t |2,45 | =0) = TDIST(2,45;9;2) = 0,04 4. P (|m|2,7|=0) < 0,05 >> zamítáme H0 Protože při m =2,7 je velmi málo pravděpodobné, že by rozdíl byl 0, tak připouštíme, že nějaký rozdíl je. Dichotomizace výsledků výzkumu Výsledek výzkumu je testováním zredukován na ano-ne Čím nižší je , tím vyšší je . Přesná podoba vztahu závisí na použitém testu. i mohou být nízké pouze při vysokých n. Síla testu viz Hendl 401-411. AJ: type-I error, type-II error, (statistical) power H0 přijata H0 zamítnuta H0 pravdivá (žádný efekt) OK chyba 1. typu (její pravděpodobnost) H0 nepravdivá (efekt) chyba 2. typu OK Síla (1-) Problémy statistického testování H Největší problém: dichotomizace stejná velikost efektu dává při různých N jiné rozhodnutí o H0 komplikuje až znemožňuje kumulativní budování znalostní báze Problém interpretace p= P(D |H0) a nikoli P(H |D) Jak z jich ven? VŽDY udávat velikost efektu (Cohenovo d, r, R 2, 2, 2 ) používat intervalové odhady testování hypotéz používat pouze doplňkově