PSY117/454 Statistická analýza dat v psychologii Přednáška 8 Statistické testování hypotéz Země je kulatá (p<0,05). Jacob Cohen Hypotézy  Příklady (statistických) hypotéz  H: µ = 100 : Populační průměr IQ je roven 100.  H: σ = 10 : Populační směrodatná odchylka je 10.  H: µ1 – µ2 = 0 : Populační průměry µ1 (psychotici) a µ2 (zdraví) jsou stejné.  H: ρxy= 0 : Proměnné X (pití piva) a Y (dominance) spolu nekorelují  Vezměme si tu první hypotézu konfrontujme s daty:  Na vzorku 1000 náhodně vybraných dospělých jsme zjistili průměrné IQ rovné 105 (s =14). AJ: statistical hypotheses testing, hypothesis, hypothesis supported by data Statistický test hypotézy Statistické testování založeno na p-nosti  Známe-li pravděpodobnostní rozložení statistik můžeme usuzovat, jak pravděpodobná je určitá výběrová statistika vzhledem k hypotéze: P (D |H )  D : např. m=9,78  H : např. µ =10, P (D |H ) je P (m=9,78 | µ =10 )  Je-li P (D |H ) vysoká, je tím hypotéza podpořena.  Je-li P (D |H ) nízká, je tím hypotéza „činěna méně p-nou“  Jak „vysokánízká“ je vysokánízká pravděpodobnost, abychom hypotézu podpořilivyvrátili? Jak vysoká P(D |H ) je nutná k přijetí H?  Bayesovský přístup – otázka není relevantní  s H je spojena určitá p-nost a ta se díky P (D |H) zvyšuje či snižuje  Bayesův teorém – P (H |D ) = P (H ) * P (D |H ) / P (D )  Fisher, Pearson, Neyman – otázka je relevantní  Popper – princip falzifikace – H nelze potvrdit, pouze vyvrátit  My ale nechceme své hypotézy vyvracet, spíš potvrzovat  P-N: princip vzájemně se doplňujících konkurenčních hypotéz  Vytvořme takovou H, kt. bude logickou negací naší vědecké hypotézy a říkejme jí nulová H. Když se nám podaří nulovou H vyvrátit, znamená to jakousi podporu pro naší vědeckou hypotézu.  Vyvrácení H0: P(D |H0) < 0,05; 0,01; 0,001; 0,0001 podle zvyku Terminologická vložka H0 : nulová (statistická) hypotéza  logická negace (doplněk) vědecké hypotézy H1 : vědecká, alternativní hypotéza  ta, o kterou nám primárně jde; P (H0 ∪ H1) = 1 P (D |H0), kdy H0 zamítáme:  úroveň/hladina statistické významnosti (průkaznosti)  α, udává se často v procentech: 5%, 1%  značí se i p nebo Sig.  p-nost chybného zamítnutí H0 - chyba prvního typu  chyba, jejíž velikost jsme ochotni tolerovat Jednostranné vs. oboustranné hypotézy  jednostranné, směrové: µ ≥ 23, µ ≤ 0, z různých důvodů se jim vyhýbáme  oboustranné: µ = 23 AJ: null hypothesis, scientific/alternative hypothesis, level of statistical significance, type I error, one-tailed, two-tailed, directional Postup testování statistické hypotézy 1. Formulujte statistickou hypotézu, kterou budete testovat (vyvracet) (H0: µ = 0) 2. Zvolte hladinu statistické významnosti, tj. míru rizika, že dojde k chybě 1. typu (např. α = 0,05) 3. Hledáme p-nost získání naší výběrové statistiky nebo extrémnější hodnoty, za předpokladu, že H0 je pravdivá: P(D|H0), p, Sig.  cesta vede přes znalost výběrového rozložení statistiky  např. m = 0,5. P (|m|=0,5|µ=0)  obvykle je nutný přepočet na tzv. testovou statistiku, např. t, z… 4. Vyneseme rozhodnutí o H0: zamítnutí či přijetí  je-li P(D|H0) < α , pak H0 zamítáme  je-li P(D|H0) ≥ α , pak H0 nezamítáme Příklad – jednovýběrový t-test Terapie nevhodného chování.  Rozdíl před-po: m=2,7; s=3,5; N=10  H : Terapie má efekt. (µ ≠0) 1. H0 : Terapie nemá efekt: µ = 0 2. V sociálních vědách běžně α=0,05 3. P (|m|≥2,7|µ=0) = ?  sm=3,5/odm(10)=1,1  t =(m-µ)/sm=2,7/1,1= 2,45  P (|t |≥2,45 |τ =0) = TDIST(2,45;9;2) = 0,04 4. P (|m|≥2,7|µ=0) < 0,05 >> zamítáme H0 Protože při m =2,7 je velmi málo pravděpodobné, že by rozdíl byl 0, tak připouštíme, že nějaký rozdíl je. Dichotomizace výsledků výzkumu  Výsledek výzkumu je testováním zredukován na ano-ne Čím nižší je α, tím vyšší je β. Přesná podoba vztahu závisí na použitém testu. α i β mohou být nízké pouze při vysokých n. Síla testu viz Hendl 401-411. AJ: type-I error, type-II error, (statistical) power H0 přijata H0 zamítnuta H0 pravdivá (žádný efekt) OK chyba 1. typu α (její pravděpodobnost) H0 nepravdivá (efekt) chyba 2. typu β OK Síla (1-β) Problémy statistického testování H  Největší problém: dichotomizace  stejná velikost efektu dává při různých N jiné rozhodnutí o H0  komplikuje až znemožňuje kumulativní budování znalostní báze  Problém interpretace  p= P(D |H0) a nikoli P(H |D)  Jak z jich ven?  VŽDY udávat velikost efektu (Cohenovo d, r, R 2, η2, ω2 )  používat intervalové odhady  testování hypotéz používat pouze doplňkově