PSY117/454 ^^^^^^^^^ Statistická analýza dat v psychologii Přednáška 10 M Statistické testování hypotéz II Přehled testů, rozdíly průměrů, velikost účinku, síla testu The great tragedy of Science - the slaying of a beautiful hypothesis by an ugly fac.i Thomas Huxley Základní výzkumné otázky/hypotézy 1. Stanovení hodnoty parametru ^m ^stanovení intervalu spolehlivosti na ju, a, p, b... 2. Rozdíl mqjiskupinami ■ mezi průměry, korelacemi, rozptyly, pravděpodobnostmi, pořadími.... ■ např. Muži a ženy se liší v míře úzkostnosti. (oboustranná) ■ např. Muži jsou úzkostnější než ženy. (jednostranná, směrová) 3. Korelace mezi proměnnými ■ korelace, regrese, chí-kvadrát ■ např. Mezi věkem a počtem návštěv lékaře za rok existuje lineární korelace, (oboustranná) ■ např. Mezi věkem a počtem návštěv lékaře za rok existuje pozitivní lineární korelace, (jednostranná) D 2. lze převést na^ippnaopak^^ D obecně mluvíme o velikosti^fefeiu/účinku i AJ: difference, association, effect size, two-tailed, one-tailed (directional) Ířeh||dy statistických tess^==^» I I receptář Oseckých ^^ ■ třídění podle D počtu výběrů - 1 či 2 D úrovně měření- alternativní, nominální, intervalová D typu procedury - interval spolehlivosti, test hypotézy, velikost potřebného výběru U l lendl - kapitolBJP' ■-■■■ ' '■ D onlin^^ ■ http://www.qraphpad.com/www/book/Choose.htm ■ http://www.whichtest.info/index.html ■ http://www.socialresearchmethods.net/selstat/ssstart.htm ■ česky: http://meloun.upce.cz/metody/ leslv lid ipzdílv středních hodnoty NBlinální závislá M ■ párový test. binomický znaménkový test ■ nezávislé skupiny, chí-kvadrát Ordinální závislá ^^ ■ párový test Wilcoxonovo T ■ nezávislé skupiny. Mann-Whitney U Intervalová závislá B ■ párový test. párový t-test------ = ■ nezávislé skupiny. D známý rozptyl v populaci: z-test D neznámý rozptyl v populaci: t-test pro nezávislé skupiny ■ varianta pro stejné a nestejné rozptyly mezi skupinami AJ: sign test, chi-square, Wilcoxon T, Mann-Whitney U, paired(-samples) t-test (dependent, repeated measures), one-sample t-test, independent samples t-test ^^nájlMJlzávislýc[jprůi|průg^ggst § Předpoklady použití ^^ jsou-li výrazně porušeny, volíme raději neparametrický test ■ proměnná je v populaci normálně rozložená - neřeší se, pokud je nvn2 >30 ■ homogenita rozptylů (homoscedascita), pokud n11 n2 ■ řeší modifikace t-testu pro nestejné rozptyly (6.2.3) ■ testuje se Levenovým testem (od oka s12/s22<2) ■ nezávislost pozorování - řeší párový t-test (pro závislé výběry) (6.2.4) U H0: n\-m2 -ISebo roven konstantě.^bo v A- 0 či ô J^^)lílTie WM 1%, 5%, nebo lUV'cl D Rozdíl má výběrovou chyb^^^^ {[{{n1-l)s12+{n2-l)s22)/{n1+^-IWll/^Wn^]} ŕ-rozložení s nľ+n2-2 stupni volnosti (v) JJ___spočítáme testovou statistfeFŕ = (m^ - m2)/$r{ O zjistíme jaká je p{t > |zjištěná hodnot§|(- tabulky, TDIST(ř, v) D Je-li p > a, pak H0 zůstává platná, je-li p < a, H0 zamítáme (a konstatujeme existenci statisticky významného rozdílu). D SjHmáme Cohenovo da interval spolehlivosti pro rozdíl průměrů. Piiklrid /Itest prcijpzál^j^yběrvM D H. Muži a ženy se liší v míře úzkostnosti. ■ nasbíraná data: mm=2; mž = 3; 5^=1,5; sž= 1,6; nm= nž = 20 ■ H0 budeme testovat na 5% hladině statistické významnosti, a = 0,05 D Předpoklady splněny >> provádíme ŕ-test pro nezávislé výběry (6.2.2) D d- mž-mm = 2-3 = -1 I I h V{[((20-l)l,52+(20-l)l,62)/(20+20-2))]*[l/20+l/20]}=0,49 ^^^^ D rozdíl má ŕ-rozložení s n1+n2-2 = 38 stupni volnosti D / - f/;/, Wm2)/s(j^mOA9 - -7,04 ^^ D /;(/ >|-7f07|)je pi í v- 38 rovna 0,048 BÍbiST(2,04;38;2)=o,048Í D p < a, takže zamítáme H0 Pokud by H0 platila, zjištěný rozdíl by byl nepravděpodobný. = ^= 95% interval spolehlivosti: JH = TINV(0,05;38) | 2,02 ^^ d - 2,02*sd < ô < d + 2,02*sd \ tj. -1,98 < ô ^^02 D Cohenovo d - |-1|/1,55 =0,65 , což je středně velký efekt Velikost účinku/efektu D Možnost srovnání mezi studiemi zkoumajícími tutéž výzkumnou otázku pomocí různě operacionalizovaných proměnných D Možnost srovnání velikosti efektu vyjádřeného různými koeficienty ^^ Snadnější interpretace ü Prcjjlzdíly středních hodnc^^ ■^Cohenovo ci = |/77il/77,|/^nnloH ; 5pnn|oH= Ví((/7i iW i (/^ll)^2)/(/71 + /79-2))1 ■ varianta ď - \mx-m^l szon; 5con= s kontrolní skupiny Pro těsnost vztahu (korelace) ■ r a r2, R2, 7/2(eta), aß- podíl vysvětleného rozptylu závislé proměnné Indikátory velikosti efektu lze||pzi sebou navzájem převádiU = ■ Cohenovo d na r: r- ^J(d2/(d2+ 4)) ■ r na Cohenovo d: d- 2r/V(l - r2) AJ: effect size, Cohen's d, strength of association, explained variance Síla testu Síla testu (1-yö) je pravděpodobnost, že existující rozdíl M bude detekoválmpištěn jako statisticky významný^M Záleží na ■ skutečné velikosti účinku (d. /:.,) ■ variabilitě proměnné(ých)llÍ ^^ M velikosti vzorku ^^^^^^^^^^^^^^^^^^^^^^^^^H ■ zvoleném riziku chyby I. typu, a: čím nižší je a tím nižší je síla ^^^H testu ^^ M zvoleném testu (parametrické mají vyšší sílu) = Obvykle toužíme po co nejvyšší síle testu, cca 0,8 a výše. ■ Bojujeme o ni velikostí vzorku a kontrol^^Rervenujícíc^^H proměnných. ^^ Publikace výsledků testování hypotéz ^(Primárně u 1000) jsou naopak extrémně přísné ■ ŕ-testy a ANOVAjsou proti narušení normality robustní, takže nám obvykle stačí konstatovat unimodalitu bez extrémního zešikmení ■ pro rozhodování mezi použitím parametrických a neparametrických testů volíme spíše úroveň měření a výzkumný kontext AJ: tests of (univariate) normality, goodness-of-fit tests