Osnova přednášky „Jednofaktorová MANOVA“ 1. Popis problému 2. Test hypotézy o shodě vektorů středních hodnot 3. Simultánní testy o složkách vektorů středních hodnot 4. Vícerozměrná obdoba mnohonásobného porovnávání 5. Simultánní testy v mnohonásobném porovnávání 6. Předpoklady v MANOVĚ a jejich ověřování 7. Aplikace MANOVY v psychologickém výzkumu Vícerozměrná analogie analýzy rozptylu jednoduchého třídění (jednofaktorová MANOVA) 1. Popis problému Předpokládáme, že faktor A má 3r ≥ úrovní a přitom na h-té úrovni bylo provedeno h n p-rozměrných pozorování ( ) ( )T phn1hnhn T p1h11h1h hhh X,,X,,X,,X KKK == XX , která považujeme za p-rozměrný náhodný výběr rozsahu h n , r,,1h K= . Na každé úrovni faktoru musí být provedeno více pozorování než je závisle proměnných veličin, tj. pnh > , r,,1h K= . Výsledky lze zapsat do tabulky: faktor A výsledky úroveň 1 p11111 x,,x K …………… pn11n1 11 x,,x K ………... …………… úroveň r p1r11r x,,x K …………… prn1rn rr x,,x K Zavedeme následující označení: h … index skupiny, i … index objektu, j … index proměnné  = = h 1r rnn … celkový rozsah všech r výběrů  = = hn 1i hij h hj X n 1 M … výběrový průměr j-té proměnné v h-té skupině, p,,1j K= , r,,1h K=           = hp 1h h M M MM … vektor výběrových průměrů v h-té skupině, r,,1h K=  = = r 1h hh n n 1 MM … vektor celkových průměrů ( )( )= −− − = hn 1i T hhihhi h 1n 1 MXMXSh … výběrová varianční matice v h-té skupině, r,,1h K= ( ) = − − = r 1h hh 1n rn 1 SS … vážený průměr výběrových variančních matic Příklad dat vhodných pro vícerozměrnou analýzu rozptylu Na 45 vzorcích ropy pocházejících ze tří ložisek byly zjištěny hodnoty těchto čtyř proměnných: X1 … obsah vanadu v popelu (v promile) X2 … obsah železa v popelu (v promile) X3 … obsah nasycených uhlovodíků (v setinách procenta) X4 … obsah aromatických uhlovodíků (v setinách procenta) Máme 3 skupiny, v 1. skupině je 7 čtyřrozměrných pozorování, ve 2. skupině 8 pozorování a ve 3. skupině 30 pozorování. Ukázka části datového souboru: Vektor M1 výběrových průměrů v 1. skupině: 36,571 38,714 679,571 1082,571 Vektor M2 výběrových průměrů ve 2. skupině: 50,6250 35,7500 653,2500 518,1250 Vektor M3 výběrových průměrů ve 3. skupině: 76,5333 21,4667 457,4667 614,8667 Vektor M celkových průměrů: 65,7111 26,6889 526,8222 670,4222 X1 … obsah vanadu v popelu (v promile) X2 … obsah železa v popelu (v promile) X3 … obsah nasycených uhlovodíků (v setinách procenta) X4 … obsah aromatických uhlovodíků (v setinách procenta) Výběrová varianční matice S1 v 1. skupině: Proměnná X1 X2 X3 X4 X1 244,62 2,5238 -1103,55 767,95 X2 2,52 59,2381 28,52 355,19 X3 -1103,55 28,523820002,95 13339,45 X4 767,95 355,190513339,45 51132,95 Výběrová varianční matice S2 ve 2. skupině: Proměnná X1 X2 X3 X4 X1 325,696 -111,393 749,11 3446,9 X2 -111,393 91,357 190,50 -133,5 X3 749,107 190,500 8149,64 26549,0 X4 3446,911 -133,53626548,96 119963,8 Výběrová varianční matice S3 ve 3. skupině: Proměnná X1 X2 X3 X4 X1 223,223 -36,602 -511,292 663,87 X2 -36,602 34,671 267,637 -567,56 X3 -511,292 267,6379071,223 4749,31 X4 663,867 -567,5564749,306 53134,19 Společná výběrová varianční matice S: Proměnná X1 X2 X3 X4 X1 488,62 -160,637 -1934,96 -812,22 X2 -160,64 101,992 958,06 388,52 X3 -1934,96 958,05719900,79 18314,85 X4 -812,22 388,52118314,85 94423,93 X1 … obsah vanadu v popelu (v promile) X2 … obsah železa v popelu (v promile) X3 … obsah nasycených uhlovodíků (v setinách procenta) X4 … obsah aromatických uhlovodíků (v setinách procenta) Celková variabilita obsažená v datech je vyjádřena maticí T: ( )( ) = = −−= r 1h n 1i T hihi h MXMXT . Matici T lze rozložit na součet dvou matic: BET += , kde E je matice reziduální variability ( )( ) ( ) == = −=−−= r 1h h r 1h n 1i T hhihhi 1n h h SMXMXE a B je matice meziskupinové variability ( )( ) = −−= r 1h T hhh n MMMMB . Vliv faktoru, který způsobuje rozpad datové matice na skupiny, se může projevit jen v matici B. Variabilitu projevující se v matici E tedy považujeme za reziduální, způsobenou buď náhodnými vlivy nebo faktory, kterou nejsou z našeho hlediska podstatné. Matice T celkové variability: X1 X2 X3 X4 X1 21499,2 -7068,04 -85138,3 -35738 X2 -7068,0 4487,64 42154,5 17095 X3 -85138,3 42154,51 875634,6 805853 X4 -35737,5 17094,91 805853,44154653 Matice E reziduální variability: X1 X2 X3 X4 X1 10221,1 -1826,1 -16205,0 47988 X2 -1826,1 2000,4 9266,1 -15263 X3 -16205,0 9266,1 440130,7 403609 X4 47988,2 -15262,7 403609,32687436 Matice B meziskupinové variability: X1 X2 X3 X4 X1 11278,1 -5241,94 -68933,3 -83726 X2 -5241,9 2487,24 32888,4 32358 X3 -68933,3 32888,41 435503,9 402244 X4 -83725,7 32357,61 402244,11467217 2. Test hypotézy o shodě vektorů středních hodnot Nadále budeme předpokládat, že náhodný výběr příslušející h-té úrovni faktoru A, tedy posloupnost stochasticky nezávislých p-rozměrných náhodných vektorů hhn1h ,, XX K , pochází z p-rozměrného normálního rozložení ( )Σμ ,N hp , r,,1h K= a jednotlivé náhodné výběry jsou stochasticky nezávislé. Na hladině významnosti α testujeme nulovou hypotézu r10 :H μμ ==K proti alternativní hypotéze :H1 aspoň jedna dvojice vektorů středních hodnot se liší. Při testování této hypotézy můžeme použít až čtyři různé testy založené na - Wilksově kritériu, - Lawleyově – Hotellingově kritériu, - Pillaiově kritériu, - Royově kritériu. Každé z těchto kritérií je určitým způsobem založeno na vlastních číslech matice 1 BE− . Označme gλ g-té vlastní číslo této matice a s počet nenulových vlastních čísel, přičemž ( )1r,pmins −= . Uvedeme vzorce pro vyjádření jednotlivých kritérií: Wilksovo kritérium: ( ) ( ) ∏ = λ+ = + =Λ s 1g g1 1 det det BE E , Lawleyovo – Hotellingovo kritérium: ( ) = − λ== s 1g g 2 trT 1 BE , Pillaiovo kritérium: ( )( )  = − + =+= s 1g g g1 λ1 λ trP EBB , Royovo kritérium: ( )1 V λ= , kde ( )1 λ je největší vlastní číslo matice 1 BE− . V praxi je nejpoužívanější Wilksovo kritérium. Nabývá hodnot mezi 0 a 1, přičemž vyšší hodnoty znamenají, že střední hodnoty se liší méně. Testová statistika WF pro test shody vektorů středních hodnot vznikne transformací Λ: Λ      − + −−= ln1 2 rp nFW . V případě platnosti nulové hypotézy se statistika WF asymptoticky řídí rozložením ( )( )1rp2 −χ . 0H tedy zamítáme na asymptotické hladině významnosti α, když ( )( )1rpF 1 2 W −χ≥ α− . Znamená to, že jsme s rizikem omylu nejvýše %100α prokázali, že alespoň dvě skupiny nemají stejné vektory středních hodnot. 3. Simultánní testy o složkách vektorů středních hodnot Prokážeme-li na zvolené hladině významnosti α rozdíl mezi vektory středních hodnot, budeme dále zjišťovat, které ze sledovaných p kvantitativních proměnných p1 X,,X K způsobují rozdíl mezi skupinami. Provedeme tedy tzv. simultánní testy. Ty odhalí, které jednotlivé proměnné jsou závislé na faktoru A. Současně tedy testujeme p hypotéz r11101 :H µ==µ K , …, pr1pp0 :H µ==µ K . Použijeme testovou statistiku založenou na Wilksově kritériu: jj jj j t e ln1 2 rp nK       − + −−= , kde jj e resp. jj t je j-tý diagonální prvek matice E resp. T, p,,1j K= . V případě platnosti nulové hypotézy se statistika jK asymptoticky řídí rozložením ( )( )1rp2 −χ . j0H tedy zamítáme na asymptotické hladině významnosti α, když ( )( )1rpK 1 2 j −χ≥ α− . Upozornění: Může však nastat situace, kdy hypotéza o shodě vektorů středních hodnot byla na hladině významnosti α zamítnuta, avšak simultánní testy neprokáží žádný rozdíl mezi složkami vektorů středních hodnot. V takovém případě jsou rozdíly mezi skupinami způsobeny nějakou kombinací sledovaných p proměnných. 4. Vícerozměrná obdoba mnohonásobného porovnávání Dalším krokem, který následuje po zamítnutí hypotézy o shodě vektorů středních hodnot, je provedení vícerozměrné obdoby mnohonásobného porovnávání. Chceme totiž zjistit, které dvojice vektorů středních hodnot se liší na zvolené hladině významnosti α. Budeme tedy pro všechny indexy ** hh,r,,1h,h ≠= K testovat hypotézu * hh0 :H μμ = proti * hh1 :H μμ ≠ . Těchto testů je       2 r . Nulovou hypotézu zamítneme na hladině významnosti α, když testová statistika (založená na Lawleyově – Hotellingově kritériu) ( ) ( ) ( )** * * hh 1T hh hh hh nn nn p1r 1prn MMEMM −− + ⋅ − +−− − nabude hodnoty aspoň ( )211 ,F ννα− , kde ( ) ( ) ( )p1r2n prnp1r 1 −−− −−− =ν , 1prn2 +−−=ν . Pak jsme s rizikem omylu nejvýše %100α prokázali, že h-tá a * h -tá skupina nemají stejné vektory středních hodnot. 5. Simultánní testy v mnohonásobném porovnávání Provedení MANOVY uzavřeme tím, že odhalíme případné rozdíly mezi jednotlivými proměnnými v rámci dvojic skupin. Pro všechny indexy * h,h , * hh ≠ a všechny indexy p,,1j K= testujeme na hladině významnosti α hypotézu jhhj0 *μμ:H = proti jhhj1 *μμ:H ≠ . Zajímá nás tedy rozdíl mezi středními hodnotami j-té proměnné v h-té a * h -té skupině. Těchto testů je ( ) 2 1rpr − . Testová statistika má tvar: ( ) 2 j 2 jhhj hh hh S MM nn nn )rn(p)1r( 1prn * * * − ⋅ + ⋅ −− +−− ( 2 j S je j-tý diagonální prvek matice S) . V případě platnosti nulové hypotézy se tato statistika asymptoticky řídí rozložením ( )21 ,F νν , kde ( ) ( ) ( )p1r2n prnp1r 1 −−− −−− =ν , 1prn2 +−−=ν . Hypotézu o shodě j-tých složek vektorů středních hodnot v h-té a * h -té skupině zamítneme na hladině významnosti α, když tato testová statistika nabude hodnoty větší nebo rovné kvantilu ( )211 ,F ννα− . Upozornění: Vícerozměrnou obdobu mnohonásobného porovnávání ani simultánní testy v mnohonásobném porovnávání systém STATISTICA neposkytuje. Problém lze vyřešit tím, že na zvolenou hladinu významnosti α aplikujeme Bonferroniho korekci. V prvém případě (tj. pro vícerozměrnou obdobu mnohonásobného porovnávání) provedeme pro každou dvojici skupin vícerozměrný dvouvýběrový t-test (tj. Hotellingův T2 test) a jeho vypočtenou p-hodnotu porovnáme s číslem       α 2 r . Je-li       α ≤ 2 r p , považujeme rozdíl ve vektorech středních hodnot příslušných dvojic skupin za prokázaný. Ve druhém případě (tj. pro simultánní testy v mnohonásobném porovnávání) provedeme pro každou proměnnou a každou dvojici skupin dvouvýběrový t-test a jeho vypočtenou p-hodnotu porovnáme s číslem ( ) 2 1rpr − α . Je-li ( ) 2 1rpr p − α ≤ , zamítáme hypotézu o shodě středních hodnot příslušné proměnné v daných dvou skupinách. 6. Předpoklady v MANOVĚ a jejich ověřování Vícerozměrná normalita: V každé z r skupin bychom měli testovat hypotézu, že vektor proměnných ( p1 X,,X K )T se řídí p-rozměrným normálním rozložením. Testy na vícerozměrnou normalitu však nejsou běžnou součástí statistických programových systémů. V praxi se spokojíme s tím, že otestujeme normalitu pro každou jednotlivou proměnnou zvlášť. Výsledky těchto testů však posuzujeme jen orientačně. Menší odchylky od normality nebrání provedení MANOVY, při větším porušení používáme vhodné transformace. Shoda variančních matic: Je-li třídění vyvážené, tj. ve všech skupinách je stejný počet pozorování, je MANOVA odolná vůči porušení předpokladu shody variančních matic. V případě nevyváženého třídění je nutné provést Boxův test shody variančních matic. Na hladině významnosti α testujeme hypotézu r10 :H ΣΣ ==K proti alternativní hypotéze :H1 aspoň jedna dvojice variančních matic se liší. Testová statistika má tvar: ( ) ( )     −−−=  = r 1h hh p 0 ln1nlnrn C 1 T SS , kde ( )( )       − − −+− −+ +=  = rn 1 1n 1 1p1r6 1p3p2 1C r 1h h 2 p je konstanta zlepšující aproximaci. V případě platnosti nulové hypotézy se statistika 0 T asymptoticky řídí rozložením ( ) ( )       +− χ 2 1pp1r2 . Pokud testová statistika nabude hodnoty aspoň ( ) ( )       +− χ α− 2 1pp1r 1 2 , hypotézu o shodě variančních matic zamítneme na asymptotické hladině významnosti α. Linearita vztahů: Vzhledem k tomu, že MANOVA patří do skupiny obecných lineárních modelů, předpokládá se, že v každé skupině existuje mezi závisle proměnnými veličinami přibližně lineární vztah. Tento předpoklad lze orientačně ověřit pomocí dvourozměrných tečkových diagramů. Výskyt nelineárních vztahů snižuje sílu testů v MANOVĚ. 7. Aplikace MANOVY v psychologickém výzkumu Informace o projektu „Výkonová motivace rozumově nadaných studentů s dyslexií“ Institut výzkumu dětí, mládeže a rodiny je součástí Fakulty sociálních studií Masarykovy univerzity. Vědecká činnost tohoto institutu je zaměřena na sledování psychických a sociálních charakteristik dětí, adolescentů a jejich rodin. V nedávné minulosti zde mj. řešili projekt „Výkonová motivace rozumově nadaných studentů s dyslexií – základní determinanty v období adolescence a časné dospělosti“. Tento projekt se zaměřoval na problematiku mimořádně nadaných adolescentů a mladých dospělých se souběžnou vývojovou poruchou učení – s dyslexií. Podle současných poznatků je právě tato skupina nadaných studentů ve značně znevýhodňující vzdělávací pozici, která jí často znemožňuje dosahovat úspěchů ve škole i v životě. Hlavním cílem projektu bylo sledování klíčových proměnných, které mohou být zodpovědné za tento stav. V rámci projektu byly vyšetřeny řádově stovky studentů. Zaměříme se na data o 166 studentech bez dyslexie a s diagnostikovanou dyslexií, u nichž byla změřena inteligence Ravenovým testem (maximální skóre je 60 bodů, za nadané jsou považováni studenti se skóre aspoň 56 bodů) a kteří vyplnili dotazník zaměřený na tyto aspekty: - vědomí vlastní účinnosti (přesvědčení jedince, že dokáže úspěšně realizovat chování, které je potřebné k dosažení specifických cílů), výsledky jsou zaznamenány v proměnné skóre H, která může nabývat hodnot od 10 do 40; - osobní standardy (tendence dávat si vysoké cíle a hodnotit se v závislosti na jejich dosažení), výsledky jsou obsaženy v proměnné skóre PS, minimální hodnota může být 7, maximální 35; - organizovanost (ukazuje na schopnost udržovat pořádek a řád ve vlastních věcech), výsledky jsou shrnuty v proměnné skóre O, může nabývat hodnot mezi 6 až 30; - potřeba poznávat, výsledky jsou zaznamenány v proměnné skóre G, která se může pohybovat v mezích -64 až 64. Poznámka k Ravenovu testu: Základem testu jsou matice diagramů 3 x 3, do které se doplňuje chybějící diagram ve třetí řadě na základě logických souvislostí. Podstatou tohoto testu je měření obecné intelektuální schopnosti pracovat s abstraktními pojmy. Ukázka Ravenovy matice: Celý výzkumný soubor 166 studentů je rozčleněn na čtyři skupiny: - nadaní studenti s dyslexií (n1 = 16, označení ND), - nadaní studenti bez dyslexie (n2 = 40, označení NnD), - průměrní studenti s dyslexií (n3 = 22, označení PD), - průměrní studenti bez dyslexie (n4 = 88, označení PnD). Metodami MANOVY zjistíme, zda na hladině významnosti 0,05 existují významné rozdíly mezi uvedenými čtyřmi skupinami studentů a identifikujeme proměnné, které tyto rozdíly způsobují. Ukázka části datového souboru: Posouzení úrovně a variability sledovaných proměnných v daných čtyřech skupinách: Souhrnné výsledky Popisné statistiky (psychologie.sta) Proměnná ID N platných Průměr Sm.odch. skoreH skorePS skoreO skoreG skoreH skorePS skoreO skoreG skoreH skorePS skoreO skoreG skoreH skorePS skoreO skoreG nadany dyslektik 16 28,62500 3,61248 nadany dyslektik 16 22,43750 5,15065 nadany dyslektik 16 17,25000 3,17280 nadany dyslektik 16 18,06250 14,17260 nadany nedyslektik 40 27,25000 4,85561 nadany nedyslektik 40 20,00000 4,53477 nadany nedyslektik 40 17,65000 3,00043 nadany nedyslektik 40 3,07500 20,38525 prumerny dyslektik 22 27,63636 2,78680 prumerny dyslektik 22 20,86364 5,00757 prumerny dyslektik 22 15,86364 4,31272 prumerny dyslektik 22 7,31818 18,00102 prumerny nedyslektik 88 28,28409 4,16595 prumerny nedyslektik 88 20,88636 4,42935 prumerny nedyslektik 88 18,53409 2,84443 prumerny nedyslektik 88 0,15909 19,10581 Průměry proměnných skóre H a skóre PS se u různých skupin příliš neliší. Průměr skóre O je poněkud nižší ve skupině průměrných dyslektiků. Největší rozdíly mezi průměry jsou pozorovatelné u skóre G, kde se velmi výrazně odlišují nadaní dyslektici a průměrní studenti bez dyslexie. Z hlediska variability se nejvyrovnanější jeví průměrní dyslektici ve vědomí vlastní účinnosti (skóre H), naopak největší proměnlivost pozorujeme u nadaných nedyslektiků v potřebě poznání (skóre G). Výpočty doplníme krabicovými grafy: Krabicový graf z více proměnných seskupený ID psychologie.sta 7v*166c Průměr; Krabice: Průměr±SmOdch; Svorka: Min-Max skoreH skorePS skoreO skoreG nadany dyslektik nadany nedyslektik prumerny dyslektik prumerny nedyslektik ID -60 -40 -20 0 20 40 60 Ověření předpokladů MANOVY Normalita: Nejprve pomocí S-W testu ověříme předpoklad o normalitě rozložení proměnných skóre H, skóre PS, skóre O, skóre G ve všech čtyřech skupinách. Souhrnné výsledky Testy normality (psychologie.sta) Proměnná ID N W p skoreH skorePS skoreO skoreG skoreH skorePS skoreO skoreG skoreH skorePS skoreO skoreG skoreH skorePS skoreO skoreG nadany dyslektik 16 0,943706 0,396906 nadany dyslektik 16 0,920708 0,173164 nadany dyslektik 16 0,974538 0,905670 nadany dyslektik 16 0,984604 0,989658 nadany nedyslektik 40 0,981282 0,736977 nadany nedyslektik 40 0,947461 0,062032 nadany nedyslektik 40 0,950792 0,080743 nadany nedyslektik 40 0,927833 0,013694 prumerny dyslektik 22 0,981058 0,931731 prumerny dyslektik 22 0,979518 0,908287 prumerny dyslektik 22 0,979293 0,904593 prumerny dyslektik 22 0,960403 0,497479 prumerny nedyslektik 88 0,983965 0,350405 prumerny nedyslektik 88 0,971554 0,049792 prumerny nedyslektik 88 0,968818 0,032215 prumerny nedyslektik 88 0,989775 0,728066 S-W test zamítá na hladině významnosti 0,05 hypotézu o normalitě skóre G u nadaných nedyslektiků a dále zamítá hypotézu o normalitě skóre PS a skóre O u průměrných nedyslektiků. Normalita je však porušena jen mírně. Nedopustíme se závažné chyby, budeme-li předpokládat, že každá ze čtyř částí datové matice je realizací výběru ze čtyřrozměrného normálního rozložení. Shoda variančních matic Hypotézu o shodě variančních matic otestujeme Boxovým testem. Boxův M test (psychologie.sta) Efekt: ID (Vypočteno pro všechny proměnné) Boxovo M Chí-kv. sv p Boxovo M 39,90594 37,13662 30 0,173196 Test shody čtyř variančních matic poskytl p-hodnotu 0,1732, tedy nadále budeme varianční matice považovat za shodné. Linearita vztahů Linearitu vztahů mezi sledovanými proměnnými v daných čtyřech skupinách orientačně posoudíme pomocí tečkových diagramů. Uvedeme zde výsledky jen pro skupinu průměrných dyslektiků, neboť vzhled tečkových diagramů v ostatních skupinách je podobný: Maticový graf psychologie.sta 7v*166c Zahrnout jestliže: ID=3 skoreH skorePSskoreO skoreO skoreG skoreG skoreH skorePS skoreO skoreG Výrazné nelinearity se zde neprojevují. Důležité předpoklady MANOVY jsou splněny. Testování hypotézy o shodě vektorů středních hodnot Nyní provedeme Wilksův, Pillaiův, Hotellingův a Royův test hypotézy o shodě vektorů středních hodnot. Vícerozměrné testy významnosti (psychologie.sta) Sigma-omezená parametrizace Dekompozice efektivní hypotézy Efekt Test hodnota F Efekt sv Chyba sv p Abs. člen ID Wilksův 0,01865 2091,936 4 159,0000 0,000000 Pillaiův 0,98135 2091,936 4 159,0000 0,000000 Hotellng 52,62732 2091,936 4 159,0000 0,000000 Royův 52,62732 2091,936 4 159,0000 0,000000 Wilksův 0,82122 2,711 12 420,9660 0,001535 Pillaiův 0,18498 2,645 12 483,0000 0,001932 Hotellng 0,21022 2,762 12 473,0000 0,001213 Royův 0,16843 6,779 4 161,0000 0,000046 Všechny čtyři testy zamítají na hladině významnosti 0,05 hypotézu, že střední hodnoty proměnných skóre H, skóre PS, skóre O, skóre G jsou ve všech čtyřech skupinách shodné. S rizikem omylu nejvýše 5 % jsme tedy prokázali, že aspoň mezi dvěma skupinami studentů existuje rozdíl z hlediska sledovaných psychologických skóre. Simultánní testy o složkách vektorů středních hodnot Dále se pomocí simultánních testů pokusíme odhalit, které proměnné způsobují rozdíly mezi skupinami studentů. 1 K1 2 K2 3 K3 4 K4 5 kvantil 1 2,21966888 3,21204257 13,0998874 12,5981213 21,0260698 Vidíme, že ani jedna ze čtyř statistik se nerealizuje v kritickém oboru. Vzhledem k tomu, že hypotéza o shodě vektorů středních hodnot byla na hladině významnosti 0,05 zamítnuta, ale simultánní testy jsou nevýznamné, musí být rozdíly mezi skupinami zapříčiněny nějakou lineární kombinací sledovaných čtyř proměnných. Vícerozměrná obdoba mnohonásobného porovnávání Nyní zjistíme, mezi kterými dvojicemi skupin existuje onen významný rozdíl, který byl odhalen při testování hypotézy o shodě vektorů středních hodnot. Vícerozměrnou obdobu mnohonásobného porovnávání STATISTICA neposkytuje. Problém vyřešíme tak, že provedeme všech šest porovnání (1-2, 1-3, 1-4, 2-3, 2-4, 3-4) pomocí Hotellingova T2 testu a získané p-hodnoty porovnáme s hladinou významnosti korigovanou podle Bonferroniho, tj. s číslem 3008,0 6 05,0 2 4 2 r ==      α=      α . Výsledek pro 1. a 2. skupinu: t-testy; grupováno: ID (psychologie.sta) Skup. 1: nadany dyslektik; Skup. 2: nadany nedyslektik Hotellingovo 8,38772 F(4,51)=1,9804 p<,11150 Vypočtenou p-hodnotu (tj. 0,11150) porovnáme s 3008,0 . Vidíme, že nadaní dyslektici a nadaní nedyslektici se neliší. -------------------------------------------------------------------------------------------------------------------- Výsledek pro 1. a 3. skupinu: t-testy; grupováno: ID (psychologie.sta) Skup. 1: nadany dyslektik; Skup. 2: prumerny dyslektik Hotellingovo 5,78503 F(4,33)=1,3257 p<,28093 Protože p-hodnota 0,28093 je větší než 3008,0 , můžeme konstatovat, že nadaní dyslektici a průměrní dyslektici se neliší. -------------------------------------------------------------------------------------------------------------------- Výsledek pro 1. a 4. skupinu: t-testy; grupováno: ID (psychologie.sta) Skup. 1: nadany dyslektik; Skup. 2: prumerny nedyslektik Hotellingovo 21,4183 F(4,99)=5,1971 p<,00077 V tomto případě vidíme, že nadaní dyslektici a průměrní nedyslektici se liší: 3008,000077,0 ≤ -------------------------------------------------------------------------------------------------------------------- Výsledek pro 2. a 3. skupinu: t-testy; grupováno: ID (psychologie.sta) Skup. 1: nadany nedyslektik; Skup. 2: prumerny dyslektik Hotellingovo 5,35556 F(4,57)=1,2719 p<,29168 Při srovnání nadaných nedyslektiků a průměrných dyslektiků nebyly odlišnosti zjištěny, protože příslušná p-hodnota (0,28168) je větší než 3008,0 . -------------------------------------------------------------------------------------------------------------------- Výsledek pro 2. a 4. skupinu: t-testy; grupováno: ID (psychologie.sta) Skup. 1: nadany nedyslektik; Skup. 2: prumerny nedyslektik Hotellingovo 7,10202 F(4,123)=1,7332 p<,14690 Nadaní a průměrní nedyslektici se neliší na hladině významnosti 0,05. Výsledek pro 3. a 4. skupinu: -------------------------------------------------------------------------------------------------------------------- t-testy; grupováno: ID (psychologie.sta) Skup. 1: prumerny dyslektik; Skup. 2: prumerny nedyslektik Hotellingovo 18,2551 F(4,105)=4,4370 p<,00236 Zde jsme prokázali, že s rizikem omylu nejvýše 5 % se liší průměrní dyslektici a nedyslektici. -------------------------------------------------------------------------------------------------------------------- Simultánní testy v mnohonásobném porovnávání Pro každou proměnnou provedeme dvouvýběrový t-test, abychom ji porovnali ve dvojicích skupin 1-2, 1-3, 2-3, 2-4, 3-4 a zjistíme, zda vypočtené p-hodnoty jsou menší nebo rovny korigované hladině významnosti ( ) 0021,02405,0 2 1rpr == − α . Vypočtené p-hodnoty máme v tabulce: skóre H skóre PS skóre O skóre G ND x NnD 0,3109 0,0861 0,6592 0,0096 ND x PD 0,3469 0,3508 0,2839 0,0554 ND x PnD 0,7597 0,2118 0,1058 0,0006 NnD x PD 0,7330 0,4920 0,0604 0,4176 NnD x PnD 0,2191 0,2996 0,1116 0,4347 PD x PnD 0,4914 0,9833 0,0006 0,1149 Na základě této tabulky můžeme konstatovat, že: - nadaní dyslektici a průměrní nedyslektici se liší ve skóre G (nadaní dyslektici vykazují vyšší potřebu poznání než průměrní studenti bez dyslexie) - průměrní dyslektici a průměrní nedyslektici se liší ve skóre O (průměrní dyslektici mají nižší schopnost udržovat pořádek a řád ve vlastních věcech než průměrní studenti bez dyslexie). Grafické znázornění rozdílů mezi sledovanými proměnnými v rámci čtyř skupin studentů: Graf průměru z více proměnných seskupený ID psychologie.sta 7v*166c Průměr; Svorka: Průměr±0,95 Int. spolehl. skoreH skorePS skoreO skoreG nadany dyslektik nadany nedyslektik prumerny dyslektik prumerny nedyslektik ID -10 -5 0 5 10 15 20 25 30 35 Závěr: Test hypotézy o shodě vektorů středních hodnot prokázal, že s rizikem omylu nejvýše 5 % existují odlišnosti mezi čtyřmi skupinami studentů z hlediska vědomí vlastní účinnosti, osobních standardů, organizovanosti a potřeby poznávání. Simultánní testy o složkách vektorů středních hodnot ukázaly, že rozdíly mezi skupinami jsou zapříčiněny nějakou lineární kombinací sledovaných čtyř proměnných. Pomocí vícerozměrné analogie mnohonásobného porovnávání jsme zjistili, že se odlišují nadaní dyslektici a průměrní studenti bez dyslexie a také průměrní studenti bez dyslexie a s dyslexií. Simultánní testy v mnohonásobném porovnávání odhalily, že nadaní dyslektici vykazují vyšší potřebu poznání než průměrní studenti bez dyslexie a průměrní dyslektici mají nižší schopnost udržovat pořádek a řád ve vlastních věcech než průměrní studenti bez dyslexie. Výpočet pomocí systému R Data jsou uložena v souboru psychologie.csv. Načteme je pomocí Environment: Environment – Import Dataset – From CSV – Browse – najdeme soubor psychologie.csv – Otevřít – Import. Načtený soubor přejmenujeme: data<-psychologie Proměnnou ID zavedeme jako faktor: data$ID<-factor(data$ID) Zjistíme rozsahy jednotlivých skupin: table(data$ID) nadany dyslektik nadany nedyslektik prumerny dyslektik prumerny nedyslektik 16 40 22 88 Vypočítáme průměry pro nadané dyslektiky, nadané nedyslektiky, průměrné dyslektiky a průměrné nedyslektiky: colMeans(data[data$ID=="nadany dyslektik",4:7]) skoreH skorePS skoreO skoreG 28.6250 22.4375 17.2500 18.0625 colMeans(data[data$ID==" nadany nedyslektik",4:7]) skoreH skorePS skoreO skoreG 27.250 20.000 17.650 3.075 colMeans(data[data$ID=="prumerny dyslektik",4:7]) skoreH skorePS skoreO skoreG 27.636364 20.863636 15.863636 7.318182 colMeans(data[data$ID=="prumerny nedyslektik",4:7]) skoreH skorePS skoreO skoreG 28.2840909 20.8863636 18.5340909 0.1590909 Vypočítáme výběrové varianční matice pro nadané dyslektiky, nadané nedyslektiky, průměrné dyslektiky a průměrné nedyslektiky: var(data[data$ID=='nadany dyslektik',4:7]) skoreH skorePS skoreO skoreG skoreH 13.050000 9.708333 4.566667 11.29167 skorePS 9.708333 26.529167 5.083333 31.83750 skoreO 4.566667 5.083333 10.066667 16.38333 skoreG 11.291667 31.837500 16.383333 200.86250 var(data[data$ID=='nadany nedyslektik',4:7]) skoreH skorePS skoreO skoreG skoreH 23.576923 7.205128 1.346154 42.673077 skorePS 7.205128 20.564103 4.974359 49.769231 skoreO 1.346154 4.974359 9.002564 3.155128 skoreG 42.673077 49.769231 3.155128 415.558333 var(data[data$ID=='prumerny dyslektik',4:7]) skoreH skorePS skoreO skoreG skoreH 7.766234 3.709957 3.567100 -8.926407 skorePS 3.709957 25.075758 3.790043 43.950216 skoreO 3.567100 3.790043 18.599567 -10.287879 skoreG -8.926407 43.950216 -10.287879 324.036797 var(data[data$ID=='prumerny nedyslektik',4:7]) skoreH skorePS skoreO skoreG skoreH 17.3551463 8.814263 0.8005486 27.48302 skorePS 8.8142633 19.619122 4.0498955 40.69645 skoreO 0.8005486 4.049896 8.0907785 15.07497 skoreG 27.4830199 40.696447 15.0749739 365.03187 Nyní pomocí H-Z testu ověříme, zda data pro nadané dyslektiky, nadané nedyslektiky, průměrné dyslektiky a průměrné nedyslektiky pocházejí ze čtyřrozměrného normálního rozložení. HZ.test(data[data$ID=="nadany dyslektik",4:7],qqplot=T) Henze-Zirkler test for Multivariate Normality data : data[data$ID == "nadany dyslektik", 4:7] HZ : 0.7110436 p-value : 0.3241268 Result : Data are multivariate normal (sig.level = 0.05) HZ.test(data[data$ID=="nadany nedyslektik",4:7],qqplot=T) Henze-Zirkler test for Multivariate Normality data : data[data$ID == "nadany nedyslektik", 4:7] HZ : 1.203365 p-value : 0.0003048462 Result : Data are not multivariate normal (sig.level = 0.05) Vidíme, že ve skupině nadaných nedyslektiků je čtyrrozměrná normalita porušena, avšak vzhledem k dostatečně velkému rozsahu této skupiny (40 studentů) budeme s daty pracovat jako by předpoklad normality splňovala. HZ.test(data[data$ID=="prumerny dyslektik",4:7],qqplot=T) Henze-Zirkler test for Multivariate Normality data : data[data$ID == "prumerny dyslektik", 4:7] HZ : 0.5654739 p-value : 0.9008939 Result : Data are multivariate normal (sig.level = 0.05) HZ.test(data[data$ID=="prumerny nedyslektik",4:7],qqplot=T) Henze-Zirkler test for Multivariate Normality data : data[data$ID == "prumerny nedyslektik", 4:7] HZ : 0.7184389 p-value : 0.7915785 Result : Data are multivariate normal (sig.level = 0.05) Kvůli vykreslení krabicových diagramů zavedeme zkrácené označení pro 4 skupiny studentů: data$ID2<-factor(data$ID,labels=c("ND","NnD","PD","PnD")) par(mfrow=c(2,2)) boxplot(data$skoreH ~ data$ID2, ylab='skore H - vedomi vlastni ucinnosti') boxplot(data$skorePS ~ data$ID2, ylab='skore PS - osobni standardy') boxplot(data$skoreO ~ data$ID2, ylab='skore O - organizovanost') boxplot(data$skoreG ~ data$ID2, ylab='skore G - potreba poznavat') K ověření shody variančních matic použijeme Boxův M-test z knihovny biotools: library(biotools) boxM(data[,4:7],grouping=data$ID) Box's M-test for Homogeneity of Covariance Matrices data: data[, 4:7] Chi-Sq (approx.) = 37.137, df = 30, p-value = 0.1732 Ověření linearity vztahů ukážeme jen pro skupinu nadaných dyslektiků. Použijeme k tomu matici dvourozměrných tečkových diagramů: plot(data[data$ID=="nadany dyslektik",4:7]) Po ověření předpokladů sestavíme model MANOVA a postupně vypíšeme výsledky Wilksova, Pillaiova, Hotellingova a Royova testu hypotézy o shodě vektorů středních hodnot: model <- manova(as.matrix(data[4:7]) ~ data$ID) summary(model,test='Wilks') Df Wilks approx F num Df den Df Pr(>F) data$ID 3 0.82122 2.7113 12 420.97 0.001535 ** Residuals 162 --- summary(model,test='Pillai') Df Pillai approx F num Df den Df Pr(>F) data$ID 3 0.18498 2.6449 12 483 0.001932 ** Residuals 162 --- summary(model,test='Hotelling-Lawley') Df Hotelling-Lawley approx F num Df den Df Pr(>F) data$ID 3 0.21022 2.762 12 473 0.001213 ** Residuals 162 --- summary(model,test='Roy') Df Roy approx F num Df den Df Pr(>F) data$ID 3 0.16843 6.7795 4 161 4.554e-05 *** Residuals 162 --- Všechny čtyři testy na hladině významnosti 0,05 zamítají hypotézu o shodě vektorů středních hodnot. Nyní se pomocí simultánních testů založených na Wilksově statistice pokusíme zjistit, které proměnné zapříčiňují rozdíly: > SSB <- summary(model,test='Wilks')$SS[[1]] > SSE <- summary(model,test='Wilks')$SS[[2]] > SST <- SSB + SSE > n <- nrow(data) > k<-4 > r<-4 > const <- (n- (k+r)/2 -1) > K <- -const * log(diag(SSE)/diag(SST)) > K skoreH skorePS skoreO skoreG 2.219678 3.212055 13.099897 12.598135 > kvantil <- qchisq(0.95, df=k*(r-1)) > kvantil [1] 21.02607 Protože se ani jedna ze čtyř statistik nerealizuje v kritickém oboru, musí být rozdíly mezi skupinami způsobeny nějakou lineární kombinací proměnných skoreH, skorePS, skoreO, skoreG. V dalším kroku provedeme vícerozměrnou obdobu mnohonásobného porovnávání, a to tak, že pomocí všech šesti dvouvýběrových Hotellingových T2 -testů porovnáme dvojice vektorů středních hodnot a výsledné p-hodnoty porovnáme s hladinou významnosti korigovanou podle Bonferroniho 0083,0 6 05,0 = . alpha.korig <- 0.05/ choose(r,2) alpha.korig [1] 0.008333333 Výsledek pro dvojici (nadaní dyslektici, nadaní nedyslektici): library(ICSNP) Loading required package: ICS HotellingsT2(data[data$ID2=='ND',4:7], data[data$ID2=='NnD',4:7]) Hotelling's two sample T2-test data: data[data$ID2 == "ND", 4:7] and data[data$ID2 == "NnD", 4:7] T.2 = 1.9804, df1 = 4, df2 = 51, p-value = 0.1115 alternative hypothesis: true location difference is not equal to c(0,0,0,0) Výsledek pro dvojici (nadaní dyslektici, průměrní dyslektici): HotellingsT2(data[data$ID2=='ND',4:7], data[data$ID2=='PD',4:7]) Hotelling's two sample T2-test data: data[data$ID2 == "ND", 4:7] and data[data$ID2 == "PD", 4:7] T.2 = 1.3257, df1 = 4, df2 = 33, p-value = 0.2809 alternative hypothesis: true location difference is not equal to c(0,0,0,0) Výsledek pro dvojici (nadaní dyslektici, průměrní nedyslektici): HotellingsT2(data[data$ID2=='ND',4:7], data[data$ID2=='PnD',4:7]) Hotelling's two sample T2-test data: data[data$ID2 == "ND", 4:7] and data[data$ID2 == "PnD", 4:7] T.2 = 5.1971, df1 = 4, df2 = 99, p-value = 0.0007661 alternative hypothesis: true location difference is not equal to c(0,0,0,0) Výsledek pro dvojici (nadaní nedyslektici, průměrní dyslektici): HotellingsT2(data[data$ID2=='NnD',4:7], data[data$ID2=='PD',4:7]) Hotelling's two sample T2-test data: data[data$ID2 == "NnD", 4:7] and data[data$ID2 == "PD", 4:7] T.2 = 1.2719, df1 = 4, df2 = 57, p-value = 0.2917 alternative hypothesis: true location difference is not equal to c(0,0,0,0) Výsledek pro dvojici (nadaní nedyslektici, průměrní nedyslektici): HotellingsT2(data[data$ID2=='NnD',4:7], data[data$ID2=='PnD',4:7]) Hotelling's two sample T2-test data: data[data$ID2 == "NnD", 4:7] and data[data$ID2 == "PnD", 4:7] T.2 = 1.7332, df1 = 4, df2 = 123, p-value = 0.1469 alternative hypothesis: true location difference is not equal to c(0,0,0,0) Výsledek pro dvojici (průměrní dyslektici, průměrní nedyslektici): HotellingsT2(data[data$ID2=='PD',4:7], data[data$ID2=='PnD',4:7]) Hotelling's two sample T2-test data: data[data$ID2 == "PD", 4:7] and data[data$ID2 == "PnD", 4:7] T.2 = 4.437, df1 = 4, df2 = 105, p-value = 0.002362 alternative hypothesis: true location difference is not equal to c(0,0,0,0) Odlišnost se prokázala u dvojic (nadaní dyslektici, průměrní nedyslektici) a (průměrní dyslektici, průměrní nedyslektici). Nakonec chceme zjistit, které proměnné způsobují rozdíly mezi jednotlivými dvojicemi skupin. K tomu využijeme dvouvýběrový t-test, v němž je ovšem nutné korigovat hladinu významnosti počtem prováděných testů, v našem případě jich je 24. alpha.korig2 <- 0.05 / (k*r*(r-1)/2) alpha.korig2 [1] 0.002083333 Postup ukážeme jen pro proměnnou skoreH a dvojici skupin (nadaný dyslektik, nadaný nedyslektik): Nejprve F-testem ověříme shodu rozptylů: var.test(data$skoreH[data$ID2=='ND'],data$skoreH[data$ID2=='NnD']) F test to compare two variances data: data$skoreH[data$ID2 == "ND"] and data$skoreH[data$ID2 == "NnD"] F = 0.55351, num df = 15, denom df = 39, p-value = 0.2168 alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 0.2525853 1.4333585 sample estimates: ratio of variances 0.5535073 Provedeme dvouvýběrový t-test: t.test(data$skoreH[data$ID2=='ND'],data$skoreH[data$ID2=='NnD'],var.equal = T) Two Sample t-test data: data$skoreH[data$ID2 == "ND"] and data$skoreH[data$ID2 == "NnD"] t = 1.0228, df = 54, p-value = 0.3109 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -1.320141 4.070141 sample estimates: mean of x mean of y 28.625 27.250 Analogicky postupujeme v ostatních případech. Nakonec porovnáním p-hodnot s korigovanou hladinou významnosti 0,0021 zjistíme, že - nadaní dyslektici a průměrní nedyslektici se liší ve skóre G (nadaní dyslektici vykazují vyšší potřebu poznání než průměrní studenti bez dyslexie) - průměrní dyslektici a průměrní nedyslektici se liší ve skóre O (průměrní dyslektici mají nižší schopnost udržovat pořádek a řád ve vlastních věcech než průměrní studenti bez dyslexie).