Osnova přednášky „Jednofaktorová MANOVA“ 1. Popis problému 2. Test hypotézy o shodě vektorů středních hodnot 3. Simultánní testy o složkách vektorů středních hodnot 4. Vícerozměrná obdoba mnohonásobného porovnávání 5. Simultánní testy v mnohonásobném porovnávání 6. Předpoklady v MANOVĚ a jejich ověřování 7. Aplikace MANOVY v psychologickém výzkumu Vícerozměrná analogie analýzy rozptylu jednoduchého třídění (jednofaktorová MANOVA) 1. Popis problému Předpokládáme, že faktor A má 3r ≥ úrovní a přitom na h-té úrovni bylo provedeno hn p-rozměrných pozorování phn1hnp1h11h hh x,,x,,x,,x KKK , která považujeme za realizaci p-rozměrného náhodného výběru rozsahu hn , r,,1h K= . Na každé úrovni faktoru musí být provedeno více pozorování než je závisle proměnných veličin, tj. pnh > , r,,1h K= . Výsledky lze zapsat do tabulky: faktor A výsledky úroveň 1 p11111 x,,x K …………… pn11n1 11 x,,x K ………... …………… úroveň r p1r11r x,,x K …………… prn1rn rr x,,x K Zavedeme následující označení: h … index skupiny, i … index objektu, j … index proměnné ∑ = = h 1r r nn … celkový rozsah všech r výběrů ∑ = = hn 1i hij h hj X n 1 M … výběrový průměr j-té proměnné v h-té skupině, p,,1j K= , r,,1h K=           = hp 1h h M M MM … vektor výběrových průměrů v h-té skupině, r,,1h K= ∑ = = r 1h hh n n 1 MM … vektor celkových průměrů ( )( )∑ = −− − = hn 1i T hhhh h 1n 1 MXMXSh … výběrová varianční matice v h-té skupině, r,,1h K= ( )∑ = − − = r 1h hh 1n rn 1 SS … vážený průměr výběrových variančních matic Příklad dat vhodných pro vícerozměrnou analýzu rozptylu Na 45 vzorcích rudy pocházejících ze tří ložisek byly zjištěny hodnoty těchto čtyř proměnných: X1 … obsah vanadu v popelu (v promile) X2 … obsah železa v popelu (v promile) X3 … obsah nasycených uhlovodíků (v setinách procenta) X4 … obsah aromatických uhlovodíků (v setinách procenta) Máme 3 skupiny, v 1. skupině je 7 čtyřrozměrných pozorování, ve 2. skupině 8 pozorování a ve 3. skupině 30 pozorování. Ukázka části datového souboru: Vektor M1 výběrových průměrů v 1. skupině: 36,571 38,714 679,571 1082,571 Vektor M2 výběrových průměrů ve 2. skupině: 50,6250 35,7500 653,2500 518,1250 Vektor M3 výběrových průměrů ve 3. skupině: 76,5333 21,4667 457,4667 614,8667 Vektor M celkových průměrů: 65,7111 26,6889 526,8222 670,4222 X1 … obsah vanadu v popelu (v promile) X2 … obsah železa v popelu (v promile) X3 … obsah nasycených uhlovodíků (v setinách procenta) X4 … obsah aromatických uhlovodíků (v setinách procenta) Výběrová varianční matice S1 v 1. skupině: Proměnná X1 X2 X3 X4 X1 244,62 2,5238 -1103,55 767,95 X2 2,52 59,2381 28,52 355,19 X3 -1103,55 28,523820002,95 13339,45 X4 767,95 355,190513339,45 51132,95 Výběrová varianční matice S2 ve 2. skupině: Proměnná X1 X2 X3 X4 X1 325,696 -111,393 749,11 3446,9 X2 -111,393 91,357 190,50 -133,5 X3 749,107 190,500 8149,64 26549,0 X4 3446,911 -133,53626548,96 119963,8 Výběrová varianční matice S3 ve 3. skupině: Proměnná X1 X2 X3 X4 X1 223,223 -36,602 -511,292 663,87 X2 -36,602 34,671 267,637 -567,56 X3 -511,292 267,6379071,223 4749,31 X4 663,867 -567,5564749,306 53134,19 Společná výběrová varianční matice S: Proměnná X1 X2 X3 X4 X1 488,62 -160,637 -1934,96 -812,22 X2 -160,64 101,992 958,06 388,52 X3 -1934,96 958,05719900,79 18314,85 X4 -812,22 388,52118314,85 94423,93 X1 … obsah vanadu v popelu (v promile) X2 … obsah železa v popelu (v promile) X3 … obsah nasycených uhlovodíků (v setinách procenta) X4 … obsah aromatických uhlovodíků (v setinách procenta) Celková variabilita obsažená v datech je vyjádřena maticí T: ( )( )∑∑ = = −−= r 1h n 1i T hihi h MXMXT . Matici T lze rozložit na součet dvou matic: BET += , kde E je matice reziduální variability ( )( ) ( )∑∑∑ == = −=−−= r 1h h r 1h n 1i T hhihhi 1n h h SMXMXE a B je matice meziskupinové variability ( )( )∑ = −−= r 1h T hhh n MMMMB . Vliv faktoru, který způsobuje rozpad datové matice na skupiny, se může projevit jen v matici B. Variabilitu projevující se v matici E tedy považujeme za reziduální, způsobenou buď náhodnými vlivy nebo faktory, kterou nejsou z našeho hlediska podstatné. Matice T celkové variability: X1 X2 X3 X4 X1 21499,2 -7068,04 -85138,3 -35738 X2 -7068,0 4487,64 42154,5 17095 X3 -85138,3 42154,51 875634,6 805853 X4 -35737,5 17094,91 805853,44154653 Matice E reziduální variability: X1 X2 X3 X4 X1 10221,1 -1826,1 -16205,0 47988 X2 -1826,1 2000,4 9266,1 -15263 X3 -16205,0 9266,1 440130,7 403609 X4 47988,2 -15262,7 403609,32687436 Matice B meziskupinové variability: X1 X2 X3 X4 X1 11278,1 -5241,94 -68933,3 -83726 X2 -5241,9 2487,24 32888,4 32358 X3 -68933,3 32888,41 435503,9 402244 X4 -83725,7 32357,61 402244,11467217 2. Test hypotézy o shodě vektorů středních hodnot Nadále budeme předpokládat, že náhodný výběr příslušející h-té úrovni faktoru A, tedy posloupnost stochasticky nezávislých p-rozměrných náhodných vektorů hhn1h ,, XX K , pochází z p-rozměrného normálního rozložení ( )Σµ ,N hp , r,,1h K= a jednotlivé náhodné výběry jsou stochasticky nezávislé. Na hladině významnosti α testujeme nulovou hypotézu r10 :H µµ ==K proti alternativní hypotéze :H1 aspoň jedna dvojice vektorů středních hodnot se liší. Při testování této hypotézy můžeme použít až čtyři různé testy založené na - Wilksově kritériu, - Lawleyově – Hotellingově kritériu, - Pillaiově kritériu, - Royově kritériu. Každé z těchto kritérií je určitým způsobem založeno na vlastních číslech matice EB 1− . Označme gλ g-té vlastní číslo této matice a s počet nenulových vlastních čísel, přičemž ( )1r,pmins −= . Uvedeme vzorce pro vyjádření jednotlivých kritérií: Wilksovo kritérium: ( ) ( ) ∏ = λ+ = + =Λ s 1g g1 1 det det BE E , Lawleyovo – Hotellingovo kritérium: ( ) ∑ = − λ== s 1g g 2 trT EB 1 , Pillaiovo kritérium: ( )( ) ∑ = − + =+= s 1g g g1 λ1 λ trP EBB , Royovo kritérium: ( )1V λ= , kde ( )1λ je největší vlastní číslo matice EB 1− . V praxi je nejpoužívanější Wilksovo kritérium. Nabývá hodnot mezi 0 a 1, přičemž vyšší hodnoty znamenají, že střední hodnoty se liší méně. Testová statistika W F pro test shody vektorů středních hodnot vznikne transformací Λ: Λ      − + −−= ln1 2 rp nFW . V případě platnosti nulové hypotézy se statistika W F asymptoticky řídí rozložením ( )( )1rp2 −χ . 0 H tedy zamítáme na asymptotické hladině významnosti α, když tato statistika nabude hodnoty větší nebo rovné α−1 kvantilu uvedeného rozložení, tj. ( )( )1rpF 1 2 W −χ≥ α− . Znamená to, že jsme s rizikem omylu nejvýše %100α prokázali, že alespoň dvě skupiny nemají stejné vektory středních hodnot. 3. Simultánní testy o složkách vektorů středních hodnot Prokážeme-li na zvolené hladině významnosti α rozdíl mezi vektory středních hodnot, budeme dále zjišťovat, které ze sledovaných p kvantitativních proměnných p1 X,,X K způsobují rozdíl mezi skupinami. Provedeme tedy tzv. simultánní testy. Ty odhalí, které jednotlivé proměnné jsou závislé na faktoru A. Současně tedy testujeme p hypotéz r11101 :H µ==µ K , …, pr1pp0 :H µ==µ K . Použijeme testovou statistiku založenou na Wilksově kritériu: jj jj j t e ln1 2 rp nK       − + −−= , kde jj e resp. jj t je j-tý diagonální prvek matice E resp. T, p,,1j K= . V případě platnosti nulové hypotézy se statistika jK asymptoticky řídí rozložením ( )( )1rp2 −χ . j0H tedy zamítáme na asymptotické hladině významnosti α, když ( )( )1rpK 1 2 j −χ≥ α− . Upozornění: Může však nastat situace, kdy hypotéza o shodě vektorů středních hodnot byla na hladině významnosti α zamítnuta, avšak simultánní testy neprokáží žádný rozdíl mezi složkami vektorů středních hodnot. V takovém případě jsou rozdíly mezi skupinami způsobeny nějakou kombinací sledovaných p proměnných. 4. Vícerozměrná obdoba mnohonásobného porovnávání Dalším krokem, který následuje po zamítnutí hypotézy o shodě vektorů středních hodnot, je provedení vícerozměrné obdoby mnohonásobného porovnávání. Chceme totiž zjistit, které dvojice vektorů středních hodnot se liší na zvolené hladině významnosti α. Budeme tedy pro všechny indexy ** hh,r,,1h,h ≠= K testovat hypotézu * hh0 :H µµ = proti * hh1 :H µµ ≠ . Těchto testů je       2 r . Nulovou hypotézu zamítneme na hladině významnosti α, když testová statistika (založená na Lawleyově – Hotellingově kritériu) ( ) ( ) ( )** * * hh 1T hh hh hh nn nn p1r 1prn MMEMM −− + ⋅ − +−− − nabude hodnoty aspoň ( )211 ,F ννα− , kde ( ) ( ) ( )p1r2n prnp1r 1 −−− −−− =ν , 1prn2 +−−=ν . Pak jsme s rizikem omylu nejvýše %100α prokázali, že h-tá a * h -tá skupina nemají stejné vektory středních hodnot. 5. Simultánní testy v mnohonásobném porovnávání Provedení MANOVY uzavřeme tím, že odhalíme případné rozdíly mezi jednotlivými proměnnými v rámci dvojic skupin. Pro všechny indexy * h,h , * hh ≠ a všechny indexy p,,1j K= testujeme na hladině významnosti α hypotézu jhhj0 *µµ:H = proti jhhj1 *µµ:H ≠ . Zajímá nás tedy rozdíl mezi středními hodnotami j-té proměnné v h-té a * h -té skupině. Těchto testů je ( ) 2 1rpr − . Testová statistika má tvar: ( ) 2 j 2 jhhj hh hh S MM nn nn )rn(p)1r( 1prn * * * − ⋅ + ⋅ −− +−− ( 2 j S je j-tý diagonální prvek matice S) . V případě platnosti nulové hypotézy se tato statistika asymptoticky řídí rozložením ( )21 ,F νν , kde ( ) ( ) ( )p1r2n prnp1r 1 −−− −−− =ν , 1prn2 +−−=ν . Hypotézu o shodě j-tých složek vektorů středních hodnot v h-té a * h -té skupině zamítneme na hladině významnosti α, když tato testová statistika nabude hodnoty větší nebo rovné kvantilu ( )211 ,F ννα− . Upozornění: Vícerozměrnou obdobu mnohonásobného porovnávání ani simultánní testy v mnohonásobném porovnávání systém STATISTICA neposkytuje. Problém lze vyřešit tím, že na zvolenou hladinu významnosti α aplikujeme Bonferroniho korekci. V prvém případě (tj. pro vícerozměrnou obdobu mnohonásobného porovnávání) provedeme pro každou dvojici skupin vícerozměrný dvouvýběrový t-test (tj. Hotellingův T2 test) a jeho vypočtenou p-hodnotu porovnáme s číslem       α 2 r . Je-li       α ≤ 2 r p , považujeme rozdíl ve vektorech středních hodnot příslušných dvojic skupin za prokázaný. Ve druhém případě (tj. pro simultánní testy v mnohonásobném porovnávání) provedeme pro každou proměnnou a každou dvojici skupin dvouvýběrový t-test a jeho vypočtenou p-hodnotu porovnáme s číslem ( ) 2 1rpr − α . Je-li ( ) 2 1rpr p − α ≤ , zamítáme hypotézu o shodě středních hodnot příslušné proměnné v daných dvou skupinách. 6. Předpoklady v MANOVĚ a jejich ověřování Vícerozměrná normalita: V každé z r skupin bychom měli testovat hypotézu, že vektor proměnných ( p1 X,,X K )T se řídí p-rozměrným normálním rozložením. Testy na vícerozměrnou normalitu však nejsou běžnou součástí statistických programových systémů. V praxi se spokojíme s tím, že otestujeme normalitu pro každou jednotlivou proměnnou zvlášť. Výsledky těchto testů však posuzujeme jen orientačně. Menší odchylky od normality nebrání provedení MANOVY, při větším porušení používáme vhodné transformace. Shoda variančních matic: Je-li třídění vyvážené, tj. ve všech skupinách je stejný počet pozorování, je MANOVA odolná vůči porušení předpokladu shody variančních matic. V případě nevyváženého třídění je nutné provést Boxův test shody variančních matic. Na hladině významnosti α testujeme hypotézu r10 :H ΣΣ ==K proti alternativní hypotéze :H1 aspoň jedna dvojice variančních matic se liší. Testová statistika má tvar: ( ) ( )     −−−= ∑ = r 1h hh p 0 ln1nlnrn C 1 T SS , kde ( )( )       − − −+− −+ += ∑ = rn 1 1n 1 1p1r6 1p3p2 1C r 1h h 2 p je konstanta zlepšující aproximaci. V případě platnosti nulové hypotézy se statistika 0 T asymptoticky řídí rozložením ( ) ( )       +− χ 2 1pp1r2 . Pokud testová statistika nabude hodnoty aspoň ( ) ( )       +− χ α− 2 1pp1r 1 2 , hypotézu o shodě variančních matic zamítneme na asymptotické hladině významnosti α. Linearita vztahů: Vzhledem k tomu, že MANOVA patří do skupiny obecných lineárních modelů, předpokládá se, že v každé skupině existuje mezi závisle proměnnými veličinami přibližně lineární vztah. Tento předpoklad lze orientačně ověřit pomocí dvourozměrných tečkových diagramů. Výskyt nelineárních vztahů snižuje sílu testů v MANOVĚ. 7. Aplikace MANOVY v psychologickém výzkumu Informace o projektu „Výkonová motivace rozumově nadaných studentů s dyslexií“ Institut výzkumu dětí, mládeže a rodiny je součástí Fakulty sociálních studií Masarykovy univerzity. Vědecká činnost tohoto institutu je zaměřena na sledování psychických a sociálních charakteristik dětí, adolescentů a jejich rodin. V nedávné minulosti zde mj. řešili projekt „Výkonová motivace rozumově nadaných studentů s dyslexií – základní determinanty v období adolescence a časné dospělosti“. Tento projekt se zaměřoval na problematiku mimořádně nadaných adolescentů a mladých dospělých se souběžnou vývojovou poruchou učení – s dyslexií. Podle současných poznatků je právě tato skupina nadaných studentů ve značně znevýhodňující vzdělávací pozici, která jí často znemožňuje dosahovat úspěchů ve škole i v životě. Hlavním cílem projektu bylo sledování klíčových proměnných, které mohou být zodpovědné za tento stav. V rámci projektu byly vyšetřeny řádově stovky studentů. Zaměříme se na data o 166 studentech bez dyslexie a s diagnostikovanou dyslexií, u nichž byla změřena inteligence Ravenovým testem (maximální skóre je 60 bodů, za nadané jsou považováni studenti se skóre aspoň 56 bodů) a kteří vyplnili dotazník zaměřený na tyto aspekty: - vědomí vlastní účinnosti (přesvědčení jedince, že dokáže úspěšně realizovat chování, které je potřebné k dosažení specifických cílů), výsledky jsou zaznamenány v proměnné skóre H, která může nabývat hodnot od 10 do 40; - osobní standardy (tendence dávat si vysoké cíle a hodnotit se v závislosti na jejich dosažení), výsledky jsou obsaženy v proměnné skóre PS, minimální hodnota může být 7, maximální 35; - organizovanost (ukazuje na schopnost udržovat pořádek a řád ve vlastních věcech), výsledky jsou shrnuty v proměnné skóre O, může nabývat hodnot mezi 6 až 30; - potřeba poznávat, výsledky jsou zaznamenány v proměnné skóre G, která se může pohybovat v mezích -64 až 64. Poznámka k Ravenovu testu: Základem testu jsou matice diagramů 3 x 3, do které se doplňuje chybějící diagram ve třetí řadě na základě logických souvislostí. Podstatou tohoto testu je měření obecné intelektuální schopnosti pracovat s abstraktními pojmy. Ukázka Ravenovy matice: Celý výzkumný soubor 166 studentů je rozčleněn na čtyři skupiny: - nadaní studenti s dyslexií (n1 = 16, označení ND), - nadaní studenti bez dyslexie (n2 = 40, označení NnD), - průměrní studenti s dyslexií (n3 = 22, označení PD), - průměrní studenti bez dyslexie (n4 = 88, označení PnD). Metodami MANOVY zjistíme, zda na hladině významnosti 0,05 existují významné rozdíly mezi uvedenými čtyřmi skupinami studentů a identifikujeme proměnné, které tyto rozdíly způsobují. Ukázka části datového souboru: Posouzení úrovně a variability sledovaných proměnných v daných čtyřech skupinách: Souhrnné výsledky Popisné statistiky (psychologie.sta) Proměnná ID N platných Průměr Sm.odch. skoreH skorePS skoreO skoreG skoreH skorePS skoreO skoreG skoreH skorePS skoreO skoreG skoreH skorePS skoreO skoreG nadany dyslektik 16 28,62500 3,61248 nadany dyslektik 16 22,43750 5,15065 nadany dyslektik 16 17,25000 3,17280 nadany dyslektik 16 18,06250 14,17260 nadany nedyslektik 40 27,25000 4,85561 nadany nedyslektik 40 20,00000 4,53477 nadany nedyslektik 40 17,65000 3,00043 nadany nedyslektik 40 3,07500 20,38525 prumerny dyslektik 22 27,63636 2,78680 prumerny dyslektik 22 20,86364 5,00757 prumerny dyslektik 22 15,86364 4,31272 prumerny dyslektik 22 7,31818 18,00102 prumerny nedyslektik 88 28,28409 4,16595 prumerny nedyslektik 88 20,88636 4,42935 prumerny nedyslektik 88 18,53409 2,84443 prumerny nedyslektik 88 0,15909 19,10581 Průměry proměnných skóre H a skóre PS se u různých skupin příliš neliší. Průměr skóre O je poněkud nižší ve skupině průměrných dyslektiků. Největší rozdíly mezi průměry jsou pozorovatelné u skóre G, kde se velmi výrazně odlišují nadaní dyslektici a průměrní studenti bez dyslexie. Z hlediska variability se nejvyrovnanější jeví průměrní dyslektici ve vědomí vlastní účinnosti (skóre H), naopak největší proměnlivost pozorujeme u nadaných nedyslektiků v potřebě poznání (skóre G). Výpočty doplníme krabicovými grafy: Krabicový graf z více proměnných seskupený ID psychologie.sta 7v*166c Průměr; Krabice: Průměr±SmOdch; Svorka: Min-Max skoreH skorePS skoreO skoreG nadany dyslektik nadany nedyslektik prumerny dyslektik prumerny nedyslektik ID -60 -40 -20 0 20 40 60 Ověření předpokladů MANOVY Normalita: Nejprve pomocí S-W testu ověříme předpoklad o normalitě rozložení proměnných skóre H, skóre PS, skóre O, skóre G ve všech čtyřech skupinách. Souhrnné výsledky Testy normality (psychologie.sta) Proměnná ID N W p skoreH skorePS skoreO skoreG skoreH skorePS skoreO skoreG skoreH skorePS skoreO skoreG skoreH skorePS skoreO skoreG nadany dyslektik 16 0,943706 0,396906 nadany dyslektik 16 0,920708 0,173164 nadany dyslektik 16 0,974538 0,905670 nadany dyslektik 16 0,984604 0,989658 nadany nedyslektik 40 0,981282 0,736977 nadany nedyslektik 40 0,947461 0,062032 nadany nedyslektik 40 0,950792 0,080743 nadany nedyslektik 40 0,927833 0,013694 prumerny dyslektik 22 0,981058 0,931731 prumerny dyslektik 22 0,979518 0,908287 prumerny dyslektik 22 0,979293 0,904593 prumerny dyslektik 22 0,960403 0,497479 prumerny nedyslektik 88 0,983965 0,350405 prumerny nedyslektik 88 0,971554 0,049792 prumerny nedyslektik 88 0,968818 0,032215 prumerny nedyslektik 88 0,989775 0,728066 S-W test zamítá na hladině významnosti 0,05 hypotézu o normalitě skóre G u nadaných nedyslektiků a dále zamítá hypotézu o normalitě skóre PS a skóre O u průměrných nedyslektiků. Normalita je však porušena jen mírně. Nedopustíme se závažné chyby, budeme-li předpokládat, že každá ze čtyř částí datové matice je realizací výběru ze čtyřrozměrného normálního rozložení. Shoda variančních matic Hypotézu o shodě variančních matic otestujeme Boxovým testem. Boxův M test (psychologie.sta) Efekt: ID (Vypočteno pro všechny proměnné) Boxovo M Chí-kv. sv p Boxovo M 39,90594 37,13662 30 0,173196 Test shody čtyř variančních matic poskytl p-hodnotu 0,1732, tedy nadále budeme varianční matice považovat za shodné. Linearita vztahů Linearitu vztahů mezi sledovanými proměnnými v daných čtyřech skupinách orientačně posoudíme pomocí tečkových diagramů. Uvedeme zde výsledky jen pro skupinu průměrných dyslektiků, neboť vzhled tečkových diagramů v ostatních skupinách je podobný: Maticový graf psychologie.sta 7v*166c Zahrnout jestliže: ID=3 skoreH skorePSskoreO skoreO skoreG skoreG skoreH skorePS skoreO skoreG Výrazné nelinearity se zde neprojevují. Důležité předpoklady MANOVY jsou splněny. Testování hypotézy o shodě vektorů středních hodnot Nyní provedeme Wilksův, Pillaiův, Hotellingův a Royův test hypotézy o shodě vektorů středních hodnot. Vícerozměrné testy významnosti (psychologie.sta) Sigma-omezená parametrizace Dekompozice efektivní hypotézy Efekt Test hodnota F Efekt sv Chyba sv p Abs. člen ID Wilksův 0,01865 2091,936 4 159,0000 0,000000 Pillaiův 0,98135 2091,936 4 159,0000 0,000000 Hotellng 52,62732 2091,936 4 159,0000 0,000000 Royův 52,62732 2091,936 4 159,0000 0,000000 Wilksův 0,82122 2,711 12 420,9660 0,001535 Pillaiův 0,18498 2,645 12 483,0000 0,001932 Hotellng 0,21022 2,762 12 473,0000 0,001213 Royův 0,16843 6,779 4 161,0000 0,000046 Všechny čtyři testy zamítají na hladině významnosti 0,05 hypotézu, že střední hodnoty proměnných skóre H, skóre PS, skóre O, skóre G jsou ve všech čtyřech skupinách shodné. S rizikem omylu nejvýše 5 % jsme tedy prokázali, že aspoň mezi dvěma skupinami studentů existuje rozdíl z hlediska sledovaných psychologických skóre. Simultánní testy o složkách vektorů středních hodnot Dále se pomocí simultánních testů pokusíme odhalit, které proměnné způsobují rozdíly mezi skupinami studentů. 1 K1 2 K2 3 K3 4 K4 5 kvantil 1 2,21966888 3,21204257 13,0998874 12,5981213 21,0260698 Vidíme, že ani jedna ze čtyř statistik se nerealizuje v kritickém oboru. Vzhledem k tomu, že hypotéza o shodě vektorů středních hodnot byla na hladině významnosti 0,05 zamítnuta, ale simultánní testy jsou nevýznamné, musí být rozdíly mezi skupinami zapříčiněny nějakou lineární kombinací sledovaných čtyř proměnných. Vícerozměrná obdoba mnohonásobného porovnávání Nyní zjistíme, mezi kterými dvojicemi skupin existuje onen významný rozdíl, který byl odhalen při testování hypotézy o shodě vektorů středních hodnot. Vícerozměrnou obdobu mnohonásobného porovnávání STATISTICA neposkytuje. Problém vyřešíme tak, že provedeme všech šest porovnání (1-2, 1-3, 1-4, 2-3, 2-4, 3-4) pomocí Hotellingova T2 testu a získané p-hodnoty porovnáme s hladinou významnosti korigovanou podle Bonferroniho, tj. s číslem 3008,0 6 05,0 2 4 2 r ==      α=      α . Výsledek pro 1. a 2. skupinu: t-testy; grupováno: ID (psychologie.sta) Skup. 1: nadany dyslektik; Skup. 2: nadany nedyslektik Hotellingovo 8,38772 F(4,51)=1,9804 p<,11150 Vypočtenou p-hodnotu (tj. 0,11150) porovnáme s 3008,0 . Vidíme, že nadaní dyslektici a nadaní nedyslektici se neliší. -------------------------------------------------------------------------------------------------------------------- Výsledek pro 1. a 3. skupinu: t-testy; grupováno: ID (psychologie.sta) Skup. 1: nadany dyslektik; Skup. 2: prumerny dyslektik Hotellingovo 5,78503 F(4,33)=1,3257 p<,28093 Protože p-hodnota 0,28093 je větší než 3008,0 , můžeme konstatovat, že nadaní dyslektici a průměrní dyslektici se neliší. -------------------------------------------------------------------------------------------------------------------- Výsledek pro 1. a 4. skupinu: t-testy; grupováno: ID (psychologie.sta) Skup. 1: nadany dyslektik; Skup. 2: prumerny nedyslektik Hotellingovo 21,4183 F(4,99)=5,1971 p<,00077 V tomto případě vidíme, že nadaní dyslektici a průměrní nedyslektici se liší: 3008,000077,0 ≤ -------------------------------------------------------------------------------------------------------------------- Výsledek pro 2. a 3. skupinu: t-testy; grupováno: ID (psychologie.sta) Skup. 1: nadany nedyslektik; Skup. 2: prumerny dyslektik Hotellingovo 5,35556 F(4,57)=1,2719 p<,29168 Při srovnání nadaných nedyslektiků a průměrných dyslektiků nebyly odlišnosti zjištěny, protože příslušná p-hodnota (0,28168) je větší než 3008,0 . -------------------------------------------------------------------------------------------------------------------- Výsledek pro 2. a 4. skupinu: t-testy; grupováno: ID (psychologie.sta) Skup. 1: nadany nedyslektik; Skup. 2: prumerny nedyslektik Hotellingovo 7,10202 F(4,123)=1,7332 p<,14690 Nadaní a průměrní nedyslektici se neliší na hladině významnosti 0,05. Výsledek pro 3. a 4. skupinu: -------------------------------------------------------------------------------------------------------------------- t-testy; grupováno: ID (psychologie.sta) Skup. 1: prumerny dyslektik; Skup. 2: prumerny nedyslektik Hotellingovo 18,2551 F(4,105)=4,4370 p<,00236 Zde jsme prokázali, že s rizikem omylu nejvýše 5 % se liší průměrní dyslektici a nedyslektici. -------------------------------------------------------------------------------------------------------------------- Simultánní testy v mnohonásobném porovnávání Pro každou proměnnou provedeme dvouvýběrový t-test, abychom ji porovnali ve dvojicích skupin 1-2, 1-3, 2-3, 2-4, 3-4 a zjistíme, zda vypočtené p-hodnoty jsou menší nebo rovny korigované hladině významnosti ( ) 0021,02405,0 2 1rpr == − α . Vypočtené p-hodnoty máme v tabulce: skóre H skóre PS skóre O skóre G ND x NnD 0,3109 0,0861 0,6592 0,0096 ND x PD 0,3469 0,3508 0,2839 0,0554 ND x PnD 0,7597 0,2118 0,1058 0,0006 NnD x PD 0,7330 0,4920 0,0604 0,4176 NnD x PnD 0,2191 0,2996 0,1116 0,4347 PD x PnD 0,4914 0,9833 0,0006 0,1149 Na základě této tabulky můžeme konstatovat, že: - nadaní dyslektici a průměrní nedyslektici se liší ve skóre G (nadaní dyslektici vykazují vyšší potřebu poznání než průměrní studenti bez dyslexie) - průměrní dyslektici a průměrní nedyslektici se liší ve skóre O (průměrní dyslektici mají nižší schopnost udržovat pořádek a řád ve vlastních věcech než průměrní studenti bez dyslexie). Grafické znázornění rozdílů mezi sledovanými proměnnými v rámci čtyř skupin studentů: Graf průměru z více proměnných seskupený ID psychologie.sta 7v*166c Průměr; Svorka: Průměr±0,95 Int. spolehl. skoreH skorePS skoreO skoreG nadany dyslektik nadany nedyslektik prumerny dyslektik prumerny nedyslektik ID -10 -5 0 5 10 15 20 25 30 35 Závěr: Test hypotézy o shodě vektorů středních hodnot prokázal, že s rizikem omylu nejvýše 5 % existují odlišnosti mezi čtyřmi skupinami studentů z hlediska vědomí vlastní účinnosti, osobních standardů, organizovanosti a potřeby poznávání. Simultánní testy o složkách vektorů středních hodnot ukázaly, že rozdíly mezi skupinami jsou zapříčiněny nějakou lineární kombinací sledovaných čtyř proměnných. Pomocí vícerozměrné analogie mnohonásobného porovnávání jsme zjistili, že se odlišují nadaní dyslektici a průměrní studenti bez dyslexie a také průměrní studenti bez dyslexie a s dyslexií. Simultánní testy v mnohonásobném porovnávání odhalily, že nadaní dyslektici vykazují vyšší potřebu poznání než průměrní studenti bez dyslexie a průměrní dyslektici mají nižší schopnost udržovat pořádek a řád ve vlastních věcech než průměrní studenti bez dyslexie.