Provedení jednofaktorové analýzy rozptylu pomocí modulu ANOVA Popis problému: V roce 1997 dostalo ministerstvo školství za úkol připravit nové podklady pro testování dětí při zařazování do zvláštních škol. V první fázi došlo ke standardizaci testu WISC- III, což je celosvětově nejužívanější test inteligence pro děti. Má 13 subtestů: Doplňování obrázků Vědomosti Kódování Podobnosti Řazení obrázků Počty Kostky Slovník Skládanky Porozumění Hledání symbolů Opakování čísel Bludiště Počet správných odpovědí v každém subtestu (tj. hrubé skóre) se podle tabulek norem převede na vážené skóre. Ze součtu vážených skóre se v převodních tabulkách odečte vážené skóre IQ. Zjišťuje se verbální IQ, performační IQ, celkové IQ a čtyři faktorově založené indexové skóry: slovní porozumění (IQ_F1), percepční uspořádání (IQ_F2), koncentrovanost (IQ_F3) a rychlost zpracování (IQ_F4). Celkové IQ má průměr 100, směrodatnou odchylku 15 a řídí se normálním rozložením. Samotné testování souboru 1455 dětí ve věku 6 – 16 let proběhlo v březnu a dubnu r. 2000 na základních školách ve 35 okresech a provedlo ho 130 pracovníků okresních pedagogicko – psychologických poraden. BO KI FM SUPS KV BV UH BK TR CB NA CLUL PM RA SO CK PI ST TC ZLBM OP OCPB PZ HB KH BN AB PU RK TU MB Charakteristiky výběrového souboru – pohlaví a národnost Pohlaví Národnost CH D CZ ROMVěk N n % n % n % n % 6 132 63 47,7 69 52,3 125 94,7 7 5,3 7 132 68 51,5 64 48,5 125 94,7 7 5,3 8 129 62 48,1 67 51,9 122 94,6 7 5,4 9 135 68 50,4 67 49,6 126 93,3 9 6,7 10 131 67 51,1 64 48,9 122 93,1 9 6,9 11 128 64 50,0 64 50,0 119 93,0 9 7,0 12 137 71 51,8 66 48,2 130 94,9 7 5,1 13 135 70 51,9 65 48,1 126 93,3 9 6,7 14 146 73 50 73 50 137 93,8 9 6,2 15 125 62 49,6 63 50,4 116 92,8 9 7,2 16 125 63 50,4 62 49,6 118 94,4 7 5,6 SUM 1455 731 50,2 724 49,8 1366 93,9 89 6,1 Legenda: CH … chlapci, D … dívky CZ … děti a dospívající z většinové populace, ROM … děti a dospívající, příslušníci romské komunity Charakteristiky výběrového souboru – sídlo a typ školy Sídlo Typ školy M > 8 tis, V < 8 tis, MŠ ZŠ ZvŠ SŠ UČVěk N n % n % procento četnosti 6 132 77 58,2 55 41,8 18,3 80,2 1,5 7 132 73 55,6 59 44,4 96,9 3,1 8 129 83 64,2 46 35,8 97,7 2,3 9 135 73 53,8 62 46,2 97,0 3,0 10 131 72 60,0 79 40,0 97,0 3,0 11 128 65 54,2 69 45,8 90,6 2,4 7,0 12 137 92 66,9 45 33,1 92,7 2,9 4,4 13 135 71 52,9 64 47,1 85,6 3,0 11,3 14 146 88 60,2 58 39,8 93,0 2,8 4,2 15 125 71 56,9 54 43,1 71,0 3,2 25,8 16 125 98 78,6 27 21,4 8,9 2,4 52,8 35,8 SUM 1455 874 60,1 581 39,9 1,7 83,2 2,7 9,4 3,0 Legenda: M>8tis - probandi ze sídel větších než 8.000 obyvatel V<8tis - probandi ze sídel menších než 8.000 obyvatel MŠ - děti navštěvující mateřskou školu, ZŠ - základní školu, ZvŠ - zvláštní školu SŠ - studenti gymnázií a středních odborných škol UČ - studenti integrovaných střeních škol, středních odborných učilišť a odborných učilišť Kolísání intelektové výkonnosti v průběhu pracovního týdne Stejně jako jiné fyziologické a psychologické charakteristiky vykazuje intelektová výkonnost kolísání v čase. Zde se zaměříme na kolísání v průběhu pracovního týdne. Údaj o tom, ve kterém dnu týdne bylo vyšetření provedeno, byl zaznamenán u 1431 dětí. Data, kterými se budeme zabývat, jsou uložena v souboru kolisani_IQ_v_tydnu.sta. Nejprve zjistíme průměry IQ_celk v jednotlivých dnech týdne: Statistika – ANOVA – Jednofaktorová ANOVA – OK – Proměnné – Seznam závislých proměnných IQ_celk, Kategor. Nezávislá proměnná DEN – OK – Záložka Průměry – Pozorované, nevážené. DEN; Nevážené průměry (kolisani_IQ_v_tydnu.sta) Současný efekt: F(4, 1426)=2,6518, p=,03177 Dekompozice efektivní hypotézy Č. buňky DEN IQ_CELK Průměr IQ_CELK Sm.Ch. IQ_CELK -95,00% IQ_CELK +95,00% N 1 2 3 4 5 pondělí 101,6149 0,846460 99,95445 103,2753 309 úterý 100,6908 0,853392 99,01675 102,3648 304 středa 99,0114 0,915764 97,21497 100,8078 264 čtvrtek 100,3495 0,820328 98,74036 101,9587 329 pátek 97,7867 0,991960 95,84081 99,7325 225 Vidíme, že nejlepší výsledky jsou dosahovány v pondělí, nejhorší v pátek. Grafické znázornění: Na záložce Průměry, Pozorované nevážené zvolíme Graf. DEN; Průměry MNČ Současný efekt: F(4, 1426)=2,6518, p=,03177 Dekompozice efektivní hypotézy Vertikální sloupce označují 0,95 intervaly spolehlivosti 1 2 3 4 5 DEN 95 96 97 98 99 100 101 102 103 104 105 IQ_CELK Nyní ověříme předpoklady pro provedení analýzy rozptylu: Vrátíme se do ANOVA Výsledky, zvolíme Více výsledků, záložka Předpoklady. Ověříme normalitu proměnné IQ_celk pro jednotlivé dny v týdnu: Rozdělení prom. Uvnitř skupin – Norm. p-graf – Vyberte skupiny 1 až 5. Dostaneme 5 N-P grafů, které nesignalizují výraznější porušení normality. Pokud bychom chtěli testovat normalitu pomocí S-W testu, klikneme na pozadí N-P grafu a v okně, které se otevře, zvolíme Statistika a zaškrtneme Shapiro – Wilkův test. Zjistíme, že na hladině významnosti 0,05 je porušena normalita proměnné IQ_celk pouze v pondělí, ve všech ostatních případech je p-hodnota S-W testu větší než 0,05. Dále ověříme homogenitu rozptylů: Na záložce Předpoklady vybereme Levenův test. Leveneův test homogenity rozptylů (kolisani_IQ_v_tydnu.sta) Efekt: DEN Stupně volnosti pro všechna F: 4, 1426 PČ Efekt PČ Chyba F p IQ_CELK 36,24704 80,22983 0,451790 0,771150 Na hladině významnosti 0,05 nelze zamítnout hypotézu o shodě rozptylů v daných pěti skupinách. Dále provedeme test hypotézy o shodě středních hodnot: Vrátíme se do ANOVA, Výsledky – na záložce Detaily zvolíme Test všech efektů. Jednorozměrné testy významnosti pro IQ_CELK (kolisani_IQ_v_tydnu.sta) Sigma-omezená parametrizace Dekompozice efektivní hypotézy Efekt SČ Stupně volnosti PČ F p Abs. člen DEN Chyba 14016168 1 14016168 63307,95 0,000000 2348 4 587 2,65 0,031774 315712 1426 221 Testová statistika FA nabývá hodnoty 2,65, počet stupňů volnosti čitatele je 4, jmenovatele 1426, odpovídající p-hodnota je 0,0318, tedy na hladině významnosti 0,05 zamítáme hypotézu o shodě středních hodnot proměnné IQ_celk. S rizikem omylu nejvýše 5 % jsme tedy prokázali, že aspoň jedna dvojice dnů v týdnu se liší z hlediska intelektové výkonnosti. Pomocí poměru determinace posoudíme, jak velký vliv na IQ_celk má den v týdnu. 0074,0 2348315712 2348 S S P T A2 = + == Poměr determinace získáme v ANOVA Výsledky na záložce Detaily – Celkové R. Test SČ celého modelu vs. SČ reziduí (kolisani_IQ_v_tydnu.sta) Závislá proměnné Vícenás. R Vícenás. R2 Upravené R2 SČ Model SV Model PČ Model SČ Rezid. SV Rezid. PČ Rezid. F p IQ_CELK 0,085928 0,007384 0,004599 2348,413 4 587,1034 315711,6 1426 221,3967 2,651817 0,031774 Poměr determinace najdeme ve sloupci Vícenás. R2. Mnohonásobné porovnávání provedeme na záložce Post – hoc. Vybereme HSD nestejné N. HSD při nestejných N; proměnná IQ_CELK (kolisani_IQ_v_tydnu.sta) Přibližné pravděpodobnosti pro post hoc testy Chyba: meziskup. PČ = 221,40, sv = 1426,0 Č. buňky DEN {1} 101,61 {2} 100,69 {3} 99,011 {4} 100,35 {5} 97,787 1 2 3 4 5 pondělí 0,940419 0,260904 0,828467 0,049856 úterý 0,940419 0,693243 0,998605 0,233079 středa 0,260904 0,693243 0,839999 0,906869 čtvrtek 0,828467 0,998605 0,839999 0,357902 pátek 0,049856 0,233079 0,906869 0,357902 Vidíme, že na hladině významnosti 0,05 se liší pondělí a pátek. Dále můžeme stanovit homogenní skupiny dnů podle Tukeyovy HSD metody. Homogenní skupiny nás informují o tom, které výběry by mohly být považovány za výběry z téhož rozložení (jsou tedy rovnocenné z hlediska vlivu sledovaného faktoru). V ANOVA Výsledky na záložce Pos - hoc vybereme Zobrazit Homogenní skupiny - HSD nestejné N. Č. buňky DEN IQ_CELK Průměr 1 2 5 3 4 2 1 pátek 97,7867 **** středa 99,0114 **** **** čtvrtek 100,3495 **** **** úterý 100,6908 **** **** pondělí 101,6149 **** První skupina – dny s horšími výkony. Druhá skupina – dny s lepšími výkony. Pátek – den s nejhorším výkonem. Pondělí – den s nejlepším výkonem. Úterý, středa, čtvrtek – dny s neutrálními výkony. Prozkoumáme chování reziduí: Návrat do ANOVA Výsledky – Rezidua – Pravděp. graf reziduí Normální p-graf; Čistá rezidua Závislá proměnná: IQ_CELK (Analyzovaný vzorek) -80 -60 -40 -20 0 20 40 60 80 Rezid. -4 -3 -2 -1 0 1 2 3 4 Oček.normál.hodnota ,01 ,05 ,15 ,35 ,65 ,85 ,95 ,99 Normální pravděpodobnostní graf reziduí svědčí o tom, že rezidua se řídí normálním rozložením. Návrat do ANOVA Výsledky – Rezidua – Před. & rezidua Předpovězené vs. reziduální hodnoty Závislá proměnná: IQ_CELK (Analyzovaný vzorek) 97,0 97,5 98,0 98,5 99,0 99,5 100,0 100,5 101,0 101,5 102,0 Předpov. hodnoty -80 -60 -40 -20 0 20 40 60 80 Čistárezidua V grafu není patrný žádný trend. Na závěr znázorníme data pomocí krabicových diagramů. Grafy – 2D Grafy – Krabicové grafy – Závisle proměnné IQ_celk, Grupovací prom. DEN – OK – OK. Krabicový graf z IQ_CELK seskupený DEN kolisani_IQ_v_tydnu.sta 2v*1442c Medián 25%-75% Rozsah neodleh. Odlehlé Extrémy pondělí úterý středa čtvrtek pátek DEN 40 60 80 100 120 140 160 IQ_CELK Analýza rozptylu dvojného třídění Zkoumáme vliv dvou faktorů A a B na závisle proměnnou veličinu X. Např. zjišťujeme, zda výnosy určité plodiny (náhodná veličina X) jsou ovlivněny typem půdy (faktor A – řádkový faktor) a způsobem hnojení (faktor B – sloupcový faktor). Předpokládáme, že faktor A má a úrovní (tj. počet typů půdy) a faktor B má b úrovní (tj. počet způsobů hnojení). Přitom máme nij pokusů takových, že na i-tém typu půdy byl použit j-tý způsob hnojení. Výsledky (tzn. výnosy dané plodiny) těchto nij pokusů označíme ijijn2ij1ij X,...,X,X . Omezíme se na případy, kdy počet pozorování nij = c ≥ 1 (jde o tzv. vyvážené třídění). Výsledky lze zapsat do tabulky: faktor B 1 2 ... b 1 X111, …, X11c X121, …, X12c … X1b1, …, X1bc 2 X211, …, X21c X221, …, X22c … X2b1, …, X2bc M M M … M faktorA a Xa11, …, Xa1c Xa21, …, Xa2c … Xab1, …, Xabc Analogicky jako u analýzy rozptylu jednoduchého třídění předpokládáme, že data se řídí normálním rozložením, tj. ijc2ij1ij X,...,X,X ~ N(µij,σ2 ), i = 1, …, a, j = 1, …, b a jednotlivé náhodné výběry jsou stochasticky nezávislé. Model můžeme zapsat ve tvaru: Xijk = µij + εijk, kde εijk jsou stochasticky nezávislé náhodné veličiny s rozložením N(0, σ2 ). Zajímá nás, zda všechny střední hodnoty jsou stejné. Přístup k problému se liší podle toho, zda faktory A, B jsou nezávislé (pak se jedná o analýzu rozptylu dvojného třídění bez interakcí) nebo se mohou nějakým způsobem ovlivňovat (jde o analýzu rozptylu dvojného třídění s interakcemi). Označení ...... a 1i b 1j c 1k ijk... ..i..i b 1j c 1k ijk..i .ij.ij c 1k ijk.ij X n 1 M ,XX ,X bc 1 M ,XX ,X c 1 M ,XX ,abcn = = = = = = = ∑∑∑ ∑∑ ∑ = = = = = = Analogické označení zavedeme i pro jiné kombinace indexů. Dvojné třídění bez interakcí Předpokládáme, že řádkový faktor A a sloupcový faktor B se neovlivňují (např. to znamená, že každý ze čtyř způsobů hnojení působí stejně na každém ze tří druhů půdy). Náhodné veličiny Xijk se řídí modelem M0: Xijk = µ + αi + βj + εijk pro i = 1, …, a, j = 1, …, b, k = 1, …, c, přičemž εijk jsou stochasticky nezávislé náhodné veličiny s rozložením N(0, σ2 ), µ je společná část střední hodnoty závisle proměnné veličiny, αi je efekt faktoru A na úrovni i, βj je efekt faktoru B na úrovni j. Parametry µ, αi, βj neznáme. Požadujeme, aby platily tzv. reparametrizační rovnice: 0,0 b 1j j a 1i i =β=α ∑∑ == . Podobně jako v analýze rozptylu jednoduchého třídění se počítají součty čtverců. ( )∑∑∑ = = = −= a 1i b 1j c 1k 2 ...ijkT MXS … celkový součet čtverců, počet stupňů volnosti fT = n – 1, ( )∑ = −= a 1i 2 .....iA MMbcS … součet čtverců pro řádkový faktor A, počet stupňů volnosti fA = a – 1, ( )∑ = −= b 1j 2 ....j.B MMacS … součet čtverců pro sloupcový faktor B, počet stupňů volnosti fB = b – 1, ( )∑∑∑ = = = −= a 1i b 1j c 1k 2 .ijijkE MXS … reziduální součet čtverců, počet stupňů volnosti fE = n – a – b + 1. Lze dokázat, že ST = SA + SB + SE. Celkový průměr ...M … bodový odhad střední hodnoty µ, sčítanec .....i MM − … bodový odhad efektu αi (tj. působení řádkového faktoru A na úrovni i), sčítanec ....j. MM − … bodový odhady efektu βj (tj. působení sloupcového faktoru B na úrovni j) Odhad ijkXˆ pozorování ijkX má tedy tvar: ( ) ( )....j......i...ijk MMMMMXˆ −+−+= . Pokud by nezáleželo na sloupcovém faktoru B, platila by hypotéza β1 = … = βb = 0 a místo modelu M0: Xijk = µ + αi + βj + εijk bychom dostali model M1: Xijk = µ + αi + εijk Platnost uvedené hypotézy ověřujeme pomocí testové statistiky EE BB B f/S f/S F = , která se řídí rozložením F(b-1,n-a-b+1), je-li model M1 správný. Hypotézu o nevýznamnosti sloupcového faktoru tedy zamítneme na hladině významnosti α, když platí: FB ≥ F1-α(b-1,n-a-b+1). Kdyby nezáleželo ani na řádkovém faktoru, platila by hypotéza α1 = … = αa = 0 a dostali bychom model M2: Xijk = µ + εijk Rozdíl mezi modely M1: Xijk = µ + αi + εijk a M2: Xijk = µ + εijk ověřujeme pomocí testové statistiky EE AA A f/S f/S F = , která se řídí rozložením F(a-1, n-a-b+1), je-li model M2 správný. Hypotézu o nevýznamnosti řádkového faktoru tedy zamítneme na hladině významnosti α, když platí: FA ≥ F1-α(a-1,n-a-b+1). Při uvedeném postupu tedy zjišťujeme, zda záleží na sloupcovém efektu B. Pokud ne, platí model M1 a ptáme se, zda záleží na řádkovém efektu A, tj. zda platí model M2. Postup lze samozřejmě provést i v jiném pořadí – nejdřív zkoumáme řádkový efekt A (tj. ověřujeme platnost modelu M1’: Xijk = µ + βj + εijk) a poté sloupcový efekt B. Lze ukázat, že oba řetězce M0 → M1 → M2 a M0 → M1’→ M2’ dají stejné výsledky. (To platí pouze za předpokladu, že nij = c pro všechna i, j.) Výsledky výpočtů zapisujeme do tabulky analýzy rozptylu dvojného třídění bez interakcí. Zdroj variability součet čtverců st. vol. podíl S/f EE f/S f/S F = řádkový efekt A SA fA = a-1 SA/fA EE AA A f/S f/S F = sloupcový efekt B SB fB = b-1 SB/fB EE BB B f/S f/S F = reziduální SE fE = n-a-b+1 SE/fE celkem ST fT = n-1 - - Scheffého a Tukeyova metoda mnohonásobného porovnávání Zjistíme-li, že existují významné rozdíly mezi řádky, můžeme pomocí Scheffého nebo Tukeyovy metody zjistit, které dvojice řádků se významně liší. Určíme tedy, které rozdíly αi - αt jsou nenulové (na dané hladině významnosti). Podle Scheffého metody zamítneme rovnost αi = αt, když ( ) ( )1ban,1aF 1ban S bc 1a2 MM 1 E ..t..i +−−−⋅ +−− ⋅ − >− α− a podle Tukeyovy metody, když ( )1ban,aq 1ban S bc 1 MM 1 E ..t..i +−− +−− ⋅>− α− , kde q1-α(a,n-a-b+1) najdeme v tabulkách kvantilů studentizovaného rozpětí. Jestliže zjistíme významný rozdíl mezi sloupci, určujeme podobně, které dvojice sloupců se mezi sebou liší, tj. které rozdíly βj – βt jsou nenulové. Podle Scheffého metody zamítneme rovnost βj = βt, když ( ) ( )1ban,1bF 1ban S ac 1b2 MM 1 E .t..j. +−−−⋅ +−− ⋅ − >− α− a podle Tukeyovy metody, když ( )1ban,bq 1ban S ac 1 MM 1 E .t..j. +−− +−− ⋅>− α− . Příklad: Byl zaznamenán prodej určitého zboží (v kusech) během tří stejně dlouhých časových období. Přitom byl sledován jednak vliv balení zboží (řádkový faktor A, úroveň 1 – balení v sáčku, úroveň 2 – balení v krabičce) a jednak vliv druhu reklamy (sloupcový faktor B, úroveň 1 – bez reklamy, úroveň 2 – reklama v novinách, úroveň 3 – reklama v TV a novinách). Výsledky prodeje jsou zaznamenány v tabulce: Faktor B Bez reklamy Reklama v novinách Reklama v TV a novinách Balení v sáčku 1 1 6Faktor A Balení v krabičce 3 4 9 Na hladině významnosti 0,05 je třeba posoudit vliv reklamy a i vliv balení zboží na jeho prodej. Řešení: Faktor B Bez reklamy Reklama v novinách Reklama v TV a novinách Balení v sáčku 1 1 6Faktor A Balení v krabičce 3 4 9 Data zpracujeme pomocí analýzy rozptylu dvojného třídění bez interakcí s jedním pozorováním v každé podtřídě. Přitom a = 2, b = 3, c = 1, n = 6. Nejprve provedeme pomocné výpočty: X1.. = 8, X2.. = 16, M1.. = 8/3, M2.. = 16/3, X… = 24, M… = 24/6 = 4, X.1. = 4, X.2. = 5, X.3. = 15, M.1. = 4/2 = 2, M.2. = 5/2, M.3. = 15/2 ( )∑ = −= a 1i 2 .....iA MMbcS 6,10 3 32 4 3 16 4 3 8 3 22 ==            −+      −= , ( )∑ = −= b 1j 2 ....j.B MMacS ( ) 374 2 15 4 2 5 422 22 2 =            −+      −+−= , ( )∑∑∑ = = = −= a 1i b 1j c 1k 2 ...ijkT MXS ( ) ( ) ( ) ( ) ( ) ( ) 48494443464141 222222 =−+−+−+−+−+−= , 3,0SSSS BATE =−−= . Výsledky zapíšeme do tabulky analýzy rozptylu dvojného třídění bez interakcí. Zdroj variability součet čtverců st. vol. podíl S/f EE f/S f/S F = způsob balení 6,10 1 6,10 63,99 druh reklamy 37 2 18,5 110,98 reziduální 3,0 2 61,0 celkem 48 5 - Odpovídající kvantily: pro řádkový efekt F0,95(1,2) = 18,1, pro sloupcový efekt F0,95(2,2) = 19. Protože FA = 63,99 ≥ 18,1, zamítáme na hladině významnosti 0,05 hypotézu, že způsob balení nemá vliv na prodej zboží. Podobně FB = 110,98 ≥ 19, tedy na hladině významnosti 0,05 zamítáme hypotézu, že druh reklamy nemá vliv na prodej zboží. Protože faktor B má tři úrovně, lze pomocí Scheffého nebo Tukeyovy metody zjistit, které druhy reklamy se od sebe liší na hladině významnosti 0,05. Nejprve vypočítáme absolutní hodnoty rozdílů sloupcových průměrů (přitom M.1. = 4/2 = 2, M.2. = 5/2, M.3. = 15/2): 5 2 15 2 5 MM,5,5 2 15 2MM,5,0 2 5 2MM .3..2..3..1..2..1. =−=−=−=−=−=− Pravá strana Scheffého vzorce je: ( ) ( ) =+−−−⋅ +−− ⋅ − α− 1ban,1bF 1ban S ac 1b2 1 E 52,21961,0 2 22 =⋅⋅ ⋅ . Vidíme, že podle Scheffého metody se na hladině významnosti 0,05 liší sloupce 1, 3 (tj. bez reklamy a s reklamou v TV a novinách) a sloupce 2, 3 (tj. s reklamou jen v novinách a reklamou v TV a novinách). Pravá strana Tukeyova vzorce je: ( )=+−− +−− ⋅ α− 1ban,bq 1ban S ac 1 1 E ( ) 4,233,8 2 61,0 2,3q 2 61,0 95,0 =⋅=⋅ . Podle Tukeyovy metody se na hladině významnosti 0,05 také liší sloupce 1, 3 a sloupce 2, 3. Výhodnější je hodnota získaná Tukeyovou metodou, protože je menší. Výpočet pomocí systému STATISTICA: Načteme datový soubor baleni_a_reklama.sta o třech proměnných X, A, B a 6 případech, kde X – prodej, A – typ balení (1 – sáček, 2 – krabička), B – druh reklamy (1 – bez reklamy, 2 – reklama v novinách, 3 – reklama v TV a novinách). Statistiky – ANOVA – ANOVA hlavních efektů – Rychlé nastavení – OK – Závisle proměnná X, Kategor. nezáv. prom. A, B – OK – Možnosti – Parametrizace – odškrtneme Sigma-omezená, zaškrtneme Bez abs. členu – OK –Všechny efekty. Dostaneme tabulku analýzy rozptylu dvojného třídění bez interakcí. Efekt SČ Stupně volnosti PČ F p A B Chyba 10,66667 1 10,66667 64,0000 0,015268 37,00000 2 18,50000 111,0000 0,008929 0,33333 2 0,16667 Vidíme, že p-hodnota pro testovou statistiku FA je 0,015268, tedy na hladině významnosti 0,05 zamítáme hypotézu, že typ balení nemá vliv na prodej zboží. Podobně p-hodnota pro testovou statistiku FB je 0,008929, což znamená, že na hladině významnosti 0,05 zamítáme hypotézu, že druh reklamy nemá vliv na prodej zboží. Podívejme se ještě na rezidua: Návrat do ANOVA Výsledky – Rezidua – P-graf reziduí. Normální p-graf; Čistá rezidua Závislá proměnná: X (Analyzovaný vzorek) -0,4 -0,3 -0,2 -0,1 0,0 0,1 0,2 0,3 0,4 0,5 Rezid. -3,0 -2,5 -2,0 -1,5 -1,0 -0,5 0,0 0,5 1,0 1,5 2,0 2,5 3,0 Oček.normál.hodnota ,01 ,05 ,15 ,35 ,55 ,75 ,95 ,99 Nejsou patrné žádné zvláštnosti. Abychom zjistili, které dvojice druhů reklamy se liší na hladině významnosti 0,05, použijeme Scheffého (resp. Tukeyovu) metodu mnohonásobného porovnávání. Návrat do ANOVA Výsledky – Více výsledků – Post-hoc – Efekt B –Tukeyův HSD. Tukeyův HSD test; proměnná X (baleni_a_reklama.sta) Přibližné pravděpodobnosti pro post hoc testy Chyba: meziskup. PČ = ,16667, sv = 2,0000 Č. buňky B {1} 2,0000 {2} 2,5000 {3} 7,5000 1 2 3 bez reklamy 0,548301 0,010156 reklama v novinach 0,548301 0,012218 reklama v TV a novinach 0,010156 0,012218 Vidíme, že na hladině významnosti 0,05 se liší dvojice (1,3) a (2,3). Dvojné třídění s interakcemi Nyní předpokládáme, že faktory A a B se mohou ovlivňovat (např. některý způsob hnojení má zcela specifický vliv na určitý typ půdy). Náhodné veličiny Xijk se řídí modelem M0: Xijk = µ + αi + βj + γij + εijk pro i = 1, …, a, j = 1, …, b, k = 1, …, c, přičemž γij je interakce mezi faktorem A na úrovni i a faktorem B na úrovni j. V této situaci předpokládáme, že c ≥ 2. Parametry µ, αi, βj neznáme. Požadujeme, aby platily tzv. reparametrizační rovnice: 0,0,0,0 b 1j ij a 1i ij b 1j j a 1i i =γ=γ=β=α ∑∑∑∑ ==== . Nyní můžeme utvořit modely M1: Xijk = µ + αi + βj + εijk, M2: Xijk = µ + αi + εijk, M3: Xijk = µ + εijk (Lze samozřejmě použít i jiný řetězec modelů, kdy postupně klademe rovny nule parametry αi, βj, γij v jiném pořadí.) Vypočítáme součty čtverců ST, SA, SB, SAB, SE, přičemž ( ) ( )[ ]∑∑ = = −−−= a 1i b 1j 2 ....j...i.ijAB MMMMcS je součet čtverců pro interakce, počet stupňů volnosti fAB = (a-1)(b-1). Vliv interakcí je prokázán na hladině významnosti α, když ( )( )( )abn,1b1aF f/S f/S F 1 EE ABAB AB −−−≥= α− . Výsledky zapisujeme do tabulky analýzy rozptylu dvojného třídění s interakcemi: Zdroj variability součet čtverců st. vol. podíl S/f EE f/S f/S F = řádkový faktor A SA fA = a-1 SA/fA EE AA A f/S f/S F = sloupcový faktor B SB fB = b-1 SB/fB EE BB B f/S f/S F = interakce A,B SAB fAB = (a-1)(b-1) SAB/fAB EE ABAB AB f/S f/S F = reziduální SE fE = n-ab SE/fE celkem ST fT = n-1 - Je třeba si povšimnout, že součet SAB + SE resp. fAB + fE dá hodnotu SE resp. fE v tabulce bez in- terakcí. Možné problémy v analýze rozptylu dvojného třídění s interakcemi a) Ukáže-li se vliv interakcí nevýznamný, vzniká otázka, zda testovat vliv řádků resp. sloupců pomocí tabulky s interakcemi nebo provést novou analýzu rozptylu, ale tentokrát bez interakcí. Převládá názor, že je zapotřebí dokončit analýzu rozptylu s interakcemi. b) Pokud interakce vyjdou významné a řádky a sloupce rovněž, zpravidla se nedoporučuje provádět mnohonásobné porovnávání, protože by se mohlo stát, že některá interakce by byla mnohem výraznější než příslušný řádkový resp. sloupcový efekt. c) Nejsou-li interakce významné a řádky resp. sloupce ano, pak lze provést mnohonásobné porovnávání zcela analogicky jako v případě třídění bez interakcí, avšak je jiný počet stupňů volnosti fE. Tabulka odhadů různých parametrů a rozptylů těchto odhadů parametr odhad rozptyl odhadu µ M… σ2 /n µ + αi Mi.. σ2 /bc µ + βj M.j. σ2 /ac µ + αi + βj + γij Mij. σ2 /c αi Mi.. – M… σ2 (a-1)/n βj M.j. – M… σ2 (b-1)/n γij (Mij. - Mi..) – (M.j. – M…) σ2 (a-1)(b-1)/n Neznámý rozptyl σ2 nahradíme jeho odhadem abn S s e2 − = . Příklad: Byly zkoumány výnosy sena (v q/ha) v závislosti na typu půdy (řádkový faktor A, úroveň 1 – normální půda, úroveň 2 – kyselá půda) a na způsobu hnojení (sloupcový faktor B, úroveň 1 – bez hnojení, úroveň 2 – hnojení chlévskou mrvou, úroveň 3 – hnojení vápenatým hnojivem). Každá kombinace faktorů A a B byla realizována čtyřikrát nezávisle na sobě. Výnosy sena jsou uvedeny v tabulce: B Bez hnojení Chlévská mrva Vápenaté hnojivo Normální půda 28 32 30 30 37 36 39 36 34 38 37 36A Kyselá půda 31 27 30 29 34 34 30 38 42 40 41 39 Na hladině významnosti 0,05 máme posoudit vliv typu půdy a způsobu hnojení (včetně případných interakcí) na výnosy sena. Řešení: Použijeme analýzu rozptylu dvojného třídění s interakcemi. Přitom a = 2, b = 3, c = 4, n = abc = 24. Nebudeme provádět pomocné výpočty, ale rovnou uvedeme tabulku výsledků. Zdroj variability součet čtverců st. vol. podíl S/f EE f/S f/S F = typ půdy 0,166 1 0,166 0,04 způsob hnojení 318,25 2 159,125 41,81 interakce 55,084 2 27,542 7,24 reziduální 68,5 18 3,8056 celkem 442 23 - Odpovídající kvantily: pro řádkový efekt F0,95(1,18) = 4,41, pro sloupcový efekt F0,95(2,18) = 3,55, pro interakce F0,95(2,18) = 3,55. Protože FA = 0,04 < 4,41, nezamítáme na hladině významnosti 0,05 hypotézu, že typ půdy neovlivňuje výnos sena. Dále FB = 41,81 ≥ 3,55, tedy na hladině významnosti 0,05 se prokázal rozdíl mezi použitými způsoby hnojení. Jelikož FAB = 7,24 ≥ 3,55, zamítáme na hladině významnosti 0,05 hypotézu o nevýznamnosti interakcí (tj. aspoň jeden způsob hnojení působí jinak na půdu normální než kyselou). Výpočet pomocí systému STATISTICA: Načteme datový soubor seno.sta se třemi proměnnými A, B, X a 24 případy, kde X – výnos sena, A – typ půdy, B – způsob hnojení. Jednotlivé varianty proměnných A a B mají tento význam: u proměnné A je 1 – normální půda, 2 – kyselá půda, u proměnné B je 1 – bez hnojení, 2 – chlévská mrva, 3 – vápenaté hnojivo. Nejprve spočítáme průměry ve všech 6 skupinách: Statistiky – ANOVA – Typ analýzy ANOVA s interakcemi. Metoda specifikace: Rychlé nastavení – OK, Proměnné – Seznam závislých proměnných X, Kategor. nezáv, prom. (faktory) A, B – OK – Možnosti – Parametrizace – zaškrtneme Bez absolutního členu – odškrtneme Sigma omezená – OK – Průměry – Pozorované, nevážené. A*B; Nevážené průměry (seno.sta) Současný efekt: F(2, 18)=7,2372, p=,00494 Dekompozice typu III Č. buňky A B X Průměr X Sm.Ch. X -95,00% X +95,00% N 1 2 3 4 5 6 normální bez hnojení 30,00000 0,975392 27,95078 32,04922 4 normální chlévská mrva 37,00000 0,975392 34,95078 39,04922 4 normální vápenaté hnojivo 36,25000 0,975392 34,20078 38,29922 4 kyselá bez hnojení 29,25000 0,975392 27,20078 31,29922 4 kyselá chlévská mrva 34,00000 0,975392 31,95078 36,04922 4 kyselá vápenaté hnojivo 40,50000 0,975392 38,45078 42,54922 4 Nyní provedeme testování hypotéz o vlivu faktorů: Návrat do ANOVA:Výsledky – Detaily – Všechny efekty. Dostaneme tabulku analýzy rozptylu dvojného třídění s interakcemi. Jednorozměrné testy významnosti pro X (seno.sta) Přeparametrizovaný model Dekompozice typu III Efekt SČ Stupně volnosti PČ F p A B A*B Chyba 0,1667 1 0,1667 0,04380 0,836585 318,2500 2 159,1250 41,81387 0,000000 55,0833 2 27,5417 7,23723 0,004938 68,5000 18 3,8056 Vidíme, že p-hodnota pro testovou statistiku FB je velmi blízká 0, tedy na hladině významnosti 0,05 zamítáme hypotézu, že způsob hnojení nemá vliv na výnosy sena. Podobně p-hodnota pro testovou statistiku FAB je 0,004938, což znamená, že na hladině významnosti 0,05 zamítáme hypotézu, že způsob hnojení působí na oba typy půd stejně. Vzhledem k tomu, že rozsahy výběrů v daných šesti skupinách jsou větší než 1 (c = 4), lze ověřit předpoklad o homogenitě rozptylů. Vrátíme se do ANOVA Výsledky a zvolíme Více výsledků – Předpoklady – Levenův test. Leveneův test homogenity rozptylů (seno.sta) Efekt: A*B Stupně volnosti pro všechna F: 5, 18 PČ Efekt PČ Chyba F p X 0,600000 1,555556 0,385714 0,852058 Zjistíme, že p-hodnota je 0,852058, tudíž tedy na hladině významnosti 0,05 nezamítáme hypotézu o homogenitě rozptylů. Normalitu všech šesti výběrů můžeme orientačně posoudit rovněž v Předpokladech pomocí N-P plotu. Ve všech šesti případech lze konstatovat vcelku dobrou shodu s normálním rozložením. Průměrné výnosy sena (spolu s 95% intervaly spolehlivosti) na normální a kyselé půdě při daných třech způsobech hnojení lze znázornit graficky. V ANOVA Výsledky zvolíme Průměry – Pozorované, nevážené – Graf. Lze vykreslit graf závislosti průměrného výnosu sena na typu půdy: A*B; Nevážené průměry Současný efekt: F(2, 18)=7,2372, p=,00494 Dekompozice typu III Vertikální sloupce označují 0,95 intervaly spolehlivosti B bez hnojení B chlévská mrva B vápenaté hnojivo normáln kysel A 24 26 28 30 32 34 36 38 40 42 44 46 X:výnos nebo graf závislosti průměrného výnosu sena na způsobu hnojení: A*B; Nevážené průměry Současný efekt: F(2, 18)=7,2372, p=,00494 Dekompozice typu III Vertikální sloupce označují 0,95 intervaly spolehlivosti A normální A kyselá bez hnojen chlévská mrva vápenaté hnojivo B 24 26 28 30 32 34 36 38 40 42 44 46 X:výnos V grafu se objevuje křížení, které je typické pro případ, kdy působí interakce mezi faktory A, B. Analýza reziduí neodhalí žádné zvláštnosti. Nyní pomocí Tukeyovy metody mnohonásobného porovnávání zjistíme, které dvojice výběrů se liší na hladině významnosti 0,05. Vrátíme se do Anova: Výsledky – klikneme na Více výsledků – Post hoc – Efekt B - Tukeyův HSD. Tukeyův HSD test; proměnnáX (seno.sta) Přibližné pravděpodobnosti pro post hoc testy Chyba: meziskup. PČ = 3,8056, sv = 18,000 Č. buňky B {1} 29,625 {2} 35,500 {3} 38,375 1 2 3 bez hnojení 0,000171 0,000149 chlévská mrva 0,000171 0,022412 vápenaté hnojivo 0,000149 0,022412 Vidíme, že na hladině významnosti 0,05 se liší všechny tři dvojice skupin: Upozornění: Systém STATISTICA umí provádět analýzu rozptylu dvojného třídění i v případě, že třídění není vyvážené. Ukážeme to na následujícím příkladě. Příklad: V rámci psychologického výzkumu bylo vyšetřeno 856 žáků základních škol. Kromě jiného se zjišťoval jejich inteligenční kvocient (proměnná IQ), vzdělání matky a vzdělání otce (proměnná VZDEL_M, VZDEL_O, mají varianty Z … základní, S … středoškolské, V … vysokoškolské) a místo trvalého bydliště (proměnná SIDLO, má varianty 1 … město, 2 … venkov). Data jsou uložena v souboru IQ_zaku.sta. Na hladině významnosti 0,05 testujte hypotézu, že proměnné VZDEL_M a SIDLO neovlivňují variabilitu hodnot proměnné IQ. Použijte analýzu rozptylu dvojného třídění s interakcemi. Výsledek: Na hladině významnosti 0,05 zamítáme hypotézu o nevýznamnosti obou faktorů i jejich interakcí.