9 Analýza rozptylu jednoduchého třídění - Domácí procvičování Příklad 9.1. Pan Novák může cestovat z místa bydliště do místa pracoviště třemi různými způsoby: tramvají, autobusem a metrem s následným přestupem na tramvaj. Máme k dispozici jeho naměřené časy cestování do práce v době ranní špičky (včetně čekání na příslušný spoj) v minutách: autobus: 32 39 42 37 34 38 tramvaj: 30 34 28 26 32 metro: 40 37 31 39 38 33 34 Pro všechny tři způsoby dopravy vypočtěte průměrné časy cestování. Na hladině významnosti a = 0.05 testujte hypotézu, že doba cestování do práce nezávisí na způsobu dopravy. V případě zamítnutí nulové hypotézy zjistěte, které způsoby dopravy do práce se od sebe liší na hladině významnosti a = 0.05. Testování normality 1. //• : ................................................................................................... 2. Hi : ................................................................................................... Na testování normality všech tří výběrů použijeme kvůli jejich malým rozsahům ............................................ test. ## [1] "Autobus: 0.9539" ## [1] "Tramvaj: 0.9672" ## [1] "Metro: 0.6294" Q-Q graf Autobus n-1-r -0.5 0.0 0.5 teoreticky kvantil Q-Q graf Tramvaj teoreticky kvantil ~i i i r -1.0 -0.5 0.0 0.5 1.0 teoreticky kvantil Protože ve všech případech je p-hodnota testu........................než a =................., nulovou hypotézu o normalitě dat ................................na hladině významnosti.................................Všechny tři výběry tedy.................................z normálního rozdělení. Test homogenity rozptylů 1. //• : ............................... 2. Hi : ............................... Jelikož náhodné výběry pochází z normálního rozdělení, na testování hypotézy o shodě rozptylů použijeme . test. 1 ## Test Statistic ## 0.1053556 ## [1] 0.9006645 Testovací statistika ................................. testu nabývá hodnoty ................................., odpovídající p-hodnota = ........................ je ........................ než a = ...................., tedy na hladině významnosti ................................. hypotézu o shodě rozptylů .................................. Test o shodě středních hodnot: 1. H0 : ................................................................................................... 2. Tři : ................................................................................................... ## Df Sum Sq Mean Sq F value PrOF) ## factor(ID) 2 154 77.00 6.715 0.00827 ** ## Residuals 15 172 11.47 ##--- ## Signif. codes: 0 1***1 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 ## [1] 3.68232 Skupinový součet čtverců S a = ................................., počet stupňů volnosti f a = ..............., reziduálni součet čtverců Se =................................., počet stupňů volnosti f e =..............., testovací statistika Fa =.......................... . p-hodnota =................................., nulovou hypotézu o shodě středních hodnot tedy.................................na hladině významnosti ........................ Kritický obor má tvar W=........................................................... Protože ......................., hypotézu H0 o shodě středních hodnot ............................................na hladině významnosti............................. S rizikem omylu nejvýše 5% se prokázal/neprokázal rozdíl v dobách cestování pana Nováka do zaměstnání autobusem, tramvají a metrem. Metoda mnohonásobného porovnávání Jelikož jsme nulovou hypotézu o shodě středních hodnot ................................., chceme nyní zjistit, které dvojice středních hodnot se od sebe významně liší. Stanovíme nulové a alternativní hypotézy pro dvojice středních hodnot • H01 : ..................................................................oproti Hlľ : ................................................... • H02 ■ ..................................................................oproti Hi2 : ................................................... • H03 : ..................................................................oproti H13 : ................................................... Protože v každé skupině máme různý počet pozorování, použijeme na mnohonásobné porovnávání metodu. ## $L ## tramvaj autobus metro ## tramvaj 0 7 1 ## autobus 7 0 6 ## metro 1 6 0 ## ## $R ## tramvaj autobus metro ## tramvaj 5.305591 5.564551 5.112595 ## autobus 5.564551 5.811983 5.380851 ## metro 5.112595 5.380851 4.912023 2 Porovnáním pravé a levé strany ................................. metody vidíme, že na hladině významnosti .................... zamítáme nulovou hypotézu o shodě středních hodnot /i........ a /i........ a středních hodnot /i........ a /i......... Z tabulky vyplývá, že s rizikem omylu nejvýše 5 % se liší cestování................................. a................................. a dále cestování................................. a.................................. Krabicový graf cd > o to CD O cd .o o "a Doprava do prace Krabicový graf tramvaj autobus metro způsob dopravy Příklad 9.2. V rámci studie bylo získáno pět nezávislých náhodných výběrů o rozsazích 13, 18, 69, 19, 44 přičemž i-tý výběr pochází z rozdělení N (fa, of), i = 1,..., 5. Skupinový součet čtverců vyšel 80 a celkový součet čtverců vyšel 3441. Na hladině významnosti a = 0.05 testujte hypotézu Hq o shodě středních hodnot. Testování proveďte pomocí kriického oboru a pomocí p-hodnoty. ## [1] 0.9401964 ## [1] 0.4423163 ## [1] 2.428885 Testovací statistika F nabývá hodnoty ............................... Kritický obor má tvar W=....................................... Protože..............................., hypotézu Hq o shodě středních hodnot ........................................na hladině významnosti .................. Testovací statistika F nabývá hodnoty..............................., p-hodnota =................................Protože p-hodnota= ......................je......................než a =......................, hypotézu Hq o shodě středních hodnot ............................... na hladině významnosti .................. 3 Příklad 9.3. Na střední škole byl uskutečněn experminet zjišťující efektvitu jednotlivých pedagogických metod. Studenti byli rozděleni do pěti skupin a každá skupina byla vyučována pomocí jedné z pedagogických metod: tradiční způsob, programová výuka, audiotechnika, audiovizuální technika a vizuální technika. Z každé skupiny byl potom vybrán náhodný vzorek studentů a všichni byli podrobeni témuž písemnému testu. Výsledky testu jsou uvedeny v následující tabulce a v souboru pet_metod.txt: metoda počet bodů tradicni programová audio audiovizuálni vizuálni 76.2 48.3 85.1 63.7 91.6 87.2 85.2 74.3 76.5 80.3 67.4 67.9 72.1 60.4 67.3 60.1 55.4 72.3 40.0 75.8 81.6 90.3 78.0 67.8 57.6 50.5 70.2 88.8 67.1 77.7 73.9 Na hladině významnosti a = 0.05 testujte hypotézu, že znalosti všech studentů jsou stejné a nezávisí na použité pedagogické metodě. V případě zamítnutí hypotézy zjistěte, které výběry se liší na hladině významnosti 0.05. Testování normality 1. //• : ................................................................................................... 2. Hi : ................................................................................................... Na testování normality všech tří výběrů použijeme kvůli jejich malým rozsahům............................................ test. ## [1] "Tradicni m.: 0.4177" ## [1] "Programovaní.: 0.9966" ## [1] "Audio m.: 0.7663" ## [1] "Audiovizuálni m.: 0.9577" ## [1] "Viualni m.: 0.8814" Q-Q graf Q-Q graf Q-Q graf Metoda 1 Metoda 2 Metoda 3 -1.0 -0.5 0.0 0.5 1.0 -1.5 -0.5 0.0 0.5 1.0 1.5 -1.0 -0.5 0.0 0.5 1.0 teoreticky kvantil teoreticky kvantil teoreticky kvantil 4 -1.0 -0.5 0.0 0.5 1.0 teoreticky kvantil -1.0 -0.5 0.0 0.5 1.0 teoreticky kvantil Protože ve všech pěti případech je p-hodnota testu........................než a =................., nulovou hypotézu o normalitě dat u každé metody ................................ na hladině významnosti ................................. Všech pět výběrů tedy ................................. z normálního rozdělení. Test homogenity rozptylů 1. H0 : ............................... 2. Hi : ............................... Jelikož náhodné výběry pochází z normálního rozdělení, na testování hypotézy o shodě rozptylů všech pěti výběrů použijeme................................. test. ## Test Statistic ## 0.8190294 ## [1] 0.5247907 Testovací statistika ................................. testu nabývá hodnoty ................................., odpovídající p-hodnota = ........................ je ........................ než a = ...................., tedy na hladině významnosti ................................. hypotézu o shodě rozptylů .................................. Test o shodě středních hodnot: 1. H0 : ................................................................................................... 2. Hi : ................................................................................................... ## Df Sum Sq Mean Sq F value Pr(>F) ## factor(ID) 4 966 241.6 1.624 0.198 ## Residuals 26 3869 148.8 ## [1] 2.742594 Skupinový součet čtverců S a = ................................., počet stupňů volnosti f a = ..............., reziduálni součet čtverců Se =................................., počet stupňů volnosti f g =..............., testovací statistika Fa =.......................... . p-hodnota =................................., nulovou hypotézu o shodě středních hodnot tedy.................................na hladině významnosti ........................ Kritický obor má tvar W=........................................................... Protože ......................., hypotézu H0 o shodě středních hodnot ............................................na hladině významnosti............................. V účinnosti jednotlivých pedagogických metod tedy ...................... významný rozdíl. Krabicový graf Výukové metody Krabicový graf "O o -Q O CD o LO o tradiční programová 1-T audiovizuálni vizuálni metoda Příklad 9.4. Je dána neúplná tabulka analýzy rozptylu jednoduchého třídění. Na volná místa doplňte chybějící hodnoty a na hladině významnosti 0.05 testujte hypotézu o shodě středních hodnot. Stanovte, jaký je celkový počet pozorování n a kolik úrovní r má faktor A? zdroj variability součet čtverců stupně volnosti podíl statistika F skupinový 3 reziduálni 3 26 - celkový 30 - - ## [1] 4 ## [1] 12 ## [1] 15 ## [1] 0.1153846 ## [1] 26 ## [1] 2.742594 ## [1] 9.33888e-09 Testovací statistika F nabývá hodnoty ............................... Kritický obor má tvar W=....................................... Protože..............................., hypotézu Hq o shodě středních hodnot ........................................na hladině významnosti .................. Testovací statistika F nabývá hodnoty..............................., p-hodnota =................................Protože p-hodnota= ......................je......................než a =......................, hypotézu Hq o shodě středních hodnot .............................. na hladině významnosti .................. Celkový počet pozorování je.......................; faktor A má celkem....................... úrovní. 6