Osnova přednášky Přehled t-testů 1. Jednovýběrový t-test 2. Párový t-test 3. Dvouvýběrový t-test - ověření hypotézy o shodě rozptylů (F-test) - Cohenův koeficient věcného účinku 4. Provedení t-testů v systému STATISTICA pomocí aplikace Testy rozdílů Přehled t-testů 1. Jednovýběrový t-test Označení: Nechť X1, ..., Xn je náhodný výběr, n ≥ 2. ∑= = n 1i iX n 1 M … výběrový průměr, ( )∑= − − = n 1i 2 i 2 MX 1n 1 S … výběrový rozptyl, 2 SS = … výběrová směrodatná odchylka Definice jednovýběrového t-testu: Nechť X1, ..., Xn je náhodný výběr z N(µ, σ2 ), kde rozptyl σ2 neznáme. Nechť n ≥ 2 a c je reálná konstanta. Test H0: µ = c proti H1: µ ≠ c (resp. H0: µ = c proti H1: µ < c resp. H0: µ = c proti H1: µ > c) se nazývá jednovýběrový t-test. Poznámka: Jednovýběrový t-test je založen na pivotové statistice ( )1-nt~ n S M T µ− = . Dosadíme-li za µ konstantu c, dostaneme testovou statistku: n S cM T0 − = , která se v případě platnosti H0 řídí Studentovým rozložením t(n-1). Provedení jednovýběrového t-testu pomocí kritického oboru Vypočteme realizaci testové statistiky n s cm t0 − = . Stanovíme kritický obor W. Pokud t0 ∈ W, H0 zamítáme na hladině významnosti α a přijímáme H1. Oboustranný test: Testujeme H0: µ = c proti H1: µ ≠ c. Kritický obor má tvar: ( ) ( ) )( ∞−∪−−∞−= α−α− ,1nt1nt,W 2/12/1 . Levostranný test: Testujeme H0: µ = c proti H1: µ < c. Kritický obor má tvar: ( )( 1nt,W 1 −−∞−= α− . Pravostranný test: Testujeme H0: µ = c proti H1: µ > c. Kritický obor má tvar: ( ) )∞−= α− ,1ntW 1 . Provedení jednovýběrového t-testu pomocí intervalu spolehlivosti Pro oboustranný test sestrojíme oboustranný 100(1-α)% interval spolehlivosti pro střední hodnotu µ při neznámém rozptylu σ2 : (d, h) = (m - n s t1-α/2(n-1), m + n s t1-α/2(n-1)) Pro levostranný test sestrojíme pravostranný 100(1-α)% interval spolehlivosti pro střední hodnotu µ při neznámém rozptylu σ2 : (-∞, h) = (-∞, m + n s t1-α(n-1)) Pro pravostranný test sestrojíme levostranný 100(1-α)% interval spolehlivosti pro střední hodnotu µ při neznámém rozptylu σ2 : (d, ∞) = (m - n s t1-α(n-1), ∞) Pokud číslo c padne do intervalu spolehlivosti, nulovou hypotézu nezamítáme na hladině významnosti α. V opačném případě nulovou hypotézu zamítáme na hladině významnosti α a přijímáme alternativní hypotézu. Provedení jednovýběrového t-testu pomocí p-hodnoty Vypočteme p-hodnotu (nejlépe pomocí statistického software) a porovnáme ji s hladinou významnosti α. Jestliže p ≤ α, pak nulovou hypotézu zamítáme na hladině významnosti α a přijímáme alternativní hypotézu. Je-li p > α, pak nulovou hypotézu nezamítáme na hladině významnosti α. Způsob výpočtu p-hodnoty: Označme Φ distribuční funkci Studentova rozložení t(n-1). Pro oboustrannou alternativu p = 2 min{Φ( t0), 1- Φ( t0)}. Pro levostrannou alternativu p = Φ( t0). Pro pravostrannou alternativu p = 1- Φ( t0). Příklad na jednovýběrový t-test: Bylo prováděno sledování obsahu vitamínu C ve vzorcích mrkve, která byla zakoupena na biofarmě. Celkem bylo provedeno analytické stanovení obsahu vitamínu C ve 20 vzorcích mrkve a byly zjištěny následující koncentrace (v mg/kg): 41,1; 32,6; 28,9; 19,6; 23,6; 35,0; 36,7; 45,9; 49,6; 33,6; 17,8; 24,6; 29,6; 47,7; 41,6; 39,8; 15,6; 34,1; 44,0 a 55,8 Průměrný obsah vitamínu C v mrkvi, který je uváděn v literatuře, je 35 mg/kg. Liší se obsah vitamínu C stanoveného ve vzorcích mrkve z biofarmy od průměrné hodnoty uváděné v literatuře? Řešení pomocí systému STATISTICA: Otevřeme datový soubor mrkev.sta s jednou proměnnou X a 20 případy. V proměnné X jsou zapsány zjištěné hodnoty obsahu vitamínu C. Na hladině významnosti 0,05 testujeme hypotézu H0: µ = 35 proti alternativě H1: µ ≠ 35. Jde o úlohu na jednovýběrový t-test. Nejprve pomocí N-P grafu a Shapirova – Wilkova testu ověříme, zda data pocházejí z normálního rozložení. Vytvoření N-P plotu: Grafy – 2D Grafy – Normální pravděpodobnostní grafy – Proměnná X – OK - odškrtneme Neurčovat průměrnou pozici svázaných pozorování – zaškrtneme Shapiro – Wilkův test - OK. Ověření normality pomocí N-P grafu a S-W testu: Normální p-graf z X Tabulka1 1v*20c 10 15 20 25 30 35 40 45 50 55 60 Pozorovaný kvantil -2,0 -1,5 -1,0 -0,5 0,0 0,5 1,0 1,5 2,0 Oček.normál.hodnoty X: SW-W = 0,9816; p = 0,9535 Body v N-P grafu jsou blízko ideální přímky. S-W test poskytl p-hodnotu 0,9535, tedy na hladině významnosti 0,05 nezamítáme hypotézu o normalitě. Provedení jednovýběrového t-testu: Statistiky – Základní statistiky/tabulky – t-test, samost. vzorek – OK – Proměnné X – OK. Do Referenční hodnoty napíšeme 35, na záložce Možnosti zaškrtneme Výpočet mezí spolehl. – Výpočet. Dostaneme tabulku: Test průměrů vůči referenční konstantě (hodnotě) (mrkev.sta) Proměnná Průměr Sm.odch. N Sm.chyba Int. spolehl. -95,000% Int. spolehl. +95,000% Referenční konstanta t SV p X: obsah vitaminu C v mrkvi 34,86000 11,08719 20 2,479170 29,67104 40,04896 35,00000 -0,056471 19 0,955557 Vidíme, že průměrný obsah vitamínu C ve sledovaných 20 vzorcích je 34,86 mg/kg se směrodatnou odchylkou 11,09 mg/kg. Test pomocí intervalu spolehlivosti: S pravděpodobností 95 % se neznámá střední hodnota obsahu vitamínu C nachází v intervalu 29,67 mg/kg až 40,05 mg/kg. Protože referenční konstanta 35 mg/kg se nachází v tomto 95% intervalu spolehlivosti, hypotézu H0: µ = 35 nezamítáme na hladině významnosti 0,05. Test pomocí kritického oboru: Testová statistika nabývá hodnoty -0,0565. Kritický obor je ( )( ( ) ) ( )( ( ) ) ( )∞∪−∞−= =∞∪−∞−=∞−∪−−∞−= α−α− ,093,2093,2, ,19t19t,,1nt1nt,W 975,0975,02/12/1 Testová statistika se nerealizuje v kritickém oboru, tedy hypotézu H0: µ = 35 nezamítáme na hladině významnosti 0,05. Upozornění: Kvantil t0,975(19) najdeme v systému STATISTICA pomocí Pravděpodobnostního kalkulátoru: Statistiky – Pravděpodobnostní kalkulátor - vybereme Rozdělení t (Studentovo). Do okénka sv. napíšeme 19 a do okénka p napíšeme 0,975. V okénku t se objeví 2,093. Test pomocí p-hodnoty: Protože p-hodnota je 0,9556, což je větší než hladina významnosti 0,05, hypotézu H0: µ = 35 nezamítáme na hladině významnosti 0,05. 2. Párový t-test Označení: Nechť             n n 1 1 Y X ,, Y X K je náhodný výběr z dvourozměrného rozložení, přičemž n ≥ 2. Označíme µ = µ1 - µ2 a zavedeme rozdílový náhodný výběr Z1 = X1 - Y1, ... , Zn = Xn - Yn, o němž předpokládáme, že se řídí normálním rozložením. Označíme ∑ = = n 1i iZ n 1 M … výběrový průměr rozdílového náhodného výběru, ( )∑= − − = n 1i 2 i 2 MZ 1n 1 S … výběrový rozptyl rozdílového náhodného výběru. Definice párového t-testu: Nechť             n n 1 1 Y X ,, Y X K je náhodný výběr z dvourozměrného rozložení, přičemž n ≥ 2. Nechť c je reálná konstanta. Testujeme H0: µ1 - µ2 = c (tj. µ = c) proti H1: µ1 - µ2 ≠ c (tj. µ ≠ c) nebo testujeme nulovou hypotézu proti jedné z jednostranných alternativ. Tento test se nazývá párový t-test. Provedení párového t-testu: Párový t-test se provádí stejně jako jednovýběrový t-test aplikovaný na rozdílový náhodný výběr Z1, …, Zn. Příklad na párový t-test: U 22 vzorků dřeva byla změřena jejich vlhkost v procentech dvěma metodami. Výsledky máme v tabulce: Na hladině významnosti 0,05 testujte hypotézu, že střední hodnoty vlhkosti dřeva získané oběma metodami se neliší. Řešení pomocí systému STATISTICA: Otevřeme datový soubor vlhkost_dreva.sta s dvěma proměnnými X, Y a 22 případy. Datový soubor doplníme o proměnnou Z, do níž uložíme rozdíl X – Y. Na hladině významnosti 0,05 testujeme hypotézu H0: µ1 - µ2 = 0 proti alternativě H1: µ1 - µ2 ≠ 0. Jde o úlohu na párový t-test. Nejprve pomocí N-P grafu a Shapirova – Wilkova testu ověříme, zda data v proměnné Z pocházejí z normálního rozložení. Vytvoření N-P plotu: Grafy – 2D Grafy – Normální pravděpodobnostní grafy – Proměnná Z – OK - odškrtneme Neurčovat průměrnou pozici svázaných pozorování – zaškrtneme Shapiro – Wilkův test - OK. Normální p-graf z Z Tabulka13 3v*22c -3,5 -3,0 -2,5 -2,0 -1,5 -1,0 -0,5 0,0 0,5 1,0 1,5 Pozorovaný kvantil -2,5 -2,0 -1,5 -1,0 -0,5 0,0 0,5 1,0 1,5 2,0 Oček.normál.hodnoty Z: SW-W = 0,932; p = 0,1350 Vzhled N-P grafu svědčí o mírném porušení normality, které však není významné na hladině významnosti 0,05, protože p-hodnota S – W testu je 0,135, což je větší než 0,05. Provedení párového t-testu: Statistiky – Základní statistiky/tabulky – t-test, závislé vzorky – OK – Proměnné – 1. seznam proměnných X, 2. seznam proměnných Y – OK - Výpočet. Dostaneme tabulku: t-test pro závislé vzorky (vlhkost_dreva.sta) Označ. rozdíly jsou významné na hlad. p < ,05000 Proměnná Průměr Sm.odch. N Rozdíl Sm.odch. rozdílu t sv p Int. spolehl. -95,000% Int. spolehl. +95,000% X Y 6,945455 0,954552 7,577273 0,944625 22 -0,631818 1,311265 -2,26002 21 0,034569 -1,21320 -0,050436 Testová statistika párového t-testu se realizuje číslem -2,26, odpovídající p-hodnota je 0,0346, tedy na hladině významnosti 0,05 zamítáme nulovou hypotézu. S rizikem omylu nejvýše 5 % jsme prokázali, že střední hodnoty vlhkosti dřeva získané oběma metodami se liší. Tabulku ještě doplníme krabicovými diagramy: Na záložce Detailní výsledky zvolíme Krabicový graf a vybereme možnost Prům./SmCh/1,96*SmCh. Krabicový graf X vs. Y Průměr Průměr±SmCh Průměr±1,96*SmChX Y 6,4 6,6 6,8 7,0 7,2 7,4 7,6 7,8 8,0 8,2 3. Dvouvýběrový t-test Označení: Máme dva nezávislé náhodné výběry, první je 1n111 X,,X K , pochází z rozložení N(µ1, σ2 ), jeho rozsah n1 ≥ 2, druhý je 2n221 X,,X K , pochází z rozložení N(µ2, σ2 ) a jeho rozsah n2 ≥ 2. ∑= = 1n 1i i11 X n 1 M , ∑= = 2n 1i i22 X n 1 M … výběrové průměry 1. a 2. výběru, ( )∑= − − = 1n 1i 2 1i1 1 2 1 MX 1n 1 S , ( )∑= − − = 2n 1i 2 2i2 2 2 2 MX 1n 1 S … výběrové rozptyly 1. a 2. výběru, 2nn S)1n(S)1n( S 21 2 22 2 112 * −+ −+− = … vážený průměr výběrových rozptylů. Definice dvouvýběrového t-testu: Nechť 1n111 X,,X K je náhodný výběr z rozložení N(µ1, σ2 ) a 2n221 X,,X K je na něm nezávislý náhodný výběr rozložení N(µ2, σ2 ), přičemž n1 ≥ 2 a n2 ≥ 2 a σ2 neznáme. Nechť c je konstanta. Test H0: µ1 – µ2 = c proti H1: µ1 – µ2 ≠ c (resp. H0: µ1 – µ2 = c proti H1: µ1 – µ2 < c resp. H0: µ1 – µ2 = c proti H1: µ1 – µ2 > c) se nazývá dvouvýběrový t-test. Poznámka: Dvouvýběrový t-test je založen na pivotové statistice ( ) ( ) ( )2-nnt~ n 1 n 1 S MM T 21 21 * 2121 + + µ−µ−− = . Dosadíme-li za µ1 – µ2 konstantu c, dostaneme testovou statistku: ( ) 21 * 21 0 n 1 n 1 S cMM T + −− = , která se v případě platnosti H0 řídí Studentovým rozložením t(n1-n2-2). Provedení dvouvýběrového t-testu pomocí kritického oboru Vypočteme realizaci testové statistiky ( ) 21 * 21 0 n 1 n 1 s cmm t + −− = . Stanovíme kritický obor W. Pokud t0 ∈ W, H0 zamítáme na hladině významnosti α a přijímáme H1. Oboustranný test: Testujeme H0: µ1 – µ2 = c proti H1: µ1 – µ2 ≠ c. Kritický obor má tvar: ( ) ( ) )( ∞−+∪−+−∞−= α−α− ,1nnt1nnt,W 212/1212/1 . Levostranný test: Testujeme H0: µ1 – µ2 = c proti H1: µ1 – µ2 < c. Kritický obor má tvar: ( )( 1nnt,W 211 −+−∞−= α− . Pravostranný test: Testujeme H0: µ1 – µ2 = c proti H1: µ1 – µ2 > c. Kritický obor má tvar: ( ) )∞−+= α− ,1nntW 211 . Provedení dvouvýběrového t-testu pomocí intervalu spolehlivosti Pro oboustranný test sestrojíme oboustranný 100(1-α)% interval spolehlivosti pro rozdíl středních hodnot µ1 – µ2 při společném neznámém rozptylu σ2 : (d, h) = (m1 – m2 – 21 * n 1 n 1 s + t1-α/2(n1+n2-2), m1 – m2 + 21 * n 1 n 1 s + t1-α/2(n1+n2-2)) Pro levostranný test sestrojíme pravostranný 100(1-α)% interval spolehlivosti pro střední hodnotu µ při společném neznámém rozptylu σ2 : (-∞, h) = (-∞, m1 – m2 + 21 * n 1 n 1 s + t1-α(n1+n2-2)) Pro pravostranný test sestrojíme levostranný 100(1-α)% interval spolehlivosti pro střední hodnotu µ při společném neznámém rozptylu σ2 : (d, ∞) = (m1 – m2 – 21 * n 1 n 1 s + t1-α(n1+n2-2), ∞) Pokud číslo c padne do tohoto intervalu, nulovou hypotézu nezamítáme na hladině významnosti α. V opačném případě nulovou hypotézu zamítáme na hladině významnosti α a přijímáme alternativní hypotézu. Provedení dvouvýběrového t-testu pomocí p-hodnoty Vypočteme p-hodnotu (nejlépe pomocí statistického software) a porovnáme ji s hladinou významnosti α. Jestliže p ≤ α, pak nulovou hypotézu zamítáme na hladině významnosti α a přijímáme alternativní hypotézu. Je-li p > α, pak nulovou hypotézu nezamítáme na hladině významnosti α. Způsob výpočtu p-hodnoty: Označme Φ distribuční funkci Studentova rozložení t(n1+n2-2). Pro oboustrannou alternativu p = 2 min{Φ( t0), 1- Φ( t0)}. Pro levostrannou alternativu p = Φ( t0). Pro pravostrannou alternativu p = 1- Φ( t0). Upozornění: Před provedením dvouvýběrového t-testu je zapotřebí testovat hypotézu o shodě rozptylů daných dvou rozložení (tzv. hypotézu homoskedasticity), tj. hypotézu H0: 2 2 2 1 σ σ = 1 proti alternativě H1: 2 2 2 1 σ σ ≠ 1. K tomu slouží F-test. Je založen na pivotové statistice F = 2 2 2 1 2 2 2 1 / S/S σσ ~ F(n1 – 1, n2 – 1). Nahradíme-li podíl 2 2 2 1 σ σ předpokládanou hodnotou 1, dostaneme testovou statistiku 2 2 2 1 0 S S T = , která se v případě platnosti H0 řídí rozložením F(n1-1, n2-1). Provedení F-testu pomocí kritického oboru Vypočteme realizaci testové statistiky 2 2 2 1 0 s s t = . Stanovíme kritický obor W. Pokud t0 ∈ W, H0 zamítáme na hladině významnosti α a přijímáme H1. Oboustranný test: Testujeme H0: 2 2 2 1 σ σ = 1 proti H1: 2 2 2 1 σ σ ≠ 1. Kritický obor má tvar: ( ) ( ) )( ∞−−∪−−= α−α ,1n,1nF1n,1nF,0W 212/1212/ . Levostranný test: Testujeme H0: 2 2 2 1 σ σ = 1 proti H1: 2 2 2 1 σ σ < 1. Kritický obor má tvar: ( )( 1n,1nF,0W 21 −−= α . Pravostranný test: Testujeme H0: 2 2 2 1 σ σ = 1 proti H1: 2 2 2 1 σ σ > 1. Kritický obor má tvar: ( ) )∞−−= α− ,1n,1nFW 211 . Provedení F-testu pomocí intervalu spolehlivosti Pro oboustranný test sestrojíme oboustranný 100(1-α)% interval spolehlivosti pro podíl rozptylů 2 2 2 1 σ σ : (d, h) =         −−−− αα )1n,1n(F s/s , )1n,1n(F s/s 21/2 2 2 2 1 21/2-1 2 2 2 1 Pro levostranný test sestrojíme pravostranný 100(1-α)% interval spolehlivosti pro podíl rozptylů 2 2 2 1 σ σ : (0, h) =         −−α )1n,1n(F s/s ,0 21 2 2 2 1 Pro pravostranný test sestrojíme levostranný 100(1-α)% interval spolehlivosti pro podíl rozptylů 2 2 2 1 σ σ : (d, ∞) =         ∞ −−α , )1n,1n(F s/s 21-1 2 2 2 1 . Pokud číslo c padne do intervalu spolehlivosti, nulovou hypotézu nezamítáme na hladině významnosti α. V opačném případě nulovou hypotézu zamítáme na hladině významnosti α a přijímáme alternativní hypotézu. Provedení F-testu pomocí p-hodnoty Vypočteme p-hodnotu (nejlépe pomocí statistického software) a porovnáme ji s hladinou významnosti α. Jestliže p ≤ α, pak nulovou hypotézu zamítáme na hladině významnosti α a přijímáme alternativní hypotézu. Je-li p > α, pak nulovou hypotézu nezamítáme na hladině významnosti α. Způsob výpočtu p-hodnoty: Označme Φ distribuční funkci Fisherova - Snedecorova rozložení F(n1-1, n2-1). Pro oboustrannou alternativu p = 2 min{Φ( t0), 1- Φ( t0)}. Pro levostrannou alternativu p = Φ( t0). Pro pravostrannou alternativu p = 1- Φ( t0). Příklad na dvouvýběrový t-test: V restauraci "U bílého koníčka" měřili ve 20 případech čas obsluhy zákazníka. Výsledky v minutách: 6, 8, 11, 4, 7, 6, 10, 6, 9, 8, 5, 12, 13, 10, 9, 8, 7, 11, 10, 5. V restauraci "Zlatý lev" bylo dané pozorování uskutečněno v 15 případech s těmito výsledky: 9, 11, 10, 7, 6, 4, 8, 13, 5, 15, 8, 5, 6, 8 ,7. Na hladině významnosti 0,05 testujte hypotézu, že střední hodnoty doby obsluhy jsou v obou restauracích stejné. Řešení pomocí systému STATISTICA: Otevřeme datový soubor restaurace.sta s dvěma proměnnými X a ID a 35 případy. V proměnné X jsou zapsány zjištěné doby obsluhy. Proměnná ID slouží k rozlišení restaurací – nabývá hodnoty 1 pro restauraci "U bílého koníčka" a hodnoty 2 pro restauraci „Zlatý lev“. Na hladině významnosti 0,05 testujeme nulovou hypotézu H0: µ1 - µ2 = 0 proti oboustranné alternativě H1: µ1 – µ2 ≠ 0. Je to úloha na dvouvýběrový t-test. Nejprve ověříme předpoklady dvouvýběrového t-testu. Nezávislost obou náhodných výběrů: splněno, plyne přímo ze způsobu pořízení dat. Normalita obou nezávislých náhodných výběrů: ověříme pomocí N-P grafů a Shapirova – Wilkova testu. Vytvoření N-P plotu pro oba výběry: Grafy – 2D Grafy – Normální pravděpodobnostní grafy – Proměnná X – OK - odškrtneme Neurčovat průměrnou pozici svázaných pozorování – zaškrtneme Shapiro – Wilkův test – na záložce Kategorizovaný zapneme Kategorie X – Změnit proměnnou - ID – OK – OK. Ověření normality pomocí N-P grafu a S-W testu: Normální p-graf z X; kategorizovaný id restaurace.sta 2v*35c Pozorovaný kvantil Oček.normál.hodnoty id: 1 2 4 6 8 10 12 14 16 -2,0 -1,5 -1,0 -0,5 0,0 0,5 1,0 1,5 2,0 id: 2 2 4 6 8 10 12 14 16 id: 1 X: SW-W = 0,9715; p = 0,7871 id: 2 X: SW-W = 0,9345; p = 0,3185 V obou případech jsou body v N-P grafu blízko ideální přímky. Pro první výběr S-W test poskytl p-hodnotu 0,7871, pro druhý výběr 0,3185, tedy na hladině významnosti 0,05 nezamítáme ani v jednom případě hypotézu o normalitě. Testování hypotézy o shodě rozptylů: Statistiky – Základní statistiky /tabulky – t-test, nezávislé, dle skupin – OK, Proměnné –Závislé proměnné X, Grupovací proměnná ID – OK. Po kliknutí na tlačítko Výpočet dostaneme tabulku: t-testy; grupováno: ID (restaurace.sta) Skup. 1: 1 Skup. 2: 2 Proměnná Průměr 1 Průměr 2 t sv p Poč.plat 1 Poč.plat. 2 Sm.odch. 1 Sm.odch. 2 F-poměr Rozptyly p Rozptyly X 8,250000 8,133333 0,123730 33 0,902279 20 15 2,510504 3,067495 1,492952 0,410440 Vidíme, že testová statistika pro test shody rozptylů se realizuje hodnotou 1,492952, odpovídající p-hodnota je 0,41044, tedy na hladině významnosti 0,05 nezamítáme hypotézu o shodě rozptylů. (Upozornění: v případě zamítnutí hypotézy o shodě rozptylů je zapotřebí v tabulce t-testu pro nezávislé vzorky dle skupin zaškrtnout volbu Test se samostatnými odhady rozptylu.) Testování hypotézy o shodě středních hodnot (provedení dvouvýběrového t-testu): Z výše uvedené výstupní tabulky plyne, že testová statistika pro test shody středních hodnot se realizuje hodnotou 0,12373, počet stupňů volnosti je 33, odpovídající p-hodnota 0,902279, tedy hypotézu o shodě středních hodnot nezamítáme na hladině významnosti 0,05. Neprokázal se rozdíl ve středních hodnotách dob obsluhy v restauracích "U bílého koníčka" a „Zlatý lev“. Tabulku ještě doplníme krabicovými diagramy. Na záložce Detaily zaškrtneme krabicový graf a vybereme volbu Průměr/SmCh/1,96*SmCh. Krabicový graf : X: doba obsluhy Průměr Průměr±SmCh Průměr±1,96*SmCh 1 2 ID 6,0 6,5 7,0 7,5 8,0 8,5 9,0 9,5 10,0 X Z grafu je vidět, že průměrná doba obsluhy v první restauraci je nepatrně delší a má menší variabilitu než ve druhé restauraci. Cohenův koeficient věcného účinku – doplnění významu dvouvýběrového t-testu: Cohenův koeficient d vypočteme podle vzorce: * 21 s mm d − = . Tento koeficient slouží k posouzení velikosti rozdílu průměrů, který je standardizován pomocí odmocniny z váženého průměru výběrových rozptylů. Jedná se o tzv. věcnou významnost neboli velikost účinku skupiny na variabilitu hodnot sledované náhodné veličiny. Velikost účinku hodnotíme podle následující tabulky: Hodnota d účinek aspoň 0,8 velký mezi 0,5 až 0,8 střední mezi 0,2 až 0,5 malý pod 0,2 zanedbatelný (Uvedené hodnoty nemají samozřejmě absolutní platnost, posouzení, jaký účinek považujeme za velký či malý, závisí na kontextu.) Je zapotřebí si uvědomit, že při dostatečně velkých rozsazích náhodných výběrů i malý rozdíl ve výběrových průměrech způsobí zamítnutí nulové hypotézy na hladině významnosti α, i když z věcného hlediska tak malý rozdíl nemá význam. Naopak, máme-li výběry malých rozsahů, pak i značně velký rozdíl ve výběrových průměrech nemusí vést k zamítnutí nulové hypotézy na hladině významnosti α. V předešlém příkladě d = 0,0423, tedy účinek restaurace na průměrnou dobu obsluhy je zcela zanedbatelný. 4. Provedení t-testů v systému STATISTICA pomocí aplikace Testy rozdílů Předpokládejme, že jsou splněny podmínky použití t-testů (normalita, v případě dvou výběrů nezávislost a homoskedasticita). Ze zadaných dat zjistíme rozsahy, průměry a směrodatné odchylky. Jednovýběrový t-test: Použijeme příklad s obsahem vitamínu C ve 20 vzorcích mrkve. V Základních statistikách a tabulkách vypočteme průměr (m = 34,86) a směrodatnou odchylku (s = 11,087) obsahu vitamínu C. Pak použijeme Testy rozdílů: r, %, průměry – OK – vybereme Rozdíl mezi dvěma průměry (normální rozdělení) – zaškrtneme Výběrový průměr vs. Střední hodnota – do políčka Pr1 napíšeme 34,86, do políčka SmOd1 napíšeme 11,087, do políčka N1 napíšeme 20, do políčka Pr2 napíšeme 35 - Výpočet. Dostaneme p-hodnotu 0,9556, tedy nezamítáme nulovou hypotézu na hladině významnosti 0,05. Párový t-test: Použijeme příklad s měřením vlhkosti 22 vzorků dřeva dvěma metodami. V Základních statistikách a tabulkách vypočteme průměr (m = -0,6318) a směrodatnou odchylku (s = 1,3113) rozdílů výsledků obou metod. Pak použijeme Testy rozdílů: r, %, průměry – OK – vybereme Rozdíl mezi dvěma průměry (normální rozdělení) – zaškrtneme Výběrový průměr vs. Střední hodnota – do políčka Pr1 napíšeme -0,6318, do políčka SmOd1 napíšeme 1,3113, do políčka N1 napíšeme 22, do políčka Pr2 napíšeme 0 - Výpočet. Dostaneme p-hodnotu 0,0346, tedy zamítáme nulovou hypotézu na hladině významnosti 0,05. Dvouvýběrový t-test: Použijeme příklad s dobami obsluhy zákazníků ve dvou restauracích. V Základních statistikách a tabulkách vypočteme průměry (m1 = 8,25, m2 = 8,1313 ) a směrodatné odchylky dob obsluhy v obou restauracích (s1 = 2,5105, s2 = 3,0675). Pak použijeme Testy rozdílů: r, %, průměry – OK – vybereme Rozdíl mezi dvěma průměry (normální rozdělení) – do políčka Pr1 napíšeme 8,25, do políčka SmOd1 napíšeme 2,5105, do políčka N1 napíšeme 20, do políčka Pr2 napíšeme 8,1313, do políčka SmOd2 napíšeme 3,0675, do políčka N2 napíšeme 15 – Výpočet. Dostaneme p-hodnotu 0,9006, tedy nezamítáme nulovou hypotézu na hladině významnosti 0,05.