Kapitola 4.: Úlohy o jednom náhodném výběru z normálního roz- ložení 4.1. Motivace Mnoho náhodných veličin, s nimiž se setkáváme ve výzkumu i praxi, se řídí normálním rozložením. Za jistých předpokladů obsažených v centrální limitní větě se dá rozložení jiných náhodných veličin aproximovat normálním rozložením. Proto je zapotřebí věnovat velkou pozornost právě náhodným výběrům z normálního rozložení. Normální rozložení je charakterizováno dvěma parametry ­ střední hodnotou a rozpty- lem 2 . Budeme tedy řešit úlohy, které se týkají těchto parametrů. Jedná se především o jed- novýběrový t-test či test o rozptylu. Seznámíme se rovněž se situací, kdy máme k dispozici jeden náhodný výběr z dvourozměrného normálního rozložení a posuzujeme rozdílnost střed- ních hodnot obou náhodných veličin. K řešení tohoto problému slouží párový t-test. 4.2. Rozložení statistik odvozených z výběrového průměru a výběrového rozptylu Nechť X1, ..., Xn je náhodný výběr z rozložení N(, 2 ). Pak platí a) Výběrový průměr M a výběrový rozptyl S2 jsou stochasticky nezávislé. b) M ~ N(, n 2 ), tedy U = n M - ~ N(0, 1). (Pivotová statistika U slouží k řešení úloh o , když 2 známe.) c) K = 2 2 S)1n( - ~ 2 (n-1). (Pivotová statistika K slouží k řešení úloh o 2 , když neznáme.) d) 2 n 1i 2 i )X( - = ~ 2 (n). (Tato pivotová statistika slouží k řešení úloh o 2 , když známe.) e) T = n S M - ~ t(n-1). (Pivotová statistika T slouží k řešení úloh o , když 2 neznáme.) 4.2.1. Příklad Na výrobní lince jsou automaticky baleny balíčky rýže o deklarované hmotnosti 1000 g. Působením náhodných vlivů hmotnost balíčků kolísá. Lze ji považovat za náhodnou veličinu, která se řídí normálním rozložením se střední hodnotou 996 g a směrodatnou odchylkou 18 g. Jaká je pravděpodobnost, že náhodně vybraný balíček rýže neprojde výstupní kontrolou, jest- liže je povolená tolerance 30 g od deklarované hmotnosti 1000 g? Řešení: X ~ N(996, 182 ), 18 996X U - = ~ N(0,1) ( ) 104,0925,0971,02)44,1()89,1(1 18 9961030 U 18 996970 P1)1030X970(P11030,970XP =--=-+-= = - << - -=<<-= 4.3. Intervaly spolehlivosti pro parametry , 2 V kapitole 1 jsme se seznámili s pojmem intervalu spolehlivosti pro parametrickou funkci h( ). Nyní se budeme zabývat speciálními případy, kdy za parametrickou funkci h() považujeme střední hodnotu nebo rozptyl 2 normálního rozložení. V příkladu 1.3.5. jsme si ukázali způsob, jak zkonstruovat interval spolehlivosti pro střední hodnotu , když rozptyl 2 známe. Odvození intervalu spolehlivosti pro další tři situace (tj. pro , když 2 neznáme, pro 2 , když neznáme a konečně pro 2 , když známe) provádět nebudeme, uvedeme jen pře- hled vzorců pro meze 100(1-)% empirických intervalů spolehlivosti pro tyto parametry . 4.3.1. Přehled vzorců a) Interval spolehlivosti pro , když 2 známe (využití pivotové statistiky U = n M - ~ N(0, 1)) Oboustranný: (d, h) = (m - n u1-/2, m + n u1-/2) Levostranný: (d, ) = (m - n u1-, ) Pravostranný: (-, h) = (-, m + n u1-) (Odvození: viz příklad 1.3.5.) b) Interval spolehlivosti pro , když 2 neznáme (využití pivotové statistiky T = n S M - ~ t(n-1)) Oboustranný: (d, h) = (m - n s t1-/2(n-1), m + n s t1-/2(n-1)) Levostranný: (d, ) = (m - n s t1-(n-1), ) Pravostranný: (-, h) = (-, m + n s t1-(n-1)) c) Interval spolehlivosti pro 2 , když neznáme (využití pivotové statistiky K = 2 2 S)1n( - ~ 2 (n-1)) Oboustranný: (d, h) = - - - - - )1n( s)1n( , )1n( s)1n( 2/ 2 2 2/1 2 2 Levostranný: (d, ) = - - - , )1n( s)1n( 1 2 2 Pravostranný: (-, h) = - - - )1n( s)1n( , 2 2 d) Interval spolehlivosti pro 2 , když známe (využití pivotové statistiky 2 n 1i 2 i )X( - = ~ 2 (n)) Oboustranný: (d, h) = - - = - = )n( )x( , )n( )x( 2/ 2 n 1i 2 i 2/1 2 n 1i 2 i Levostranný: (d, ) = - - = , )n( )x( 1 2 n 1i 2 i Pravostranný: (-, h) = - - = )n( )x( , 2 n 1i 2 i 4.3.2. Příklad 10 krát nezávisle na sobě byla změřena jistá konstanta . Výsledky měření byly: 2 1,8 2,1 2,4 1,9 2,1 2 1,8 2,3 2,2. Tyto výsledky považujeme za číselné realizace náhodného výběru X1, ..., X10 z rozložení N(, 2 ), kde parametry , 2 neznáme. Najděte 95% empirický interval spolehlivosti pro , a to a) oboustranný, b) levostranný, c) pravostranný. Řešení: Vypočteme realizaci výběrového průměru: m = 2,06, výběrového rozptylu: s2 = 0,0404 a vý- běrové směrodatné odchylky: s = 0,2011. Riziko je 0,05. Jde o situaci popsanou v bodě (b), kde využíváme pivotovou statistiku T, která se řídí Studentovým rozložením t(9). V tabulkách najdeme kvantil t0,975(9) = 2,2622 pro oboustranný interval spolehlivosti a kvantil t0,95(9) = 1,8331 pro jednostranné intervaly spolehlivosti. ad a) d = m - n s t1-/2(n-1) = 2,06 - 10 2011,0 2,2622 = 1,92 h = m + n s t1-/2(n-1) = 2,06 + 10 2011,0 2,2622 = 2,20 1,92 < < 2,20 s pravděpodobností aspoň 0,95. ad b) d = m - n s t1-(n-1) = 2,06 - 10 2011,0 1,8331 = 1,94 1,94 < s pravděpodobností aspoň 0,95. ad c) h = m + n s t1-(n-1) = 2,06 + 10 2011,0 1,8331 = 2,18 < 2,18 s pravděpodobností aspoň 0,95. 4.4. Testování hypotéz o parametrech , 2 a) Nechť X1, ..., Xn je náhodný výběr N(, 2 ), kde 2 známe. Nechť n 2 a c je konstanta. Test H0: = c proti H1: c se nazývá z-test. b) Nechť X1, ..., Xn je náhodný výběr N(, 2 ), kde 2 neznáme. Nechť n 2 a c je konstan- ta. Test H0: = c proti H1: c se nazývá jednovýběrový t-test. c) Nechť X1, ..., Xn je náhodný výběr N(, 2 ), kde neznáme. Nechť n 2 a c je konstanta. Test H0: 2 = c proti H1: 2 c se nazývá test o rozptylu. 4.4.1. Provedení testů o parametrech , 2 pomocí kritického oboru V kapitole 1 byly uvedeny tři způsoby testování hypotéz ­ pomocí kritického oboru, pomocí intervalu spolehlivosti a pomocí p-hodnoty. V tomto odstavci si ukážeme, jak testovat hypotézy o střední hodnotě a rozptylu 2 pomocí kritického oboru. a) Provedení z-testu H0: = c proti H1: c (resp. H1: < c resp. H1: > c) zamítáme na hladině významnosti , jestliže 2/1u n cm - - (resp. -- - 1u n cm resp. - - 1u n cm ). b) Provedení jednovýběrového t-testu H0: = c proti H1: c (resp. H1: < c resp. H1: > c) zamítáme na hladině významnosti , jestliže )1n(t n s cm 2/1 - - - (resp. )1n(t n s cm 1 -- - - resp. )1n(t n s cm 1 - - - ). c) Provedení testu o rozptylu H0: 2 = c proti H1: 2 c (resp. H1: 2 < c resp. H1: 2 > c) zamítáme na hladině významnosti , jestliže - c s)1n( 2 2 /2(n-1) nebo - c s)1n( 2 2 1-/2(n-1) (resp. - c s)1n( 2 2 (n-1) nebo - c s)1n( 2 2 1-(n-1)). Před provedením kteréhokoli z uvedených testů je zapotřebí ověřit normalitu dat pomocí diagnostických grafů a testů normality popsaných v kapitole 3. Zjistíme-li u jednovýběrového t-testu, že rozsah souboru je malý (n < 30) a porušení normality je výraznější, doporučuje se přejít k neparametrickému jednovýběrovému Wilcoxonovu testu (viz kapitola 7). Pro výběry větších rozsahů není mírné porušení normality na překážku použití uvedených testů. 4.4.2. Příklad Podle údajů na obalu čokolády by její čistá hmotnost měla být 125g. Výrobce dostal několik stížností od kupujících, ve kterých tvrdili, že hmotnost čokolád je nižší než deklaro- vaných 125g. Z tohoto důvodu oddělení kontroly náhodně vybralo 50 čokolád a zjistilo, že jejich průměrná hmotnost je 122g a směrodatná odchylka 8,6g. Za předpokladu, že hmotnost čokolád se řídí normálním rozložením, můžeme na hladině významnosti 0,01 považovat stíž- nosti kupujících za oprávněné? Řešení: X1, ..., X50 je náhodný výběr z N(, 2 ). Testujeme hypotézu H0: = 125 proti le- vostranné alternativě H1: < 125. Protože neznáme rozptyl 2 , použijeme jednovýběrový t- test. Testové kritérium 4667,2 50 6,8 125122 n s cm -= - = - . Absolutní hodnotu testového kritéria porovnáme s kvantilem t0,99(49) = 2,4049. Jelikož 2,4667 2,4049, zamítáme nulovou hypotézu na hladině významnosti 0,01. Stížnosti kupujících tedy lze považovat za oprávněné. 4.5. Náhodný výběr z dvourozměrného normálního rozložení Nechť n n 1 1 Y X ,, Y X K je náhodný výběr z rozložení N2 2 212 12 2 1 2 1 , , přičemž n2. Označíme = 1- 2 a zavedeme rozdílový náhodný výběr Z1 = X1-Y1, ..., Zn = Xn-Yn. Vypočteme = = n 1i iZ n 1 M , ( ) = -= n 1i 2 i 2 MZ n 1 S . 4.5.1. Interval spolehlivosti pro parametr Pro výpočet mezí 100(1-)% empirického intervalu spolehlivosti pro střední hodnotu použijeme vzorec uvedený v 4.3.1. (b). 4.5.2. Párový t-test Testujeme H0: 1 - 2 = 0 (tj. = 0) proti H1: 1 - 2 0 (tj 0). Přechodem k rozdílovému náhodnému výběru převedeme párový t-test na jednovýběrový t-test, jehož provedení je popsáno v 4.4.1. (b). Před provedením párového t-testu je zapotřebí se aspoň orientačně přesvědčit o dvou- rozměrné normalitě dat pomocí dvourozměrného tečkového diagramu. Je-li rozsah výběru malý (n < 30) a porušení normality je výraznější, je zapotřebí místo párového testu použít neparametrický párový Wilcoxonův test (viz kapitola 7). Pro výběry větších rozsahů, které vykazují jen mírné porušení normality, můžeme použít párový t-test. 4.5.3. Příklad Na 10 automobilech stejného typu se testovaly dva druhy benzínu lišící se oktanovým číslem. U každého automobilu se při průměrné rychlosti 90 km/h měřil dojezd (tj. dráha, kte- rou ujede na dané množství benzínu) při použití každého z obou druhů benzínu. Výsledky: Číslo auta 1 2 3 4 5 6 7 8 9 10 benzín A 17,5 20,0 18,9 17,9 16,4 18,9 17,2 17,5 18,5 18,2 benzín B 17,8 20,8 19,5 18,3 16,6 19,5 17,5 17,9 19,1 18,6 Za předpokladu, že dojezd se řídí normálním rozložením, testujte na hladině významnosti 0,05 hypotézu, že rozdíl středních hodnot dojezdu při dvou druzích benzínu se neliší. Řešení: Pomocí dvourozměrného tečkového diagramu se zakreslenou 95% elipsou konstantní hustoty pravděpodobnosti posoudíme oprávněnost předpokladu o dvourozměrné normalitě dat. 14 15 16 17 18 19 20 21 22 14 15 16 17 18 19 20 21 22 23 Vidíme, že tečky se řadí do velmi úzkého elipsovitého obrazce. Data můžeme považovat za realizace náhodného výběru z dvourozměrného normálního rozložení. Přejdeme k rozdílovému náhodnému výběru. Označíme = 1 - 2. Testujeme hypotézu H0: = 0 proti H1: 0 na hladině významnosti 0,05. Vypočteme m = -0,46, s = 0,1838 a testové kritérium t0 = -7,9148. Absolutní hodnotu testového kritéria porovnáme s kvantilem t0,975(9) = 2,2622. Protože 7,9148 2,2622, zamítáme nulovou hypotézu na hladině význam- nosti 0,05. Kontrolní otázky 1. Jaké pivotové statistiky odvozené z výběrového průměru M a výběrového rozptylu S2 pou- žíváme při řešení úloh o střední hodnotě a rozptylu 2 normálního rozložení? 2. Jak vypadají meze 100(1-)% empirického intervalu spolehlivosti pro neznámou střední hodnotu , když rozptyl 2 není znám? 3. Jaké testy o parametrech normálního rozložení znáte? 4. V jaké situaci a za jakých podmínek použijete jednovýběrový t-test? 5. V jaké situaci a za jakých podmínek použijete dvouvýběrový t-test? Příklady 1. Lze předpokládat, že hmotnost pomerančů dodávaných do obchodní sítě se řídí normálním rozložením se střední hodnotou 170 g a směrodatnou odchylkou 12 g. Jaká je pravděpodob- nost, že celková hmotnost devíti náhodně vybraných pomerančů balených do síťky překročí 1,5 kg? Výsledek: Hledaná pravděpodobnost je 0,797. 2. Počet bodů v testu inteligence je náhodná veličina, která se řídí rozložením N(100,225). Jaká je pravděpodobnost, že průměr v náhodně vybrané skupině 20 osob bude větší než 105 bodů? Výsledek: Hledaná pravděpodobnost je 0,06811. 3. Při provádění určitého pokusu bylo zapotřebí udržovat v laboratoři konstantní teplotu 26,5°C. Teplota byla v jednom pracovním týdnu 46x namátkově kontrolována v různých den- ních a nočních hodinách. Z výsledků měření byly vypočteny realizace výběrového průměru a výběrové směrodatné odchylky: m = 26,33°C, s = 0,748°C. Za předpokladu, že výsledky mě- ření teploty se řídí rozložením N(,2 ), vypočtěte 95% empirický interval spolehlivosti a) pro střední hodnotu b) pro směrodatnou odchylku . Výsledek: ad a) Dosazením do vzorce 4.3.1. (b) dostaneme 26,11°C < < 26,55°C s pravděpodobností aspoň 0,95. ad b) Dosazením do vzorce 4.3.1. (d), kde meze odmocníme, dostaneme 0,62°C < < 0,94°C s pravděpodobností aspoň 0,95. 4. U 25 náhodně vybraných dvoulitrových lahví s nealkoholickým nápojem byl zjištěn přesný objem nápoje. Výběrový průměr činil m = 1,99 l a výběrová směrodatná odchylka s = 0,1 l. Předpokládejme, že objem nápoje v láhvi je náhodná veličina s normálním rozložením. a) Na hladině významnosti 0,05 ověřte tvrzení výrobce, že zákazník není znevýhodněn. b) Na hladině významnosti 0,05 ověřte tvrzení výrobce, že směrodatná odchylka je 0,08 l. Výsledek: ad a) Testujeme hypotézu H0: = 2 proti levostranné alternativě H1: < 2 pomocí jednovýbě- rového t-testu (viz 4.4.1. (b)). Jelikož hodnota testového kritéria -0,5 neleží v kritickém oboru ( 064,2;-- , nezamítáme nulovou hypotézu na hladině významnosti 0,05. ad b) Testujeme hypotézu H0: = 0,08 proti oboustranné alternativě H1: 0,08 pomocí testu o rozptylu (viz 4.4.1. (c)). Jelikož hodnota testového kritéria 37,5 neleží v kritickém obo- ru ( ) ;4,394,12;0 , nejsme oprávněni na hladině významnosti 0,05 zamítnout tvrzení vý- robce. 5. (S) Bylo vybráno šest nových vozů téže značky a po určité době bylo zjištěno, o kolik mm se sjely jejich levé a pravé přední pneumatiky. Výsledky: (1,8; 1,5), (1,0; 1,1), (2,2; 2,0), (0,9; 1,1), (1,5; 1,4), (1,6; 1,4). Za předpokladu, že uvedené dvojice tvoří náhodný výběr z dvourozměrného normálního rozložení s vektorem středních hodnot (1, 2), testujte na hla- dině významnosti 0,05 hypotézu, že obě pneumatiky se sjíždějí stejně rychle. Výsledek: Vzhled dvourozměrného tečkového diagramu není v rozporu s předpokladem o dvourozměr- ném normálním rozložení. Přejdeme k rozdílovému náhodnému výběru a testujeme nulovou- hypotézu H0: = 0 proti oboustranné alternativě H1: 0 pomocí párového t-testu. Hodnota testového kritéria = 1,0512, počet stupňů volnosti = 5. Protože odpovídající p-hodnota = 0,3411 je větší než hladina významnosti 0,05, nelze na hladině významnosti 0,05 zamítnout nulovou hypotézu. Ke stejnému rozhodnutí dospějeme, pokud stanovíme kritický obor: W = ( ) ( )-- ;571,2571,2; . Testové kritérium se nerealizuje v kritickém oboru, tedy nelze na hladině významnosti 0,05 zamítnout nulovou hypotézu. 6. (S) Uměle připravený vzorek minerálu obsahoval 10% křemene a byl 12 krát proměřen. Výsledky měření byly: 8,7 10,2 10,07 9,75 9,65 10,37 10,14 10,5 9,48 11,22 9,49 9,86. Na hladině významnosti 0,05 testujte hypotézu, že obsah křemene byl stanoven správně. Výsledek: K-S test ani S-W test nezamítají na hladině významnosti 0,05 normalitu dat. Testujeme nulo- vou hypotézu H0: = 10 proti oboustranné alternativě H1: 10. Úloha vede na jednovýbě- rový t-test. Realizace testového kritéria = -0,262, počet stupňů volnosti = 1. Protože odpoví- dající p-hodnota = 0,7981 je větší než hladina významnosti 0,05, nelze na hladině významnos- ti 0,05 zamítnout nulovou hypotézu.