Testování hypotéz: Dvě populace Povinná literatura: Mann (2016), Kapitola 10 Z čeho studovat desátou lekci? Povinná literatura: Mann (2016), kap. 10 Příprava na cvičení: Leaflet 11 Koncepty a procedury, cv. 11, kap. 10 Příprava na zkoušku: Mann (2016), kap. 10 Leaflet 11 Sbírka úloh, kap. 10 Koncepty a procedury, cv. 11, kap. 10 ·Testování hypotéz: Dvě populace · 2 / 77 Motivace Rozhodování v ekonomii často vyžaduje porovnání dvou skupin – například porovnání efektivity mezi různými metodami, analýza vlivu intervence na ekonomický ukazatel, nebo testování rozdílů mezi dvěma trhy. Nepárový t-test je vhodný pro porovnání dvou nezávislých skupin. Příklady: Porovnání platů v různých odvětvích. Rozdíly v útratách mezi zákazníky v různých regionech. Párový t-test nám umožňuje porovnávat stejnou skupinu před a po určité změně nebo zásahu. Příklady: Měření dopadu vzdělávacího programu na znalosti zaměstnanců. Změna spotřebního chování po ekonomické reformě. Cíl přednášky: Naučíme se, jak a kdy použít t-test k zodpovězení ekonomických otázek, jak interpretovat výsledky a jak přemýšlet o statistické významnosti v kontextu ekonomického výzkumu. ·Testování hypotéz: Dvě populace · 3 / 77 Obsah Nezávislé versus závislé vzorky Odhady rozdílu, dvě NZV populace, σ1 a σ2 známé Odhady rozdílu, dvě NZV populace, σ1 = σ2 neznámé Odhady rozdílu, dvě NZV populace, σ1 ̸= σ2 neznámé Testování rozdílů dvou závislých vzorků Odhady podílu, dvě NZV populace ·Testování hypotéz: Dvě populace · 4 / 77 Nezávislé versus závislé vzorky Nezávislé versus závislé vzorky Nezávislé versus závislé vzorky Dva vzorky získané ze dvou populací jsou nezávislé, pokud výběr jednoho vzorku z jedné populace neovlivňuje výběr druhého vzorku z druhé populace. V opačném případě jsou vzorky závislé. ·Testování hypotéz: Dvě populace · 5 / 77 Nezávislé versus závislé vzorky Nezávislé versus závislé vzorky Nezávislé versus závislé vzorky Příklad 1: Předpokládejme, že chceme odhadnout rozdíl mezi průměrnými platy všech mužských a všech ženských manažerů. K tomu získáme dva vzorky, jeden z populace mužských manažerů a druhý z populace ženských manažerů. Tyto dva vzorky jsou nezávislé, protože jsou získány z dvou různých populací a navzájem se neovlivňují. Příklad 2: Předpokládejme, že chceme odhadnout rozdíl mezi průměrnými hmotnostmi všech účastníků před a po absolvování programu hubnutí. K tomu si vezmeme vzorek 40 účastníků a změříme jejich hmotnost před a po dokončení tohoto programu. Všimněte si, že tyto dva vzorky zahrnují tytéž 40 účastníků. To je příklad dvou závislých vzorků. ·Testování hypotéz: Dvě populace · 6 / 77 Nezávislé versus závislé vzorky Nezávislé versus závislé vzorky Obsah Nezávislé versus závislé vzorky Odhady rozdílu, dvě NZV populace, σ1 a σ2 známé Odhady rozdílu, dvě NZV populace, σ1 = σ2 neznámé Odhady rozdílu, dvě NZV populace, σ1 ̸= σ2 neznámé Testování rozdílů dvou závislých vzorků Odhady podílu, dvě NZV populace ·Testování hypotéz: Dvě populace · 7 / 77 Odhady rozdílu, dvě NZV populace, σ1 a σ2 známé Odhady rozdílu mezi průměry dvou populací pro nezávislé vzorky: σ1 a σ2 známy Průměr, směrodatná odchylka a rozdělení ¯x1 − ¯x2 Intervalový odhad µ1 − µ2 Testování hypotéz o µ1 − µ2 ·Testování hypotéz: Dvě populace · 8 / 77 Odhady rozdílu, dvě NZV populace, σ1 a σ2 známé Průměr, směrodatná odchylka a rozdělení ¯x1 − ¯x2 Průměr, směrodatná odchylka a rozdělení ¯x1 − ¯x2 Pokud platí tři podmínky: 1. Oba vzorky jsou nezávislé. 2. Směrodatné odchylky σ1 a σ2 obou populací jsou známy. 3. Splněna je alespoň jedna z následujících podmínek: i. Oba vzorky jsou velké (tj. n1 ≥ 30 a n2 ≥ 30). ii. Jsou-li oba vzorky malé, pak populace, z nichž byly vzorky získány, jsou normálně rozděleny. Pak je vzorkovací rozdělení ¯x1 − ¯x2 přibližně normálně rozděleno. ·Testování hypotéz: Dvě populace · 9 / 77 Odhady rozdílu, dvě NZV populace, σ1 a σ2 známé Průměr, směrodatná odchylka a rozdělení ¯x1 − ¯x2 Průměr, směrodatná odchylka a rozdělení ¯x1 − ¯x2 Když jsou splněny podmínky uvedené na předchozím snímku, rozdělení ¯x1 − ¯x2 je přibližně normální s průměrem µ¯x1−¯x2 = µ1 − µ2 a směrodatnou odchylkou σ¯x1−¯x2 = σ2 1 n1 + σ2 2 n2 ·Testování hypotéz: Dvě populace · 10 / 77 Odhady rozdílu, dvě NZV populace, σ1 a σ2 známé Interval spolehlivosti pro µ1 − µ2 Interval spolehlivosti pro µ1 − µ2 S využitím normálního rozdělení je (1 − α)100% interval spolehlivosti pro µ1 − µ2 vyjádřen jako: (¯x1 − ¯x2) ± zσ¯x1−¯x2 Hodnota z je získána z tabulky normálního rozdělení pro danou úroveň spolehlivosti. Hodnota σ¯x1−¯x2 je vypočítána, jak bylo vysvětleno dříve. Poznámka: Zde ¯x1 − ¯x2 je bodový odhad µ1 − µ2. ·Testování hypotéz: Dvě populace · 11 / 77 Odhady rozdílu, dvě NZV populace, σ1 a σ2 známé Interval spolehlivosti pro µ1 − µ2 Příklad 3 Zadání: Podle průzkumu činil průměrný příspěvek zaměstnavatele na zdravotní pojištění 16 834 dolarů v roce 2014 a 15 745 dolarů v roce 2012. Předpokládejme, že tyto průměry byly založeny na náhodných vzorcích 250 a 200 zaměstnanců, kteří měli takové zdravotní pojištění v letech 2014 a 2012 domluvené. Dále předpokládejme, že směrodatné odchylky populace pro roky 2014 a 2012 byly 2160 dolarů a 1990 dolarů. Nechť µ1 a µ2 jsou příslušné populační průměry ročních příspěvků pro roky 2014 a 2012. (a) Jaký je bodový odhad µ1 − µ2? (b) Sestrojte 97% interval spolehlivosti pro µ1 − µ2. ·Testování hypotéz: Dvě populace · 12 / 77 Odhady rozdílu, dvě NZV populace, σ1 a σ2 známé Interval spolehlivosti pro µ1 − µ2 Příklad 3: Řešení (a) Bodový odhad µ1 − µ2 je hodnota ¯x1 − ¯x2 = $16 834 − $15 745 = $1 089 (b) 97% interval spolehlivosti => kritická hodnota z je 2.17. σ¯x1−¯x2 = σ2 1 n1 + σ2 2 n2 = (2160)2 250 + (1990)2 200 = 196.1196 (¯x1 − ¯x2) ± zσ¯x1−¯x2 = ($16 834 − $15 745) ± 2.17 · (196.1196) = 1089 ± 425.58 = $663.42 až $1514.58 Takže s 97% jistotou můžeme říci, že rozdíl mezi průměrnými ročními příspěvky na zdravotní pojištění v letech 2014 a 2012 je mezi $663.42 a $1514.58. ·Testování hypotéz: Dvě populace · 13 / 77 Odhady rozdílu, dvě NZV populace, σ1 a σ2 známé Testování hypotéz o µ1 − µ2 Testování hypotéz o µ1 − µ2 1. Testování alternativní hypotézy, že průměry dvou populací jsou rozdílné, je ekvivalentní k µ1 ̸= µ2, což je totéž jako µ1 − µ2 ̸= 0. 2. Testování alternativní hypotézy, že průměr první populace je větší než průměr druhé populace, je ekvivalentní µ1 > µ2, což je to samé jako µ1 − µ2 > 0. 3. Testování alternativní hypotézy, že průměr první populace je menší než průměr druhé populace, je ekvivalentní µ1 < µ2, což je to samé jako µ1 − µ2 < 0. ·Testování hypotéz: Dvě populace · 14 / 77 Odhady rozdílu, dvě NZV populace, σ1 a σ2 známé Testování hypotéz o µ1 − µ2 Testování hypotéz o µ1 − µ2 Při použití normálního rozdělení se hodnota testovací statistiky z pro ¯x1 − ¯x2 vypočítá jako: z = (¯x1 − ¯x2) − (µ1 − µ2) σ¯x1−¯x2 Hodnota µ1 − µ2 je nahrazena z H0. Poznámka: Hodnota σ¯x1−¯x2 je vypočítána tak, jak bylo vysvětleno dříve v této přednášce. ·Testování hypotéz: Dvě populace · 15 / 77 Odhady rozdílu, dvě NZV populace, σ1 a σ2 známé Testování hypotéz o µ1 − µ2 Příklad 4 Zadání: Vraťme se k Příkladu 3 o průměrných ročních příspěvcích na zdravotní pojištění v letech 2014 a 2012. Testujte na hladině významnosti 1 %, zda se populační průměry pro oba roky liší. ·Testování hypotéz: Dvě populace · 16 / 77 Odhady rozdílu, dvě NZV populace, σ1 a σ2 známé Testování hypotéz o µ1 − µ2 Příklad 4: Řešení Krok 1: Stanovíme hypotézy H0 : µ1 − µ2 = 0 (Populační průměry nejsou rozdílné.) H1 : µ1 − µ2 ̸= 0 (Populační průměry jsou rozdílné.) Krok 2: Směrodatné odchylky populace, σ1 a σ2, jsou známé. Oba vzorky jsou velké; n1 > 30 a n2 > 30. Proto používáme normální rozdělení k provedení testu hypotézy. Krok 3: α = 0.01. Znak ̸= v alternativní hypotéze naznačuje, že test je oboustranný. Oblast v každém konci → α/2 = 0.01/2 = 0.005 Kritické hodnoty z jsou 2.58 a -2.58. ·Testování hypotéz: Dvě populace · 17 / 77 Odhady rozdílu, dvě NZV populace, σ1 a σ2 známé Testování hypotéz o µ1 − µ2 Příklad 4: Řešení ·Testování hypotéz: Dvě populace · 18 / 77 Odhady rozdílu, dvě NZV populace, σ1 a σ2 známé Testování hypotéz o µ1 − µ2 Příklad 4: Řešení Krok 4: σ¯x1−¯x2 = σ2 1 n1 + σ2 2 n2 = (2160)2 250 + (1990)2 200 = 196.1196064 z = (¯x1 − ¯x2) − (µ1 − µ2) σ¯X1−¯X2 = ($16834 − $15745) − 0 196.1196064 = 5.55 Krok 5: Protože hodnota testovací statistiky z = 5.55 spadá do oblasti zamítnutí, zamítáme nulovou hypotézu H0. Tudíž konstatujeme, že průměrné roční příspěvky na zdravotní pojištění sponzorované zaměstnavatelem pro rodinné krytí byly v letech 2014 a 2012 rozdílné. ·Testování hypotéz: Dvě populace · 19 / 77 Odhady rozdílu, dvě NZV populace, σ1 a σ2 známé Testování hypotéz o µ1 − µ2 Obsah Nezávislé versus závislé vzorky Odhady rozdílu, dvě NZV populace, σ1 a σ2 známé Odhady rozdílu, dvě NZV populace, σ1 = σ2 neznámé Odhady rozdílu, dvě NZV populace, σ1 ̸= σ2 neznámé Testování rozdílů dvou závislých vzorků Odhady podílu, dvě NZV populace ·Testování hypotéz: Dvě populace · 20 / 77 Odhady rozdílu, dvě NZV populace, σ1 = σ2 neznámé Odhady rozdílu mezi průměry dvou populací pro nezávislé vzorky: σ1 a σ2 neznámé, ale σ1 = σ2 Intervalový odhad µ1 − µ2 Testování hypotéz o µ1 − µ2 ·Testování hypotéz: Dvě populace · 21 / 77 Odhady rozdílu, dvě NZV populace, σ1 = σ2 neznámé Intervalový odhad µ1 − µ2 Vážená směrodatná odchylka pro dva vzorky Vážená směrodatná odchylka pro dva vzorky se vypočítá jako: sp = (n1 − 1)s2 1 + (n2 − 1)s2 2 n1 + n2 − 2 kde n1 a n2 jsou velikosti vzorků a s2 1 a s2 2 jsou rozptyly těchto vzorků. Zde sp je estimátor pro σ. Estimátor směrodatné odchylky pro ¯x1 − ¯x2 je: s¯x1−¯x2 = sp 1 n1 + 1 n2 ·Testování hypotéz: Dvě populace · 22 / 77 Odhady rozdílu, dvě NZV populace, σ1 = σ2 neznámé Intervalový odhad µ1 − µ2 Interval spolehlivosti µ1 − µ2 (1 − α)100% interval spolehlivosti pro µ1 − µ2 je: (¯x1 − ¯x2) ± ts¯x1−¯x2 kde hodnota t je získána z tabulky rozdělení t pro danou úroveň spolehlivosti a n1 + n2 − 2 stupňů volnosti a s¯x1−¯x2 je vypočítána, jak bylo vysvětleno dříve. ·Testování hypotéz: Dvě populace · 23 / 77 Odhady rozdílu, dvě NZV populace, σ1 = σ2 neznámé Intervalový odhad µ1 − µ2 Příklad 5 Zadání: Agentura spotřebitelské ochrany chtěla odhadnout rozdíl v průměrných množstvích kofeinu u dvou značek kávy. Agentura vzala vzorek 15 jednolitrových sklenic kávy značky I, který ukázal, že průměrné množství kofeinu v těchto sklenicích je 80 miligramů na sklenici se směrodatnou odchylkou 5 miligramů. Další vzorek 12 jednolitrových sklenic kávy značky II poskytl průměrné množství kofeinu rovné 77 miligramů na sklenici se směrodatnou odchylkou 6 miligramů. Sestrojte 95% interval spolehlivosti pro rozdíl mezi průměrným množstvím kofeinu v jednolitrových sklenicích těchto dvou značek kávy. Předpokládejte, že obě populace mají normální rozdělení a že směrodatné odchylky obou populací jsou stejné. ·Testování hypotéz: Dvě populace · 24 / 77 Odhady rozdílu, dvě NZV populace, σ1 = σ2 neznámé Intervalový odhad µ1 − µ2 Příklad 5: Řešení Ssp = (n1 − 1)s2 1 + (n2 − 1)s2 2 n1 + n2 − 2 = (15 − 1)52 + (12 − 1)62 15 + 12 − 2 = 5.4626 s¯X1−¯X2 = sp 1 n1 + 1 n2 = 5.4626 1 15 + 1 12 = 2.1155 Plocha v každém ocasu = α/2 = 0.5 − (0.95/2) = 0.025 Stupně volnosti = n1 + n2 − 2 = 25 t = 2.060 (¯x1 − ¯x2) ± ts¯x1−¯x2 = (80 − 77) ± 2.060(2.11565593) = 3 ± 4.36 = −1.36 až 7.36 miligramů ·Testování hypotéz: Dvě populace · 25 / 77 Odhady rozdílu, dvě NZV populace, σ1 = σ2 neznámé Intervalový odhad µ1 − µ2 Testování hypotézy o µ1 − µ2 Hodnota testovací statistiky t pro ¯x1 − ¯x2 je vypočítána jako: t = (¯x1 − ¯x2) − (µ1 − µ2) s¯x1−¯x2 Hodnota µ1 − µ2 v tomto vzorci je nahrazena z nulové hypotézy a s¯x1−¯x2 je vypočítán, jak bylo vysvětleno dříve. ·Testování hypotéz: Dvě populace · 26 / 77 Odhady rozdílu, dvě NZV populace, σ1 = σ2 neznámé Intervalový odhad µ1 − µ2 Příklad 6 Zadání: Vzorek 14 plechovek dietní sody Brand I dává průměrný počet kalorií 23 na plechovku se směrodatnou odchylkou 3 kalorie. Další vzorek 16 plechovek dietní sody Brand II dává průměrný počet kalorií 25 na plechovku se směrodatnou odchylkou 4 kalorie. Můžeme při zvolené hladině významnosti 1 % vyvodit, že se průměrný počet kalorií na plechovku pro tyto dvě značky dietní sodovky liší? Předpokládejme, že kalorický obsah dietní sodovky na plechovku je normálně rozložený pro obě značky a že směrodatné odchylky pro obě populace jsou stejné. ·Testování hypotéz: Dvě populace · 27 / 77 Odhady rozdílu, dvě NZV populace, σ1 = σ2 neznámé Intervalový odhad µ1 − µ2 Příklad 6: Řešení Krok 1: Stanovíme hypotézy H0 : µ1 − µ2 = 0 (Průměrný počet kalorií není rozdílný.) H1 : µ1 − µ2 ̸= 0 (Průměrný počet kalorií je rozdílný.) Krok 2: Oba vzorky jsou nezávislé. Směrodatné odchylky σ1 a σ2 jsou neznámé, ale rovné. Velikosti vzorků jsou malé, ale obě populace jsou normálně rozděleny. Použijeme t-rozdělení. Krok 3: α = 0.01. Znak ̸= v alternativní hypotéze naznačuje, že test je oboustranný. Oblast v každém konci → α/2 = 0.01/2 = 0.005. Stupně volnosti df = n1 + n2 − 2 = 14 + 16 − 2 = 28. Kritické hodnoty t jsou 2.763 a -2.763. ·Testování hypotéz: Dvě populace · 28 / 77 Odhady rozdílu, dvě NZV populace, σ1 = σ2 neznámé Intervalový odhad µ1 − µ2 Příklad 6: Řešení ·Testování hypotéz: Dvě populace · 29 / 77 Odhady rozdílu, dvě NZV populace, σ1 = σ2 neznámé Intervalový odhad µ1 − µ2 Příklad 6: Řešení Krok 4: sp = (n1 − 1)s2 1 + (n2 − 1)s2 2 n1 + n2 − 2 = 3.5707, s¯x1−¯x2 = sp 1 n1 + 1 n2 = 3.5707 1 14 + 1 16 = 1.3067, t = (¯x1 − ¯x2) − (µ1 − µ2) s¯x1−¯x2 = (23 − 25) − 0 1.3067 = −1.531. Krok 5: Hodnota testovací statistiky t = 1.531 se nachází v oblasti nezamítnutí. Proto nezamítáme nulovou hypotézu. Důsledkem je, že docházíme k závěru, že neexistuje rozdíl v průměrném počtu kalorií na plechovku mezi oběma značkami dietních sodovek. ·Testování hypotéz: Dvě populace · 30 / 77 Odhady rozdílu, dvě NZV populace, σ1 = σ2 neznámé Intervalový odhad µ1 − µ2 Příklad 7 Zadání: Vzorek 40 dětí z Prahy ukázal, že průměrný čas, který tráví sledováním instagramu, je 28.50 hodin týdně se směrodatnou odchylkou 4 hodiny. Další vzorek 35 dětí z Brna ukázal, že průměrný čas, který tráví sledováním instagramu, je 23.25 hodin týdně se směrodatnou odchylkou 5 hodin. Můžete usoudit, s využitím hladiny významnosti 2.5 %, že průměrný čas, který děti tráví sledováním instagramu v Praze, je větší než ten pro děti v Brně? Předpokládejme, že směrodatné odchylky pro obě populace jsou stejné. ·Testování hypotéz: Dvě populace · 31 / 77 Odhady rozdílu, dvě NZV populace, σ1 = σ2 neznámé Intervalový odhad µ1 − µ2 Příklad 7: Řešení Krok 1: Stanovíme hypotézy H0 : µ1 − µ2 = 0 H1 : µ1 − µ2 > 0 Krok 2: Oba vzorky jsou nezávislé. Směrodatné odchylky σ1 a σ2 jsou neznámé, ale rovné. Velikosti vzorků jsou velké. Použijeme t-rozdělení. Krok 3: α = 0.025. Znak > v alternativní hypotéze naznačuje, že test je pravostranný. Oblast v pravém konci → α = 0.025. Stupně volnosti df = n1 + n2 − 2 = 40 + 35 − 2 = 73. Kritická hodnota t je 1.993. ·Testování hypotéz: Dvě populace · 32 / 77 Odhady rozdílu, dvě NZV populace, σ1 = σ2 neznámé Intervalový odhad µ1 − µ2 Příklad 7: Řešení ·Testování hypotéz: Dvě populace · 33 / 77 Odhady rozdílu, dvě NZV populace, σ1 = σ2 neznámé Intervalový odhad µ1 − µ2 Příklad 7: Řešení Krok 4: sp = (n1 − 1)s2 1 + (n2 − 1)s2 2 n1 + n2 − 2 = 4.4935, s¯x1−¯x2 = sp 1 n1 + 1 n2 = 4.4935 1 40 + 1 35 = 1.0400, t = (¯x1 − ¯x2) − (µ1 − µ2) s¯x1−¯x2 = (28.50 − 23.25) − 0 1.0400 = 5.048. Krok 5: Hodnota testovací statistiky t = 5.048 se nachází v oblasti zamítnutí. Proto zamítáme nulovou hypotézu. Důsledkem je, že docházíme k závěru, že děti v Praze stráví na Instagramu více času než děti v Brně. ·Testování hypotéz: Dvě populace · 34 / 77 Odhady rozdílu, dvě NZV populace, σ1 = σ2 neznámé Intervalový odhad µ1 − µ2 Obsah Nezávislé versus závislé vzorky Odhady rozdílu, dvě NZV populace, σ1 a σ2 známé Odhady rozdílu, dvě NZV populace, σ1 = σ2 neznámé Odhady rozdílu, dvě NZV populace, σ1 ̸= σ2 neznámé Testování rozdílů dvou závislých vzorků Odhady podílu, dvě NZV populace ·Testování hypotéz: Dvě populace · 35 / 77 Odhady rozdílu, dvě NZV populace, σ1 ̸= σ2 neznámé Odhady rozdílu mezi průměry dvou populací pro nezávislé vzorky: σ1 a σ2 neznámé a σ1 ̸= σ2 Intervalový odhad µ1 − µ2 Testování hypotéz o µ1 − µ2 ·Testování hypotéz: Dvě populace · 36 / 77 Odhady rozdílu, dvě NZV populace, σ1 ̸= σ2 neznámé Odhady rozdílu mezi průměry dvou populací pro nezávislé vzorky: σ1 a σ2 neznámé a σ1 ̸= σ2 Stupně volnosti Pokud: 1. jsou oba vzorky nezávislé. 2. σ1 a σ2 obou populací jsou neznámé a rozdílné. 3. a je splněna alespoň jedna z následujících podmínek i. Oba vzorky jsou velké (tj. n1 ≥ 30 a n2 ≥ 30) ii. Pokud jsou jedna nebo obě velikosti vzorků malé, pak jsou obě populace, z nichž byly vzorky odebrány, normálně rozdělené. pak se k vyvození závěrů o µ1 − µ2 používá t-rozdělení a stupně volnosti pro t-rozdělení jsou dány vzorcem: df = s2 1 n1 + s2 2 n2 2 (s2 1/n1)2 n1−1 + (s2 2/n2)2 n2−1 Číslo df určené tímto vzorcem je vždy zaokrouhleno dolů. ·Testování hypotéz: Dvě populace · 37 / 77 Odhady rozdílu, dvě NZV populace, σ1 ̸= σ2 neznámé Intervalový odhad µ1 − µ2 Intervalový odhad µ1 − µ2 (1 − α)100% interval spolehlivosti pro µ1 − µ2 je dán: (¯x1 − ¯x2) ± ts¯x1−¯x2 kde hodnota t je získána z tabulky t-rozdělení pro danou úroveň spolehlivosti a stupně volnosti jsou dány dle dříve zmíněného vzorce a s¯x1−¯x2 odpovídá vzorci s¯x1−¯x2 = s2 1 n1 + s2 2 n2 ·Testování hypotéz: Dvě populace · 38 / 77 Odhady rozdílu, dvě NZV populace, σ1 ̸= σ2 neznámé Testování hypotéz o µ1 − µ2 Testování hypotéz o µ1 − µ2 Hodnota testové statistiky t pro ¯x1 − ¯x2 je vypočítána jako: t = (¯x1 − ¯x2) − (µ1 − µ2) s¯x1−¯x2 Hodnota µ1 − µ2 v tomto vzorci je nahrazena z nulové hypotézy a s¯x1−¯x2 je vypočítána jak bylo vysvětleno dříve. ·Testování hypotéz: Dvě populace · 39 / 77 Odhady rozdílu, dvě NZV populace, σ1 ̸= σ2 neznámé Testování hypotéz o µ1 − µ2 Obsah Nezávislé versus závislé vzorky Odhady rozdílu, dvě NZV populace, σ1 a σ2 známé Odhady rozdílu, dvě NZV populace, σ1 = σ2 neznámé Odhady rozdílu, dvě NZV populace, σ1 ̸= σ2 neznámé Testování rozdílů dvou závislých vzorků Odhady podílu, dvě NZV populace ·Testování hypotéz: Dvě populace · 40 / 77 Testování rozdílů dvou závislých vzorků Testování rozdílů dvou závislých vzorků (párových pozorování) Intervalový odhad µd Testování hypotéz o µd ·Testování hypotéz: Dvě populace · 41 / 77 Testování rozdílů dvou závislých vzorků Závislé vzorky Dva vzorky se označují jako závislé, když pro každou hodnotu dat získanou z jednoho vzorku existuje odpovídající hodnota dat získaná ze druhého vzorku, přičemž obě tyto hodnoty dat jsou získány ze stejného zdroje. ·Testování hypotéz: Dvě populace · 42 / 77 Testování rozdílů dvou závislých vzorků Průměr a směrodatná odchylka rozdílu dvou závislých výběrů Hodnoty průměru a směrodatné odchylky, ¯d a sd, rozdílu dvou závislých výběrů jsou vypočítány následovně: ¯d = d n , sd = d2 − ( d)2 n n − 1 . ·Testování hypotéz: Dvě populace · 43 / 77 Testování rozdílů dvou závislých vzorků Rozdělení, průměr a směrodatná odchylka ¯d Pokud je známa σd a buď je velikost vzorku velká (n ≥ 30) nebo je populace normálně rozdělená, pak je rozdělení ¯d přibližně normální s průměrem a směrodatnou odchylkou: µ¯d = µd, σ¯d = σd √ n . ·Testování hypotéz: Dvě populace · 44 / 77 Testování rozdílů dvou závislých vzorků Rozdělení ¯d Odhad směrodatné odchylky párových rozdílů Pokud: 1. je směrodatná odchylka σd populace rozdílů neznámá. 2. je splněna alespoň jedna z následujících podmínek: Velikost vzorku je velká (tj. n ≥ 30) Velikost vzorku je malá, ale populace rozdílů je normálně rozdělená. Pak se používá t-rozdělení k vyvození závěrů o µd. Směrodatná odchylka σ¯d odhadu ¯d je odhadována pomocí s¯d, což je vypočítáno jako: s¯d = sd √ n ·Testování hypotéz: Dvě populace · 45 / 77 Testování rozdílů dvou závislých vzorků Interval spolehlivosti µd (1 − α)100% interval spolehlivosti pro µd vypočítáme jako: ¯d ± ts¯d kde hodnota t je získána z tabulky t-rozdělení pro danou hladinu významnosti a n − 1 stupňů volnosti, a s¯d je vypočítána jak bylo vysvětleno dříve. ·Testování hypotéz: Dvě populace · 46 / 77 Testování rozdílů dvou závislých vzorků Příklad 8 Zadání: Výzkumník chtěl zjistit účinek speciální diety na systolický krevní tlak. Vybral si vzorek sedmi dospělých a na dobu 3 měsíců je umístil na tento dietní plán. Následující tabulka uvádí systolický krevní tlak (v mm Hg) sedmi dospělých před a po dokončení tohoto plánu. Nechť µd je průměrné snížení systolického krevního tlaku díky tomuto speciálnímu dietnímu plánu pro populaci všech dospělých. Sestrojte 95% interval spolehlivosti pro µd. Předpokládejte, že populace rozdílů je (přibližně) normálně rozdělená. ·Testování hypotéz: Dvě populace · 47 / 77 Testování rozdílů dvou závislých vzorků Příklad 8: Řešení ·Testování hypotéz: Dvě populace · 48 / 77 Testování rozdílů dvou závislých vzorků Příklad 8: Řešení ¯d = d n = 35 7 = 5.00, sd = d2 − ( d)2 n n − 1 = 873 − (35)2 7 7 − 1 = 10.7857. s¯d = sd √ n = 10.7857 √ 7 = 4.0766, Oblast v každém ocasu = α/2 = 0.5 − (0.95/2) = 0.025, stupně volnosti = df = n − 1 = 7 − 1 = 6, t = 2.447, ¯d ± ts¯d = 5.00 ± 2.447(4.0766) = 5.00 ± 9.98 = −4.98 do 14.98. ·Testování hypotéz: Dvě populace · 49 / 77 Testování rozdílů dvou závislých vzorků Testování hypotéz o µd Hodnota testové statistiky t pro ¯d je vypočítána následovně: t = ¯d − µd s¯d ·Testování hypotéz: Dvě populace · 50 / 77 Testování rozdílů dvou závislých vzorků Příklad 9 Zadání: Společnost chtěla zjistit, zda účast na kurzu „jak být úspěšným obchodníkem“ může zvýšit průměrný obrat jejích zaměstnanců. Společnost poslala šest svých obchodníků na tento kurz. Následující tabulka uvádí týdenní obraty těchto obchodníků před a po účasti na kurzu. S využitím hladiny významnosti 1 %, zjistěte, zda vzrostl průměrný týdenní obrat všech obchodníků v důsledku účasti na tomto kurzu. Předpokládejte, že populace rozdílů má normální rozdělení. ·Testování hypotéz: Dvě populace · 51 / 77 Testování rozdílů dvou závislých vzorků Příklad 9: Řešení ·Testování hypotéz: Dvě populace · 52 / 77 Testování rozdílů dvou závislých vzorků Příklad 9: Řešení ¯d = d n = −25 6 = −4.17, sd = d2 − ( d)2 n n − 1 = 139 − (−25)2 6 6 − 1 = 2.6394, s¯d = sd √ n = 2.6394 √ 6 = 1.0775. ·Testování hypotéz: Dvě populace · 53 / 77 Testování rozdílů dvou závislých vzorků Příklad 9: Řešení Krok 1: Stanovíme hypotézy H0 : µd = 0 (µ1 − µ2 = 0 průměrné týdenní tržby se nezměnily) H1 : µd < 0 (µ1 − µ2 < 0 průměrné týdenní tržby se zvýšily) Krok 2: Oba vzorky jsou závislé. Směrodatná odchylka σ je neznámá. Populace rozdílů je normálně rozdělena. Použijeme t-rozdělení. Krok 3: α = 0.01. Znak < v alternativní hypotéze naznačuje, že test je levostranný. Oblast v levém konci → α = 0.01. Stupně volnosti df = n − 1 = 6 − 1 = 5. Kritická hodnota t je -3.365. ·Testování hypotéz: Dvě populace · 54 / 77 Testování rozdílů dvou závislých vzorků Příklad 9: Řešení ·Testování hypotéz: Dvě populace · 55 / 77 Testování rozdílů dvou závislých vzorků Příklad 9: Řešení Krok 4: t = ¯d−µd S¯d = −4.17−0 1.0775 = −3.870 Krok 5: Hodnota testovací statistiky t = 3.870 se nachází v oblasti zamítnutí. Proto zamítáme nulovou hypotézu. Důsledkem je, že docházíme k závěru, že absolvování kurzu zvyšuje průměrné týdenní tržby. ·Testování hypotéz: Dvě populace · 56 / 77 Testování rozdílů dvou závislých vzorků Příklad 10 Zadání: Výzkumník chtěl zjistit účinek speciální diety na systolický krevní tlak. Vybral si vzorek sedmi dospělých a na dobu 3 měsíců je umístil na tento dietní plán. Následující tabulka uvádí systolický krevní tlak (v mm Hg) sedmi dospělých před a po dokončení tohoto plánu. Nechť µd je průměr rozdílů mezi systolickým krevním tlakem před a po dokončení tohoto speciálního dietního plánu pro populaci všech dospělých. Pokud použijeme hladinu významnosti 5%, můžeme usuzovat, že průměrná hodnota rozdílů µd se liší od nuly? Předpokládejme, že populace rozdílů je (přibližně) normálně rozdělená. ·Testování hypotéz: Dvě populace · 57 / 77 Testování rozdílů dvou závislých vzorků Příklad 10: Řešení ·Testování hypotéz: Dvě populace · 58 / 77 Testování rozdílů dvou závislých vzorků Příklad 10: Řešení ¯d = d n = 35 7 = 5.00, sd = d2 − ( d)2 n n − 1 = 873 − (35)2 7 6 = 10.7857, s¯d = sd √ n = 10.7857 √ 7 = 4.0766. ·Testování hypotéz: Dvě populace · 59 / 77 Testování rozdílů dvou závislých vzorků Příklad 10: Řešení Krok 1: Stanovíme hypotézy H0 : µd = 0 (průměrný rozdíl není různý od nuly) H1 : µd ̸= 0 (průměrný rozdíl je různý od nuly) Krok 2: Oba vzorky jsou závislé. Směrodatná odchylka σ je neznámá. Velikost vzorku je malá, nicméně populace rozdílů je normálně rozdělena. Použijeme t-rozdělení. Krok 3: α = 0.05. Znak ̸= v alternativní hypotéze naznačuje, že test je oboustranný. Oblast v každém konci → α/2 = 0.025. Stupně volnosti df = n − 1 = 7 − 1 = 6. Kritická hodnota t je -2.447 a 2.447. ·Testování hypotéz: Dvě populace · 60 / 77 Testování rozdílů dvou závislých vzorků Příklad 10: Řešení ·Testování hypotéz: Dvě populace · 61 / 77 Testování rozdílů dvou závislých vzorků Příklad 10: Řešení Krok 4: t = ¯d−µd S¯d = 5.00−0 4.0766 = 1.226 Krok 5: Hodnota testovací statistiky t = 1.226 se nachází v oblasti nezamítnutí. Proto nezamítáme nulovou hypotézu. Důsledkem je, že docházíme k závěru, že populační průměrný rozdíl není různý od nuly a že speciální dieta nemá na systolický krevní tlak účinek. ·Testování hypotéz: Dvě populace · 62 / 77 Testování rozdílů dvou závislých vzorků Obsah Nezávislé versus závislé vzorky Odhady rozdílu, dvě NZV populace, σ1 a σ2 známé Odhady rozdílu, dvě NZV populace, σ1 = σ2 neznámé Odhady rozdílu, dvě NZV populace, σ1 ̸= σ2 neznámé Testování rozdílů dvou závislých vzorků Odhady podílu, dvě NZV populace ·Testování hypotéz: Dvě populace · 63 / 77 Odhady podílu, dvě NZV populace Závěry o rozdílu mezi dvěma populačními podíly pro velké a nezávislé vzorky Průměr, směrodatná odchylka a rozdělení ˆp1 − ˆp2 Intervalový odhad p1 − p2 Testování hypotéz o p1 − p2 ·Testování hypotéz: Dvě populace · 64 / 77 Odhady podílu, dvě NZV populace Průměr, směrodatná odchylka a rozdělení ˆp1 − ˆp2 Průměr, směrodatná odchylka a rozdělení ˆp1 − ˆp2 Pro dva velké a nezávislé vzorky je rozdělení ˆp1 − ˆp2 (přibližně) normální s průměrem µˆp1−ˆp2 = p1 − p2 a směrodatnou odchylkou σˆp1−ˆp2 = p1q1 n1 + p2q2 n2 kde q1 = 1 − p1 a q2 = 1 − p2. ·Testování hypotéz: Dvě populace · 65 / 77 Odhady podílu, dvě NZV populace Intervalový odhad p1 − p2 Intervalový odhad p1 − p2 (1 − α)100% interval spolehlivosti pro p1 − p2 je: (ˆp1 − ˆp2) ± zsˆp1−ˆp2 kde hodnota z je získána z tabulky normálního rozdělení pro danou hladinu významnosti a sˆp1−ˆp2 je vypočítána jako: sˆp1−ˆp2 = p1q1 n1 + p2q2 n2 kde q1 = 1 − p1 a q2 = 1 − p2. ·Testování hypotéz: Dvě populace · 66 / 77 Odhady podílu, dvě NZV populace Intervalový odhad p1 − p2 Příklad 11 Zadání: Výzkumník chtěl odhadnout rozdíl mezi procenty uživatelů dvou zubních past, kteří nikdy nepřejdou na jinou zubní pastu. Ve vzorku 500 uživatelů zubní pasty A, který výzkumník provedl, 100 uživatelů uvedlo, že nikdy nepřejdou na jinou zubní pastu. Ve druhém vzorku 400 uživatelů zubní pasty B, který provedl tentýž výzkumník, 68 uživatelů uvedlo, že nikdy nepřejdou na jinou zubní pastu. (a) Nechť p1 a p2 jsou podíly všech uživatelů zubních past A a B, kteří nikdy nepřejdou na jinou zubní pastu. Jaký je bodový odhad rozdílu p1 − p2? (b) Sestrojte 97% interval spolehlivosti pro rozdíl mezi podíly všech uživatelů obou zubních past, kteří nikdy nepřejdou na jinou zubní pastu. ·Testování hypotéz: Dvě populace · 67 / 77 Odhady podílu, dvě NZV populace Intervalový odhad p1 − p2 Příklad 11: Řešení Oba podíly jsou vypočítány následovně: ˆp1 = x1 n1 = 100 500 = 0.20 → ˆq1 = 1 − 0.20 = 0.80 ˆp2 = x2 n2 = 68 400 = 0.17 → ˆq2 = 1 − 0.17 = 0.83 Ověření předpokladů: n1ˆp1 = 500(0.20) = 100 n1ˆq1 = 500(0.80) = 400 n2ˆp2 = 400(0.17) = 68 n2ˆq2 = 400(0.83) = 332 Každá z těchto hodnot je větší než 5. Velikosti obou vzorků jsou velké. V důsledku toho používáme normální rozdělení k vytvoření intervalu spolehlivosti pro p1 − p2. ·Testování hypotéz: Dvě populace · 68 / 77 Odhady podílu, dvě NZV populace Intervalový odhad p1 − p2 Příklad 11: Řešení (a) Bodový odhad: p1 − p2 = ˆp1 − ˆp2 = 0.20 − 0.17 = 0.03 (b) Intervalový odhad Směrodatná odchylka ˆp1 − ˆp2 je: sˆp1−ˆp2 = ˆp1ˆq1 n1 + ˆp2ˆq2 n2 = 0.0259 S využitím z = 2.17, (ˆp1 − ˆp2) ± zsˆp1−ˆp2 = (.20 − .17) ± 2.17(0.0259) = 0.03 ± 0.056 = −0.026 až 0.086 ·Testování hypotéz: Dvě populace · 69 / 77 Odhady podílu, dvě NZV populace Testování hypotéz o p1 − p2 Testování hypotéz o p1 − p2 Hodnota testové statistiky z pro ˆp1 − ˆp2 je vypočítána jako: z = (ˆp1 − ˆp2) − (p1 − p2) sˆp1−ˆp2 Hodnota p1 − p2 je nahrazena z H0, která je obvykle nula. Výraz sˆp1−ˆp2 lze spočítat jako: sˆp1−ˆp2 = ¯p¯q 1 n1 + 1 n2 , kde ¯p = n1ˆp1+n2ˆp2 n1+n2 a ¯q = 1 − ¯p. ·Testování hypotéz: Dvě populace · 70 / 77 Odhady podílu, dvě NZV populace Testování hypotéz o p1 − p2 Příklad 12 Zadání: Výzkumník chtěl odhadnout rozdíl mezi procenty uživatelů dvou zubních past, kteří nikdy nepřejdou na jinou zubní pastu. Ve vzorku 500 uživatelů zubní pasty A, který výzkumník provedl, 100 uživatelů uvedlo, že nikdy nepřejdou na jinou zubní pastu. Ve druhém vzorku 400 uživatelů zubní pasty B, který provedl tentýž výzkumník, 68 uživatelů uvedlo, že nikdy nepřejdou na jinou zubní pastu. Na hladině významnosti 1 %, ověřte, že podíl uživatelů zubní pasty A, kteří nikdy nepřejdou na jinou zubní pastu, je vyšší než podíl uživatelů zubní pasty B, kteří nikdy nepřejdou na jinou zubní pastu. ·Testování hypotéz: Dvě populace · 71 / 77 Odhady podílu, dvě NZV populace Testování hypotéz o p1 − p2 Příklad 12: Řešení ˆp1 = x1 n1 = 100 500 = 0.20 ˆp2 = x2 n2 = 68 400 = 0.17 Krok 1: Stanovíme hypotézy H0 : p1 − p2 = 0 (p1 není větší než p2) H1 : p1 − p2 > 0 (p1 je větší než p2) Krok 2: Hodnoty n1ˆp1, n1ˆq1, n2ˆp2, a n2ˆq2 jsou všechny větší než 5. Velikost vzorku je velká. Použijeme normální rozdělení. Krok 3: α = 0.01. Znak > v alternativní hypotéze naznačuje, že test je pravostranný. Oblast v pravém konci → α = 0.01. Kritická hodnota z je 2.33. ·Testování hypotéz: Dvě populace · 72 / 77 Odhady podílu, dvě NZV populace Testování hypotéz o p1 − p2 Příklad 12: Řešení ·Testování hypotéz: Dvě populace · 73 / 77 Odhady podílu, dvě NZV populace Testování hypotéz o p1 − p2 Příklad 12: Řešení Krok 4: ¯p = x1 + x2 n1 + n2 = 100 + 68 500 + 400 = 0.187, ¯q = 1 − ¯p = 1 − 0.187 = 0.813, sˆp1−ˆp2 = ¯p¯q 1 n1 + 1 n2 = 0.0261, z = (ˆp1 − ˆp2) − (p1 − p2) sˆp1−ˆp2 = (0.20 − 0.17) − 0 0.0261 = 1.15. Krok 5: Hodnota testovací statistiky z = 1.15 se nachází v oblasti nezamítnutí. Proto nezamítáme nulovou hypotézu a dospíváme k závěru, že podíl uživatelů zubní pasty A, kteří nikdy nepřejdou na jinou zubní pastu, není vyšší než podíl uživatelů zubní pasty B, kteří nikdy nepřejdou na jinou zubní pastu. ·Testování hypotéz: Dvě populace · 74 / 77 Odhady podílu, dvě NZV populace Testování hypotéz o p1 − p2 Shrnutí přednášky: Nezávislé versus závislé vzorky Odhady rozdílu, dvě NZV populace, σ1 a σ2 známé Odhady rozdílu, dvě NZV populace, σ1 = σ2 neznámé Odhady rozdílu, dvě NZV populace, σ1 ̸= σ2 neznámé Testování rozdílů dvou závislých vzorků Odhady podílu, dvě NZV populace ·Testování hypotéz: Dvě populace · 75 / 77 Odhady podílu, dvě NZV populace Testování hypotéz o p1 − p2 Co si nastudovat na příští týden? Příprava na cvičení: Leaflet 11 Koncepty a procedury, cv. 11, kap. 10 Povinná literatura: Mann (2016), Kapitola 11 ·Testování hypotéz: Dvě populace · 76 / 77 Odhady podílu, dvě NZV populace Testování hypotéz o p1 − p2 Děkuji za pozornost! ·Testování hypotéz: Dvě populace · 77 / 77