Testování hypotéz o střední hodnotě a podílu Povinná literatura: Mann (2016), Kapitola 9 Z čeho studovat devátou lekci? Povinná literatura: Mann (2016), kap. 09 Příprava na cvičení: Leaflet 10 Koncepty a procedury, cv. 10, kap. 09 Příprava na zkoušku: Mann (2016), kap. 09 Leaflet 10 Sbírka úloh, kap. 09 Koncepty a procedury, cv. 10, kap. 09 ·Testování hypotéz o střední hodnotě a poměru · 2 / 89 Obsah: Případové studie Testování hypotéz: Úvod Testování hypotéz o µ: při známém σ Testování hypotéz o µ: při neznámém σ Testování hypotéz o poměru ·Testování hypotéz o střední hodnotě a poměru · 3 / 89 Případové studie TÉMA: Je průměrný dluh ze studentských půjček pro ročník 2013 všude stejný? Podle odhadů studie Project on Student Debt mělo 69 % absolventů vysoké školy z roku 2013 půjčky ke splacení. Přiložený graf uvádí průměr USA a průměrné hodnoty těchto dluhů pro několik vybraných států u zadlužených studentů z ročníku 2013. Jaký závěr lze učinit, pokud chceme ověřit, zda byl průměrný dluh studentů v Ohiu vyšší než průměrný dluh v USA tj. $28 400? ·Testování hypotéz o střední hodnotě a poměru · 4 / 89 Případové studie TÉMA: Platí lidé s vyššími příjmy spravedlivý podíl na daních? V průzkumu Gallup mezi Američany ve věku 18 a více let z roku 2014, byli dospělí dotázáni: „Platí lidé s vyššími příjmy spravedlivý podíl na federálních daních, platí příliš mnoho, nebo platí příliš málo?“ Odpovědi dospělých dotázaných jsou zobrazeny v grafu níže. Jaký závěr lze učinit, pokud chceme ověřit, zda současné procento lidí, kteří tvrdí, že lidé s vyššími příjmy platí na federálních daních příliš málo, se statisticky významně liší od 61 %? ·Testování hypotéz o střední hodnotě a poměru · 5 / 89 Testování hypotéz: Úvod Obsah: Případové studie Testování hypotéz: Úvod Testování hypotéz o µ: při známém σ Testování hypotéz o µ: při neznámém σ Testování hypotéz o poměru ·Testování hypotéz o střední hodnotě a poměru · 6 / 89 Testování hypotéz: Úvod Hypotézy a oblasti jejich zamítnutí a nezamítnutí Hypotézy Nulová hypotéza je tvrzení o parametru populace, které se předpokládá jako pravdivé, dokud není prohlášeno za nepravdivé. Alternativní hypotéza je tvrzení o parametru populace, které bude prohlášeno za pravdivé, pokud je nulová hypotéza prohlášena za nepravdivou. ·Testování hypotéz o střední hodnotě a poměru · 7 / 89 Testování hypotéz: Úvod Chyba prvního a druhého druhu Dva druhy chyb ·Testování hypotéz o střední hodnotě a poměru · 8 / 89 Testování hypotéz: Úvod Chyba prvního a druhého druhu Chyba prvního a druhého druhu Chyba prvního druhu (Type I error) nastává, když je správná nulová hypotéza zamítnuta. Hodnota α představuje pravděpodobnost provedení tohoto druhu chyby, to znamená, α = P(H0 je zamítnuta | H0 je pravdivá). Hodnota α představuje hladinu významnosti testu. Chyba druhého druhu (Type II error) nastává, když není zamítnuta nesprávná nulová hypotéza. Hodnota β představuje pravděpodobnost spáchání chyby druhého druhu, to znamená, β = P(H0 není zamítnuta | H0 je nepravdivá). Hodnota 1 - β se nazývá síla testu (power of the test). Představuje pravděpodobnost neprovedení chyby druhého druhu. ·Testování hypotéz o střední hodnotě a poměru · 9 / 89 Testování hypotéz: Úvod Chyba prvního a druhého druhu Chyba prvního a druhého druhu ·Testování hypotéz o střední hodnotě a poměru · 10 / 89 Testování hypotéz: Úvod Chvosty testu Chvosty testu Oboustranný test má oblasti zamítnutí na obou koncích, levostranný test má oblast zamítnutí v levém konci a pravostranný test má oblast zamítnutí v pravém konci křivky rozdělení. Poznámka: Termín Tail bývá překládán jako ocasy, chvosty nebo konce. ·Testování hypotéz o střední hodnotě a poměru · 11 / 89 Testování hypotéz: Úvod Chvosty testu Oboustranný test Jak rozeznám, který typ hypotézy chci použít? Podle Úřadu práce v USA si pracující ve Spojených státech v roce 2014 v průměru vydělali 47230 dolarů ročně. Předpokládejme, že ekonom chce zjistit, zda se tento průměr od roku 2014 změnil. Klíčové slovo zde je „změnil“. Průměrný roční příjem zaměstnaných Američanů se od roku 2014 změnil. „změnil“ = zvětšil nebo zmenšil, to je příklad oboustranného testu. ·Testování hypotéz o střední hodnotě a poměru · 12 / 89 Testování hypotéz: Úvod Chvosty testu Oboustranný test Nechť µ je průměrný roční příjem zaměstnaných Američanů. Existují dvě možná rozhodnutí: H0 : µ = 47230 (Průměrný roční příjem zaměstnaných Američanů se od roku 2014 nezměnil) H1 : µ ̸= 47230 (Průměrný roční příjem zaměstnaných Američanů se od roku 2014 změnil) Poznámka: Zda je test oboustranný nebo jednostranný, je určeno znaménkem v alternativní hypotéze. Pokud má alternativní hypotéza znaménko nerovná se (̸=), jedná se o oboustranný test. ·Testování hypotéz o střední hodnotě a poměru · 13 / 89 Testování hypotéz: Úvod Chvosty testu Oboustranný test ·Testování hypotéz o střední hodnotě a poměru · 14 / 89 Testování hypotéz: Úvod Chvosty testu Levostranný test Zvažme příklad průměrného množství sodovky ve všech plechovkách vyráběných určitou společností. Společnost tvrdí, že tyto plechovky obsahují v průměru 12 uncí sodovky. Pokud však plechovky obsahují méně než deklarované množství sodovky, může být společnost obviněna z podvodu. Předpokládejme, že spotřebitelská agentura chce testovat, zda průměrné množství sodovky na plechovku je méně než 12 uncí. Všimněte si, že klíčové slovní spojení je tentokrát „méně než“, což indikuje test s levým chvostem. ·Testování hypotéz o střední hodnotě a poměru · 15 / 89 Testování hypotéz: Úvod Chvosty testu Levostranný test Nechť µ je průměrné množství sodovky ve všech plechovkách. Možná rozhodnutí jsou: H0 : µ = 12 uncí (Průměr je roven 12 uncím.) H1 : µ < 12 uncí (Průměr je menší než 12 uncí.) Poznámka: V tomto případě můžeme nulovou hypotézu zapsat také jako H0 : µ ≥ 12. To neovlivní výsledek testu, pokud je znaménko v H1 menší než (<). Když alternativní hypotéza obsahuje znaménko menší než (<), test je vždy levostranný. ·Testování hypotéz o střední hodnotě a poměru · 16 / 89 Testování hypotéz: Úvod Chvosty testu Levostranný test ·Testování hypotéz o střední hodnotě a poměru · 17 / 89 Testování hypotéz: Úvod Chvosty testu Pravostranný test Podle developerů byla v roce 2013 průměrná cena domů ve West Orange, New Jersey, 471 257 dolarů. Předpokládejme, že výzkumník v oblasti nemovitostí chce zkontrolovat, zda je aktuální průměrná cena domů v tomto městě vyšší než 471 257 dolarů. Klíčová fráze v tomto případě je „vyšší než“, což indikuje pravostranný test. ·Testování hypotéz o střední hodnotě a poměru · 18 / 89 Testování hypotéz: Úvod Chvosty testu Pravostranný test Nechť µ je aktuální průměrná cena domů v tomto městě. Možná rozhodnutí jsou: H0 : µ ≤ $471 257 (Aktuální průměrná cena domů v tomto městě není vyšší než $471 257.) H1 : µ > $471 257 (Aktuální průměrná cena domů v tomto městě je vyšší než $471 257.) Poznámka: Když alternativní hypotéza obsahuje znaménko větší než (>), test je vždy pravostranný. ·Testování hypotéz o střední hodnotě a poměru · 19 / 89 Testování hypotéz: Úvod Chvosty testu Pravostranný test ·Testování hypotéz o střední hodnotě a poměru · 20 / 89 Testování hypotéz: Úvod Chvosty testu Znaménka v H0 a H1 a chvosty testu ·Testování hypotéz o střední hodnotě a poměru · 21 / 89 Testování hypotéz: Úvod Procedury testování Dvě procedury k provedení testu 1. Přístup přes určení p-hodnoty 2. Přístup přes určení kritických hodnot ·Testování hypotéz o střední hodnotě a poměru · 22 / 89 Testování hypotéz o µ: při známém σ Obsah: Případové studie Testování hypotéz: Úvod Testování hypotéz o µ: při známém σ Testování hypotéz o µ: při neznámém σ Testování hypotéz o poměru ·Testování hypotéz o střední hodnotě a poměru · 23 / 89 Testování hypotéz o µ: při známém σ Testování hypotéz o µ: při známém σ Tři možné případy Případ I. Pokud jsou splněny následující tři podmínky: 1. Směrodatná odchylka populace σ je známa. 2. Velikost vzorku je malá (tj. n < 30). 3. Populace, ze které byl vzorek vybrán, je normálně rozdělená. Případ II. Pokud jsou splněny následující dvě podmínky: 1. Směrodatná odchylka populace σ je známa. 2. Velikost vzorku je velká (tj. n ≥ 30). Případ III. Pokud jsou splněny následující tři podmínky: 1. Směrodatná odchylka populace σ je známa. 2. Velikost vzorku je malá (tj. n < 30). 3. Populace, ze které byl vzorek vybrán, není normálně rozdělená (nebo její rozdělení není známo). ·Testování hypotéz o střední hodnotě a poměru · 24 / 89 Testování hypotéz o µ: při známém σ Testování hypotéz o µ: při známém σ ·Testování hypotéz o střední hodnotě a poměru · 25 / 89 Testování hypotéz o µ: při známém σ p-hodnota p-hodnota je měřítkem, které se používá k určení síly důkazů proti nulové hypotéze. Konkrétně p-hodnota určuje pravděpodobnost získání statistického výsledku, který je stejně extrémní nebo extrémnější než aktuálně pozorovaný výsledek za předpokladu, že nulová hypotéza je pravdivá. Jinými slovy, p-hodnota nám říká, jak pravděpodobné je získat výsledky ještě více odlišné od těch, které předpovídá nulová hypotéza (za předpokladu, že nulová hypotéza je pravdivá). Pokud je p-hodnota velmi nízká, obvykle nižší než zvolená hladina významnosti (např. 0.05), máme důvod zpochybnit platnost nulové hypotézy a zvážit její zamítnutí ve prospěch alternativní hypotézy. Poznamenejme, že p-hodnota je nejmenší hladina významnosti, při které je nulová hypotéza zamítnuta. ·Testování hypotéz o střední hodnotě a poměru · 26 / 89 Testování hypotéz o µ: při známém σ p-hodnota pro pravostranný test ·Testování hypotéz o střední hodnotě a poměru · 27 / 89 Testování hypotéz o µ: při známém σ p-hodnota pro oboustranný test ·Testování hypotéz o střední hodnotě a poměru · 28 / 89 Testování hypotéz o µ: při známém σ Výpočet hodnoty z pro ¯x Při použití normálního rozdělení se hodnota z pro ¯x pro test hypotézy o µ počítá následovně: z = ¯x − µ σ¯x kde σ¯x = σ√ n . Hodnota z, vypočítaná pro ¯x s použitím tohoto vzorce, se také nazývá pozorovaná (realizovaná) hodnota z. ·Testování hypotéz o střední hodnotě a poměru · 29 / 89 Testování hypotéz o µ: při známém σ Postup provedení testu hypotézy pomocí p-hodnoty 1. Stanovte nulovou a alternativní hypotézu. 2. Vyberte rozdělení, které budete používat. 3. Vypočítejte p-hodnotu. 4. Učiňte rozhodnutí. ·Testování hypotéz o střední hodnotě a poměru · 30 / 89 Testování hypotéz o µ: při známém σ Příklad 1 Zadání: V Mlékárně Kunín bývalo průměrně potřeba 90 minut, aby se noví pracovníci naučili obsluze stroje na zpracování potravin. Nedávno společnost nainstalovala nový stroj na zpracování potravin. Vedoucí společnosti chce zjistit, zda se průměrná doba, kterou noví pracovníci věnují učení se obsluze tohoto nového stroje, liší od 90 minut. Vzorek 20 pracovníků ukázal, že se průměrně naučili postup zpracování potravin na novém stroji za 85 minut. Je známo, že doby učení se všech nových pracovníků jsou normálně rozdělené se směrodatnou odchylkou populace 7 minut. Najděte p-hodnotu pro test, že průměrná doba učení se postupu zpracování potravin na novém stroji se liší od 90 minut. Jaký bude váš závěr, pokud α = 0.01? ·Testování hypotéz o střední hodnotě a poměru · 31 / 89 Testování hypotéz o µ: při známém σ Příklad 1: řešení Krok 1 H0 : µ = 90; H1 : µ ̸= 90 Krok 2 Směrodatná odchylka populace σ je známá, velikost vzorku je malá (n < 30), ale rozdělení populace je normální. Použijeme normální rozdělení k nalezení p-hodnoty a provedení testu. Krok 3 σ¯x = σ √ n = 7 √ 20 = 1.56524758 minut z = ¯x − µ σ¯x = 85 − 90 1.56524758 = −3.19 ·Testování hypotéz o střední hodnotě a poměru · 32 / 89 Testování hypotéz o µ: při známém σ Příklad 1: řešení p-hodnota = 2(0.0007) = 0.0014 ·Testování hypotéz o střední hodnotě a poměru · 33 / 89 Testování hypotéz o µ: při známém σ Příklad 1: řešení Krok 4 Protože α = .01 je větší než p-hodnota .0014, zamítáme nulovou hypotézu na této hladině významnosti. Z toho vyplývá, že průměrná doba učení postupu zpracování potravin na novém stroji se liší od 90 minut. ·Testování hypotéz o střední hodnotě a poměru · 34 / 89 Testování hypotéz o µ: při známém σ Příklad 2 Zadání: Vedení GYM klubu tvrdí, že jejich členové v průměru zhubnou 10 nebo více liber během prvního měsíce po vstupu do tohoto klubu. Agentura pro ochranu spotřebitele chtěla toto tvrzení ověřit. Z dřívějších studií jiných GYM klubů ví, že směrodatná odchylka úbytku váhy je 2.4 libry. Vzala náhodný vzorek 36 členů tohoto klubu a zjistila, že během prvního měsíce členství vybraní členové ztratili průměrně 9.2 libry. Určete p-hodnotu pro tento test. Jaké bude vaše rozhodnutí, pokud α = .01? A co pokud α = .05? ·Testování hypotéz o střední hodnotě a poměru · 35 / 89 Testování hypotéz o µ: při známém σ Příklad 2: řešení Krok 1 H0 : µ ≥ 10; H1 : µ < 10 Krok 2 Populační směrodatná odchylka σ je známá, velikost vzorku je velká (n > 30). Díky Centrálnímu limitnímu teorému použijeme normální rozdělení k nalezení p-hodnoty a provedení testu. Krok 3 σ¯x = σ √ n = 2.4 √ 36 = 0.4 z = ¯x − µ σ¯x = 9.2 − 10 0.4 = −2.00 ·Testování hypotéz o střední hodnotě a poměru · 36 / 89 Testování hypotéz o µ: při známém σ Příklad 2: řešení p-hodnota = 0.0228 ·Testování hypotéz o střední hodnotě a poměru · 37 / 89 Testování hypotéz o µ: při známém σ Příklad 2: řešení Krok 4 Jelikož α = 0.01 je menší než p-hodnota 0.0228, nulovou hypotézu na této hladině významnosti nezamítáme. Důsledkem toho dospíváme k závěru, že průměrná ztráta hmotnosti členů tohoto klubu během prvního měsíce členství je 10 liber nebo více. Protože α = 0.05 je větší než p-hodnota 0.0228, nulovou hypotézu na této hladině významnosti zamítáme. Tím pádem dospíváme k závěru, že průměrná ztráta hmotnosti členů tohoto klubu během prvního měsíce členství je menší než 10 liber. ·Testování hypotéz o střední hodnotě a poměru · 38 / 89 Testování hypotéz o µ: při známém σ Testová statistika Testová statistika Při testech hypotéz o µ s využitím normálního rozdělení je náhodná proměnná z = ¯x − µ σ¯x , kde σ¯x = σ √ n nazývána testová statistika. Testová statistika může být definována jako pravidlo nebo kritérium, které se používá pro rozhodnutí zda zamítnout či nezamítnout nulovou hypotézu. ·Testování hypotéz o střední hodnotě a poměru · 39 / 89 Testování hypotéz o µ: při známém σ Testová statistika Postup provedení testu hypotézy pomocí přístupu kritických hodnot 1. Formulujte nulovou a alternativní hypotézu. 2. Vyberte rozdělení, které použijete. 3. Vypočítejte hodnotu testové statistiky. 4. Stanovte oblasti zamítnutí a nezamítnutí. 5. Učiňte rozhodnutí. ·Testování hypotéz o střední hodnotě a poměru · 40 / 89 Testování hypotéz o µ: při známém σ Testová statistika Příklad 3 Zadání: Telefonní společnost TIV poskytuje službu dálkového telefonního hovoru. Podle záznamů společnosti byla průměrná délka všech dálkových hovorů uskutečněných prostřednictvím této společnosti v roce 2015 12.44 minut. Vedení společnosti chtělo ověřit, zda je průměrná délka současných dálkových hovorů odlišná od 12.44 minut. Vzorek 150 hovorů uskutečněných prostřednictvím této společnosti měl průměrnou délku 13.71 minut. Vedení společnosti z dřívějška zná populační směrodatnou odchylku délky dálkových hovorů stanovenou na 2.65 minut, o které předpokládá, že se nemění. Můžete s použitím 2% hladiny významnosti dospět k závěru, že se průměrná délka všech současných dálkových hovorů liší od 12.44 minut? ·Testování hypotéz o střední hodnotě a poměru · 41 / 89 Testování hypotéz o µ: při známém σ Testová statistika Příklad 3: řešení Krok 1 H0 : µ = 12.44; H1 : µ ̸= 12.44 Krok 2 Populační směrodatná odchylka σ je známá a velikost vzorku je velká (n > 30). Díky Centrální limitní větě použijeme normální rozdělení k provedení testu. Krok 3 σ¯x = σ √ n = 2.65 √ 150 = .21637159 z = ¯x − µ σ¯x = 13.71 − 12.44 .21637159 = 5.87 ·Testování hypotéz o střední hodnotě a poměru · 42 / 89 Testování hypotéz o µ: při známém σ Testová statistika Příklad 3: řešení Krok 4 Znaménko nerovnosti v alternativní hypotéze indikuje, že test je oboustranný. Oblast v každém konci je α/2 = 0.02/2 = 0.01. Hodnoty z pro dva kritické body jsou -2.33 a 2.33. ·Testování hypotéz o střední hodnotě a poměru · 43 / 89 Testování hypotéz o µ: při známém σ Testová statistika Příklad 3: řešení Krok 5 Realizovaná hodnota z = 5.87 je větší než kritická hodnota z = 2.33 a nachází se v oblasti zamítnutí na pravém konci v předcházejícím obrázku. Proto zamítáme H0 a docházíme k závěru, že na základě informací ze vzorku se zdá, že průměrná délka všech takových hovorů není rovna 12.44 minut. ·Testování hypotéz o střední hodnotě a poměru · 44 / 89 Testování hypotéz o µ: při známém σ Testová statistika Příklad 4 Zadání: Starosta velkého města tvrdí, že průměrné čisté jmění rodin žijících v tomto městě je alespoň 300 000 dolarů. Náhodný vzorek 25 rodin vybraných z tohoto města vykázal průměrné čisté jmění 288 000 dolarů. Předpokládejme, že čistá jmění všech rodin v tomto městě mají normální rozdělení se směrodatnou odchylkou populace 80 000 dolarů. Můžete s použitím 2.5% hladiny významnosti dospět k závěru, že starostovo tvrzení je nepravdivé? ·Testování hypotéz o střední hodnotě a poměru · 45 / 89 Testování hypotéz o µ: při známém σ Testová statistika Příklad 4: řešení Krok 1 H0 : µ ≥ 300, 000; H1 : µ < 300, 000 Krok 2 Populační směrodatná odchylka σ je známá, velikost vzorku je malá (n < 30), ale rozdělení populace je normální. V důsledku toho použijeme normální rozdělení k provedení testu. Krok 3 σ¯x = σ √ n = 80000 √ 25 = 16000 z = ¯x − µ σ¯x = 288000 − 300000 16000 = −0.75 ·Testování hypotéz o střední hodnotě a poměru · 46 / 89 Testování hypotéz o µ: při známém σ Testová statistika Příklad 4: řešení Krok 4 Znaménko < v alternativní hypotéze indikuje, že test je jednostranný s levým chvostem. Oblast v levém chvostu α = 0.025. Kritická hodnota z je -1.96. ·Testování hypotéz o střední hodnotě a poměru · 47 / 89 Testování hypotéz o µ: při známém σ Testová statistika Příklad 4: řešení Krok 5 Realizovaná hodnota z = −0.75 je větší než kritická hodnota z = −1.96, a nachází se v oblasti nezamítnutí. V důsledku toho nezamítáme H0 a můžeme konstatovat, že na základě informací ze vzorku se zdá, že průměrné čisté jmění rodin v tomto městě není menší než 300 000 dolarů. ·Testování hypotéz o střední hodnotě a poměru · 48 / 89 Testování hypotéz o µ: při neznámém σ Obsah: Případové studie Testování hypotéz: Úvod Testování hypotéz o µ: při známém σ Testování hypotéz o µ: při neznámém σ Testování hypotéz o poměru ·Testování hypotéz o střední hodnotě a poměru · 49 / 89 Testování hypotéz o µ: při neznámém σ Testování hypotéz o µ: při neznámém σ Tři možné případy Případ I. Pokud jsou splněny následující tři podmínky: 1. Směrodatná odchylka populace σ je neznáma. 2. Velikost vzorku je malá (tj. n < 30). 3. Populace, ze které byl vzorek vybrán, je normálně rozdělená. Případ II. Pokud jsou splněny následující dvě podmínky: 1. Směrodatná odchylka populace σ je neznáma. 2. Velikost vzorku je velká (tj. n ≥ 30). Případ III. Pokud jsou splněny následující tři podmínky: 1. Směrodatná odchylka populace σ je neznáma. 2. Velikost vzorku je malá (tj. n < 30). 3. Populace, ze které byl vzorek vybrán, není normálně rozdělená (nebo její rozdělení není známo). ·Testování hypotéz o střední hodnotě a poměru · 50 / 89 Testování hypotéz o µ: při neznámém σ Testování hypotéz o µ: při neznámém σ Tři možné případy ·Testování hypotéz o střední hodnotě a poměru · 51 / 89 Testování hypotéz o µ: při neznámém σ Testování hypotéz o µ: při neznámém σ Hodnota testové statistiky t pro průměr vzorku ¯x je vypočítána jako t = ¯x − µ s¯x kde s¯x = s √ n . Hodnota t, vypočítaná pro ¯x použitím tohoto vzorce, se také nazývá realizovaná hodnota t. ·Testování hypotéz o střední hodnotě a poměru · 52 / 89 Testování hypotéz o µ: při neznámém σ Příklad 5 Zadání: Psycholog tvrdí, že průměrný věk, kdy děti začínají chodit, je 12.5 měsíce. Karolína chtěla ověřit, zda je toto tvrzení pravdivé. Vzala náhodný vzorek 18 dětí a zjistila, že průměrný věk, ve kterém tyto děti začaly chodit, byl 12.9 měsíce se směrodatnou odchylkou 0.8 měsíce. Je známo, že věk, kdy všechny děti začínají chodit, je přibližně normálně rozdělen. Najděte p-hodnotu pro test, zda průměrný věk, kdy všechny děti začínají chodit, se liší od 12.5 měsíce. Jaký bude váš závěr, pokud je hladina významnosti 1 %? ·Testování hypotéz o střední hodnotě a poměru · 53 / 89 Testování hypotéz o µ: při neznámém σ Příklad 5: řešení Krok 1 H0 : µ = 12.5; H1 : µ ̸= 12.5 Krok 2 Populační směrodatná odchylka σ není známa, velikost vzorku je malá (n < 30), a populace je normálně rozdělená. V důsledku toho použijeme Studentovo t-rozdělení k nalezení p-hodnoty pro test. Krok 3 s¯x = s √ n = 0.8 √ 18 = 0.18856 t = ¯x − µ s¯x = 12.9 − 12.5 0.18856 = 2.121 ·Testování hypotéz o střední hodnotě a poměru · 54 / 89 Testování hypotéz o µ: při neznámém σ Příklad 5: řešení Stupně volnosti df = n − 1 = 18 − 1 = 17; p-hodnota = 0.0489 ·Testování hypotéz o střední hodnotě a poměru · 55 / 89 Testování hypotéz o µ: při neznámém σ Příklad 5: řešení Krok 4 Pro jakékoli α větší než 0.0489 zamítneme nulovou hypotézu. Pro jakékoli α menší než 0.0489 nulovou hypotézu nezamítneme. V našem příkladu je α = 0.01, což je méně než spodní hranice rozsahu p-hodnot 0.0489. V důsledku toho nulovou hypotézu nezamítneme a dojdeme k závěru, že průměrný věk, kdy děti začínají chodit, se významně neliší od 12.5 měsíce. ·Testování hypotéz o střední hodnotě a poměru · 56 / 89 Testování hypotéz o µ: při neznámém σ Příklad 6 Zadání: Společnost Elektro Auto vyrábí autobaterie. Společnost tvrdí, že její nejlepší baterie Never Die mají průměrnou životnost alespoň 65 měsíců. Agentura na ochranu spotřebitele otestovala 45 takových baterií, aby tvrzení ověřila. Zjistila, že průměrná životnost těchto 45 baterií je 63.4 měsíce se směrodatnou odchylkou 3 měsíce. Zjistěte p-hodnotu pro test, že průměrná životnost baterií je menší než 65 měsíců. Jaký bude váš závěr, jestliže je hladina významnosti 2.5 %? ·Testování hypotéz o střední hodnotě a poměru · 57 / 89 Testování hypotéz o µ: při neznámém σ Příklad 6: řešení Krok 1 H0 : µ ≥ 65; H1 : µ < 65 Krok 2 Populační směrodatná odchylka σ není známa, velikost vzorku je velká (n > 30). V důsledku toho použijeme t-rozdělení k nalezení p-hodnoty pro test. Krok 3 s¯x = s √ n = 3 √ 45 = 0.44721 t = ¯x − µ s¯x = 63.4 − 65 0.44721 = −3.578 ·Testování hypotéz o střední hodnotě a poměru · 58 / 89 Testování hypotéz o µ: při neznámém σ Příklad 6: řešení Stupně volnosti df = n − 1 = 45 − 1 = 44; p-hodnota < 0.001. Na základě p-hodnoty, která je menší než hladina významnosti 2.5 % můžeme zamítnout nulovou hypotézu. Je tedy vysoce nepravděpodobné, že by průměrná životnost baterií Never Die dosahovala minimálně 65 měsíců, jak tvrdí společnost. ·Testování hypotéz o střední hodnotě a poměru · 59 / 89 Testování hypotéz o µ: při neznámém σ Příklad 7 Zadání: Pokračování Příkladu 5. Psycholog tvrdí, že průměrný věk, kdy děti začínají chodit, je 12.5 měsíce. Karolína chtěla ověřit, zda je toto tvrzení pravdivé. Vzala náhodný vzorek 18 dětí a zjistila, že průměrný věk, ve kterém tyto děti začaly chodit, byl 12.9 měsíce se směrodatnou odchylkou 0.8 měsíce. Můžeme s použitím hladiny významnosti 1 % vyvodit závěr, že průměrný věk, ve kterém všechny děti začínají chodit, se liší od 12.5 měsíce? Předpokládejme, že věk, ve kterém všechny děti začínají chodit, má přibližně normální rozdělení. ·Testování hypotéz o střední hodnotě a poměru · 60 / 89 Testování hypotéz o µ: při neznámém σ Příklad 7: řešení Krok 1 H0 : µ = 12.5; H1 : µ ̸= 12.5 Krok 2 Populační směrodatná odchylka σ není známa, velikost vzorku je malá (n < 30), a populace je normálně rozdělená. V důsledku toho použijeme t-rozdělení k nalezení p-hodnoty pro test. Krok 3 s¯x = s √ n = 0.8 √ 18 = 0.18856 t = ¯x − µ s¯x = 12.9 − 12.5 0.18856 = 2.121 ·Testování hypotéz o střední hodnotě a poměru · 61 / 89 Testování hypotéz o µ: při neznámém σ Příklad 7: řešení Krok 4 Symbol ̸= v alternativní hypotéze naznačuje, že test je oboustranný a oblast zamítnutí leží v obou chvostech. Oblast v každém chvostu = α 2 = 0.01 2 = 0.005. Stupně volnosti df = n − 1 = 18 − 1 = 17. Kritické hodnoty pro t pro 17 stupňů volnosti a oblast 0.005 v každém chvostu jsou −2.898 a 2.898. ·Testování hypotéz o střední hodnotě a poměru · 62 / 89 Testování hypotéz o µ: při neznámém σ Příklad 7: řešení Na základě vypočítané testové statistiky t = 2.121 a zjištěné kritické hodnoty −2.898 při zvolené hladině významnosti 1 % nedokážeme zamítnout nulovou hypotézu. Na této úrovni významnosti tedy nelze s dostatečnou jistotou tvrdit, že průměrný věk, kdy děti začínají chodit, je rozdílný od 12.5 měsíce. ·Testování hypotéz o střední hodnotě a poměru · 63 / 89 Testování hypotéz o µ: při neznámém σ Příklad 8 Zadání: Vedení jedné komerční banky je vždy znepokojeno kvalitou služeb poskytovaných svým zákazníkům. S původním počítačovým systémem mohl pokladní v této bance obsloužit průměrně 22 zákazníků za hodinu. Vedení si všimlo, že s touto úrovní služeb byla doba čekání zákazníků příliš dlouhá. Nedávno vedení banky nainstalovalo nový počítačový systém v očekávání, že zvýší úroveň poskytovaných služeb a tím zkrátí dobu čekání zákazníků. Pro ověření, zda je nový počítačový systém účinnější než ten starý, vedení banky provedlo náhodný výběr 70 hodin a zjistilo, že během těchto hodin průměrný počet zákazníků obsluhovaných pokladníky byl 27 za hodinu se směrodatnou odchylkou 2.5. Na hladině významnosti 1 % ověřte závěr, že je nový počítačový systém účinnější než ten starý. ·Testování hypotéz o střední hodnotě a poměru · 64 / 89 Testování hypotéz o µ: při neznámém σ Příklad 8: řešení Krok 1 H0 : µ = 22; H1 : µ > 22 Krok 2 Populační směrodatná odchylka σ není známa, velikost vzorku je velká (n > 30). V důsledku toho použijeme Studentovo t-rozdělení k nalezení p-hodnoty pro test. Krok 3 s¯x = s √ n = 2.5 √ 70 = 0.29881 t = ¯x − µ s¯x = 27 − 22 0.29881 = 16.733 ·Testování hypotéz o střední hodnotě a poměru · 65 / 89 Testování hypotéz o µ: při neznámém σ Příklad 8: řešení Krok 4 Symbol > v alternativní hypotéze naznačuje, že test je jednostranný a oblast zamítnutí se nachází v pravém chvostu. Oblast v pravém chvostu = α = 0.01. Stupně volnosti df = n − 1 = 70 − 1 = 69. Kritická hodnota pro t pro 69 stupňů volnosti a oblast 0.01 v pravém ocásku je 2.382. ·Testování hypotéz o střední hodnotě a poměru · 66 / 89 Testování hypotéz o µ: při neznámém σ Příklad 8: řešení Krok 4 Hodnota realizace testové statistiky t = 16.733 je větší než kritická hodnota t = 2.382 a nachází se v oblasti zamítnutí. Proto zamítáme H0. V důsledku toho dospíváme k závěru, že hodnota vzorkového průměru je příliš vysoká ve srovnání s hypotetickou hodnotou průměru populace a rozdíl mezi nimi nemusí být způsoben pouze náhodou. ·Testování hypotéz o střední hodnotě a poměru · 67 / 89 Testování hypotéz o µ: při neznámém σ Co když je velikost vzorku příliš velká? 1. Použijte hodnotu t z posledního řádku (řádku s ∞) v Tabulce V v Příloze B. 2. Použijte normální rozdělení jako aproximaci t rozdělení. ·Testování hypotéz o střední hodnotě a poměru · 68 / 89 Testování hypotéz o poměru Obsah: Případové studie Testování hypotéz: Úvod Testování hypotéz o µ: při známém σ Testování hypotéz o µ: při neznámém σ Testování hypotéz o poměru ·Testování hypotéz o střední hodnotě a poměru · 69 / 89 Testování hypotéz o poměru Testování hypotéz o poměru Hodnota testové statistiky z pro podíl získaný ze vzorku, ˆp, je vypočítána jako z = ˆp − p σˆp kde σˆp = pq n Hodnota p, která je použita v tomto vzorci, je ta z nulové hypotézy. Hodnota q je rovna 1 − p. Hodnota z, vypočítaná pro ˆp pomocí výše uvedeného vzorce, se také nazývá realizovaná hodnota z. ·Testování hypotéz o střední hodnotě a poměru · 70 / 89 Testování hypotéz o poměru Příklad 9 Zadání: Podle průzkumu agentury provedeného v březnu 2014 bylo 20 % absolventů vysokých škol emočně připojeno ke své alma mater. Předpokládejme, že tento výsledek platí pro populaci absolventů vysokých škol v roce 2014. V náhodně vybraném vzorku 2000 absolventů vysokých škol 22 % uvedlo, že je emočně připojeno ke své alma mater. Najděte p-hodnotu pro test hypotézy, že současný podíl absolventů vysokých škol, kteří jsou emočně připojeni ke své alma mater, se liší od 20 %. Jaký je váš závěr, pokud je hladina významnosti 5 %? ·Testování hypotéz o střední hodnotě a poměru · 71 / 89 Testování hypotéz o poměru Příklad 9: řešení Krok 1 H0 : p = 0.20; H1 : p ̸= 0.20 Krok 2 Pro ověření, zda je vzorek dostatečně velký, vypočítáme hodnoty np a nq: np = 2000 · (0.20) = 400 > 5 nq = 2000 · (0.80) = 1600 > 5 Následně použijeme normální rozdělení k nalezení p-hodnoty pro tento test. Krok 3 Symbol ̸= v alternativní hypotéze naznačuje, že test je oboustranný. σˆp = pq n = (.20)(.80) 2000 = .00894427 z = ˆp − p σˆp = .22 − .20 .00894427 = 2.24 ·Testování hypotéz o střední hodnotě a poměru · 72 / 89 Testování hypotéz o poměru Příklad 9: řešení p-hodnota = 2(.01250) = .0250 ·Testování hypotéz o střední hodnotě a poměru · 73 / 89 Testování hypotéz o poměru Příklad 9: řešení Krok 4 Protože p-hodnota (0.025) je menší než hladina významnosti (α = 0.05), zamítáme nulovou hypotézu. Závěrem je, že existují statisticky významné důkazy na hladině významnosti 5 %, které naznačují, že současné procento absolventů vysokých škol, kteří jsou emočně vázáni na svou alma mater, se liší od 20 %. ·Testování hypotéz o střední hodnotě a poměru · 74 / 89 Testování hypotéz o poměru Příklad 10 Zadání: Když stroj používaný k výrobě čipů pro kalkulátory funguje správně, pak nevyrábí více než 4 % vadných čipů. Pokud stroj vyrábí více než 4 % vadných čipů, potřebuje úpravu. K ověření, zda stroj pracuje správně, oddělení kontroly kvality ve společnosti často odebírá vzorky čipů a podrobuje je inspekci, aby zjistilo, zda jsou dobré nebo vadné. Nedávno byl jeden takový náhodný vzorek 200 čipů odebrán z výrobní linky a obsahoval 12 vadných čipů. Najděte p-hodnotu pro test hypotézy, zda stroj potřebuje úpravu. Jaký bude váš závěr, pokud je hladina významnosti 2.5 %? ·Testování hypotéz o střední hodnotě a poměru · 75 / 89 Testování hypotéz o poměru Příklad 10: řešení Krok 1 H0 : p ≤ 0.04; H1 : p > 0.04 Krok 2 Pro ověření, zda je vzorek dostatečně velký, vypočítáme hodnoty np a nq: np = 200 · (0.04) = 8 > 5 nq = 200 · (0.96) = 192 > 5 Následně použijeme normální rozdělení k nalezení p-hodnoty pro tento test. Krok 3 Symbol > v alternativní hypotéze naznačuje, že test je pravostranný. σˆp = pq n = (.04)(.96) 200 = .01385641 z = ˆp − p σˆp = .06 − .04 .01385641 = 1.44 ·Testování hypotéz o střední hodnotě a poměru · 76 / 89 Testování hypotéz o poměru Příklad 10: řešení p-hodnota = .0749 ·Testování hypotéz o střední hodnotě a poměru · 77 / 89 Testování hypotéz o poměru Příklad 10: řešení Krok 4 Můžeme konstatovat, že pro libovolné α větší než 0.0749 zamítneme nulovou hypotézu, a pro libovolné α menší nebo rovné 0.0749 nulovou hypotézu nezamítneme. Pro náš příklad platí α = 0.025, což je menší než p-hodnota 0.0749. V důsledku toho nezamítáme H0 a dospíváme k závěru, že stroj nepotřebuje žádnou úpravu. ·Testování hypotéz o střední hodnotě a poměru · 78 / 89 Testování hypotéz o poměru Příklad 11 Zadání: Podle průzkumu agentury provedeného v březnu 2014 bylo 20 % absolventů vysokých škol emočně připojeno ke své alma mater. Předpokládejme, že tento výsledek platí pro populaci absolventů vysokých škol v roce 2014. V náhodně vybraném vzorku 2000 absolventů vysokých škol 22 % uvedlo, že je emočně připojeno ke své alma mater. Můžete s použitím hladiny významnosti 5 % vyvodit závěr, že současný procentní podíl absolventů vysokých škol, kteří jsou emočně připojeni ke své alma mater, se liší od 20 %? ·Testování hypotéz o střední hodnotě a poměru · 79 / 89 Testování hypotéz o poměru Příklad 11: řešení Krok 1 H0 : p = 0.20; H1 : p ̸= 0.20 Krok 2 Pro ověření, zda je vzorek dostatečně velký, vypočítáme hodnoty np a nq: np = 2000 · (0.20) = 400 > 5 nq = 2000 · (0.80) = 1600 > 5 Následně použijeme normální rozdělení k nalezení p-hodnoty pro tento test. Krok 3 σˆp = pq n = (.20)(.80) 2000 = .00894427 z = ˆp − p σˆp = .22 − .20 .00894427 = 2.24 ·Testování hypotéz o střední hodnotě a poměru · 80 / 89 Testování hypotéz o poměru Příklad 11: řešení Krok 4 Symbol ̸= v alternativní hypotéze naznačuje, že test je oboustranný. Celková plocha obou oblastí zamítnutí je tedy 0.05, a oblast zamítnutí v každém ocásku výběrového rozdělení je α/2 = 0.05/2 = 0.025. Kritické hodnoty z, získané z tabulky standardizovaného normálního rozdělení, jsou -1.96 a 1.96, jak je uvedeno na obrázku. ·Testování hypotéz o střední hodnotě a poměru · 81 / 89 Testování hypotéz o poměru Příklad 11: řešení Krok 5 Hodnota realizace testové statistiky z = 2.24 spadá do oblasti zamítnutí. V důsledku toho zamítáme H0 a konstatujeme, že současné procento absolventů vysokých škol, kteří jsou emočně vázáni na svou alma mater, se liší od 0.20. Následně můžeme říci, že rozdíl mezi hypotetickým populačním podílem 0.20 a vzorkovým podílem 0.22 je příliš velký na to, aby byl připsán pouze chybě vzorkování, při zvolené α = 0.05. ·Testování hypotéz o střední hodnotě a poměru · 82 / 89 Testování hypotéz o poměru Příklad 12 Zadání: Společnost TS Moravia prodává poštou počítače a počítačové díly. Společnost tvrdí, že minimálně 90 % všech objednávek je odesláno do 72 hodin poté, co jsou přijaty. Oddělení kontroly kvality ve společnosti často odebírá vzorky, aby zkontrolovalo, zda je toto tvrzení platné. Nedávno odebraný vzorek 150 objednávek ukázal, že 129 z nich bylo odesláno do 72 hodin. Myslíte si, že tvrzení společnosti je pravdivé? Použijte hladinu významnosti 2.5 %. ·Testování hypotéz o střední hodnotě a poměru · 83 / 89 Testování hypotéz o poměru Příklad 12: řešení Krok 1 H0 : p ≥ 0.90; H1 : p < 0.90 Krok 2 Pro ověření, zda je vzorek dostatečně velký, vypočítáme hodnoty np a nq: np = 150 · (0.90) = 135 > 5 nq = 150 · (0.10) = 15 > 5 Následně použijeme normální rozdělení k nalezení p-hodnoty pro tento test. Krok 3 σˆp = pq n = (.90)(.10) 150 = .02449 z = ˆp − p σˆp = .86 − .90 .02449 = −1.63 ·Testování hypotéz o střední hodnotě a poměru · 84 / 89 Testování hypotéz o poměru Příklad 12: řešení Krok 4 Symbol < v alternativní hypotéze naznačuje, že test je levostranný. Celková plocha oblasti zamítnutí je tedy α = 0.025. Kritická hodnoty z, získaná z tabulky standardizovaného normálního rozdělení je -1.96, jak je uvedeno na obrázku. ·Testování hypotéz o střední hodnotě a poměru · 85 / 89 Testování hypotéz o poměru Příklad 12: řešení Krok 5 Hodnota realizace testové statistiky z = −1.63 je větší než kritická hodnota z = −1.96, a nachází se v oblasti nezamítnutí. Proto nezamítáme H0. Můžeme konstatovat, že rozdíl mezi vzorkovým podílem a hypotetickou hodnotou populačního podílu je malý, a tento rozdíl mohl nastat pouze náhodou. ·Testování hypotéz o střední hodnotě a poměru · 86 / 89 Testování hypotéz o poměru Shrnutí přednášky: Případové studie Testování hypotéz: Úvod Testování hypotéz o µ: při známém σ Testování hypotéz o µ: při neznámém σ Testování hypotéz o poměru ·Testování hypotéz o střední hodnotě a poměru · 87 / 89 Testování hypotéz o poměru Co si nastudovat na příští týden? Příprava na cvičení: Leaflet 10 Koncepty a procedury, cv. 10, kap. 09 Povinná literatura: Mann (2016), Kapitola 10 ·Testování hypotéz o střední hodnotě a poměru · 88 / 89 Testování hypotéz o poměru Děkuji za pozornost! ·Testování hypotéz o střední hodnotě a poměru · 89 / 89