BPM.STAE: Sbírka úloh - cvičení 11, kapitola 10 Příklad 1 Úřad práce USA sbírá data o platbách dávek v nezaměstnanosti, které jsou vypláceny v různých státech. Předpokládejme, že během roku 2011 náhodný vzorek 1000 nezaměstnaných lidí na Floridě obdržel průměrnou týdenní dávku ve výši 219.65 dolarů, zatímco náhodný vzorek 900 nezaměstnaných lidí v Mississippi obdržel průměrnou týdenní dávku ve výši 191.47 dolarů. Předpokládejme, že populační směrodatné odchylky týdenních dávek pro všechny nezaměstnané pracovníky na Floridě a v Mississippi byly 35.15 a 28.22 dolarů. (Poznámka: Studie z roku 2011 od Daily-Finance.com (http://www.dailyfinan.ee. com/2011/05/12/unemployment-benef its-best-worst-states/) označila Mississippi a Floridu jako dva nejhorší státy pro nezaměstnanost.) a. Nechť /ii a /i2 jsou střední hodnoty dávek vyplácené všem nezaměstnaným pracovníkům během roku 2011 na Floridě a v Mississippi. Jaký je bodový odhad /ii — /i2? b. Sestavte 96% interval spolehlivosti pro /ii — /i2- c. Můžete na hladině významnosti 2 % tvrdit, že jsou střední hodnoty dávek vyplácených všem nezaměstna-ným pracovníkům během roku 2011 na Floridě a v Mississippi různé? Použijte přístup jak pomocí p-hodnoty, tak pomocí kritického oboru k provedení tohoto testu. Příklad 2 Místní kafeterie ve škole má samoobslužný stroj na zmrzlinu. Kafeterie poskytuje mísy, které mohou pojmout až 16 porcí zmrzliny. Manažer stravovacího provozu se zajímá o srovnání průměrného množství zmrzliny, které je vydáváno mužskými studenty, s průměrným množstvím vydávaným ženskými studenty. Na stroj na zmrzlinu bylo umístěno měřicí zařízení k určení vydaného množství. Bylo náhodně vybráno 90 mužských a 67 ženských studentů, kteří si vzali zmrzlinu. Průměry jednotlivých výběrů byly 8.32 a 6.49 uncí pro mužské a ženské studenty. Předpokládejte, že populační směrodatné odchylky jsou 1.22 a 1.17 uncí. a. Nechť /ii a /i2 jsou střední hodnoty množství zmrzliny vydané všemi mužskými a všemi ženskými studenty na této škole, odpovídajícím způsobem. Jaký je bodový odhad /ii — /i2? b. Sestavte 95% interval spolehlivosti pro /ii — /i2- c. Můžete na hladině významnosti 1 % tvrdit, že střední hodnota množství zmrzliny vydané všemi mužskými studenty na této koleji je větší než střední hodnota množství vydané všemi ženskými studenty? Použijte oba přístupy k provedení tohoto testu. Příklad 3 Zaměstnanci korporace mají obavy z poklesu kvality lékařských služeb poskytovaných skupinovým zdravotním pojištěním. Náhodný vzorek 100 návštěv zaměstnanců této korporace u obvodních lékařů v roce 2004 ukázal, že lékaři strávili s každým pacientem průměrně 18 minut. Letos náhodný vzorek 108 takových návštěv ukázal, že lékaři strávili s každým pacientem průměrně 15.5 minut. Předpokládejme, že směrodatné odchylky pro obě populace jsou 2.7 a 2.2 minuty. a. Sestavte 95% interval spolehlivosti pro rozdíl mezi středními hodnotami obou populací pro tyto dva roky. b. Můžete na hladině významnosti 2.5 % tvrdit, že střední hodnota času strávený lékaři s každým pacientem je nižší než v roce 2004? c. Jaké by bylo vaše rozhodnutí v části b), pokud by pravděpodobnost vzniku chyby I. druhu byla nulová? Vysvětlete. 1 Příklad 4 Vedení banky New Century tvrdí, že průměrná doba čekání všech zákazníků na pobočkách je menší než doba čekání u veřejné banky, která je jejím hlavním konkurentem. Konzultační firma vzala vzorek 200 zákazníků z banky New Century a zjistila, že čekali průměrně 4.7 minut před obsluhou. Další vzorek 300 zákazníků odebraný z veřejné banky ukázal, že tito zákazníci čekali průměrně 5 minut před obsluhou. Předpokládejte, že směrodatné odchylky pro obě populace jsou 1.2 a 1.5 minuty. a. Sestavte 97% interval spolehlivosti pro rozdíl mezi středními hodnotami obou populací. b. Testujte na hladině významnosti 2.5 %, zda je tvrzení vedení banky New Century pravdivé. c. Vypočítejte p-hodnotu pro test z části b). Zamítnete nulovou hypotézu, pokud a = 0.01? Co když a = 0.05? Příklad 5 Maine Mountain Dairy tvrdí, že průměrný počet kalorií v osmiuncových nízkotučných jogurtech je nižší než u jogurtů stejné velikosti vyráběných konkurenční společností. Spotřebitelská agentura chtěla toto tvrzení zkontrolovat. Vzorek 27 takových jogurtů vyrobených touto společností ukázal, že obsahují průměrně 141 kalorií na kelímek. Vzorek 25 takových jogurtů vyrobených jejím konkurentem ukázal, že obsahují průměrně 144 kalorií na kelímek. Předpokládejme, že obě populace jsou přibližně normálně rozdělené se směrodatnými odchylkami 5.5 a 6.4 kalorií. a. Sestavte 98% interval spolehlivosti pro rozdíl mezi střední hodnotou počtu kalorií v jogurtech vyráběných oběma společnostmi. b. Testujte na hladině významnosti 1 %, zda je tvrzení společnosti Maine Mountain Dairy pravdivé. c. Vypočítejte p-hodnotu pro test z části b). Zamítnete nulovou hypotézu, pokud a = 0.05? Co když a = 0.025? Příklad 6 Standardní doporučení pro výměnu oleje v automobilech je jednou každých 3000 mil. Místní mechanik se zajímá o to, zda lidé, kteří jezdí dražšími auty, pravděpodobněji toto doporučení dodržují. Byly sestaveny nezávislé náhodné výběry 45 zákazníků, kteří řídí luxusní vozy, a 40 zákazníků, kteří řídí kompaktní levnější vozy. Průměrná vzdálenost mezi výměnami oleje byla 3187 mil pro majitele luxusních aut a 3214 mil pro majitele kompaktních levných aut. Výběrové směrodatné odchylky jsou postupně 42.40 a 50.70 mil pro majitele luxusních vozů a majitele kompaktních levných aut. Předpokládejte, že vzdálenosti mezi výměnami oleje mají shodnou směrodatnou odchylku pro obě populace. a. Sestavte 95% interval spolehlivosti pro rozdíl mezi středními hodnotami vzdáleností mezi výměnami oleje pro všechny luxusní a kompaktní levné vozy. b. Můžete na hladině významnosti 1 % tvrdit, že vzdálenost mezi výměnami oleje je menší pro všechna luxusní auta než pro všechny kompaktní levné vozy? Příklad 7 Město, které nedávno zahájilo program recyklace, poskytlo recyklační kontejnery o objemu 60 galonů pro 30 náhodně vybraných domácností a recyklační kontejnery o objemu 75 galonů pro 22 náhodně vybraných domácností. Celkový objem recyklace během 10-týdenního období byl měřen pro každou z domácností. Průměrné celkové objemy byly 365 a 423 galonů pro domácnosti s recyklačními kontejnery o objemech 60 a 75 galonů, odpovídajícím způsobem. Výběrové směrodatné odchylky jsou 52.5 a 43.8 galonů. Předpokládejte, že celkové desetitýdenní objemy určené k recyklaci mají přibližně normální rozdělení pro obě populace a že směrodatné odchylky jsou shodné. a. Sestavte 98% interval spolehlivosti pro rozdíl mezi středními hodnotami objemů 10-týdenní recyklace pro domácnosti s 60 a 75 galonovými kontejnery. b. Můžete na hladině významnosti 2 % tvrdit, že střední hodnota objemu 10-týdenní recyklace pro všechny domácnosti s 60 galonovými kontejnery je odlišná od střední hodnoty objemu pro všechny domácnosti s 75 galonovými kontejnery? 2 Příklad 8 Spotřebitelská organizace testovala dva drtiče papíru, Piranhu a Krokodýla, navržené pro domácí použití. Každý z 10 náhodně vybraných dobrovolníků rozdrtil 100 listů papíru s Piranhou a pak další vzorek 10 náhodně vybraných dobrovolníků rozdrtil 100 listů s Krokodýlem. Piranha potřebovala průměrně 218 sekund na rozdrcení 100 listů s odchylkou 8 sekund. Krokodýl potřeboval průměrně 163 sekund na rozdrcení 100 listů s odchylkou 4 sekund. a. Sestavte 99% interval spolehlivosti pro rozdíl mezi středními hodnotami obou populací. b. Můžete na hladině významnosti 1 % tvrdit, že střední hodnota času potřebný Piranhou na rozdrcení 100 listů je větší než u Krokodýla? c. Jaké by bylo vaše rozhodnutí v části b), pokud by pravděpodobnost vzniku chyby I. druhu byla nulová? Vysvětlete. Příklad 9 Společnost A tvrdí, že její lék poskytuje rychlejší úlevu od bolesti než lék jiné společnosti B. Výzkumník testoval obě značky léků na dvou skupinách náhodně vybraných pacientů. Výsledky testu jsou uvedeny v následující tabulce. Průměr a směrodatná odchylka časů úlevy jsou v minutách. Výběrová směrodatná Velikost Průměrná odchylka Značka vzorku doby úlevy doby úlevy Ä 30 43 12 B 28 48 7 Předpokládejte, že obě populace jsou přibližně normálně rozdělené se stejnými, ale neznámými směrodatnými odchylkami. a. Sestavte 99% interval spolehlivosti pro rozdíl mezi středními hodnotami časů úlevy pro obě značky léků. b. Testujte na hladině významnosti 1 %, zda je střední hodnota doby úlevy pro značku A menší než u značky B. Příklad 10 Podle úvěrové ratingové agentury Equifax se mezi lednem 2011 a květnem 2011 zvýšily kreditní limity na nově vydávaných kreditních kartách (http://money.cnn.com/2011/08/19/pf/credit\_card\_issuance/index.htm). Předpokládejme, že náhodné vzorky 400 kreditních karet vydaných v lednu 2011 a 500 kreditních karet vydaných v květnu 2011 měly průměrné kreditní limity 2635 dolarů a 2887 dolarů. Předpokládejte, že výběrové směrodatné odchylky obou výběrů byly 365 a 412 dolarů. Dále předpokládejte, že směrodatné odchylky jsou stejné pro obě populace. a. Nechť yui a /j.2 jsou střední hodnoty limitů na všech kreditních kartách vydaných v lednu 2011 a v květnu 2011. Jaký je bodový odhad yui — /i2? b. Sestavte 98% interval spolehlivosti pro /ii — /i2- c. Můžete na hladině významnosti 1% tvrdit, že střední hodnota limitu pro všechny nově vydané kreditní karty v lednu 2011 byla nižší než odpovídající střední hodnota pro všechny kreditní karty vydané v květnu 2011? Použijte k tomu jak přístup pomocí kritického oboru, tak i p-hodnotu. 3 Příklad 11 Vzorek 45 zákazníků, kteří řídí luxusní vozy, ukázal, že jejich průměrná vzdálenost mezi výměnami oleje byla 3187 mil s výběrovou směrodatnou odchylkou 42.40 mil. Další vzorek 40 zákazníků, kteří řídí kompaktní levnější vozy, vedl k průměrné vzdálenosti 3214 mil se směrodatnou odchylkou 50.70 mil. Předpokládejme, že směrodatné odchylky pro obě populace nejsou rovny. a. Sestavte 95% interval spolehlivosti pro rozdíl mezi středními hodnotami vzdáleností mezi výměnami oleje pro všechny luxusní a kompaktní levné vozy. b. Můžete na hladině významnosti 1 % tvrdit, že střední hodnota vzdáleností mezi výměnami oleje je menší pro všechny luxusní vozy než pro všechny kompaktní levné vozy? c. Předpokládejme, že výběrové směrodatné odchylky byly 28.9 a 61.4 mil. Opakujte části a) a b). Diskutujte o jakýchkoli změnách výsledků. Příklad 12 Pojišťovna chce vědět, zdaje průměrná rychlost vyšší u mužů než u žen. Společnost náhodně vybrala 30 aut řízených muži na dálnici a zjistila, že průměrná rychlost byla 74 mil za hodinu se směrodatnou odchylkou 3.1 mil za hodinu. Další výběr 18 aut řízených ženami na stejné dálnici dával průměrnou rychlost 68 mil za hodinu se směrodatnou odchylkou 2.5 mil za hodinu. Předpokládejme, že rychlosti, kterými řídí muži a ženy auta na této dálnici, jsou obě normálně rozdělené s různými směrodatnými odchylkami populací. a. Sestavte 98% interval spolehlivosti pro rozdíl mezi středními hodnotami rychlostí aut řízenými všemi muži a všemi ženami na této dálnici. b. Testujte na hladině významnosti 1 %, zda je střední hodnota rychlosti aut řízených všemi muži na této dálnici vyšší než u aut řízených všemi ženami. c. Předpokládejme, že výběrové směrodatné odchylky byly 1.9 a 3.4 mil za hodinu. Opakujte části a) a b). Diskutujte o jakýchkoli změnách výsledků. Příklad 13 Školní poradkyně chtěla vědět, zda žáci desátých tříd na její škole mají tendenci mít více volného času než studenti dvanáctých tříd. Vzala náhodné výběry 25 žáků desátých tříd a 22 žáků dvanáctých tříd. Každý student byl požádán, aby zaznamenal množství volného času, který má v průměru za týden. Průměr pro žáky desátých tříd byl 29 hodin volného času týdně se směrodatnou odchylkou 7.0 hodin. Pro žáky dvanáctých tříd byl průměr 22 hodin volného času týdně se směrodatnou odchylkou 6.4 hodin. Nyní předpokládejme, že obě populace jsou normálně rozdělené s různými a neznámými směrodatnými odchylkami populace. a. Sestavte 90% interval spolehlivosti pro rozdíl mezi odpovídajícími středními hodnotami populací. b. Testujte na hladině významnosti 5 %, zda jsou obě střední hodnoty populací různé. c. Předpokládejme, že výběrové směrodatné odchylky byly 9.5 a 5.1 hodin. Opakujte části a) a b). Diskutujte o jakýchkoli změnách výsledků. Příklad 14 Město, které nedávno zahájilo program recyklace, poskytlo recyklační kontejnery o objemu 60 galonů pro 30 náhodně vybraných domácností a recyklační kontejnery o objemu 75 galonů pro 22 náhodně vybraných domácností. Průměrné celkové objemy recyklace za 10 týdnů byly 365 a 423 galonů pro obě skupiny, s výběrovými směrodatnými odchylkami 52.5 a 43.8 galonů. Předpokládejme, že směrodatné odchylky pro obě populace nejsou stejné. 4 a. Sestavte 98% interval spolehlivosti pro rozdíl mezi středními hodnotami objemů lOtýdenní recyklace pro domácnosti s recyklačními kontejnery o objemech 60 a 75 galonů. b. Můžete na hladině významnosti 2 % tvrdit, že střední hodnota objemu recyklace za 10 týdnů pro všechny domácnosti s 60 galonovými kontejnery je odlišná od střední hodnoty objemu pro všechny domácnosti s 75 galonovými kontejnery? c. Předpokládejme, že výběrové směrodatné odchylky byly 59.3 a 33.8 galonů. Opakujte části a) a b). Diskutujte o jakýchkoli změnách výsledků. Podle ratingové agentury pro úvěrový rating se mezi lednem 2016 a květnem 2016 zvýšily kreditní limity na nově vydaných kreditních kartách. Předpokládejme, že náhodné výběry 400 nových kreditních karet vydaných v lednu 2016 a 500 nových kreditních karet vydaných v květnu 2016 měly průměrné kreditní limity 2635 a 2887 dolarů. Předpokládejme, že výběrové směrodatné odchylky pro tyto dva vzorky byly 365 a 412 dolarů. Nyní předpokládejme, že směrodatné odchylky pro obě populace jsou neznámé a nejsou si rovny. a. Nechť yui a /j.2 jsou střední hodnoty limitů na všechny kreditní karty vydané v lednu 2016 a v květnu 2016. Jaký je bodový odhad yui — /i2? b. Sestavte 98% interval spolehlivosti pro /ii — /i2- c. Můžete na hladině významnosti 1 % tvrdit, že střední hodnota limitu pro všechny nové kreditní karty vydané v lednu 2016 byla nižší než odpovídající střední hodnota pro všechny kreditní karty vydané v květnu 2016? Použijte k tomu jak kritický obor, tak i p-hodnotu. Několik bývalých závodníků na kole trénuje velkou skupinu mladých nadějných cyklistů. Náhodně vybírají sedm ze svých jezdců, aby se zúčastnili testu účinnosti nového doplňku stravy, který by měl zvyšovat sílu a vytrvalost. Každý ze sedmi jezdců absolvuje časovou zkoušku na stejné trase. Poté všichni berou doplněk stravy následující 4 týdny. Všechny ostatní aspekty tréninku zůstávají stejné. Po 4 týdnech závodníci zajedou stejnou trasu. Časy (v minutách) jsou zaznamenány v následující tabulce (čas před a po čtyřtýdenním období). Předpokládejte, že párové rozdíly jsou (přibližně) normálně rozděleny. a. Sestavte interval spolehlivosti 99% pro střední hodnotu populace párových rozdílů, kde párový rozdíl je roven času před užitím doplňku stravy mínus čas po užití doplňku stravy. b. Na hladině významnosti 2.5 % ověřte, zda užívání tohoto doplňku stravy vede ke zkrácení časů na trase. Příklad 17 Soukromá agentura tvrdí, že intenzivní kurz, který nabízí, významně zvyšuje rychlost psaní na počítači. Následující tabulka uvádí skóre osmi sekretářek před a po absolvování tohoto kurzu. a. Vytvořte interval spolehlivosti 90% pro střední hodnotu párových rozdílů populace, kde párový rozdíl je roven skóre před absolvováním kurzu mínus skóre po absolvování kurzu. b. Můžete na hladině významnosti 5 % usoudit, že absolvování tohoto kurzu zvyšuje rychlost psaní na počítači? Příklad 15 Příklad 16 Před 103 97 111 95 Po 100 95 104 101 102 96 108 96 91 101 Před 81 75 89 91 65 70 90 64 Po 97 72 93 110 78 69 115 72 5 Příklad 18 Výrobce přísady do benzínu tvrdí, že použití této přísady zvyšuje výkonnost benzínu. Byl vybrán náhodný vzorek šesti aut, která byla řízena po dobu 1 týdne bez přídavku do benzínu a poté po dobu 1 týdne s přídavkem do benzínu. Následující tabulka uvádí míle na galon pro tato auta bez a s přídavkem do benzínu. Bez S 23.8 28.3 18.5 23.7 13.6 28.8 26.3 30.5 18.2 25.3 16.3 30.9 a. Sestavte 99% interval spolehlivosti pro střední hodnotu párových rozdílů populace, kde párový rozdíl je roven mílím na galon bez přídavku do benzínu mínus míle na galon s přídavkem do benzínu. b. Můžete na hladině významnosti 2.5 % usoudit, že použití přídavku do benzínu zvyšuje spotřebu benzínu? Příklad 19 Společnost zvažuje instalaci nových strojů pro montáž svých výrobků. Společnost zvažuje dva typy strojů, ale koupí pouze jeden typ. Společnost vybrala osm montážních dělníků a požádala je, aby použili tyto dva typy strojů k montáži výrobků. Následující tabulka uvádí čas (v minutách) potřebný k montáži jedné jednotky výrobku na každý typ stroje pro každého z těchto osmi dělníků. Předpokládejte, že párové rozdíly jsou (přibližně) normálně rozděleny. Stroj I Stroj II 23 26 19 24 27 22 20 18 21 24 23 25 24 28 24 23 a. Sestavte 98% interval spolehlivosti pro střední hodnotu párových rozdílů populace, kde párový rozdíl je roven času potřebnému k montáži jednotky výrobku na stroji I mínus času potřebnému k montáži jednotky výrobku na stroji II. b. Na hladině významnosti 5 % ověřte, zda jsou střední hodnoty časů potřebné k montáži jednotky výrobku odlišné pro oba typy strojů. Příklad 20 Globální recese přiměla více lidí k tomu, aby se přestěhovali k příbuzným, což vedlo k velkému množství domácností s více generacemi. Průzkum Pew Research Center z října 2011 ukázal, že 11.5 % lidí žijících v domácnostech s více generacemi žilo pod hranicí chudoby a 14.6 % lidí žijících v jiných typech domácností žilo pod hranicí chudoby (www. pewsocialtrends. org/2011/10/03/f ighting-poverty-irL-a-bad-economy-americans-move-iii-witli-relatives/ ?src-prc4readline). Předpokládejme, že tyto výsledky byly založeny na výběru 1000 lidí žijících v domácnostech s více generacemi a 2000 lidí žijících v jiných typech domácností. a. Nechť p\ je podíl všech lidí v domácnostech s více generacemi, kteří žijí pod hranicí chudoby, a p2 nechť je podíl všech lidí v jiných typech domácností, kteří žijí pod hranicí chudoby. Sestrojte 98% interval spolehlivosti pro Pi -P2- b. Můžete na hladině významnosti 2.5 % usoudit, že pi je menší než p'{l Použijte přístup pomocí kritického oboru. c. Zopakujte část b) pomocí p-hodnoty. Příklad 21 Průzkum společnosti Gallup z listopadu 2011 se zeptal amerických dospělých na jejich názory na zdravotní péči a zdravotnický systém ve Spojených státech. I když pocity o kvalitě zdravotní péče byly pozitivní, to samé nelze říci o kvalitě zdravotního systému. Podle této studie označilo 29 % nezávislých a 27 % demokratů zdravotní systém za vynikající nebo dobrý (www.gallup.com/poll/t50788/Americans-Maintaiii-Negative-View-Healtlicare-Coverage. aspx). Předpokládejme, že tyto výsledky byly založeny na výběru 1200 nezávislých a 1300 demokratů. 6 a. Nechť p\ a P2 jsou podíly všech nezávislých a všech demokratů, kteří označí zdravotní systém za vynikající nebo dobrý. Sestrojte 97% interval spolehlivosti pro pi — P2- b. Můžete na hladině významnosti 1 % usoudit, že p\ se liší od p'{l Použijte jak přístup pomocí kritického oboru, tak p-hodnoty. Příklad 22 Podle průzkumů Pew Research Center v lednu 2011 používalo 79 % Američanů internet a v lednu 2012 ho používalo 83 % (USA TODAY, 26. ledna 2012). Předpokládejme, že tato procenta jsou založena na náhodných výběrech 1800 Američanů v lednu 2011 a 1900 v lednu 2012. a. Nechť p\ a p2 jsou podíly všech Američanů, kteří v lednu 2011 a v lednu 2012 používali internet. Sestrojte 98% interval spolehlivosti pro p\ — P2- b. Můžete na hladině významnosti 1 % usoudit, že p\ je nižší než pg? Použijte jak přístup pomocí kritického oboru, tak přístup pomocí p-hodnoty. Příklad 23 Bernard Haldane Associates provedla průzkum v roce 2004 mezi 1021 kancelářskými pracovníky, kteří měli práci v předchozích dvanácti měsících. Z těchto pracovníků mělo 56 % mužů a 35 % žen vyšší plat ve své nové práci, když změnili zaměstnání (USA TODAY, 28. dubna 2004). Předpokládejme, že tato procenta jsou založena na náhodných výběrech 510 mužů a 510 žen. a. Jaký je bodový odhad rozdílu mezi populačními podíly? b. Sestrojte 95% interval spolehlivosti pro rozdíl mezi oběma populačními podíly. c. Můžete na hladině významnosti 2 % usoudit, že oba populační podíly jsou odlišné? Použijte jak přístup pomocí kritického oboru, tak přístup pomocí p-hodnoty. Příklad 24 Podle zprávy z června 2009 (http://www.alertnet.org/thenews/newsdesk/L31011082.htm) si 68 % lidí se „zelenými" pracovními místy v Severní Americe myslelo, že mají pracovní jistotu, zatímco pouze 60 % lidí ve Spojeném království si myslelo totéž. Předpokládejme, že výsledky byly založeny na výběrech 305 lidí se "zelenými"pracovními místy ze Severní Ameriky a 280 lidí s takovými pracovními místy ze Spojeného království. a. Sestrojte 96% interval spolehlivosti pro rozdíl mezi podíly obou populací. b. Můžete na hladině významnosti 2 % usoudit, že podíl všech lidí se "zelenými"pracovními místy v Severní Americe, kteří si myslí, že mají pracovní jistotu, je vyšší než příslušný podíl pro Spojené království? Použijte přístup pomocí kritického oboru. c. Zopakujte část b) pomocí p-hodnoty. Příklad 25 Studie ze 7. července 2009 v časopise USA TODAY uvedla, že míra účasti v programu 401(k) mezi zaměstnanci s asijským původem v USA je 76 %, zatímco míra účasti mezi zaměstnanci s hispánským původem je 66 %. Předpokládejme, že tyto výsledky byly založeny na náhodných výběrech 100 zaměstnanců z každé skupiny. a. Sestrojte 95% interval spolehlivosti pro rozdíl mezi podíly obou populací. b. Můžete na hladině významnosti 5 % usoudit, že míry účasti v programu 401(k) jsou odlišné pro všechny zaměstnance s asijským původem v USA a všechny zaměstnance s hispánským původem? Použijte jak přístup pomocí kritického oboru, tak pomocí p-hodnoty. c. Zopakujte část a) a b) pro oba výběry velikosti 200 místo 100. Změní se vaše závěry v části b)? 7 Příklad 26 Konzultační agentura byla požádána velkou pojišťovací společností, aby zjistila, zda jsou studenti obchodních oborů lepší prodejci než ti s jinými vystudovanými obory. Výběr 20 prodejců s diplomem z obchodního oboru ukázal, že prodali průměrně 11 pojistných smluv týdně. Další výběr 25 prodejců s diplomem z jiného než obchodního oboru ukázal, že prodali průměrně 9 pojistných smluv týdně. Předpokládejte, že obě populace jsou přibližně normálně rozděleny se směrodatnými odchylkami populací 1.75 a 1.25 smluv týdně. a. Sestrojte 99% interval spolehlivosti pro rozdíl mezi středními hodnotami obou populací. b. Můžete na hladině významnosti 1 % usoudit, že osoby s obchodním diplomem jsou lepšími prodejci než ti, kteří mají diplom v jiné oblasti? Příklad 27 Podle odhadu jsou průměrné příjmy žen, které nejsou členy odborů, 909 $ týdně a průměrné příjmy žen, které jsou členy odborů, jsou 1035 $ týdně. Předpokládejme, že tyto průměrné příjmy jsou spočteny na základě náhodných výběrů 1500 žen, které nejsou členy odborů, a 2000 žen, které jsou členy odborů. Dále předpokládejte, že směrodatné odchylky pro obě odpovídající populace jsou 70 $ a 90 $. a. Sestrojte 95% interval spolehlivosti pro rozdíl mezi středními hodnotami obou populací. b. Testujte na hladině významnosti 2.5 %, zdaje střední hodnota týdenních příjmů žen, které nejsou členy odborů, nižší než střední hodnota týdenních příjmů žen, které jsou členy odborů. Příklad 28 V roce 2007 byl průměrný počet úmrtí při všech železničních nehodách 0.1994 na nehodu, zatímco průměrný počet úmrtí při všech rekreačních námořních nehodách byl 0.1320 na nehodu (Zdroj: http://www.bts.gov/publications/ national_transportation_statistics/#chapter_4). Předpokládejte, že náhodné výběry železničních a rekreačních námořních nehod pro tento rok mají průměrné počty úmrtí 0.183 a 0.146 na nehodu, se směrodatnými odchylkami 0.82 a 0.67. Statistiky železnice jsou založeny na náhodném výběru 418 nehod, zatímco statistiky rekreačního námořního sportu jsou založeny na náhodném výběru 392 nehod. Předpokládejte, že rozdělení počtu úmrtí mají stejnou směrodatnou odchylku pro obě populace. a. Sestrojte 98% interval spolehlivosti pro rozdíl středních hodnot počtu úmrtí na nehodu ve všech železničních a všech rekreačních námořních nehodách. b. Můžete na hladině významnosti 1 % usoudit, že střední hodnota počtu úmrtí při všech železničních nehodách je vyšší než střední hodnota počtu úmrtí při všech rekreačních námořních nehodách? Příklad 29 Výzkumník chce testovat, zda jsou průměrné GPA (průměrné známky) všech mužských a všech ženských studentů, kteří aktivně sportují, různé. Vzal náhodný výběr 28 mužů a 24 žen, kteří aktivně sportují. Zjistil, že průměrné GPA obou skupin jsou 2.62 a 2.74, s odpovídajícími směrodatnými odchylkami 0.43 a 0.38. a. Testujte na hladině významnosti 5 %, zda jsou střední hodnoty GPA obou populací různé. b. Sestrojte 90% interval spolehlivosti pro rozdíl mezi středními hodnotami obou populací. Předpokládejte, že GPA všech mužských a všech ženských studentů sportovců jsou normálně rozdělené se stejnými, ale neznámými směrodatnými odchylkami populací. 8 Příklad 30 Na základě celonárodního průzkumu dospělých od Průmyslové asociace cestovního ruchu, američtí občané v roce 2005 očekávali, že utratí průměrně 1019 $ na své nejdelší dovolenkové výlety v roce 2005, oproti 1101 $ v roce 2004 (USA TODAY, 20. května 2005). Předpokládejte, že průměr pro rok 2005 je založen na náhodném výběru 1000 dospělých a výběr pro rok 2004 je založen na náhodném vzorku 900 dospělých a že výběrové směrodatné odchylky pro takové výdaje jsou 320 $ pro rok 2005 a 305 $ pro rok 2004. Nechť /ii a /j.2 jsou střední hodnoty takových výdajů pro roky 2005 a 2004. a. Sestrojte 99% interval spolehlivosti pro /ii — /i2- b. Testujte na hladině významnosti 1 %, zda můžete usoudit, že střední hodnota výdajů pro rok 2005 je nižší než střední hodnota pro rok 2004? Předpokládejte, že výdaje pro roky 2005 a 2004 mají neznámé, ale stejné směrodatné odchylky populací. Příklad 31 Podle zprávy Úřadu práce vydané dne 25. března 2015 vydělávají statistici průměrně 84010 $ ročně a účetní a auditoři průměrně 73670 $ ročně (www.bls.gov). Předpokládejme, že tyto odhady jsou založeny na náhodných výběrech 2000 statistiků a 1800 účetních a auditorů. Dále předpokládejte, že výběrové směrodatné odchylky ročních výdělků těchto dvou skupin jsou 15200 $ a 14500 $, a že směrodatné odchylky populací jsou neznámé a různé pro tyto dvě skupiny. a. Sestrojte 98% interval spolehlivosti pro rozdíl středních hodnot ročních výdělků obou skupin. b. Můžete na hladině významnosti 1 % usoudit, že střední hodnota ročních příjmů statistiků je vyšší než střední hodnota ročních příjmů účetních a auditorů? Příklad 32 Manažer továrny vytvořil podrobný plán pro evakuaci budovy v případě požáru nebo jiné nouzové situace. Průmyslový psycholog věří, že pracovníci opouštějí továrnu rychleji na konci směny, aniž by následovali jakýkoli systém. Společnost pravidelně pořádá požární cvičení, během nichž zní zvonek a pracovníci opouštějí budovu podle systému. Čas evakuace pro každé cvičení je zaznamenán. Pro srovnání psycholog také zaznamenává čas evakuace, když zvonek zazní během konce směny. Náhodný výběr 36 požárních cvičení ukázal průměrný čas evakuace 5.1 minuty se směrodatnou odchylkou 1.1 minuty. Náhodný výběr 37 dnů během konce směny ukázal průměrný čas evakuace 4.2 minuty se směrodatnou odchylkou 1.0 minuty. a. Sestrojte 99% interval spolehlivosti pro rozdíl mezi středními hodnotami obou situací. b. Testujte na hladině významnosti 5 %, zdaje střední hodnota času evakuace menší během konce směny než během požárních cvičení. Předpokládejte, že časy evakuace mají neznámé a různé směrodatné odchylky odchylky pro obě situace. Příklad 33 V projektu Pew Internet and American Life bylo dotázáno 809 umělců a 2755 hudebníků na některé otázky týkající se internetu (zde umělci zahrnovali lidi v oblasti performančního a vizuálního umění a tvůrčího psaní). Na otázku, zda by mělo být legální vypálit kopii CD nebo DVD pro přítele, odpovědělo 48 % umělců a 71 % hudebníků, že by to mělo být nelegální (The New York Times, 6. prosince 2004). Předpokládejme, že 809 umělců a 2755 hudebníků, kteří byli dotazováni, tvoří náhodné výběry z jejich odpovídajících populací. a. Najděte 98% interval spolehlivosti pro rozdíl mezi odpovídajícími podíly v obou populacích. b. Můžete na hladině významnosti 2 % usoudit, že se podíly obou populací liší? 9 Příklad 34 Podle zprávy v The New York Times vydělávají ve Spojených státech účetní a auditoři průměrně 70130 $ ročně a úředníci pro poskytování půjček 67960 $ ročně (Jessica Silver-Greenberg, The New York Times, 22. dubna 2012). Předpokládejme, že tyto odhady jsou založeny na náhodných výběrech 1650 účetních a auditorů a 1820 úředníků pro poskytování půjček. Dále předpokládejme, že výběrové směrodatné odchylky mezd obou skupin jsou 14400 $ a 13600 $ a že směrodatné odchylky obou populací jsou si rovny. a. Sestrojte 98% interval spolehlivosti pro rozdíl středních hodnot ve mzdách obou skupin - účetních a auditorů a úředníků pro poskytování půjček. b. Můžete na hladině významnosti 1 % usoudit, že střední hodnota mezd účetních a auditorů je vyšší než ta úředníků pro poskytování půjček? Příklad 35 V telefonickém průzkumu Newsweek provedeném Princeton Survey Research Associates v únoru 2005 byli dospělí dotázáni na své postoje k sociálnímu zabezpečení a možným změnám v systému. Čtyřicet dva procenta lidí ve věku 45 až 54 let očekávalo, že sociální zabezpečení bude schopno splatit všechny dávky, na které měli podle zákona nárok v danou dobu, zatímco pouze 32 % lidí ve věku 18 až 34 let mělo stejný názor (Newsweek, 14. února 2005). Předpokládejme, že tato procenta byla založena na náhodných výběrech 800 dospělých z každé z těchto dvou věkových skupin. a. Sestrojte 95% interval spolehlivosti pro rozdíl mezi podíly obou populací. b. Můžete na hladině významnosti 2.5 % usoudit, že podíl lidí ve věku 18 až 34 let, kteří očekávali, že sociální zabezpečení jim zaplatí všechny takové dávky, je nižší než podíl lidí ve věku 45 až 54 let, kteří měli tento názor? Příklad 36 V květnovém průzkumu společnosti Harris Interactive v roce 2011 byly americké ženy dotázány: „Jak často si myslíte, že by měly ženy ve vašem věku, které nemají žádné zvláštní rizikové faktory pro rakovinu prsu, podstoupit mamografické vyšetření ke kontrolu rakoviny prsu?" Padesát procent žen ve věku 40 až 49 let a 56 % žen ve věku 50 let a starších odpovědělo ročně(www.harrisinteractive.com/NewsRoom/PressReleases/tabid/44/ctl/ReadCustomDefault/mid/ 1506/ArticleId/769/Def ault. aspx). Předpokládejme, že tyto výsledky byly založeny na výběrech 1055 žen ve věku 40 až 49 let a 1240 žen ve věku 50 let a starších. a. Nechť p\ a p2 jsou podíly všech žen ve věku 40 až 49 let a 50 let a starších, které řeknou, že ženy jejich věku s žádnými zvláštními rizikovými faktory pro rakovinu prsu by měly mít mamografické vyšetření každoročně. Sestrojte 98% interval spolehlivosti pro pi — P2- b. Můžete na hladině významnosti 1 % usoudit, že p\ je menší než p'{l Spočtěte jak pomocí kritického oboru, tak pomocí p-hodnoty. Příklad 37 Podle průzkumu Randstad Global Work Monitor uvedlo 52 % mužů a 43 % žen, že práce na částečný úvazek brání jejich kariérním příležitostem (USA TODAY, 6. října 2011). Předpokládejme, že tyto výsledky jsou založeny na náhodných výběrech 1350 mužů a 1480 žen. a. Nechť p\ a p2 jsou podíly všech mužů a všech žen, kteří řeknou, že práce na částečný úvazek brání jejich kariérním příležitostem, odpovídajícím způsobem. Sestrojte 95% interval spolehlivosti pro rozdíl p\ a p2- b. Můžete na hladině významnosti 2 % usoudit, že p\ a p2 jsou různé? Zdůvodněte jak pomocí kritického oboru, tak pomocí p-hodnoty. 10 Příklad 38 Nový typ prášku na spaní je testován proti staršímu standardnímu prášku. Dva tisíce nespavců jsou náhodně rozděleni do dvou stejně velkých skupin. První skupina dostane starý prášek a druhá skupina dostane nový prášek. Cas potřebný k usnutí po podání prášku je zaznamenán pro každou osobu. Výsledky experimentu jsou uvedeny v následující tabulce, kde x a s představují průměr a směrodatnou odchylku pro doby potřebné k usnutí pro lidi v každé skupině po užití prášku. Skupina 1 Skupina 2 (Starý prášek) (Nový prášek) n 1000 1000 X, 15.4 minut 15.0 minut s 3.5 minut 3.0 minuty Zvažte test hypotézy Hq : fii — /j.2 = 0 versus Ha : fii — /j.2 > 0, kde /ii a /j.2 jsou střední hodnoty doby potřebné pro všechny potenciální uživatele k usnutí pomocí starého a nového prášku. a Najděte p-hodnotu tohoto test. b Udává Vaše odpověď na část a), že výsledek je statisticky významný? Použijte a = 0.025. c Sestrojte 95% interval spolehlivosti pro /ii — /i2- d Implikuje Vaše odpověď na část c), že tento výsledek má velký praktický význam? Příklad 39 Výrobci dvou konkurenčních modelů automobilů, Gofer a Diplomat, tvrdí, že mají nejnižší průměrnou spotřebu paliva. Nechť /ii je střední hodnota spotřeby paliva v mílích na galon (mpg) pro Gofer a /j.2 je střední hodnota spotřeby paliva v mpg pro Diplomat. Dva výrobci se dohodli na testu, při kterém bude několik aut každého modelu řízeno na 100 mílový testovací běh. Spotřeba paliva v mpg bude spočtena pro každý testovací běh. Průměrné mpg pro všechny 100 mílové testy pro každý model dávají odpovídající průměr. Předpokládejme, že pro každý model jsou spotřeby paliva pro testovací běhy normálně rozděleny s a = 2 mpg. Pamatujte, že každé auto podstoupí pouze jednu 100 mílovou testovací jízdu. a Kolik aut (tj. velikost vzorku) pro každý model je potřeba k odhadu fii — /j-2 s 90% hladinou spolehlivosti a s chybou odhadu 1.5 mpg? Použijte stejný počet aut (tj. velikost vzorku) pro každý model. b Pokud je /ii ve skutečnosti 33 mpg a /j.2 ve skutečnosti 30 mpg, jaká je pravděpodobnost, že pět aut pro každý model by vyvolalo x\ > ÔJ2? Příklad 40 Maria a Ellen se obě specializují na hod oštěpem. Maria hodí oštěp průměrně na vzdálenost 200 stop se směrodatnou odchylkou 10 stop, zatímco Ellen hodí oštěp průměrně na vzdálenost 210 stop se směrodatnou odchylkou 12 stop. Předpokládejme, že vzdálenosti, na které tyto atletky hodí oštěp, jsou normálně rozděleny s těmito parametry. Pokud Maria a Ellen hodí oštěpem jen jednou, jaká je pravděpodobnost, že Marie dohodí dál než Ellen? Příklad 41 Zvyšuje používání mobilních telefonů riziko mozkových nádorů? Předpokládejme, že výrobce mobilních telefonů vás najme, abyste odpověděli na tuto otázku kvůli obavám z veřejných žalob. Jak byste provedli experiment k zodpovězení této otázky? Buďte konkrétní. Vysvětlete, jak byste provedli pozorování, kolik pozorování byste provedli, a jak byste analyzovali data poté, co je shromáždíte. Jaké jsou vaše nulové a alternativní hypotézy? Chtěli byste použít vyšší nebo nižší úroveň významnosti pro test? Vysvětlete. 11 Příklad 42 Dvě konkurenční letecké společnosti, Alpha a Beta, létají na trase mezi Des Moines v Iowě a Wichitou v Kansasu. Každá letecká společnost tvrdí, že má nižší procento zpožděných letů. Nechť p\ je podíl zpožděných letů Alpha a P2 je podíl zpožděných letů Beta. a Byli jste požádáni, abyste sledovali náhodný výběr příletů pro každou leteckou společnost a odhadli p\ — P2 s 90% hladinou spolehlivosti a s chybou odhadu 0.05. Kolik příletů pro každou leteckou společnost byste měli sledovat? (Předpokládejte, že budete sledovat stejný počet příletů, n, pro každou leteckou společnost. Pro jistotu, že budete mít dostatečně velký vzorek, použijte p\= P2 = 0.50 ve vašich výpočtech pro n.) b Pokud je p\ ve skutečnosti 0.30 a p2 je ve skutečnosti 0.23, jaká je pravděpodobnost, že náhodný výběr 100 letů pro každou leteckou společnost (celkem 200) vyvolá p\ > P2? Příklad 43 Týdenní úbytky váhy všech dietám na Dietě I mají normální rozdělení se střední hodnotou 1.3 liber a směrodatnou odchylkou 0.4 libry. Týdenní úbytky váhy všech dietám na Dietě II mají normální rozdělení se střední hodnotou 1.5 liber a směrodatnou odchylkou 0.7 libry. Je sledován náhodný výběr 25 dietářů na Dietě I a další výběr 36 dietářů na Dietě II. a Jaká je pravděpodobnost, že rozdíl mezi průměry obou vzorků, x\ — X2, bude mezi —0.15 a 0.15, tj. —0.15 < x\ — x,2 < 0.15? b Jaká je pravděpodobnost, že průměrný úbytek váhy x,\ dietářů na Dietě I bude větší než průměrný úbytek váhy X2 dietářů na Dietě II? c Pokud je průměrný úbytek váhy 25 dietářů na Dietě I vypočten na 2.0 libry, jaká je pravděpodobnost, že rozdíl mezi dvěma průměry vzorků, x,\ — X2, bude mezi —0.15 a 0.15, tj. —0.15 < x\ — x,2 < 0.15? d Řekněme, že předpoklad —0.15 < fii — /J.2 < 0.15 je rozumný. Co to znamená pro osobu, která si vybere jednu z těchto diet? Příklad 44 Náhodně bylo vybráno šest aut k testování příměsi benzínu. S auty se jezdilo po dobu 1 týdne bez benzínové příměsi a poté po dobu 1 týdne s příměsí. Tabulka ukazuje spotřebu v mílích na galon bez a s příměsí. Bez 24.6 28.3 18.9 23.7 15.4 29.5 S 26.3 31.7 18.2 25.3 18.3 30.9 Předpokládejme, že místo studie se 6 auty, byl vybrán náhodný výběr 12 aut a ta byla náhodně rozdělena do dvou skupin po 6 autech. Auta v první skupině byla řízena bez příměsi do benzínu a auta v druhé skupině byla řízena s příměsí do benzínu. Předpokládejme, že horní řádek tabulky reprezentuje data bez příměsi a spodní řádek reprezentuje data s příměsí. Předpokládejme, že spotřeba benzínu pro obě skupiny jsou (zhruba) normálně rozděleny se stejnými, ale neznámými, směrodatnými odchylkami. a. Byl by párový test vhodný v tomto případě? Vysvětlete. b. Pokud je párový test nevhodný, použijte vhodný test na hypotézu, že spotřeba bez příměsi je menší. Použijte a = 0.05. c. Porovnejte výsledky s příkladem ??. 12