Téma 11: Parametrické úlohy o jednom a dvou nezvislých náhodných výběrech z alternativních rozložení Úkol 1.: Asymptotický interval spolehlivosti pro parametr alternativního rozložení Může politická strana, pro niž se v předvolebním průzkumu vyslovilo 60 z 1000 dotázaných osob (tj. 6%), očekávat se spolehlivostí 0,95, že by v této době ve volbách překročila 5% hranici pro vstup do parlamentu? Návod: Zavedeme náhodné veličiny X1, ..., X1000, přičemž Xi = 1, když i-tá osoba se vysloví pro danou politickou stranu a Xi = 0 jinak, i = 1, ..., 1000. Tyto náhodné veličiny tvoří náhodný výběr z rozložení A( ). V tomto případě n = 1000, m = 60/1000 = 0,06, = 0,05, u1- = u0,95 = 1,645. Ověření podmínky n (1- ) > 9: parametr neznáme, musíme ho nahradit výběrovým průměrem. Pak 1000.0,06.0,94 = 56,4 > 9. 95% levostranný interval spolehlivosti pro je ( ) ( ) - -= - - ;u 1000 6,016,0 06,0;u n m1m m 95,01 . V našem případě 0476,0645,1 1000 94,006,0 06,0d = -= S pravděpodobností přibližně 0,95 tedy > 0,048. Protože tento interval zahrnuje i hodnoty nižší než 0,05, nelze vyloučit, že strana získá méně než 5% hlasů. Postup ve STATISTICE: Přesný způsob: Vytvoříme datový soubor o jedné proměnné (nazveme ji d) a o jednom případu. Do Dlouhého jména proměnné d napíšeme =0,06-sqrt(0,6*0,94/1000)*VNormal(0,95;0;1) Vyjde 0,047647. Přibližný způsob: Do nového datového souboru o jedné proměnné X a 1000 případech uložíme 60 jedniček (indikují volbu dané politické strany) a 940 nul (indikují volbu jiné politické strany). Statistika - Základní statistiky a tabulky - Popisné statistiky - OK - Proměnné X - OK - Detailní výsledky - zaškrtneme Meze spolehl. prům. - Interval 90,00 - Výpočet. Dostaneme tabulku: Popisné statistiky (Tabulka1) Proměnná N platných Průměr Int. spolehl. -90,000% Int. spolehl. 90,000 X 1000 0,060000 0,047630 0,072370 Protože dolní mez oboustranného 90% intervalu spolehlivosti pro střední hodnotu je shodná s dolní mezí 95% levostranného intervalu spolehlivosti, můžeme konstatovat, že voliči budou volit danou politickou stranu s pravděpodobností aspoň 4,76%. Na základě uvedených dat strana tedy nemá zaručeno, že překročí 5% hranici pro vstup do parlamentu. Úkol k samostatnému řešení: Přírůstky cen akcií na burze (v %) u 10 náhodně vybraných společností dosáhly těchto hodnot: 10, 16, 5, 10, 12, 8, 4, 6, 5, 4. Sestrojte 95% asymptotický empirický interval spolehlivosti pro pravděpodobnost, že přírůstek ceny akcie překročí 8,5%. Výsledek: 0,096 < < 0,704 s pravděpodobností aspoň 0,95. Znamená to, že pravděpodobnost, že přírůstek ceny akcie překročí 8,5%, je aspoň 9,6% a nanejvýš 70,4% (při spolehlivosti 95%.) Úkol 2.: Testování hypotézy o parametru alternativního rozložení Určitá cestovní kancelář organizuje zahraniční zájezdy podle individuálních přání zákazníků. Z několika minulých let ví, že 30% všech takto organizovaných zájezdů má za cíl zemi X. Po zhoršení politických podmínek v této zemi se cestovní kancelář obává, že se zájem o tuto zemi mezi zákazníky sníží. Ze 150 náhodně vybraných zákazníků v tomto roce má 38 za cíl právě zemi X (tj. 25,3%). Potvrzují nejnovější data pokles zájmu o tuto zemi? Volte hladinu významnosti 0,05. Návod: Máme náhodný výběr X1, ..., X150 z rozložení A(0,3). Testujeme H0: = 0,3 proti levostranné alternativě H1: < 0,3. V tomto případě je testovým kritériem statistika n )c1(c cM T0 - - = , která v případě platnosti nulové hypotézy má asymptoticky rozložení N(0,1). Musíme ověřit splnění podmínky n (1- ) > 9: 150.0,3.0,7 = 31,5 > 9. Vypočteme realizaci testového kritéria: 24722,1 150 )3,01(3,0 3,0 n )c1(c cm t 150 38 0 -= - - = - - = . Kritický obor: ( ---= 1u,W = ( 645,1,-- . Protože testové kritérium nepatří do kritického oboru, H0 nezamítáme na asymptotické hladině významnosti 0,05. Postup ve STATISTICE: Přesný způsob: Vytvoříme datový soubor o dvou proměnných (nazveme je t0 a kvantil) a jednom případu. Vypočteme realizaci testového kritéria tak, že do Douhého jména proměnné t0 napíšeme =(38/150-0,3)/sqrt(0,3*0,7/150) Do Dlouhého jména proměnné kvantil napíšeme =VNormal(0,95;0;1) Tím získáme kvantil u0,95 a testové kritérium porovnáme s opačnou hodnotou tohoto kvantilu. 1 t0 2 kvantil 1 -1,24721913 1,644854 Jelikož testové kritérium je větší než -1,644854, H0 nezamítáme na asymptotické hladině významnosti 0,05. Přibližný způsob: Do nového datového souboru o jedné proměnné X a 150 případech uložíme 38 jedniček (indikují zájem o danou zemi) a 112 nul (indikují nezájem o danou zemi). Statistika - Základní statistiky a tabulky - t-test, samost. vzorek - OK - Proměnné X - OK, Test všech průměrů vůči 0,3 - Výpočet. Test průměrů vůči referenční konstantě (hodnotě) (Tabulka4) Proměnná Průměr Sm.odch. N Sm.chyba Referenční konstanta t SV p X 0,253333 0,436377 150 0,035630 0,300000 -1,30976 149 0,192294 Hodnota testové statistiky je při tomto přibližném způsobu -1,30976. Odpovídající p-hodnota je 0,1923, ovšem to je p-hodnota pro oboustranný test. Tuto p-hodnotu tedy musíme dělit dvěma a dostaneme 0,0961. Na asymptotické hladině významnosti 0,05 nelze zamítnout hypotézu, že zájem o danou zemi se nezměnil. Úkol 3.: Asymptotický interval spolehlivosti pro parametrickou funkci 21 Při výstupní kontrole bylo náhodně vybráno 150 výrobků vyrobených na ranní směně a rovněž 150 výrobků vyrobených na odpolední směně. U ranní směny bylo zjištěno 16 zmetků a u odpolední 12 zmetků. Sestrojte 95% asymptotického interval spolehlivosti pro rozdíl pravděpodobností vyrobení zmetku v obou směnách. Návod: Zavedeme náhodnou veličinu X1i, která bude nabývat hodnoty 1, když i-tý výrobek z ranní směny je zmetek, 0 jinak, i = 1, ..., 150. Náhodné veličiny X1,1, ..., X1,150 tvoří náhodný výběr z rozložení ( )1A . Dále zavedeme náhodnou veličinu X2i, která bude nabývat hodnoty 1, když i-tý výrobek z odpolední směny je zmetek, 0 jinak, i = 1, ..., 150.. Náhodné veličiny X2,1, ..., X2,150 tvoří náhodný výběr z rozložení ( )2A . n1 = 150, n2 = 150, m1 = 16/150 = 0,1067, m2 = 12/150 = 0,08. Ověření podmínek n1 1 (1- 1 ) > 9 a n2 2 (1- 2 ) > 9: Parametry 1 a 2 neznáme, nahradíme je odhady m1 a m2: 16.(1-16/150) = 14,29 > 9, 12.(1-12/150) = 11,04 > 9. Meze 100(1-)% asymptotického empirického intervalu spolehlivosti pro parametrickou funkci 21 - jsou: 092,096,1 150 )1( 150 )1( 150 12 150 16 u n )m1(m n )m1(m mmh 039,096,1 150 )1( 150 )1( 150 12 150 16 u n )m1(m n )m1(m mmd 150 12 150 12 150 16 150 16 2/1 2 22 1 11 21 150 12 150 12 150 16 150 16 2/1 2 22 1 11 21 = - + - +-= = - + - +-= -= - + - --= = - + - --= - Zjistili jsme tedy, že s pravděpodobností přibližně 0,95: -0,039 < 21 - < 0,092. Postup ve STATISTICE: Otevřeme nový datový soubor se dvěma proměnnými d a h a o jednom případu. Do Dlouhého jména proměnné d napíšeme: =16/150-12/150-sqrt((16/150)*(134/150)/150+(12/150)*(138/150)/150)*VNormal(0,975;0;1) Do Dlouhého jména proměnné h napíšeme: =16/150-12/150+sqrt((16/150)*(134/150)/150+(12/150)*(138/150)/150)*VNormal(0,975;0;1) Dostaneme tabulku 1 d 2 h 1 -0,0391 0,092433 S pravděpodobností přibližně 0,95 se rozdíl pravděpodobností vyrobení zmetku na ranní a odpolední směně nachází v intervalu (-0,039; 0,092. Úkol 4.: Testování hypotézy o parametrické funkci 21 Pro údaje z úkolu 3 testujte na asymptotické hladině významnosti 0,05 hypotézu, že pravděpodobnost vyrobení zmetků v obou směnách je táž. Postup ve STATISTICE: Statistiky - Základní statistiky a tabulky - Testy rozdílů: r, %, průměry - OK - vybereme Rozdíl mezi dvěma poměry - do políčka P 1 napíšeme 0,1067, do políčka N1 napíšeme 150, do políčka P 2 napíšeme 0,08, do políčka N2 napíšeme 150 -Výpočet. Dostaneme p-hodnotu 0,4274, tedy nezamítáme nulovou hypotézu na hladině významnosti 0,05. Úkol k samostatnému řešení: V anketě, která se týkala očkování proti chřipce, odpovědělo z 200 náhodně vybraných mužů 97, že se podrobí očkování a z 300 náhodně vybraných žen chtělo podstoupit očkování 162. Na asymptotické hladině významnosti 0,05 testujte hypotézu, že pravděpobnost uskutečnění očkování proti chřipce je u mužů nižší než u žen. Výsledek: Podmínky dobré aproximace jsou splněny. Relativní četnost mužů ochotných k očkování je 0,485, relativní četnost žen ochotných k očkování je 0,54. Na asymptotické hladině významnosti 0,05 se neprokázalo, že pravděpodobnost ochoty k očkování je u mužů nižší než u žen, protože p-hodnota pro levostrannou alternativu je 0,1142