Parametrické úlohy o jednom náhodném výběru z normálního rozložení a z alternativního rozložení Motivace k náhodným výběrům z normálního rozložení: Mnoho náhodných veličin, s nimiž se setkáváme ve výzkumu i praxi, se řídí normálním rozložením. Za jistých předpokladů obsažených v centrální limitní větě se dá rozložení jiných náhodných veličin aproximovat normálním rozložením. Proto je zapotřebí věnovat velkou pozornost právě náhodným výběrům z normálního rozložení. Věta: Rozložení statistik odvozených z výběrového průměru a výběrového rozptylu Nechť X[1], ..., X[n ]je náhodný výběr z rozložení N(μ, σ^2). Pak platí a) Výběrový průměr M a výběrový rozptyl S^2 jsou stochasticky nezávislé. b) M ~ N(μ, ), tedy U = ~ N(0, 1). (Pivotová statistika U slouží k řešení úloh o μ, když σ^2 známe.) c) K = ~ χ^2(n-1). (Pivotová statistika K slouží k řešení úloh o σ^2, když μ neznáme.) d) ~ χ^2(n). (Tato pivotová statistika slouží k řešení úloh o σ^2, když μ známe.) e) T = ~ t(n-1). (Pivotová statistika T slouží k řešení úloh o μ, když σ^2 neznáme.) Důkaz: ad a) Nebudeme provádět, viz Jiří Anděl: Matematická statistika, SNTL/Alfa, Praha 1978, str. 82 ad b) Výběrový průměr M je lineární kombinace náhodných veličin s normálním rozložením, má tedy normální rozložení s parametry E(M) = μ, D(M) = σ^2/n. Statistika U se získá standardizací M. ad c) Vhodnou úpravou výběrového rozptylu S^2, kde použijeme obrat X[i] - M = (X[i] - μ) – (M - μ), lze statistiku K vyjádřit jako součet kvadrátů n - 1 stochasticky nezávislých náhodných veličin se standardizovaným normálním rozložením. Tento součet se řídí rozložením χ^2(n-1). ad d) Tato statistika je součet kvadrátů n stochasticky nezávislých náhodných veličin se standardizovaným normálním rozložením, řídí se tedy rozložením χ^2(n). ad e) U ~ N(0, 1), K ~ χ^2(n-1) jsou stochasticky nezávislé, protože M a S^2 jsou stochasticky nezávislé, tudíž statistika ~ t(n-1). Příklad: Hmotnost balíčku krystalového cukru baleného na automatické lince se řídí normálním rozložením se střední hodnotou 1002 g a směrodatnou odchylkou 8 g. Kontrolor náhodně vybírá 9 balíčků z jedné série a zjišťuje, zda jejich průměrná hmotnost je alespoň 999 g. Pokud ne, podnik musí zaplatit pokutu 20 000 Kč. Jaká je pravděpodobnost, že podnik bude muset zaplatit pokutu? Řešení: X ~ N(1002, 64), M ~ Pravděpodobnost, že podnik bude platit pokutu, je asi 12,9%. Výpočet pomocí systému STATISTICA: Využijeme toho, že STATISTICA pomocí funkce INormal(x;mu;sigma) umí vypočítat hodnotu distribuční funkce normálního rozložení se střední hodnotou mu a směrodatnou odchylkou sigma. Tedy , kde Ф je distribuční funkce rozložení N(1002, 64/9). Otevřeme nový datový soubor o jedné proměnné a jednom případu. Dvakrát klikneme na název proměnné Prom1. Do Dlouhého jména této proměnné napíšeme = INormal(999;1002;8/3). V proměnné Prom1 se objeví hodnota 0,130295: Věta: Vzorce pro meze 100(1-α)% empirických intervalů spolehlivosti pro střední hodnotu μ a pro rozptyl σ^2 a) Interval spolehlivosti pro μ, když σ^2 známe (využití pivotové statistiky U) Oboustranný: (d, h) = (m - u[1-α/2], m + u[1-α/2]) Levostranný: (d, ∞) = (m - u[1-α], ∞) Pravostranný: (-∞, h) = (-∞, m + u[1-α]) b) Interval spolehlivosti pro μ, když σ^2 neznáme (využití pivotové statistiky T) Oboustranný: (d, h) = (m - t[1-α/2](n-1), m + t[1-α/2](n-1)) Levostranný: (d, ∞) = (m - t[1-α](n-1), ∞) Pravostranný: (-∞, h) = (-∞, m + t[1-α](n-1)) c) Interval spolehlivosti pro σ^2, když μ neznáme (využití pivotové statistiky K) Oboustranný: (d, h) = Levostranný: (d, ∞) = Pravostranný: (-∞, h) = d) Interval spolehlivosti pro σ^2, když μ známe (využití pivotové statistiky ) Oboustranný: (d, h) = Levostranný: (d, ∞) = Pravostranný: (-∞, h) = Příklad: 10 krát nezávisle na sobě byla změřena jistá konstanta μ. Výsledky měření byly: 2 1,8 2,1 2,4 1,9 2,1 2 1,8 2,3 2,2. Tyto výsledky považujeme za číselné realizace náhodného výběru X[1], ..., X[10] z rozložení N(μ, σ^2), kde parametry μ, σ^2 neznáme. Najděte 95% empirický interval spolehlivosti jak pro μ, tak pro σ^2 a to a) oboustranný, b) levostranný, c) pravostranný. Řešení: m = 2,06, s^2 = 0,0404, s = 0,2011, α = 0,05, t[0,975](9) = 2,2622, t[0,95](9) = 1,8331, χ^2[0,975](9) = 19,023, χ^2[0,025](9) = 2,7, χ^2[0,95](9) = 16,919, χ^2[0,05](9) = 3,325 ad a) Oboustranný interval spolehlivosti pro střední hodnotu μ d = m - t[1-α/2](n-1) = 2,06 - 2,2622 = 1,92 h = m + t[1-α/2](n-1) = 2,06 + 2,2622 = 2,20 1,92 < μ < 2,20 s pravděpodobností aspoň 0,95. Oboustranný interval spolehlivosti pro rozptyl σ^2 0,0191 < σ^2 < 0,1347 s pravděpodobností aspoň 0,95. ad b) Levostranný interval spolehlivosti pro střední hodnotu μ d = m - t[1-α](n-1) = 2,06 - 1,8331 = 1,94 1,94 < μ s pravděpodobností aspoň 0,95. Levostranný interval spolehlivosti pro rozptyl σ^2 σ^2 > 0,0215 s pravděpodobností aspoň 0,95. ad c) Pravostranný interval spolehlivosti pro střední hodnotu μ h = m + t[1-α](n-1) = 2,06 + 1,8331 = 2,18 μ < 2,18 s pravděpodobností aspoň 0,95. Pravostranný interval spolehlivosti pro rozptyl σ^2 σ^2 < 0,1094 s pravděpodobností aspoň 0,95. Řešení pomocí systému STATISTICA: Vytvoříme nový datový soubor o jedné proměnné X a 10 případech. Do proměnné X napíšeme dané hodnoty. Statistika – Základní statistiky a tabulky – Popisné statistiky – OK – Proměnné X – OK – Detailní výsledky – zaškrtneme Meze spolehl. prům. a Meze sp. směr. odch. (ostatní volby zrušíme) – pro oboustranný 95% interval spolehlivosti ponecháme implicitní hodnotu pro Interval 95,00, pro jednostranné intervaly změníme hodnotu na 90,00. Výsledky pro oboustranné 95% intervaly spolehlivosti pro střední hodnotu μ, pro směrodatnou odchylku σ a rozptyl σ^2: Vidíme, že 1,92 < μ < 2,20 s pravděpodobností aspoň 0,95, 0,1383 < σ < 0,3671 s pravděpodobností aspoň 0,95. 0,0191 < σ^2 < 0,1348 s pravděpodobností aspoň 0,95. Výsledky pro jednostranné 95% intervaly spolehlivosti pro střední hodnotu μ, pro směrodatnou odchylku σ a rozptyl σ^2: Vidíme, že μ > 1,94 s pravděpodobností aspoň 0,95, μ < 2,18 s pravděpodobností aspoň 0,95, σ > 0,1467 s pravděpodobností aspoň 0,95, σ < 0,3309 s pravděpodobností aspoň 0,95, σ^2 > 0,0215 s pravděpodobností aspoň 0,95, σ^2 < 0,1095 s pravděpodobností aspoň 0,95, Definice: Jednotlivé typy testů pro parametry normálního rozložení a) Nechť X[1], ..., X[n] je náhodný výběr N(μ, σ^2), kde σ^2 známe. Nechť n ≥ 2 a c je konstanta. Test H[0]: μ = c proti H[1]: μ c se nazývá jednovýběrový z-test. b) Nechť X[1], ..., X[n] je náhodný výběr N(μ, σ^2), kde σ^2 neznáme. Nechť n ≥ 2 a c je konstanta. Test H[0]: μ = c proti H[1]: μ c se nazývá jednovýběrový t-test. c) Nechť X[1], ..., X[n] je náhodný výběr N(μ, σ^2), kde μ neznáme. Nechť n ≥ 2 a c je konstanta. Test H[0]: σ^2 = c proti H[1]: σ^2 c se nazývá test o rozptylu. Provedení testů o parametrech μ, σ^2 pomocí kritického oboru a) Provedení jednovýběrového z-testu Vypočteme realizaci testového kritéria . Stanovíme kritický obor W. Pokud t[0] W, H[0] zamítáme na hladině významnosti α a přijímáme H[1]. Oboustranný test: Testujeme H[0]: μ = c proti H[1]: μ c. Kritický obor má tvar: . Levostranný test: Testujeme H[0]: μ = c proti H[1]: μ < c. Kritický obor má tvar: . Pravostranný test: Testujeme H[0]: μ = c proti H[1]: μ > c. Kritický obor má tvar: . b) Provedení jednovýběrového t-testu Vypočteme realizaci testového kritéria . Stanovíme kritický obor W. Pokud t[0] W, H[0] zamítáme na hladině významnosti α a přijímáme H[1]. Oboustranný test: Testujeme H[0]: μ = c proti H[1]: μ c. Kritický obor má tvar: . Levostranný test: Testujeme H[0]: μ = c proti H[1]: μ < c. Kritický obor má tvar: . Pravostranný test: Testujeme H[0]: μ = c proti H[1]: μ > c. Kritický obor má tvar: . c) Provedení testu o rozptylu Vypočteme realizaci testového kritéria . Stanovíme kritický obor W. Pokud t[0] W, H[0] zamítáme na hladině významnosti α a přijímáme H[1]. Oboustranný test: Testujeme H[0]: σ^2 = c proti H[1]: σ^2 c. Kritický obor má tvar:. Levostranný test: Testujeme H[0]: σ^2 = c proti H[1]: σ^2 < c. Kritický obor má tvar: . Pravostranný test: Testujeme H[0]: σ^2 = c proti H[1]: σ^2 > c. Kritický obor má tvar: . Příklad: Podle údajů na obalu čokolády by její čistá hmotnost měla být 125 g. Výrobce dostal několik stížností od kupujících, ve kterých tvrdili, že hmotnost čokolád je nižší než deklarovaných 125 g. Z tohoto důvodu oddělení kontroly náhodně vybralo 50 čokolád a zjistilo, že jejich průměrná hmotnost je 122 g a směrodatná odchylka 8,6 g. Za předpokladu, že hmotnost čokolád se řídí normálním rozložením, můžeme na hladině významnosti 0,01 považovat stížnosti kupujících za oprávněné? Řešení: X[1], ..., X[50] je náhodný výběr z N(μ, σ^2). Testujeme hypotézu H[0]: μ = 125 proti levostranné alternativě H[1]: μ < 125. Protože neznáme rozptyl σ^2, použijeme jednovýběrový t-test. Testové kritérium . Kritický obor . Jelikož testové kritérium se realizuje v kritickém oboru, zamítáme nulovou hypotézu na hladině významnosti 0,01. Stížnosti kupujících tedy lze považovat za oprávněné. Výpočet pomocí systému STATISTICA: Statistiky – Základní statistiky a tabulky – Testy rozdílů: r, %, průměry – OK – vybereme Rozdíl mezi dvěma průměry (normální rozdělení) – zaškrtneme Výběrový průměr vs. Střední hodnota a zvolíme jednostr. – do políčka Pr1 napíšeme 122, do políčka SmOd1 napíšeme 8,6, do políčka N1 napíšeme 50, do políčka Pr2 napíšeme 125 - Výpočet. Dostaneme p-hodnotu 0,0086, tedy zamítáme nulovou hypotézu na hladině významnosti 0,01 Definice: Definice rozdílového náhodného výběru na základě náhodného výběru z dvourozměrného normálního rozložení. Nechť je náhodný výběr z rozložení N[2] , přičemž n ≥ 2. Označíme μ = μ[1] - μ[2] a zavedeme rozdílový náhodný výběr Z[1] = X[1 ]- Y[1], ... , Z[n] = X[n] - Y[n]. Vypočteme , . Věta: Vzorec pro meze 100(1-α)% empirického intervalu spolehlivosti pro střední hodnotu rozdílového náhodného výběru Oboustranný: (d, h) = (m - t[1-α/2](n-1), m + t[1-α/2](n-1)) Levostranný: (d, ∞) = (m - t[1-α](n-1), ∞) Pravostranný: (-∞, h) = (-∞, m + t[1-α](n-1)) Příklad: Dvěma rozdílnými laboratorními metodami se zjišťoval obsah chemické látky v roztoku (v procentech). Bylo vybráno 5 vzorků a proměřeno oběma metodami. Výsledky měření jsou obsaženy v tabulce: číslo vzorku 1 2 3 4 5 1. metoda 2,3 1,9 2,1 2,4 2,6 2. metoda 2,4 2,0 2,0 2,3 2,5 Za předpokladu, že data mají normální rozložení, sestrojte 90% empirický interval spolehlivosti pro rozdíl středních hodnot výsledků obou metod. Řešení: Přejdeme k rozdílovému náhodnému výběru, jehož realizace jsou: -0,1 -0,1 0,1 0,1 0,1. Vypočteme m = 0,02, s^2 = 0,012, s = 0,109545. Předpokládáme, že tato data pocházejí z normálního rozložení N(μ, σ^2). Vypočteme meze 90% oboustranného intervalu spolehlivosti pro μ při neznámém σ: -0,0844 < μ < 0,1244 s pravděpodobností aspoň 0,9. Výpočet pomocí systému STATISTICA: Vytvoříme nový datový soubor o 3 proměnných a 5 případech. Do 1. proměnné X napíšeme hodnoty pro 1. metodu, do 2. proměnné Y hodnoty pro 2. metodu a do 3. proměnné Z rozdíly mezi X a Y. Statistiky – Základní statistiky a tabulky – Popisné statistiky, OK - Proměnné Z, Detailní výsledky – zaškrtneme Meze spolehl. Prům. – Interval 90% - Výpočet. Dostaneme tabulku: Vidíme tedy, že -0,0844 < μ < 0,1244 s pravděpodobností aspoň 0,9. Definice: Definice párového t-testu Nechť je náhodný výběr z rozložení N[2] , přičemž n ≥ 2. Testujeme H[0]: μ[1] - μ[2] = c (tj. μ = c) proti H[1]: μ[1 ]- μ[2] ≠ c (tj. μ ≠ c) nebo testujeme nulovou hypotézu proti jedné z jednostranných alternativ. Tento test se nazývá párový t-test. Provedení párového t-testu Vypočteme realizaci testového kritéria . Stanovíme kritický obor W. Pokud t[0] W, H[0] zamítáme na hladině významnosti α a přijímáme H[1]. Oboustranný test: Testujeme H[0]: μ = c proti H[1]: μ c. Kritický obor má tvar: . Levostranný test: Testujeme H[0]: μ = c proti H[1]: μ < c. Kritický obor má tvar: . Pravostranný test: Testujeme H[0]: μ = c proti H[1]: μ > c. Kritický obor má tvar: . Příklad: V následující tabulce jsou údaje o výnosnosti dosažené 12 náhodně vybranými firmami při investování do mezinárodního podnikání (veličina X) a do domácího podnikání (veličina Y): č.firmy 1 2 3 4 5 6 7 8 9 10 11 12 X 10 12 14 12 12 17 9 15 9 11 7 15 Y 11 14 15 11 13 16 10 13 11 17 9 19 (Výnosnost je vyjádřena v procentech a představuje podíl na zisku vložených investic za rok.) Za předpokladu, že data pocházejí z dvourozměrného normálního rozložení, na hladině významnosti 0,1 testujte hypotézu, že neexistuje rozdíl mezi střední hodnotou výnosnosti investic do mezinárodního a domácího podnikání proti oboustranné alternativě. Testování proveďte a) pomocí intervalu spolehlivosti b) pomocí kritického oboru. (Pro úsporu času máte uvedeny realizace výběrového průměru m = a výběrového rozptylu s^2 = rozdílového náhodného výběru Z[i] = X[i] – Y[i], i = 1, …, 12. Řešení: Testujeme H[0]: μ = 0 proti H[1]: μ ≠ 0 ad a) 90% interval spolehlivosti pro střední hodnotu μ při neznámém rozptylu σ^2 má meze: Protože číslo c = 0 neleží v intervalu (-2,4677; -0,1989), H[0] zamítáme na hladině významnosti 0,1. ad b) Vypočítáme realizaci testové statistiky Stanovíme kritický obor Protože testová statistika se realizuje v kritickém oboru, H[0] zamítáme na hladině významnosti 0,1. Výpočet pomocí systému STATISTICA: Vytvoříme nový datový soubor o 2 proměnných a 12 případech. Do 1. proměnné X napíšeme hodnoty pro mezinárodní podnikání, do 2. proměnné hodnoty pro domácí podnikání. Statistiky – Základní statistiky a tabulky – t-test pro závislé vzorky, OK - Proměnné X, Y – OK – Výpočet. Dostaneme tabulku: Vypočtenou p-hodnotu 0,05849 porovnáme se zvolenou hladinou významnosti α = 0,1. Protože p ≤ α, zamítáme nulovou hypotézu na hladině významnosti 0,1. Motivace k náhodným výběrům z alternativního rozložení: S náhodným výběrem rozsahu n z alternativního rozložení se setkáváme v situaci, kdy provádíme n opakovaných nezávislých pokusů a v každém z těchto pokusů sledujeme nastoupení úspěchu. Pravděpodobnost úspěchu je pro všechny pokusy stejná. Náhodná veličina X[i] nabude hodnoty 1, pokud v i-tém pokusu nastal úspěch a hodnoty 0, pokud v i-tém pokusu úspěch nenastal, i = 1, 2, …, n. Realizací náhodného výběru X[1], …, X[n] je tedy posloupnost 0 a 1. Opakování: Alternativní rozložení: Náhodná veličina X udává počet úspěchů v jednom pokusu, přičemž pravděpodobnost úspěchu je . Píšeme X ~ A( ). π(x) = neboli π(x) = Binomické rozložení: Náhodná veličina X udává počet úspěchů v posloupnosti n nezávislých opakovaných pokusů, přičemž pravděpodobnost úspěchu je v každém pokusu . Píšeme X ~ Bi(n, ). π(x) = E(X) = n , D(X) = n (1- ) (Alternativní rozložení je speciálním případem binomického rozložení pro n = 1. Jsou-li X[1], ..., X[n] stochasticky nezávislé náhodné veličiny, X[i] ~ A( ), i = 1, ..., n, pak X = ~ Bi(n, ).) Centrální limitní věta: Jsou-li náhodné veličiny X[1], …, X[n] stochasticky nezávislé a všechny mají stejné rozložení se střední hodnotou μ a rozptylem σ^2, pak pro velká n (n ≥ 30) lze rozložení součtu aproximovat normálním rozložením N(nμ, nσ^2). Zkráceně píšeme . Pokud součet standardizujeme, tj. vytvoříme náhodnou veličinu , pak rozložení této náhodné veličiny lze aproximovat standardizovaným normálním rozložením. Zkráceně píšeme U[n] ≈ N(0,1) Věta: Asymptotické rozložení statistiky odvozené z výběrového průměru. Nechť X[1], ..., X[n ]je náhodný výběr z rozložení A( ) a nechť je splněna podmínka . Pak statistika konverguje v distribuci k náhodné veličině se standardizovaným normálním rozložením. (Říkáme, že U má asymptoticky rozložení N(0,1) a píšemu U ≈ N(0,1).) Důkaz: Protože X[1], ..., X[n ]je náhodný výběr z rozložení A( ), bude mít statistika Y[n] = (výběrový úhrn) rozložení Bi(n, ). Y[n] má střední hodnotu E(Y[n]) = n a rozptyl D(Y[n]) = . Podle centrální limitní věty se standardizovaná statistika asymptoticky řídí standardizovaným normálním rozložením N(0,1). Pokud čitatele i jmenovatele podělíme n, dostaneme vyjádření: Věta: Vzorec pro meze 100(1-α)% asymptotického empirického intervalu spolehlivosti pro parametr . Meze 100(1-α)% asymptotického empirického intervalu spolehlivosti pro parametr jsou: . Důkaz: Pokud rozptyl nahradíme odhadem , konvergence náhodné veličiny U k veličině s rozložením N(0,1) se neporuší. Tedy Příklad: Náhodně bylo vybráno 100 osob a zjištěno, že 34 z nich používá zubní kartáček zahraniční výroby. Najděte 95% asymptotický interval spolehlivosti pro pravděpodobnost, že náhodně vybraná osoba používá zubní kartáček zahraniční výroby. Řešení: Zavedeme náhodné veličiny X[1], ..., X[100], přičemž X[i] = 1, když i-tá osoba používá zahraniční zubní kartáček a X[i] = 0 jinak, i = 1, ..., 100. Tyto náhodné veličiny tvoří náhodný výběr z rozložení A( ). n = 100, m = 34/100, α = 0,05, u[1-α/2] = u[0,975] = 1,96. Ověření podmínky n (1- ) > 9: parametr neznáme, musíme ho nahradit výběrovým průměrem. Pak 100.0,34.0,66 = 22,44 > 9. . S pravděpodobností přibližně 0,95 tedy 0,2472 < < 0,4328. Znamená to, že s pravděpodobností přibližně 95% je v uvažované populaci nejméně 24,7% a nejvíce 43,3% osob, které používají zahraniční zubní kartáček. Výpočet pomocí systému STATISTICA: a) Přesný způsob Otevřeme nový datový soubor se dvěma proměnnými a jednom případu. První proměnnou nazveme d a do jejího Dlouhého jména napíšeme =0,34-sqrt(0,34*0,66/100)*VNormal(0,975;0;1) Druhou proměnnou nazveme h a do jejího Dlouhého jména napíšeme =0,34+sqrt(0,34*0,66/100)*VNormal(0,975;0;1) Dostaneme výsledek: Vidíme, že s pravděpodobností aspoň 0,95 se pravděpodobnost používání zubního kartáčku zahraniční výroby bude pohybovat v mezích 0,2471 až 0,4328. b) Přibližný způsob, použitelný pro dostatečně velký rozsah výběru Do nového datového souboru o jedné proměnné X a 100 případech uložíme 34 jedniček (indikují používání zubního kartáčku zahraniční výroby) a 66 nul (indikují používání zubního kartáčku domácí výroby). Statistika – Základní statistiky a tabulky – Popisné statistiky – OK – Proměnné X – OK – Detailní výsledky – zaškrtneme Meze spolehl. prům. – ponecháme implicitní hodnotu pro Interval 95,00 – Výpočet. Dostaneme tabulku: Dospěli jsme k výsledku, že s pravděpodobností aspoň 0,95 se pravděpodobnost používání zubního kartáčku zahraniční výroby bude pohybovat v mezích 0,2455 až 0,4345. Příklad: Kolik osob musíme vybrat, abychom podíl modrookých osob v populaci odhadli se spolehlivostí 90% a šířka intervalu spolehlivosti byla nanejvýš a) 0,06, b) 0,01? Řešení: Šířka 100(1-α)% asymptotického empirického intervalu spolehlivosti pro parametr : Požadujeme, aby h – d ≤ Δ, tedy . Odtud vyjádříme . Předpokládejme, že nemáme žádné předběžné informace o podílu modrookých osob v populaci. Musíme tedy vybrat takové m, aby šířka intervalu spolehlivosti byla maximální. Maximalizujeme výraz . Derivujeme podle m a položíme rovno 0: .V tomto případě volíme relativní četnost m = 0,5. ad a) Uvedenou podmínku tedy splníme, když vybereme aspoň 752 osob. ad b) Chceme-li dosáhnout podstatně užšího intervalu spolehlivosti, musíme vybrat aspoň 27 061 osob. ad a) Předpokládejme, že v populaci je nanejvýš 30% modrookých osob. Pak relativní četnost m = 0,3. V tomto případě stačí vybrat 632 osob. Ve srovnání s předešlým případem vidíme, že rozsah výběru skutečně klesl. ad b) V tomto případě musíme vybrat aspoň 22 731 osob. Věta: Testování hypotézy o parametru . Nechť X[1], ..., X[n ]je náhodný výběr z rozložení A( ) a nechť je splněna podmínka . Na asymptotické hladině významnosti α testujeme hypotézu H[0]: = c proti alternativě H[1]: ≠ c (resp. H[1]: < c resp. H[1]: > c). Testovým kritériem je statistika , která v případě platnosti nulové hypotézy má asymptoticky rozložení N(0,1). Kritický obor má tvar (resp. resp. ). (Testování hypotézy o parametru lze samozřejmě provést i pomocí 100(1-α)% asymptotického intervalu spolehlivosti nebo pomocí p-hodnoty.) Příklad: Podíl zmetků při výrobě určité součástky činí = 0,01. Bylo náhodně vybráno 1000 výrobků a zjistilo se, že mezi nimi je 16 zmetků. Na asymptotické hladině významnosti 0,05 testujte hypotézu H[0]: = 0,01 proti oboustranné alternativě H[1]: ≠ 0,01. Řešení: Zavedeme náhodné veličiny X[1], ..., X[1000], přičemž X[i] = 1, když i-tý výrobek byl zmetek a X[i] = 0 jinak, i = 1, ..., 1000. Tyto náhodné veličiny tvoří náhodný výběr z rozložení A( ). Testujeme hypotézu H[0]: = 0,01 proti alternativě H[1]: ≠ 0,01. Známe: n = 1000, , c = 0,01, α = 0,05, u[1-α/2] = u[0,975] = 1,96 Ověření podmínky : 1000.0,01.0,99 = 9,9 > 9. a) Testování pomocí kritického oboru: Realizace testového kritéria: . Kritický obor: . Protože 1,907 W, H[0] nezamítáme na asymptotické hladině významnosti 0,05. b) Testování pomocí intervalu spolehlivosti Protože číslo c = 0,01 leží v intervalu 0,0082 až 0,0238, H[0] nezamítáme na asymptotické hladině významnosti 0,05. c) Testování pomocí p-hodnoty Protože testujeme nulovou hypotézu proti oboustranné alternativě, vypočteme p-hodnotu podle vzorce: p = 2 min{ Φ(1,907), 1–Φ(1,907) } = 2 min { 0,97104, 1 – 0,97104 } = 0,05792. Protože vypočtená p-hodnota je větší než hladina významnosti 0,05, H[0] nezamítáme na asymptotické hladině významnosti 0,05. Výpočet pomocí systému STATISTICA (pouze přibližný): Statistiky – Základní statistiky a tabulky – Testy rozdílů: r, %, průměry – OK – vybereme Rozdíl mezi dvěma poměry – do políčka P 1 napíšeme 0,016, do políčka N1 napíšeme 1000, do políčka P 2 napíšeme 0,01, do políčka N2 napíšeme 32767 (větší hodnotu systém neumožní) - Výpočet. Dostaneme p-hodnotu 0,0626, tedy nezamítáme nulovou hypotézu na hladině významnosti 0,05. Příklad: Nový léčebný postup považujeme za úspěšný, pokud po jeho ukončení bude dosaženo zlepšení zdravotního stavu u alespoň 50% zúčastněných pacientů. Nová terapie byla vyzkoušena u 40 pacientů a ke zlepšení došlo u 24 osob. Je možné na asymptotické hladině významnosti zamítnout hypotézu, že tato terapie nedosahuje úspěšnosti aspoň 50%? Řešení: Zavedeme náhodné veličiny X[1], ..., X[40], přičemž X[i] = 1, když terapie u i-tého pacienta byl úspěšná a X[i] = 0 jinak, i = 1, ..., 40. Tyto náhodné veličiny tvoří náhodný výběr z rozložení A( ). Testujeme hypotézu H[0]: ≤ 0,5 proti pravostranné alternativě H[1]: > 0,5. Známe: n = 40, , c = 0,5, α = 0,05, u[1-α/2] = u[0,95] = 1,645 Ověření podmínky : 40.0,6.0,4 = 9,6 > 9. Realizace testového kritéria: . Kritický obor: . Protože 1,2649 W, H[0] nezamítáme na asymptotické hladině významnosti 0,05. Výpočet pomocí systému STATISTICA: Vypočtená p-hodnota jednostranného testu je 0,1031, tedy větší než asymptotická hladina významnosti 0,05. H[0] nezamítáme na asymptotické hladině významnosti 0,05.