Statistické metody Základní metody:  odhad parametrů  testování hypotéz Pokročilejší metody:  shluková (klastrová) analýza  faktorová analýza  analýza hlavních komponent (PCA)  … Statistické metody: Bodový odhad parametru Intervalový odhad parametru Testování hypotéz Potřebný rozsah výběru Výběrový průměr Výběrový rozptyl a směr. odchyl. Vlastnosti odhadu Konečnostní násobitel Statistické metody Základní soubor (populace) je příliš velký a nemůžeme ho celý „proměřit“. Proto dělám reprezentativní výběr, ten změřím, tedy náhodným procesem získávám konkrétní hodnoty náhodných veličin. Spočítám výběrové charakteristiky souboru. Tyto výběrové charakteristiky chci vztáhnout na celý základní soubor. Musím nějak kvantifikovat jistotu či nejistotu, že moje odhady se potkávají s neznámou skutečností. Připomínka značení: 𝝁 vs. ഥ𝑿 𝝈 𝟐 vs. 𝑺 𝟐 𝒛 𝟏 − 𝜶 𝒕 𝒅𝒇 𝟏 − 𝜶 … skutečný neznámý parametr vs. náš odhad … (1 - 𝜶)% kvantil rozdělení prstí, pro který platí 𝑷 𝑿 > 𝒛 𝟏 − 𝜶 = 𝜶 Statistické metody: Bodový odhad parametru Intervalový odhad parametru Testování hypotéz Potřebný rozsah výběru Výběrový průměr Výběrový rozptyl a směr. odchyl. Vlastnosti odhadu Konečnostní násobitel Bodový odhad parametru [point estimate of the parameter] Základní předpoklad dalšího odvozování: mám výběr n hodnot 𝑋1, 𝑋2, 𝑋3, … , 𝑋 𝑛 , které jsou iid., tedy vzájemně nezávislé a všechny pocházejí ze stejného rozdělení prstí. K odhadu typické hodnoty (charakteristika polohy) nejčastěji používáme výběrový průměr ഥ𝑿 = 𝟏 𝒏 σ𝒊=𝟏 𝒏 𝑿𝒊 [sample mean] Protože výběrový průměr je náhodná veličina, má smysl se ptát: a) jaká je jeho střední hodnota [expected value of the estimate] b) jaký je jeho rozptyl [variance of the estimate] c) jaká je jeho směrodatná odchylka [standard error of the estimate] Tady shrnutí, odvození dále: 𝑬ഥ𝑿 = 𝝁 𝒗𝒂𝒓 ഥ𝑿 = 𝝈 𝟐 𝒏 𝒔𝒅 ഥ𝑿 = 𝝈 𝒏 Statistické metody: Bodový odhad parametru Intervalový odhad parametru Testování hypotéz Potřebný rozsah výběru Výběrový průměr Výběrový rozptyl a směr. odchyl. Vlastnosti odhadu Konečnostní násobitel Střední hodnota výběr. průměru Rozptyl výběrového průměru SD výběrového průměru Odvození pro výběrový průměr: (a) Střední hodnota výběrového průměru: 𝑬ഥ𝑿 = 𝑬 𝟏 𝒏 ෍ 𝒊=𝟏 𝒏 𝑿𝒊 = 𝟏 𝒏 ෍ 𝒊=𝟏 𝒏 𝑬𝑿𝒊 = 𝟏 𝒏 ෍ 𝒊=𝟏 𝒏 𝝁 = 𝟏 𝒏 ∙ 𝒏 ∙ 𝝁 = 𝝁 • tento odhad je nestranný, protože 𝐸 ത𝑋 = 𝜇 Statistické metody: Bodový odhad parametru Intervalový odhad parametru Testování hypotéz Potřebný rozsah výběru vlastnost střední hodnoty: 𝐄 𝑿 + 𝒀 = 𝑬𝑿 + 𝑬𝒀 Výběrový průměr Výběrový rozptyl a směr. odchyl. Vlastnosti odhadu Konečnostní násobitel Střední hodnota výběr. průměru Rozptyl výběrového průměru SD výběrového průměru Odvození pro výběrový průměr: (b) Rozptyl výběrového průměru: 𝒗𝒂𝒓ഥ𝑿 = 𝒗𝒂𝒓 𝟏 𝒏 ෍ 𝒊=𝟏 𝒏 𝑿𝒊 = 𝟏 𝒏 𝟐 𝒗𝒂𝒓 ෍ 𝒊=𝟏 𝒏 𝑿𝒊 = 𝟏 𝒏 𝟐 ෍ 𝒊=𝟏 𝒏 𝒗𝒂𝒓𝑿𝒊 = 𝟏 𝒏 𝟐 ∙ 𝒏 ∙ 𝝈 𝟐 = 𝝈 𝟐 𝒏 𝒗𝒂𝒓ഥ𝑿 = 𝝈 𝟐 𝒏 Statistické metody: Bodový odhad parametru Intervalový odhad parametru Testování hypotéz Potřebný rozsah výběru (1) všechna 𝑿𝒊 jsou iid., proto 𝒄𝒐𝒗 𝑿𝒊, 𝑿𝒋 = 𝟎 pro ∀𝒊, 𝒋 (2) 𝒗𝒂𝒓 𝑿 + 𝒀 = 𝒗𝒂𝒓𝑿 + 𝒗𝒂𝒓𝒀 + 𝟐𝒄𝒐𝒗(𝑿, 𝒀) 𝒗𝒂𝒓 𝜷 ∙ 𝑿 = 𝜷 𝟐 ∙ 𝒗𝒂𝒓𝑿 • n = 1  𝒗𝒂𝒓 𝑿 𝟏 = 𝝈 𝟐 • větší n  menší rozptyl ഥ𝑿 • problém: 𝝈 𝟐 většinou neznáme Výběrový průměr Výběrový rozptyl a směr. odchyl. Vlastnosti odhadu Konečnostní násobitel Střední hodnota výběr. průměru Rozptyl výběrového průměru SD výběrového průměru Odvození pro výběrový průměr: (c) Směrodatná odchylka výběrového průměru: 𝑺. 𝑬. ഥ𝑿 = 𝒗𝒂𝒓 ഥ𝑿 = 𝝈 𝒏 • říkáme jí střední chyba průměru [standard error of mean, SEM] • často se uvádí ve výsledcích článků • charakterizuje „přesnost“ odhadu (pozor: přesnost odhadu ve smyslu střední kvadratické chyby (viz dále) zahrnuje i vychýlení odhadu) • platí: čím větší výběr (n), tím přesnější odhad • SEM závisí na parametru 𝝈, který většinou neznáme a nahrazujeme ho vhodným odhadem, např. výběrovým rozptylem (za chvilku). Slovní označení „střední chyba“ se používá i tehdy, když místo 𝝈 použiji odhad. Statistické metody: Bodový odhad parametru Intervalový odhad parametru Testování hypotéz Potřebný rozsah výběru Výběrový průměr Výběrový rozptyl a směr. odchyl. Vlastnosti odhadu Konečnostní násobitel Střední hodnota výběr. průměru Rozptyl výběrového průměru SD výběrového průměru Bodový odhad variance – výběrový rozptyl K odhadu variability hodnot v populaci nejčastěji používáme výběrový rozptyl 𝑺 𝟐 = 𝟏 𝒏−𝟏 σ𝒊=𝟏 𝒏 𝑿𝒊 − ഥ𝑿 𝟐 [sample variance] • střední hodnota výběrového rozptylu: 𝑬𝑺 𝟐 = 𝝈 𝟐 • rozptyl výběrového rozptylu běžně nepotřebujeme, proto neuvádím • výběrový momentový rozptyl 𝑺 𝒏 𝟐 = 𝟏 𝒏 σ𝒊=𝟏 𝒏 𝑿𝒊 − ഥ𝑿 𝟐 většinou nepoužíváme, protože o 1 𝑛 podhodnocuje skutečný parametr 𝜎2 (dále) Statistické metody: Bodový odhad parametru Intervalový odhad parametru Testování hypotéz Potřebný rozsah výběru Výběrový průměr Výběrový rozptyl a směr. odchyl. Vlastnosti odhadu Konečnostní násobitel Střední hodnota výběr. rozptylu Vsuvka – jiný tvar výběrového rozptylu: užitečný tvar pro „ruční“ výpočet, používá se v algoritmech (je rychlejší): 𝑺 𝟐 = 1 𝑛 − 1 ෍ 𝑖=1 𝑛 𝑋𝑖 − ത𝑋 2 = 1 𝑛 − 1 ෍ 𝑖=1 𝑛 𝑋𝑖 2 − 2 ത𝑋𝑋𝑖 + ത𝑋2 = = 1 𝑛 − 1 ෍ 𝑖=1 𝑛 𝑋𝑖 2 − 2 ത𝑋 ෍ 𝑖=1 𝑛 𝑋𝑖 + 𝑛 ത𝑋2 = = 1 𝑛 − 1 ෍ 𝑖=1 𝑛 𝑋𝑖 2 − 2 ത𝑋 ∙ 𝑛 σ 𝑋𝑖 𝑛 + 𝑛 ത𝑋2 = = 1 𝑛 − 1 ෍ 𝑖=1 𝑛 𝑋𝑖 2 − 2 ത𝑋 ∙ 𝑛 ത𝑋 + 𝑛 ത𝑋2 = 𝟏 𝒏 − 𝟏 ෍ 𝒊=𝟏 𝒏 𝑿𝒊 𝟐 − 𝒏ഥ𝑿 𝟐 Statistické metody: Bodový odhad parametru Intervalový odhad parametru Testování hypotéz Potřebný rozsah výběru Výběrový průměr Výběrový rozptyl a směr. odchyl. Vlastnosti odhadu Konečnostní násobitel Střední hodnota výběr. rozptylu Odvození výpočtu střední hodnoty výběrového rozptylu 𝑬𝑺 𝟐 = 𝐸 1 𝑛 − 1 ෍ 𝑖=1 𝑛 𝑋𝑖 − ത𝑋 2 = 𝐸 1 𝑛 − 1 ෍ 𝑖=1 𝑛 𝑋𝑖 2 − 𝑛 ത𝑋2 = = 1 𝑛 − 1 ෍ 𝑖=1 𝑛 𝐸 𝑋𝑖 2 − 𝑛 ∙ 𝐸 ത𝑋2 = = 1 𝑛 − 1 𝑛 𝜎2 + 𝜇2 − 𝑛 ∙ 𝜎2 𝑛 + 𝜇2 = 1 𝑛 − 1 𝑛𝜎2 + 𝑛𝜇2 − 𝜎2 − 𝑛𝜇2 = = 𝟏 𝒏 − 𝟏 ∙ (𝒏 − 𝟏)𝝈 𝟐 = 𝝈 𝟐  𝑣𝑎𝑟 𝑋𝑖 = 𝐸 𝑋𝑖 − 𝐸𝑋𝑖 2 = 𝐸 𝑋𝑖 2 − 2𝑋𝑖 𝐸𝑋𝑖 + 𝐸𝑋𝑖 2 = 𝐸 𝑋𝑖 2 − 2 ∙ 𝐸𝑋𝑖 ∙ 𝐸𝑋𝑖 + 𝐸𝑋𝑖 2 = 𝐸 𝑋𝑖 2 − 𝐸𝑋𝑖 2 odtud: 𝑬 𝑿𝒊 𝟐 = 𝒗𝒂𝒓𝑿𝒊 + 𝑬𝑿𝒊 𝟐 = 𝝈 𝟐 + 𝝁 𝟐  podobně: 𝑣𝑎𝑟 ത𝑋 = 𝐸 ത𝑋 − 𝐸 ത𝑋 2 = ⋯ = 𝐸 ത𝑋 2 − 𝐸 ത𝑋 2 odtud: 𝑬ഥ𝑿 𝟐 = 𝒗𝒂𝒓ഥ𝑿 + 𝑬ഥ𝑿 𝟐 = 𝝈 𝟐 𝒏 + 𝝁 𝟐 Statistické metody: Bodový odhad parametru Intervalový odhad parametru Testování hypotéz Potřebný rozsah výběru Výběrový průměr Výběrový rozptyl a směr. odchyl. Vlastnosti odhadu Konečnostní násobitel Střední hodnota výběr. rozptylu 𝐸 𝛽 ∙ 𝑋 = 𝛽 ∙ 𝐸𝑋 Bodový odhad populační SD – výběrová směrodatná odchylka 𝑺 = 𝑺 𝟐 • tento odhad je vychýlený, skutečnou směr. odchylku v průměru podhodnocuje, protože platí 𝐸𝑆 < 𝜎. Statistické metody: Bodový odhad parametru Intervalový odhad parametru Testování hypotéz Potřebný rozsah výběru Výběrový průměr Výběrový rozptyl a směr. odchyl. Vlastnosti odhadu Konečnostní násobitel Střední hodnota výběr. SD Vlastnosti bodového odhadu Nestranný odhad (nevychýlený, nezkreslený) [unbiased estimation] • když střední hodnota odhadu = teoretickému parametru • právě jsme měli: 𝑬ഥ𝑿 = 𝝁 a 𝑬𝑺 𝟐 = 𝝈 𝟐 • nestranný odhad systematicky nenadhodnocuje ani nepodhodnocuje odhadovaný parametr • příklad vychýleného odhadu – výběrový momentový rozptyl: 𝑬𝑺 𝒏 𝟐 = 𝑬 𝟏 𝒏 ෍ 𝒊=𝟏 𝒏 𝑿𝒊 − ഥ𝑿 𝟐 = ⋯ = 𝒏 − 𝟏 𝒏 𝝈 𝟐 vychýlení značíme 𝐵 𝜎2 , 𝑆 𝑛 2 = 𝑬𝑺 𝒏 𝟐 − 𝝈 𝟐 = 𝑛−1 𝑛 𝜎2 − 𝑛 𝑛 𝜎2 = − 𝟏 𝒏 𝝈 𝟐 𝑺 𝒏 𝟐 podhodnocuje skutečný parametr 𝝈 𝟐 . Statistické metody: Bodový odhad parametru Intervalový odhad parametru Testování hypotéz Potřebný rozsah výběru Výběrový průměr Výběrový rozptyl a směr. odchyl. Vlastnosti odhadu Konečnostní násobitel Nestranný odhad Konzistentní odhad Vydatný, eficientní odhad Přesnost odhadu Vlastnosti bodového odhadu Asymptoticky nestranný odhad • když odhad je sice vychýlený, ale se zvyšujícím se rozsahem výběru n se vychýlení zmenšuje až k nule • to je případ výběrového momentového rozptylu: 𝑺 𝒏 𝟐 = 𝟏 𝒏 ෍ 𝒊=𝟏 𝒏 𝑿𝒊 − ഥ𝑿 𝟐 𝑬𝑺 𝒏 𝟐 = 𝒏 − 𝟏 𝒏 𝝈 𝟐 vychýlení 𝑬𝑺 𝒏 𝟐 − 𝝈 𝟐 = − 𝟏 𝒏 𝝈 𝟐 lim 𝑛→∞ − 𝟏 𝒏 𝝈 𝟐 → − 𝟏 ∞ 𝝈 𝟐 = 𝟎 Statistické metody: Bodový odhad parametru Intervalový odhad parametru Testování hypotéz Potřebný rozsah výběru Výběrový průměr Výběrový rozptyl a směr. odchyl. Vlastnosti odhadu Konečnostní násobitel Nestranný odhad Konzistentní odhad Vydatný, eficientní odhad Přesnost odhadu Vlastnosti bodového odhadu Konzistentní odhad [consistent estimation] • pokud se s rostoucím rozsahem výběru n odhad zpřesňuje • 𝐸 𝑜𝑑ℎ𝑎𝑑𝑢 = 𝑝𝑎𝑟𝑎𝑚𝑒𝑡𝑟 • a zároveň lim 𝑛→∞ 𝑣𝑎𝑟 𝑜𝑑ℎ𝑎𝑑𝑢 = 0 • platí např. pro výběrový průměr: 𝑬ഥ𝑿 = 𝝁 𝒗𝒂𝒓ഥ𝑿 = 𝝈 𝟐 𝒏 𝒏 → ∞ 𝝈 𝟐 ∞ = 𝟎 Statistické metody: Bodový odhad parametru Intervalový odhad parametru Testování hypotéz Potřebný rozsah výběru Výběrový průměr Výběrový rozptyl a směr. odchyl. Vlastnosti odhadu Konečnostní násobitel Nestranný odhad Konzistentní odhad Vydatný, eficientní odhad Přesnost odhadu Vlastnosti bodového odhadu Vydatný, eficientní, nejlepší nestranný odhad [efficient estimation] • má nejmenší rozptyl mezi všemi nestrannými odhady téhož parametru Přesnost, kvalita odhadu [quality of the estimation] • měříme pomocí střední kvadratické chyby odhadu • výběrová chyba odhadu: 𝑜𝑑ℎ𝑎𝑑 − 𝑝𝑎𝑟𝑎𝑚𝑒𝑡𝑟 • zkratka MSE(odhadu) [mean squared error] • Kromě variability zahrnuje i vychýlení odhadu. Pro nestranné odhady (vychýlení = 0) je to totéž jako var(odhadu) a potažmo S.E.(odhadu) • 𝑀𝑆𝐸 𝑜𝑑ℎ𝑎𝑑𝑢 = 𝐸 𝑜𝑑ℎ𝑎𝑑 − 𝑝𝑎𝑟𝑎𝑚𝑒𝑡𝑟 2 = 𝑣𝑎𝑟 𝑜𝑑ℎ𝑎𝑑𝑢 + 𝐵2 𝑜𝑑ℎ𝑎𝑑𝑢 = = 𝐸(𝑜𝑑ℎ𝑎𝑑 − 𝐸 𝑜𝑑ℎ𝑎𝑑𝑢 )2+(𝐸 𝑜𝑑ℎ𝑎𝑑𝑢 − 𝑝𝑎𝑟𝑎𝑚𝑒𝑡𝑟)2 • příklad: 𝑀𝑆𝐸 𝑆 𝑛 2 = 𝐸 𝑆 𝑛 2 − 𝜎2 2 = ⋯ Statistické metody: Bodový odhad parametru Intervalový odhad parametru Testování hypotéz Potřebný rozsah výběru Výběrový průměr Výběrový rozptyl a směr. odchyl. Vlastnosti odhadu Konečnostní násobitel Nestranný odhad Konzistentní odhad Vydatný, eficientní odhad Přesnost odhadu Ze statistického slovníku: Robustní = odolný přibližně řečeno je to schopnost spočítat „spolehlivý“ výsledek, přestože jsou narušeny předpoklady testu, odhadu apod. Statistické metody: Bodový odhad parametru Intervalový odhad parametru Testování hypotéz Potřebný rozsah výběru Výběrový průměr Výběrový rozptyl a směr. odchyl. Vlastnosti odhadu Konečnostní násobitel Nestranný odhad Konzistentní odhad Vydatný, eficientní odhad Přesnost odhadu Konečnostní násobitel Většinou zahrnuje náš výběr méně než 5 % jedinců z celé populace, proto můžeme takovou populaci považovat za nekonečnou. Pokud ovšem vybíráme z menší konečné populace a rozsah výběru je větší než 5 % všech jedinců, potom výběrový průměr ഥ𝑿 zůstává nestranným odhadem populačního průměru, ale rozptyl ഥ𝑿 se poněkud zmenší. Aby byly odhadované vlastnosti ഥ𝑿 správné, je třeba rozptyl vynásobit konečnostním násobitelem 𝑁−𝑛 𝑁−1 . Tedy: 𝑬ഥ𝑿 = 𝝁 … to je stejné 𝒗𝒂𝒓 ഥ𝑿 = 𝑵 − 𝒏 𝑵 − 𝟏 ∙ 𝝈 𝟐 𝒏 (Citace: Zvára, Karel: Biostatistika. Karolinum, Praha 2008.) Statistické metody: Bodový odhad parametru Intervalový odhad parametru Testování hypotéz Potřebný rozsah výběru Výběrový průměr Výběrový rozptyl a směr. odchyl. Vlastnosti odhadu Konečnostní násobitel Intervalový odhad parametru [confidence interval of the parameter] také konfidenční interval či interval spolehlivosti. Konstrukci intervalu provedeme na příkladu výběrového průměru, teorie však platí pro odhady všech parametrů.  Výběrový průměr ഥ𝑿 je náhodná veličina, má tedy i své rozdělení pravděpodobností.  Víme, že 𝑬ഥ𝑿 = 𝝁 a 𝒗𝒂𝒓 ഥ𝑿 = 𝝈 𝟐 𝒏 (skutečné, ale neznámé parametry).  Pokud výběr pochází z normálního rozdělení 𝑵 𝝁, 𝝈 𝟐 , potom také náh. veličina ഥ𝑿 má normální rozdělení s parametry 𝑵 𝝁, 𝝈 𝟐 𝒏 .  Když výběr nepochází z normálního rozdělení (histogram je šikmý nebo hrbatý), potom záleží na velikosti výběru. Při rozumně velkém výběru n funguje centrální limitní věta (dále) a podle té má ഥ𝑿 ≈ 𝑵 𝝁, 𝝈 𝟐 𝒏 i když původní data nejsou z normálního rozdělení. Statistické metody: Bodový odhad parametru Intervalový odhad parametru Testování hypotéz Potřebný rozsah výběru Konstrukce intervalu spolehlivosti Odvození T statistiky Centrální limitní věta Intervalový odhad parametru Teoreticky: hodnoty, kterých může nabývat průměr ഥ𝑿 jsou popsány normálním rozdělením 𝑵 𝝁, 𝝈 𝟐 𝒏 : Chceme sestrojit interval takový, aby pokrýval „rozumné“ hodnoty ഥ𝑿 a abychom znali pravděpodobnost chybného tvrzení o tomto intervalu. Zvolíme velikost možné chyby 𝜶 = 𝟎, 𝟎𝟓, tj. 5 % (například). Pomůžeme si normovaným tvarem 𝒁 = ഥ𝑿−𝝁 𝝈 𝒏 ~𝑵 𝟎, 𝟏 se známými kvantily: 𝑷 −𝒛 𝟏 − Τ𝜶 𝟐 < ഥ𝑿−𝝁 𝝈 𝒏 < 𝒛 𝟏 − Τ𝜶 𝟐 = 𝟎, 𝟗𝟓 ≈ 𝑷 ഥ𝑿 − 𝒛 𝟏 − Τ𝜶 𝟐 ∙ 𝝈 𝒏 < 𝝁 < ഥ𝑿 + 𝒛 𝟏 − Τ𝜶 𝟐 ∙ 𝝈 𝒏 = 𝟎, 𝟗𝟓 Statistické metody: Bodový odhad parametru Intervalový odhad parametru Testování hypotéz Potřebný rozsah výběru Konstrukce intervalu spolehlivosti Odvození T statistiky Centrální limitní věta N(0, 1) je souměrné, proto 𝑧 1 − Τ𝛼 2 = −𝑧 Τ𝛼 2 . 2,5 %2,5 % Intervalový odhad parametru  𝑷 ഥ𝑿 − 𝒛 𝟏 − Τ𝜶 𝟐 ∙ 𝝈 𝒏 < 𝝁 < ഥ𝑿 + 𝒛 𝟏 − Τ𝜶 𝟐 ∙ 𝝈 𝒏 = 𝟏 − 𝜶 = 𝟎, 𝟗𝟓 Tedy jsem zpět v ~ 𝑵 𝝁, 𝝈 𝟐 𝒏 . Jiný tvar: 𝐏 𝝁 ∈ ഥ𝑿 − 𝒛 𝟏 − Τ𝜶 𝟐 ∙ 𝝈 𝒏 ; ഥ𝑿 + 𝒛 𝟏 − Τ𝜶 𝟐 ∙ 𝝈 𝒏 = 𝟏 − 𝜶 konfidenční interval odhadu parametru μ na hladině α = 0.05. Další způsob zápisu: ഥ𝑿 ± 𝒛 𝟏 − Τ𝜶 𝟐 ∙ 𝝈 𝒏 Výsledek 15.3 ± 3.65 čteme např. takto: střední hodnotu odhadujeme hodnotou 15.3, přičemž skutečná hodnota střední hodnoty leží na 95 % v rozmezí 15.3 – 3.65 a 15.3 + 3.65. Je třeba uvádět také pravděp. nebo α. Statistické metody: Bodový odhad parametru Intervalový odhad parametru Testování hypotéz Potřebný rozsah výběru Konstrukce intervalu spolehlivosti Odvození T statistiky Centrální limitní věta Intervalový odhad parametru – graficky 𝐏 𝝁 ∈ ഥ𝑿 − 𝒛 𝟏 − Τ𝜶 𝟐 ∙ 𝝈 𝒏 ; ഥ𝑿 + 𝒛 𝟏 − Τ𝜶 𝟐 ∙ 𝝈 𝒏 = 𝟏 − 𝜶 = 𝟎, 𝟗𝟓 Statistické metody: Bodový odhad parametru Intervalový odhad parametru Testování hypotéz Potřebný rozsah výběru Konstrukce intervalu spolehlivosti Odvození T statistiky Centrální limitní věta Červený interval je to „chybné tvrzení o intervalu spolehlivosti“. Červený interval nezahrnuje (nepokrývá) skutečnou hodnotu μ0. Pravděpodobnost této chyby je α (5 %). Intervalový odhad parametru – nahrazení neznámého σ2 Většinou neznáme σ2 a nahrazujeme ho odhadem rozptylu 𝑆2 = σ 𝑋 𝑖− ത𝑋 2 𝑛−1 . Potom místo 𝑍 = ത𝑋−𝜇 𝜎 𝑛 ~𝑁(0,1) dostáváme 𝑻 = ഥ𝑿−𝝁 𝑺 𝒏 ~𝒕(𝒏−𝟏) a mění se i konfidenční interval: 𝐏 𝝁 ∈ ഥ𝑿 − 𝒕(𝒏−𝟏) 𝟏 − ൗ𝜶 𝟐 ∙ 𝑺 𝒏 ; ഥ𝑿 + 𝒕(𝒏−𝟏) 𝟏 − ൗ𝜶 𝟐 ∙ 𝑺 𝒏 = 𝟏 − 𝜶 • Rozdělení t má (n – 1) stupňů volnosti! (viz odvození dále) • Interval spolehlivosti spočítaný z t-rozdělení je širší, protože 𝒕(𝒏−𝟏) 𝟏 − Τ𝜶 𝟐 > 𝒛 𝟏 − Τ𝜶 𝟐 . Odpovídá to nejistotě přidané použitím odhadu S2. • Odvození T statistiky dále: Statistické metody: Bodový odhad parametru Intervalový odhad parametru Testování hypotéz Potřebný rozsah výběru Konstrukce intervalu spolehlivosti Odvození T statistiky Centrální limitní věta Intervalový odhad parametru – odvození T statistiky 𝑻 = 𝒁 𝑾 𝒌 = ?? = ഥ𝑿 − 𝝁 𝑺 𝒏 , kde 𝒁~𝑵 𝟎, 𝟏 a 𝑾 = ෍ 𝒊=𝟏 𝒌 𝒁𝒊 𝟐 , 𝒁𝒊~𝑵(𝟎, 𝟏) 𝒁 = ഥ𝑿 − 𝝁 𝝈 𝒏 , protože ഥ𝑿 ~ 𝑵 𝝁, 𝝈 𝟐 𝒏 𝑺 𝟐 = σ 𝑿𝒊 − ഥ𝑿 𝟐 𝒏 − 𝟏 −→ 𝒏 − 𝟏 ∙ 𝑺 𝟐 = ෍ 𝑿𝒊 − ഥ𝑿 𝟐 𝒏 − 𝟏 ∙ 𝑺 𝟐 𝝈 𝟐 = σ 𝑿𝒊 − ഥ𝑿 𝟐 𝝈 𝟐 = ෍ 𝒊=𝟏 𝒏 𝑿𝒊 − ഥ𝑿 𝝈 𝟐 = ෍ 𝒊=𝟏 𝒏 𝒁𝒊 𝟐 = 𝑾 𝑻 = ഥ𝑿 − 𝝁 𝝈 𝒏 𝒏 − 𝟏 ∙ 𝑺 𝟐 𝝈 𝟐 𝒏 − 𝟏 𝟏 = ഥ𝑿 − 𝝁 𝒏 𝝈 𝑺 𝟐 ∙ (𝒏 − 𝟏) 𝝈 𝟐 ∙ (𝒏 − 𝟏) = ഥ𝑿 − 𝝁 𝒏 𝝈 𝑺 𝝈 = ഥ𝑿 − 𝝁 𝑺 𝒏 ~𝒕(𝒏−𝟏) Statistické metody: Bodový odhad parametru Intervalový odhad parametru Testování hypotéz Potřebný rozsah výběru Konstrukce intervalu spolehlivosti Odvození T statistiky Centrální limitní věta … Normování ത𝑋 Normovaná 𝑋𝑖 vypadá takto: 𝑋 𝑖−𝜇 𝜎 Chci tam ത𝑋 místo μ, ale ztrácím tím jeden stupeň volnosti. Přidat σ je snadné, ale musím ji přidat na obě strany rovnice! Centrální limitní věta (CLV) [central limit theorem] Vysvětluje, proč můžeme použít na odhad střední hodnoty datového souboru s nenormálním rozdělením aproximaci normálním rozdělením, pokud je výběr „dostatečně velký“. Máme-li posloupnost 𝑋1, 𝑋2, 𝑋3, … , 𝑋 𝑛 nezávislých, stejně rozdělených náh. veličin, které mají nějaké rozdělení (nemusí být normální) s 𝑬𝑿 = 𝝁 a 𝒗𝒂𝒓𝑿 = 𝝈 𝟐, a počet n jde do ∞, potom za velmi obecných předpokladů konverguje normovaný součet 𝑿𝒊 pro 𝒏 → ∞ k rozdělení 𝑵(𝟎, 𝟏): součet 𝑿𝒊: σ𝒊=𝟏 𝒏 𝑿𝒊  normovaný součet: 𝒁 𝒏 = σ 𝑿 𝒊−𝑬 σ 𝑿 𝒊 𝒗𝒂𝒓 σ 𝑿 𝒊 𝒁 𝒏 = σ 𝑿𝒊 − 𝑬 σ 𝑿𝒊 𝒗𝒂𝒓 σ 𝑿𝒊 = σ 𝑿𝒊 − 𝒏𝝁 𝒏𝝈 𝟐 n→∞ ~ 𝑵(𝟎, 𝟏) Toto lze aplikovat např. na průměr, relativní četnost či součet pořadí, také na testy o střední hodnotě nějakého rozdělení. Statistické metody: Bodový odhad parametru Intervalový odhad parametru Testování hypotéz Potřebný rozsah výběru Konstrukce intervalu spolehlivosti Odvození T statistiky Centrální limitní věta ≠ součet normovaných 𝑿𝒊 Použití CLV na aproximaci binomického rozdělení 𝒀~𝑩𝒊(𝒏, 𝒑), kde 𝒀 = σ𝒊=𝟏 𝒏 𝑿𝒊 a 𝑿𝒊 ~ 𝑨𝒍𝒕(𝒑) víme, že 𝐄𝑿𝒊 = 𝒑 a 𝒗𝒂𝒓𝑿𝒊 = 𝒑(𝟏 − 𝒑) tedy 𝑬𝒀 = 𝒏 ∙ 𝒑 a 𝒗𝒂𝒓𝒀 = 𝒏 ∙ 𝒑 ∙ (𝟏 − 𝒑) Podle CLV má náh. vel. 𝒁 = 𝒀−𝒏𝒑 𝒏𝒑(𝟏−𝒑) ~𝑵(𝟎, 𝟏) pro velká n. Proto 𝒀~𝑩𝒊(𝒏, 𝒑) může být pro velká n aproximována ~𝑵(𝒏𝒑, 𝒏𝒑 𝟏 − 𝒑 ). Zkušenosti starších říkají, že aproximace je dobře použitelná pro 𝒏𝒑 𝟏 − 𝒑 > 𝟗 nebo Statistické metody: Bodový odhad parametru Intervalový odhad parametru Testování hypotéz Potřebný rozsah výběru Konstrukce intervalu spolehlivosti Odvození T statistiky Centrální limitní věta Prezentace odhadu a jeho vlastností - graficky a tabulkou Statistické metody: Bodový odhad parametru Intervalový odhad parametru Testování hypotéz Potřebný rozsah výběru Konstrukce intervalu spolehlivosti Odvození T statistiky Centrální limitní věta Prezentace odhadu graficky Vš. skupiny Histogram z hmotnost data_kojeni 10v*99c hmotnost = 99*500*normal(x; 7689,5253; 845,0972) 5000 5500 6000 6500 7000 7500 8000 8500 9000 9500 10000 10500 hmotnost 0 2 4 6 8 10 12 14 16 18 20 22 24 26 Početpozorování Hmotnosti miminek ve 24. týdnu podle vzdělání matky Vzdělání matky n průměr medián SD SE Základní 34 7695,9 7775,0 901,2 154,6 Maturita 47 7603,5 7600,0 846,6 123,5 VŠ 18 7902,2 8000,0 730,0 172,1 Vš. skupiny Krabicový graf : hmotnost Průměr Průměr±SmCh Průměr±SmOdch maturita VŠ základní Vzdelani 6600 6800 7000 7200 7400 7600 7800 8000 8200 8400 8600 8800 hmotnost Prezentace odhadu a jeho vlastností - graficky a tabulkou Jsou-li data symetrická, zobrazíme PRŮMĚR a jeho STŘEDNÍ CHYBU (SE) Statistické metody: Bodový odhad parametru Intervalový odhad parametru Testování hypotéz Potřebný rozsah výběru Konstrukce intervalu spolehlivosti Odvození T statistiky Centrální limitní věta Prezentace odhadu graficky Vš. skupiny Krabicový graf : hmotnost Průměr Průměr±SmCh Průměr±SmOdch maturita VŠ základní Vzdelani 6600 6800 7000 7200 7400 7600 7800 8000 8200 8400 8600 8800 hmotnost Prezentace odhadu a jeho vlastností - graficky a tabulkou Pro zešikmená data volím raději medián a kvartily… … data nejsou ani normální ani šikmá… Statistické metody: Bodový odhad parametru Intervalový odhad parametru Testování hypotéz Potřebný rozsah výběru Konstrukce intervalu spolehlivosti Odvození T statistiky Centrální limitní věta Prezentace odhadu graficky Vš. skupiny Krabicový graf z vek.o seskupený Vzdelani data_kojeni 18v*99c Medián 25%-75% Rozsah neodleh. Odlehlé Extrémy maturita VŠ základní Vzdelani 18 20 22 24 26 28 30 32 34 36 38 40 42 44 vek.o Vzdelani=maturita Histogram z vek.o data_kojeni 18v*99c Vyjmout jestliže: NOT( UCASE("Vzdelani") = "MATURITA"$ ) 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 vek.o 0 1 2 3 4 5 6 7 8 9 Početpozorování Testování hypotéz [hypotheses testing] Příklady: • Z histogramu vidím, že data mají zhruba normální rozdělení. Ale tvrzení, že výběr pochází z normálního rozdělení, musím podepřít testem. • Mám data o hmotnosti samců a samiček nějakého druhu a z grafické prezentace je vidět, že samečci jsou těžší. Statistický test řekne, zda je rozdíl mezi pohlavími „systematický“ nebo zda bylo věcí náhody, že někteří samečci byli těžší a posunuli průměr napravo. Základní poučka metodologie vědy: shoda dat s hypotézou ještě neznamená, že hypotéza je pravdivá; na druhou stranu data odporující hypotéze ukazují, že hypotéza pravdivá není. Proto hypotézu nelze na základě dat dokázat, ale hypotézu lze na základě dat vyvrátit. Ad příklad 2) chci vyvrátit tvrzení, že samci i samičky mají stejnou hmotnost. Statistické metody: Bodový odhad parametru Intervalový odhad parametru Testování hypotéz Potřebný rozsah výběru Nulová a alternativní hypotéza Chyba prvního a druhého druhu Hladina testu α Dosažená hladina testu Síla testu Oboustranná alternativa Jednostranná alternativa Slovníček Formulujeme nulovou hypotézu H0 [null hypothesis] a její negaci , tzv. alternativní hypotézu H1, příp. HA [alternative hypothesis]. Příklad. H0: dva datové soubory mají stejnou střední hodnotu, 𝜇1 = 𝜇2; H1: střední hodnoty se liší, 𝜇1 ≠ 𝜇2. H0: výběr pochází z normálního rozdělení; H1: výběr nepochází z normálního rozdělení Máme 2 možná rozhodnutí: H0 zamítáme nebo H0 nezamítáme. Následují 4 možné situace: Statistické metody: Bodový odhad parametru Intervalový odhad parametru Testování hypotéz Potřebný rozsah výběru SKUTEČNOST NAŠE ROZHODNUTÍ H0 platí H0 neplatí (platí H1) H0 zamítáme Chyba 1. druhu: α Prst. chyby ≤ α SPRÁVNÉ ROZHODNUTÍ 𝑃 = 1 − 𝛽 síla testu H0 nezamítáme SPRÁVNÉ ROZHODNUTÍ 𝑃 ≥ 1 − 𝛼 Chyba 2. druhu: β β většinou neznáme Nulová a alternativní hypotéza Chyba prvního a druhého druhu Hladina testu α Dosažená hladina testu Síla testu Oboustranná alternativa Jednostranná alternativa Slovníček Testování hypotéz Nulová hypotéza souvisí s nějakým předem daným uspořádáním dat. Toto uspořádání je popsáno nějakým teoretickým rozdělením prstí nějaké náhodné veličiny. Naše výběrová data tedy porovnáváme s určeným teoretickým rozdělením pomocí odhadu určené náhodné veličiny. Nulovou hypotézu zamítáme tehdy, když naše uspořádání výběrového souboru je za předpokladu platnosti H0 velmi nepravděpodobné. Příklad: Test hypotézy o střední hodnotě normálního rozdělení. Data „kojeni“: váha miminek ve 24. týdnu Tabulková váha = 7600 g Průměrná váha VŠ = 7900 g H0: μvs = 7600 ; H1: μvs ≠ 7600 Statistické metody: Bodový odhad parametru Intervalový odhad parametru Testování hypotéz Potřebný rozsah výběru Vš. skupiny Histogram z hmotnost data_kojeni 10v*99c hmotnost = 99*500*normal(x; 7689,5253; 845,0972) 5000 5500 6000 6500 7000 7500 8000 8500 9000 9500 10000 10500 hmotnost 0 2 4 6 8 10 12 14 16 18 20 22 24 26 Početpozorování Nulová a alternativní hypotéza Chyba prvního a druhého druhu Hladina testu α Dosažená hladina testu Síla testu Oboustranná alternativa Jednostranná alternativa Slovníček Test hypotézy o střední hodnotě normálního rozdělení • Mám výběr 𝑋1, 𝑋2, … , 𝑋 𝑛 • Předpokládám, že 𝑋𝑖~𝑁(𝜇 𝑋, 𝜎 𝑋 2 ) a jsou iid. • Testuji, zda 𝜇 𝑋 = 𝜇0 … 𝜇0 nějaké číslo, často 0 • Hypotéza H0: 𝜇 𝑋 = 𝜇0, H1: 𝜇 𝑋 ≠ 𝜇0 • Určím přípustnou chybu 𝜶 – hladinu testu • 𝜇 𝑋 odhadnu pomocí ത𝑋, protože vím, 𝐸 ത𝑋 = 𝜇 • Rozhodovací pravidlo: ത𝑋 − 𝜇0 … bude-li velký rozdíl, H0 zamítnu • Využijeme znalostí o 𝑍 = 𝑌−𝐸𝑌 𝑠𝑑 𝑌 ~𝑁(0,1) • V tomto příkladu 𝑌 → ത𝑋, 𝐸𝑌 → 𝐸 ത𝑋 = 𝜇 𝑋 , 𝑠𝑑 𝑌 → 𝑠𝑑 ത𝑋 = 𝜎 𝑋 𝑛 • Zapracujeme předpoklad H0: 𝜇 𝑋 = 𝜇0 → 𝑍 = ത𝑋−𝜇0 𝜎 𝑥 𝑛 = ത𝑋−𝜇0 𝜎 𝑥 𝑛 Statistické metody: Bodový odhad parametru Intervalový odhad parametru Testování hypotéz Potřebný rozsah výběru Data „kojeni“: váha miminek ve 24. týdnu Jen matky s VŠ: n = 18 H0: 𝜇 𝑋 = 7600 ; H1: 𝜇 𝑋 ≠ 7600 𝛼 = 0.05 ത𝑋 = 7900 Nulová a alternativní hypotéza Chyba prvního a druhého druhu Hladina testu α Dosažená hladina testu Síla testu Oboustranná alternativa Jednostranná alternativa Slovníček Test hypotézy o střední hodnotě normálního rozdělení Odvodili jsme testovou statistiku Z, která má – za platnosti H0 – rozdělení N(0, 1): 𝒁 = ഥ𝑿 − 𝝁 𝟎 𝝈 𝒙 𝒏 ~ 𝑵 𝟎, 𝟏 … 𝝁 𝟎 = známé číslo V tuto chvíli otazník jen u 𝝈 𝒙 a) 𝝈 𝒙 známe: rozhod. pravidlo bude 𝒁 ≥ 𝒛 𝟏 − Τ𝜶 𝟐 , protože H1: 𝜇 𝑋 ≠ 𝜇0 oboustranná alternativa [two-tailed test] b) 𝝈 𝒙 neznáme: nahradíme ho odhadem 𝑆 𝑋 2 = 𝑆 𝑋 test. statistika 𝑻 = ഥ𝑿−𝝁 𝟎 𝑺 𝒙 𝒏 ~ 𝒕 𝒏−𝟏 a rozhod. pravidlo 𝑻 ≥ 𝒕 𝒏−𝟏 𝟏 − 𝜶 𝟐 . Statistické metody: Bodový odhad parametru Intervalový odhad parametru Testování hypotéz Potřebný rozsah výběru a) známe b) neznáme Nulová a alternativní hypotéza Chyba prvního a druhého druhu Hladina testu α Dosažená hladina testu Síla testu Oboustranná alternativa Jednostranná alternativa Slovníček Test hypotézy o střední hodnotě normálního rozdělení v číslech: Příklad: Data „kojeni“: váha miminek ve 24. týdnu, kde matky mají VŠ H0: μvs = 7600 g; H1: μvs ≠ 7600 g ഥX = 7902 g , σx neznáme  odhad S = 730 Testová statistika: 𝑇 = 7902−7600 730 18 = 1.76 Kvantil 𝑡 17 1 − 0,025 = 2.11 Rozhodnutí: 1.76 < 2.11, proto nezamítám H0, že skutečná μvs = 7600 g. P-hodnota provedeného testu p = 0.097, tj. 9.7 % Statistické metody: Bodový odhad parametru Intervalový odhad parametru Testování hypotéz Potřebný rozsah výběru Nulová a alternativní hypotéza Chyba prvního a druhého druhu Hladina testu α Dosažená hladina testu Síla testu Oboustranná alternativa Jednostranná alternativa Slovníček Dosažená hladina významnosti testu Také p-hodnota [p-value] Je to pravděpodobnost, které odpovídá testová statistika coby kvantil. Dnes je toto číslo velmi cennou informací v publikacích, proto je častou součástí výsledků. Co nastává: Zvolili jsme α = 0.05 (5 %) a … • p-hodnota vyjde 0.0023, tj. 0.23 %. Výsledek je tedy hluboko za kritickou hranicí, výsledek (rozdíl) je evidentně průkazný. Hurá! • p = 0.049, tedy zamítám H0, ale jen velmi těsně. • p = 0.052, tedy nezamítám H0, ale také velmi těsně. • p = 0.43, tedy H0 nezamítám a je zřejmé, že se výsledek hranici 5 % ani zdaleka neblíží. Statistické metody: Bodový odhad parametru Intervalový odhad parametru Testování hypotéz Potřebný rozsah výběru Nulová a alternativní hypotéza Chyba prvního a druhého druhu Hladina testu α Dosažená hladina testu Síla testu Oboustranná alternativa Jednostranná alternativa Slovníček Formulace nulové hypotézy a) Vidím, že samci a samičky mají skoro stejnou charakteristiku a chci je spojit do jedné skupiny. Potřebuji testem ukázat, že v datech není rozpor se „sjednocením“.  hledaný výsledek: „nezamítám H0“, „rozdíl mezi samci a samičkami je neprůkazný“, apod. Tvrzení podporuje velká p-hodnota, např. 0.3 a větší. b) Chci ukázat, že dvě skupiny se v nějaké charakteristice liší. Potom H0 formuluji tak, abych ji na základě svých dat mohla zamítnout.  Hledaný výsledek: „zamítám H0 o tom, že mezi charakteristikami první a druhé skupiny není rozdíl“. Tvrzení musí mít p-hodnotu ≤ α. • Nezamítnutí H0 znamená spíše nedostatek důkazů pro zamítnutí, než potvrzení platnosti H0. • Pouze zamítnutím H0 něco vědecky dokazujeme. • Odpověď při neúspěchu: „Na základě dat nemůžeme zamítnout H0.“ • Nelze napsat: „dokázali jsme nulovou hypotézu…“ CHYBA!! Neprůkaznost rozdílu, který jsme očekávali, je nejčastěji důsledkem toho, že buď rozdíly neexistují, nebo máme málo dat. Statistické metody: Bodový odhad parametru Intervalový odhad parametru Testování hypotéz Potřebný rozsah výběru Nulová a alternativní hypotéza Chyba prvního a druhého druhu Hladina testu α Dosažená hladina testu Síla testu Oboustranná alternativa Jednostranná alternativa Slovníček Poznámky k postupu • Statistik má nejdříve formulovat hypotézu, zvolit rozhodovací pravidlo, určit hladinu testu, podle toho spočítat minimální rozsah výběru, a pak teprve sbírat data. • Biolog nasbírá data, polovinu jich vyřadí a pak se ptá, co z toho lze otestovat  • Přesto máme pokusy, kdy je třeba o rozsahu výběru i o hladině testu uvažovat předem -> plánování experimentů, výpočet potřebného rozsahu výběru tak, aby bylo možné dosáhnout potřebné hladiny testu α. Statistické metody: Bodový odhad parametru Intervalový odhad parametru Testování hypotéz Potřebný rozsah výběru Nulová a alternativní hypotéza Chyba prvního a druhého druhu Hladina testu α Dosažená hladina testu Síla testu Oboustranná alternativa Jednostranná alternativa Slovníček Síla testu (1 – β) [power of the test] = pravděpodobnost, že nulovou hypotézu zamítneme, když ona neplatí = pravděpodobnost, s jakou odhalíme neplatnost hypotézy  ta žlutá prst. • Sílu testu většinou neznáme. Závisí na skutečném rozdělení výběrového souboru. • Víme ale, že síla testu roste s odchylkou od nulové hypotézy a také s počtem pozorování (rozsahem výběru). • Také platí, že čím menší je α, tím větší bude β. Statistické metody: Bodový odhad parametru Intervalový odhad parametru Testování hypotéz Potřebný rozsah výběru Nulová a alternativní hypotéza Chyba prvního a druhého druhu Hladina testu α Dosažená hladina testu Síla testu Oboustranná alternativa Jednostranná alternativa Slovníček Síla testu (1 – β) Různé typy testů mají také různé síly, tím se zabývá teorie. Nás pak zajímají praktické poznámky typu • „test B je silnější než běžně používaný test A“ • „test C je silný, ale je citlivý na porušení předpokladů o normalitě dat“ (tzn. mám pěkná data z normálního rozd. => beru test C) • „test D je spíše slabý, ale je robustní k narušení předpokladů“ (tzn. použiju ho tam, kde data nejsou zrovna příkladně gaussovská). Statistické metody: Bodový odhad parametru Intervalový odhad parametru Testování hypotéz Potřebný rozsah výběru Nulová a alternativní hypotéza Chyba prvního a druhého druhu Hladina testu α Dosažená hladina testu Síla testu Oboustranná alternativa Jednostranná alternativa Slovníček Oboustranná vs. jednostranná alternativa [two-tailed vs. one-tailed alternative] Oboustranná alternativa H0: 𝜇 𝑋 = 𝜇0, H1: 𝝁 𝑿 ≠ 𝝁 𝟎 … tedy μx může být větší. Teorie případu nenapovídá nic o tom, na kterou stranu se rozdělení dat může posunout (přestože nám to napovídají čísla!) Jednostranná alternativa Pokud z povahy případu vyplývá, že např. střední hodnota může být jedině menší (větší) než testovaná hodnota μ0, zapracuju tento fakt do H1: H0: 𝜇 𝑋 = 𝜇0, H1: 𝝁 𝑿 < 𝝁 𝟎 nebo H1: 𝝁 𝑿 > 𝝁 𝟎 Rozhodovací pravidlo: 𝑻 < 𝒕 𝒏−𝟏 𝜶 nebo 𝑻 > 𝒕 𝒏−𝟏 𝟏 − 𝜶 Statistické metody: Bodový odhad parametru Intervalový odhad parametru Testování hypotéz Potřebný rozsah výběru Nulová a alternativní hypotéza Chyba prvního a druhého druhu Hladina testu α Dosažená hladina testu Síla testu Oboustranná alternativa Jednostranná alternativa Slovníček Testování hypotéz - slovníček Chyba 1. druhu – Type I error Chyba 2. druhu – Type II error Síla testu – power of the test Hladina testu – signifikance level Zamítnout hypotézu – to reject hypothesis Oboustranný test – two-tailed test Jednostranný test – one-tailed test, left/right-tailed test Kritický obor – takové výsledky testové statistiky, kdy H0 zamítáme Obor přijetí – takové výsledky testové statistiky, kdy H0 nezamítáme Statistické metody: Bodový odhad parametru Intervalový odhad parametru Testování hypotéz Potřebný rozsah výběru Nulová a alternativní hypotéza Chyba prvního a druhého druhu Hladina testu α Dosažená hladina testu Síla testu Oboustranná alternativa Jednostranná alternativa Slovníček Potřebný rozsah výběru … v další přednášce. Statistické metody: Bodový odhad parametru Intervalový odhad parametru Testování hypotéz Potřebný rozsah výběru