8. SEMINÁŘ • •INDUKTIVNÍ STATISTIKA • •1. ODHADY PARAMETRŮ • • • STATISTICKÁ INDUKCE STATISTICKÁ INDUKCE • • • • • •Vlastnosti a složení výběrového souboru je přesně známé. •Vlastnosti a složení základního souboru odhadujeme s určitou mírou nejistoty. •Metody induktivní statistiky nejistotu neodstraňují, ale dokáží určit míru této nejistoty. ? Základní a výběrový soubor •VÝBĚROVÝ SOUBOR • •reprezentativní náhodný výběr • •výběrové (empirické) rozdělení četností • •popis rozdělení: tabulka, graf • •stat. ukazatele = výběrové charakteristiky: m, s, p (ozn. latinkou) •jsou to charakteristiky náhodných veličin a také se jako náhodné veličiny chovají, tzn. mění se výběr od výběru •ZÁKLADNÍ SOUBOR • •soubor, který nás zajímá • •teoretické rozdělení četností (matematický model) • •popis rozdělení: pravděpodobnostní rozdělení • •stat. ukazatele = parametry: μ, σ, p (ozn. řeckou abecedou) • •jsou to neměnné konstanty, zpravidla neznámé, pro n ® ∞ platí, že m ® μ, s ® σ, p ® p. Empirické rozdělení četností •Měříme-li veličinu ve výběrovém souboru, pak rozložení hodnot této veličiny znázorňujeme na základě empiricky zjištěných četností (histogram). •Jsou popsány četnosti, se kterými se naměřené hodnoty vyskytovaly ve výběrovém souboru. • • Základní a výběrový soubor •VÝBĚROVÝ SOUBOR • •reprezentativní náhodný výběr • •výběrové (empirické) rozdělení četností • •popis rozdělení: tabulka, graf • •stat. ukazatele = výběrové charakteristiky: m, s, p (ozn. latinkou) •jsou to charakteristiky náhodných veličin a také se jako náhodné veličiny chovají, tzn. mění se výběr od výběru •ZÁKLADNÍ SOUBOR • •soubor, který nás zajímá • •teoretické rozdělení četností (matematický model) • •popis rozdělení: pravděpodobnostní rozdělení • •stat. ukazatele = parametry: μ, σ, p (ozn. řeckou abecedou) • •jsou to neměnné konstanty, zpravidla neznámé, pro n ® ∞ platí, že m ® μ, s ® σ, p ® p. Pravděpodobnostní rozdělení •Každá veličina má své pravděpodobnostní (teoretické) rozdělení. Na ose y jsou pravděpodobnosti vyjadřující očekávání, jak často se budou jednotlivé hodnoty vyskytovat v nekonečně velkém souboru. Hodnoty proměnné (VKP) •Od empirického k pravděpodobnostnímu rozdělení (postupné vyhlazování histogramu) • •Pravděpodobnostní rozdělení –znázorňují procesy a jevy našeho každodenního života pomocí matematických modelů. –Tyto modely vyjadřují v matematické formě jejich zákonitosti a umožňují tak hlubší poznání zákonitostí těchto jevů. • Empirické a pravděpodobnostní rozdělení Základní a výběrový soubor •VÝBĚROVÝ SOUBOR • •reprezentativní náhodný výběr • •výběrové (empirické) rozdělení četností • •popis rozdělení: tabulka, graf • •stat. ukazatele = výběrové charakteristiky: m, s, p (ozn. latinkou) •jsou to charakteristiky náhodných veličin a také se jako náhodné veličiny chovají, tzn. mění se výběr od výběru •ZÁKLADNÍ SOUBOR • •soubor, který nás zajímá • •teoretické rozdělení četností (matematický model) • •popis rozdělení: pravděpodobnostní rozdělení • •stat. ukazatele = parametry: μ, σ, p (ozn. řeckou abecedou) • •jsou to neměnné konstanty, zpravidla neznámé, pro n ® ∞ platí, že m ® μ, s ® σ, p ® p. Typy pravděpodobnostních rozdělení • •Diskrétní veličiny •binomické rozdělení (jev – nejev) •rovnoměrné rozdělení •Poissonovo rozdělení (vzácné jevy) • •Spojité veličiny •normální rozdělení •Studentovo t-rozdělení •Snedecorovo F-rozdělení •Chí-kvadrát rozdělení • •Pozn.: •S veličinou zacházíme jako s normálně rozdělenou, pokud nemáme dostatečné důvody pro vyvrácení této domněnky. •Rozložení většiny veličin lze převést na normální rozdělení. • NORMÁLNÍ ROZDĚLENÍ (GAUSSOVA KŘIVKA) Matematický model rozdělení četností spojité náhodné veličiny NORMÁLNÍ ROZDĚLENÍ •μ1 ˂ μ2; σ1 = σ2 img173 NORMÁLNÍ ROZDĚLENÍ •μ1 = μ2; σ1 ˂ σ2 img175 VLASTNOSTI NORMÁLNÍHO ROZDĚLENÍ VLASTNOSTI NORMÁLNÍHO ROZDĚLENÍ • • • • • •Častěji nás ale zajímá, v jakém intervalu leží 95% (příp. 99%) hodnot sledované veličiny –můžeme pak totiž vyjádřit tvrzení, že s pravděpodobností 95% (99%) se hodnoty sledované veličiny nacházejí právě v tomto intervalu, resp., že 95% hodnot, kterých sledovaná veličina nabývá, leží v tomto intervalu. –takový interval je vymezen tzv. kritickými hodnotami (konstantami) normálního rozdělení • • KRITICKÉ HODNOTY NORMÁLNÍHO ROZDĚLENÍ • • • • • • •Kritické hodnoty normálního rozložení: 1,96σ a 2,58σ. •V intervalu (μ - 1,96σ; μ + 1,96σ) se nachází 95 % všech možných hodnot sledované veličiny. •V intervalu (μ – 2,58σ; μ + 2,58σ) se nachází 99% všech možných hodnot sledované veličiny. • • • v v v v μv v v v 99% v 95% μ - 1,96σ 1,96σ -2,58σ 2,58σ ODHADY PARAMETRŮ •Bodové odhady •Intervalové odhady 1. • BODOVÉ ODHADY INTERVALOVÉ ODHADY •Neznámý parametr odhadujeme intervalem vytvořeným kolem tzv. nejlepšího nestranného bodového odhadu. •Interval spolehlivosti (konfidenční interval) •Spolehlivost určujeme sami, obvykle 95% nebo 99% •jde o pravděpodobnost, že odhadovaný parametr se nachází v daném intervalu. – •zápis: 95% CI (dolní hranice ; horní hranice) – 99% CI (dolní hranice ; horní hranice) • • INTERVALOVÉ ODHADY • •Doplněk spolehlivost vyjadřuje tzv. riziko odhadu – tj. riziko, že odhadovaný parametr leží mimo interval: •při spolehlivosti 95% je riziko odhadu 5%, •při spolehlivosti 99% je riziko odhadu 1%. • 2. • ODHAD PRŮMĚRU ZÁKLADNÍHO SOUBORU (PARAMETRU μ) Normální rozdělení náhodné veličiny (μ,σ) μ -1,96σ +1,96σ μ •Skupina A: •Odhadněte průměrnou hladinu hemoglobinu v populaci zdravých mužů z náhodného výběru 100 jedinců s průměrnou hodnotou m = 152,4 g/l a směrodatnou odchylkou s = 18,2 g/l se spolehlivostí: a)95% b)99% – •Skupina B: •Odhadněte průměrnou hladinu hemoglobinu v populaci zdravých mužů z náhodného výběru 35 jedinců s průměrnou hodnotou m = 152,4 g/l a směrodatnou odchylkou s = 18,2 g/l se spolehlivostí: a)95% b)99% • •Skupina C: •Odhadněte průměrnou hladinu hemoglobinu v populaci zdravých mužů z náhodného výběru 100 jedinců s průměrnou hodnotou m = 152,4 g/l a směrodatnou odchylkou s = 14,8 g/l se spolehlivostí: a)95% b)99% • VLASTNOSTI INTERVALOVÉHO ODHADU ODHAD PRAVDĚPODOBNOSTI ZÁKLADNÍHO SOUBORU (PARAMETRU p) INTERVALOVÉ ODHADY Změna kritických hodnot u jednostranného odhadu pro spolehlivost 0,95 Pravostranný odhad P= 0,95 Oboustranný odhad P= 0,95 Riziko odhadu Riziko odhadu Riziko odhadu