Etapy stat.šetření o 1.Plán šetření 2.Sběr dat 3.Popis a technické zpracování, tzv. deskriptivní statistika 4.Rozbor, závěry, interpretace, tzv. induktivní statistika Statistická indukce – 4. etapa oTeorie odhadů -Odhad průměru základního souboru -Odhad pravděpodobnosti oTestování statistických hypotéz -Srovnání dvou průměrů -Srovnání pravděpodobností oHodnocení závislosti -Závislost kvantitativních veličin -Závislost kvalitativních veličin - oZOBECNĚNÍ VÝSLEDKŮ VÝBĚROVÉHO ŠETŘENÍ NA CELÝ ZÁKLADNÍ SOUBOR o! PRAVDĚPODOBNOST, NÁHODNÁ VELIČINA A JEJÍ ROZDĚLENÍ Pravděpodobnost oVšechny STAT výroky – pravděpodobnostní charakter . o oJejich věrohodnost vyjadřujeme npstí, že tento výrok platí → SPOLEHLIVOST npstí, že daný výrok neplatí → RIZIKO n oDva základní pojmy teorie pravděpodobnosti – náhodný jev a pravděpodobnost. o oPravděpodobnost náhodného jevu – kvantitativní charakteristika, která je mírou častosti výskytu zkoumaného jevu. o Pravděpodobnost oPST někt.náhodných jevů umíme vypočítat, např. výhra ve Sportce, karetní hry ; vznik teorie pravděpodobnosti vázán na hazardní hry → později užití v jiných oblastech lidské činnosti o oKlasická definice P (A) = m/n o m = počet příznivých výsledků v experimentu o n = počet všech možných výsledků o Příklady: kostka, mince o karty o sportka o narození chlapce, dívky oKomplex podmínek – souhrn předpisů, za nichž se experiment provádí. o o o Pravděpodobnost ou většiny jevů v lékařské praxi PST neznáme (např.výskyt onemocnění v populaci, pooperační komplikace, účinek léku) o o → pouze odhadujeme – pomocí RELATIVNÍ ČETNOSTI, o kt. zjišťujeme opakováním pokusu n. pozorování + měříme: m/n m = počet příznivých výsledků v experimentu o n = počet všech možných výsledků o o → blíží se skutečné PSTI tím více, čím větší počet pokusů a pozorování provedeme o o Pravděpodobnost oPravděpodobnost reakce pacienta na určitou léčbu? o oPouze odhad pomocí relativních četností on pacientů ox vyléčeno o oPodíl x/n odhaduje pravděpodobnost vyléčení P o o Vlastnosti pravděpodobnosti 1.0 < nebo = P (A) < nebo = 1 2.P (A) = 0 pro jevy nemožné 3.P (A) =1 pro jevy jisté 4. o oPravidla pro počítání a)Pravidlo pro sčítání o A, B disjunktní – vzájemně se vylučují o P (A nebo B) = P (A) + (B) o o A, B nejsou disjunktní o P (A nebo B) = P (A) + P (B) – P (A i B) o Vlastnosti pravděpodobnosti ob) Pravidlo pro násobení oA, B nezávislé oP (A i B) = P (A) . P (B) oA, B závislé oP (A i B) = P (A) . P (B/A) o = P (B) . P (A/B) př. dvě nemoci u člověka o oP (A/B), P (B/A) jsou tzv. podmíněné pravděpodobnosti. oPlatí: P (A/B) = P (A i B)/ P (B) o P (B/A) = P (A i B)/P (A) oPravidlo pro sčítání i násobení se dá rozšířit na více jevů. oPodmíněné pravděpodobnosti jsou užitečné pro hodnocení rizika nemoci v populaci Vlastnosti pravděpodobnosti oNapř. Ze srovnání pravděpodobností oP (Ca), P (Ca/K), P(Ca/N) oLze usuzovat na riziko kouření (K,N) na výskyt karcinomu plic (Ca) oNapř. P (Ca/K)/P (Ca) udává, kolikrát je větší pravděpodobnost výskytu karcinomu plic u kuřáků než v celé populaci o P (Ca/K)/P (Ca/N) udává, kolikrát je větší pravděpodobnost výskytu karcinomu plic u kuřáků než u nekuřáků Výběrový/základní soubor oVýběrový soubor Základní soubor o- reprez. náhodný výběr - soubor, který nás zajímá o- výběrové (empirické) - teoretické rozdělení četností o rozdělení četností (matematický model) o- popis rozdělení: tabulka, graf - popis rozdělení: pravděpodobnostní o- stat. ukazatele = výběrové charakteristiky: rozdělení om, s, p (ozn. latinkou) - stat. ukazatele = parametry: μ,σ, π o- jsou to charakteristiky náhodných veličin, (ozn. řeckou abecedou) otzn. mění se výběr od výběru + je nutné počítat - jsou to konstanty, zpravidla neznámé, os chybami (výběrové, náhodné) pro o o o o oStatistická indukce = usuzování z vlastností výběru na vlastnosti základního souboru o o Snímek 040.jpg Empirické a pravděpodobnostní rozdělení o→ každá veličina, kterou zkoumáme, je ovlivněna řadou nepatrných náhodných vlivů, což způsobuje její variabilitu – tzn. veličina nabývá u různých subjektů různých hodnot. o oměříme-li veličinu ve výběrovém souboru, pak rozložení hodnot této veličiny znázorňujeme na základě empiricky zjištěných četností o okaždá veličina má své pravděpodobnostní (teoretické) rozdělení o Pravděpodobnostní rozdělení (pravděpodobnostní křivka) vyjadřuje očekávání, jak často se budou jednotlivé hodnoty vyskytovat v nekonečně velkém souboru Empirické a pravděpodobnostní rozdělení oPravděpodobnostní (teoretické) rozdělení o v takovém rozložení jsou na ose x všechny hodnoty, kterých může veličina potenciálně nabývat a na ose y jsou zaneseny pravděpodobnosti, se kterými se dané hodnoty vyskytují o X ov empirickém rozdělení (polygon četností) jsou popsány četnosti, se kterými se naměřené hodnoty vyskytovaly ve výběrovém souboru o o Typy pravděpodobnostních rozdělení opřírodním i společenským jevům vlastní různorodost a mnohotvárnost X v praxi lze vystačit s poměrně malým množstvím modelů. o oPozn. -s veličinou zacházíme jako s normálně rozdělenou, pokud nemáme dostatečné důvody pro vyvrácení této domněnky -rozložení většiny veličin lze převést na normální rozdělení o o oDiskrétní veličiny -binomické rozdělení (jev – nejev) -rovnoměrné rozdělení -Poissnovo rozdělení (vzácné jevy) o oSpojité veličiny -normální rozdělení -Studentovo t-rozdělení -Snedecorovo F-rozdělení -Chí-kvadrát rozdělení o Normální rozdělení o oSpojitý znak → normální rozdělení – je-li vytvářen nahromaděním velkého počtu nepatrných, nezávislých příčin nahodilého charakteru Normální rozdělení -matematický model rozdělení četností náhodné veličiny o - - - - - - - -frekvenční křivka normálního rozdělení je jednoznačně určena dvěma parametry: µ, σ o µ určuje polohu křivky (analogie m) mí o σ určuje tvar křivky (analogie s) sigma o o Snímek 038.jpg Normální rozdělení o µ určuje polohu křivky (analogie m) mí o σ určuje tvar křivky (analogie s) sigma o o Snímek 039.jpg Vlastnosti normálního rozložení -Frekvenční křivky normálního rozložení mají pro různé veličiny různý tvar o (σ) a polohu (µ) o -Pro všechny ale platí, že intervaly, ve kterých se odhadovaná proměnná nachází s pravděpodobností 95 nebo 99%, lze vyjádřit jako odchylky od µ v násobcích σ : - Snímek 036.jpg Snímek 037.jpg Odhady parametrů (1) o1)Bodové odhady o o o o o oPožadavky na bodové odhady: a)Konzistence – s rostoucím VS se výběrová charakteristika více blíží k parametru b)Nestrannost – odhady parametru provedené na základě různých VS kolísají kolem hodnoty neznámého parametru na obě strany c)Minimální rozptyl – uvedené kolísání musí být co nejmenší d) oNevýhody bodových odhadů: o- neznáme jejich spolehlivost a přesnost Snímek 035.jpg Odhady parametrů (2) o2/ Intervalové odhady o -Neznámý parametr odhadujeme intervalem vytvořeným kolem tzv. nejlepšího nestranného bodového odhadu - -Interval spolehlivosti (konfidenční interval) -Spolehlivost si určujeme sami – buď 95% nebo 99% - o jde o pravděpodobnost, že odhadovaný parametr se nachází v daném intervalu o o 95% CI (-;-) o 99% CI (-;-) o Odhady parametrů (3) - -doplněk spolehlivosti vyjadřuje riziko odhadu – tj. riziko, že odhadovaný parametr leží mimo interval - o při spolehlivosti 95% → riziko odhadu 5% o při spolehlivosti 99% → riziko odhadu 1% Odhad průměru základního souboru (parametru µ ) [mý] 1.Nejlepší bodový odhad parametru µ je výběrový průměr m 2.V souborech, kde n>30, se výběrový průměr chová jako náhodná veličina, která má normální rozdělení 3.V souborech, kde n<30, používáme model Studentova rozdělení (konstanty 1,96, příp. 2,58 se nahrazují jinými – viz. skripta,str. 25) 4.Každý výběrový průměr je zatížen chybou – jde o tzv. standardní chybu průměru Sem , kterou odhadujeme ze vztahu: (střední chyba) oZávěr: Snímek 033.jpg Snímek 034.jpg Vlastnosti odhadu 1)Spolehlivost – volí se předem, jde o stanovení pravděpodobnosti, obvykle 0,95 nebo 0,99 2)Přesnost – je dána délkou intervalu, čím kratší je interval, tím je vyšší přesnost odhadu o o o o o o o Obě vlastnosti spolu souvisí oPřesnost odhadu lze ovlivnit: a)snížením či zvýšením P spolehlivosti b)snížením či zvýšením n (velikost souboru) c)snížením či zvýšením s (homogenita souboru) Snímek 032.jpg Příklad 1: oOdhadněte průměrnou vitální kapacitu plic mužů 40-50 letých na podkladě výběrového šetření 200 mužů, u kterých jsme zjistili: o om = 4,82 os = 0,67 on = 200 Příklad 2: oSkupina A: oOdhadněte průměrnou hladinu hemoglobinu v populaci zdravých mužů z náhodného výběru 100 jedinců s průměrnou hodnotou m = 152,4 g/l a směrodatnou odchylkou s = 18,2 g/l se spolehlivostí: a) 95% b)99% oSkupina B: oOdhadněte průměrnou hladinu hemoglobinu v populaci zdravých mužů z náhodného výběru 35 jedinců s průměrnou hodnotou m = 152,4 g/l a směrodatnou odchylkou s = 18,2 g /l se spolehlivostí: a) 95% b) 99% oSkupina C: oOdhadněte průměrnou hladinu hemoglobinu v populaci zdravých mužů z náhodného výběru 100 jedinců s průměrnou hodnotou m = 152,4 g/l a směrodatnou odchylkou s = 14,8 g/l se spolehlivostí: a) 95% b) 99% Odhad pravděpodobnosti ZS (parametru π) [pí] 1.Nejlepší bodový odhad je relativní četnost o o o n = počet pozorování o k = počet pozorování, u nichž nastal sledovaný jev 2.Pro pravděpodobnosti sice platí binomické rozdělení, ale pokud platí o o můžeme vycházet z normálního rozdělení o3. Standardní chybu SE odhadujeme ze vztahu: o o o o Snímek 031.jpg Snímek 030.jpg Snímek 029.jpg Příklad: o oOdhadněte pravděpodobnost výskytu zrakové vady u studentů LF na základě výběrového šetření u 200 studentů o o n = 200 o k = 80 o p = 0,40 (40%) o Příklad: oVe výběru 100 šestiměsíčních zdravých dětí náhodně vybraných z brněnské populace byl sledován hemoglobin v g%. on = 100 m = 13,10 s = 1,90 o 1)Určete interval, ve kterém se pohybuje hemoglobin u 95% vyšetřených dětí. 2)Odhadněte průměrné množství hemoglobinu v základním souboru se spolehlivostí 0,95. Jaká je přesnost tohoto odhadu? 3)U kolika dětí musíme provést šetření, aby přesnost odhadu průměru byla při spolehlivosti 0,95 nejméně ± 0,2.