MUDr. Michal Jurajda, Ph.D. 1 Koncepce normality/normálnosti v medicíně ÚPF LF MU 2 Definice zdraví a nemoci §Normativní subjektivní hodnocení hodnotí schopnosti a cíle §Funkcionalistické hodnotí optimálnost tělesných funkcí ÚPF LF MU 3 Modely zdraví a nemoci §Kontinuální §Alternativní ÚPF LF MU 4 Co považovat za normální? §Za normální můžeme považovat vždy to, co je četné? §Za normální můžeme považovat to, co je optimální! §To, co je optimální se stává díky přírodnímu výběru četné. -3s -2s -1s m +1s +2s +3s =medián =modus 68% 95,5% 99,7% Konstrukce normálních intervalů Cca 95% hodnot hematokrit krevni tlak ÚPF LF MU 8 Konstrukce referenčních/normálních intervalů §Optimální hodnoty daného znaku s ohledem na prognózu daného jedince §Stanoveny na základě retrospektivních nebo prospektivních studií §Určení hranic intervalů je arbitrární 9 Co může znamenat poloha pacienta v okraji (nebo i za okrajem) referenčního intervalu: §Preinstrumentální chybu (např. příprava pacienta, způsob odběru krve) §Instrumentální chybu (přesnost měření nebo systematickou chybu - správnost měření §Intraindividuální kolísání měřené veličiny §Příslušnost do 5% zdravých osob, které bývají z normálního intervalu vylučovány §Eufunkční extrém (norma individua je přitom dodržena) §Skutečně patologickou hodnotu daného znaku § MUDr. Michal Jurajda, Ph.D. 10 Úvod do statistiky Definice §Statistika - věda §Statistika - statisticky vyjádřené šetření § § § §soubor postupů užívaných při sběru, zpracování a interpretaci dat směřujících ke zlepšení rozhodování §Soubor metod, které nám umožňují činit rozumná rozhodnutí v případě nejistoty Statistika jako věda - definice §Slovo statistika má stejný původ jako slovo stát §Statistika vychází jako matematická věda především z počtu pravděpodobnosti a teorie her. §Studuje převážně tak zvané hromadné jevy Statistika §popisná §základní charakteristika získaných dat §vyčerpávající šetření §analytická, induktivní §charakterizace určitého vzorku populace, ze které usuzujeme na vlastnosti celého základního souboru §výběr Statistika §testování hypotéz §explorativní statistika §data mining Statistika a lékař §„sběratel“ dat §„konzument“ výsledků § Statistika se zabývá variabilitou měření §Metodologická, přesnost měření §Časová, v rámci individua = intraindividuální variabilita §Populační variabilita = interindividuální variabilita Statistika opakovaných měření §Sledujeme správnost a přesnost měření §Správné a přesné měření §Správné a nepřené měření §Nesprávné a přesné měření §Nesprávné a nepřesné měření presnost rozptyl rozptyl Variabilita populací §Srovnávání populace s teoretickým předpokladem §Srovnávání populací mezi sebou Sběr dat §data §kvalitativní •kategoriální, nominální (např. pohlaví) à potřeba kódování §kvantitativní •diskrétní x kontinuální (spojitá) •ordinální (např. známky ve škole 1,2,3,4,5) •intervalová •poměrová Sběr dat §měřítka §přímo naměřená hodnota §intervalové (o kolik?) §poměrové (kolikrát?) Sběr dat §Vztah základní soubor x výběr §každý prvek základního souboru musí mít stejnou pravděpodobnost, že se stane prvkem výběru!!!! §Definice výběrových kritérií / kritérií exkluze §Opakovatelnost výběru § Sběr dat §Databáze §záznam: nositel znaku §pole: znaky/proměnné § Zobrazení dat §tabulka, četnostní tabulka, histogram četností) § § originální setříděná histogram data data 115 <100: 0 135 100-110: 1 120 111-120: 0 140 121-130: 2 125 131-140: 4 130 141-150: 8 150 151-160: 4 145 161-170: 11 . >171: 0 . . hodnota sledované veličiny Zobrazení dat §histogram §box and whisker plot §sloupcový graf §koláčový graf § § Zobrazení dat §Tabulky absolutních četností §Relativní četnost §porovnání zastoupení jednotlivých kategorií mezi různě velikými skupinami §vyjádření struktury, vztahu části k celku §indexy pro porovnání vývoje v čase (pevný základ a zřetězený index) § § § § § Popis dat §Distribuce §normální §Poissonova §binomická § §Testy normality § § § § Popis dat §míry polohy §průměr (m) §medián (= 50 percentil, frekvenční střed) §modus (= nejčastější hodnota) § § § Popis dat §míry variability §min-max (=rozsah, range) §kvantily (horní 25%, dolní 75%) §směrodatná odchylka (SD, s) §rozptyl (s2) Normální rozložení normal3 symetrické průměr =medián =modus asymetrická medián průměr -3s -2s -1s m +1s +2s +3s =medián =modus -3s -2s -1s m +1s +2s +3s =medián =modus 68% 95,5% 99,7% Variabilita - příčiny opakovaná měření, např. teploty 18,2°C 18,5°C 19,1°C 18,7°C variabilita výšky v populaci 180cm 175cm 165cm 157cm proměnlivost biologických společenstev mezipopulační rozdíly rasové rozdíly = BIODIVERZITA časová proměnlivost fluktuace čas symetrické průměr =medián =modus asymetrická medián průměr Transformace dat Odhady parametrů rozložení §Vztahujeme na základní soubor §průměr μ, směrodatná odchylka σ §Výběrové charakteristiky §průměr , směrodatná odchylka s § § § § § § § § § § § § § § § § § § § § § § § § § § § § § § § § § § § § § § § § § § § § § § § § § Příklady §Popisná statistika a zobrazení získaných dat Statistická indukce §základní soubor (populace) §soubor prvků, o kterém chceme statistickými metodami něco zjistit §výběr §reprezentativní část dané populace (zákl. souboru), která má sloužit k odvození závěrů platných pro celou populaci § § § Testování hypotéz §porovnání výběrového souboru a teorie o základním souboru §porovnání dvou základních souborů na základě porovnání dvou výběrů nulová hypotéza alternativní hypotéza Chyba 1. a 2. typu errors Postup při testování hypotéz §vyslovení hypotéz §volba testu §volba pravděpodobnosti chyby zamítnutí, hladiny významnosti α §výpočet §zamítnutí/nezamítnutí nulové hypotézy Statistické testy parametrické (pro normální nebo téměř normální rozložení) neparametrické (pro jiné než normální rozložení) testy nepárové párové • t-test nezávislý (klasický t-test, two-sample) • Mann-Whitney (=Wilcoxon nezávislý) • mediánový test • t-test závislý (one-sample) • Wilcoxon závislý • znaménkový test srovnání parametru mezi 2 skupinami objektů srovnání parametru u stejných objektů v časové souslednosti Kontingenční tabulky §Chi-square §Fischer exact test § § Regresní a korelační analýza §Sleduje závislost dvou proměnných §Formální korelace §Korelace způsobená nehomogenitou §Korelace způsobená třetí veličinou Mnohorozměrná analýza dat §Shluková analýza § § Příklad 1 §Porovnejte mzdy ve dvou virtuálních nemocnicích. §Stanovte hlavní rozdíly a porovnejte vypovídací schopnost aritmetického průměru o skutečném stavu Příklad 2 §Porovnejte hmotnosti pacientů a zdravých jedinců §Vyslovte nulovou a alternativní hypotézu. §Otestujte normalitu distribuce znaku, rozhodněte jaký typ testů na testování hypotéz je možno použít, otestujte nulovou hypotézu a komentujte výsledek Příklad 3 §Porovnejte systolický krevní tlak u pacientů před terapií a po terapii. §Vyslovte nulovou a alternativní hypotézu. §Otestujte normalitu distribuce znaku, rozhodněte jaký typ testů na testování hypotéz je možno použít, otestujte nulovou hypotézu a komentujte výsledek Příklad 4 §Porovnejte hladiny IgE u pacientů a zdravých jedinců §Vyslovte nulovou a alternativní hypotézu. §Otestujte normalitu distribuce znaku, rozhodněte jaký typ testů na testování hypotéz je možno použít, otestujte nulovou hypotézu a komentujte výsledek Příklad 5 §Analyzujte tabulku 2x2 §Vyslovte nulovou a alternativní hypotézu. §Otestujte tabulky Fischer exact testem Příklad 6 §Korelujte 10 řad náhodných čísel a interpretujte výsledek korelace § ÚPF LF MU 55 Konstrukce referenčních/normálních intervalů §Optimální hodnoty daného znaku s ohledem na prognózu daného jedince. §Stanoveny na základě retrospektivních nebo prospektivních studií. §Určení hranic intervalů je arbitrární ÚPF LF MU 56 Konstrukce referenčních/normálních intervalů §Optimální hodnoty daného znaku s ohledem na prognózu daného jedince. §Stanoveny na základě retrospektivních nebo prospektivních studií. §Určení hranic intervalů je arbitrární ÚPF LF MU 57 Konstrukce referenčních/normálních intervalů §Optimální hodnoty daného znaku s ohledem na prognózu daného jedince. §Stanoveny na základě retrospektivních nebo prospektivních studií. §Určení hranic intervalů je arbitrární ÚPF LF MU 58 Konstrukce referenčních/normálních intervalů §Optimální hodnoty daného znaku s ohledem na prognózu daného jedince. §Stanoveny na základě retrospektivních nebo prospektivních studií. §Určení hranic intervalů je arbitrární ÚPF LF MU 59 Konstrukce referenčních/normálních intervalů §Optimální hodnoty daného znaku s ohledem na prognózu daného jedince. §Stanoveny na základě retrospektivních nebo prospektivních studií. §Určení hranic intervalů je arbitrární ÚPF LF MU 60 Konstrukce referenčních/normálních intervalů §Optimální hodnoty daného znaku s ohledem na prognózu daného jedince. §Stanoveny na základě retrospektivních nebo prospektivních studií. §Určení hranic intervalů je arbitrární ÚPF LF MU 61 Konstrukce referenčních/normálních intervalů §Optimální hodnoty daného znaku s ohledem na prognózu daného jedince. §Stanoveny na základě retrospektivních nebo prospektivních studií. §Určení hranic intervalů je arbitrární ÚPF LF MU 62 Konstrukce referenčních/normálních intervalů §Optimální hodnoty daného znaku s ohledem na prognózu daného jedince. §Stanoveny na základě retrospektivních nebo prospektivních studií. §Určení hranic intervalů je arbitrární