Epidemiologické studie I. Mgr. Aleš Peřina, Ph. D. Z historie  Hippokratés z Kósu: soustavným sledováním a racionální úvahou nad výsledky se zasloužil o základy moderní medicíny  John Snow (Londýn, 1854): analýzou místních souvislostí odhalil ohnisko epidemie cholery  Ignaz Semmelweis (1818 – 1865): všiml si, že větší výskyt puerperální sepse je při domácích porodech a proto nařídil dezinfekci rukou, i když původce onemocnění objevil Luis Pasteur až 1879.  Polovina 20. století: postinfekční éra, i když s rozvojem laboratorních metod vyšetřování prostředí nastal příklon k „uvěření“ výsledku laboratoře (otázka stanovitelnosti a objektivity). Londýnská epidemie cholery, John Snow, 1854 Mělké infiltrační studny pro jímání říční vody ve městě bez kanalizace. Žádní nemocní v blízkém pivovaru ani v blízkém chudobinci s vlastní hlubokou studnou. Pro svoje chuťové vlastnosti byla studna na Broad Street vyhledávána obyvateli i ze vzdálenějších oblastí. Epidemiologie  Epidemiologií se rozumí studium distribuce a determinant zdravotně významných jevů a událostí v definovaných populacích a využití tohoto studia k řešení zdravotních problémů.  Infekční  Neinfekční  Přesah do nových oblastí  Klinická epidemiologie: měření efektu léčby, rozvoj medicíny založené na důkazu (Evidence Based Medicine)  Měření zdravotních služeb  Epidemiologie odpovídá na otázku „kolik?“, kvalitativní výzkum na otázku „proč?“. Jak na to?  Výzkumná otázka  Volba proměnných  Volba typu studie  Volba souborů  Pilotní studie  Měření  Velikost nebo frekvence jevu  Statistické zpracování  Deskriptivní (jednorozměrná analýza)  Analytické (dvou- a více rozměrná analýza)  Interpretace výsledků  Nejistoty Nosná myšlenka  Co studovat?  Biologický, chemický, fyzikální, psychologický, sociální, behaviorální… faktor  Úvaha o expozici, aneb „cesta do hlubin člověka“.  Lze očekávat následek?  Hypotéza  Na základě literární rešerše (pokud možno)  Ukazatele míry  V metrické soustavě (výška, hmotnost, obvod pasu, glykémie na lačno…)  Ukazatele frekvence  Incidence nemoci, Počet zemřelých  Riziko je pravděpodobnost (ale i emoce) Zdroje dat  Rutinně sbíraná data o nemocnosti, úmrtnosti  Rutinní evidence ze statistiky UZIS, ČSÚ, registry nemocí, úrazů, transplantací, lékařské záznamy praktických a odborných lékařů, záznamy o úmrtích  Základ tzv. ekologických (korelačních) studií  Vlastní výzkum  Dotazník  Interview  Laboratorní analýza Strategie deskriptivní statistiky  Spojitá proměnná  Ordinální: když 2 je více než 1  Intervalová: rozpětí ordinálních hodnot, např. skóre v testu  Indexy: relativní číslo  Nespojitá (kategoriální) data  Nominální stupnice: somatotyp, krevní skupina, barva očí… Deskripce spojité proměnné  Průměr: součet množiny čísel vydělený počtem těchto čísel, ukazatel centrální tendence  =PRŮMĚR(A2:A6)  Medián: prostřední hodnota, 50. percentil v řadě čísel seřazených vzestupně  =MEDIAN(A2:A6)  Modus: nejčastěji se vyskytující hodnota v souboru  =MODE(A2:A7)  Minimum: nejmenší hodnota v souboru  =MIN(A2:A6)  Maximum: největší hodnota v souboru  =MAX(A2:A6) U symetrického rozložení platí: průměr = medián = modus Průměr Průměr  Je opodstatněný u dat rovnoměrně rozložených kolem střední hodnoty.  Doplněný o SMODHC.  Při vychýlených rozloženích je zavádějící Průměr Sample data Statistica (c) Dell File: Leukemia Variable Valid N Mean Median Mode Frequency of Mode Minimum Maximum Std.Dev. AGE 71 46,14085 45,00000 28,00000 6 18,00000 83,00000 17,80473 Průměr Sample data Statistica (c) Dell File: Leukemia AGE = 71*1*Normal(Location=46,1408; Scale=17,8047) 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 70 72 74 76 78 80 82 AGE 0 1 2 3 4 5 6 7 Noofobs Průměr Mortalita v oblasti vlivu JETE Variable Valid N Mean Median Mode Frequency of Mode Minimum Maximum Std.Dev. VEKZE 4473 76,30673 79,00000 87,00000 173 0,00 103,0000 14,46791 Průměr: počet zemřelých podle věku Histogram of VEKZE Mortalita v oblasti vlivu ETE 0 3 6 9 12 15 18 21 24 27 30 33 36 39 42 45 48 51 54 57 60 63 66 69 72 75 78 81 84 87 90 93 96 99 102 VEKZE 0 20 40 60 80 100 120 140 160 180 Noofobs Deskripce nespojitých (kategoriálních) dat  Četnost: počet výskytu hodnoty dané kategorie (např. věkový interval od – do)  Relativní četnost: počet výskytu hodnot vztažených ke zvolenému základu (100 %)  Kumulativní četnost: součet hodnot sledované kategorie a všech nižších kategorií Deskripce nespojitých (kategoriálních) dat Mortalita v oblasti vlivu JETE Category Count Percent Cumulative Percent E1 E2V E2Z KBA KBV KBJ KBS KBZ KPJ KPV KPZ CB HK OL Missing 101 2,3 2,3 122 2,7 5,0 102 2,3 7,3 218 4,9 12,1 151 3,4 15,5 70 1,6 17,1 87 1,9 19,0 111 2,5 21,5 96 2,1 23,7 169 3,8 27,4 119 2,7 30,1 1042 23,3 53,4 993 22,2 75,6 1092 24,4 100,0 0 0,0 100,0 Požadavky na vstupní údaje  Expoziční proměnná  Spotřeba potravin, frekvenční dotazník, spotřeba vody, fyzická aktivita, množství kontaminující látky v potravinách nebo v pitné vodě  Znak  Zdraví  Nemoc: definice diagnostických znaků (inclusion krítéria), exclusion kritéria k vyloučení zdrojů statistických bias (příště  )  Smrt  Nemocnost a úmrtnost  Celková  Specifická podle příčiny nebo podle věku Požadavky na vstupní údaje  Validita  Popisuje studovaný znak situaci, kterou hodláme studovat?  Lze z frekvence konzumace potravin usuzovat na zdravotní stav nebo jen na to, kdo má co rád?  Lze na základě výsledků laboratorního vyšetření definovat případ (inclusion kritérium), nebo má laboratorní vyšetření pouze pomocný charakter?  Srov. Glykemie na lačno vs. CRP  Senzitivita a specificita  Senzitivita: úspěšnost záchytu sledovaného znaku (100 % = žádné falešně negetivní  Specificita: schopnost testu odlišit případy, které znak nemají (100 % = žádné falešně pozitivní) Senzitivita a specificita Má pozitivní výsledek testu Má negativní výsledek testu Je nemocný/-á Skutečně pozitivní (SENZITIVITA) Falešně negativní Je zdravý/-á Falešně pozitivní Skutečně negativní (SPECIFICITA) Ročenka UZIS Epidemiologické studie II. Mgr. Aleš Peřina, Ph. D. Požadavky na vstupní údaje  Expoziční proměnná  Spotřeba potravin, frekvenční dotazník, spotřeba vody, fyzická aktivita, množství kontaminující látky v potravinách nebo v pitné vodě  Znak  Zdraví  Nemoc: definice diagnostických znaků (inclusion krítéria), exclusion kritéria k vyloučení zdrojů statistických bias  Smrt  Nemocnost a úmrtnost  Celková  Specifická nejčastěji podle příčiny nebo podle věku Požadavky na vstupní údaje  Validita  Popisuje studovaný znak situaci, kterou hodláme studovat?  Lze z frekvence konzumace potravin usuzovat na zdravotní stav?  Lze na základě výsledků laboratorního vyšetření definovat případ (inclusion kritérium)?  Srov. Glykemie na lačno vs. CRP  Senzitivita a specificita  Senzitivita: úspěšnost záchytu sledovaného znaku (100 % = žádné falešně negetivní  Specificita: schopnost testu odlišit případy, které znak nemají (100 % = žádné falešně pozitivní) Senzitivita a specificita Má pozitivní výsledek testu Má negativní výsledek testu Je nemocný/-á Skutečně pozitivní (SENZITIVITA) Falešně negativní Je zdravý/-á Falešně pozitivní Skutečně negativní (SPECIFICITA) Ročenka UZIS Incidence a prevalence  Incidence: nově vzniklé případy během studie  Osobočas: počet účastníků studie násobený délkou studie  30 osob během dvouleté kohortové studie je 60 osoboroků, incidence je 10 případů/60 osoboroků, tj. 0,167/osoborok (vyjádření rizika).  Prevalence: existující případy k určitému datu (bodová) nebo období (intervalová). Vyjadřuje se jako proporce v populaci (obv. %).  Nižší o vyléčené nebo zemřelé  Nižší o počty případů, které se vyskytly po stanoveném datu.  Vyšší o případy, které přešly např. do chronicity  Vhodný ukazatel ke získání přehledu a formulaci hypotéz.  Incidence a pravelence se vyjadřují v relativních číslech vztažených k vhodnému základu (1000 osob, 100 tis. osob, v závislosti na frekvenci jevu a velikosti populace). Studovaná populace  Reprezentativní výběr: mající shodné charakteristiky se souborem základním  Charakteristiky věku, pohlaví, ekonomické aktivity  Kritéria  Randomizace (nahodilost)  Stratifikace (rozvrstvení) Návrh (design) studie  Deskriptivní studie (zpravidla univariační)  Analytická studie (zpravidla bivariační)  Průřezová (cross-sectional)  Ekologická  Případů a kontrol (case – control)  Kohortová  Kontrolovaný experiment  Na populační úrovni prakticky nerealizovatelný  Výjimky: jaderná havárie v Černobylu (1986) jako nechtěný „experiment“; velmi dobře popsaná expozice umožňující studovat následky ionizujícího záření na zdraví populaci Měření vztahu dvou (a více) proměnných  Design:  Ekologická studie: obvykle na základě rutinních statistik  Studie případů a kontrol: problematická definice případu; následek je znám, pátráme po expozičních odlišnostech  Kohortová studie: problematický způsob definice kohort, kontrolujeme expozici a pátráme po následku.  Příklad 2X2 TABULKA Zdroje Fe nedostatečné Zdroje Fe dostatečné CELKEM Anemie ANO 205 129 334 Anemie NE 89 86 175 CELKEM 294 215 509 Pozorované a očekávané četnosti Pozorované četnosti Zdroje Fe nedostatečné Zdroje Fe dostatečné CELKEM Anemie ANO 205 129 334 Anemie NE 89 86 175 CELKEM 294 215 509 Očekávané četnosti =CHITEST (Excel) P = 0,02 Zdroje Fe nedostatečné Zdroje Fe dostatečné CELKEM Anemie ANO 193 = 294x334/509 - 12 141 + 12 334 Anemie NE 101 + 12 74 - 12 175 Měření velikosti efektu pomocí ukazatelů velikosti rizika Pozorované četnosti Zdroje Fe nedostatečné Zdroje Fe dostatečné CELKEM Anemie ANO 205 129 334 Anemie NE 89 86 175 CELKEM 294 215 509 Relativní riziko (kohorta) 205/294 = 0,70 125/215 = 0,60 RR = 0,70/0,60 = 1,17 1,17-krát nebo o 17 % více Poměr šancí (Odds Ratio, případy) 205/89 = 2,30 120/86 = 1,50 OR = 2,30/1,50 = 1,53 O 53 % větší šance. Ekologická studie: Korelace incidence případů anémie v různých územích vzhledem k prodeji masa. Obecný formát 2x2 (čtyřpolní) tabulky Exponovaní Nemocní Neexponovaní Nemocní Falešně pozitivní Exponovaní Zdraví Falešně negativní Neexponovaní Zdraví RR nebo OR = 1 … není efekt RR nebo OR > 1 … rizikový faktor RR nebo OR < 1 … ochranný faktor  Úskalí: přenositelnost výsledků  Interní validita epidemiologické studie  Hillova kritéria kauzality (sir Austin Bradford Hill, 1897 – 1991)  Síla asociace: ani slabá asociace nevylučuje kauzalitu, je-li oslabena nerozpoznanými confoundery  Konzistence: avšak nekonzistentnost s jinými epid. studiemi nevylučuje kauzalitu, efekt se může dostavovat jen za zvláštních okolností  Specificitu účinku kauzalita nepředpokládá  Časová posloupnost expozice a následku je podmínkou! Epidemiologie v hodnocení zdravotních rizik  Hillova kritéria kauzality … pokrač.  Biologický gradient: avšak jeho absence kauzalitu nevylučuje Biologická přijatelnost: avšak neschopnost patofyziologického vysvětlení jevu může být jen důsledkem aktuální úrovně vědeckého poznání Koherence: inkompatibilita se "zavedenými" teoriemi nevylučuje kauzalitu • Experimentální důkaz: jeho absence nevylučuje kauzalitu, neboť experimentu mohou bránit též etické důvody • Analogie: její absence může být jen projevem nedostatku vědecké představivosti Epidemiologie v hodnocení zdravotních rizik II. Formální a logická kauzalita. Spotřeba zmrzliny matematicky koreluje s nárůstem kriminality ve městě, ale ve skutečnosti je nárůst krimininality spojen s nástupem turistické sezóny. Bias  Základní typy  Informační: na co se ptát a jak?  Selekční: zdrojem bývá nízká reprezentativnost vzorku  Confounding: spolupůsobící či závadějící faktory Závěr  Základem vědecké práce jsou A. Informace o stavu řešení dané vědecké otázky B. Dostupnost dat pro vlastní vědeckou práci  Data jsou cenná a některá i osobního charakteru. Data je proto třeba chránit před zneužitím a vytěžit z nich maximum nových informací (data mining), které jsou využitelné pro další vědecký výzkum nebo praxi.