© Institut biostatistiky a analýz Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2012 Blok 3 Jak a kdy použít parametrické a neparametrické testy II. 2 Parametrické a neparametrické testy pro kvantitativní data – přehled 3 Typ srovnání Parametrický test Neparametrický test 1 skupina dat s referenční hodnotou – jednovýběrové testy: Jednovýběrový t-test, jednovýběrový z-test Wilcoxonův test 2 skupiny dat párově – párové testy: Párový t-test Wilcoxonův test, znaménkový test 2 skupiny dat nepárově – dvouvýběrové testy: Dvouvýběrový t-test Mannův-Whitneyův test, mediánový test Více skupin nepárově: ANOVA Kruskalův- Wallisův test Osnova 1. F-test 2. Analýza rozptylu (ANOVA) a její předpoklady 3. Problém násobného testování hypotéz a použití korekčních procedur 4. Kruskalův-Wallisův test 5. Analýza rozptylu jako lineární model 4 1. F-test 5 F-test • Srovnáváme rozptyly (variabilitu) dvou skupin dat, které jsou na sobě nezávislé (mezi objekty neexistuje vazba). • F-test patří mezi dvouvýběrové parametrické testy. • Příklady: srovnání variability objemu hipokampu u pacientů s AD a kontrol. • Použití: ověření předpokladu shodnosti (homogenity) rozptylů u dvouvýběrového t-testu. • Předpoklad: normalita dat v OBOU skupinách. • Testová statistika: , kde s1 2 je rozptyl prvního výběru a s2 2 je rozptyl druhého výběru 6 0 1 2 3 Pacienti Kontroly 2 2 2 1 s s F = F-test • Příklad: Chceme srovnat, zda se liší variabilita objemu putamenu podle pohlaví. • Tzn. hypotézy budou mít tvar: a • Postup: 1. Ověření normality hodnot v OBOU skupinách pomocí histogramu (tzn. vykreslíme histogram zvlášť pro muže a zvlášť pro ženy). 2. Vykreslení krabicových grafů, které nám napoví, zda máme očekávat shodu nebo neshodu rozptylů. 3. Aplikujeme statistický test (F-test je součástí dvouvýběrového t-testu v softwaru STATISTICA (tedy zvolíme t-test, independent, by groups)). 4. Nulovou hypotézu zamítneme nebo nezamítneme: p=0,935 > 0,05 → nezamítáme nulovou hypotézu → Neprokázali jsme rozdíl ve variabilitě objemu putamenu podle pohlaví (na hladině významnosti α=0,05.) 7 22 0 : ZMH ss = 22 1 : ZMH ss ¹ 2. Analýza rozptylu (ANOVA) a její předpoklady 8 Motivace Jak můžeme ověřit, zda se liší objem hipokampu u pacientů s AD, pacientů s MCI a u zdravých kontrol? A. Můžeme použít vhodný test pro dva výběry (např. dvouvýběrový t-test) a otestovat, jak se liší AD od MCI, AD od CN a MCI od CN – tedy provést 3 testy. B. Můžeme použít vhodný test pro více než dvě srovnávané skupiny. V čem je zásadní rozdíl mezi A a B? 9 Objemhipokampu(mm3) AD MCI CN Motivace – pokračování • Problém s možností A je v násobném testování hypotéz: ‖ S narůstajícím počtem testovaných hypotéz nám roste také pravděpodobnost získání falešně pozitivního výsledku, tedy pravděpodobnost toho, že se při našem testování zmýlíme a ukážeme na statisticky významný rozdíl tam, kde ve skutečnosti žádný neexistuje (chyba I. druhu). • Máme tři testy, v každém 95% pravděpodobnost, že neuděláme chybu I. druhu. • Pro všechny tři testy to tedy znamená: 0,95 × 0,95 × 0,95 = 0,857. • Pravděpodobnost, že neuděláme chybu I. druhu nám celkově klesla na 0,857. • Pravděpodobnost, že uděláme chybu I. druhu nám celkově stoupla na 0,143. 10 Motivace – pokračování • Lepší volbou je: B. Použít vhodný test pro více než dvě srovnávané skupiny. • Analýza rozptylu (ANOVA = „ANalysis Of VAriance“) je statistickou metodou, která umožňuje testovat rozdíl v průměrech více než dvou skupin. Přitom se jedná o jeden test. • Více než dvě skupiny mohou být dány přirozeně (např. sledujeme rozdíl mezi věkovými kategoriemi) nebo uměle (např. sledujeme rozdíl v účinnosti několika typů léčby). 11 Analýza rozptylu (ANOVA) jednoduchého třídění • Srovnáváme tři a více skupin dat, které jsou na sobě nezávislé (mezi objekty neexistuje vazba). • Příklady: srovnání objemu hipokampu u pacientů s AD, pacientů s MCI a kontrol, srovnání kognitivního výkonu podle čtyř kategorií věku. • Předpoklady: normalita dat ve VŠECH skupinách, shodnost (homogenita) rozptylů VŠECH srovnávaných skupin, nezávislost jednotlivých pozorování. • Testová statistika: - vysvětlení později 12 𝑥̅1 𝑥̅2 𝑥̅3 0 1 2 3 AD MCI Kontroly ee AA dfS dfS F / / = Analýza rozptylu (ANOVA) jednoduchého třídění • Příklad: Chceme srovnat, zda se liší objem hipokampu podle typu onemocnění (tzn. u pacientů s AD, pacientů s MCI a zdravých kontrol). • Tzn. hypotézy budou mít tvar: • Postup: 1. Popisná sumarizace objemu hipokampu podle typu onemocnění. 2. Ověření normality hodnot ve VŠECH skupinách. 3. Ověření shodnosti rozptylů VŠECH skupin. 4. Aplikujeme statistický test. 5. Nulovou hypotézu zamítneme nebo nezamítneme: p<0,001 < 0,05 → zamítáme nulovou hypotézu → Rozdíl v objemu hipokampu podle typu onemocnění je statisticky významný (na hladině významnosti α=0,05.) 13 CNMCIADH mmm ==:0 ostatníchododlišnéjejednonejméně: i1 mH Ověření normality dat • Graficky: – histogram – krabicový graf (box-plot) – Q-Q graf • Testy normality: – Shapirův-Wilkův test – Kolmorovův-Smirnovův test • Testy nejsou vždy nejlepším nástrojem! Vždy je důležité se podívat i očima! • Pokud o sledované veličině prokazatelně víme, že v cílové populaci nabývá normální rozdělení (např. výška lidské postavy), ale v daném souboru normální rozdělení nepotvrdíme, pak s naším náhodným výběrem není něco v pořádku – např. není reprezentativní. 14 Ověření normality graficky – krabicový graf a histogram • Normální rozdělení • Log-normální rozdělení 15 Ověření normality graficky – krabicový graf a histogram • Normální rozdělení s odlehlými hodnotami • Rovnoměrně spojité rozdělení 16 Ověření normality graficky – Q-Q graf • Q-Q graf proti sobě zobrazuje kvantily pozorovaných hodnot a kvantily teoretického rozdělení pravděpodobnosti (zde normálního rozdělení). • V případě shody leží všechny body na přímce. • Normální rozdělení: 17 Ověření normality graficky – Q-Q graf 18 1. Log-normální rozdělení 2. Normální rozdělení s odlehlými hodnotami 3. Rovnoměrně spojité rozdělení 1. 2. 3. Ověření normality pomocí testů • Shapirův-Wilkův test – v podstatě se jedná o proložení seřazených hodnot regresní přímkou vzhledem k očekávaným hodnotám normálního rozdělení. Má tedy přímý vztah k Q-Q plotu – vyhodnocuje, jak moc se Q-Q plot liší od ideální přímky. Doporučován pro menší vzorky, může být „moc“ přísný pro velké vzorky. • Kolmogorovův-Smirnovovův test – založen na srovnání výběrové distribuční funkce s teoretickou distribuční funkcí odpovídající normálnímu rozdělení. K-S test hodnotí maximální vzdálenost mezi těmito dvěma distribučními funkcemi. V praxi se používá korekce dle Lillieforse. 19 Ověření shody (homogenity) rozptylů • Grafické ověření – krabicový graf, histogram. • Leveneův test – často používaný. • Bartlettův test 20 Analýza rozptylu (ANOVA) – princip • Srovnání variability (rozptylu) mezi výběry s variabilitou uvnitř výběrů. • Tabulka analýzy rozptylu jednoduchého třídění (One-Way ANOVA): 21 Variabilita Součet čtverců Počet stupňů volnosti Průměrný čtverec F statistika p-hodnota Mezi skupinami SA dfA = k – 1 MSA = SA/dfA p Uvnitř skupin (reziduální var.) Se dfe = n – k MSe = Se/dfe Celkem ST dfT = n – 1 ee AA dfS dfS F / / = AD MCI CNAD MCI CN celkový průměr ANOVA – 2 ukázkové situace • Rozdíl ve všech třech skupinách: • Žádný rozdíl mezi skupinami: 22 AD MCI CNAD MCI CN celkový průměr AD MCI CNAD MCI CN celkový průměr Výsledky ANOVA testu • Tabulka analýzy rozptylu jednoduchého třídění: • Výsledek ze softwaru STATISTICA: 23 Variabilita Součet čtverců Počet stupňů volnosti Průměrný čtverec F statistika p- hodnota Mezi skupinami SA = 71 422 222 dfA = k – 1 = 2 MSA = SA/dfA = 35 711 111 0,00 Uvnitř skupin (reziduální var.) Se = 26 857 142 dfe = n – k = 830 MSe = Se/dfe = 32 358 Celkem ST = 98 279 364 dfT = n – 1 = 832 6,1103 / / == ee AA dfS dfS F Analýza rozptylu (ANOVA) jednoduchého třídění • Příklad: Chceme srovnat, zda se liší objem hipokampu podle typu onemocnění (tzn. u pacientů s AD, pacientů s MCI a zdravých kontrol). • Tzn. hypotézy budou mít tvar: • Postup: 1. Popisná sumarizace objemu hipokampu podle typu onemocnění. 2. Ověření normality hodnot ve VŠECH skupinách. 3. Ověření shodnosti rozptylů VŠECH skupin. 4. Aplikujeme statistický test. 5. Nulovou hypotézu zamítneme nebo nezamítneme: p<0,001 < 0,05 → zamítáme nulovou hypotézu → Rozdíl v objemu hipokampu podle typu onemocnění je statisticky významný (na hladině významnosti α=0,05.) 24 CNMCIADH mmm ==:0 ostatníchododlišnéjejednonejméně: i1 mH Další kroky analýzy 25 ANOVA H0 zamítáme H0 nezamítáme STOP Provést mnohonásobné porovnávání 3. Problém násobného testování hypotéz a použití korekčních procedur 26 Korekce na násobné srovnání výběrů • Zamítneme-li analýzou rozptylu nulovou hypotézu o celkové rovnosti středních hodnot, má smysl se ptát, jaké skupiny se od sebe nejvíce liší. • Toto srovnání lze provést pomocí testů pro dva výběry, ale je nutné korigovat výslednou hladinu významnosti testu, abychom se vyhnuli chybě I. druhu. • Nejjednodušší metoda: Boferroniho procedura - korekce hladiny významnosti: α* = α/m, kde m je počet provedených testů. Ekvivalentně lze vynásobit p-hodnotu počtem provedených testů. Nevýhodou je, že je konzervativní pro velké m, tedy počet provedených testů. • Pro analýzu rozptylu: Tukeyho a Scheffého post hoc testy. • Může se stát, že při použití různých korekcí nám mohou vyjít výsledky různě (např. při použití Scheffého testu nám vyjde statisticky významný rozdíl mezi skupinou AD a MCI a při použití Tukeyho testu nám rozdíl statisticky významný nevyjde). 27 Poznámka • Může nastat situace, kdy zamítneme H0 u ANOVY, ale metodami mnohonásobného porovnávání nenajdeme významný rozdíl u žádné dvojice středních hodnot. K tomu dochází zvláště tehdy, když p-hodnota pro ANOVU je jen o málo nižší než zvolená hladina významnosti. • Důvod: post-hoc testy (tzn. metody mnohonásobného porovnávání) mají obecně menší sílu než ANOVA, proto nemusí odhalit žádný rozdíl. 28 Korekce na násobné srovnání – jiná situace • Problém násobného testování („Multiple Testing Problem“) nastává, i když je provedeno větší množství testů na různých proměnných v rámci jednoho hodnocení dat. • Příklad: zjišťování, zda se liší objem šedé hmoty u dvou skupin subjektů v každém voxelu obrazu. • Korekce: – Bonferroniho korekce – kontroluje pravděpodobnost, s jakou dostaneme falešně pozitivní výsledek (kontroluje chybu I. druhu); konzervativní pro velký počet provedených testů. – False discovery rate (FDR) – kontroluje podíl falešně pozitivních výsledků mezi všemi statisticky významnými výsledky (např. pokud je FDR 0,05 a počet všech statisticky významných výsledků bude 1000, tak můžeme očekávat, že 50 výsledků bude falešně pozitivních). 29 Úkol 1. • Zadání: Zjistěte, zda se liší objem pallida podle typu onemocnění (nezapomeňte ověřit předpoklady). • Řešení: 30 4. Kruskalův-Wallisův test 31 Co dělat, když nejsou splněny předpoklady u ANOVy? 1. Zkusit data transformovat – např. logaritmická transformace by měla pomoci s normalizací rozdělení a stabilizací rozptylu u log-normálních dat. 2. Použít neparametrické testy – např. Kruskalův-Wallisův test nevyžaduje předpoklad normality, pracuje stejně jako neparametrický MannůvWhitneyův test. 32 Kruskalův-Wallisův test • Neparametrická alternativa analýzy rozptylu (ANOVy). • Testuje se, zda jsou srovnatelné distribuční funkce (obdobně jako u Mannova-Whitneyova testu). • Hypotézy mají tvar: • Princip Kruskalova-Wallisova testu (podobný jako u Mannova-Whitneyova testu): 1. Všechny hodnoty ze všech výběrů dohromady uspořádáme vzestupně podle velikosti → každé hodnotě přiřadíme pořadí. 2. Spočítáme součet pořadí hodnot u každého výběru. 3. Na základě těchto dvou součtů vypočteme testovou statistiku. • Tzn. za platnosti nulové hypotézy jsou spojená data dobře promíchaná a průměrná pořadí v jednotlivých souborech jsou podobná. • Odlehlé hodnoty nejsou problém, protože pracujeme s pořadími. 33 )(...)()(: 210 xFxFxFH k=== ostatníchododlišnájeFjednanejméně: i1H Kruskalův-Wallisův test • Příklad: Chceme srovnat, zda se liší MMSE skóre podle typu onemocnění. • Tzn. hypotézy budou mít tvar: • Postup: 1. Popisná sumarizace MMSE skóre podle typu onemocnění. 2. Vykreslení histogramů MMSE skóre pro jednotlivé skupiny subjektů, abychom viděli, že není splněn předpoklad normálního rozdělení → proto použijeme neparametrický test. 3. Aplikujeme statistický test. 4. Nulovou hypotézu zamítneme nebo nezamítneme: p<0,001 < 0,05 → zamítáme nulovou hypotézu → MMSE skóre je u pacientů s AD, MCI a u kontrol statisticky významně odlišné. 34 )()()(:0 xFxFxFH CNMCIAD == ostatníchododlišnájeFjednanejméně: i1H Úkol 2. • Zadání: Zjistěte, zda se liší objem pěti mozkových struktur podle typu onemocnění (použijte Kruskalův-Wallisův test). 35 Výsledky srovnání objemů mozkových podle typu onemocnění 36 Hipokampus (p < 0,001*) * Statisticky významný rozdíl: ADxMCI, ADxCN, MCIxCN Objem(mm3)Objem(mm3) Amygdala (p < 0,001*) * Statisticky významný rozdíl: ADxCN, MCIxCN Thalamus (p = 0,214) Pallidum (p = 0,078) Putamen (p < 0,001*) * Statisticky významný rozdíl: ADxMCI, ADxCN, MCIxCN Úkol 3. • Zadání: Zjistěte, zda se liší váha podle typu onemocnění. Pokud nejsou splněny předpoklady, zkuste váhu logaritmovat. Proveďte i popisnou sumarizaci váhy podle typu onemocnění včetně výpočtu intervalů spolehlivosti. • Řešení: p<0,001* *Statisticky významný rozdíl: ADxMCI, ADxCN 37 N Geometrický průměr Dolní mez IS Horní mez IS Medián Minimum Maximum CN 230 76,9 75,3 78,5 76,0 52,0 135,0 MCI 406 75,4 74,1 76,7 75,5 52,0 140,0 AD 197 70,3 68,6 71,9 70,0 44,0 106,0 5. Analýza rozptylu jako lineární model 38 Analýza rozptylu jako lineární model • Analýza rozptylu pro jednu vysvětlující proměnnou (jednoduché třídění) lze zapsat jako lineární model: • Nulovou hypotézu pak lze vyjádřit jako: • Rozšířením tohoto zápisu můžeme definovat další modely ANOVA: více faktorů, hodnocení interakcí, opakovaná měření na jednom subjektu. 39 kH aaa === K210 : Analýza rozptylu dvojného třídění • Uvažujeme dvě vysvětlující proměnné zároveň. • Zápis modelu: • Nulové hypotézy pak máme dvě: , 40 kH aaa === K2101 : rH bbb === K2102 : Variabilita Součet čtverců Počet stupňů volnosti Průměrný čtverec F statistika p-hodnota Faktor A SA dfA = k – 1 MSA = SA / dfA FA p Faktor B SB dfA = r – 1 MSB = SB / dfB FB p Rezidua Se dfe = (k – 1)(r – 1) MSe= Se / dfe Celkem ST dfT = n – 1 = kr – 1 Analýza rozptylu dvojného třídění s interakcí • Uvažujeme dvě vysvětlující proměnné a zároveň i jejich společné působení. • Zápis modelu: • Nulové hypotézy pak máme tři: 41 kH aaa === K2102 :krH ggg === K121101 : Variabilita Součet čtverců Počet stupňů volnosti Průměrný čtverec F statistika p-hodnota Faktor A SA dfA = k – 1 MSA = SA / dfA FA p Faktor B SB dfA = r – 1 MSB = SB / dfB FB p Interakce A×B SAB dfAB = (k – 1)(r – 1) MSAB = SAB / dfAB FAB p Rezidua Se dfe = n – kr MSe= Se / dfe Celkem ST dfT = n – 1 rH bbb === K2103 : Blok 4 Jak analyzovat kategoriální a binární data. 42 Typy dat - opakování • Kvalitativní (kategoriální) data: - Binární data - Nominální data - Ordinální data • Kvantitativní data: - Intervalová data - Poměrová data 43 Osnova 1. Binomické rozdělení 2. Poissonovo rozdělení 44 Motivace • Kromě spojitých dat se setkáváme také s daty kategoriálními, jejichž nejjednodušším případem jsou data binární. • Binární data jsou popsána binomickým rozložením. • Od chování binomického rozložení je odvozena: – popisná statistika binárních dat (procento výskytu jevu) – interval spolehlivosti pro binární data – binomické testy pro srovnání procentuálního výskytů jevů v různých skupinách. 45 Binomické rozdělení Binomické rozdělení • Diskrétní rozdělení, které popisuje počet výskytů sledované události (ve formě nastala/nenastala) v sérii n nezávislých pokusech, kdy v každém pokusu je stejná pravděpodobnost výskytu této události. • Značení: Bi(n,π) • Parametry: ‖ n ... počet nezávislých pokusů ‖ r ... počet, kolikrát nastala sledovaná událost (r = 0...n) ‖ p = r/n ... pravděpodobnost nastání sledované události (p ̴π) • Pravděpodobnost, že sledovaná událost nastane r-krát, lze vypočítat: • Střední hodnota: EX = n · p • Rozptyl: DX = n · p · (1 - p) • Příklady: výskyt nežádoucích účinků léku u léčených pacientů, počet zemřelých pacientů mezi léčenými pacienty, počet pacientů s výsledkem neuropsychologického testu pod normou ( ) ( ) rnrrnr pp rnr n pp r n rXP -- -×× - =-÷÷ ø ö çç è æ == 1 !! ! )1()( Binomické rozdělení – příklad • Př. Pravděpodobnost narození chlapce je 0,5. Jaká je pravděpodobnost toho, že mezi čtyřmi dětmi v rodině je 0, 1,... až 4 chlapců. Vypočítejte i jaký je nejpravděpodobnější počet chlapců v této rodině. • Řešení: n = 4 (4 děti v rodině) r = 0, 1, 2, 3, 4 chlapců ( ) ( ) rnrrnr pp rnr n pp r n rXP -- -×× - =-÷÷ ø ö çç è æ == 1 !! ! )1()( ( ) 0625,05,015,0 4!0! !4 )0( 40 =-××==XP ( ) 2500,05,015,0 3!1! !4 )1( 31 =-××==XP ( ) 3750,05,015,0 2!2! !4 )2( 22 =-××==XP Nejpravděpodobnější počet chlapců – střední hodnota: E(X) = n · p = 4 · 0,5 = 2 2500,0)3( ==XP 0625,0)4( ==XP 0 0,1 0,2 0,3 0,4 0 1 2 3 4 n = 4 p = 0,5 0 0,05 0,1 0,15 0,2 0,25 0,3 0 1 2 3 4 5 6 7 8 9 10 0 0,05 0,1 0,15 0,2 0,25 0,3 0 5 10 15 20 25 30 0 0,05 0,1 0,15 0,2 0,25 0,3 0 10 20 30 40 50 60 70 80 90 100 0 0,02 0,04 0,06 0,08 0,1 0,12 0,14 0,16 0,18 0,2 0 5 10 15 20 25 30 35 40 45 50 0 0,02 0,04 0,06 0,08 0,1 0,12 0 5 10 15 20 25 30 35 40 45 50 0 0,02 0,04 0,06 0,08 0,1 0,12 0,14 0,16 0,18 0,2 0 5 10 15 20 25 30 35 40 45 50 Binomické rozdělení – tvar pro různé n a p • Čím vícekrát opakujeme experiment, tím menší relativní podíl připadá na jednotlivé hodnoty X, neboť všechny dohromady musí dát součet 1 (100%). • Rozdělení s p=0,5 je symetrické kolem středu osy x, menší či větší p posouvá střed rozdělení směrem k limitním hodnotám (tedy hodnotám 0 či n). n = 10 p = 0,3 n = 30 p = 0,3 n = 100 p = 0,3 n = 50 p = 0,1 n = 50 p = 0,5 n = 50 p = 0,9 P(r) P(r) P(r) P(r) P(r) P(r) r r r r r r Binomické rozložení – speciální případy • Pokud n=1, jde o tzv. alternativní rozdělení a daná událost buď nenastane nebo nastane jednou. • Pokud náhodný experiment opakujeme mnohokrát (n je velké), rozdělení se začne podobat spojitému rozdělení → aproximace na normální rozdělení. • Aproximace normálním rozdělením však nebude platit pro velmi nízké a velmi vysoké hodnoty p → u nízkých hodnot p aproximace na Poissonovo rozdělení (pro n > 30 a p < 0,1). 0 0,05 0,1 0,15 0,2 0,25 0,3 0 10 20 30 40 50 60 70 80 90 100 n = 100 p = 0,3 0 0,02 0,04 0,06 0,08 0,1 0,12 0,14 0,16 0,18 0,2 0 5 10 15 20 25 30 35 40 45 50 n = 50 p = 0,09 P(r) r P(r) r Binomické rozdělení - interval spolehlivosti - příklad • Př. Sledování výskytu nežádoucích účinků u n = 100 pacientů se schizofrenií léčených daným přípravkem. Nežádoucí účinky se vyskytly u 60 jedinců. Odhadněte pravděpodobnost výskytu nežádoucích účinků a tento odhad doplňte o 95% interval spolehlivosti. • Vzorečky: • Řešení: • Pravděpodobnost výskytu nežádoucích účinků je 0,6 (0,503; 0,697). n rpp =» ;p (bodový odhad parametru π) ( ) ( ) 1 1 1 1 2 1 2 1 - - ×+££ - ×- -- n pp Zp n pp Zp aa p (interval spolehlivosti pro π) 6,0100/60 ==p ( ) ( ) 1100 6,016,0 96,16,0 1100 6,016,0 96,16,0 - -× ×+££ - -× ×- p 049,096,16,0049,096,16,0 ×+££×- p 697,0503,0 ££ p Binomické rozdělení – interval spolehlivosti • Ovlivnění šířky intervalu spolehlivosti (IS): – hodnotou p – IS bude nejširší pro p = 0,5 – hodnotou n – IS širší při malém n než při velkém – hodnotou α – IS širší pro malé α (hladinu spolehlivosti) – tzn. 99% IS bude širší než 95% IS • Interval spolehlivosti bez aproximace na normální rozdělení (pokud hodnoty p jsou velmi nízké nebo velmi vysoké): ( ) 1 1 2 1 - ×± - n pp Zp a ( ) ( )21; 2 1 nn aFrnr r D ×+-+ = ( ) rrn 2;12 21 =+-= nn ( ) ( ) ( ) ( )21 21 ; 2 ; 2 1 1 nn a nn a ¢¢ ¢¢ ×++- ×+ = Frrn Fr H ( ) ( ) 22 212 12 21 -=-=¢ +=+=¢ nn nn rn r ... kde: Dolní hranice IS: Horní hranice IS: ... kde: Statistické testování binomických dat 1. Liší se odhad p od předpokládané (referenční) hodnoty π? (Např. liší se procento pacientů s nežádoucími účinky léčby od předpokládaného procenta?) → jednovýběrový binomický test (tzn. test pro podíl u jednoho výběru) 2. Liší se p ve dvou souborech? (Např. liší se podíl pacientů s nežádoucími účinky léčby podle typu léčby?) → dvouvýběrový binomický test (tzn. test pro podíl u dvou výběrů) 53 Jednovýběrový binomický test • Příklad: Mezi 50 pacienty s Alzheimerovou chorobou je 12 pacientů s MMSE skóre nižším než daná hranice. Ověřte, zda podíl pacientů s nižším skóre je stejný jako v běžné populaci. • Tzn. hypotézy budou mít tvar: a • Řešení: • π = 0,05 (v populaci – hranice skóre jsou dělána tak, aby 5% populace bylo nižší než hranice) • p = 12/50 = 0,24 • Závěr: Podíl pacientů s nižším MMSE skóre je statisticky významně odlišný od podílu v běžné populaci. p=pH :0 p¹pH :1 Co největší N2 Vypočtená p-hodnota Dvouvýběrový binomický test • Příklad: Mezi 42 pacienty s Alzheimerovou chorobou (AD) je 11 pacientů s MMSE skóre nižším než daná hranice. Mezi 18 pacienty s mírnou kognitivní poruchou (MCI) je 6 pacientů s MMSE skóre nižším než daná hranice. Ověřte, zda se podíly pacientů s nižším skóre u pacientů s AD a MCI liší. • Tzn. hypotézy budou mít tvar: a • Řešení: • p1 = 11/42 = 0,262 • p2 = 6/18 = 0,333 • Závěr: Neprokázali jsme, že by se podíl subjektů s nižším MMSE skóre lišil u pacientů s AD a MCI. 210 : ppH = 211 : ppH ¹ Vypočtená p-hodnota Poissonovo rozdělení Poissonovo rozdělení • Diskrétní rozdělení, které popisuje počet výskytů sledované události na danou jednotku (času, plochy, objemu), když se tyto události vyskytují vzájemně nezávisle s konstantní intenzitou (parametr λ). • Značení: Po(λ) • Jedná se o zobecnění binomického rozdělení pro a ‖ (aproximace je funkční již při n > 30, p < 0,1): ‖ Pravděpodobnost, že sledovaná událost nastane r-krát, lze vypočítat: • Střední hodnota: EX = λ (λ vyjadřuje střední počet jevů na jednu experimentální jednotku) • Rozptyl: DX = λ • Příklady: počet krvinek v poli mikroskopu, počet pooperačních komplikací během určitého časového intervalu po výkonu, počet pacientů, kteří přišli do ordinace během jedné hodiny, počet částic, které vyzáří zářič za danou časovou jednotku ¥®n 0®p ! )( r e rXP r l l - == ( ) ( )pnpn ×® Po,Bi Poissonovo rozdělení – příklady Výskyt jevu na experimentální jednotku (mutace bakterií na inkubačních miskách) Výskyt jevu v prostoru (počet buněk v sčítacím poli preparátu) Orientační stanovení jevu (např. produkce plynu bakteriemi) + + +- Výskyt jevu v čase (vyzáření částice v určitých časových intervalech) čas Poissonovo rozdělení – příklad • Příklad: Předpokládejme, že v určité populaci krys se vyskytuje albín s pravděpodobností π=0,001, ostatní krysy jsou normálně pigmentované. Ve vzorku 100 krys náhodně vybraných z této populace určete pravděpodobnost, že vzorek a) neobsahuje albína, b) obsahuje právě jednoho albína. • Řešení: Pravděpodobnost výskytu albína je π=0,001. Předpokládaný počet albínů ve výběru o rozsahu n je λ=n*π (průměr binomické náhodné veličiny), tj. v našem příkladu λ=n*π=100*0,001=0,1. Počet albínů označme x. Potom: • Jak je vidět, pravděpodobnost, že ve vzorku 100 krys nebude žádný albín, je desetkrát vyšší než pravděpodobnost, že ve vzorku bude právě jeden albín. Pravděpodobnosti výskytu dvou a více albínů jsou již velmi malé. Převzato z Zvárová, J. (2001) Základy statistiky pro biomedicínské obory. Praha: Karolinum. Poissonovo rozdělení – předpoklady • výskyt jevu je zcela náhodný (tedy náhodný v čase nebo prostoru podle typu situace) • výskyt jevu v konkrétní experimentální jednotce nijak nezávisí na tom, co se stalo v jiných jednotkách • není možné, aby 2 nebo více jevů nastaly současně, přesně ve stejném místě prostoru nebo ve stejném časovém okamžiku • pro každý dílčí časový okamžik, prostorou jednotku apod. je pravděpodobnost výskytu stejná ms <2 ms >2 ms =2 Poissonovo rozdělení výskyt uniformní výskyt shlukový výskyt náhodný Poissonovo rozdělení – tvar pro různé λ • Čím větší je λ, tím více se tvar Poissonova rozdělení blíží normálnímu rozdělení. 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 0 1 2 3 4 5 6 7 8 9 10 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 1,1 0 1 2 3 4 5 6 7 8 9 10 l = 0.01 l = 0.1 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0 1 2 3 4 5 6 7 8 9 10 l = 0.5 0 0,02 0,04 0,06 0,08 0,1 0,12 0,14 0,16 0,18 0,2 0 1 2 3 4 5 6 7 8 9 10 0 0,02 0,04 0,06 0,08 0,1 0,12 0,14 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 l = 5 l = 10 0 0,05 0,1 0,15 0,2 0,25 0,3 0,35 0,4 0 1 2 3 4 5 6 7 8 9 10 l = 1 Poissonovo rozdělení – intervaly spolehlivosti - příklad • Př. Za 10 hodin vyzářil zářič 1500 částic. Spočtěte průměrný počet vyzářených částic za hodinu a tento odhad průměrného počtu částic doplňte o 95% interval spolehlivosti. • Vzorečky: • Řešení: • Průměrný počet částic vyzářených za hodinu je 150 (142;158). x»l (bodový odhad parametru λ) n x Zx n x Zx ×+££×- -- 2 1 2 1 aa l (interval spolehlivosti pro λ) 15010/1500 ==x 10 150 96,1150 10 150 96,1150 ×+££×- l 873,396,1150873,396,1150 ×+££×- l 158142 ££ l Poissonovo rozdělení – interval spolehlivosti • Ovlivnění šířky intervalu spolehlivosti (IS): – hodnotou λ – IS širší při velkém λ – hodnotou n – IS širší při malém n než při velkém – hodnotou α – IS širší pro malé α (hladinu spolehlivosti) – tzn. 99% IS bude širší než 95% IS • Interval spolehlivosti bez aproximace na normální rozdělení: n x Zx ×± - 2 1 a ( ) 2 1 2 2 nac =D r21 =n 22212 +=+= rnn ... kde: Dolní hranice IS: Horní hranice IS: ... kde:( ) 2 2 2 21 nac - =H