Koriťáková, Dušek: Analýza dat pro neurovědy© Institut biostatistiky a analýz Analýza dat pro Neurovědy RNDr. Eva Koriťáková, Ph.D. doc. RNDr. Ladislav Dušek, Dr. Koriťáková, Dušek: Analýza dat pro neurovědy Blok 4 Jak a kdy použít parametrické a neparametrické testy II. 2 Koriťáková, Dušek: Analýza dat pro neurovědy Osnova 1. Analýza rozptylu (ANOVA) 2. Problém násobného testování hypotéz a použití korekčních procedur 3. Kruskalův-Wallisův test 4. Analýza rozptylu jako lineární model 3 Koriťáková, Dušek: Analýza dat pro neurovědy Parametrické a neparametrické testy pro kvantitativní data – přehled 4 Typ srovnání Parametrický test Neparametrický test 1 skupina dat s referenční hodnotou – jednovýběrové testy: Jednovýběrový t-test, jednovýběrový z-test Wilcoxonův test 2 skupiny dat párově – párové testy: Párový t-test Wilcoxonův test, znaménkový test 2 skupiny dat nepárově – dvouvýběrové testy: Dvouvýběrový t-test Mannův-Whitneyův test, mediánový test Více skupin nepárově: ANOVA Kruskalův- Wallisův test Koriťáková, Dušek: Analýza dat pro neurovědy 1. Analýza rozptylu (ANOVA) 5 Koriťáková, Dušek: Analýza dat pro neurovědy Motivace Jak můžeme ověřit, zda se liší objem hipokampu u pacientů s AD, pacientů s MCI a u zdravých kontrol? A. Můžeme použít vhodný test pro dva výběry (např. dvouvýběrový t-test) a otestovat, jak se liší AD od MCI, AD od CN a MCI od CN – tedy provést 3 testy. B. Můžeme použít vhodný test pro více než dvě srovnávané skupiny. V čem je zásadní rozdíl mezi A a B? 6 Objemhipokampu(mm3) AD MCI CN Koriťáková, Dušek: Analýza dat pro neurovědy Motivace – pokračování • Problém s možností A je v násobném testování hypotéz: ‖ S narůstajícím počtem testovaných hypotéz nám roste také pravděpodobnost získání falešně pozitivního výsledku, tedy pravděpodobnost toho, že se při našem testování zmýlíme a ukážeme na statisticky významný rozdíl tam, kde ve skutečnosti žádný neexistuje (chyba I. druhu). • Máme tři testy, v každém 95% pravděpodobnost, že neuděláme chybu I. druhu. • Pro všechny tři testy to tedy znamená: 0,95 × 0,95 × 0,95 = 0,857. • Pravděpodobnost, že neuděláme chybu I. druhu nám celkově klesla na 0,857. • Pravděpodobnost, že uděláme chybu I. druhu nám celkově stoupla na 0,143. 7 Koriťáková, Dušek: Analýza dat pro neurovědy Motivace – pokračování • Lepší volbou je: B. Použít vhodný test pro více než dvě srovnávané skupiny. • Analýza rozptylu (ANOVA = „ANalysis Of VAriance“) je statistickou metodou, která umožňuje testovat rozdíl v průměrech více než dvou skupin. Přitom se jedná o jeden test. 8 Koriťáková, Dušek: Analýza dat pro neurovědy Analýza rozptylu (ANOVA) jednoduchého třídění • Srovnáváme tři a více skupin dat, které jsou na sobě nezávislé (mezi objekty neexistuje vazba). • Příklady: srovnání objemu hipokampu u pacientů s AD, pacientů s MCI a kontrol; srovnání kognitivního výkonu podle čtyř kategorií věku. • Předpoklady: normalita dat ve VŠECH skupinách, shodnost (homogenita) rozptylů VŠECH srovnávaných skupin, nezávislost jednotlivých pozorování. • Testová statistika: - vysvětlení na dalších slidech 9 ҧ𝑥1 ҧ𝑥2 ҧ𝑥3 0 1 2 3 AD MCI Kontroly ee AA dfS dfS F / /  Koriťáková, Dušek: Analýza dat pro neurovědy • Srovnání variability (rozptylu) mezi výběry s variabilitou uvnitř výběrů. • Tabulka analýzy rozptylu jednoduchého třídění (One-Way ANOVA): Analýza rozptylu (ANOVA) – princip 10 Variabilita Součet čtverců Počet stupňů volnosti Průměrný čtverec F statistika p-hodnota Mezi skupinami SA dfA = k – 1 MSA = SA/dfA p Uvnitř skupin (reziduální var.) Se dfe = n – k MSe = Se/dfe Celkem ST dfT = n – 1 ee AA dfS dfS F / /  celkový průměr AD MCI CN AD MCI CN Koriťáková, Dušek: Analýza dat pro neurovědy ANOVA – 2 ukázkové situace • Rozdíl ve všech třech skupinách: • Žádný rozdíl mezi skupinami: 11 AD MCI CN AD MCI CN celkový průměr AD MCI CN celkový průměr AD MCI CN Koriťáková, Dušek: Analýza dat pro neurovědy Analýza rozptylu (ANOVA) jednoduchého třídění • Příklad: Chceme srovnat, zda se liší objem hipokampu podle typu onemocnění (tzn. u pacientů s AD, pacientů s MCI a zdravých kontrol). • Tzn. hypotézy budou mít tvar: • Postup: 1. Popisná sumarizace objemu hipokampu podle typu onemocnění. 2. Ověření normality hodnot ve VŠECH skupinách. 3. Ověření shodnosti rozptylů VŠECH skupin. 4. Aplikujeme statistický test. 5. Nulovou hypotézu zamítneme nebo nezamítneme: p<0,001 < 0,05 → zamítáme nulovou hypotézu → Rozdíl v objemu hipokampu podle typu onemocnění je statisticky významný (na hladině významnosti α=0,05.) 12 CNMCIADH  :0 ostatníchododlišnéjejednonejméně: i1 H Koriťáková, Dušek: Analýza dat pro neurovědy Ověření normality dat • Graficky: – histogram – krabicový graf (box-plot) – Q-Q graf • Testy normality: – Shapirův-Wilkův test – Kolmogorovův-Smirnovův test • Testy nejsou vždy nejlepším nástrojem! Vždy je důležité se podívat i očima! • Pokud o sledované veličině prokazatelně víme, že v cílové populaci nabývá normální rozdělení (např. výška lidské postavy), ale v daném souboru normální rozdělení nepotvrdíme, pak s naším náhodným výběrem není něco v pořádku – např. není reprezentativní. 13 Koriťáková, Dušek: Analýza dat pro neurovědy Ověření normality graficky – krabicový graf a histogram • Normální rozdělení • Log-normální rozdělení 14 Koriťáková, Dušek: Analýza dat pro neurovědy Ověření normality graficky – krabicový graf a histogram • Normální rozdělení s odlehlými hodnotami • Rovnoměrně spojité rozdělení 15 Koriťáková, Dušek: Analýza dat pro neurovědy Ověření normality graficky – Q-Q graf • Q-Q graf proti sobě zobrazuje kvantily pozorovaných hodnot a kvantily teoretického rozdělení pravděpodobnosti (zde normálního rozdělení). • V případě shody leží všechny body na přímce. • Normální rozdělení: 16 Koriťáková, Dušek: Analýza dat pro neurovědy Ověření normality graficky – Q-Q graf 17 1. Log-normální rozdělení 2. Normální rozdělení s odlehlými hodnotami 3. Rovnoměrně spojité rozdělení 1. 2. 3. Koriťáková, Dušek: Analýza dat pro neurovědy Ověření normality pomocí testů • Shapirův-Wilkův test – v podstatě se jedná o proložení seřazených hodnot regresní přímkou vzhledem k očekávaným hodnotám normálního rozdělení. Má tedy přímý vztah k Q-Q plotu – vyhodnocuje, jak moc se Q-Q plot liší od ideální přímky. Doporučován pro menší vzorky, může být „moc“ přísný pro velké vzorky. • Kolmogorovův-Smirnovovův test – založen na srovnání výběrové distribuční funkce s teoretickou distribuční funkcí odpovídající normálnímu rozdělení. K-S test hodnotí maximální vzdálenost mezi těmito dvěma distribučními funkcemi. V praxi se používá korekce dle Lillieforse. 18 Koriťáková, Dušek: Analýza dat pro neurovědy Ověření shody (homogenity) rozptylů • Grafické ověření – krabicový graf, histogram. • F-test (testování shody rozptylů dvou vzorků) • Leveneův test – často používaný (testování shody rozptylů dvou a více vzorků) • Bartlettův test 19 Koriťáková, Dušek: Analýza dat pro neurovědy Výsledky ANOVA testu • Tabulka analýzy rozptylu jednoduchého třídění: • Výsledek ze softwaru SPSS: 20 Variabilita Součet čtverců Počet stupňů volnosti Průměrný čtverec F statistika p- hodnota Mezi skupinami SA = 71 422 222 dfA = k – 1 = 2 MSA = SA/dfA = 35 711 111 0,00 Uvnitř skupin (reziduální var.) Se = 26 857 142 dfe = n – k = 830 MSe = Se/dfe = 32 358 Celkem ST = 98 279 364 dfT = n – 1 = 832 6,1103 / /  ee AA dfS dfS F Koriťáková, Dušek: Analýza dat pro neurovědy Další kroky analýzy 21 ANOVA H0 zamítáme (p<0,05) H0 nezamítáme (p>0,05) STOP Provést mnohonásobné porovnávání (post-hoc testy) Koriťáková, Dušek: Analýza dat pro neurovědy 2. Problém násobného testování hypotéz a použití korekčních procedur 22 Koriťáková, Dušek: Analýza dat pro neurovědy Korekce na násobné srovnání výběrů • Zamítneme-li analýzou rozptylu nulovou hypotézu o celkové rovnosti středních hodnot, má smysl se ptát, jaké skupiny se od sebe nejvíce liší. • Toto srovnání lze provést pomocí testů pro dva výběry, ale je nutné korigovat výslednou hladinu významnosti testu, abychom se vyhnuli chybě I. druhu. • Nejjednodušší metoda: Boferroniho korekce - korekce hladiny významnosti: α* = α/m, kde m je počet provedených testů. Ekvivalentně lze vynásobit p-hodnotu počtem provedených testů. Nevýhodou je, že je konzervativní („přísná“) pro velké m, tedy počet provedených testů. • Pro analýzu rozptylu: Tukeyho a Scheffého post hoc testy. • Může se stát, že při použití různých korekcí nám mohou vyjít výsledky různě (např. při použití Scheffého testu nám vyjde statisticky významný rozdíl mezi skupinou AD a MCI a při použití Tukeyho testu nám rozdíl statisticky významný nevyjde). 23 Koriťáková, Dušek: Analýza dat pro neurovědy Poznámka • Může nastat situace, kdy zamítneme H0 u ANOVY, ale metodami mnohonásobného porovnávání nenajdeme významný rozdíl u žádné dvojice středních hodnot. K tomu dochází zvláště tehdy, když p-hodnota pro ANOVU je jen o málo nižší než zvolená hladina významnosti. • Důvod: post-hoc testy (tzn. metody mnohonásobného porovnávání) mají obecně menší sílu než ANOVA, proto nemusí odhalit žádný rozdíl. 24 Koriťáková, Dušek: Analýza dat pro neurovědy Korekce na násobné srovnání – jiná situace • Problém násobného testování („Multiple Testing Problem“) nastává, i když je provedeno větší množství testů na různých proměnných v rámci jednoho hodnocení dat. • Příklad: zjišťování, zda se liší objem šedé hmoty u dvou skupin subjektů v každém voxelu obrazu. • Korekce: – Bonferroniho korekce – kontroluje pravděpodobnost, s jakou dostaneme falešně pozitivní výsledek (kontroluje chybu I. druhu); konzervativní pro velký počet provedených testů. – False discovery rate (FDR) – kontroluje podíl falešně pozitivních výsledků mezi všemi statisticky významnými výsledky (např. pokud je FDR 0,05 a počet všech statisticky významných výsledků bude 1000, tak můžeme očekávat, že 50 výsledků bude falešně pozitivních). 25 Koriťáková, Dušek: Analýza dat pro neurovědy Úkol 1. • Zadání: Zjistěte, zda se liší objem pallida podle typu onemocnění (nezapomeňte ověřit předpoklady). • Řešení: 26 Koriťáková, Dušek: Analýza dat pro neurovědy Parametrické a neparametrické testy pro kvantitativní data – přehled 27 Typ srovnání Parametrický test Neparametrický test 1 skupina dat s referenční hodnotou – jednovýběrové testy: Jednovýběrový t-test, jednovýběrový z-test Wilcoxonův test 2 skupiny dat párově – párové testy: Párový t-test Wilcoxonův test, znaménkový test 2 skupiny dat nepárově – dvouvýběrové testy: Dvouvýběrový t-test Mannův-Whitneyův test, mediánový test Více skupin nepárově: ANOVA Kruskalův- Wallisův test Koriťáková, Dušek: Analýza dat pro neurovědy 3. Kruskalův-Wallisův test 28 Koriťáková, Dušek: Analýza dat pro neurovědy Co dělat, když nejsou splněny předpoklady u ANOVy? 1. Zkusit data transformovat – např. logaritmická transformace by měla pomoci s normalizací rozdělení a stabilizací rozptylu u log-normálních dat. 2. Použít neparametrické testy – např. Kruskalův-Wallisův test nevyžaduje předpoklad normality, pracuje stejně jako neparametrický MannůvWhitneyův test. 29 Koriťáková, Dušek: Analýza dat pro neurovědy Kruskalův-Wallisův test • Neparametrická alternativa analýzy rozptylu (ANOVy). • Testuje se, zda jsou srovnatelné distribuční funkce (obdobně jako u Mannova-Whitneyova testu). • Hypotézy mají tvar: • Princip Kruskalova-Wallisova testu (podobný jako u Mannova-Whitneyova testu): 1. Všechny hodnoty ze všech výběrů dohromady uspořádáme vzestupně podle velikosti → každé hodnotě přiřadíme pořadí. 2. Spočítáme součet pořadí hodnot u každého výběru. 3. Na základě těchto dvou součtů vypočteme testovou statistiku. • Tzn. za platnosti nulové hypotézy jsou spojená data dobře promíchaná a průměrná pořadí v jednotlivých souborech jsou podobná. • Odlehlé hodnoty nejsou problém, protože pracujeme s pořadími. 30 )(...)()(: 210 xFxFxFH k ostatníchododlišnájeFjednanejméně: i1H Koriťáková, Dušek: Analýza dat pro neurovědy Kruskalův-Wallisův test • Příklad: Chceme srovnat, zda se liší MMSE skóre podle typu onemocnění. • Tzn. hypotézy budou mít tvar: • Postup: 1. Popisná sumarizace MMSE skóre podle typu onemocnění. 2. Vykreslení histogramů MMSE skóre pro jednotlivé skupiny subjektů, abychom viděli, že není splněn předpoklad normálního rozdělení → proto použijeme neparametrický test. 3. Aplikujeme statistický test. 4. Nulovou hypotézu zamítneme nebo nezamítneme: p<0,001 < 0,05 → zamítáme nulovou hypotézu → MMSE skóre je u pacientů s AD, MCI a u kontrol statisticky významně odlišné. 31 )()()(:0 xFxFxFH CNMCIAD  ostatníchododlišnájeFjednanejméně: i1H 5. Post hoc test: → rozdíl je mezi všemi skupinami Koriťáková, Dušek: Analýza dat pro neurovědy Úkol 2. • Zadání: Zjistěte, zda se liší objem šesti mozkových struktur podle typu onemocnění (rozmyslete si, jaký test (či testy) byste použili). 32 Koriťáková, Dušek: Analýza dat pro neurovědy Výsledky srovnání objemů mozkových podle typu onemocnění 33 Hipokampus (p < 0,001*) * Statisticky významný rozdíl: ADxMCI, ADxCN, MCIxCN Objem(mm3)Objem(mm3) Amygdala (p < 0,001*) * Statisticky významný rozdíl: ADxCN, MCIxCN Thalamus (p = 0,214) Pallidum (p = 0,078) Putamen (p < 0,001*) * Statisticky významný rozdíl: ADxMCI, ADxCN, MCIxCN Nucl. caudatus (p = 0,064) Koriťáková, Dušek: Analýza dat pro neurovědy Výsledky srovnání objemů mozkových podle typu onemocnění – jiný způsob vyznačení lišících se skupin 34 Hipokampus (p < 0,001) Objem(mm3)Objem(mm3) Amygdala (p < 0,001) Thalamus (p = 0,214) Pallidum (p = 0,078) Putamen (p < 0,001) * * * * * * * * Nucl. caudatus (p = 0,064) Koriťáková, Dušek: Analýza dat pro neurovědy Úkol 3. • Zadání: Zjistěte, zda se liší váha podle typu onemocnění. Pokud nejsou splněny předpoklady, zkuste váhu logaritmovat. Proveďte i popisnou sumarizaci váhy podle typu onemocnění včetně výpočtu intervalů spolehlivosti. 35 Koriťáková, Dušek: Analýza dat pro neurovědy Úkol 3. – řešení 36 1. Provedeme popisnou sumarizaci: 2. Ověření předpokladů (ověření normality je nutné i proto, abychom byli schopni říci, zda můžeme vypočítat intervaly spolehlivosti): CN MCI AD Koriťáková, Dušek: Analýza dat pro neurovědy Úkol 3. – řešení 37 3. Protože data nemají normální rozdělení, zkusíme provést logaritmickou transformaci: Insert → Add Variables → Name: weight_log → Long name: =Log(Weight) nebo =Log10(Weight) 4. Ověření normality logaritmicky transformovaných dat: Podle SW-W testu sice u MCI není splněn předpoklad normality, víme ale, že pro velká N je tento test až příliš přísný; podle histogramu však mají data normální rozdělení. 5. Ověření homogenity rozptylu u logaritmicky transformovaných dat: → ANOVA Koriťáková, Dušek: Analýza dat pro neurovědy Úkol 3. – řešení 38 6. Protože byly splněny předpoklady, použijeme ANOVu pro zjištění, zda jsou mezi skupinami statisticky významné rozdíly ve váze (musíme použít logarimovanou váhu!): 7. Mezi skupinami je statisticky významný rozdíl → musíme zjistit, mezi kterými skupinami ten rozdíl ve skutečnosti je: Statisticky významné rozdíly u ADxMCI, ADxCN. Tzn. pacienti s AD mají statisticky významně nižší váhu než pacienti s MCI a zdravé kontroly. Koriťáková, Dušek: Analýza dat pro neurovědy Úkol 3. – řešení 39 8. Pokud chceme u popisné statistiky vypočítat intervaly spolehlivosti, nemůžeme je počítat na původních datech, protože neměla normální rozdělení, ale na datech po logaritmické transformaci: 9. Nyní bychom ale potřebovali transformovat tyto vypočtené hodnoty do původního měřítka, aby se nám výsledky lépe interpretovaly: N Geometrický průměr Dolní mez IS Horní mez IS Medián Minimum Maximum CN 230 76,9 75,3 78,5 76,0 52,0 135,0 MCI 406 75,4 74,1 76,7 75,5 52,0 140,0 AD 197 70,3 68,6 71,9 70,0 44,0 106,0 Zkopírujeme tabulku do Excelu a provedeme exponenciální transformaci (pokud jsme v SPSS použili funkci Log, použijeme v Excelu =EXP(buňka); pokud Log10, použijeme v Excelu =10^buňka) Poznámka: po exponenciální transformaci průměru vypočteného na logaritmované váze dostáváme geometrický průměr) Koriťáková, Dušek: Analýza dat pro neurovědy Úkol 3. – srovnání popisné sumarizace 40 Popisná sumarizace původních hodnot váhy (sloupeček Weight): N Geometrický průměr Dolní mez IS Horní mez IS Medián Minimum Maximum CN 230 76,9 75,3 78,5 76,0 52,0 135,0 MCI 406 75,4 74,1 76,7 75,5 52,0 140,0 AD 197 70,3 68,6 71,9 70,0 44,0 106,0 Popisná sumarizace hodnot zlogaritmované váhy po exponenciální transformaci: f(y) y f(x) ln (y) x = ln(y) MediánPrůměr Medián Průměr Geom. průměr ( ) IS ( ) IS ( ) IS Je patrné, že medián, minimum i maximum jsou stejné. Avšak průměr a intervaly spolehlivosti vypočtené na původních datech jsou vyšší (tzn. nereprezentují dobře střed dat a jeho spolehlivost)! y = exp(x) Koriťáková, Dušek: Analýza dat pro neurovědy 4. Analýza rozptylu jako lineární model 41 Koriťáková, Dušek: Analýza dat pro neurovědy Analýza rozptylu jako lineární model • Analýza rozptylu pro jednu vysvětlující proměnnou (jednoduché třídění) lze zapsat jako lineární model: • Nulovou hypotézu pak lze vyjádřit jako: • Rozšířením tohoto zápisu můžeme definovat další modely ANOVA: více faktorů, hodnocení interakcí, opakovaná měření na jednom subjektu. 42 kH   210 : Koriťáková, Dušek: Analýza dat pro neurovědy Analýza rozptylu dvojného třídění • Uvažujeme dvě vysvětlující proměnné zároveň. • Zápis modelu: • Nulové hypotézy pak máme dvě: , 43 kH   2101 : rH   2102 : Variabilita Součet čtverců Počet stupňů volnosti Průměrný čtverec F statistika p-hodnota Faktor A SA dfA = k – 1 MSA = SA / dfA FA p Faktor B SB dfA = r – 1 MSB = SB / dfB FB p Rezidua Se dfe = (k – 1)(r – 1) MSe= Se / dfe Celkem ST dfT = n – 1 = kr – 1 Koriťáková, Dušek: Analýza dat pro neurovědy Analýza rozptylu dvojného třídění s interakcí • Uvažujeme dvě vysvětlující proměnné a zároveň i jejich společné působení. • Zápis modelu: • Nulové hypotézy pak máme tři: 44 kH   2102 :krH   121101 : Variabilita Součet čtverců Počet stupňů volnosti Průměrný čtverec F statistika p-hodnota Faktor A SA dfA = k – 1 MSA = SA / dfA FA p Faktor B SB dfA = r – 1 MSB = SB / dfB FB p Interakce A×B SAB dfAB = (k – 1)(r – 1) MSAB = SAB / dfAB FAB p Rezidua Se dfe = n – kr MSe= Se / dfe Celkem ST dfT = n – 1 rH   2103 : Koriťáková, Dušek: Analýza dat pro neurovědy Poděkování… Příprava výukových materiálů předmětu „DSAN01 Analýza dat pro Neurovědy “ byla finančně podporována prostředky projektu FRVŠ č. 942/2013 „Inovace materiálů pro interaktivní výuku a samostudium předmětu Analýza dat pro Neurovědy“