Janoušová, Dušek: Analýza dat pro neurovědy© Institut biostatistiky a analýz Analýza dat pro Neurovědy RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2014 Janoušová, Dušek: Analýza dat pro neurovědy Blok 3 Jak a kdy použít parametrické a neparametrické testy I. 2 Janoušová, Dušek: Analýza dat pro neurovědy Osnova 1. Dvouvýběrové testy 2. F-test 3. Neparametrické testy 3 Janoušová, Dušek: Analýza dat pro neurovědy Parametrické a neparametrické testy pro kvantitativní data – přehled 4 Typ srovnání Parametrický test Neparametrický test 1 skupina dat s referenční hodnotou – jednovýběrové testy: Jednovýběrový t-test, jednovýběrový z-test Wilcoxonův test 2 skupiny dat párově – párové testy: Párový t-test Wilcoxonův test, znaménkový test 2 skupiny dat nepárově – dvouvýběrové testy: Dvouvýběrový t-test Mannův-Whitneyův test, mediánový test Více skupin nepárově: ANOVA Kruskalův- Wallisův test Janoušová, Dušek: Analýza dat pro neurovědy 1. Dvouvýběrové testy 5 Janoušová, Dušek: Analýza dat pro neurovědy Dvouvýběrové („Two-Sample“) testy • Srovnávají navzájem dva nezávislé vzorky („two samples“). • V testu jsou srovnávány dvě rozložení hodnot. • Otázka položená v testu může být opět vztažena k průměru, rozptylu, podílu hodnot i dalším statistickým parametrům popisujícím vzorek. • Parametrické dvouvýběrové testy, kterým se budeme věnovat: – dvouvýběrový t-test (test o rozdílu průměrů dvou nezávislých vzorků) – F-test (test o shodnosti rozptylů dvou nezávislých vzorků) 6 Janoušová, Dušek: Analýza dat pro neurovědy Dvouvýběrový t-test • Srovnáváme dvě skupiny dat, které jsou na sobě nezávislé – mezi objekty neexistuje vazba. • Příklady: srovnání objem hipokampu u mužů a u žen, srovnání kognitivního výkonu podle dvou kategorií věku. • Předpoklad: normalita dat v OBOU skupinách, shodnost (homogenita) rozptylů v obou skupinách • Testová statistika: , kde 𝑠∗ je vážená směrodatná odchylka, c je konstanta, o kterou se rozdíl průměrů má lišit (většinou rovna 0) 7 𝑥̅1 𝑥̅2 21 11 * 21 nns cxx T + -- = 0 1 2 3 Pacienti Kontroly Janoušová, Dušek: Analýza dat pro neurovědy Ověření normality dat • Graficky: – histogram – krabicový graf (box-plot) – Q-Q graf • Testy normality: – Shapirův-Wilkův test – Kolmogorovův-Smirnovův test • Testy nejsou vždy nejlepším nástrojem! Vždy je důležité se podívat i očima! • Pokud o sledované veličině prokazatelně víme, že v cílové populaci nabývá normální rozdělení (např. výška lidské postavy), ale v daném souboru normální rozdělení nepotvrdíme, pak s naším náhodným výběrem není něco v pořádku – např. není reprezentativní. 8 Janoušová, Dušek: Analýza dat pro neurovědy Ověření normality graficky – krabicový graf a histogram • Normální rozdělení • Log-normální rozdělení 9 Janoušová, Dušek: Analýza dat pro neurovědy Ověření normality graficky – krabicový graf a histogram • Normální rozdělení s odlehlými hodnotami • Rovnoměrně spojité rozdělení 10 Janoušová, Dušek: Analýza dat pro neurovědy Ověření normality graficky – Q-Q graf • Q-Q graf proti sobě zobrazuje kvantily pozorovaných hodnot a kvantily teoretického rozdělení pravděpodobnosti (zde normálního rozdělení). • V případě shody leží všechny body na přímce. • Normální rozdělení: 11 Janoušová, Dušek: Analýza dat pro neurovědy Ověření normality graficky – Q-Q graf 12 1. Log-normální rozdělení 2. Normální rozdělení s odlehlými hodnotami 3. Rovnoměrně spojité rozdělení 1. 2. 3. Janoušová, Dušek: Analýza dat pro neurovědy Ověření normality pomocí testů • Shapirův-Wilkův test – v podstatě se jedná o proložení seřazených hodnot regresní přímkou vzhledem k očekávaným hodnotám normálního rozdělení. Má tedy přímý vztah k Q-Q plotu – vyhodnocuje, jak moc se Q-Q plot liší od ideální přímky. Doporučován pro menší vzorky, může být „moc“ přísný pro velké vzorky. • Kolmogorovův-Smirnovovův test – založen na srovnání výběrové distribuční funkce s teoretickou distribuční funkcí odpovídající normálnímu rozdělení. K-S test hodnotí maximální vzdálenost mezi těmito dvěma distribučními funkcemi. V praxi se používá korekce dle Lillieforse. 13 Janoušová, Dušek: Analýza dat pro neurovědy Ověření shody (homogenity) rozptylů • Grafické ověření – krabicový graf, histogram. • F-test (testování shody rozptylů dvou vzorků) • Leveneův test – často používaný (testování shody rozptylů dvou a více vzorků) • Bartlettův test 14 Janoušová, Dušek: Analýza dat pro neurovědy Dvouvýběrový t-test • Příklad: Chceme srovnat, zda se liší objem putamenu podle pohlaví. • Tzn. hypotézy budou mít tvar: a • Postup: 1. Popisná sumarizace objemu putamenu podle pohlaví. 2. Ověření normality hodnot v OBOU skupinách pomocí histogramu (tzn. vykreslíme histogram zvlášť pro muže a zvlášť pro ženy). 3. Ověření shodnosti rozptylů – vizuálně pomocí krabicových grafů. 4. Aplikujeme statistický test (v softwaru STATISTICA: t-test, independent, by groups). 5. Nulovou hypotézu zamítneme nebo nezamítneme: p=0,097 > 0,05 → nezamítáme nulovou hypotézu → Neprokázali jsme rozdíl objemu putamenu podle pohlaví (na hladině významnosti α=0,05.) 15 0: 210 =- xxH 0: 211 ¹- xxH Janoušová, Dušek: Analýza dat pro neurovědy Úkol 3. • Zadání: Zjistěte, zda se liší objem thalamu podle pohlaví (nezapomeňte ověřit předpoklady). • Řešení: 16 Janoušová, Dušek: Analýza dat pro neurovědy 2. F-test 17 Janoušová, Dušek: Analýza dat pro neurovědy F-test • Srovnáváme rozptyly (variabilitu) dvou skupin dat, které jsou na sobě nezávislé (mezi objekty neexistuje vazba). • F-test patří mezi dvouvýběrové parametrické testy. • Příklady: srovnání variability objemu hipokampu u pacientů s AD a kontrol. • Použití: ověření předpokladu shodnosti (homogenity) rozptylů u dvouvýběrového t-testu. • Předpoklad: normalita dat v OBOU skupinách. • Testová statistika: , kde s1 2 je rozptyl prvního výběru a s2 2 je rozptyl druhého výběru 18 0 1 2 3 Pacienti Kontroly 2 2 2 1 s s F = Janoušová, Dušek: Analýza dat pro neurovědy F-test • Příklad: Chceme srovnat, zda se liší variabilita objemu thalamu podle pohlaví. • Tzn. hypotézy budou mít tvar: a • Postup: 1. Ověření normality hodnot v OBOU skupinách pomocí histogramu (tzn. vykreslíme histogram zvlášť pro muže a zvlášť pro ženy). 2. Vykreslení krabicových grafů, které nám napoví, zda máme očekávat shodu nebo neshodu rozptylů. 3. Aplikujeme statistický test (F-test je součástí dvouvýběrového t-testu v softwaru STATISTICA (tedy zvolíme t-test, independent, by groups)). 4. Nulovou hypotézu zamítneme nebo nezamítneme: p=0,487 > 0,05 → nezamítáme nulovou hypotézu → Neprokázali jsme rozdíl ve variabilitě objemu thalamu podle pohlaví (na hladině významnosti α=0,05.) 19 22 0 : ZMH ss = 22 1 : ZMH ss ¹ Janoušová, Dušek: Analýza dat pro neurovědy 3. Neparametrické testy 20 Janoušová, Dušek: Analýza dat pro neurovědy Parametrické a neparametrické testy pro kvantitativní data – přehled 21 Typ srovnání Parametrický test Neparametrický test 1 skupina dat s referenční hodnotou – jednovýběrové testy: Jednovýběrový t-test, jednovýběrový z-test Wilcoxonův test 2 skupiny dat párově – párové testy: Párový t-test Wilcoxonův test, znaménkový test 2 skupiny dat nepárově – dvouvýběrové testy: Dvouvýběrový t-test Mannův-Whitneyův test, mediánový test Více skupin nepárově: ANOVA Kruskalův- Wallisův test Janoušová, Dušek: Analýza dat pro neurovědy Neparametrické testy • Nemají předpoklady o rozdělení vstupních dat, je tedy možné je použít při asymetrickém rozdělení nebo odlehlých hodnotách. • Používání neparametrických testů je „bezpečnější“. • Mají však menší sílu, protože dochází k redukci informační hodnoty původních dat z důvodu, že neparametrické testy nevyužívají původní hodnoty, ale nejčastěji pouze jejich pořadí („rank“). • Menší sílu testu je možné vykompenzovat větší velikostí vzorku. • Neparametrické testy: – Wilcoxonův test – jednovýběrový i párový test – Znaménkový test – párový test – Mannův-Whitneyův test – dvouvýběrový test – Mediánový test – dvouvýběrový test 22 Janoušová, Dušek: Analýza dat pro neurovědy Wilcoxonův test • Neparametrická alternativa jednovýběrového i párového t-testu a z-testu. • Je testem o mediánu – hypotézy mají tvar: a • Princip Wilcoxonova testu: 1. Spočítáme diference všech hodnot x1, x2, … , xn od c. 2. Podíváme se, jestli je zhruba ½ diferencí kladných a ½ záporných. (To je ekvivalentní s tím, že zhruba polovina hodnot x1, x2, … , xn je menších než c a polovina hodnot x1, x2, … , xn je větších než c). • Je zřejmé, že odlehlé hodnoty nebudou v tomto testu problém, protože nehodnotíme velikost diferencí, ale pouze, zda je zhruba ½ z nich kladných a ½ záporných. 23 cxH =~:0 cxH ¹~:1 Janoušová, Dušek: Analýza dat pro neurovědy Wilcoxonův test jako párový test • Příklad: Chceme srovnat, zda se liší MMSE skóre u pacientů s MCI při vstupu do studie a 2 roky po zahájení studie. • Tzn. hypotézy budou mít tvar: a • Postup: 1. Ověření existence vazby mezi oběma skupinami dat pomocí tečkového grafu. 2. Vykreslení histogramu nové proměnné s rozdíly MMSE skóre, abychom viděli, že u rozdílů není splněn předpoklad normálního rozdělení → proto použijeme neparametrický test. 3. Aplikujeme statistický test. 4. Nulovou hypotézu zamítneme nebo nezamítneme: p<0,001 < 0,05 → zamítáme nulovou hypotézu → Rozdíl MMSE skóre u pacientů s MCI při vstupu do studie a 2 roky po zahájení studie je statisticky významný. 24 0 ~ :0 =dH 0 ~ :1 ¹dH Janoušová, Dušek: Analýza dat pro neurovědy Wilcoxonův test jako jednovýběrový test • Příklad: Chceme zjistit, zda se hodnoty MMSE skóre u 197 pacientů s Alzheimerovou chorobou v našem souboru liší od populačního mediánu 27,5. • Tzn. hypotézy budou mít tvar: a • Postup: 1. Vykreslíme histogram a spočítáme popisnou statistiku, abychom viděli, že u MMSE skóre u pacientů s AD není splněn předpoklad normálního rozdělení → proto použijeme neparametrický test. 2. Aplikujeme statistický test (Software STATISTICA neumožňuje počítat jednovýběrový Wilcoxonův test přímo. Lze to však obejít vytvořením nové proměnné, která ve všech řádcích bude mít hodnotu 27,5, a použitím párového Wilcoxonova testu). 3. Nulovou hypotézu zamítneme nebo nezamítneme: p<0,001 < 0,05 → zamítáme nulovou hypotézu → Medián MMSE skóre u pacientů s AD v našem souboru se statisticky významně liší od populačního mediánu. 25 5,27~:0 =xH 5,27~:1 ¹xH Janoušová, Dušek: Analýza dat pro neurovědy Úkol 4. • Zadání: Zjistěte, zda se liší váha u mužů v našem souboru od populačního mediánu 75 kg. • Řešení: 26 Janoušová, Dušek: Analýza dat pro neurovědy Mannův-Whitneyův (U) test • Někdy nazýván jako dvouvýběrový Wilcoxonův test. • Neparametrická alternativa dvouvýběrového t-testu. • Testuje se, zda jsou srovnatelné distribuční funkce (tzn. zda mediány obou výběrů jsou srovnatelné). • Hypotézy mají tvar: a • Princip Mannova-Whitneyova testu: 1. Všechny hodnoty z obou výběrů dohromady (tedy n1+n2 hodnot) uspořádáme vzestupně podle velikosti → každé hodnotě přiřadíme pořadí. 2. Spočítáme součet pořadí hodnot prvního výběru a součet pořadí hodnot druhého výběru. 3. Na základě těchto dvou součtů vypočteme testové statistiky. • Je zřejmé, že odlehlé hodnoty nebudou v tomto testu problém, protože pracujeme s pořadími namísto původních hodnot. 27 )()(:0 yFxFH = )()(:1 yFxFH ¹ Janoušová, Dušek: Analýza dat pro neurovědy Mannův-Whitneyův (U) test • Příklad: Chceme srovnat, zda se liší objem hipokampu podle pohlaví. • Tzn. hypotézy budou mít tvar: a • Postup: 1. Popisná sumarizace objemu hipokampu podle pohlaví. 2. Vykreslení histogramů objemu hipokampu u mužů a u žen, abychom viděli, že není splněn předpoklad normálního rozdělení → proto použijeme neparametrický test. 3. Aplikujeme statistický test. 4. Nulovou hypotézu zamítneme nebo nezamítneme: p<0,001 < 0,05 → zamítáme nulovou hypotézu → Objem hipokampu je u mužů a u žen statisticky významně odlišný. 28 )()(:0 yFxFH = )()(:1 yFxFH ¹ Janoušová, Dušek: Analýza dat pro neurovědy Úkol 5. • Zadání: Zjistěte, zda se liší MMSE skóre u kontrolních subjektů a pacientů s AD. • Řešení: 29 Janoušová, Dušek: Analýza dat pro neurovědy Poznámka 1 • Všechny dosud uvedené testy se zabývají hodnocením spojitých náhodných veličin (mohou nabývat jakýchkoliv hodnot v určitém rozmezí). • Příklady: výška, váha, vzdálenost, čas, teplota. • Uvedené testy lze ale použít i pro hodnocení diskrétních náhodných veličin – ale musí to být odůvodnitelné (např. velký počet možných hodnot). • Příklady: počet krevních buněk, počet hospitalizací, počet krvácivých epizod za rok. 30 Janoušová, Dušek: Analýza dat pro neurovědy Poznámka 2 • Parametrické a neparametrické testy nemusí vycházet stejně. Důvody: 1. Nesplněné předpoklady parametrického testu. 2. Malá síla neparametrického testu. • Jsou-li však splněny předpoklady parametrického testu a je-li dostatek dat, bude to vycházet stejně. • Měli bychom preferovat parametrické testy, ALE pouze po důkladném ověření jejich předpokladů! 31 Janoušová, Dušek: Analýza dat pro neurovědy Úkol 6. • Zadání: Chceme ověřit, zda se liší objem jednotlivých mozkových struktur podle pohlaví. Vykreslete histogramy a rozmyslete si, jaký test (jaké testy) byste použili. 32 Janoušová, Dušek: Analýza dat pro neurovědy Poděkování… Příprava výukových materiálů předmětu „DSAN01 Analýza dat pro Neurovědy “ byla finančně podporována prostředky projektu FRVŠ č. 942/2013 „Inovace materiálů pro interaktivní výuku a samostudium předmětu Analýza dat pro Neurovědy“