Janoušová, Dušek: Analýza dat pro neurovědy© Institut biostatistiky a analýz
Analýza dat pro Neurovědy
RNDr. Eva Janoušová
doc. RNDr. Ladislav Dušek, Dr.
Jaro 2014
Janoušová, Dušek: Analýza dat pro neurovědy
Blok 4
Jak a kdy použít parametrické a
neparametrické testy II.
2
Janoušová, Dušek: Analýza dat pro neurovědy
Osnova
1. Analýza rozptylu (ANOVA)
2. Problém násobného testování hypotéz a použití korekčních procedur
3. Kruskalův-Wallisův test
4. Analýza rozptylu jako lineární model
3
Janoušová, Dušek: Analýza dat pro neurovědy
Parametrické a neparametrické testy pro kvantitativní
data – přehled
4
Typ srovnání Parametrický test Neparametrický test
1 skupina dat s referenční
hodnotou
– jednovýběrové testy:
Jednovýběrový t-test,
jednovýběrový z-test
Wilcoxonův test
2 skupiny dat párově
– párové testy:
Párový t-test
Wilcoxonův test,
znaménkový test
2 skupiny dat nepárově
– dvouvýběrové testy:
Dvouvýběrový t-test
Mannův-Whitneyův test,
mediánový test
Více skupin nepárově: ANOVA Kruskalův- Wallisův test
Janoušová, Dušek: Analýza dat pro neurovědy
1. Analýza rozptylu (ANOVA)
5
Janoušová, Dušek: Analýza dat pro neurovědy
Motivace
Jak můžeme ověřit, zda se liší objem hipokampu u pacientů s AD, pacientů s
MCI a u zdravých kontrol?
A. Můžeme použít vhodný test pro dva výběry (např. dvouvýběrový t-test) a
otestovat, jak se liší AD od MCI, AD od CN a MCI od CN – tedy provést 3
testy.
B. Můžeme použít vhodný test pro více než dvě srovnávané skupiny.
V čem je zásadní rozdíl mezi A a B?
6
Objemhipokampu(mm3)
AD MCI CN
Janoušová, Dušek: Analýza dat pro neurovědy
Motivace – pokračování
• Problém s možností A je v násobném testování hypotéz:
‖ S narůstajícím počtem testovaných hypotéz nám roste také
pravděpodobnost získání falešně pozitivního výsledku, tedy
pravděpodobnost toho, že se při našem testování zmýlíme a ukážeme na
statisticky významný rozdíl tam, kde ve skutečnosti žádný neexistuje
(chyba I. druhu).
• Máme tři testy, v každém 95% pravděpodobnost, že neuděláme chybu I.
druhu.
• Pro všechny tři testy to tedy znamená: 0,95 × 0,95 × 0,95 = 0,857.
• Pravděpodobnost, že neuděláme chybu I. druhu nám celkově klesla na
0,857.
• Pravděpodobnost, že uděláme chybu I. druhu nám celkově stoupla na
0,143.
7
Janoušová, Dušek: Analýza dat pro neurovědy
Motivace – pokračování
• Lepší volbou je:
B. Použít vhodný test pro více než dvě srovnávané skupiny.
• Analýza rozptylu (ANOVA = „ANalysis Of VAriance“) je statistickou
metodou, která umožňuje testovat rozdíl v průměrech více než dvou
skupin. Přitom se jedná o jeden test.
• Více než dvě skupiny mohou být dány přirozeně (např. sledujeme rozdíl
mezi věkovými kategoriemi) nebo uměle (např. sledujeme rozdíl v
účinnosti několika typů léčby).
8
Janoušová, Dušek: Analýza dat pro neurovědy
Analýza rozptylu (ANOVA) jednoduchého třídění
• Srovnáváme tři a více skupin dat, které jsou na sobě nezávislé (mezi
objekty neexistuje vazba).
• Příklady: srovnání objemu hipokampu u pacientů s AD, pacientů s MCI a
kontrol; srovnání kognitivního výkonu podle čtyř kategorií věku.
• Předpoklady: normalita dat ve VŠECH skupinách, shodnost (homogenita)
rozptylů VŠECH srovnávaných skupin, nezávislost jednotlivých pozorování.
• Testová statistika: - vysvětlení později
9
𝑥̅1 𝑥̅2 𝑥̅3
0
1
2
3
AD MCI Kontroly
ee
AA
dfS
dfS
F
/
/
=
Janoušová, Dušek: Analýza dat pro neurovědy
• Srovnání variability (rozptylu) mezi výběry s variabilitou uvnitř výběrů.
• Tabulka analýzy rozptylu jednoduchého třídění (One-Way ANOVA):
Analýza rozptylu (ANOVA) – princip
10
Variabilita
Součet
čtverců
Počet stupňů
volnosti
Průměrný
čtverec
F statistika p-hodnota
Mezi skupinami SA dfA = k – 1 MSA = SA/dfA p
Uvnitř skupin
(reziduální var.)
Se dfe = n – k MSe = Se/dfe
Celkem ST dfT = n – 1
ee
AA
dfS
dfS
F
/
/
=
celkový
průměr
AD MCI CN AD MCI CN
Janoušová, Dušek: Analýza dat pro neurovědy
ANOVA – 2 ukázkové situace
• Rozdíl ve všech třech skupinách:
• Žádný rozdíl mezi skupinami:
11
AD MCI CN AD MCI CN
celkový
průměr
AD MCI CN
celkový
průměr
AD MCI CN
Janoušová, Dušek: Analýza dat pro neurovědy
Analýza rozptylu (ANOVA) jednoduchého třídění
• Příklad: Chceme srovnat, zda se liší objem hipokampu podle typu
onemocnění (tzn. u pacientů s AD, pacientů s MCI a zdravých kontrol).
• Tzn. hypotézy budou mít tvar:
• Postup:
1. Popisná sumarizace objemu hipokampu podle typu onemocnění.
2. Ověření normality hodnot ve VŠECH skupinách.
3. Ověření shodnosti rozptylů VŠECH skupin.
4. Aplikujeme statistický test.
5. Nulovou hypotézu zamítneme nebo nezamítneme:
p<0,001 < 0,05 → zamítáme nulovou hypotézu → Rozdíl v objemu
hipokampu podle typu onemocnění je statisticky významný (na
hladině významnosti α=0,05.)
12
CNMCIADH mmm ==:0
ostatníchododlišnéjejednonejméně: i1 mH
Janoušová, Dušek: Analýza dat pro neurovědy
Výsledky ANOVA testu
• Tabulka analýzy rozptylu jednoduchého třídění:
• Výsledek ze softwaru STATISTICA:
13
Variabilita
Součet
čtverců
Počet stupňů
volnosti
Průměrný
čtverec
F statistika
p-
hodnota
Mezi skupinami
SA =
71 422 222
dfA = k – 1 =
2
MSA = SA/dfA =
35 711 111
0,00
Uvnitř skupin
(reziduální var.)
Se =
26 857 142
dfe = n – k =
830
MSe = Se/dfe =
32 358
Celkem
ST =
98 279 364
dfT = n – 1 =
832
6,1103
/
/
==
ee
AA
dfS
dfS
F
Janoušová, Dušek: Analýza dat pro neurovědy
Další kroky analýzy
14
ANOVA
H0 zamítáme
H0 nezamítáme STOP
Provést
mnohonásobné
porovnávání
Janoušová, Dušek: Analýza dat pro neurovědy
2. Problém násobného
testování hypotéz a použití
korekčních procedur
15
Janoušová, Dušek: Analýza dat pro neurovědy
Korekce na násobné srovnání výběrů
• Zamítneme-li analýzou rozptylu nulovou hypotézu o celkové rovnosti
středních hodnot, má smysl se ptát, jaké skupiny se od sebe nejvíce liší.
• Toto srovnání lze provést pomocí testů pro dva výběry, ale je nutné
korigovat výslednou hladinu významnosti testu, abychom se vyhnuli chybě
I. druhu.
• Nejjednodušší metoda: Boferroniho procedura - korekce hladiny
významnosti: α* = α/m, kde m je počet provedených testů. Ekvivalentně
lze vynásobit p-hodnotu počtem provedených testů. Nevýhodou je, že je
konzervativní pro velké m, tedy počet provedených testů.
• Pro analýzu rozptylu: Tukeyho a Scheffého post hoc testy.
• Může se stát, že při použití různých korekcí nám mohou vyjít výsledky
různě (např. při použití Scheffého testu nám vyjde statisticky významný
rozdíl mezi skupinou AD a MCI a při použití Tukeyho testu nám rozdíl
statisticky významný nevyjde).
16
Janoušová, Dušek: Analýza dat pro neurovědy
Poznámka
• Může nastat situace, kdy zamítneme H0 u ANOVY, ale metodami
mnohonásobného porovnávání nenajdeme významný rozdíl u žádné
dvojice středních hodnot. K tomu dochází zvláště tehdy, když p-hodnota
pro ANOVU je jen o málo nižší než zvolená hladina významnosti.
• Důvod: post-hoc testy (tzn. metody mnohonásobného porovnávání) mají
obecně menší sílu než ANOVA, proto nemusí odhalit žádný rozdíl.
17
Janoušová, Dušek: Analýza dat pro neurovědy
Korekce na násobné srovnání – jiná situace
• Problém násobného testování („Multiple Testing Problem“) nastává, i když
je provedeno větší množství testů na různých proměnných v rámci
jednoho hodnocení dat.
• Příklad: zjišťování, zda se liší objem šedé hmoty u dvou skupin subjektů v
každém voxelu obrazu.
• Korekce:
– Bonferroniho korekce – kontroluje pravděpodobnost, s jakou
dostaneme falešně pozitivní výsledek (kontroluje chybu I. druhu);
konzervativní pro velký počet provedených testů.
– False discovery rate (FDR) – kontroluje podíl falešně pozitivních
výsledků mezi všemi statisticky významnými výsledky (např. pokud je
FDR 0,05 a počet všech statisticky významných výsledků bude 1000,
tak můžeme očekávat, že 50 výsledků bude falešně pozitivních).
18
Janoušová, Dušek: Analýza dat pro neurovědy
Úkol 1.
• Zadání: Zjistěte, zda se liší objem pallida podle typu onemocnění
(nezapomeňte ověřit předpoklady).
• Řešení:
19
Janoušová, Dušek: Analýza dat pro neurovědy
Parametrické a neparametrické testy pro kvantitativní
data – přehled
20
Typ srovnání Parametrický test Neparametrický test
1 skupina dat s referenční
hodnotou
– jednovýběrové testy:
Jednovýběrový t-test,
jednovýběrový z-test
Wilcoxonův test
2 skupiny dat párově
– párové testy:
Párový t-test
Wilcoxonův test,
znaménkový test
2 skupiny dat nepárově
– dvouvýběrové testy:
Dvouvýběrový t-test
Mannův-Whitneyův test,
mediánový test
Více skupin nepárově: ANOVA Kruskalův- Wallisův test
Janoušová, Dušek: Analýza dat pro neurovědy
3. Kruskalův-Wallisův test
21
Janoušová, Dušek: Analýza dat pro neurovědy
Co dělat, když nejsou splněny předpoklady u ANOVy?
1. Zkusit data transformovat – např. logaritmická transformace by měla
pomoci s normalizací rozdělení a stabilizací rozptylu u log-normálních dat.
2. Použít neparametrické testy – např. Kruskalův-Wallisův test nevyžaduje
předpoklad normality, pracuje stejně jako neparametrický MannůvWhitneyův
test.
22
Janoušová, Dušek: Analýza dat pro neurovědy
Kruskalův-Wallisův test
• Neparametrická alternativa analýzy rozptylu (ANOVy).
• Testuje se, zda jsou srovnatelné distribuční funkce (obdobně jako u
Mannova-Whitneyova testu).
• Hypotézy mají tvar:
• Princip Kruskalova-Wallisova testu (podobný jako u Mannova-Whitneyova
testu):
1. Všechny hodnoty ze všech výběrů dohromady uspořádáme
vzestupně podle velikosti → každé hodnotě přiřadíme pořadí.
2. Spočítáme součet pořadí hodnot u každého výběru.
3. Na základě těchto dvou součtů vypočteme testovou statistiku.
• Tzn. za platnosti nulové hypotézy jsou spojená data dobře promíchaná a
průměrná pořadí v jednotlivých souborech jsou podobná.
• Odlehlé hodnoty nejsou problém, protože pracujeme s pořadími.
23
)(...)()(: 210 xFxFxFH k===
ostatníchododlišnájeFjednanejméně: i1H
Janoušová, Dušek: Analýza dat pro neurovědy
Kruskalův-Wallisův test
• Příklad: Chceme srovnat, zda se liší MMSE skóre podle typu onemocnění.
• Tzn. hypotézy budou mít tvar:
• Postup:
1. Popisná sumarizace MMSE skóre podle typu onemocnění.
2. Vykreslení histogramů MMSE skóre pro jednotlivé skupiny subjektů,
abychom viděli, že není splněn předpoklad normálního rozdělení →
proto použijeme neparametrický test.
3. Aplikujeme statistický test.
4. Nulovou hypotézu zamítneme nebo nezamítneme:
p<0,001 < 0,05 → zamítáme nulovou hypotézu → MMSE skóre je u
pacientů s AD, MCI a u kontrol statisticky významně odlišné.
24
)()()(:0 xFxFxFH CNMCIAD ==
ostatníchododlišnájeFjednanejméně: i1H
Janoušová, Dušek: Analýza dat pro neurovědy
Úkol 2.
• Zadání: Zjistěte, zda se liší objem pěti mozkových struktur podle typu
onemocnění (použijte Kruskalův-Wallisův test).
25
Janoušová, Dušek: Analýza dat pro neurovědy
Výsledky srovnání objemů mozkových podle typu
onemocnění
26
Hipokampus (p < 0,001*)
* Statisticky významný rozdíl:
ADxMCI, ADxCN, MCIxCN
Objem(mm3)Objem(mm3)
Amygdala (p < 0,001*)
* Statisticky významný rozdíl:
ADxCN, MCIxCN
Thalamus (p = 0,214)
Pallidum (p = 0,078) Putamen (p < 0,001*)
* Statisticky významný rozdíl:
ADxMCI, ADxCN, MCIxCN
Janoušová, Dušek: Analýza dat pro neurovědy
Úkol 3.
• Zadání: Zjistěte, zda se liší váha podle typu onemocnění. Pokud nejsou
splněny předpoklady, zkuste váhu logaritmovat. Proveďte i popisnou
sumarizaci váhy podle typu onemocnění včetně výpočtu intervalů
spolehlivosti.
• Řešení:
p<0,001*
*Statisticky významný rozdíl: ADxMCI, ADxCN
27
N
Geometrický
průměr
Dolní mez
IS
Horní mez
IS
Medián Minimum Maximum
CN 230 76,9 75,3 78,5 76,0 52,0 135,0
MCI 406 75,4 74,1 76,7 75,5 52,0 140,0
AD 197 70,3 68,6 71,9 70,0 44,0 106,0
Janoušová, Dušek: Analýza dat pro neurovědy
4. Analýza rozptylu jako lineární
model
28
Janoušová, Dušek: Analýza dat pro neurovědy
Analýza rozptylu jako lineární model
• Analýza rozptylu pro jednu vysvětlující proměnnou (jednoduché třídění)
lze zapsat jako lineární model:
• Nulovou hypotézu pak lze vyjádřit jako:
• Rozšířením tohoto zápisu můžeme definovat další modely ANOVA: více
faktorů, hodnocení interakcí, opakovaná měření na jednom subjektu.
29
kH aaa === K210 :
Janoušová, Dušek: Analýza dat pro neurovědy
Analýza rozptylu dvojného třídění
• Uvažujeme dvě vysvětlující proměnné zároveň.
• Zápis modelu:
• Nulové hypotézy pak máme dvě: ,
30
kH aaa === K2101 : rH bbb === K2102 :
Variabilita
Součet
čtverců
Počet stupňů volnosti
Průměrný
čtverec
F statistika p-hodnota
Faktor A SA dfA = k – 1 MSA = SA / dfA FA p
Faktor B SB dfA = r – 1 MSB = SB / dfB FB p
Rezidua Se dfe = (k – 1)(r – 1) MSe= Se / dfe
Celkem ST dfT = n – 1 = kr – 1
Janoušová, Dušek: Analýza dat pro neurovědy
Analýza rozptylu dvojného třídění s interakcí
• Uvažujeme dvě vysvětlující proměnné a zároveň i jejich společné
působení.
• Zápis modelu:
• Nulové hypotézy pak máme tři:
31
kH aaa === K2102 :krH ggg === K121101 :
Variabilita
Součet
čtverců
Počet stupňů volnosti
Průměrný
čtverec
F statistika p-hodnota
Faktor A SA dfA = k – 1 MSA = SA / dfA FA p
Faktor B SB dfA = r – 1 MSB = SB / dfB FB p
Interakce A×B SAB dfAB = (k – 1)(r – 1) MSAB = SAB / dfAB FAB p
Rezidua Se dfe = n – kr MSe= Se / dfe
Celkem ST dfT = n – 1
rH bbb === K2103 :
Janoušová, Dušek: Analýza dat pro neurovědy
Poděkování…
Příprava výukových materiálů předmětu „DSAN01 Analýza
dat pro Neurovědy “ byla finančně podporována prostředky
projektu FRVŠ č. 942/2013 „Inovace materiálů pro
interaktivní výuku a samostudium předmětu Analýza dat pro
Neurovědy“