Přednáška 6
Pojmy z oblasti statistického testování
Typy testů
Normalita dat a její význam pro testování
ml m m #1
«a W W W
Parametrické vs. neparametrické testy
• Parametrické testy
• Mají předpoklady o rozložení vstupujících dat (např. normální rozložení)
• Při stejném N a dodržení předpokladů mají vyšší sílu testu než testy neparametrické
• Pokud nejsou dodrženy předpoklady parametrických testů, potom jejich síla testu prudce klesá a výsledek testu může být zcela chybný a nesmyslný
• Neparametrické testy
• Nemají předpoklady o rozložení vstupujících dat, lze je tedy použít i při asymetrickém rozložení, odlehlých hodnotách, či nedetekovatelném rozložení
• Snížená síla těchto testů je způsobena redukcí informační hodnoty původních dat, kdy neparametrické testy nevyužívají původní hodnoty, ale nejčastěji pouze jejich pořadí
Problémy parametrických a neparametrických testů
Parametrické testy
• Reálná data neodpovídají modelovému rozdělení
Neparametrické testy
• Díky převodu dat na pořadí ztrácíme část informace
							
							
		\			/		
		\ 1	\l původních		/		
		\ «	datech	vidím	e		
		\ t	,mezeru" mezi/				
		\ skupinami					
							
							
40 50 60 70 80 90 100 110 120
Po převodu na pořadí o tuto informaci přicházíme.
Jednovýběrové a dvouvýběrové testy
• Jednovýběrové testy (one-sample)
• Srovnávají jeden vzorek (one sample, jednovýběrové testy) s referenční hodnotou (popřípadě se statistickým parametrem cílové populace)
• V testu je tedy srovnáváno rozložení hodnot (vzorek) s jediným číslem (referenční hodnota, hodnota cílové populace)
• Otázka položená v testu může být vztažena k průměru, rozptylu, podílu hodnot i dalším statistickým parametrům popisujícím vzorek
• Dvouvýběrové testy (two-sample)
• Srovnávají navzájem dva vzorky (two sample, dvouvýběrové testy)
• V testu jsou srovnávány dvě rozložení hodnot
• Otázka položená v testu může být opět vztažena k průměru, rozptylu, podílu hodnot i dalším statistickým parametrům popisujícím vzorek
• Kromě testů pro dvě skupiny hodnot existují samozřejmě i testy pro více skupin dat
Jednostranné a oboustranné hypotézy
• Jednostranné testy (one-tailed)
• Hypotéza testu je postavena asymetricky, tedy ptáme se na větší než/ menší než
• Test může mít pouze dvojí výstup-jedna z hodnot je větší (menší) než druhá a všechny ostatní případy
• Pouze v případě jasné hypotézy - jinak může být napadnuto za účelovost (při vhodném výběru směru testování snazší potvrzení významnosti)
• Oboustranné testy (two-tailed)
• Hypotéza testu se ptá na otázku rovná se/nerovná se
• Test může mít trojí výstup - menší - rovná se - větší než
• Situace nerovná se je tedy souhrnem dvou možných výstupů testu (menší+větší)
• Významově neutrální
■J    íVfVt -    V- I   Institut biostatistiky a analýz, PřF a LF MU
iba *>m? w w
/*     *\   Kritický obor (0.05)
A
Nepárový vs. párový design
Nepárový design
• Skupiny srovnávaných dat jsou na sobě zcela nezávislé (též nezávislý, independent design), např. lidé z různých zemí, nezávislé skupiny pacientů s odlišnou léčbou atd.
• Při výpočtu je nezbytné brát v úvahu charakteristiky obou skupin dat
Párový design
• Mezi objekty v srovnávaných skupinách existuje vazba, daná např. člověkem před a po operaci, reakce stejného kmene krys atd.
• Vazba může být buď přímo dána nebo pouze předpokládána (vtom případě je nutněji ověřit)
• Test je v podstatě prováděn na diferencích skupin, nikoliv na jejich původních datech
nepárový
^ I      two sample test
Diference XI X2 XUX2
i
I -—*
Párový '    y two sample tes L
iba
I   Institut biostatistiky a analýz, PřF a LF MU
Důležité poznámky k testování hypotéz
• Nezamítnutí nulové hypotézy neznamená automaticky její přijetí! Může se jednat o situaci, kdy pro zamítnutí nulové hypotézy nemáme dostatečné množství informace.
• Dosažená hladina významnosti testu (ať už 5 %, 1 % nebo 10 %) nesmí být slepě brána jako hranice pro existenci / neexistenci testovaného efektu.
• Malá p-hodnota nemusí znamenat velký efekt. Hodnota testové statistiky a p-hodnota mohou být ovlivněny velkou velikostí vzorku a malou variabilitou pozorovaných dat.
• Na výsledky testování musí být nahlíženo kriticky-jedná se o závěr založeny „pouze" na jednom výběrovém souboru.
• Statistická významnost indikuje, že pozorovaný rozdíl není náhodný, ale nemusí znamenat, že je významný i ve skutečnosti. Důležitá je i praktická (klinická) významnost.
Statistické testy a normalita
• Normalita dat je jedním z předpokladů tzv. parametrických testů (testů založených na předpokladu nějakého rozložení) - napr. t-testy
• Obecně lze říci, že každá statistická metoda, v jejímž algoritmu je obsažen výpočet průměru nebo směrodatné odchylky má předpoklad normálního rozložení
• Pokud data nejsou normální, neodpovídají ani modelovému rozložení, které je použito pro výpočet (t-rozložení) a test tak může lhát
• Řešením je tedy:
• Transformace dat za účelem dosažení normality jejich rozložení
• Neparametrické testy - tyto testy nemají předpoklady o rozložení dat (nebo jen minimální)
Typ srovnání
Parametrický test
Neparametrický test
2 skupiny dat nepárově:
Nepárový t-test
Mannův-Whitneyho test
2 skupiny dat párově:
Párový t-test
Wilcoxonův test, znaménkový test
Více skupin nepárově:
ANOVA (analýza rozptylu)
Kruskalův- Wallisův test
Korelace:
Pearsonův koeficient
Spearmanův koeficient
Testy normality
• Testy normality pracují s nulovou hypotézou, že není rozdíl mezi zpracovávaným rozložením a normálním rozložením. Vždy je ovšem dobré prohlédnout si i histogram, protože některé odchylky od normality, např. bimodalitu některé testy neodhalí.
Chĺ-kvadrát test dobré shody 25o
• V testu dobré shody jsou data rozdělena do kategorií (obdobně jako při tvorbě histogramu), tyto intervaly jsou normalizovány (převedeny na normální rozložení) a
podle obecných vzorců normálního rozložení jsou k nim dopočítány očekávané 200 hodnoty v intervalech, pokud by rozložení byío normální. Pozorované normalizované četnosti jsou poté srovnány s očekávanými četnostmi pomocí \2 testu dobré shody. 150 Test dáva dobré výsledky, ale ie náročný na n, tedy množství dat, aby bylo možné vytvořit dostatečný počet třícf hodnot.
Kolmogorovův - Smirnovův test 00
• Tento test je často používán, dokáže dobře najít odlehlé hodnoty, ale počítá spíše se 50 symetrií hodnot nez přímo s normalitou. Jde o neparametrický test pro srovnání
rozdílu dvou rozložení. Je založen na zjištění rozdílu mezi reálným kumulativním rozložením (vzorek) a teoretickým kumulativním rozložením. Měl by být počítán pouze o v případě, že známe průměr a směrodatnou odchylku hypotetického rozložení, pokud tyto hodnoty neznáme, měla by být použita jeho modifikace - Lilieforsův test.
Shapirův-Wilkův test
• Jde o neparametrický test použitelný i při velmi malých n (10) s dobrou sílou testu, zvláště ve srovnání s alternativními typy testů, je zaměřen na testování symetrie.
Šikmost a špičatost jako testy normality
• Parametry normálního rozdělení, skewness a kurtosis mohou být využity pro testování normality, ale pouze pro velké vzorky (šikmost - 100, špičatost - 500).
skewness>0 skewness<0
Vizuální hodnocení normality I
-200       400       1000      1600      2200 -200        400        1000       1600 2200
Hodnota proměnné Hodnota proměnné
-» /•Sévřv <0
lYíY t f-':>-'^' * lili 1   Institut biostatistiky a analýz, PřF a LF MU
iba *>m? w w
Vizuální hodnocení normality II
Normální p-graf
"í -0,5
Graf Q.Q
0,01 0,05  0,10        0,26 0,50 0,75        0,90   0,95 0,99
???
1,0   -0,5   -0,6  -0,4   -0,2   0,0    0,2    0,4   0,6    0,8    1,0    1,2    1,4 1,6 Pozorovaný kvantil
Graf P-P
• Pouze výměna os
• Znázorněn pozorovaný a teoretický kvantil
• Vykresleno kumulativní rozdělení
PAMATUJ: Pocházejí-li data z normálního rozložení, pak body budou ležet okolo přímky
A
0,1        0,2       0,3       0,4       0,5       0,6       0,7       0,8       0,9 1,0 Teoretické kumulativní rozděleni
MU ^
i
iba
m
|   Institut biostatistiky a analýz, PřF a LF MU
Vizuální hodnocení normality III
Rozložení s kladnou šikmostí											Normálni rozložení										Rozložení se zápornou šikmostí									
	Histogram											Histogram										Histogram								
											•																			
																....														
																												:	1--	
																														
												—							—											
																										r				
					n~i-r-i-, ^							—pí							1			^__vrrk .: 1_|_|_								
	NP plot											NP plot									NP plot									
■											■									y	■-		n\	/o v	r* i					
																									111				y	
																						kŕ	m\	ca	\				/	
		y		N K	on	k;	3\	ix	II																					
		/		k	ři\/	c	1																							
					1 I v		A																							
	Krabicový diagram										■	Ki	■abicov}			' diagram						Krabicový diagran								
					—i-																									
					1																									
																														
																														
																														
																														
\/ýívtoi/é materiály: Výpočetní statistika, RNDr. Marie Budíková, Dr., 2011
M_      ľVfV'í        '•   ŕ IUI I   Institut biostatistiky a analýz, PřF a LF MU
iba *>m? w w
Parametrické jednovýběrové statistické testy
Jednovýběrový t-test Jednovýběrový test rozptylu
Anotace
• Jednovýběrové statistické testy srovnávají některou popisnou statistiku vzorku (průměr, směrodatnou odchylku) s jediným číslem, jehož význam je ze statistické hlediska hodnota cílové populace
• Z hlediska statistické teorie jde o ověření, zda daný vzorek pochází z testované cílové populace.
Shrnutí statistických testů
Typ srovnání	Nulová hypotéza	Parametrický test	Neparametrický test
1 výběr dat vs. referenční hodnota	Střední hodnota je rovna zvolené referenční hodnotě.	jednovýběrový t-test / z-test	Jednovýběrový Wilcoxonův test
2 nezávislé skupiny dat (test shody středních hodnot)	Střední hodnoty se mezi skupinami neliší.	nepárový t-test	Mannův-Whitneyho test
2 nezávislé skupin dat (test shody rozptylů = homoskedasticity)	Rozptyl obou skupin je shodný.	F-test	Levenův test
2 párově závislé výběry dat	Rozdíl (diference) párových hodnot je nulový.	párový t-test	Wilcoxonův test; znaménkový test
Shoda rozdělení výběru s teoretickým rozdělením	Rozdělení dat odpovídá teoretickému (vybranému) rozdělení.	test dobré shody (X2 test)	Shapirův-Wilkův test; Kolmogorovův-Smirnovův test; Lilieforsův test
3 a více skupin nepárově (test shody středních hodnot)	Střední hodnoty se mezi skupinami neliší.	ANOVA	Kruskalův-Wallisův test
Korelace	Neexistuje vztah mezi hodnotami dvou výběrů.	Pearsonův korelační koeficient	Spearmanův korelační koeficient
iba
Ě
'WS*
|   Institut biostatistiky a analýz, PřF a LF MU
Základní rozhodování o výběru statistických testů
Spojitá x spojitá data
Pearsonův korelační koeficient
Spearmanův korelační koeficient
Spojitá x kategoriálnídata
Jeden výběr
Dva výběry
Párová data
Jednovýběrový t-test
Jednovýběrový Wilcoxonův test
Nepárová data
Párový t-test
Wilcoxonův / znaménkový test
Dvouvýběrový t-test
Mannův-Whitneyho test
Tři a více výběrů nepárově)
Parametrické testy Neparametrické testy
Kategoriálníx kategoriální data
Jeden výběr
ANOVA
Kruskalův-Wallisův test
1
Více výběrů
Párová data
Jednovýběrový binomický test
1
Nepárová data
McNemarův test
Chí-kvadrát test
Fisherův exaktní test
iba
Ě
'WS*
I   Institut biostatistiky a analýz, PřF a LF MU
Parametrické jednovýběrové testy
• Předpoklad: normalita dat
• Jednovýběrový z-test (porovnání základního a výběrového souboru, známe střední hodnotu a rozptyl základního souboru)
• Studentův jednovýběrový t-test (testování rozdílů dvou středních hodnot) -(porovnání základního a výběrového souboru, známe střední hodnotu ale neznáme rozptyl základního souboru; nahrazujeme jej výběrovým rozptylem našich dat)
• Chi-kvadrát test (testování rozdílu cílová vs. výběrová populace)
Jednovýběrový z a t test
• V případě jednovýběrových testů jde o srovnání výběru dat (tedy one sample) s cílovou populací. Pro parametrické testy musí mít datový soubor normální rozložení.
• Rozdíl mezi jednovýběrovým z-testem a t-testem spočívá ve znalosti rozptylu základního souboru (z-test) nebo jeho nahrazení výběrovým rozptylem našich dat (t-test)
z-test:
x — \i z =-
VAŽ
t-test:
x — u
t =-
VAŽ
H0	HA	Testová statistika	Kritická hodnota
X < \i	X > \i	z/t	z > zl-a / t > tl-a
X>\i	X <\i	z/t	z<za / t< tS'1
X — \i	X ^ \i	z/t	1*1 >*l-«/2/ M > ti-a/2
iba
Ě
'WS*
|   Institut biostatistiky a analýz, PřF a LF MU
Příklad: z-test projeden výběr 1
• Při populačním epidemiologickém průzkumu se zjistilo, že průměrný objem prostaty u mužů je 32,73 ml (SD = 18,12 ml).
• Na hladině významnosti testu a = 0,05 chceme ověřit, jestli se muži nad 70 let liší od celé populace.
• Máme náhodný výběr o velikosti n = 100 a výběrový průměr 36,60 ml.
• Chceme ověřit platnost:
• H0: jLX = 32,73
• HA: jlx ^ 32,73
a/2
1-a
a/2
Jíl
Ě
|   Institut biostatistiky a analýz, PřF a LF MU
Příklad: z-test projeden výběr 2
Hodnota testové statistiky:
x — a ,—    36,60 — 32,73 ,-
z =--VAŽ =-——-VTÔÔ = 2,14
p 18,12
• Můžeme zamítnout nulovou hypotézu na hladině významnosti testu a = 0,05 nebo ne?
z = 2,14 > 1,96 (z!_a/2 = z0<975)
• Nulovou hypotézu o rovnosti objemu prostaty u mužů nad 70 let populační hodnotě 32,73 ml zamítáme na hladině významnosti a = 0,05, protože výsledná hodnota z statistiky je větší než kritická hodnota (příslušný kvantil) rozdělení N(0,1).
•^SílT '^.-^ ^»»V>*
Příklad: t-test projeden výběr
• Určitá linka autobusové městské dopravy má v době dopravní špičky průměrnou rychlost 8 km/hod. Uvažovalo se o tom, zda změna trasy by vedla ke změně průměrné rychlosti. Nová trasa byla proto projeta v deseti náhodně vybraných dnech a byly zjištěny tyto průměrné rychlosti: 8,4; 7,9; 9,0; 7,8; 8,0; 7,8; 8,5; 8,2; 8,2; 9,3. Rozhodněte, zda změna trasy vede ke změně průměrné rychlosti. Předpokládáme normální rozdělení a a=0,05.
• Postup:
1. Na hladině významnosti 0,05 testujeme hypotézu H0: u. = 8, proti HA: u. * 8
2. Vypočteme aritmetický průměr a rozptyl výběrového souboru.
3. Vypočteme testovou statistiku t:        x-\i r-   8,310-8 _
t =--VAŽ = VlQ = 1,934
5 0,507
4. Vypočtené t porovnáme s kritickou hodnotou:
h-a/2 = řo,975 — 2,262
5. Je-li \t\ < t^Zot/ - > statisticky nevýznamný rozdíl testovaných parametrů při zvolené a; nulovou hypotézu nezamítáme, na hladině významnosti a=0,05 se nepodařilo prokázat, ze by změna trasy měla za následek změnu průměrné rychlosti.
A
IUI i   Institut biostatistiky a analýz, PřF a LF MU
Ví-X ^Szír
Typické výstupy SW (Statistica, v jiných obdobné)
Výběrový průměr (průměr pozorovaných dat)
Rozsah výběru Hodnota testovacího kritéria
Standardní chyba
Variable
Test of rr eans against referei> fe const* |nt (value) (Q4_doprava.sta)
Std.Dv.
rychlost
Stupeň volnosti
J
Std.Err.
Reference Constant
t-value
513_10    0.160174      8,000000 1,935401
Výběrová směrodatná odchylka (pozorovaných dat)
POZOR: Platí pro oboustranný test!
Referenční konstanta-předpokládaná velikost střední hodnoty
iba
Ě
I   Institut biostatistiky a analýz, PřF a LF MU
Příklad k řešení: t-test 1
Data - koncentrace antibiotika v cílovém orgánu
• Při 1000 měřeních antibiotika byla zjištěna v cílovém orgánu průměrná koncentrace 202,5 jednotek a směrodatná odchylka 44 jednotek.
• Požadovaná koncentrace antibiotika je 200 jednotek. Výzkumné otázky
1. Je daný rozdíl 2,5 významný vzhledem k variabilitě znaku na hladině významnosti 5%?
2. Jaká je skutečná hladina významnosti?
Příklad k řešení: t-test 1
Data - koncentrace antibiotika v cílovém orgánu
• Při 1000 měřeních antibiotika byla zjištěna v cílovém orgánu průměrná koncentrace 202,5 jednotek a směrodatná odchylka 44 jednotek.
• Požadovaná koncentrace antibiotika je 200 jednotek. Výzkumné otázky
1. Je daný rozdíl 2,5 významný vzhledem k variabilitě znaku na hladině významnosti 5%?
2. Jaká je skutečná hladina významnosti?
X — [i
Važ =
202,5 - 200
VTÔÔÔ = 1,797
t =
44
5
Příklad k řešení: t-test 1
X — li ,—     202,5 — 200   ,- .N-l -999        i n^n
t =--VAŽ =---VTÔÔÔ = 1,797-1,8 h_a/ = řj;9y75 = 1,960
Area between O and z
/Y,
0 z
	0.00	.01	0.02	0.03	0.04	0.05	0.06	0.07	0.08	0.09
1.7	0.455^		0.4573	0.45ÍÍ	0.459"	0.4599	0.4608	0.4616	0.4625	0.4633
1.8	D.4641	.4649	0.4656	0.466^	0.4671	0.4678	0.46S6	0.4693	C.4Í99	0.4706
Výzkumné otázky
1. Je daný rozdíl 2,5 významný vzhledem k variabilitě znaku na hladině významnosti 5%?
• Nulovou hypotézu nezamítáme
2. Jaká je skutečná hladina významnosti?
• p = 2*(1-0,4641)=0,072
■J    íVfVt f"í    VI r|U| I   Institut biostatistiky a analýz, PřF a LF MU
iba *>m? w w
Příklad k řešení: t-test 2
Data - aktivita enzymu v buňkách
• Při zjišťování aktivity enzymu v buňkách na vzorku 25 měření byl zjištěn průměr 3,5 jednotek a směrodatná odchylka 1.
Výzkumné otázky
1. otázka zní, zda se naměřené hodnoty našeho vzorku liší od výsledků dřívější rozsáhlé studie zaměřené na celou cílovou populaci, kde byla zjištěna průměrná aktivita 2,5
2. otázka - jakou minimální odchylku X od jiné hodnoty bychom zachytili při daných hodnotách?
3. za předpokladu, že z praktického hlediska je významná odchylka již 0,2 jednotky, jaký minimální počet měření musíme provést, abychom ji byli schopni prokázat ?
jednotky?
Příklad k řešení: t-test 2
Data - aktivita enzymu v buňkách
• Při zjišťování aktivity enzymu v buňkách na vzorku 25 měření byl zjištěn průměr 3,5 jednotek a směrodatná odchylka 1.
Výzkumné otázky
1. otázka zní, zda se naměřené hodnoty našeho vzorku liší od výsledků dřívější rozsáhlé studie zaměřené na celou cílovou populaci, kde byla zjištěna průměrná aktivita 2,5 jednotky?
s 1
ř024975 = 2,064        t > t™a/2 C^> HO zamítnuta při a<0,05
iba
Ě
'WS*
|   Institut biostatistiky a analýz, PřF a LF MU
Příklad k řešení: t-test 2
Data - aktivita enzymu v buňkách
• Při zjišťování aktivity enzymu v buňkách na vzorku 25 měření byl zjištěn průměr 3,5 jednotek a směrodatná odchylka 1.
Výzkumné otázky
2. otázka - jakou minimální odchylku X od jiné hodnoty bychom zachytili při daných hodnotách?
t =
——sfň = —síň ^ d
s s
l-a/2
4ň
s ^ d =
2,064 5
Příklad k řešení: t-test 2
Data - aktivita enzymu v buňkách
• Při zjišťování aktivity enzymu v buňkách na vzorku 25 měření byl zjištěn průměr 3,5 jednotek a směrodatná odchylka 1.
Výzkumné otázky
3. za předpokladu, že z praktického hlediska je významná odchylka již 0,2 jednotky, jaký minimální počet měření musíme provést, abychom ji byli schopni prokázat ?
t =
-ju i-   d i--V« = — yln ^
n =
l-a/2
d
Jednovýběrový test pro rozptyl
• V případě one sample testů jde o srovnání výběru dat (tedy one sample) s cílovou populací. Pro parametrické testy musí mít datový soubor normální rozložení.
Chi-kvadrát test:
(N - l)s2
X2 =
	H0		HA	Testová statistika	Kritická hodnota
s2	<G2	s2	>G2	x2	2 .      2 (N-l) X   > Xi-a
s2	>o2	s2	<G2	x2	2.2 (N-l) X <Xa
s2	= a2	s2	*o2	x2	X2 > xllaj^ nebox2 < xVf2~^
iba
Ě
'WS*
|   Institut biostatistiky a analýz, PřF a LF MU
Neparametrické jednovýběrové statistické testy
Jednovýběrový t-test Jednovýběrový test rozptylu
Parametrické vs. neparametrické testy
Parametrické testy
• Mají předpoklady o rozložení vstupujících dat (např. normální rozložení)
• Při stejném N a dodržení předpokladů mají vyšší sílu testu než testy neparametrické
• Pokud nejsou dodrženy předpoklady parametrických testů, potom jejich síla testu prudce klesá a výsledek testu může být zcela chybný a nesmyslný
Neparametrické testy
• Vyžadují méně předpokladů o rozložení vstupujících dat, lze je tedy použít i při asymetrickém rozložení, odlehlých hodnotách, či nedetekovatelném rozložení
• Snížená síla těchto testů je způsobena redukcí informační hodnoty původních dat, kdy neparametrické testy nevyužívají původní hodnoty, ale nejčastěji pouze jejich pořadí
• Souvisíš malou velikostí souboru (nejsme schopni normalitu dat ověřit)
Proč nemusí parametrický a neparametrický test vyjít stejně?
Jednovýběrový Wilcoxonův test
• Předpokladem je symetrické rozdělení dat kolem mediánu.
• Testuje, zda je medián jednoho výběru roven hodnotě c (v případě párového designu je x0.5 reprezentováno mediánem rozdílu hodnot)
Postup:
1. Spočítáme rozdíly hodnot výběru s testovanou hodnotou mediánu.
2. Absolutní hodnoty rozdílů uspořádáme vzestupně a přiřadíme jim pořadí.
3. Spočítáme statistiky Sw+a Sw~, které odpovídají součtu pořadí kladných (Sw+) a záporných rozdílů (Sw~). Jako finální hodnotu testové statistiky bereme minimum z Sw+ a Sw\ Nulovou hypotézu zamítáme, pokud hodnota testové statistiky menší nebo rovna tabelované kritické hodnotě (při dané hladině významnosti a počtu nenulových rozdílů).
nebo
3. Pro N > 30 lze využít asymptotické normality statistiky Sw+
H0: x05=c proti H1: x05* c.
E(Sw+)
n(n + l)
D(Sw+)
n(n + l)(2n + l)
Z =
+ -E(SW+)
4
24
• Pokud | Z | > u
l-a/2
zamítáme nulovou hypotézu, že medián výběru je roven hodnotě c.
Jednovýběrový znaménkový test
• Lze použít v situaci, kdy není splněn předpoklad symetrie rozdělení kolem mediánu.
• Testuje, zda je medián jednoho výběru roven hodnotě c (v případě párového designu je x0 5 reprezentováno mediánem rozdílu
Postup:
1. Spočítáme rozdíly hodnot výběru s testovanou hodnotou mediánu.
2. Spočítáme statistiku Sz+, která odpovídá počtu kladných rozdílů -> test nevyužívá hodnot pořadí původních dat ale pouze informaci, zda se hodnota realizuje nad nebo pod mediánem -> dochází ke snížení síly testu
3. Nulovou hypotézu zamítáme, pokud statistika Sz+ realizuje v kritickém oboru hodnot W=(0,k1)U(k2,n), kde n odpovídá počtu nenulový rozdílů a hodnoty kx a k2 lze dohledat v matematických tabulkách.
• nebo
3.   Pro N > 20 lze využít asymptotické normality statistiky Sz+
hodnot)
H0: x0 5=c proti H^. x0 5* c.
E(Sz+)
n
D(Sz+)
n
Z =
Sz + -E(Sz+)
2
4
Pokud | Z | > u^/2 zamítáme nulovou hypotézu, že medián výběru je roven hodnotě c.
Příklad: jednovýběrový test
• U 15 náhodně vybraných pacientů byla vyhodnocena doba, kterou museli strávit v čekárně, než byli sestrou pozváni do ordinace. Na 5% hladině významnosti testujte nulovou hypotézu, že medián čekací doby je roven půl hodině.
Příklad: jednovýběrový test - Wilcoxonův test
• U 15 náhodně vybraných pacientů byla vyhodnocena doba, kterou museli strávit v čekárně, než byli sestrou pozváni do ordinace. Na 5% hladině významnosti testujte nulovou hypotézu, že medián čekací doby je roven půl hodině.
Pacient č.	čekací doba (min)	medián	rozdíl	| rozdílí	pořadí
1	1	30	-29	29	15
2	45	30	15	15	10
3	25	30	-5	5	3.5
4	15	30	-15	15	10
5	34	30	4	4	2
6	19	30	-11	11	8
7	31	30	1	1	1
8	25	30	-5	5	3.5
9	8	30	-22	22	14
10	12	30	-18	18	12
11	20	30	-10	10	6
12	15	30	-15	15	10
13	40	30	10	10	6
14	20	30	-10	10	6
15	10	30	-20	20	13
sw-=ioi
min (V,SW-)=19 Kritická hodnota w15(0,05)=25 Hodnota testové statiky je menší než kritická hodnota -> zamítáme Hn
iba
Ě
'WS*
I   Institut biostatistiky a analýz, PřF a LF MU
Příklad: jednovýběrový test - Znaménkový test
• U 15 náhodně vybraných pacientů byla vyhodnocena doba, kterou museli strávit v čekárně, než byli sestrou pozváni do ordinace. Na 5% hladině významnosti testujte nulovou hypotézu, že medián čekací doby je roven půl hodině.
Pacient č.	čekací doba (min)	medián	rozdíl	Větší než medián?
1	1	30	-29	Ne
2	45	30	15	Ano
3	25	30	-5	Ne
4	15	30	-15	Ne
5	34	30	4	Ano
6	19	30	-11	Ne
7	31	30	1	Ano
8	25	30	-5	Ne
9	8	30	-22	Ne
10	12	30	-18	Ne
11	20	30	-10	Ne
12	15	30	-15	Ne
13	40	30	10	Ano
14	20	30	-10	Ne
15	10	30	-20	Ne
Kritický obor: W=(0,3)U(12,15) Hodnota statistiky se realizuje mimo kritický obor hodnot -> nezamítáme Hn
iba
Ě
'WS*
I   Institut biostatistiky a analýz, PřF a LF MU
Příklad: Řešení v softwaru
1) Výstup Wilcoxonova testu
Testová statistika: min (SW+,SW~)
				
	Wilcoxon Matclled Pairs Test (v cekáme.sta) Marked tests fre significant at p <.05000			
Pair of Variables	Valid N		Z	p-value
doba    & median	15	19.00000,	2.328E44	0.019879,
I
z
Statistika a p-hodnota pro asymptotickou variantu testu (používat pouze pro N > 30)
Počet nenulových rozdílů
2) Výstup znaménkového testu
Podíl hodnot menších než testovaný medián
				
Pair of Variables	Sign Test (v cekar Marked tests are f	]e.sta) Ignificant at p <.05000		
	Ho. of   I Perl Non-ties |    v 1	ent V	Z	p-value
doba    & median	151   73.33333. 1.549193 I-1-■ 1			0.121335
Počet nenulových rozdílů
asymptotickou variantu testu (používat pouze pro N > 20)
iba
,Oi,
fj- ^Sß1 Sa-
Mi I  Institut biostatistiky a analýz, PřF a LF MU
Schéma při testování pomocí jednovýběrových testů
Data
~~r~
Vizuální ověření normality		Testové ověření normality
		
Histogram, Q-Q graf, P-P graf, N-P graf, krabicový graf
S-W test, K-S test, Lilieforsův test
Opakování
Normální rozdělení?
I -
NE
Logaritmická transformace
Normální rozdělení? I
NE
ZEL
Jednovýběrový Wilcoxonův test na
původních datech
ANO
Jednovýběrový t-test / z-test
na transformovaných datech
ANO
Jednovýběrový t-test / z-test
Parametrické testy Neparametrické testy
I ^Y?V\ í" i IUI I   Institut biostatistiky a analýz, PřF a LF MU
Parametrické dvouvýběrové statistické testy
Dvouvýběrový nepárový t-test Dvouvýběrový párový t-test
Anotace
• Jedním z nejčastějších úkolů statistické analýzy dat je srovnání spojitých dat ve dvou skupinách pacientů.
• Na výběr je celá škála testů, výběr konkrétního testu se pak odvíjí od toho, zda je o srovnání párové nebo nepárové a zda je vhodné použít test parametrický (má předpoklady o rozložení dat) nebo neparametrický (nemá předpoklady o rozložení dat, nicméně má nižší vypovídací sílu).
• Nejznámějšími testy z této skupiny jsou tzv. t-testy používané pro srovnání průměrů dvou skupin hodnot
Dvouvýběrové testy: párové a nepárové I
Při použití two sample testů srovnáváme spolu dvě rozložení. Jejich základním dělením je podle designu experimentu na testy párové a nepárové.
Základním testem pro srovnání dvou nezávislých rozložení spojitých čísel je nepárový two-sample t-test
nepárový ^ I      two sample tesi
X2
♦
t
'.V
Základním testem pro srovnání dvou závislých rozložení spojitých čísel je párový two-sample t-test
Diference XI X2 xiaX2
Párový ■ i    y two sample tes L
iba
Ě
'WS*
I   Institut biostatistiky a analýz, PřF a LF MU
Dvouvýběrové testy: párové a nepárové
x1 x2
Nezávislé uspořádání ^
H0. [i1 [i2
XrX2=D
Párové uspořádání ^
2 2 i5\      tS" o
H n:D = 0
Design uspořádání zásadně ovlivňuje interpretaci parametrů
,» /gh. <">
YíY t í í lili !   Institut biostatistiky a analýz, PřF a LF MU
tba *W W W
n D
2
(n = n2 = n,)
Dvouvýběrové testy: párové a nepárové III
• Identifikace párovitosti (Korelace, Kovariance)
Předpoklady nepárového dvouvýběrového t-testu
Náhodný výběr subjektů jednotlivých skupin z jejich cílových populací Nezávislost obou srovnávaných vzorků
Přibližně normální rozložení proměnné ve vzorcích, drobné odchylky od normality ovšem nejsou kritické, test je robustní proti drobným odchylkám od tohoto předpokladu, normalita může být testována testy normality
Rozptyl v obou vzorcích by měl být přibližně shodný (homoscedastic). Tento předpoklad je testován několika možnými testy - Levenův test nebo F-test.
Vždy je vhodné prohlédnout histogramy proměnné v jednotlivých vzorcích pro okometrické srovnání a ověření předpokladů normality a homogenity rozptylu - nenahradí statistické testy, ale poskytne prvotní představu.
x
X
+
+
Varianta 1   Varianta 2
*Sf«r ^»
I   Institut biostatistiky a analýz, PřF a LF MU
Nepárový dvou výběrový t-test - výpočet I
nulová hypotéza: průměry obou skupin jsou shodné, alternativní hypotéza je, že nejsou shodné, two tailed test
prohlédnout průběh dat, průměr, medián apod. pro zjištění odchylek od normality a nehomogenita rozptylu, provést F-test
F-test pro srovnání dvou výběrových rozptylů
• Používá se pro srovnání rozptylu dvou skupin hodnot, často za účelem ověření homogenity rozptylu těchto skupin dat.
V případě ověření homogenity je testována hypotéza shody rozptylů (two tailed); v případě shodných rozptylů je vše v pořádku a je možné pokračovat ve výpočtu t-testu, v opačném případě není vhodné test počítat.
	H0		HA	Testová statistika
2 ^1	, 2	2 ^1	2 >a2	2 S2
2 ^1	><y\	2 ^1	^ 2 <a2	2 F = ^ 2
	= a\			p _max(sf;s22) min (sf; s\)
iba
'WS*
|   Institut biostatistiky a analýz, PřF a LF MU
Nepárový dvouvýběrový t-test - výpočet II
Výpočet testové statistiky (stupně volnosti jsou 0 = ^ + ^-2):
Rozdíl _ průrůmě
SE{rozdílpr ůo ěrů)
Xi - Xi
—+ —
_ {nx - l)sf + (n2 - \)s22  vážený odhad
rozptylu
nx+n2-2
• výsledné t srovnáme s tabulární hodnotou t pro dané stupně volnosti a 13 (obvykle oc=0,05)
• Lze spočítat interval spolehlivosti pro rozdíl průměrů (např. 95%), počet stupňů volnosti a s2 odpovídají předchozím vzorcům
(Xl     X2 ) — ^0,975 X2 ) ~~ (Xl     X2 ) — ^0,975 \\S
-+-
Jíl
Ě
'WS*
I   Institut biostatistiky a analýz, PřF a LF MU
Nepárový dvouvýběrový t-test - výpočet shrnutí
• Nulová hypotéza: průměry obou skupin jsou shodné
• Alternativní hypotéza je, že nejsou shodné.
• Prohlédnout průběh dat, průměr, medián apod.
• Ověřit normalitu dat (např. Shapiro-Wilk test)
• Ověřit homogenitu rozptylů (F-test)
• V případě ověření homogenity je testována hypotéza shody rozptylů; v případě shodných rozptylů je vše v pořádku a je možné pokračovat ve výpočtu t-testu, v opačném případě není vhodné test počítat.
• Vypočítat hodnotu testové statistiky a p-hodnotu. Když je vypočítaná p-hodnota menší než 0,05, zamítáme nulovou hypotézu.
Přednáška 7
Příklad : Nepárový dvouvýběrový t-test
^ 1. skupina, N=30
• Průměrná hmotnost ovcí v čase páření byla srovnávána pro kontrolní skupinu a skupinu krmenou zvýšenou dávkou potravy. Kontrolní skupina obsahuje 30 ovcí, skupina se zvýšeným příjmem potravy pak 24 ovcí.
Vlastní experiment byl prováděn tak. že na začátku máme 54 ovcí (ideálně stejného plemene, stejně staré atd.), které náhodně rozdělíme do dvou skupin (náhodné rozdělování objektů do pokusných skupin je objektem celého specializovaného odvětví statistiky nazývaného randomizace). Poté co experiment proběhne, musíme nejprve ověřit teoretický předpoklad pro využití nepárového t-testu. Pro obě skupiny jsou vykresleny grafy (můžeme téz spočítat základní popisnou statistiku), na kterých můžeme posoudit normalitu a homogenitu rozptylu, kromě okometrického pohledu můžeme pro ověření normality použít testy normality, pro ověření homogenity rozptylu pak F-test.
Pokud platí všechny předpoklady dvouvýběrového nepárového t-testu, můžeme spočítat testovou statistiku, výsledné řje 2,43 s 52 stupni volnosti, podle tabulek je a tpo75(52)L= 2,01, tedy 111 > tQ 975 (52) a nulovou hypotézu můžeme zamítnout, skutečná pravděpodobnost je pak 0,018. Rozcfífmezi skupinami je 1,59 Kg ve prospěch skupiny se zvýšeným příjmem.
Rozdíl. průměru x\-xi
SE (rozdíl .průměru )
L		0
i P		+ —
V		n2)
[nx - \)s\ + [n2 - l)s
n, +n
Pro rozdíl mezi oběma soubory jsou spočítány 95% intervaly spolehlivosti jako 1,59±2.01*(0,655) kg, což odpovídá rozsahu 0,28 až 2,91 kg. To, že interval spolehlivosti nezahrnuje 0 je dalším potvrzením, že mezi skupinami je významný rozdíl - jde o další způsob testování významnosti rozdílů mezi skupinami dat - nulovou hypotézu o tom, že rozdíl průměrů dvou skupin dat je roven nějaké hodnotě zamítáme v případě, kdy 95% interval spolehlivosti rozdílu nezahrnuje tuto hodnotu (v tomto případě 0).
í i     i A
(x1   x2) i t q 915SE(xx   x2) — (x1   x2)iř0975 Is
1 1 — + —
V n\       n2 J
Ä%   Ä <>
t' ííWiV í llll 1   Institut biostatistiky a analýz, PřF a LF MU
W ^Sz*r
2. skupina, N=24
Příklad : Nepárový dvouvýběrový t-test
• Nejprve ověřte normalitu hmotnosti jednak ve skupině kontroly a ve skupině se zvýšenou potravou
2.5 2,0 1.5 1,0 tu - 05	Normal Probability Plot of Hmotnost: categorized by Skupina srovnáni hmotnosti ovci 5v*54c													
														
				O/										
				/o										
												/o		
I 0,0 0 1 -0,5 OJ S  -1 0 Q. x LU -1,5 -2,0 2,5 6											Jo			
														
										/ of				
	- '■"■'/-									o				
								9						
	'/ O							7						
	0     62     64     66     68     70     72     74 6 .....................................Ř.k,.!..!.p-irhí!.:....!<™'5.tr.R. ŕ*..................................................................							0     62     64     66     68     70     72 74 .............................Aki-inina" 7\i\/^nr\ň nritrava						
Skupina: Kontrola Hmotnost: SW-W = D;9859; p = 0,9520 Skupina: Zvýšená potrava Hmotnost: SW-W = 0,9847: o - 0,9645														
• V obou případech se tečky odchylují od přímky jenom málo a p-hodnoty S-W testu převyšují 0,05. Předpoklad o normálním rozložení dat v obou skupinách je oprávněný.
iba
Ě
'WS*
I   Institut biostatistiky a analýz, PřF a LF MU
Příklad : Nepárový dvouvýběrový t-test
'POZOR: Výstupní tabulku vyhodnocujeme zezadu!!!
Výběrový průměr u 1. skupiny
Výběrový průměr u 2. skupiny
T-tests; Group Group 1: Kont Group 2: Zvýšená potrava
Mean Kontrola
65.77333 67.3666
Výběrová směrodatná odchylka u 2. skupiny
Rozsah výběru 1. skupiny
Rozsah výběru 2. skupiny
ng: Skupina (srovnáni hmotnosti ovc la
Mean Zvýšená potrava
Hodnota testové statistiky (pro test shody středních hodnot)
Počet stupňů volnosti
ValhTN
Zvýšená potrava
Std.Dev. Kontrola
24 2.497162
Std.
Zvýšina potrava
F-rati o Variances
2.252471 1.229066
Variances
0.617383
Testová statistika pro test shody rozptylů (F-test)
Tyto sloupce lze interpretovat pouze pokud rozdíl mezi rozptyly byl neprůkazný!!!
iba
Ě
'WS*
I   Institut biostatistiky a analýz, PřF a LF MU
Párový dvouvýběrový t-test
• Skupiny dat jsou spojeny přes objekt měření, příkladem může být měření parametrů pacienta před léčbou a po léčbě (nemusí jít přímo o stejný objekt, dalším příkladem mohou být např. krysy ze stejné linie).
• Oba soubory musí mít shodný počet hodnot, protože všechna měření v jednom souboru musí být spárována s měřením v druhém souboru. Při vlastním výpočtu se potom počítá se změnou hodnot (diferencí) subjektů v obou souborech.
• V případě, že se nejedná o měření na temže subjektu je vhodné si před párovým testem ověřit si, zda existuje vazba mezi oběma skupinami - vynesení do grafu, korelace.
Existuje několik možných designů experimentu, stručně lze sumarizovat:
• pokus je párový a jako párový se projeví
• párové provedení pokusu - párově se neprojeví
• možná párovost není
• špatně provedený pokus - malé n, velká variabilita, špatný výběr jedinců
• čekali jsme nezávislé a jsou
• čekali jsem nezávislé a nejsou
• vazba
• náhoda
Párový dvouvýběrový t-test
• Tento test nemá žádné předpoklady o rozložení vstupních dat, protože je počítán až na základě jejich diferencí.
• Tyto diference by měly být normálně rozloženy a otázkou v párovém t-testu je, zda se průměrná hodnota diferencí rovná nějakému číslu, typicky jde o srovnání s nulou jako důkaz neexistence změny mezi oběma spárovanými skupinami.
• V podstatě jde o one sample t-test, kde místo rozdílu průměru vzorku a cílové populace je uveden průměr diferencí a srovnávané číslo (0 v případě otázky, zda není rozdíl mezi vzorky).
Někdy je obtížné rozhodnout, zda jde nebo nejde o párové uspořádání, párový test by měl být použit pouze v případě, že můžeme potvrdit vazbu (korelace, vynesení do grafu), jedním z důvodů proč toto ověřovat je fakt, že v případě párového t-testu není nutné brát ohled na variabilitu původních dvou souborů, tento předpoklad však platí pouze v případě vazby mezi proměnnými. Výpočet obou typů testů se vlastně liší v použité s, jednou jde o s diferencí, v druhém případě o složený odhad rozptylu obou souborů.
Zda je párové uspořádání efektivnější lze určit na základě:
Síly vazby
Je-li sD výrazně menší než sxl.x2
2 2 2
Závislost je možné rozepsat pomocí vzorce:       5   = <J   + <J   — 2Cov(x,X.)
v případě Cov=0, tedy v případě neexistence vazby pak sD2 odpovídá součtu původních rozptylů, tedy přibližně Sxl.
Pro srovnání s 0 (testovou statistikou je t rozložení):
S
Příklad 1: Párový dvouvýběrový test
• Byl prováděn pokus s dietou 11 diabetických psů, každý pes byl vystaven dvěma dietám s odlišným typem sacharidů (snadno vstřebatelné X pozvolna se rozkládající na glukózu), hodnoty krevní glukózy v průběhu jednotlivých diet mají být srovnány pro zjištění vlivu diety na hladinu krevní glukózy. Protože každý pes absolvoval obě diety, jde o párové uspořádání, kdy výsledky hodnoty v obou pokusech jsou spojeny přes pokusné zvíře.
1. Nulová hypotéza zní, že skutečný průměrný rozdíl mezi oběma dietami je 0, alternativní hypotéza zní, že to není 0.
2. Pro každého psa je spočítán rozdíl mezi jeho hladinou glukózy při obou dietách a měly by být ověřeny předpoklady pro one sampíe t-test - tedy alespoň přibližně normální
3. Je spočítána testová charakteristika, výpočet vlastně probíhá jako one-sample t-test, kde je zjišťována významnost průměru diferencí obou souborů jako rozdíl mezi touto hodnotou a nulou (nula je hodnota, kterou by průměrná diference měla nabývat, pokud platí nulová hypotéza). T=4.37 s 10 stupni volnosti, skutečná hodnota p=0,0014 a tedy na hladině p=0,05 můžeme nulovou hypotézu zamítnou
4. Závěrem můžeme říci, že nulová hypotéza neexistence rozdílu mezi oběma dietami byla zamítnuta, což znamená, že high-fibre dieta má významný vliv na snížení hladiny krevní
rozložení.
rozdíl_ průměru _vzorku _a_populace   x - /j   x - /j
SE( průměru) s s
glukózy.
Příklad 2: Párový dvouvýběrový test
• Byl prováděn pokus s dietou u 18 diabetických krys, každá krysa byla vystavena dvěma dietám (jedné nové speciální a jedné kontrolní dietě). Protože každá krysa absolvovala obě diety, jde o párové uspořádání, kdy hodnoty v obou pokusech jsou spojeny přes poKusné zvíře. Zjistěte, zda testovaná dieta způsobí změnu hmotnosti u krys (zda se liší hmotnost krys p nové speciální a po kontrolní dietě).
1. Nulová hypotéza zní, že skutečný průměrný rozdíl v hmotnosti krys po speciální a kontrolní dietě je nulový (speciální dieta nevedla ke změně hmotnosti ve srovnání s kontrolní dietou), alternativní hypotéza zní, že rozdíl hmotností je odlišný od nuly (speciální dieta vedla ke změně hmotnosti ve srovnání s kontrolní dietou).
2. Pro každou krysu je spočítán rozdíl hmotností naměřených po obou dietách a měly by být ověřeny předpoklady pro jednovýběrovy t-test - alespoň přibližně normální rozloženi diferencí.
3. Je spočítána testová statistika, výpočet vlastně probíhá jako jednovýběrovy t-test, kde je zjišťována významnost průměru diferencí obou souboru jako rozdíl mezi touto hodnotou a nulou (Oje hodnota, kterou by průměrná diference měla nabývat, pokud platí nulová hypotéza). T=-l,72 s 17 stupni volnosti, skutečná p-hodnota=0,102 a tedy na hladině významnosti a=0,05 nemůžeme nulovou hypotézu zamítnout.
rozdíl_průměru_vzorku_a_populace   x — /n   x -/n
SE(průměru) s s
4.
Závěrem můžeme říci, že nulová hypotéza neexistence rozdílu vlivu na snížení váhy mezi oběma dietami nebyla zamítnuta.
Příklad: Párový dvouvýběrový test
Výběrový průměr ,     „ ,
Výběrová směrodatná odchylka
Počet pozorování
Variable	iVest for Depi Maíked differ^		ndent Sac »ces ariß		tfples (efektivita diety pro krysy} ignificant at p < ,05000				
	Klean	Std.Dv.		N	Diff.	Std.Dv. Diff.	t	df	I  P I
testovaná dieta	186,0556	[59,52011							_1
kontrolní dieta	191,7222	"69,65022		18	-5,88887	13.91994	~72714	17	0,102266
									I
Hodnota testovacího kritéria
Průměrná hodnota diferencí
Výběrová směrodatná odchylka diferencí
iba
Ě
I   Institut biostatistiky a analýz, PřF a LF MU
Neparametrické dvouvýběrové statistické testy
Nepárový Mannův-Whitneyův test Párový Wilcoxonův a znaménkový test
Mannův-Whitneyův U test
• Neparametrická alternativa dvouvýběrového t-testu.
• Počítá s pořadím dat v souborech namísto s originálními daty.
• Předpoklad: rozdělení pravděpodobnosti veličiny ve skupinách se může lišit pouze posunutím. Postup:
1. Stanovíme nulovou a alternativní hypotézu (F(x)=distribuční funkce):
H0: F(Xl)=F(x2) Hi: F(Xl)* F(x2).
2. Čísla obou souborů jsou sloučena a je určeno jejich pořadí v tomto sloučeném souboru.
3. Pro oba výběry zvlášť je spočítán součet pořadí 0^ a T2).
4. Ze součtů pořadí ve skupinách je určena finální hodnota testové statistiky U.
^-(^+1) m-(ri2 + l)
Ul = nM2+—---7l ř/2 = 721722 H--
2 2 U = min(ř/i,ř/2)
5.   Hodnotu testové statistiky U porovnáme s kritickou hodnotou testu, pokud je tato hodnota menší než kritická hodnota testu, zamítáme nulovou hypotézu shody distribučních funkcí obou skupin.
iba
Ě
'WS*
|   Institut biostatistiky a analýz, PřF a LF MU
Mannův-Whitneyův U test - asymptotická varianta
5. Pro velká n1 a n2 (>30) lze využít asymptotické normality statistiky U.
mm m»2(»i + »2 + l)
E(U) =- D(U) =-
2 12
6. Pro testování lze využít Z-statistiky:
7. Pokud |Z|
- uzamítáme nulovou hypotézu o shodnosti distribučních funkcí
IMI i   lnstitut biostatistiky a analýz, PřF a LF MU ^SS* M5!^
Mannův-Whitneyův U test
• Stejně jako řada jiných neparametrických testů počítá i tento test s pořadím dat
v souborech namísto s originálními daty. Jde o neparametrickou obdobu nepárového t-testu a z těchto neparametrických testů má nejvyšší sílu testu (95% párového t-testu).
• V případě Mann-Whitney testu jsou nejprve čísla obou souborů sloučena a je vytvořeno jejich pořadí v tomto sloučeném souboru, pak jsou hodnoty vráceny do původních souborů a nadále se pracuje již jen s jejich pořadím.
• Pro oba soubory je tedy vytvořen součet pořadí a menší z obou součtů je porovnán s kritickou hodnotou testu, pokud je tato hodnota menší než kritická hodnota testu, zamítáme nulovou hypotézu shody distribučních funkcí obou skupin.
Jíl
Ě
'WS*
|   Institut biostatistiky a analýz, PřF a LF MU
Příklad: Mannův-Whitneyův U test
• 17 štěňat bylo trénováno v chození na záchod metodou pozitivní motivace (pochvala, když jde na záchod venku) nebo negativní motivace (trest, když jde na záchod doma). Jako parametr bylo měřeno, za kolik dní je štěně vycvičeno.
• Nulová hypotéza je, že není rozdíl v metodách tréninku, tedy, že oběma metodami je štěně vycvičeno za stejnou dobu.
• Po srovnání rozložení + kvůli nízkému počtu hodnot je vhodné použít neparametrický test.
• Je vytvořeno pořadí hodnot v kompletním souboru.
• Hodnota testové statistiky je určena ze součtu pořadí hodnot v jednotlivých skupinách.
* Jak dopadne testování?
ä ŕ&%s o
YíY 1 f*WW í Ml !   Institut biostatistiky a analýz, PřF a LF MU
Příklad: Řešení v softwaru
Součet pořadí"^
Součet pořadí T2
Hodnota Z statistiky
variable
délka
Manr Whitney U 1 By variable skupin Marked tests are
Rank Sum Group 1
49 50000 103,5
51
st (Spreadsheets) nificant at p <,05000
Rank Sum Group 2
U
p-value
Z
adjusted
p-value
Valid N Group 1
Valid N Group 2
2ř1sided exact p
Q0 IjlýOOOO  -2.11G95 0.034265  -2.11955 0.034045
9 0.027396
r1
Hodnota testové statistiky      Asymptotická p-hodnota
Přesná p-hodnota (použít, jestliže rozsah výběru je menší než 30)
iba
-' IUI i   Institut biostatistiky a analýz, PřF a LF MU
Párový Wilcoxonův a znaménkový test
• Vycházíme z rozdílů párových hodnot a přecházíme na design jednovýběrových testů
• Testuje, zda je medián diferencí (D) párových hodnot roven hodnotě c
H0: D05=c proti h^: D05* c.
Wilcoxonův párový test
1. Spočítáme rozdíly diferencí výběru s testovanou hodnotou mediánu = c.
2. Absolutní hodnoty rozdílů uspořádáme vzestupně a přiřadíme jim pořadí.
3. Spočítáme statistiky Sw+ a Sw~, které odpovídají součtu pořadí kladných (Sw+) a záporných rozdílů (Sw~). Jako finální hodnotu testové statistiky bereme minimum z Sw+a Sw\ Nulovou hypotézu zamítáme, pokud hodnota testové statistiky menší nebo rovna tabelované kritické hodnotě (při dané hladině významnosti a počtu nenulových rozdílů).
Znaménkový párový test
1. Spočítáme rozdíly diferencí výběru s testovanou hodnotou mediánu = c.
2. Spočítáme statistiku Sz+, která odpovídá počtu kladných rozdílů -> test nevyužívá hodnot pořadí původních dat ale pouze informaci, zda se hodnota realizuje nad nebo pod mediánem -> dochází ke snížení síly testu
3. Nulovou hypotézu zamítáme, pokud statistika Sz+ realizuje v kritickém oboru hodnot W=(0,k1)U(k2,n), kde n odpovídá počtu nenulový rozdílů a hodnoty kx a k2 lze dohledat v matematických tabulkách.
Příklad 2: Párový dvouvýběrový test
Byla testována nová dieta pro laboratorní krysy, při pokusu byl zjišťován její vliv na hmotnost v různých liniích krys, bylo proto zvoleno párové uspořádání kdy krysy v obou dietách jsou spojeny přes svoji linii, tj. na začátku byly dvojice krys stejné linie, jedna z nich byla náhodně přiřazena k dietě, druhá z dvojice pak do druhé diety.
1. nulová hypotéza je, že váha krys není ovlivněna použitou dietou, alternativní, že ovlivněni dietou existuje
2. spočítáme diference - tyto diference jsou nenormální a proto je vhodné využít neparametrický test
3. Spočítáme sumu pořadí kladných a záporných diferencí, zde je menší suma záporných diferencí-31
4. výsledkem výpočtu je p>0,05 a tedy nemáme dostatečné důkazy pro zamítnutí nulové hypotézy, nelze říci, že by nová dieta byla efektivnější nez stará
5. pro doplnění výsledků je vhodné zjistit také skutečnou velikost rozdílu hmotností ve skupinách, např. ve formě mediánu
éma při testování 2 a více skupin
Data
Parametrické testy Neparametrické testy
Normální rozdělení v rámci skupin?
I -
NE
zu
Logaritmická transformace
ANO
Homogenita rozptylů]
Normální rozdělení v rámci skupin? I
	NE		
			
Mannův-Whitneyho test, Kruskalův-Wallisův test na původních datech			
ANO
Homogenita rozptylů'
	NE		
			
Mannův-Whitneyho test,			
Kruskalův-Wallisův test *			
	ANO		
			
Dvouvýběrový t-test, AN OVA			
-E
NE
ANO
Mannův-Whitneyho test, Kruskalův-Wallisův test
na původních datech *
Dvouvýběrový t-test, ANOVA na
transformovaných datech
* Při nesplnění předpokladu shody rozptylů mezi skupinami lze použít i parametrický t-test s Welchovou korekcí
m
ju
Ě
'WS*
I   Institut biostatistiky a analýz, PřF a LF MU
éma při testování pomocí párových testů
Data
Normální rozdělení? (normální rozdělení diferencí!)
NE
ANO
Párový Wilcoxonův test / znaménkový test
Párový t-test
Parametrické testy Neparametrické testy
m
Ji;
Ě
'WS*
I   Institut biostatistiky a analýz, PřF a LF MU
Binomické rozdělení
Popis binomického rozložení
Testování hypotéz binomicky rozložených dat
Anotace
• Kromě spojitých dat se setkáváme také s daty kategoriálními, jejichž nejjednodušším případem jsou data binární.
• Binární data jsou popsána binomickým rozdělením, od chování binomického rozdělení je odvozena popisná statistika binárních dat (procento výskytu jevu), její interval spolehlivosti a binomické testy pro srovnání procentuálního výskytů jevů v různých
skupinách.
Alternativní rozdělení
Nastane jedna ze dvou možných varianta
n(x) = n pro x = i n(x) = i - n pro x = o
n(x) = 0 jinak
X = 1
.jev
n
o
x
Ve- *
IMII   lnstitut biostatistiky a analýz, PřF a LF MU
w W
Binomické rozdělení
X.....     celkový počet nastání jevu v n nezávislých pokusech
E(x)= n . n D(x)= n . n (1-n)
n ~ p
d u y
jediný parametr distribuce
určuje tvar distribuce
^ = 0,5
7T = 02
] 0 n n
iba
|   Institut biostatistiky a analýz, PřF a LF MU
Binomické rozdělení jako model pro zkoumání výskytu sledovaného jevu
n.....počet nezávislých opakování
(dotazů)
X.....počet lidí s jistým symptomem
r znamená celkový počet nastání jevu v n nezávislých experimentech
p ~ re.. jediný parametr binomického rozložení
p .... relativní četnost nastání jevu p..........určuje tvar distribuce
r: 0
n
iba
,Oi,
tt = 0,5
Binomická proměnná X
i
-; IMI1   Institut biostatistiky a analýz, PřF a LF MU
n = 0,2
I 0 n n n X
Binomické rozdělení jako model
Jev:   narození chlapce     11 = 0,5 n :     rodina s 5 dětmi r:       0,1,2,3,4,5 chlapců
Vr7
P(r)=      pr (l-p)
ín-r)
n!
!(n-r)!
pr q(n r)
r = 0: (of 5!)(a5)0(a5)5=a°31 r = 1:    ^^(°>5M0,5)4 =0,15625
r = 2: P(r) = 0,3125 r = 3: P(r) = 0,3125 r = 4: P(r) = 0,15625 r = 5: P(r) = 0,031
X: Binomická proměnná
Střed rozložení:
Rozptyl:      em =n'P
D(j) = n • p • (1 - p)
Příklad: n = 100 respondentů r = 20 má symptom
-D-
E (x) = n • p = 20
je střed rozložení
a nejpravděpodobnější
hodnota
iba
|   Institut biostatistiky a analýz, PřF a LF MU
Binomické rozdělení jako model
0,2 -0,18 -0,16 -0,14 -0,12 -
0,1 -0,08 -0,06 -0,04 -0,02 -0 -
P(x = r) =
n
n = 10 P = 0,3
n II II II II II n ^
n = 50 P = 0,1
n
! (n — r) !
(n-r)
q = l-p
n = 30 P = 0,3
n = 100 P = 0,3
........lil lllllllih,
11111111111111 rrTTTrrTTrrTTTrrTTrrTTTrrrrTTn
5 10 15 20 25 30 0       10       20      30       40       50      60       70       80      90 100
n = 50 P = 0,5
0,2 -, 0,18 -0,16 -0,14 -0,12 -
0,1 -0,08 -0,06 -0,04 -0,02 -
n = 50 P = 0,9
t
10     15     20     25     30     35     40     45 50
10     15     20     25     30     35     40     45 50
10      15      20      25      30      35      40      45 50
iba
w
|   Institut biostatistiky a analýz, PřF a LF MU
Binomial distribution showing the number of subjects out of ten in blood group B based on the probability of being in in blood group B of 0,08.
Aplikace binomického rozdělení
Výskyt krevní skupiny B v určité populaci: p = 0,08
.Q
ra
.Q
o
Number in blood group B
Probability
B	B	2
not B	B	1
B	not B	1
not B	not B	0
0,0064 0,0736 0,0736 0,8464
0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0
Binomial distribution of number of people out of two in blood group B
Number: blood group B in 2 cases
iba
/ť
ÉILII1   Institut biostatistiky a analýz, PřF a LF MU
O
0,5 0,4 0,3 0,2 0,1
	0
	0,16
	0,14
	0,12
	
-1—1	0,1
15 ro	0,08
-Q	
O	0,06
i—	
Cl.	0,04
	0,02
	0
□ =
23456789 10
Number of subjects
Binomial distribution showing the number of subjects out of 100 in blood group B based on the probability of being in in blood group B of 0,08.
10    20    30    40    50    60    70    80    90 100
N u m ber of subjects
Aplikace binomického rozdělení
• Populace: 60% jedinců má zvýšenou hladinu cholesterolu; výběr: 5 lidí
• Kolik lidí má ve výběru vyšší hladinu cholesterolu ?
• n. p = 5. 0,6 = 3 lidé  ~ E(x)
• Jaká je P, že právě 3 lidé budou mít vyšší hladinu cholesterolu ? odpovídá dané populaci ?
5!
Pm =     —--(0,6)3 • (OAf = 0,346 = 35%
(3)    3! (5-3)! v    7   v 7
Jaká je P, že většina jedinců (tedy minimálně 3) má vyšší hladinu cholesterolu ? ~ Tzn. výběr alespoň obecně odpovídá zkoumané populaci ?
• P(X > 3) = P(3) + P(4) + P (5) = 0,346 + 0,259 + 0,078 = 68 %
Tzn. Výběr přesně
P(x)
!
1/
X
iba
Ě
I   Institut biostatistiky a analýz, PřF a LF MU
Odhad parametru n binomického rozdělení
• Při vícenásobném odhadu se parametr fl chová jako normálně rozložen
U malých nebo velkých hodnot p (11) je však předpoklad normality omezen
m
1   Institut biostatistiky a analýz, PřF a LF MU
J(x)
Odhad parametru ľl binomického rozložení
	p=r/ 1 /n	
1) Bodový     ^ 2 P'  sp =	. £(l_ P) n-í	
2) Intervalový - aproximace		Íp(í-p) í n-l
J//
I   Institut biostatistiky a analýz, PřF a LF MU
Odhad parametru ľl binomického rozložení: příklad I
X: % jedinců s daným znakem n = 100 jedinců r = 60;   p = 0,6
sp = 0,049
Interval spolehlivosti : 95 %
Z 0,975 = 1,96
0,6 -1,96 • 0,049 < n < 0,6 +1,96 • 0,049
0,504 < n < 0,697
P(0,504 < ;r< 0,697) > 0,95
iba
s /^Sřv <0
lYSYí ?'"¥Vt í llll !   Institut biostatistiky a analýz, PřF a LF MU
w %J#' w
Odhad parametru ľl binomického rozložení
• Intervalový odhad bez aproximací na normálni rozložení
	r r + (n-r + \)-F^V2) n spodní limit intervalu           vi ~~ '	l{n-r + \)\ v2 = 2r
		
	/2 " «-r + (r + l)-FJ/í;vi)	v; = 2(r + l) = v2 + 2
U	Á	v'2 = l(n-r)=vl-2
	horní limit intervalu	
P(LX <n <L2)>\-a
■J    ľVfV'í f"í    VI ŕ|U| I   Institut biostatistiky a analýz, PřF a LF MU
iba *>m? w w
Odhad parametru ľl binomického rozložení: příklad II
Náhodný vzorek n = 200 jedinců.
Zjištěno pouze r = 4 jedinci bez určitého znaku.
p = 14oo = 2£Í
95% interval spolehlivosti = ?
ví = 2(n-r + í)= 2(200 -4 +1) = 394 v -2r=2-4 = 8
v1' = 2(r + l)=10
v'2 = 2(n - r) = 2(200 - 4) = 392
F?y] = 3,67
1 /2 -
'    4 +(200-4 + 1)-3,67
0,0055
F
(10; 392)
2,08
(4 + 1)-2,08
200-4 +(4 + 1)-2,08
0,051
_____________j
iba
|   Institut biostatistiky a analýz, PřF a LF MU
Binomické rozložení v datech: vizualizace
MU r<
n(x)
1
n X
Pravděpodobnost výskytu hodnot X
n opakování       jev ANO
jev NE
Binární podstata původních hodnot
iba
i
-; IMI1   Institut biostatistiky a analýz, PřF a LF MU
Interval spolehlivosti pro fl
Statistické testování binomických dat
Liší se odhad jd od předpokládané hodnoty P ?
Liší se dva nebo více odhadů jd ?
- závislé odhady -
- nezávislé odhady -
Je výskyt kategorií dvou jevů nezávislý 1
Hodnocení relativního rizika z výskytu určitého jevu v rámci skupiny lidí
MU     ŕ'jgj^r -&^?**'\
- #wV\ ;    , •- • ŕlUI §   Institut biostatistiky a analýz, PřF a LF MU
*-&/ m& \W
iba
Jednovýběrový binomický test
H,
Testová statistika
Interval spolehlivosti
p<n
p>n
z > Z i-a
p>n
p<n
z < z
a
P = n
YtzYt > z t
a/2
Z =
p-n-n
n-p-n-n
-0,5
Korekce na kontinuitu
Ho		Testová statistika	Interval spolehlivostí
p<n	p>n	(r -+-	p = r/n > Lx
		// — r~ -\- Cr~ -\- 1) Z7,	
p>n	p<n	Í2 = /" + ( n — /- + 1 ) /v a,V[ ,v2	p < L2
P = n	P^n	'■l' ^2 (F „/aj F i-a/2'	p < L2 v p > Li
mm t ŕ
&' w \»
IMI i   Institut biostatistiky a analýz, PřF a LF MU
Test 7i ? p: Příklad 1
• Stromy s pozměněným tvarem koruny
• n = 9 000 jedinců
• r = 2 250 změněných jedinců
• Jak je pravděpodobná změna u až 1/3 jedinců?
z _   n • p - n • 7T   _       225Q - 3QQQ _ ^} p(V - p)n      JO,2,5 -0,75 - 9000
a = 5%; Z 1,96; Z ^=1,645 Z > Z i_a/2.........zamítáme H0: p < 0,01
• 95 % Interval spolehlivosti ... p: (0,241; 0,258)
<ús& /í«?y <o
?YiYí * lili !   Institut biostatistiky a analýz, PřF a LF MU
w w w
Test 71 ? p: Příklad 2
• Pravděpodobnost narození chlapce je asi 1/2.
• Máte zhodnotit výsledky průzkumu populace, která žije v silně poškozeném životním prostředí.
• Průzkum se týká 1000 náhodně vybraných rodin a zjištěný podíl narozených chlapců je 0.41.
Jaké jsou vaše závěry o této populaci (zda se rodí stejný podíl chlapců jako v běžné populaci?)
Jak se váš odhad zpřesní, když použijete vzorek n = 10 000 rodin při zachování odhadu p = 0.41?
Test n ? p: Příklad 2
• Použijeme jednovýběrový binomický test s nulovou hypotézou HO: p=K, hladina významnosti a=0,05
• Testová statistika: a příslušný kvantil:
• Protože nulovou hypotézu ???
• Interval spolehlivosti:
• Pokud použijeme n=10 000, bude int. spolehlivosti ???:
M_      ryli í ff¥*& * IIJI1   Institut biostatistiky a analýz, PřF a LF MU
iba
Test 71 ? p: Příklad 2
• Použijeme jednovýběrový binomický test s nulovou hypotézou HO: p=K, hladina významnosti a=0,05
• Testová statistika: z■ -g^ -ľa Příslušný kvantil: V2"" "'96
• Protože \z|>z0,975 nulovou hypotézu zamítáme. Chlapci se ve zkoumavé populaci nerodí s pravděpodobností 0,5.
• Interval spolehlivosti: ^ p+z1 _^^pE5=0,4±z0 975 -o,o46=0,41+1,%-0,010=0,41+0,03
• Pokud použijeme n=10 000, bude int. spolehlivosti užší:
n: p + Z    ■ jp(l~p) = 0,41 +1,96• 0,005 = 0,41 + 0,01
1 A  V   n — l
M_      ľVfV'í        '•   ŕ|U| I   Institut biostatistiky a analýz, PřF a LF MU
iba *>m? w w
Test 71 ? p: Příklad 3
Příklad testu bez aproximace na normální rozložení
12 jedinců bylo zkoumáno pro výskyt určitého znaku, 10 jedinců znak nemělo
*p Jak hodně se tento výsledek liší od výsledku 6 - 6: tedy od situace, kdy polovina •    jedinců znak má?
a) Využití distribuční funkce
r	0	1	2	3	4	5	6	7	8	9	10	11	12
P(r)	0,0002 4	0,0029 3	0,0161 1	0,0537 1	0,1208 5	0,1933 5	0,2255 9	0,1933 6	0,1208 5	0,0537 1	0,0161 1	0,0029 3	0,0002 4
,Oi,
P (r > 10) = 0,01611 + 0,00393 + 0,00024 = 0,01928
H0: p = 0,5 je tedy značně nepravděpodobná b) Pozorované      p = 1^/^ = 0,833   překročilo horní limit 95 % intervalu
spolehlivosti pro p:
p = 0,5 : L2 =
(6 + l)-2,64
12-6 +(6 + 1)-2,64
= 0,755
tba W ^ W
|   Institut biostatistiky a analýz, PřF a LF MU
Dvouvýběrový binomický test (pi ? p2)
z =
✓v
P\
PA
p(y-p), M1-/7)
f z
(A-p2)±z(1_
p(l-p) , p(l-p)
Ur
MU r<
/BA
i ■   ■ - . -
IUI i   Institut biostatistiky a analýz, PřF a LF MU
^»
Dvouvýběrový binomický test (pi ? p2)
• Tento příklad je ukázkou testování rozdílů mezi dvěma binomickými populacemi (tedy srovnání dvou odhadů parametru p).
• Celkem 49 pokusných myší bylo použito k testování toxického preparátu během dvouměsíční kultivace. Následující tabulka obsahuje původní data zároveň s testem nulové hypotézy: Podíl přežívajících jedinců je u zasažené populace stejný.
	Alive	Dead	Total	Proportion alive	Proportion dead
Treated	15	9	24	p1 = 0,625	qx = 0,375
Not Treated	10	15	25	p2 = 0,400	q2 = 0,600
Total	25	24	49	p = 0,510	q = 0,490
z =
0,625 - 0,400
0,225
J(0,510) (0,490)	(0,510) (0,490)	A/0,010413 +0,009996
AÍ 24	25	
= 1,573
II    y     Nezamítáme H0: 0,10 < P < 0,20
Z0,05(2) = t0,05(2) = 1,96
S korekcí
15-0,5   10 + 0,5
na kontinuitu: z = ——
25
0,604 - 0,420
= 1,287
0,143 0,143
Nezamítáme H0: 0,10 < P < 0,20
MU ^
iba
Í^Wtí' i IUI I   Institut biostatistiky a analýz, PřF a LF MU
<w«»*
Z0,05(2) = t0,05(2) = 1,96
Přednáška 8
Kontingenční tabulky
Test dobré shody Fisherův přesný test McNemar test Odds ratio a relativní riziko
Anotace
• Analýza kontingenčních tabulek umožňuje analyzovat vazbu mezi dvěma kategoriálními proměnnými.
• Základním způsobem testování je tzv. chi-square test, který srovnává pozorované četnosti kombinací kategorií oproti očekávaným četnostem, které vychází z teoretické situace, kdy je vztah mezi proměnnými náhodný.
• Test dobré shody je využíván také pro srovnání pozorovaných četností proti očekávaným četnostem daným určitým pravidlem (typickým příkladem je Hardy-Weinbergova rovnováha v genetice)
• Specifickým typem výstupů odvozených z kontingenčních tabulek jsou tzv. odds ratia a relativní rizika, využívaná často v medicíně pro identifikaci a popis rizikových skupin
pacientů.
Co je kontingenční tabulka ?
• Frekvenční sumarizace dvou kategoriálních proměnných (binárních, nominálních nebo ordinálních proměnných).
• Obecně: R x C kontingenční tabulka (R - počet kategorií jedné proměnné, C- počet kategorií druhé proměnné).
• Speciální případ: 2x2 tabulka = čtyřpolní tabulka.
• Kontingenční tabulky: absolutních četností, celkových procent, řádkových/sloupcových četností
• Př.: Sumarizace vyšetřených osob podle pohlaví a výsledku diagnostického testu.
	Výsledek vyšetření		
Pohlaví	Nemocný	Zdravý	Celkem
Muž	45	11	56
Žena	25	6	31
Celkem	70	17	87
■_      ľVfV'í -   i\ií\ I   Institut biostatistiky a analýz, PřF a LF MU
iba *>m? w w
Ukázka kontingenční tabulky
• Vztah pohlaví a výskytu onemocnění (pozor na hodnocení nesmyslného vztahu)
	Nemocný Zdravý	Celkem
Muž Žena	a b	+ k |—^ Marginální absolutní
	c dl	c + d
Celkem	a + c             b + d \N	a + b + c + d = N ^^►celkový počet hodnot
Simultánní absolutní četnost		
	Nemocný Zdravý	Celkem j
Muž Žena	45 11 25 6	56 31 A^s^
Celkem	70 17	V—y 87               jsou více nemocní
muži nebo ženy?
■_      ľVfV'í        '•   i\ií\ I   Institut biostatistiky a analýz, PřF a LF MU
iba *>m? w w
Test dobré shody - základní teorie
Testová statistika:
x
-z
X
[pozorovaná - očekávaná"] četnost četnost I
očekávaná četnost
ľpozorovaná - očekávaná I 2 [pozorovaná- očekávaná] 2 četnost četnost    J [četnost četnost J
+
očekávaná četnost
očekávaná četnost
1. jev
2. jev
zamítáme H
o
1 - hladina významnosti
stupně volnosti
iba
m A-Äk <>
I   Institut biostatistiky a analýz, PřF a LF MU
^rí.>
Test dobré shody: příklad
x (d _
Binomické jevy (1/0)
[pozorovaná     očekávaná |^       [pozorovaná    očekávaná]^ četnost       ~ četnost    J [četnost četnost J
očekávaná četnost
očekávaná četnost
Příklad
MU r<
iba
i  ■   ■ - . -
I. jev 1
J   10 000 lidí hází mincí
I. jev 2
-> rub: 4 000 případu (R) líc: 6 000 případů (L)
Lze výsledek považovat za statisticky významně odlišný (nebo neodlišný) od očekávaného poměru R : L = 1 : 1 (tzn. že je výsledek hodu mincí náhodný)?
X
(4000 - 5000)2     (6000 - 5000)'
5000
5000
= 400
Tabulková hodnota: J(095)(v = fc-i = i) = 3,84 (o,95 = i-or)
Rozdíl je vysoce statisticky významný (p < 0,001)
IUI i   Institut biostatistiky a analýz, PřF a LF MU

Kontingenční tabulka - hypotézy
• NEZÁVISLOST (Pearsonův chí-kvadrát test, Fisherův exaktní test)
• Jeden výběr, 2 charakteristiky-obdoba nepárového uspořádání
• Např.: existence vztahu mezi barvou očí a známkou z biostatistiky u studentů
• SHODA STRUKTURY (Pearsonův chí-kvadrát test, Fisherův exaktní test)
• Tzv. test homogenity
• Více výběrů, jedna charakteristika - obdoba nepárového uspořádání
• Např.: věková struktura pacientů s diabetem v K nemocnicích (tj. K výběrů)
• SYMETRIE (McNemarův test)
• Jeden výběr, opakovaně jedna charakteristika - obdoba párového uspořádání
• Např.: posouzení stavu stromů ve dvou sezónách
Základní rozhodování o výběru statistických testů - analýza kontingenčních tabulek
Spojitá x spojitá data
Spojitá x kategoriální data
Jeden výběr
Pearsonův korelační koeficient
Spearmanův korelační koeficient
			Tři a více	
	Dva výběry		výběrů	
				nepárově)
1		1		
Párová data
Jednovýběrový t-test
Wilcoxonův / znaménkový test
Nepárová data
Párový t-test
Wilcoxonův / znaménkový test
Dvouvýběrový t-test
Mannův-Whitneyho / mediánový t.
Parametrické testy Neparametrické testy
A N OVA
Kategoriální x kategoriální data
Jeden výběr
Kruskalův-Wallisův test / mediánový t.
1
Více výběrů
Párová data
Jednovýběrový binomický test
1
Nepárová data
McNemarův test
Chí-kvadrát test
Fisherův exaktní test
IUI i   Institut biostatistiky a analýz, PřF a LF MU
Kontingenční tabulka - obecně
Máme dvě nominální veličiny, X (má r variant) a Y (má s variant) Kontingenční tabulka typu r x s
hu
l[r]
n
.k
Y[s]
n
11
n
rl
n
.1
Označení:
• njk- simultánní absolutní četnost,
• nj.- marginální absolutní četnost
Marginální absolutní četnost
n
ls
"rs
n
n1
IX
n
Marginální absolutní četnost
Simultánní absolutní četnost
iba
Ě
I   Institut biostatistiky a analýz, PřF a LF MU
Kontingenční tabulky HO :Nezávislost dvou jevů A a B
Kontingenční tabulka 2x2
	+	-	Podíl (+)
+	a	b	
-	c	d	
Podíl (+)	CL		
	(či -h ( )	(p -+- cl)	
N=a+b+c+d
(a + b)
p(b-)=
N (c + d) N
Očekávané četnosti:
f =
1 (A)
f =
1 (B)
(a + b)(a + c) N
(a + b)(b + d) N
f =
1 (C)
f =
(D)
(a + c) (d + c) N
(b + d)(c + d) N
v = l = (r-l)*(c-l)
P(A)>P(B)
I' =1
i=\
F
f,i-F,i - °4
^% /í?ž.v <>
1 > íeW%.- i lili |   Institut biostatistiky a analýz, PřF a LF MU
Očekávané četnosti v kontingenční tabulce
• Očekávané četnosti pro výpočet testu dobré shody v kontingenční tabulce odpovídají tabulce, která nemá žádný vztah mezi řádky a sloupečky (náhodný vztah řádků a sloupců)
Za) =
r
I pozorovaná I četnost
očekávaná četnost
očekávaná četnost
Počítáno pro každou buňku tabulky
	9				©
A	10	0	A	5	5
B	0	10	B	5	5
Pozorovaná tabulka
Očekávaná tabulka
iba
Ě
'WS*
|   Institut biostatistiky a analýz, PřF a LF MU
Testování nezávislosti - Pearsonův chí-kvadrát test
• Souvisí spolu výskyt dvou nominálních znaků měřených na jediném výběru?
• Příklad: Barva očí (modrá, zelená, hnědá) a barva vlasů (hnědá, černá, blond) u vybraných 30 studentů jsou nezávislé.
• Nulová hypotéza: Znaky X a Y jsou nezávislé náhodné veličiny.
• Alternativní hypotéza: Znaky X a Y jsou závislé náhodné veličiny.
• Test: Pearsonův chí-kvadrát
2 H0 platí
-   *   r((r~ l)Cs-l))
*=ZZ
(n
• Očekávané (teoretické) četnosti ejk: ejk =-LJl
• HO zamítáme na hladině významnosti a, pokud K> xl_a({r-\){s-\))
• Předpoklady testu ?
Testování nezávislosti - Pearsonův chí-kvadrát test
Předpoklady Pearsonova chí-kvadrát testu:
• Jednotlivá pozorování shrnutá v kontingenční tabulce jsou nezávislá, tj. každý prvek patří jen dojedná buňky kont. tabulky nemůže zároveň patřit do dvou.
• Podmínky dobré aproximace: Očekávané (teoretické) četnosti jsou aspoň v 80 % případů větší nebo rovné 5 a ve 100 % případů nesmí být pod 2 (pokud není tento předpoklad splněn, je vhodné sloučit kategorie s nízkými četnostmi).
• Měření síly závislosti:        / K
Cramérův koeficient:
Význam hodnot: 0-0,1....zanedbatelná závislost
0,1-0,3...slabá závislost 0,3-0,7...střední závislost 0,7-1 silná závislost
Kontingenční tabulky: příklad
	Ano	Ne	Z
Ano	20	82	102
Ne	10	54	64
Z	30	136	166
FA= 102*30/166 = 18,43 FB = 102* 136/166 = 83,57 Fc = 11,57 FD = 52,43
(20 -18,43)2   (82 -83,57)2   (lO-11,57 )2 (54-52,43)
18,43
+
+
+
83,57 11,57 52,43
Kontingenční tabulka v obrázku
= 0,423    0,423 < xl
2 (1) = 3 84
95 J,0^+
c: 49%
Gen: ANO % 80
20
d: 33%
Gen: NE
84,4
Zemřelí Žijící
Zemřelí Žijící
w w ^
IIJI i   Institut biostatistiky a analýz, PřF a LF MU
Výstup řešení v SW
Tab.l: Pozorované četnosti
Tab. 2: Očekávané četnosti
Summary Frequency Table (07 priklad_z_prednasky_K Marked cells have counts > 10 (Marginal summaries are not marked)					Summary Table: Expected Frequencies (07 priklad_z_pre Marked cells have counts > 10 Pearson Chi-square: .421322. df= 1, p=,516278		
Gen	Stav_pacienta úmrtí	Stav_pacienta žijící	Row Totals		Gen Stav_pacienta .-úmrtí-	Stav_pacienta -žijící-.	Row Totals
;iitc~en	20	G2	102		přítomen 18,43373	53 5663	102,00001
nepřítomen	10	54	64		necntc-en 11.56627	52.4337	64.0000 i
All Grps	30 13E		1EE		All Grps             30,000004 136,0000		166,0000
Jsou splněny podmínky dobré aproximace?
Tab. 3: Paersonův chí-kvadrát
Hodnota testové statistiky
Počet stupňů volnosti
Statistic
Pearson Chi-square
M-L Chi-square
Phi for 2 x2 tables
Tetrachoric correlation
Contingency coefficient
tatistics: Ger^ f.) x Stav_p; Chi-square   df _n
42132231 ďFT
df=l
,0503794 0949754 ,0503156
p- hodnota
iba
- IIJI1   Institut biostatistiky a analýz, PřF a LF MU
R x C kontingenční tabulka
Výběr: N lidí ze sociologického průzkumu (delikventi) Jev A: Původ z rozvrácených rodin Jev B: Stupeň zločinnosti I < II < III < IV
P a =
	1.	II.	III.	IV.
	a	b	c	d
	e	f	g	h
číslo2
Stupně volnosti: (R-1) * (C-1) = 1 *3 = 3
číslo 1 • číslo 2
N
2
číslo 1
Tabulky:
Očekávané četnos
a
a + e
y2 M /C (1-a)
Pb =
b + f
Pc =
c + g
P d =
d d + h
iba
|   Institut biostatistiky a analýz, PřF a LF MU
Rekódování kategoriálních proměnných na binární
Původní	Dummies				Vzhledem k referenci		
NYHA	NYHA 1	NYHA II	NYHA III	NYHA IV	NYHA II ref	NYHA III ref	NYHA IV ref
1	1	0	0	0	0	0	0
1	1	0	0	0	0	0	0
1	1	0	0	0	0	0	0
II	0	1	0	0	1		
II	0	1	0	0	1		
III	0	0	0	0		1	
III	0	0	0	0		1	
IV	0	0	1	1			1
IV	0	0	1	1			1
iba
Ě
|   Institut biostatistiky a analýz, PřF a LF MU
Rekódování kategoriálních proměnných na binární
• Kategoriální a ordinální data mohou do analýzy vstupovat jako binární proměnné
• Kategoriální data (nelze seřadit) -> dummies
• Ordinální data (lze seřadit)
• Dummies
• Definice referenční kategorie (obvykle kategorie s nejnižším rizikem pro hodnocený endpoint
• Příklad: The New York Heart Association (NYHA) Functional Classification
Původní	Dummies				Vzhledem k referenci		
NYHA	NYHA 1	NYHAN	NYHA III	NYHA IV	NYHA II ref	NYHA III ref	NYHA IV ref
1	1	0	0	0	0	0	0
1	1	0	0	0	0	0	0
1	1	0	0	0	0	0	0
II	0	1	0	0	1		
II	0	1	0	0	1		
III	0	0	0	0		1	
III	0	0	0	0		1	
IV	0	0	1	1			1
IV	0	0	1	1			1
iba
'WS*
I   Institut biostatistiky a analýz, PřF a LF MU
Test dobré shody: příklad I
Ověřte na datech z pokusu se 100 květinkami určitého druhu, že barva květů se geneticky štěpí v poměru žlutá : červená = 3:1.
H0: Pozorovaná frekvence pro jednotlivé barvy květů jsou vzorkem populace mající poměr mezi žlutými a červenými květy 3:1.
Součet frekvencí u obou barev květů (f;) se rovná 100 a pozorované frekvence u kategorií barvy budou srovnány s očekávanými frekvencemi (uvedeny v závorkách):
	Kategorie barvy		
		Červená	n
^ poz.	84	16	100
^ oček.	75	25	
X
^ {fpoz. - Ú _ (84 - 75)2 | (16 - 25)2 _ ^
f
75
25
St. volnosti = n = k -1 =1
Zamítáme hypotézu shody srovnávaných četností
Při testování H0 jsme použili matematický zápis (0,025 < P < 0,05). Z tabulek %2 rozložení vidíme, že pravděpodobnost překročení hranice 2,706 je 0,1 (10 %), což může být stručně zapsáno jako P(x2> 2,706) = 0,10.
Dále lze zjistit pro P (%2 > 3,841) = 0,05. V řešené úloze jsme dospěli k hodnotě testové statistiky y2 = 4,320. Pro tento případ lze tedy psát 0,025 < P {j2 > 4,320) < 0,05; a jednodušeji 0,025 < P < 0,05. Jde v podstatě o přibližné určení hranic chyby 1. druhu.
iba
Ě
'WS*
I   Institut biostatistiky a analýz, PřF a LF MU
Test dobré shody: příklad II
Tento příklad je rozšířením problému z příkladu 1 na srovnání pozorovaných a očekávaných frekvencí pro více kategorií sledovaného znaku:
Celkem bylo zkoumáno 250 semen určitého druhu rostliny a roztříděno do následujících kategorií: žluté/hladké; žluté/vrásčité; zelené/hladké; zelené/vrásčité. Předpokládaný poměr výskytu těchto kategorií v populaci je 9 : 3 : 3 : 1. Následující tabulka obsahuje původní data z pozorování a dále postup při testování H0.
	žluté/hladké	žluté/vrásčité	zelené/hladké	zelené/vrásčité	n
^ poz.	152	39	53	6	250
^ oček.	140,6250	46,8750	46,8750	15,6250	
v = k-1 =3
2 11,37501 7,87501 6,1250 X =-+-+-
_+^!=8,972
140,6250    46,8750    46,8750 15,6250
DDI
Zamítáme hypotézu shody pozorovaných četností s očekávanými
iba
,Oi,
■SEA
fj- Sa-
IM i  Institut biostatistiky a analýz, PřF a LF MU
Test dobré shody: příklad
Složitější příklady řešené srovnáváním frekvencí je možné rozdělit na testování dílčích
hypotéz:
/Předpokládejme, že chceme pro data z předchozí úlohy testovat hypotézu existence štěpného poměru 9 : 3 : 3 pro první tři kategorie semen:
	žluté/hladké	žluté/vrásčité	zelené/hladké	n
	152	39	53	244
^ oček.	146,400	48,800	48,800	
n = k-1 =2
5,600
9,800
146,40 48,80
4,200 2 48,80
2,544
Nezamítáme hypotézu shody pozorovaných četností s očekávanými.
Nyní otestujeme hypotézu štěpného poměru kategorií zelené/vrásčité:ostatní typy =1:15
	zelené/vrásčité	ostatní	n
	6	244	25
^ oček	15,625	234,375	
n = k-1= 1
9,625 2
9,625
15,625 234,375
= 6,324
Zamítáme hypotézu shody pozorovaných četností s očekávanými.
IUI i   Institut biostatistiky a analýz, PřF a LF MU
Testování homogenity (shody struktury)
• Motivace: Zajímá nás výskyt nominálního znaku u r nezávislých výběrů z r různých populací.
• Příklad: Je zájem o sport stejný u děvčat jako u chlapců?
• Nulová hypotéza: pravděpodobnostní rozdělení kategoriální proměnné je stejné v různých populací
• Test: Pearsonův chí-kvadrát
		Dívky	Chlapci	
Zájem	Ano	a	b	a+b
o sport	Ne	c	d	c+d
		a+c	b+d /	n
Některé marginální četnosti (buďsloupcové nebo řádkové) jsou předem pevně stanoveny
■J    íVfVt -    V- I   Institut biostatistiky a analýz, PřF a LF MU
iba *>m? w w
Test homogenity binomických rozložení
E
Jev: Úmrtnost na leukemii
Předpoklad: n = 0,6
Absolutní četnost jevu označena r.
Sledovalo s autorů z s zemí:
- 2>
Autor	n.	r.	Pi
l			
2			
s			
Test homogenity binomických rozložení
O Po možném sloučení s výběrů
Test shody reálného r fcr)
% S-l
fen Pí - pY,ri)
p
\Zri-N-u\
n • n • (i - n)
IBA     ^ W W
I   Institut biostatistiky a analýz, PřF a LF MU
Test homogenity binomických četností: příklad
Pomocí %2 rozložení lze rovněž posuzovat homogenitu většího množství nezávislých
pokusů testujících tutéž hypotézu.
Bylo provedeno 6 nezávislých výběrů z populace mladých mužů, kteří v dětství onemocněli těžkým zánětem mozkových blan.
H0: V této populaci se vyskytují praváci a leváci v poměru 1:1.
iba
,Oi,
Nalezněte v literatuře příslušné vztahy pro testování homogenity všech šesti výběrových populací a na základě výsledků tohoto testu rozhodněte o dalším postupu.
Následující tabulka obsahuje původní data a výsledek testování (v závorkách jsou uvedeny očekávané četnosti):
Vzorek	Praváci	Leváci	n	3C2	St. volnosti
l	3(7)	11(7)	14	4,5714	l
2	4(8)	12 (8)	16	4,000	l
3	15(10)	5(10)	20	5,000	l
4	14 (9)	14(9)	18	5,5556	l
5	13 (8,5)	4 (8,5)	17	4,7647	l
6	17 (11)	5(11)	22	6,5455	l
y = 30 2
/L heterogeni ta '
v=s-\=5 P < 0,001
Jednoduchým testováním lze zjistit, že všechny testy pro jednotlivé výběry jsou významné, což znamená, že ani v jednom případě nebyla potvrzena shoda očekávaných a pozorovaných četností. Test homogenity štěpného poměru v zkoumaných populacích rovněž vedl k zamítnutí možnosti sloučit jednotlivé výběry a posuzovat je jako celek (kromě testovaného poměru 1 neexistuje tedy v datech žádný jiný jednotný štěpný poměr mezi oběma vlastnostmi.
V případě, že by tento test neprokázal odchylky mezi jednotlivými výběrovými populacemi, bylo by možné jednotlivé odběry sloučit a posuzovat jako homogenní vzorek.
W ř lili f   Institut biostatistiky a analýz, PřF a LF MU
test - příklad frakcionace složitější kontingenční ta
Cílem rozsáhlejšího průzkumu populace bylo prozkoumat vztah mezi dvěma typy chorob a krevními skupinami u lidí. Konkrétní data jsou uvedena v tabulce:
Krevní skupina	Žaludeční vředy	Rakovina žaludku	Kontrola	Celkem
0	983	383	2892	4258
A	679	416	2625	3720
B	134	84	570	788
Celkem	1796	883	6087	8766
Vypočítejte testovou charakteristiku pro tuto kontingenční tabulku a otestujte nulovou hypotézu nezávislosti jevů {j2 = 40,54; 4 st. volnosti)
■j * |^| ^   lnstitut biostatistiky a analýz, PřF a LF MU
99
%2 test - příklad frakcionace složitější kontingenční tabulky
K podrobnějšímu průzkumu složitějších tabulek výrazně napomáhá přepis původní tabulky
do podoby procentického zastoupení kategorií:
Krevní skupina	Žaludeční vředy	Rakovina žaludku	Kontrola
0	983	383	2892
A	679	416	2625
B	134	84	570
Celkem	1796	883	6087
Z této tabulky je patrné:
1.
2.
Jsou jenom malé rozdíly v distribuci krevních skupin u kontroly a u skupiny nemocných rakovinou žaludku.
Pacienti s vředy mají mnohem častěji krevní skupinu 0.
Na základě těchto poznatků je možné sestrojit menší kontingenční tabulku, která otestuje hypotézu o shodné distribuci krevních skupin pro nemocné rakovinou a pro zdravé lidi. Sestavte tuto tabulku a otestujte nulovou hypotézu. (%2 = 5,64 (2 st. v.), P je přibližně rovna 0,06)
iba
i  ■   ■ - '. -
IMI i   Institut biostatistiky a analýz, PřF a LF MU

%2 test - příklad frakcionace složitější kontingenční tabulky III
• Z tohoto dílčího testu vyplývá možnost sloučení skupiny nemocných rakovinou a zdravých lidí neboť se vzhledem k distribuci krevních skupin chovají jako homogenní populace.
• Dalším logickým krokem v podrobné analýze je testování shody relativních četností výskytu krevních skupin A a B mezi kombinovaným vzorkem (sloučená skupina s rakovinou a kontrola) a mezi vzorkem lidí nemocných žaludečními vředy - tzn. nyní neuvažujeme krevní skupinu 0. Výsledkem tohoto testu je %2 = 0,68 (1 st. vol.); P > 0,7. Vzorky pro krevní skupiny A a B lze tedy sloučit do směsného vzorku A + B.
• Nyní otestujeme shodu relativních četností výskytu skupiny 0 oproti A + B, a to mezi kombinovanou populací (kontrola + nemocní rakovinou) a mezi vzorkem nemocných vředařů (c2 = 34,29; 1 st. vol.).
• Lze tedy shrnout, že vysoká hodnota původního c2 se 4 st. volnosti byla způsobena zvýšenou četností lidí s krevní skupinou 0 mezi nemocnými žaludečními vředy.
test - příklad frakcionace složitější kontingenční tabulky IV
Průběh hodnocení lze shrnout do tabulky:
Srovnání	St. volnosti	X2
0, A, B skupina u pacientů s rakovinou (r) x kontrola (k)	2	5,64
A, B skupina u pacientů s vředy x kombinovaný vzorek (r + k)	1	0,68
0, A, B skupina u pacientů s s vředy x kombinovaný vzorek (r + k)	1	34,29
Celkem	4	40,61
Celkový součet testových statistik %2 (40,61) odpovídá přibližně původní hodnotě x2 (40,54). Což platí i o stupních volnosti (4). Tato skutečnost potvrzuje, že jsme detailním rozborem vyčerpali informační obsah původní kontingenční tabulky a kromě popsané závislosti (zvýšený výskyt krevní skupiny 0 u lidí s žaludečními vředy) jsou jednotlivé kategorie zkoumaných jevů zcela nezávislé.
<P ^ IMI ^   lnstitut biostatistiky a analýz, PřF a LF MU
Kontingenční tabulka 2x2: Řešení při nedostatečné velikosti vzorku
Yates' corection
Fisher's exact test
H0: Nezávislost jevů
Test analyzuje všechny možné 2x2 tabulky, které dávají stejnou sumu řádků a
sloupců jako tabulka zdrojová. Algoritmus každé tabulce přiřazuje pravděpodobnost, že taková situace nastane, je-li
H 0 pravdivá.
Spectacle wearing among juvenile delinquents and non-delinquents who failed a vision
test (Weindling et al., 1986)
Juvenile delinquents    Non- deliquents Total
Yes 1 5 6
Spectacle wearers----
No 8 2 10
Total 9 7 16
iba
Ě
I   Institut biostatistiky a analýz, PřF a LF MU
Kontingenční tabulka 2x2: Řešení při nedostatečné velikosti vzorku
Všechny možné varianty tabulky s danou sumou řádků a sloupců
(I)
(II)
(III)
(IV)
0 9
1 8
2 7
3 6
6 1
5 2
4 3
3
4
(V)
(VI)
(VII)
4
5
5 4
6 3
2 5
1 6
0 7
Pravděpodobnost náhodného vzniku variant tabulky
	a	b	C	d	P
(1)	0	6	9	l	0,00087
(II)	1	5	8	2	0,02360
(III)	2	4	7	3	0,15734
(IV)	3	3	6	4	0,36713
(V)	4	2	5	5	0,33042
(VI)	5	1	4	6	0,11014
(VII)	6	0	3	7	0,01049
Total					0,99999
Ä,   áÄ'v?* Ä
IMI i   institut biostatistiky a analýz, PřF a LF MU
Fisherův exaktní test
• Využití ve čtyřpolní tabulce (v současnosti i větší díky vyššímu výkonu počítačů) s nízkými četnostmi, které znemožňují použití Pearsonova chí-kvadrát testu.
• Patří mezi neparametrické testy pracující s daty na nominální škále, v nejjednodušší podobě ve dvou třídách: pozitivní/negativní, úspěch/neúspěch apod.
• Nulová hypotéza předpokládá rovnoměrné zastoupení sledovaného znaku u dvou nezávislých souborů.
• Slovo exaktní (přímý) znamená, že se přímo vypočítává pravděpodobnost odmítnutí, resp. platnosti nulové hypotézy.
Fisherův exaktní test
• Výpočet „přesné" p-hodnoty, která zde hraje roli testové statistiky: • spočítá se parciální pravděpodobnost čtyřpolní tabulky pl:
Sledovaný jev	Skupina		
	Experimentální	Kontrolní	Celkem
Ano	a	b	a + b
Ne	c	d	c + d
Celkem	a + c	b + d	n
Pí =
(a+b}! * (c+d)! * (a+c}! * (b+d}!
N! * a! * b! * c! * d!
• Spočítá se pa všech možných tabulek při zachování marginálních četností (řádkové a sloupcové součty) a výsledná p-hodnota je součtem pa menších nebo stejných jako pl, která přísluší pozorované tabulce.
iba
Ě
'WS*
I   Institut biostatistiky a analýz, PřF a LF MU
Test hypotézy o symetrii (McNemarův test pro čtyřpolní tabulku)
Motivace: Na osobách sledujeme binární proměnnou před pokusem a po něm, cílem je zjistit, zda došlo ke změně v rozdělení této proměnné.
Analýza párových dichotomických proměnných
Četnost n f tabulka Tabulka teoretických pravděpodobností
		po		
		+	-	nj.
před	+	0	b	a+b
	-	c	d	c+d
		a+c	b+d	n
		po		
		+		
před	+	Pu	P12	Pl.
	-	P 21	P22	P2.
		P.l	P.2	
• Nulová hypotéza:     = pn , pokus nemá vliv na výskyt daného znaku
Testová statistika:
(\b-c\-iy
b + c
pokud je větší než kritická hodnota x rozdělení o
jednom stupni volnosti (vhodné pro počty údajů b+c > 8), pak nulovou hypotézu zamítáme
iba
Ě
'WS*
I   Institut biostatistiky a analýz, PřF a LF MU
McNemarův test: příklad I
• Zjistěte, zda úspěch našich sportovců na Olympiádě nebo ve Světovém poháru vede ke změně postojů žáků ke sportování.
• Nulová hypotéza: Počet žáků, kteří změní svůj postoj pozitivním směrem, je pouze náhodně odlišný od počtu žáků, kteří změní svůj postoj negativním směrem.
Postoj po výuce
(3-16 -l)2
= 7,58
X =
3 + 16
Stupně volnosti
• Závěr: Úspěch našich sportovců má pozitivní vliv na postoj žáků vzhledem k provozování sportu.
McNemarův test: příklad II
Příklad: Srovnání 2 metod stanovení antigenu v krvi (antigen vždy přítomen)
metoda 1 = metoda 2
| Metoda 1	Metoda 2	Frekvence |
úspěch	úspěch	202
úspěch	neúspěch	60
neúspěch	úspěch	42
neúspěch	neúspěch	10
,       (|60 - 42 - l)2
Xl, = ^-—-— = 2,83
102
Tabulky:   xlJy=1) = 3>84
■3
= 102
Hn nezamítnuta
/BA
'WS*
I   Institut biostatistiky a analýz, PřF a LF MU
Aplikace analýzy 2x2 tabulky pro hodnocení rizika I. Prospektivní studie - odhad relativního rizika
Jedinci jsou sledováni prospektivně, zda se vyskytne nějaká vlastnost.
VÝBĚR JE DÁN SLOUPCEM
OBECNĚ
PŘIKLAD
	Skupina 1	Skupina 2		Retardace plodu	
				Symetrická	Asymetrická
ANO	a	b	Agpar ANO	2	33
L.I IdIV NE	c	d	skoré >7 NE	14	58
u					
Riziko:
(a + c)      (b + d)
RR = = o,345
33/91
33/91=0,36
a
RR
_ (a + c) b
(b + d)
H0: RR = 1
Riziko u "symetrické skupiny" je asi 35 % rizika u asymetrické skupiny
S/: (ln RR) = -V a
a      ci + c
_\_
b
cl
IS: In RR-Z In RR + Z
Í9t       - ř*f
1-o/2 ■ -l-oc/2
SE (In RR) , SE (In RR)
} |U| I   Institut biostatistiky a analýz, PřF a LF MU
7BA ^/ ^
Aplikace analýzy 2x2 tabulky pro hodnocení rizika II. Retrospektivní studie - "ODDS RATIO"
Zcela zásadně odlišný přístup od retrospektivní studie VÝBĚR JE DÁN VLASTNOSTÍ - ŘÁDKEM Není tedy možné analyzovat relativní riziko, protože přípravou řádků můžeme měnit
velikost kontrol.
OBECNĚ
PŘIKLAD
	Skupina 1	Skupina 2
ANO	a	b
ĹlldK NE	c	d
odds	a/c	b/d
Odds ratio :
ale b/d
/ «»<fx f
*Sŕ«r ^»
SEQnOR) = J- + - + - + -a   b   c d
I   Institut biostatistiky a analýz, PřF a LF MU
Vady chrupu
ANO			NE
Plavání	<6h	32	118
týdně	> 6h	17	127
OR = (32 /17 ) / (l 18 /127 ) = 2,026 ln (OR) = 0,706 SE (ln(OR)) =0,326
Relative risk vs. Odds ratio ?
Relative risk (relativní riziko)
Odds ratio (poměr šancí)
• Smysl RR a OR
• Výpočet
• Srovnatelnost
• Interpretace
• Výhody a nevýhody
• Aplikace v klinickém hodnocení
Smysl RR a OR
Popis vlivu faktoru (léčba, klinicky parametr) na výskyt události (úmrtí, progrese aj.)
Relative risk (relativní riziko)
0 Snadná přirozená interpretace rizik vyjádřených jako procento událostí
ALE
0 Matematická omezení pro některé aplikace
Odds ratio (poměr šancí)
0 Pouze málo lidí má přirozenou schopnost interpretovat OR
ALE
0 OR v řadě aplikací výhodnější matematické vlastnosti
iba
Ě
'WS*
I   Institut biostatistiky a analýz, PřF a LF MU
Výpočet
1|l event
bez eventu
Relative risk Odds ratio
(relativní riziko) fY% (poměr šancí)
A B t t
tttttt    *    ; ; tttttt
dd_ mmmmm _io _0 t * nD_ _ttttt_ _4_.c
RR— ^^^^^^^^^^^^^^^^^ — ~~~   — L a   UK— —     — ó. D
tti       A     * f ttf 3
t t
10 II iiiAA*i 7
ömmmm        J { ftttftt
t IUI f   Institut biostatistiky a analýz, PřF a LF MU
h mezi RR a OR
Relative risk (relativní riziko)
10
5
3 2
Odds ratio (poměr šancí)
i -
n CC
if) r>
O 0.7 -
0.5 0.3
0.1
1
—r— 5
RR a OR je přímo srovnatelné pouze při nízkém bazálním riziku
10
Zhang, J. et al. JAMA 1998;280:1690-1691.
20 30 40 50
Incidence Among the Nonexposed. %
RR = 0.75
RR = 0.5
RR = 0.3
60
70
J IUI i   Institut biostatistiky a analýz, PřF a LF MU
Srovnatelnost RR a OR I: maximum
Relative risk (relativní riziko)
RR mění své maximum podle bazálního rizika
ft
lb
JO
CĹ
S(L) C
>N O
E
E
-m
E
'x ro
10
0% 20% 40% 60%
Bazálni riziko
s™
■iC'frí,
Odds ratio (poměr šancí)
0   Odds ratio má vždy rozsah od 0 do nekonečna
0   Velikost OR není závislá na velikosti bazálního rizika
0   OR lze použít pro srovnání studií s různým bazálním rizikem !!!!
0   Výhodné pro metaanalýzu
MU r<
iba
0   RR ve studiích s různým bazálním rizikem jsou nesrovnatelná !!!!
i  ■   ■ - . -
IUI i   Institut biostatistiky a analýz, PřF a LF MU
^»
Srovnatelnost RR a OR I: symetrie
Existuje mezi RR a O rozdíl v případě
Relative risk
výměny definice eventu a non-eventu?
RR(I) =
RR(II) =
(relativní rizi	ko)
ÍHf	4
fiööfiöflöfififi	1 10
iont*	7
	10
litttt	6
fiÔĎfiĎÔfifififi	10
ttt	3
fiÔĎfiĎÔfifiÔfi	10
= 0.57
= 2
0 ©
f t f t 11 11 i t 11 t í 11 11 11
vs.
I t t1 t f
t f
i f
II
11
11 11 i i
OR(I) =
OR(II) =
Odds ratio (poměr šancí)
tf tt
Htttt ttttttt
Hi
tttttt tttt
m ttitttt
= -2- = 0.29 3
= ^ = 3 5 3
7
/BA
,Oi,
- IUI 1   Institut biostatistiky a analýz, PřF a LF MU
RR a OR ve studiích s různou mírou bazálního rizika
Výskyt eventu (%)
Výskyt eventu (%)
M
's
1%.
i IMI I   Institut biostatistiky a analýz, PřF a LF MU
Odds ratio
Ve skupině „Case" připadá na jednoho pacienta bez eventu 4x tolik pacientů s eventem než ve skupině „Control"
5
^ 3 O
CĽ i
cN      o% o^- ■ŕ"- cN
<HrNj^í-ooLnocriiHama
H     i-M      ro lTj
Bazálni (control) výskyt eventu (%) Relative risk
Pacient ve skupině „Case" má x-krát zvýšenou pravděpodobnost výskytu eventu než pacient ve skupině „Control". X-krát závisí na basálním výskytu eventu.
OR v prospektivních a retrospektivních studiích
Prospektivní studie
Retrospektivní studie
0   Sledování výskytu eventu a následná analýza jeho příčin
0   Převážně kohortní studie
0   Zpetne sledovaní pricin eventu
0   Převážně case-control studie
0   Výběrem pacientů ovlivňujeme bazální výskyt eventu
0   Bazálni výskyt eventu je dán vlastnostmi kohorty pacientů
0   Bezproblémové využití RR
0   RR nelze použít -ovliněno bazálním výskytem eventu
0   Využití OR - není ovliněno designem studie
Relative risk (relativní riziko)
Odds ratio (poměr šancí)
i \ÍA\ I   Institut biostatistiky a analýz, PřF a LF MU
'WS*
Relative risk vs. Odds ratio: shrnutí
Relative risk (relativní riziko)
0   Intuitivně snadno interpretovatelné
0   Pro prospektivní studie
0   Maximum se lisí podle bazálni hodnoty výskytu eventu
Odds ratio (poměr šancí)
0   Retrospektivní studie
0   Aplikace v metaanalýze
0   Standardní výstup logistické regrese
0   Rozsah vždy 0 až nekonečno, není ovlivněno bazálním výskytem eventu
0   Obtížnější interpretace
iba
Ě
'WS*
I   Institut biostatistiky a analýz, PřF a LF MU
Přednáška 9
Poissonovo rozdělení
Popis rozložení a jeho využití
www
Anotace
• Poissonovo rozdělení se používá pro popis četnosti výskytu jevu na experimentální jednotku, příkladem může být počet mutací bakterií na Petriho misku nebo počet srdečních poruch na jednotku času
iba
ä /^.\ o
V; I lilii   Institut biostatistiky a analýz, PřF a LF MU
VSÍ> *<í>
Poissonovo rozdělení
Celkový počet jevů v n nezávislých pokusech
E(x) = n p i |_ . >
D(x)= n p }   £W = °W n, , e-"-fir
P(r) =
-A
r!
r!
jU=Á= průměrný počet jevů z n pokusů
?(X = 6)=e
M
p(X=4)= M
(4)(3)(2)
/BA
|   Institut biostatistiky a analýz, PřF a LF MU
Poissonovo rozdělení jako model
Poissonovo rozdělení v přírodě existuje
Mutace bakterií na inkubačních miskách
O
Výskyt jevu v prostoru
(počet žížal na určitou plochu pole)
Orientační stanovení jevu (při produkci plynu bakteriemi)
+
y u u
+
The most probable number technique
Výskyt jevu v čase
(srdeční arytmie v určitých časových intervalech)
1 ill 1
-I-1-1-1-
cas
,Oi,
Ve- *
IMI i   Institut biostatistiky a analýz, PřF a LF MU
<W<**
Poissonovo rozdělení jako model pro náhodný výskyt jevů
Předpoklad: náhodná distribuce jevu mezi studovanými objekty
(příp. v čase, v prostoru).
<J~ < JLl <J~ > JLl CJ1 = JU
Poisson
Pokud je X spíše větší (~ 5-10), pak Poisson odpovídá spíše binomickému
až normálnímu rozložení.
■J    íVfVt f"í    V- I   Institut biostatistiky a analýz, PřF a LF MU
iba *>m? w w
Formální prezentace Poissonova rozložení
Př: pokus......10 000 bakterií na misce
n = 10 misek Jev: mutace (r=25)
X..........průměrný počet mutantů na
jednu misku
r = 25
x*/l = 25/10 = 2,5 95 % IS:
x — Z
l—CC,
X
n
<A<x+Z
l—CC,
X
n
2,5 -1,96 • /0,25 < Á < 2,5 +1,96 • a/0,25
1,52 < Ä < 3,48
,ä Ä\ -o
?YíYi fíTW ř lili f   Institut biostatistiky a analýz, PřF a LF MU
w w w
Poissonova náhodná proměnná
• Při měření počtu krvinek změněných určitou chorobou (relativně vzácné) je pozorován zředěný vzorek krve pod mikroskopem v komůrce rozdělené na stejně velká pole. Sledovaná veličina, udávající počet krvinek v i-tém poli může byt považována za rozdělenou podle Poissonova rozložení:
• n = 169 = počet nezávislých pozorování proměnné
• r = 10 = počet pozorovaných krvinek
• Jaká je hodnota parametru E Poissonova rozložení a jaká je jeho interpretace ?
• Jaký je interval 95% spolehlivosti pro parametr X
• Pokud bychom sledovali celkový počet červených krvinek (opět v n = 169 nezávislých políčkách), bylo by i tuto proměnnou možno považovat za rozloženou podle Poissonova rozložení ? Uvazujte celkový počet pozorovaných krvinek jako 2013.
Výpočet intervalu spolehlivosti pro X (bez aproximace na normální rozložení)								
	-	Spodní hranice IS			-	Horní hranice IS	-	
		2 (A=2/-) i_(X /			^2 =			
		2				2		
■_      ľVfV'í -   i\ií\ I   Institut biostatistiky a analýz, PřF a LF MU
iba *>m? w w
Poissonova náhodná proměnná
Konstantní zářič: n = 2608 časových intervalů (každý 7,5 s)
i: počet částic v intervalu (x)
s,: pozorovaná četnost intervalů s i částicemi
P(x = i) =
X -é
~ P i
Poissonova proměnná:
* Výborný model pro experimenty, v nichž je během časového
průběhu zjišťován počet výskytu určitého jevu
	Počet intervalů	teoretické četnosti	\si-nPi)
i	s právě i zaznamenanými částicemi s,	nPj	
0	57	54,399	0,1244
1	203	210,523	0,2688
2	383	407T3fi1	1,4568
3	525	5?5,496	0,0005
4	532	508.418	1,0938
5	408	393.515	0,5332
6	273	253.817	1,4498
7	139	140.325	0,0125
8	45	67.882	7,7132
9	27	29,189	0,1642
10	10		
11	4	17,075	
12	2	(-P{š>10})	0,0677
13	0		
	n = 2608	2608,00	12,8849
iba
Ě
'WS*
|   Institut biostatistiky a analýz, PřF a LF MU
Poissonovo rozdělení: jednovýběrový test
Př: Počet hnízd křepelek na dané ploše
n = 8000 "pod lokalit" -| A r = 28
} ^ = 0,0035
Nechť je srovnávací soubor (předchozí průzkum)
Po =0,0020 p0 • 8 000 = 16 = ju = A
\H0:    p<Po   ~  ju<\6    ? ]
<Sj\ Ä ŕÄ lw Has?
IUI i   Institut biostatistiky a analýz, PřF a LF MU
1) Vzít data jako pocházející z populace:
éT16-1628 P(r = 28) = ——— = 0,00192
28!
2)
zamítnuta
P(r> 28) = ?)
^<0,05 => Ho [0,00411] J
i
r = 28 je příliš velké pro populaci s p0
aby r = 28 bylo > po, pravděpodobnější
Analýza rozptylu
Parametrická analýza rozptylu Post hoc testy Kruskal-Wallis test
Anotace
• Analýza rozptyluje základním nástrojem pro analýzu rozdílů mezi průměry v několika skupinách objektů.
• Základní myšlenka, na níž je ANOVA založena, je rozdělení celkové variability v datech (neznámé, dané pouze náhodným rozložením) na část systematickou (spjatou s kategoriemi pacientů, vysvětlená variabilita) a část náhodnou. Pokud systematická, tedy nenáhodná a vysvětlitelná část variability převažujeme, považujeme daný kategoriální faktor za významný pro vysvětlení variability dat.
• Analýza rozptylu vyhodnocuje pouze celkový vliv faktoru na variabilitu, v případě analýzy jednotlivých kategorií je třeba využít tzv. post-hoc testy
Základní rozhodování o výběru statistických testů
Parametrické testy Neparametrické testy
Spojitá x spojitá data
Spojitá x kategoriálnídata
Kategoriálníx kategoriální data
Pearsonův korelační koeficient
Spearmanův korelační koeficient
Jeden výběr
Jednovýběrový t-test
Jednovýběrový Wilcoxonův test
Dva výběry
Párová data
Nepárová data
Párový t-test
Wilcoxonův / znaménkový test
Dvouvýběrov) t-test
Mannův-Whitneyho test
Tři a více výběrů nepárově)
ANOVA
Kruskalův-Wallisův test
Jeden výběr
1
Více výběrů
Párová data
Jednovýběrový binomický test
1
Nepárová data
McNemarův test
Chí-kvadrát test
Fisherův exaktní test
iba
Ě
'WS*
I   Institut biostatistiky a analýz, PřF a LF MU
Cíl stochastického modelování
• Obecným cílem je snaha vysvětlit variabilitu predikované proměnné (endpoint, Y) pomocí prediktorů (vysvětlující proměnná, faktor, X)
• Jak predikovaná proměnná, tak prediktor mohou být různého typu
• Binární
• Kategoriální
• Ordinální
• Spojitá
• Cenzorovaná (-> analýza přežití)
• Kombinace datového typu predikované proměnné a prediktorů určuje použitou metodu analýzy
Ä  ÄSv O
IMI i   lnstitut biostatistiky a analýz, PřF a LF MU
8 .5
Vysvětluje kategoriální prediktor?
8 .5
7.5 ■
7 ■
6.5 ■
6 ■
5.5 ■
5 ■
4.5 ■
0    0 .4  0 .8  1 .2  1 .6    2    2 .4 0 .2  0 .6    1     1 .4  1 .8 2 .2  2 .6
Analýza rozptylu - ANOVA
Základní technika
sloužící k posouzení rozdílů mezi více úrovněmi pokusného zásahu
JE
o i— +-> c o
				ro		Q.
X						X
cd		cu		cd		cd
<_>		<_>		U		u
ro		ro		ro		ro
i—		i_		i_		i—
+->		+->		+->		+->
cz		C		C		CZ
cu		cd		q;		cd
<_>		U		<_>		u
CZ		c		CZ		CZ
o		o		o		o
						
Rostoucí koncentrace testované látky / látek Celkově významné změny v reakci biologického systému
Vzájemné rozdíly účinku jednotlivých dávek
||    \   Rozdíly účinku dávek od kontroly
iba
s <o
lYSYí ?'"¥Vt ř llll f   Institut biostatistiky a analýz, PřF a LF MU
w %J#' w
Analýza rozptylu - ANOVA
Významné kroky analýzy, vedoucí k efektivnímu srovnání variant
_ro
O i— +-> c o
		(N		ro		Q.
X		X				X
cd		cd		cd		cd
u		<_>		<_>		<_>
ro		ro		ro		ro
i—		i—		i_		i_
+->		+->		■M		■M
c		c		C		C
cd		cd		cd		cd
<_>		u		u		<_>
c		c		c		c
o		o		o		o
						
Rostoucí koncentrace testované látky / látek
Splnění předpokladů analýzy Transformace dat
Relevantnost kontroly (vliv vlastní aplikace látek)
Vhodnost modelu ANOVA pro účely testu
Vlastní srovnání variant
Minimalizace chyb při ověřování hypotéz
iba
,Oi,
-; IMI1   Institut biostatistiky a analýz, PřF a LF MU
Analýza rozptylu - ANOVA
SPLNĚNÍ PŘEDPOKLADŮ ANOVA JE NEZBYTNOU PODMÍNKOU
POUŽITÍ TÉTO TECHNIKY
1 Předpoklad nezávislosti opakování experimentu
ANOVA = parametrická analýza dat
Homogenita rozptylu \ v rámci pokusných variant
Normalita rozložení 3. v rámci pokusných variant
ALTERNATIVOU JSOU NEPARAMETRICKÉ METODY
I ^Y?V\ 'f^yíi' ŕlljíl   Institut biostatistiky a analýz, PřF a LF MU
r w w
iba
ANOVA- předpoklady
• Symetrické rozložení hodnot a normalita odchylek od hodnoceného modelu ANOVA. Velkou část dat lze adekvátně normalizovat použitím logaritmické transformace. Předpoklad lognormální transformace může pochopitelně být teoreticky vyloučen u mnoha datových souborů obsahujících diskrétní parametry, kde je indikována vhodnost jiného typu transformace. U asymetricky rozložených a u diskrétních dat je nutné využít neparametrické alternativy analýzy rozptylu.
• Homogenita rozptylu je nutným předpokladem pro smysluplnost vzájemných srovnání pokusných variant. U testů toxicity by splnění tohoto předpokladu mělo být ověřováno (Bartlettův test), neboť vážné rozdíly (až řádové) v jednotkách testovaného parametru mohou nastat v důsledku inhibice dávkami látky. Nehomogenita rozptylu je často ve vztahu k nenormalitě (asymetrii) dat a lze ji odstranit vhodnou normalizující transformací.
• Statistická nezávislost reziduí vyhodnocovaného modelu ANOVA. Pokud odhad a posouzení korelačních vztahů mezi pokusnými variantami není přímo předmětem výzkumu, lze jejich vliv na vyhodnocení odstranit znahodněním dat v rámci pokusných variant - tedy změnou poradí v náhodné. Rozsah vlivu těchto autokorelačních vztahů musí být ovsem primárně omezen správností experimentálního uspořádání.
• Ad it i vita jako předpoklad týkající se složitějších experimentálních uspořádání. Exaktní otestování
ad it i vity více pokusných faktorů je procedura poměrně náročná na experimentální design vyvážený co do počtu opakování. Je rovněž obtížné testovat interakci na nestandardních datech, neboť případná transformace může změnit charakter odchylek původních dat od hodnoceného modelu ANOVA.
iba
Ě
'WS*
|   Institut biostatistiky a analýz, PřF a LF MU
Omezení aplikace ANOVA lze řešit
• Chybějící data. Vážným problémem jsou chybějící údaje o celé skupině kombinací testovaných látek, například u faktoriálních pokusů, kdy je znemožněno hodnocení experimentu jako celku.
• Různé počty opakování. Jde o typickýjev pro experimentální datové soubory. Při různých počtech opakování v experimentálních variantách jsou testy ANOVA citlivější na nenormalitu dat. Pokud jsou počty opakování zcela odlišnéfaž na řádové rozdíly), je nutno použít neparametrické techniky nebo analýzu rozptylu nevyvážených pokusů.
• Odlehlé hodnoty. Ojedinělé odlehlé hodnoty musí být před parametrickou analýzou rozptylu vyloučeny.
• Nedostatek nezávislosti mezi rezidui modelu. Jde o závažný nedostatek, zkreslující výsledek F-testu. Velmi často je tato skutečnost důsledkem špatného provedení nebo naplánování experimentu.
• Nehomogenita rozptylu. Velmi častý nedostatek experimentálních dat, často související s nenormalitou rozložení nebo s odľehlými hodnotami.
• Nenormalita dat. I v tomto případě Iz situaci upravit vyloučením odlehlých hodnot nebo normalizující transformací.
• Neaditivita kombinovaného vlivu více pokusných zásahů. Tuto situaci lze testovat jednak speciálními testy aditivity nebo přímo F testem kontrolujícím významnost vlivu interakce pokusných zásahů. Při významné interakci je nutné prozkoumat především její charakter ve vhodném experimentálním uspořádání.
Modely analýzy rozptylu
Model I. Pevný model
Model II. Náhodný model
X0 X1 X2 X3 X4
A   B   C   D E
4-
+
4-
+
4-
XO    XI     X2     X3 X4
I  Institut biostatistiky a analýz, PřF a LF MU
A    B    C    D E
Princip ANOVA
Základním principem ANOVY je porovnání rozptylu připadajícího na:
• Rozdělení dat do skupin (tzv. effect, variance between groups)
• Variabilitu objektů uvnitř skupin (tzv. error, variance within groups), předpokládá se, že jde o náhodnou variabilitu (=error)
o
SS between
iba
,Oi,
1.     Variabilita mezi skupinami
Rozptyl je počítán pro celkový průměr (tzv. grand mean) a průměry v jednotlivých skupinách dat
Stupně volnosti jsou odvozeny od počtu skupin (= počet skupin -1)
2.
Variabilita uvnitř skupin
Rozptyl je počítán pro průměry
jednotlivých skupin a objekty uvnitř příslušných, celková variabilita je pak sečtena pro všechny skupiny
Stupně volnosti jsou odvozeny od počtu hodnot (= počet hodnot - počet skupin)
-; IMI1   Institut biostatistiky a analýz, PřF a LF MU
-	
Ľ	i
SS within
v. - n-k
F =
between_ groups within _ groups
Výsledný poměr (F) porovnáme s
tabulkami F rozložení pro v1 a v2 stupňů volnosti
SS=sum of squares
Design modelu
• Design modelu znamená jaké proměnné a v jakých kombinacích budou vysvětlovat hodnocenou proměnnou
• Obecně je vhodné ať již expertně nebo jako výsledek předběžné analýzy vytvořit a ověřit hypotézy o vzájemných vztazích proměnných a podle těchto předběžných výsledků vytvářet finální model
• Tvorba designu modelu úzce souvisí s pojmy:
• Analýza pouze hlavních efektů proměnných
• Analýza interakcí mezi proměnnými a složitost interakcí
• Design modelu lze vyjádřit graficky nebo v rovnici nebo pomocí maticového zápisu
faktor 1
y = hmotnost * 1.5 + věk * 3.6 + hmotnost * věk * 1.8 + 9
CM k_ O
4-1
	A		B			C
1						
2	U					
interakce
" Vi "		"l II'				
	=	1 X2			+	f-2
		.1 x" .				
iba
Ě
'WS*
I   Institut biostatistiky a analýz, PřF a LF MU
Jednoduchý ANOVA design
• Nejjednodušším případem ANOVA designu je rozdělení na skupiny podle jednoho parametru
dělící parametr
ro ro
B
C
iba
m rfS\ <>
I   Institut biostatistiky a analýz, PřF a LF MU
^rí.> ^^s^
Nested ANOVA
• Rozdělení skupin na náhodné podskupiny (např. opakování experimentu)
• Cílem je zjistit, zda data v jedné skupině nejsou pouhou náhodou
• Nejprve je testována shoda podskupin v hlavních skupinách,
• pokud jsou shodné, je vše v pořádku
• pokud nejsou, stále lze zjišťovat, zda se variabilita uvnitř hlavních skupin liší od celkové variability
jednoduchá ANOVA
nested ANOVA
B
B
MU ŕ<
iba
i  ■   ■ - . -
IMI i   Institut biostatistiky a analýz, PřF a LF MU

Two way ANOVA
• Pro rozdělení do kategorií je zde více parametrů
• Na rozdíl od nested ANOVY nejde o náhodná opakování experimentu, ale o řízené zásahy (např.vliv pH a koncentrace 02)
• Kromě vlivu hlavních faktorů se uplatňuje i jejich interakce
iba
Ě
'WS*
|   Institut biostatistiky a analýz, PřF a LF MU
ANOVA-základní výstup
• Základním výstupem analýzy rozptylu je Tabulka ANOVA - frakcionace komponent rozptylu
Zdroj rozptylu St. v. SS MS F
Pok. zásah           a-1 SSB SSB/(a-1) MSB/MSE
(mezi skupinami)
Uvnitř skupin        N-a SSE SSE/(N - a)
Celkem N -1 SST
v—\    Kvantifikovaný podíl rozdílu mezi pokusnými zásahy na SSB/SST 1—y   celkovém rozptylu
MSB/MST   >   \   Statistická významnost rozdílu
I ^Y?V\ í'" i IUII   Institut biostatistiky a analýz, PřF a LF MU
Hlavní efekty a interakce
18 i- 3£ Faktor 2
3E Faktor 2
8 I-1-1-
A B
	SS	Di.	MS	F	P
Intercept	33487	1	33487	8165.3	0.000
Faktor 1	1978	1	1978	482.2	0.000
Faktor 2	1	1	1	0.3	0.602
F1*F2	1	1	1	0.3	0.570
Error	804	196	4		
18 r-17 ■ 16 ■ 15 ■
8 I-1-■-
A B
	SS	D.f.	MS	F	P
Intercept	28511	1	28511	6952.0	0.000
Faktor 1	4	1	4	1.0	0.314
Faktor 2	1	1	1	0.3	0.602
F1*F2	867	1	867	211.3	0.000
Error	804	196	4		
■_      ľVfV't ä IUI I   Institut biostatistiky a analýz, PřF a LF MU
iba *>m? w w
18 I-
17 -
15 -14 ■
13 -12 ■ 11 -
A B
	SS	D.f.	MS	F	P
Intercept	33487	1	33487	8165.3	0.000
Faktor 1	4	1	4	1.0	0.314
Faktor 2	1891	1	1891	461.1	0.000
F1*F2	1	1	1	0.3	0.570
Error	804	196	4		
20 r
8 I-1-■-
A B
_SS D.f.       MS F p
Intercept   38863      1 38863 9476.2 0.000
Faktorl     920       1 920 224.3 0.000
Faktor2       1         1         1 0.3 0.602
F1*F2       867        1 867 211.3 0.000
Error       804 196 4
A B
	SS	D.f.	MS	F	P
Intercept	57391	1	57391	13993	0.000
Faktor 1	5293	1	5293	1290.7	0.000
Faktor 2	861	1	861	209.9	0.000
F1*F2	1	1	1	0.3	0.570
Error	804	196	4		
24 I-
8 I-1-L-
A B
_SS D.f. MS        F p
Intercept   45203 1 45203 13596 0.000
Faktorl    4799 1 4799 1443.4 0.000
Faktor2     316 1 316 95.0 0.000
F1*F2       175 1 175 52.5 0.000
Error       652 196 3
Analýza rozptylu - obecný F test
_CO
o
-I—'
c o
		C\J		CO
x		X		X
0		0		0
o		O		O
CO		CO		CO
		i_		i_
c		C		C
0		0		0
O		O		O
c		C		C
o		o		o
				
HQ platí
Látka nepůsobí
Q.
X
0
O
CO i_ -I—'
c
0 O C
o
H
o-
obecný F test m1 = m2 = m3 = ...
= m.
H0 neplatí
Látka působí
Další analýzy
iba
I   Institut biostatistiky a analýz, PřF a LF MU
Testování dílčích hypotéz
• V řadě analýz je třeba pracovat se vzájemným testováním více skupin objektů stylem každý s každým
• Obecný postup analýzy je
• Testování celkové významnosti - všechny skupiny navzájem (ENG: among groups)
• Pokud je zjištěna celková významnost pokračuje testování analýzou již konkrétních kombinací dvojic skupin (ENG: between)
• Problémem je vliv mnohonásobného testování na statistickou významnost testů:
• Každý jeden test má a=0.05 (chyba I. druhu)
• Při mnohonásobném testování stoupá pravděpodobnost, že alespoň u jednoho testu dojde k chybnému zamítnutí nulové hypotézy (tedy k chybě I. druhu)
i
3
Řešením jsou různé procedury korigující hodnotu p (např. Bonferroniho korekce, FWR, FDR procedury apod.)
Q_
0
1 3  5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49
Počet testů
Analýza rozptylu - testy kontrastů
_C0
o
-I—'
c o
iba
ANOVA:H0 zamítnuta
Testy kontrastů
		C\J		CO		Q.
x		X		X		X
0		0		0		0
o		O		O		O
CO		CO		CO		CO
		i_		i_		i_
c		C		C		C
0		0		0		0
O		O		O		O
c		C		C		C
o		o		o		o
						
•
Rozdíly v smysluplných kombinacích ?
-; IMI1   Institut biostatistiky a analýz, PřF a LF MU
( ]
Neplánované
Pro srovnání variant s kontrolou
r
Testování kontrastů "Multiple range testy"
Neparametrické
Řada různých post-hoc testů
One Way ANOVA for PRODUCTS
Tafk Poles T es. 5 Means
Breakdowr = ::s
T-es
Means > Comparison
The main effect is: Product Name
.-Methods to use —
□ Preview code
I  I Bonferrani ttest
I  I TLkey 3 stL^ertizec r = r;= lest (HSC i I  I Duncan's multiple-rangetest
□ Dunnett's ttest
I  I Fishers I;Est ^rifk-rt-citferercstest LJ Gabriel's multiple-comparison procedure
□ Student-Newman-Keuls multiplerangetest I  I Waller-Duncan k-ratiottest
I  I Scheffes multiplecompanson procedure
I  I Rtan-Eirot-Gsbrisl-'.'/sls^h rrdti pie-range test
§sas
í ANOVA Results 1: srovnáni hmotnosti ovci
Profiler | Custom tests | Residuals 1 | Residuals 2 | Matrix | Report Summarv | Means
Effect:   |Skupina ^
Planned comps      Post-hoc ! Assumptions
Dependent variables:
J Hrr
Display
f* Significant differences C Homogeneous groups: C Confidence intervals C Critical ranges:
Error term f* Between error C Within error C Between; within; pooled r MS:|0.00t "
J
^    Modify j Options 1
J.
Jj
M TukeyHSD | fflfl Unequal N HSD | Range tests (multi-stage tests)
StatSoft9
One-Way AN OVA: Post Hoc Multiple Com pari son 5
|)uncan's | CIrit. ranges |
■ Equal Variances Assumed-
r LSD; r~ Bonferroni r Sidak ľ- Scheffe T R-E-G-WF
r S-N-K I- lukey I- Tukey's-b I Duncan I    Hochberg's GT2
I- Waller-Duncan
Type I/Type II Error Ratio: I- Dunnett
Control Category: ■Test-
100
Last
31
r R-E-G-WQ      r Gabriel
2-sided C < Control C > Control
- Equal Variances Not Assumed I- Tamhane's T2  |    Dunnett'sT3    \~ Games-Howell   \~ Dunnett's C
Significance level: .05
Continue
Cancel
Help
CG cell«:
iba
I   Institut biostatistiky a analýz, PřF a LF MU
Příklad: Anova - One way
Dávka rostlinného stimulátoru (0, 4, 8,12 mg/l) A = 4;n = 8
I. ANOVA
Bartletťs test:     P = 0,9847
K-S test: P = 0,482 - 0,6525 pro jednotlivé kategorie
Source	D.f.	SS	MS	F	P
Between	3	305.8	101.9	8.56	<0.001
Within	28	322.2	11.9		
Total	31	638			
II.   Multiple Range Test (NKS -test)
Level	Average	Homogeneous groups		
0	34.8	X		
4	41.4		X	
12	41.8		X	
8	52.6			X
■_      ľVfV'í -   ŕ IUI I   Institut biostatistiky a analýz, PřF a LF MU
iba *>m? w w