Adobe Systems Institut biostatistiky a analýz LF – Výuka – Biostatistika 1 MNBS081 Biostatistika (jaro 2022) MICHAL SVOBODA Institut biostatistiky a analýz LF MU svoboda@iba.muni.cz Adobe Systems Institut biostatistiky a analýz LF – Výuka 2 Osnova ̶Excel: opakování, příprava dat, základní vzorce ̶Základy popisné statistiky ̶Základní rozdělení pravděpodobnosti, testování hypotéz ̶Parametrické testy ̶Neparametrické testy ̶Analýza kontingenčních tabulek ̶Základy korelační analýzy a lineární regrese Adobe Systems Institut biostatistiky a analýz LF – Výuka 3 Důležité informace ̶Výuka: 14:00–15:40, počítačová učebna F01B1/709 ̶Materiály v IS ̶Software: Microsoft Office - Excel, Statistica ̶Pro získání zápočtu/kolokvia je třeba: 1) Účast – povoleny jsou 2 absence oPři větší absenci – splnění písemky na konci semestru (teoretická část + řešení příkladů na počítači) 2) Domácí úkoly – povoleno max 1 neodevzdání oza účelem procvičení, dostanete zpětnou vazbu, na dalším cvičení se vrátíme, kdyby byl problém 3) Závěrečný úkol – datový soubor – praktické úkoly ̶ o o Adobe Systems Institut biostatistiky a analýz LF – Výuka 4 Organizace výuky •15. 2. – Excel: opakování, příprava dat, základní vzorce •1. 3. – Základy popisné statistiky (pozor! 22. 2. setkání nebude) •15. 3. – Základní rozdělení pravděpodobnosti, testování hypotéz (pozor! 8. 3. setkání nebude) •22. 3. – Parametrické testy •29. 3. – Neparametrické testy •5. 4. – Analýza kontingenčních tabulek, testy dobré shody •12. 4. – Korelační analýza + základy lineární regrese •19. 4. – Volitelné sezení (návrat k některým tématům) •3. 5. – Ukončení předmětu, test •10. 5. – Vyhodnocení testu Adobe Systems Institut biostatistiky a analýz LF – Výuka – Biostatistika 5 Parametrické testy ̶Mají předpoklady o rozložení vstupních dat (normální rozložení). ̶Při stejném počtu pozorování (N) a dodržení předpokladů mají vyšší sílu testu než testy neparametrické. ̶Pokud nejsou dodrženy předpoklady parametrických testů, potom jejich síla testu prudce klesá a výsledek testu může být chybný. http://files.mscck-trmice.webnode.cz/200000297-22250231ed/vyk%C5%99i%C4%8Dn%C3%ADk.png Proč nemusí parametrický a neparametrický test vyjít stejně? Adobe Systems Institut biostatistiky a analýz LF – Výuka – Biostatistika 6 Neparametrické testy ̶Vyžadují splnění méně předpokladů o rozložení vstupních dat, lze je tedy použít i při asymetrickém rozložení, přítomnosti odlehlých hodnot, či nedetekovatelném rozložení. ̶Snížená síla těchto testů je způsobena redukcí informační hodnoty původních dat, kdy neparametrické testy nevyužívají původní hodnoty, ale nejčastěji pouze jejich pořadí. ̶Používají se také při hodnocení souborů s nízkým počtem pozorování (N; malé soubory), kdy nejsme schopni normalitu dat spolehlivě ověřit. http://files.mscck-trmice.webnode.cz/200000297-22250231ed/vyk%C5%99i%C4%8Dn%C3%ADk.png Adobe Systems Institut biostatistiky a analýz LF – Výuka – Biostatistika 7 Neparametrické testy Adobe Systems Institut biostatistiky a analýz LF – Výuka – Biostatistika 8 Základní statistické testy Typ dat Spojitá x spojitá data Spojitá x kategoriální data Kategoriální x kategoriální data Jeden výběr Dva výběry Tři a více výběrů (nepárově) Jeden výběr Více výběrů Párová data Nepárová data Pearsonův korelační koeficient Jednovýbě-rový t-test Párový t-test Dvouvýbě-rový t-test ANOVA Párová data Nepárová data Chí-kvadrát test Spearmanův korelační koeficient Jednovýbě-rový Wilcoxo-nův test Wilcoxonův / znaménkový test Mannův-Whitneyho test Kruskalův-Wallisův test Jednovýbě-rový bino-mický test McNemarův test Fisherův exaktní test Parametrické testy Neparametrické testy Adobe Systems Institut biostatistiky a analýz LF – Výuka – Biostatistika 9 Statistické testy o parametrech jednoho výběru Jednovýběrový Wilcoxonův test Jednovýběrový znaménkový test Adobe Systems Institut biostatistiky a analýz LF – Výuka – Biostatistika 10 Jednovýběrový test Jednovýběrový Wilcoxonův test ̶Předpokladem je symetrické rozdělení dat kolem mediánu. ̶ Jednovýběrový znaménkový test ̶Lze použít v situaci, kdy není splněn předpoklad symetrie rozdělení kolem mediánu. ̶ ̶Oba testy testují, zde je medián jednoho výběru roven hodnotě c (v případě párového designu je x0,5 reprezentováno mediánem rozdílu hodnot). H0: x0,5 = c proti HA: x0,5 ≠ c Adobe Systems Institut biostatistiky a analýz LF – Výuka – Biostatistika 11 Jednovýběrový Wilcoxonův test Postup: 1.Určíme rozdíly hodnot výběru s testovanou hodnotou mediánu. 2.Absolutní hodnoty rozdílů uspořádáme vzestupně a přiřadíme jim pořadí. 3.Spočítáme statistiky Sw+ a Sw-, které odpovídají součtu pořadí kladných (Sw+) a záporných rozdílů (Sw-). Jako finální hodnotu testové statistiky bereme minimum z Sw+ a Sw-. Nulovou hypotézu zamítáme, pokud je hodnota testové statistiky menší nebo rovna tabelované kritické hodnotě (při dané hladině významnosti a počtu nenulových rozdílů), nebo když příslušná p-hodnota ≤ zvolená hladina významnosti. Nebo: Pro N > 30 lze využít asymptotické normality statistiky Sw+. Adobe Systems Jednovýběrový Wilcoxonův test Ukázka výpočtu: U 15 pacientů byla vyhodnocena doba, kterou museli strávit v čekárně u lékaře. Zjistěte, zda medián čekací doby je roven půl hodině. ID Doba čekání Medián Rozdíl |Rozdíl| Pořadí 1 1 30 -29 29 15 2 45 30 15 15 10 3 25 30 -5 5 3,5 4 15 30 -15 15 10 5 34 30 4 4 2 6 19 30 -11 11 8 7 31 30 1 1 1 8 25 30 -5 5 3,5 9 8 30 -22 22 14 10 12 30 -18 18 12 11 20 30 -10 10 6 12 15 30 -15 15 10 13 40 30 10 10 6 14 20 30 -10 10 6 15 10 30 -20 20 13 min(Sw+,Sw-) = 19 Kritická hodnota w15(0,05) = 25 Hodnota testové statistiky je menší než kritická hodnota zamítáme H0. http://nd01.jxs.cz/175/785/67893df7b8_4453866_o2.jpg Sw+ = 19 Sw- = 101 Adobe Systems Institut biostatistiky a analýz LF – Výuka – Biostatistika 13 Jednovýběrový znaménkový test Postup: 1.Spočítáme rozdíly hodnot výběru s testovanou hodnotou mediánu. 2.Spočítáme statistiku Sz+, která odpovídá počtu kladných rozdílů → test nevyužívá hodnot pořadí původních dat, ale pouze informaci, zda se hodnota realizuje nad nebo pod mediánem → dochází ke snížení síly testu. 3.Nulovou hypotézu zamítáme, pokud statistika Sz+ realizuje v kritickém oboru hodnot W = (0,k1) U (k2,n), kde n odpovídá počtu nenulových rozdílů a hodnoty k1 a k2 lze dohledat v matematických tabulkách; nebo když příslušná p-hodnota ≤ zvolená hladina významnosti. Nebo: Pro N > 20 lze využít asymptotické normality statistiky Sz+. Adobe Systems Jednovýběrový znaménkový test Ukázka výpočtu: U 15 pacientů byla vyhodnocena doba, kterou museli strávit v čekárně u lékaře. Zjistěte, zda medián čekací doby je roven půl hodině. ID Doba čekání Medián Rozdíl Větší než medián? 1 1 30 -29 Ne 2 45 30 15 Ano 3 25 30 -5 Ne 4 15 30 -15 Ne 5 34 30 4 Ano 6 19 30 -11 Ne 7 31 30 1 Ano 8 25 30 -5 Ne 9 8 30 -22 Ne 10 12 30 -18 Ne 11 20 30 -10 Ne 12 15 30 -15 Ne 13 40 30 10 Ano 14 20 30 -10 Ne 15 10 30 -20 Ne Kritický obor: W = (0,3) U (12,15) Hodnota statistiky se realizuje mimo kritický obor hodnot nezamítáme H0 . SZ+ = 4 http://nd01.jxs.cz/175/785/67893df7b8_4453866_o2.jpg Adobe Systems Institut biostatistiky a analýz LF – Výuka – Biostatistika 15 Statistické testy o parametrech dvou výběrů Nepárový Mannův-Whitneyův test Párový Wilcoxonův a znaménkový test Adobe Systems Institut biostatistiky a analýz LF – Výuka – Biostatistika 16 Párový a nepárový test ̶Srovnání dvou nezávislých výběrů: Nepárový Mannův-Whitneyův U test ̶ ̶ ̶ ̶Srovnání dvou závislých výběrů: Párový Wilcoxonův test Párový znaménkový test ….. ….. ….. ….. ….. ….. ….. ….. ….. ….. ….. ….. Adobe Systems Institut biostatistiky a analýz LF – Výuka – Biostatistika 17 Mannův-Whitneyův U test ̶Neparametrická alternativa dvouvýběrového t-testu ̶Počítá s pořadím hodnot namísto s původními daty. ̶Testuje nulovou hypotézu o shodě rozdělení, ze kterého pocházejí porovnávané výběry. ̶Když chceme interpretovat výsledek testu jako test o poloze (střední hodnoty jsou stejné), musíme předpokládat, že tvar rozdělení je v obou skupinách stejný. ̶Poznámka: test lze použít i pro ordinální data (např. hodnocení zdravotního stavu na stupnici 1-5 apod.). ̶ Adobe Systems Institut biostatistiky a analýz LF – Výuka – Biostatistika 18 Mannův-Whitneyův U test Postup: 1.Stanovíme nulovou a alternativní hypotézu (F(x) – distribuční funkce): H0: F(x1) = F(x2) HA: F(x1) ≠ F(x2). 2.Hodnoty obou výběrů (skupin) jsou sloučena a je určeno jejich pořadí v tomto sloučeném souboru. 3.Pro oba výběry zvlášť je spočítán součet pořadí (T1 a T2). 4.Ze součtů pořadí ve skupinách je určena finální hodnota testové statistiky U. 5. 5. Adobe Systems Institut biostatistiky a analýz LF – Výuka – Biostatistika 19 Mannův-Whitneyův U test 5.Hodnotu testové statistiky U porovnáme s kritickou hodnotou testu, pokud je tato hodnota menší než kritická hodnota testu, zamítáme nulovou hypotézu shody distribučních funkcí obou skupin. 6.Pro velká n1 a n2 (> 30) lze využít asymptotické normality statistiky U. Adobe Systems Mannův-Whitneyův U test Ukázka výpočtu: 17 štěňat bylo trénováno k hygienickým návykům pomocí pozitivní (8 štěňat) nebo negativní motivace (9 štěňat). Zjistěte, zda se tyto dva přístupy liší. ID Délka výcviku Skupina Pořadí 1 35 pozitivne 1 2 41 pozitivne 2 3 43 pozitivne 4 4 44 pozitivne 5 5 47 pozitivne 7,5 6 48 pozitivne 9,5 7 48 pozitivne 9,5 8 51 pozitivne 11 9 42 negativne 3 10 46 negativne 6 11 47 negativne 7,5 12 53 negativne 12 13 54 negativne 13 14 57 negativne 14 15 59 negativne 15 16 65 negativne 16 17 74 negativne 17 min(U1,U2) = 13,5 Kritická hodnota U(8,9;0,05) = 15 Hodnota testové statistiky je menší než kritická hodnota zamítáme H0. http://www.mojestarosti.cz/poradna/images/mconsult/images/1339688205_pes.jpg T1 = 49,5 T2 = 103,5 U1 = 58,5 U2 = 13,5 Adobe Systems Institut biostatistiky a analýz LF – Výuka – Biostatistika 21 Párový Wilcoxonův test a znaménkový test ̶Vycházíme z rozdílů párových hodnot a přecházíme na design jednovýběrových testů. ̶Testuje, zda je medián diferencí (D) párových hodnot roven hodnotě 0. H0: D0,5 = 0 HA: D0,5 ≠ 0 ̶Dále postupujeme stejně jako u jednovýběrových testů výpočtem testové statistiky Sw+ a Sw- (u Wilcoxonova testu), resp. Sz+ (u znaménkového testu) a jejich porovnáním s kritickou hodnotou, resp. s kritickým intervalem (nebo pro větší vzorky použijeme aproximaci normálním rozdělením). Adobe Systems Institut biostatistiky a analýz LF – Výuka – Biostatistika 22 Párový Wilcoxonův test Ukázka výpočtu: U 10 pacientů byla zjištěna hodnota krevního parametru před a po podání léku. Zjistěte, zda se hodnoty před a po podaní léku liší. ID Před Po Rozdíl |Rozdíl| Pořadí 1 142 138 4 4 4,5 2 140 136 4 4 4,5 3 144 147 -3 3 3 4 144 139 5 5 7 5 142 143 -1 1 1 6 146 141 5 5 7 7 149 143 6 6 9,5 8 150 145 5 5 7 9 142 136 6 6 9,5 10 148 146 2 2 2 min(Sw+,Sw-) = 4 Kritická hodnota w10(0,05) = 8 Hodnota testové statistiky je menší než kritická hodnota zamítáme H0. Sw+ = 51 Sw- = 4 Adobe Systems Institut biostatistiky a analýz LF – Výuka – Biostatistika 23 Statistické testy o parametrech tří a více výběrů Kruskalův-Wallisův test Adobe Systems Institut biostatistiky a analýz LF – Výuka – Biostatistika 24 Kruskalův-Wallisův test ̶Neparametrická alternativa analýzy rozptylu (ANOVA) ̶Zobecnění Mannova-Whitneyova U testu pro více než dvě srovnávané skupiny. ̶Počítá s pořadím hodnot v souborech namísto s původními daty. ̶Nulová hypotéza předpokládá stejné rozdělení pravděpodobnosti veličiny ve všech skupinách. ̶Předpoklad: tvar rozdělení je ve všech skupinách stejný. ̶Poznámka: test lze použít i pro ordinální data (např. hodnocení zdravotního stavu na stupnici 1-5 apod.). ̶ Adobe Systems Institut biostatistiky a analýz LF – Výuka – Biostatistika 25 Kruskalův-Wallisův test Postup: 1.Stanovíme nulovou a alternativní hypotézu pro k skupin (F(x) – distribuční funkce): H0: F(x1) = F(x2) = … = F(xk) HA: alespoň jedna F(xi) se liší od ostatních 2.Hodnoty všech výběrů (skupin) jsou sloučena a je určeno jejich pořadí v tomto sloučeném souboru. 3.Pro všechny výběry zvlášť je spočítán součet pořadí (T1, … Tk). 4.Ze součtu pořadí ve skupinách je určena finální hodnota testové statistiky Q: Adobe Systems Institut biostatistiky a analýz LF – Výuka – Biostatistika 26 Kruskalův-Wallisův test 5.Pokud je Q ≥ χ2 (k-1), nebo když příslušná p-hodnota ≤ zvolená hladina významnosti, zamítáme nulovou hypotézu. Pro malé velikosti výběrů určujeme kritický obor z tabulek pro Kruskalův-Wallisův test. 6.V případě zamítnutí nulové hypotézy pokračujeme dále hledáním lišících se dvojic pomocí metod mnohonásobného porovnávání. Adobe Systems Institut biostatistiky a analýz LF – Výuka – Biostatistika 27 Praktické cvičení v programu Statistica Adobe Systems Institut biostatistiky a analýz LF – Výuka – Biostatistika 28 Datový soubor Rehabilitace po mozkovém infarktu Adobe Systems Institut biostatistiky a analýz LF – Výuka – Biostatistika 29 Rehabilitace po mozkovém infarktu ̶Cvičný datový soubor obsahuje záznamy o celkem 407 pacientech hospitalizovaných pro mozkový infarkt na neurologickém oddělení akutní péče, kde jim byla poskytnuta terapie pro obnovu krevního oběhu v postižené části mozku. ̶Po zvládnutí akutní fáze byl u pacientů vyhodnocen stupeň soběstačnosti v základních denních aktivitách (ADL) pomocí tzv. indexu Barthelové (BI) a byli přeloženi na rehabilitační oddělení. ̶Po dvou týdnech byl opět dle BI vyhodnocen stupeň soběstačnosti a pacienti byli buď propuštěni do ambulantní péče, nebo přeloženi na oddělení následné péče. Adobe Systems Institut biostatistiky a analýz LF – Výuka – Biostatistika 30 Sbírané informace: ̶základní demografické údaje (pohlaví a věk), ̶informace o samotné diagnóze mozkové příhody (etiologie a lokalizace uzávěru cévy), ̶informace o léčbě (typ indikované terapie a výskyt komplikací) ̶informace o způsobu ukončení rehabilitace. ̶Stupeň soběstačnosti před rehabilitací byl dodatečně zjištěn z neurologie a na konci rehabilitace byl vyplněn nový dotazník pro určení výsledného indexu Barthelové. Rehabilitace po mozkovém infarktu Adobe Systems Institut biostatistiky a analýz LF – Výuka – Biostatistika 31 Úkol 1. Jednovýběrový Wilcoxonův test Adobe Systems Institut biostatistiky a analýz LF – Výuka – Biostatistika 32 Úkol č. 1 – Jednovýběrový Wilcoxonův test Zadání: „V podobné zahraniční studii byla publikovaná střední hodnota indexu Barthelové na konci akutní rehabilitace po mozkovém infarktu ve výši 64,4. Zjistěte, zda výsledné dosažení stupně soběstačnosti dle BI ve vašich datech je stejné nebo jiné než v této studii.“ Postup: 1.Ověříme předpoklady testu: Normalita rozložení hodnot indexu Barthelové na konci rehabilitace (ověříme vizuálně i statistickým testem – Shapiro-Wilkův test). Adobe Systems Úkol č. 1 – Jednovýběrový Wilcoxonův test Postup (po nemožnosti použít jednovýběrový t-test): 1.Na hladině významnosti α = 0,05 testujeme hypotézu H0: proti HA: 2.Původní hodnoty Barthelové indexu převedeme na pořadí (určené podle absolutní hodnoty rozdílu oproti referenci). 3.Vypočítáme testovou statistiku Sw nebo Z a odpovídající p-hodnotu. 4. 4.Vypočítané statistiky porovnáme s kritickou hodnotou, nebo porovnáme p-hodnotu s hladinou významnosti α = 0,05. 5.Je-li p-hodnota > α nezamítáme H0. Výsledná soběstačnost pacientů v našem souboru se neliší od výsledků publikovaných v porovnávané studii. 6. Adobe Systems Institut biostatistiky a analýz LF – Výuka – Biostatistika 34 Úkol č. 1 – Ověření normality a popis dat ① Průměr a medián se výrazně liší (prů-měr 62 bodů, medián 70 bodů. Data jsou nejspíše asymetrická. Srovnání průměru a mediánu Histogram !!! Shapirův-Wilkův test !!! BI Krabicový graf Diagnostický N-P graf !!! Shapirův-Wilkův test !!! ② Asymetrie je patrná i z krabicového grafu a histogramu. Z histogramu je navíc zřetelně vidět odlišnost od normálního rozdělení. Odchylky od normality jsou patrné i z N-P grafu. ③ Na základě p-hodnoty < 0,001 zamítáme nulovou hypotézu o normalitě (tj. zamítáme, že není rozdíl mezi pozorovanými daty a teoretickým normálním rozdělením, … tj. data nejsou normálně rozdělená). Adobe Systems Úkol č. 1 – Řešení v programu Statistica Institut biostatistiky a analýz LF – Výuka – Biostatistika 35 •Do datové tabulky je potřeba přidat sloupec obsahující konstantní hodnotu reference, se kterou porovnáváme naše výsledky. • •V menu Statistics zvolíme Nonparametrics, vybereme Comparing two dependent samples (groups). 3 2 Adobe Systems Institut biostatistiky a analýz LF – Výuka – Biostatistika 36 Úkol č. 1 – Řešení v programu Statistica •Vybereme proměnné (Variables), které chceme testovat (testovaný parametr a reference). • •Kliknutím na Wilcoxon matched pair test získáme výsledky. Adobe Systems Institut biostatistiky a analýz LF 37 Úkol č. 1 – Výsledky v Statistica ① Pozorovaný výsledný medián Barthelové indexu je 70 bodů, což je oproti výsledku 64,4 bodů v porovnávané studii lepší výsledný stav o 5,6 bodů. ② P-hodnota statistické významnosti tohoto pozorova-ného rozdílu je ale p = 0,861, což na hladině významnosti 0,05 značí nevýznamný rozdíl, a z dostupných dat tedy nelze prokázat, že by výsledná soběstačnost pacientů léčených s mozkovým infarktem v našem souboru byla odlišná od výsledků publikovaných v porovnávané studii. http://files.mscck-trmice.webnode.cz/200000297-22250231ed/vyk%C5%99i%C4%8Dn%C3%ADk.png p-hodnota Wilcoxonova testu Rozsah výběru Hodnota testové statistiky Sw a Z Adobe Systems Institut biostatistiky a analýz LF – Výuka – Biostatistika 38 Úkol 2. Dvouvýběrový Mannův-Whitneyův test Adobe Systems Institut biostatistiky a analýz LF – Výuka – Biostatistika 39 Úkol č. 2 – Dvouvýběrový Mannův-Whitneyův test Zadání: „U pacientů hospitalizovaných pro moz- kový infarkt by po úspěšné terapii a absolvování akutní rehabilitace měl následovat přesun do ambulantní péče nebo na následné lůžko k pokračování v další rehabilitaci. Při správném managementu péče by do následné lůžkové péče měli pokračovat pouze pacienti, u kterých dosud nebylo dosaženo dostatečné rekonvalescence. Zkontrolujte, zda pacienti překládaní na následné lůžko mají skutečně horší míru soběstačnosti v základních denních aktivitách (ADL) vyjádřenou indexem Barthelové určenou v době propouštění.“ Adobe Systems Úkol č. 2 – Dvouvýběrový Mannův-Whitneyův test Postup (po nemožnosti použít dvouvýběrový t-test): 1.Na hladině významnosti α = 0,05 testujeme hypotézu H0: proti HA: 2.Původní hodnoty Barthelové indexu převedeme na pořadí v celém souboru. 3.Vypočítáme testovou statistiku U nebo Z a odpovídající p-hodnotu. 4. 4.Vypočítané statistiky porovnáme s kritickou hodnotou, nebo porovnáme p-hodnotu s hladinou významnosti α = 0,05. 5.Je-li p-hodnota ≤ α zamítáme H0. Aktuální soběstač-nost pacientů je určující pro jejich další pokračování v systému zdravotní péče. Adobe Systems Institut biostatistiky a analýz LF – Výuka – Biostatistika 41 Úkol č. 2 – Ověření normality a popis dat Krabicový graf ① Základní popis i grafické srovnání ukazuje výrazný rozdíl mezi skupinami (soběstačnost při propuštění do ambulantní péče je v mediánu 75 bodů, ale pacienti pokračující do následné péče mají medián pouze 40 bodů). ② Normalitu dat zamítáme u obou skupin (p = 0,013 a p < 0,001) a přinejmenším u pacientů propuštěných domů je výrazné porušení normality patrné graficky i z N-P grafu. !!! Shapirův-Wilkův test !!! Diagnostický N-P graf Popis dat Adobe Systems Institut biostatistiky a analýz LF – Výuka – Biostatistika 42 Úkol č. 2 – Řešení v programu Statistica •V menu Statistics zvolíme Nonparametrics, vybereme Comparing two independent samples (groups). 3 2 Adobe Systems Institut biostatistiky a analýz LF – Výuka – Biostatistika 43 Úkol č. 2 – Řešení v programu Statistica •Vybereme proměnnou, kterou chceme testovat (dependent) a proměnnou obsahující skupiny, které srovnáváme (grouping). • •Kliknutím na Mann-Whitney U test, nebo na M-W U test získáme výstupy. Adobe Systems Institut biostatistiky a analýz LF 44 Úkol č. 2 – Výsledky v Statistica p-hodnota Mannova-Whitneyova testu Rozsahy výběru obou skupin Hodnota testové statistiky U a Z http://files.mscck-trmice.webnode.cz/200000297-22250231ed/vyk%C5%99i%C4%8Dn%C3%ADk.png ① Z předchozího popisu je patrný výrazný rozdíl mezi skupinami (soběstačnost při propuštění do ambulantní péče je v mediánu 75 bodů, ale pacienti pokračující do následné péče mají medián pouze 40 bodů). ② P-hodnota statistické významnosti tohoto pozorovaného rozdílu je p < 0,001, což na hladině významnosti 0,05 značí významný rozdíl, a ze získaných dat tedy lze říct, že aktuální soběstačnost pacientů souvisí s jejich dalším pokračováním v systému zdravotní péče. Adobe Systems Institut biostatistiky a analýz LF – Výuka – Biostatistika 45 Úkol 3. Párový Wilcoxonův test Adobe Systems Institut biostatistiky a analýz LF – Výuka – Biostatistika 46 Úkol č. 3 – Párový Wilcoxonův test Zadání: „Pacientům hospitalizovaným s mozko- vým infarktem byla na lůžku akutní péče poskytnuta terapie pro obnovu krevního oběhu v postižené části mozku. Po zvládnutí akutní fáze byl u pacientů vyhodnocen stupeň soběstačnosti v základních denních aktivitách (ADL) pomocí indexu Barthelové (BI) a byli přeloženi na rehabilitační oddělení. Po dvou týdnech byl opět vyhodnocen stupeň soběstačnosti dle BI. Zjistěte, zda poskytnutá rehabilitační péče vedla ke zlepšení soběstačnosti ADL. “ Adobe Systems Úkol č. 3 – Párový Wilcoxonův test Postup (po nemožnosti použít párový t-test): 1.Na hladině významnosti α = 0,05 testujeme hypotézu o diferencích párových hodnot. H0: , HA: 2.Původní hodnoty vypočítaných diferencí obou měření pře-vedeme na pořadí (určené podle jejich absolutní hodnoty). 3.Vypočítáme testovou statistiku Sw nebo Z a odpovídající p-hodnotu. 4.Vypočítané statistiky porovnáme s kritickou hodnotou, nebo porovnáme p-hodnotu s hladinou významnosti α = 0,05. 5.Je-li p-hodnota ≤ α zamítáme H0. Během rehabilitace se podařilo změnit soběstačnost pacientů v denních aktivitách. Ke stejnému závěru jsme došli při použití parametrického t-testu. 6. Adobe Systems Institut biostatistiky a analýz LF – Výuka – Biostatistika 48 Úkol č. 3 – Ověření normality diferencí ① Průměr a medián jsou v podstatě shodné (cca -30) a data jsou tedy nejspíš alespoň symetrická. Srovnání průměru a mediánu Histogram !!! Shapirův-Wilkův test !!! Změna BI Krabicový graf Diagnostický N-P graf !!! Shapirův-Wilkův test !!! ② Symetrie je patrná i z krabi-cového grafu. Navíc histogram je svým průběhem velmi podobný normálnímu rozdělení. Z N-P grafu také nejsou patrné odchylky od normality. ③ Na základě p-hodnoty 0,003 zamítáme nulovou hypotézu o normalitě (tj. zamítáme, že není rozdíl mezi pozorovanými daty a teoretickým normálním rozdělením, … tj. data formálně dle testu nejsou normálně rozdělená). Adobe Systems Úkol č. 3 – Řešení v programu Statistica Institut biostatistiky a analýz LF – Výuka – Biostatistika 49 •V menu Statistics zvolíme Nonparametrics, vybereme Comparing two dependent samples (groups). 3 2 Adobe Systems Institut biostatistiky a analýz LF – Výuka – Biostatistika 50 Úkol č. 3 – Řešení v programu Statistica •Vybereme proměnné (Variables), které chceme testovat. • •Kliknutím na Wilcoxon matched pair test získáme výsledky. Adobe Systems Institut biostatistiky a analýz LF 51 Úkol č. 3 – Výsledky v Statistica ① Pozorovaný medián zlepšení Barthelové indexu na začátku a po rehabilitaci je 30 bodů. ② P-hodnota statistické významnosti této pozorované změny je p < 0,001, což na hladině významnosti 0,05 značí významný rozdíl, a lze tedy prohlásit, že stupeň soběstačnosti v základních denních aktivitách se viditelně během péče zlepšil. http://files.mscck-trmice.webnode.cz/200000297-22250231ed/vyk%C5%99i%C4%8Dn%C3%ADk.png p-hodnota Wilcoxonova testu Rozsah výběru Hodnota testové statistiky Sw a Z Adobe Systems Institut biostatistiky a analýz LF – Výuka – Biostatistika 52 Úkol 4. Kruskalův-Wallisův test Adobe Systems Institut biostatistiky a analýz LF – Výuka – Biostatistika 53 Úkol č. 4 – Kruskalův-Wallisův test Zadání: „Zjistěte, zda etiologie vzniku mozko- vého infarktu (deficit způsobený embolií, trombózou nebo neurčenou okluzí/stenózou) je potenciálním prediktivním faktorem výsledného stupně soběstačnosti v základních denních aktivitách (ADL) vyjádřeného indexem Barthelové. Tj., liší se pacienti s různým typem vzniku mozkového infarktu ve výsledné soběstačnosti?“ Adobe Systems Úkol č. 4 – Kruskalův-Wallisův test Postup (po nemožnosti použít ANOVA test): 1.Na hladině významnosti α = 0,05 testujeme hypotézu H0: proti HA: alespoň jedna dvojice se liší. 2.Původní hodnoty Barthelové indexu převedeme na pořadí v celém souboru. 3.Vypočítáme testovou statistiku Q a odpovídající p-hodnotu. 4. 4.Testovou statistiku porovnáme s kritickou hodnotou nebo porovnáme p-hodnotu s hladinou významnosti α = 0,05. 5.Je-li p-hodnota ≤ α zamítáme H0. Existuje alespoň jedna dvojice způsobu vzniku mozkového infarktu, která se liší v následné soběstačnosti pacientů. Adobe Systems Institut biostatistiky a analýz LF 55 Úkol č. 4 – Ověření normality a popis dat Srovnání průměru a mediánu BI Krabicový graf ① Základní popis i grafické srovnání ukazuje možný rozdíl mezi skupinami (soběstačnost po embolii je v mediánu 60 bodů, po trombóze 65 bodů a po neurčené okluzi nebo stenóze 70 bodů). ② Normalitu dat zamítáme u všech tří skupin (p < 0,001, p < 0,001 a p = 0,007) s tím, že u všech je porušení normality patrné graficky i z N-P grafu. Diagnostické N-P grafy Adobe Systems Úkol č. 4 – Řešení v programu Statistica Institut biostatistiky a analýz LF – Výuka – Biostatistika 56 •V menu Statistics zvolíme Nonparametrics, vybereme Comparing multiple indep. samples (groups). 3 2 Adobe Systems Úkol č. 4 – Řešení v programu Statistica Institut biostatistiky a analýz LF – Výuka – Biostatistika 57 1 2 •Vybereme proměnnou, kterou chceme testovat (dependent) a proměnnou obsahující skupiny, které srovnáváme (grouping). • •Kliknutím na Multiple comparisons of mean ranks for all groups získáme výstupy (celkové srovnání ale také mnohonásobné porovnání mezi všemi skupinami). Adobe Systems Institut biostatistiky a analýz LF 58 Úkol č. 4 – Výsledky v Statistica Souhrnná p-hodnota Kruskalova-Wallisova testu p-hodnoty mnohonásobného porovnání všech skupin ① Z předchozího popisu je patrný možný rozdíl mezi skupinami (soběstačnost po embolii je v mediánu 60 bodů, po trombóze 65 bodů a po neurčené okluzi nebo stenóze 70 bodů). ② Souhrnná p-hodnota statistické významnosti tohoto pozorovaného rozdílu je p < 0,001, což na hladině významnosti 0,05 značí významný rozdíl a ze získaných dat tedy lze říct, že existuje alespoň jedna dvojice způsobu vzniku mozkového infarktu, která se liší v následné soběstačnosti pacientů (tj. etiologie souvisí s další soběstačnosti). ③ Mnohonásobným porovnáním jsme navíc prokázali významný rozdíl mezi embolií a okluzí/stenózou a mezi trombózou a okluzí/stenózou (rozdíl mezi embolií a trombózou významný není). Jinými slovy, výsledný stupeň soběstačnosti je významně lepší u pacientů s okluzí/stenózou oproti embolii i trombóze. http://files.mscck-trmice.webnode.cz/200000297-22250231ed/vyk%C5%99i%C4%8Dn%C3%ADk.png