Testování statistických hypotéz (1) oV lékařském výzkumu → neustále prověřujeme předpoklady a domněnky (cíl: potvrdit nebo vyvrátit) o omožno formulovat jako tzv. statistické hypotézy o oSTAT metody: urychlují a objektivizují třídění domněnek (hypotéz) na: §mylné §správné Testování statistických hypotéz (2) oPojmy: o nTestovaná (nulová) hypotéza nAlternativní hypotéza nHladina významnosti nKritické hodnoty natd. Testování statistických hypotéz (3) oSTATISTICKÁ HYPOTÉZA = výrok o statistickém souboru o oPlatnost statistických hypotéz se prověřuje pomocí testů významnosti, které rozhodují mezi: o o- Hypotézou nulovou (testovanou) H0 o- Hypotézou alternativní (opačnou) HA - oFormulace H0, HA není nahodilá x je přesně specifikovaná statistikem při odvozování testu významnosti. o o! H0 se volí jako jednoduchá ! o o o o o o o o Příklady statistických hypotéz o1. H0: Rozložení výšek 10-letých chlapců je normální (Gaussovo). o HA: Není normální. o2. HA: 10-letí chlapci jsou větší než 10-letá děvčata. o H0: Mají stejnou výšku. o (μ1 = μ2) ≡ μ1 – μ2 = 0 o3. HA: Lék A je účinnější než lék B při léčbě hypertenze. o H0: Léky jsou stejně účinné. o (πA = πB) ≡ πA – πB = 0 o4. HA: Kouření je rizikový faktor pro ICHS, IM, Ca plic. o H0: Kouření není rizikový faktor. (RR = 1) o5. HA: Existuje závislost mezi nízkou porodní hmotností a kojeneckou úmrtností. o H0: Není závislost. o o o o Příklad (1): o oJe potřeba použít pro hodnocení hladiny cholesterolu různých norem (standardů) s přihlédnutím k věku? o o oVýsledky výběrového šetření (muži) o1. (20-30) roků n1 = 50 m1 = 4,57 o s1 = 0,70 SE1 = 0,10 o2. (40-50) roků n2 = 60 m2 = 5,42 o s2 = 0,85 SE2 = 0,11 o o o Příklad (2): oOrientační řešení pomocí CI o20-30 95% CI (4,37; 4,77) o40-50 95% CI (5,20; 5,64) o oObjektivně lze rozhodnout pomocí testu významnosti pro srovnání dvou průměrů. o oVzhledem k tomu, že oba výběry jsou větší než 30, můžeme vycházet z modelu normálního (Gaussova) rozdělení. (μ1, σ1) ; (μ2, σ2) o o H0 /HA oNulová hypotéza (testovaná) oPředpokládá, že jde o dva náhodné výběry z jednoho základního souboru (rozdíl není). o o o o o oAlternativní hypotéza (opačná) oPředpokládá, že jde o dva náhodné výběry ze dvou základních souborů s rozdílnými průměry. o o o o o oRozhodování mezi H0 a HA se zakládá na rozdílu m1 – m2 (5,42-4,57 = 0,85) Snímek 030.jpg Snímek 031.jpg Rozhodování (1) oPokud je rozdíl m1 – m2 (5,42 - 4,57 = 0,85) o o1) ?? rozumně blízko nule, tzn., že se dá vysvětlit náhodou → rozhodujeme se pro H0 o o2) Je-li hodně vzdálen od nuly, dáváme přednost HA o o Rozhodování (2) oOtázka „rozumně“ blízko se řeší pomocí CI pro rozdíl průměrů. oPokud H0 platí (μ1 = μ2 = μ), pak s pravděpodobností 0,95 by se měl rozdíl m1 – m2 nacházet v 95% CI o o o! SE je chyba rozdílu průměrů (m1 – m2). oVypočítá se pomocí SE1 (chyba průměru m1) a SE2 (chyba průměru m2). o! Pro nezávislé výběry platí SE² = SE1²+ SE2² ! o o Snímek 032.jpg Snímek 033.jpg Rozhodování (3) oJak rozhodujeme? o o1) Pokud je m1 – m2 mimo CI → H0 zamítáme o |m1 – m2| > 1,96 SE o o2) Pokud m1 – m2 padne do CI → H0 nezamítáme o |m1 – m2| ≤ 1,96 SE o o! Nezamítnutí H0 neznamená její přijetí Rozhodování (4) oFormální úprava zápisu: o oad1) |m1 – m2| /SE > 1,96 → H0 zamítáme o oad 2) |m1 – m2| /SE ≤ 1,96 → H0 nezamítáme o ou = testovací charakteristika = > u-test o oV anglické literatuře se používá i označení z → z-test o Příklad: Cholesterol oPodmínky použitelnosti: 1)n1, n2 > 30 2)nezávislé výběry = > u-test o u = 5,70 o oZávěr: ou = 5,70 >2,58 = > H0 zamítáme na 1% HV, tzn., že je hodně malá pravděpodobnost, že se mýlíme, když přisuzujeme významný vliv věku. o Jak rozhodujeme? (1) o oZamítnutí –pravděpodobnost, že rozdíl mezi průměry je způsoben náhodou, je tak malá, že tuto možnost (H0) zamítáme – a přijímáme alternativní hypotézu (HA) o - riziko chyby prvního typu o oNezamítnutí – rozdíly nepřesahují velikost rozdílů způsobených náhodou, ale mohla nastat tzv. chyba druhého typu. Skuteč nost Naše rozhodnutí H0 neplatí H0 platí Zamítáme H0 Správné rozhodnutí Chyba 1. typu α Nezamítáme H0 Chyba 2. typu β Správné rozhodnutí Jak rozhodujeme? (2) oIF spolehlivost rozhodování: 95% , resp. 99% o o→ riziko (nesprávnost) rozhodování: 5%, resp. 1% o oJe to pravděpodobnost, že rozhodnutí je špatné → pravděpodobnost chyby 1.druhu nebo tzv. HLADINA VÝZNAMNOSTI α o opro 95% → konstanta 1,96 → 5 % kritická hodnota oPro 99% → konstanta 2,58 → 1% kritická hodnota Jak rozhodujeme? (3) o o+ rozhodování doprovázeno chybou 2.druhu β, kt.vyjadřuje nesprávné zamítnutí HA o o→ stará se o ni statistik při odvozování testu o ! Testování statistických hypotéz ! 1. 1.Stanovíme nulovou a alternativní hypotézu 2.Zvolíme hladinu významnosti (HV = 5% nebo 1%) 3.Vybereme vhodný test (u-test; t-test) 4.Ověříme, zda jsou splněny podmínky pro použití testu 5.Vypočítáme testovací charakteristiku 6.Srovnáme ji s odpovídajícími kritickými hodnotami 7.Zamítneme nebo nezamítneme nulovou hypotézu 8.Výsledky interpretujeme o Příklad: o oSrovnejte výšku tříletých brněnských chlapců a děvčat na podkladě výběrového šetření náhodně vybraných dětí: o o o CH: n1 = 80 m1 = 97,4 s1 = 3,8 o D: n2 = 80 m2 = 96,3 s2 = 3,7 o o 1) Nezamítnutí H0 oNezamítnutí H0 (μ1 = μ2 ) představuje rozhodnutí dvojznačné. Buď nulová hypotéza platí, nebo neplatí, avšak na základě zjištěných výsledků se ji nepodařilo zamítnout. o oPříklad: s výškou chlapců a děvčat (skripta str. 23), o u = 2,70, což vede k zamítnutí H0 (n1 = 170, n2 = 172) o oRozdíl ve výškách chlapců a děvčat 1,1 cm se jako významný prokázal při větším počtu změřených dětí. o o! Závěr: Prokázání relativně malého rozdílu v průměrech vyžaduje větší počet měření. o Nezamítnutí H0 o oRozložení výšek chlapců a děvčat Snímek 040.jpg Příklad na srovnání pravděpodobností (1) o oByl sledován výskyt alergií u studentů LF: o oMuži: n1 = 105 k = 21 p = 0,20 (20%) oŽeny: n2 = 195 k = 19 p = 0,097 (9,7%) o oOtázka: Je rozdíl mezi pravděpodobností výskytu alergie u mužů a u žen způsoben náhodou, anebo lze odvodit, že alergie postihují častěji muže? Příklad na srovnání pravděpodobností (2) oPostup: 1)Pro soubor mužů i pro soubor žen zjistit, zda je splněna podmínka pro použití u-testu. o o2) Vypočítat SE rozdílů pravděpodobností o o o o3) Vypočítat testovací charakteristiku a porovnat ji s příslušnou kritickou hodnotou Snímek 041.jpg Srovnání pravděpodobností u-testem oPříklad: o oV souboru 200 náhodně vybraných studentů LF byla zjištěna zraková vada u 80 studentů (p1 = 80/200= 0,40,ev. 40%) o oU 250 nestudujících stejného věku byla zraková vada zjištěna u 85 vyšetřovaných (p2= 0,34, ev. 34%) o o o o - Studentovo rozdělení t oPodmínka: n1, n2 < 30 oTestovací charakteristika t = o o o o o o oPočet stupňů volnosti f = n1 + n2 – 2 oKritické hodnoty viz skripta str. 25 o Snímek 002.jpg Příklad o oSrovnejte průměrnou porodní hmotnost u novorozenců matek silných kuřaček a nekuřaček na podkladě výběrového šetření u 30 novorozenců. o 1) Nekuřačky: n1 = 15 m1 = 3,59 s1 = 0,37 2) Silné kuřačky: n2 = 15 m2 = 3,20 s2 = 0,49 -