Testování hypotéz o9. seminář C:\WINWORD\CLIPART\CROWD.WMF Testování statistických hypotéz oStatistická hypotéza je výrok o statistickém souboru o Platnost statistických hypotéz se prověřuje pomocí testů významnosti, které rozhodují mezi: o- Hypotézou nulovou (testovanou) H0 o- Hypotézou alternativní (opačnou) HA oFormulace H0, HA není nahodilá, je přesně specifikovaná statistikem při odvozování testu významnosti. o! H0 se volí jako jednoduchá ! o= je rovno o≠ není rovno – dvoustranná H o> je větší – jedostranná H o o o o o o o o Příklady statistických hypotéz -Rozložení výšek 10-letých chlapců je normální (Gaussovo) - H0, HA není normální. -10-letí chlapci jsou větší než 10-letá děvčata - HA, H0 mají stejnou výšku o (μ1 = μ2) ≡ μ1 – μ2 = 0 -Lék A je účinnější než lék B při léčbě hypertenze - HA, H0 léky jsou stejně účinné. (πA = πB) ≡ πA – πB = 0 -Kouření je rizikový faktor pro ICHS, IM, Ca plic - HA, H0 kouření není rizikový faktor. -Existuje závislost mezi nízkou porodní hmotností a kojeneckou úmrtností - HA, H0 není závislost. o o o o Příklad: oJe potřeba použít hodnocení hladiny cholesterolu různých norem (standardů) s přihlédnutím k věku? oVýsledky výběrového šetření (muži) o1. (20-30) roků n1 = 50 m1 = 4,57 o s1 = 0,70 SE1 = 0,10 o2. (40-50) roků n2 = 60 m2 = 5,42 o s2 = 0,85 SE2 = 0,11 oOrientační řešení pomocí CI o20-30 95% CI (4,37; 4,77) o40-50 95% CI (5,18; 5,66) oObjektivně lze rozhodnout pomocí testu významnosti pro srovnání dvou průměrů. oVzhledem k tomu, že oba výběry jsou větší než 30, můžeme vycházet z modelu normálního (Gaussova) rozdělení. (μ1, σ1) ; (μ2, σ2) o o o H0 /HA oNulová hypotéza (testovaná) oPředpokládá, že jde o dva náhodné výběry z jednoho základního souboru (rozdíl není). o o o o o oAlternativní hypotéza (opačná) oPředpokládá, že jde o dva náhodné výběry ze dvou základních souborů s rozdílnými průměry. o o o o o oRozhodování mezi H0 a HA se zakládá na rozdílu m1 – m2 (5,42-4,57 = 0,85) Snímek 030.jpg Snímek 031.jpg Rozhodování 1)Pokud je rozdíl m1 – m2 (5,42-4,57= 0,85) o ?? rozumně blízko nule, tzn., že se dá vysvětlit náhodou, rozhodujeme se pro H0 (I.). o2) Je-li hodně vzdálen od nuly, dáváme přednost HA (II.) oOtázka „rozumně“ blízko se řeší pomocí CI pro rozdíl průměrů. oPokud H0 platí (μ1 = μ2 = μ), pak s pravděpodobností 0,95 by se měl rozdíl m1 – m2 nacházet v 95% CI o o o! SE je chyba rozdílu průměrů (m1 – m2). oVypočítá se pomocí SE1 (chyba průměru m1) a SE2 (chyba průměru m2). o! Pro nezávislé výběry platí SE² = SE1 ²+ SE2 ² ! o o Snímek 032.jpg Snímek 033.jpg Rozhodování oJak rozhodujeme? o1) Pokud je m1 – m2 mimo CI, H0 zamítáme o |m1 – m2| > 1,96. SE o2) Pokud m1 – m2 padne do CI, H0 nezamítáme o |m1 – m2| ≤ 1,96. SE o! Nezamítnutí H0 neznamená její přijetí oFormální úprava zápisu oad1) |m1 – m2| /SE > 1,96 H0 zamítáme oad 2) |m1 – m2| /SE ≤ 1,96 H0 nezamítáme o= u = testovací charakteristika = > u-test o oV anglické literatuře se používá i označení z ≥ z-test Příklad: Cholesterol oPodmínky použitelnosti 1)n1, n2 > 30 2)nezávislé výběry = > u-test o u = 5,70 oZávěr: ou = 5,70 >2,58 = > H0 zamítáme na 1% HV, tzn., že je hodně malá pravděpodobnost, že se mýlíme, když přisuzujeme významný vliv věku. o Jak rozhodujeme? o oZamítnutí – pravděpodobnost, že rozdíl mezi průměry je způsoben náhodou je tak malá, že tuto možnost zamítáme – dáváme přednost alternativní hypotézu o oNezamítnutí – rozdíly nepřesahují velikost rozdílů způsobených náhodou ! Testování statistických hypotéz ! 1.Stanovíme nulovou a alternativní hypotézu 2.Zvolíme hladinu významnosti 3.Vybereme vhodný test 4.Ověříme, zda jsou splněny podmínky pro použití testu 5.Vypočítáme testovací charakteristiku 6.Srovnáme ji s odpovídajícími kritickými hodnotami 7.Zamítneme nebo nezamítneme nulovou hypotézu 8.Výsledky interpretujeme o Příklad: oSrovnejte výšku tříletých brněnských chlapců a děvčat na podkladě výběrového šetření náhodně vybraných dětí: o oCH: n1 = 80 m1= 97,4 s1 = 3,8 oD: n2 = 80 m2 = 96,3 s2 = 3,7 o o 1) Řešení oŘešení: 1)H0 ≡ μCH = μD HA ≡ μCH ≠ μD 2)Zvolíme hladinu významnosti α = 0,05 eventuálně 0,01 3)Ověříme podmínky použitelnosti u-testu o n1, n 2 > 30 o výběry jsou nezávislé o Příklad o4) Vypočítáme testovací charakteristiku o o o o o o o5) Závěr: protože u = 1,84 < 1,96 H0 nezamítáme. o6) Interpretace: Nezamítnutí H0 neznamená její přijetí. o Správná formulace: Rozdíl v průměrných výškách tříletých chlapců a děvčat není statisticky významný. Nebylo by správné tvrdit, že rozdíl neexistuje. o Snímek 039.jpg Nezamítnutí H0 oNezamítnutí H0 (μ1 = μ2 ) představuje rozhodnutí dvojznačné. Buď nulová hypotéza platí, nebo neplatí, avšak na základě zjištěných výsledků se ji nepodařilo zamítnout. oPříklad: s výškou chlapců a děvčat (skripta str. 23), o u = 2,70, což vede k zamítnutí H0 (n1 = 170, n2 = 172) oRozdíl ve výškách chlapců a děvčat 1,1 cm se jako významný prokázal při větším počtu změřených dětí. o! Závěr: Prokázání relativně malého rozdílu v průměrech vyžaduje větší počet měření. oRozložení výšek chlapců a děvčat Snímek 040.jpg Příklad na srovnání pravděpodobností oByl sledován výskyt alergií u studentů LF: oMale: n 1= 105 k = 21 p = 0,20 (20%) oFemale: n = 195 k = 19 p = 0,097 (9,7%) o oOtázka: Je rozdíl mezi pravděpodobností výskytu alergie u mužů a u žen způsoben náhodou, anebo lze odvodit, že alergie postihují častěji muže? oPostup: 1)Pro soubor mužů i pro soubor žen zjistit, zda je splněna podmínka pro použití u-testu. 2)Vypočítat SE rozdílů pravděpodobností o o3) Vypočítat testovací charakteristiku a porovnat ji s příslušnou kritickou hodnotou Snímek 041.jpg Řešení Snímek.jpg Srovnání pravděpodobností u-testem oPříklad: o oV souboru 200 náhodně vybraných studentů LF byla zjištěna zraková vada u 80 studentů (p1 = 80/200= 0,40,ev. 40%) o oU 250 nestudujících stejného věku byla zraková vada zjištěna u 85 vyšetřovaných (p2= 0,34, ev. 34%) o o o o - Srovnání pravděpodobností u-testem oŘešení: H0 ≡ π1 = π2 není rozdíl ve výskytu zrakové vady u stud. a nestud. mládeže o HA ≡ π1 ≠ π2 je rozdíl oPodmínky použití u-testu -Nezávislé výběry -Konvergence binomického rozdělení k normálnímu (n.p.(1-p) > 9) o 200 . 0,4 . (1-0,4) = 48 > 9, 250 . 0,34 . (1-0,34) = 56,1 > 9 o o o oZávěr: Nulovou hypotézu nezamítáme, nepodařilo se prokázat, že by nestudující mládež měla významně méně zrakových vad než studenti LF. o Snímek 043.jpg Studentovo rozdělení t oPodmínka: n1, n2 < 30 oTestovací charakteristika t = o o o o o o oPočet stupňů volnosti f = n1 + n2 – 2 oKritické hodnoty viz skripta str. 23 o Snímek 002.jpg Příklad oSrovnejte průměrnou porodní hmotnost u novorozenců matek silných kuřaček a nekuřaček na podkladě výběrového šetření u 30 novorozenců. 1)Nekuřačky: n1 = 15 m1 = 3,59 s1 = 0,37 2) Silné kuřačky: n2 = 15 m2 = 3,20 s2 = 0,49 - Řešení oŘešení: -Výběry jsou nezávislé -n1, n2 < 30 => Studentův t-test o o o o o o o oZávěr: Nulovou hypotézu (μ1 = μ2 ) zamítáme na 5% HV. Riziko, že se mýlíme, je mezi (1-5)%. - o Snímek 042.jpg Děkuji za pozornost C:\WINWORD\CLIPART\CROWD.WMF