Testování statistických hypotéz (1)
oV lékařském výzkumu → neustále prověřujeme předpoklady a domněnky (cíl: potvrdit nebo vyvrátit)
o
omožno formulovat jako tzv. statistické hypotézy
o
oSTAT metody: urychlují a objektivizují třídění domněnek (hypotéz) na:
§mylné
§správné

Testování statistických hypotéz (2)
oPojmy:
o
nTestovaná (nulová) hypotéza
nAlternativní hypotéza
nHladina významnosti
nKritické hodnoty
natd.

Testování statistických hypotéz (3)
oSTATISTICKÁ HYPOTÉZA = výrok o statistickém souboru
o
oPlatnost statistických hypotéz se prověřuje pomocí testů významnosti, které rozhodují mezi:
o
o- Hypotézou nulovou (testovanou) H0
o- Hypotézou alternativní (opačnou) HA
-
oFormulace H0, HA není nahodilá   x  je přesně specifikovaná statistikem při odvozování testu
významnosti.
o
o! H0 se volí jako jednoduchá !
o
o
o
o
o
o
o
o

Příklady statistických hypotéz
o1. H0: Rozložení výšek 10-letých chlapců je normální (Gaussovo).
o       HA: Není normální.
o2. HA: 10-letí chlapci jsou větší než 10-letá děvčata.
o      H0: Mají stejnou výšku.
o (μ1 = μ2) ≡ μ1 – μ2 = 0
o3. HA: Lék A je účinnější než lék B při léčbě hypertenze.
o H0: Léky jsou stejně účinné.
o (πA = πB) ≡ πA – πB = 0
o4. HA: Kouření je rizikový faktor pro ICHS, IM, Ca plic.
o H0: Kouření není rizikový faktor. (RR = 1)
o5. HA: Existuje závislost mezi nízkou porodní hmotností a kojeneckou úmrtností.
o H0: Není závislost.
o
o
o
o

Příklad (1):
o
oJe potřeba použít pro hodnocení hladiny cholesterolu různých norem (standardů) s přihlédnutím k
věku?
o
o
oVýsledky výběrového šetření (muži)
o1. (20-30) roků   n1 = 50 m1 = 4,57
o                 s1 = 0,70 SE1 = 0,10
o2.   (40-50) roků  n2 = 60 m2 = 5,42
o                 s2 = 0,85 SE2 = 0,11
o
o
o

Příklad (2):
oOrientační řešení pomocí CI
o20-30 95%    CI (4,37; 4,77)
o40-50 95%    CI (5,20; 5,64)
o
oObjektivně lze rozhodnout pomocí testu významnosti pro srovnání dvou průměrů.
o
oVzhledem k tomu, že oba výběry jsou větší než 30, můžeme vycházet z modelu normálního (Gaussova)
rozdělení. (μ1, σ1) ; (μ2, σ2)
o
o

H0 /HA
oNulová hypotéza (testovaná)
oPředpokládá, že jde o dva náhodné výběry z jednoho základního souboru (rozdíl není).
o
o
o
o
o
oAlternativní hypotéza (opačná)
oPředpokládá, že jde o dva náhodné výběry ze dvou základních souborů s rozdílnými průměry.
o
o
o
o
o
oRozhodování mezi H0 a HA se zakládá na rozdílu m1 – m2 (5,42-4,57 = 0,85)
Snímek 030.jpg Snímek 031.jpg

Rozhodování (1)
oPokud je rozdíl m1 – m2 (5,42 - 4,57 = 0,85)
o
o1)  ?? rozumně blízko nule, tzn., že se dá vysvětlit náhodou → rozhodujeme se pro H0
o
o2) Je-li hodně vzdálen od nuly, dáváme přednost HA
o
o

Rozhodování (2)
oOtázka „rozumně“ blízko se řeší pomocí CI pro rozdíl průměrů.
oPokud H0 platí (μ1 = μ2 = μ), pak s pravděpodobností 0,95 by se měl rozdíl  m1 – m2 nacházet v 95%
CI
o
o
o! SE je chyba rozdílu průměrů (m1 – m2).
oVypočítá se pomocí SE1 (chyba průměru m1) a SE2 (chyba průměru m2).
o! Pro nezávislé výběry platí SE² = SE1²+ SE2² !
o
o
Snímek 032.jpg Snímek 033.jpg

Rozhodování (3)
oJak rozhodujeme?
o
o1) Pokud je m1 – m2 mimo CI → H0 zamítáme
o |m1 – m2| > 1,96 SE
o
o2) Pokud m1 – m2 padne do CI → H0 nezamítáme
o |m1 – m2| ≤ 1,96 SE
o
o! Nezamítnutí H0 neznamená její přijetí

Rozhodování (4)
oFormální úprava zápisu:
o
oad1) |m1 – m2| /SE > 1,96 → H0 zamítáme
o
oad 2) |m1 – m2| /SE ≤ 1,96 → H0 nezamítáme
o
ou = testovací charakteristika  = >  u-test
o
oV anglické literatuře se používá i označení  z     →    z-test
o

Příklad: Cholesterol
oPodmínky použitelnosti:
1)n1, n2 > 30
2)nezávislé výběry = > u-test
o u = 5,70
o
oZávěr:
ou = 5,70 >2,58 = > H0 zamítáme na 1% HV, tzn., že je hodně malá pravděpodobnost, že se mýlíme,
když přisuzujeme významný vliv věku.
o

Jak rozhodujeme? (1)
o
oZamítnutí –pravděpodobnost, že rozdíl mezi průměry je způsoben náhodou, je tak malá, že tuto
možnost (H0) zamítáme – a přijímáme alternativní hypotézu (HA)
o - riziko chyby prvního typu
o
oNezamítnutí – rozdíly nepřesahují velikost rozdílů způsobených náhodou, ale mohla nastat tzv.
chyba druhého typu.
Skuteč
nost
Naše rozhodnutí
H0 neplatí
H0 platí
Zamítáme H0
Správné rozhodnutí
Chyba 1. typu   α
Nezamítáme H0
Chyba 2. typu  β
Správné rozhodnutí

Jak rozhodujeme? (2)
oIF spolehlivost rozhodování: 95%
o
o→ riziko (nesprávnost) rozhodování: 1%
o
oJe to pravděpodobnost, že rozhodnutí je špatné → pravděpodobnost chyby 1.druhu nebo tzv. HLADINA
VÝZNAMNOSTI α
o
opro 95% → konstanta 1,96 → 5 % kritická hodnota
oPro 99% → konstanta 2,58 → 1% kritická hodnota

Jak rozhodujeme? (3)
o
o+ rozhodování doprovázeno chybou 2.druhu β, kt.vyjadřuje nesprávné zamítnutí HA
o
o→ stará se o ni statistik při odvozování testu
o

! Testování statistických hypotéz !
1.
1.Stanovíme nulovou a alternativní hypotézu
2.Zvolíme hladinu významnosti  (HV = 5% nebo 1%)
3.Vybereme vhodný test (u-test; t-test)
4.Ověříme, zda jsou splněny podmínky pro použití testu
5.Vypočítáme testovací charakteristiku
6.Srovnáme ji s odpovídajícími kritickými hodnotami
7.Zamítneme nebo nezamítneme nulovou hypotézu
8.Výsledky interpretujeme
o

Příklad:
o
oSrovnejte výšku tříletých brněnských chlapců a děvčat na podkladě výběrového šetření náhodně
vybraných dětí:
o
o
o CH: n1 = 80 m1  = 97,4 s1 = 3,8
o D:      n2 = 80 m2 = 96,3 s2 = 3,7
o
o
1)

Nezamítnutí H0
oNezamítnutí H0 (μ1 = μ2 ) představuje rozhodnutí dvojznačné. Buď nulová hypotéza platí, nebo
neplatí, avšak na základě zjištěných výsledků se ji nepodařilo zamítnout.
o
oPříklad: s výškou chlapců a děvčat (skripta str. 23),
o u = 2,70, což vede k zamítnutí H0 (n1 = 170, n2 = 172)
o
oRozdíl ve výškách chlapců a děvčat 1,1 cm se jako významný prokázal při větším počtu změřených
dětí.
o
o! Závěr: Prokázání relativně malého rozdílu v průměrech vyžaduje větší počet měření.
o

Nezamítnutí H0
o
oRozložení výšek chlapců a děvčat
Snímek 040.jpg

Příklad na srovnání pravděpodobností (1)
o
oByl sledován výskyt alergií u studentů LF:
o
oMuži: n1 = 105 k = 21 p = 0,20   (20%)
oŽeny: n2 = 195 k = 19 p = 0,097 (9,7%)
o
oOtázka: Je rozdíl mezi pravděpodobností výskytu alergie u mužů a u žen způsoben náhodou, anebo lze
odvodit, že alergie postihují častěji muže?

Příklad na srovnání pravděpodobností (2)
oPostup:
1)Pro soubor mužů i pro soubor žen zjistit, zda je splněna podmínka pro použití u-testu.
o
o2) Vypočítat SE rozdílů pravděpodobností
o
o
o
o3)    Vypočítat testovací charakteristiku a porovnat ji s příslušnou kritickou hodnotou
Snímek 041.jpg

Srovnání pravděpodobností u-testem
oPříklad:
o
oV souboru 200 náhodně vybraných studentů LF byla zjištěna zraková vada u 80 studentů (p1 = 80/200=
0,40,ev. 40%)
o
oU 250 nestudujících stejného věku byla zraková vada zjištěna u 85 vyšetřovaných (p2= 0,34, ev.
34%)
o
o
o
o
-

Studentovo rozdělení t
oPodmínka: n1, n2 < 30
oTestovací charakteristika t =
o
o
o
o
o
o
oPočet stupňů volnosti f = n1 + n2 – 2
oKritické hodnoty viz skripta str. 25
o
Snímek 002.jpg

Příklad
o
oSrovnejte průměrnou porodní hmotnost u novorozenců matek silných kuřaček a nekuřaček na podkladě
výběrového šetření u 30 novorozenců.
o
1) Nekuřačky:       n1 = 15 m1 = 3,59     s1 = 0,37
2) Silné kuřačky: n2 = 15 m2 = 3,20 s2 = 0,49
-