INDUKTIVNÍ STATISTIKA II. TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ • •Při testování statistických hypotéz vycházíme z údajů zjištěných ve výběrovém souboru - jde o induktivní soud. • •Statistická hypotéza = výrok o statistickém souboru (není nutně totožná s výzkumnou hypotézou!!!) • •např. - daná veličina má normální rozdělení, • - dva srovnávané výběry pocházejí z jednoho ZS, • - dvě veličiny jsou na sobě nezávislé • • •K určení platnosti hypotézy se používá tzv. testů významnosti, které rozhodují mezi: –nulovou (testovanou) hypotézou H0 –hypotézou alternativní (opačnou) HA • •Hypotéza jednoduchá (předpokládá se jediná možnost) • např. π = 0,3 •Hypotéza složená (souhrn jednoduchých hypotéz) • např. π ≠ 0,3 - jednostranná • - dvoustranná •Formulace Ho, HA není nahodilá, je přesně specifikovaná statistikem při odvozování testu významnosti. • ! H0 se volí jako jednoduchá ! • = je rovno • ≠ není rovno – dvoustranná H • > je větší – jednostranná H • ≡ totožný s… • • TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ – základní pojmy • Příklad: •Je potřeba použít pro hodnocení hladiny cholesterolu různých norem s přihlédnutím k věku? • •Muži 20-30 let: n1 = 50 m1 = 4,57 s1 = 0,70 SE1 = 0,10 •Muži 40-50 let: n2 = 60 m2 = 5,42 s2 = 0,85 SE2 = 0,11 • •Odpověď můžeme odhadnout pomocí intervalů spolehlivosti. Pokud se intervaly spolehlivosti, které vytvoříme kolem bodových odhadů m1 a m2 překrývají, pak lze očekávat, že rozdíl mezi nimi není statisticky významný. Naopak, pokud se nepřekrývají, lze očekávat, že rozdíl je statisticky významný. • •m1 = 4,57 95% CI (4,37; 4,77) m2 = 5,42 95% CI (5,18; 5,66) • • Příklad: SROVNÁVÁNÍ PRŮMĚRŮ •Jsou rozdíly v průměrné hladině cholesterolu v různých věkových skupinách tak velké, že je pro její hodnocení vhodné používat různé normy? • •Otázku můžeme objektivně zodpovědět pomocí testování statistické hypotézy o rozdílu průměrů m1 – m2. (test pro srovnání dvou průměrů) • • TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ 1.Stanovíme nulovou a alternativní hypotézu 2.Zvolíme hladinu významnosti 3.Vybereme vhodný test 4.Ověříme, zda jsou splněny podmínky pro použití testu 5.Vypočítáme testovací charakteristiku 6.Srovnáme ji s odpovídajícími kritickými hodnotami 7.Zamítneme nebo nezamítneme nulovou hypotézu 8.Výsledky interpretujeme • TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ 1.Stanovíme nulovou a alternativní hypotézu • • NULOVÁ A ALTERNATIVNÍ HYPOTÉZA •Při testování hypotéz začínáme tím, že předpokládáme určitou hodnotu parametru základního souboru a potom učiníme závěr týkající se výběrového statistického ukazatele • •Nulová hypotéza H0 - testovaná •Předpokládá, že rozdíl mezi parametrem a výběrovým ukazatelem je blízký nule – nulová hypotéza. • (p = 0,3 = π, π - p = 0) • •Alternativní hypotéza HA - opačná •Předpokládá opak, tj. že rozdíl mezi parametrem a výběrovým ukazatelem je nenulový (hodně vzdálen od nuly). • (p = 0,3 ≠π, π – p ≠ 0) Příklad: SROVNÁVÁNÍ PRŮMĚRŮ Příklad: SROVNÁVÁNÍ PRŮMĚRŮ μ m1 m2 4,57 5,42 Příklad: SROVNÁVÁNÍ PRŮMĚRŮ •Alternativní hypotéza (opačná) -předpokládá opak, tj. že jde o dva výběry ze dvou různých základních souborů s rozdílnými průměry (rozdíl mezi průměry je statisticky významný) • HA: μ1 ≠ μ2 • μ1 - μ2 ≠ 0 • • Příklad: SROVNÁVÁNÍ PRŮMĚRŮ •Alternativní hypotéza (opačná) -předpokládá opak, tj. že jde o dva výběry ze dvou různých základních souborů s rozdílnými průměry (rozdíl mezi průměry je statisticky významný) • HA: μ1 ≠ μ2 • μ1 - μ2 ≠ 0 • • μ μ m1 m2 4,57 5,42 TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ 1.Stanovíme nulovou a alternativní hypotézu 2.Zvolíme hladinu významnosti • HLADINA VÝZNAMNOSTI •Je-li pravděpodobnost nějakého jevu velmi malá, chováme se (většinou) tak, jako by nemohl vůbec nastat. • •Je-li malá pravděpodobnost, že H0 platí, chováme se tak, jako by neplatila a zamítáme ji. • •Tato malá pravděpodobnost se nazývá hladina významnosti, obvykle α = 0,05 nebo 0,01. Vyjadřuje riziko nesprávného zamítnutí H0, tzv. chyba 1. druhu. • •β ozn. chybu 2. druhu, souvisí se silou statistického testu . Nastává, když H0 nezamítáme, přestože ve skutečnosti neplatí. • • Síla testu = 1- β: schopnost zamítnout H0, když neplatí. • • Příklad: SROVNÁVÁNÍ PRŮMĚRŮ •Je potřeba použít pro hodnocení hladiny cholesterolu různých norem s přihlédnutím k věku? • •Muži 20-30 let: n1 = 50 m1 = 4,57 s1 = 0,70 SE1 = 0,10 •Muži 40-50 let: n2= 60 m2 = 5,42 s2 = 0,85 SE2 = 0,11 • • •Hladinu významnosti si zvolíme např. α = 0,05. TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ 1.Stanovíme nulovou a alternativní hypotézu 2.Zvolíme hladinu významnosti 3.Vybereme vhodný test • TESTY VÝZNAMNOSTI • •Platnost statistických hypotéz prověřujeme pomocí tzv. testů významnosti: • –Testy pro hodnoty parametrů (měříme vzdálenost pozorované statistiky od hypotézou stanovené hodnoty parametru) –Srovnávání rozdílů parametrů (např. test významnosti pro rozdíly středních hodnot či pravděpodobností) –Zjišťování typu rozložení četností (testy NR) –Hodnocení závislostí (testy závislosti) • TESTY VÝZNAMNOSTI •Parametrické testy •Vycházejí ze srovnávání parametrů μ, σ, π (zastoupených při srovnávání výběrovými charakteristikami m, p, s). •Musíme znát typ rozložení testované veličiny, hypotézy se týkají parametrů tohoto rozložení. •Srovnáváme charakteristiky dvou nezávislých výběrů. • TESTY VÝZNAMNOSTI •Neparametrické testy •Velkou skupinu tvoří např. testy založené na pořadí •Výhody: jsou početně jednodušší a nepředpokládají znalost typu rozložení a lze je použít pro závislé výběry malého rozsahu •Nevýhody: mají menší sílu, tzn. mají menší schopnost zamítnout nulovou hypotézu, když ta skutečně neplatí. • VÝBĚR VHODNÉHO TESTU • Obecně: rozhodování mezi Ho a HA spočívá v přijetí vhodného pravidla, kterým se rozdělí výběrový prostor na 2 podmnožiny : 1/obor nezamítnutí Ho • 2/ kritický obor (tj.obor zamítnutí Ho) • Testovací charakteristika má za platnosti Ho některé známé teoretické rozdělení → znalost modelu umožnit stanovit hranice mezi oborem zamítnutí a nezamítnutí tj. tzv. kritické hodnoty • u-test (z-test): • parametrický test •normální rozložení •Vypočítaná testovací charakteristika u (někdy ozn. z) se srovnává s kritickými hodnotami normálního rozložení (1,96;2,58) • • Příklad: SROVNÁVÁNÍ PRŮMĚRŮ •Je potřeba použít pro hodnocení hladiny cholesterolu různých norem s přihlédnutím k věku? • •Muži 20-30 let: n1 = 50 m1 = 4,57 s1 = 0,70 SE1 = 0,10 •Muži 40-50 let: n2= 60 m2 = 5,42 s2 = 0,85 SE2 = 0,11 • • •Pro srovnání průměrů zvolíme u-test •Při dostatečně velkých souborech mají rozdíly výběrových • průměrů normální rozdělení TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ 1.Stanovíme nulovou a alternativní hypotézu 2.Zvolíme hladinu významnosti 3.Vybereme vhodný test 4.Ověříme, zda jsou splněny podmínky pro použití testu • PODMÍNKY PRO POUŽITÍ TESTU • •Podmínky pro použití u-testu pro srovnávání průměrů 1.n1 > 30, n2 > 30 –pro menší soubory Studentův t-test 2.nezávislé výběry –(hodnoty do nich zahrnuté se vzájemně neovlivňují) 3.stejné rozptyly –neliší se významně • Příklad: SROVNÁVÁNÍ PRŮMĚRŮ •Je potřeba použít pro hodnocení hladiny cholesterolu různých norem s přihlédnutím k věku? • •Muži 20-30 let: n1 = 50 m1 = 4,57 s1 = 0,70 SE1 = 0,10 •Muži 40-50 let: n2 = 60 m2 = 5,42 s2 = 0,85 SE2 = 0,11 • •Podmínky pro použití u-testu: 1.50 > 30 60 > 30 2.soubory jsou nezávislé 3.předpokládáme stejné rozptyly TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ 1.Stanovíme nulovou a alternativní hypotézu 2.Zvolíme hladinu významnosti 3.Vybereme vhodný test 4.Ověříme, zda jsou splněny podmínky pro použití testu 5.Vypočítáme testovací charakteristiku • TESTOVACÍ CHARAKTERISTIKA •Testy významnosti rozhodují mezi H0 a HA, a to nejčastěji pomocí výpočtu tzv. testovací charakteristiky • •Vymezuje obor hodnot pro zamítnutí a obor hodnot pro nezamítnutí H0. • •Pro stanovení takových oborů hodnot je nezbytné, aby měla některé ze známých teoretických rozdělení – umožní to stanovení tzv. kritických hodnot. • •Kritické hodnoty vymezují interval spolehlivosti, jenž je mírou vzdálenosti od 0. Leží-li hodnota testovací charakteristiky mimo tento interval, zamítáme H0. • • VZDÁLENOST OD NULY •Pokud je rozdíl srovnávaných průměrů rozumně blízko nule, pak můžeme říct, že rozdíl vznikl náhodou a rozhodujeme se pro nulovou hypotézu. • •Je-li rozdíl hodně vzdálen od nuly, dáváme přednost alternativní hypotéze. VZDÁLENOST OD NULY •Řeší se pomocí intervalu spolehlivosti pro rozdíl průměrů. • •Pokud H0 platí (μ1 = μ2 = μ), pak s pravděpodobností 0,95 by se měl rozdíl m1 – m2 nacházet v 95% intervalu spolehlivosti. 0 + 1,96 SEm1-m2 - 1,96 SEm1-m2 - 2,58 SEm1-m2 + 2,58 SEm1-m2 95% 99% VZDÁLENOST OD NULY •Chyba rozdílu průměrů •Rozdíly průměrů mají normální rozdělení s parametry μ a σ; σ odhadujeme pomocí SE • SEm1-m2 = chyba rozdílu průměrů (m1 – m2), přičemž pro nezávislé výběry platí: SE2m1-m2= SE2m1+ SE2m2 • 0 + 1,96 SEm1-m2 - 1,96 SEm1-m2 - 2,58 SEm1-m2 + 2,58 SEm1-m2 95% 99% JAK ROZHODUJEME? •Testovací charakteristika „u“ •Pokud leží rozdíl mimo interval spolehlivosti, pak zamítáme nulovou hypotézu. • • • • •Pokud leží rozdíl v intervalu spolehlivosti, pak nulovou hypotézu nezamítáme. • • •Nezamítnutí nulové hypotézy neznamená její přijetí! u Příklad: SROVNÁVÁNÍ PRŮMĚRŮ •Je potřeba použít pro hodnocení hladiny cholesterolu různých norem s přihlédnutím k věku? • •Muži 20-30 let: n1 = 50 m1 = 4,57 s1 = 0,70 SE1 = 0,10 •Muži 40-50 let: n2= 60 m2 = 5,42 s2 = 0,85 SE2 = 0,11 • •Výpočet testovací charakteristiky u: •m1 – m2 = 4,57 – 5,42 = -0,88 •SEm1-m22= 0,102+ 0,112 = 0,0221 •SEm1-m2= 0,15 •u = 0,88: 0,15= 5,66 • • TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ 1.Stanovíme nulovou a alternativní hypotézu 2.Zvolíme hladinu významnosti 3.Vybereme vhodný test 4.Ověříme, zda jsou splněny podmínky pro použití testu 5.Vypočítáme testovací charakteristiku 6.Srovnáme ji s odpovídajícími kritickými hodnotami • Příklad: SROVNÁVÁNÍ PRŮMĚRŮ •Je potřeba použít pro hodnocení hladiny cholesterolu různých norem s přihlédnutím k věku? • •Muži 20-30 let: n1 = 50 m1 = 4,57 s1 = 0,70 SE1 = 0,10 •Muži 40-50 let: n2= 60 m2 = 5,42 s2 = 0,85 SE2 = 0,11 • •Srovnání testovací charakteristiky s kritickou hodnotou: •5,66 >1,96, (5,66 > 2,58) •testovací charakteristika je větší než kritická hodnota pro α = • 0,05, tzn. leží mimo 95% CI • • TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ 1.Stanovíme nulovou a alternativní hypotézu 2.Zvolíme hladinu významnosti 3.Vybereme vhodný test 4.Ověříme, zda jsou splněny podmínky pro použití testu 5.Vypočítáme testovací charakteristiku 6.Srovnáme ji s odpovídajícími kritickými hodnotami 7.Zamítneme nebo nezamítneme nulovou hypotézu • JAK ROZHODUJEME? •Nezamítnutí H0– rozdíly nepřesahují velikost rozdílů způsobených náhodou, ale mohla nastat tzv. chyba druhého typu. • •Zamítnutí H0– pravděpodobnost, že rozdíl mezi průměry je způsoben náhodou je tak malá, že tuto možnost zamítáme – a přijímáme alternativní hypotézu (riziko chyby prvního typu) • JAK ROZHODUJEME? Skutečnost Naše rozhodnutí H0 neplatí H0 platí Zamítáme H0 Správné rozhodnutí Chyba I. typu Nezamítáme H0 Chyba II. typu Správné rozhodnutí JAK ROZHODUJEME? •Statistický program •spolu s testovací charakteristikou uvádí i P-value •hodnota P-value udává pravděpodobnost, že hodnocený rozdíl je způsoben náhodou •pokud je P-value menší než zvolená hladina významnosti, nulovou hypotézu zamítáme, pokud je větší nulovou hypotézu nezamítáme •Např.: α = 5% (pravděpodobnost platnosti H0) –P-value = 0,00073, zamítáme H0 –P-value = 0,07300, nezamítáme H0 • • Příklad: SROVNÁVÁNÍ PRŮMĚRŮ •Je potřeba použít pro hodnocení hladiny cholesterolu různých norem s přihlédnutím k věku? • •Muži 20-30 let: n1 = 50 m1 = 4,57 s1 = 0,70 SE1 = 0,10 •Muži 40-50 let: n2= 60 m2 = 5,42 s2 = 0,85 SE2 = 0,11 • • •Zamítnutí nebo nezamítnutí nulové hypotézy: •Zamítáme nulovou hypotézu a přijímáme hypotézu alternativní. • • • TESTOVÁNÍ STATISTICKÝCH HYPOTÉZ 1.Stanovíme nulovou a alternativní hypotézu 2.Zvolíme hladinu významnosti 3.Vybereme vhodný test 4.Ověříme, zda jsou splněny podmínky pro použití testu 5.Vypočítáme testovací charakteristiku 6.Srovnáme ji s odpovídajícími kritickými hodnotami 7.Zamítneme nebo nezamítneme nulovou hypotézu 8.Výsledky interpretujeme • Příklad: SROVNÁVÁNÍ PRŮMĚRŮ •Je potřeba použít pro hodnocení hladiny cholesterolu různých norem s přihlédnutím k věku? • •Muži 20-30 let: n1 = 50 m1 = 4,57 s1 = 0,70 SE1 = 0,10 •Muži 40-50 let: n2= 60 m2 = 5,42 s2 = 0,85 SE2 = 0,11 • ( jedná se o 2 NV ze 2 ZS) • •Interpretace výsledků: •Na 5% (resp. 1%HV) hladině významnosti jsme prokázali, že při hodnocení hladiny cholesterolu je vhodné používat různé normy pro různé věkové kategorie. Je hodně malá pst, že se mýlíme , když přisuzujeme významný vliv věku. Rozdíl mezi výběrovými průměry je vysoce statisticky významný. • • SHRNUTÍ PŘÍKLADU 1.H0: μ1 = μ2 = μ; μ1 - μ2 = 0 • HA: μ1 ≠ μ2; μ1 - μ2 ≠ 0 2.α = 0,05 3.u-test 4.n1 > 30; n2 > 30; nezávislé soubory; stejné rozptyly 5.u = 5,66 6.5,66 > 1,96 7.Zamítáme nulovou hypotézu a přijímáme hypotézu • alternativní. 8.Rozdíl mezi průměrnými hodnotami cholesterolu je • statisticky významný, tj. není způsoben náhodou a pro různé • věkové kategorie má smysl použít odlišné normy • • • • • • • • • • Příklad: SROVNÁNÍ PRAVDĚPODOBNOSTÍ (π1,π2) dvou náhodných jevů •Podmínka pro použití u-testu: •a)n1•p1• (1 - p1)> 9 b)srovnávané výběry jsou • n2•p2• (1 - p2)> 9 vzájemně nezávislé •Standardní chyba rozdílu pravděpodobností •SE2= SE12+ SE22 = •Testovací charakteristika u • • Příklad: SROVNÁNÍ PRAVDĚPODOBNOSTÍ •Byl sledován výskyt alergií u studentů LF. •Muži: m1 = 105 k1 = 21 p1 = 0,20 (20%) •Ženy: m2 = 195 k2 = 19 p2 = 0,097 (9,7%) • •Otázka: Je rozdíl ve výskytu alergie u mužů a u žen způsoben náhodou, anebo lze odvodit, že alergie postihují muže častěji? Řešení 1.H0: π1 = π2 = π; π1 - π2 = 0 HA: π1 ≠ π2; π1 - π2 ≠ 0 2.α = 0,05 3.u-test 4.velikost souboru: n1 > 30; n2 > 30 platnost nerovnosti: 16,8 > 9; 17,1 > 9 nezávislé soubory 5.u = 2,32 6. 2,32 > 1,96 7.Na 5% hladině významnosti nulovou hypotézu zamítáme a přijímáme hypotézu alternativní. Riziko, že se mýlíme je menší než 5%. 8.Alergie jsou častější u mužů než u žen. 9. • • • •