5 Úvod do statistického usuzování pH explorační a popisné analýze dm docházíme k závěrům, které .se tykají pouze nashroma7.denýeli údajíi. Naproti tomu cílem statistického usuzování (statistická inference) je odvodit n;i základě dat týkajících se výběru a jistých predpokladu o jejich rozdílení závory o celé populaci nebo procesu. Naše schopnost takto zobecňovat závisí na plánu sběru dat a na chování numerických charakteristik, vypočítaných z daL Ačkoliv existuje mnoho různých postupů, jak provádět statistické usuzováni v konkrétní situaci, všechny patři ke dvěma základním typům. Jedná se buď o metody pro odhadování, nebo postupy založené na statistických testech. PŘÍKLAD 5.1 Bodový odhad, intervalový odhad, test hypotézy Odhadujeme průměrnou výšku chlapců v určilo věkové kategorii. Ve studii se pro náhodně vybranou skupinu chlapců z|islil průmór I79cm. To (e „bodový odhad" průmětu v celé populaci. Virne ale, že kdybychom sestavili pro výzkum odlišnou skupinu (jiný výběr), doslali bychorn ne)sp(š trochu jiný bodový odhad. Proto je lepši misto |edlného čisla („bodu") uvést Interval, v němž se populační hodnota nachází s velkou spolehlivosti. To |e ..intervalový odhad", Navíc chceme znát. zda se Itšf v průměrné výšce dvě specilikovanó subpopulace chlapců. To je problém testováni hypotézy. Všechny tylo tri druhy otázek mají smysl. V léto kapitole demonstrujeme principy statistického usuzováni na jednoduchých »Skladech, Uvedeme základní metodu nalezení intervalu spolehlivosti pro průměr normálního rozdělení. Ukážeme laké na průměru normálního rozdelení statistickou inlerenci pomocí testu hypotézy, Postupy slatislického testování hypotéz jsou užitečné tehdy, jestliže potřebujeme provést rozhodnutí o hodnotě parametru nebo obecně o tvaru rozdělení náhodné proměnné. Pomocí těchto postupu se například dokážeme s velkou .spolehlivostí rozhodnout, zda určitý parametr je větsí. nebo menší než specifikovaná hodnota nebo zda se parametry v různých Populacích lisí. 165 PŔEHLEO SIÄÍISTICKVCH METOD PRÍKLAD 5.2 Statistické usuzovaní Výzkumnici v oblasti psychiatrie porovnávají skupinu duševné nemocných jedinců se skupinou zdravých Jedinců na základě sledovaných 77 různých proměnných, popisujících deiswi a rodinná zázemí všech jedinců. Zjistila se .statistická rozdílnost" mezi skupinami u dvou z těchto proměnných. Postupovali jsme při statistickém usuzováni správně' Jak můžeme Interpretoval luto ..statistickou významnost"? Protože melody statistického usuzování vycházejí z výberových rozdílení, vyžadují určitý pravděpodobnostní model dul. V následujících příkladech předpokládáme. Že jsme provedli prostý náhodný výběr a data mají normální rozdělení, Opíráme se o poznatky z předcházející kapitoly, kieré se týkaly rozdělení výběrových statistik. 5.1 Základní koncepty statistického usuzování Statistická inference (statistické usuzováni*) znamená provedení zobecnění z náhodného výboru na populaci. Tolo /obecnění se provádí s určitým stupněm jistoty, resp. spolehlivosti. Jak jsme už naznačili, rozlišujeme dvě hlavní formy statistického usuzování: odhadování a testování hypotéz. V obou typech statistického usuzování, jehož princip je schematicky zachycen na obrázku 5.1, počítáme zdal výběru určité statistiky, jež slouží jako základ tohoto usuzování. Odhadování vede k určení parametru neznámého rozdělení. Teslování hypotéz poskytuje jisté zdůvodnění pro úvahy, zda danou hypotézu o parametru nebo pravděpodobnostním rozdělení je možné zamítnout, nebo ne. Účelem statistiky je získat porozumění výzkumným problémům pomocí dat. Pritom lze použil různé přístupy. Zmínili jsem se o explorační analýze dať (kap. 3.8I- Jestliže klademe důraz na získání vhodných dat pomocí statistického šetření nebo experimentu, začínáme směroval k statistické inferenci. Oba typy přístupů jsou důležité pro efektivní práci s daty. V tabulce 5.1 jsou schematicky ukázány rozdíly mezi oběma přístupy. Oba přístupy se navzájem podporuji. Statistické usuzováni vyžaduje kvalitní dala. Pomoci explorační analýzy odhalujeme odlehlé hodnoty nebo datové konfigurace, které by mohly ovlivnit přesvědčivost statistické inference. Explorační analýza, především jej í grafické metody, jsou pivním krokem k validníinferencl. Hlavním předpokladem validity inference je získání dat pomocí dobře navrže- 166 b ÚVOD DO STATISTICKÉHO USUZOVANÍ Zdal výboru počítáme statistiky, které podávají Informaci o parametrech populace Porovnání explorační analýzy a statistické inlerence Explot aěni analýzo Statistická Inlefpncc Uíel jo neomozony průzkum dat. hledaní zajímavých konfiguraci. Cilem jo oupovôdet na spoolickou olazku, kterou jsmo položili pfcd tůn, než začal suů' dal. Závěry platí pouze pro jedince a mořeni, |eí jame môli k dispozici. Zaviry jsou neformální, vyenázíme z toho. a Ismo natozB v datoch Závory ptati pro véiäí skupinu jedinců (populaci) naüo &irsí tílflu okolnosli Zúvôry jsou lormátni, s upresnením (ßjich spoiohtivosli. ného schématu výzkumu a sběru dal. Jestliže používáme metody statistického usu/ování, postupujeme tak, jako by data představovala náhodný výběr nebo pocházela ze znáhodnéného experimentu. Pokud tomu tak není. naše závěry lze snadno zpochybnit. Tomu nemůže zabránit ani složitá matematika, jež se používá při formálním odvození metod statistického usuzování. Jakkoli složitý matematický aparát nedokáže vylepšit základní pochybení při sběru dat. Proto je tak dOlcŽiié porozumět základům metodologie výzkumné práce, plánování projeklíi. správné realizaci sběru dat a data zpracovat metodami statistické inlerence pouze lehdy, pokud jsme přesvědčeni, že si lakovou analýzu zaslouží. 167 PftEHLEO STATISTICKÝCH METOD Shrneme v bodech principy, kieré stoji v základu statistického usuzování: 1. Statistické usuzování znamená zobecňování z výběrových statistik na parametry rozdělení. 2. Abychom mohli provést statistické usuzování, musíme mít nijakou teorii, jS popisuje náhodné chování sledovaných proměnných. 3. Existují dva typy výběrových chyb; náhodné výběrové chyby a systematické chyby. Získáním náhodného výběru zmenšujeme systematickou chybu a /ískame podklad pro odhad náhodné chyby výběru. 4. Výběrová rozdělení statistik jsou teoretická pravděpodobnostní rozdělení která popisují vztah mezi výhěrovou statistikou a populací. 5. Směrodatná odchylka výběrového rozdělení statistiky í odhadu parametru) se nazývá směrodatná chyba. Odhaduje náhodnou výhěrovou chybu vypočítané statistiky (odhadu parametru). 6. Jak roste velikost výběru, výběrová chyba u směrodatná chyba se zmenšují. 7. Směrodatná chyba se používá k získání intervalového odhadu parametrů i k testování hypotéz o parametrech rozdělení. 5,2 Spolehlivé odhadování Parametr je Číselná hodnota, jež platí pro celou populaci, kdežto odhad parametru získáváme pomoci výběru z populace. Parametra jeho odhad jsou ve vztahu, ale nemůžeme je zaměnit. Výběrové charakteristiky jsou náhodné proměnné. Parametry se považují za konstantu (ačkoli v t/v. baycsovské teorii statistiky tomu je jinak). Parametry Často neznáme, kdežto výběrovou charakteristiku můžeme pomocí získaných měření spočítat. Parametry a jejich bodové odhady (ij. výběrové statistiky) odliüujcmc jiným značením - pro označení teoretických parametrů používáme často řecká písmena, odhady (statistiky) značíme písmeny běžné latinské abecedy. Tabulka 5.2 uvádí značení nejznámějších teoretických parametrů a jej ich odhadu. Populační parametry se snažíme odhadnout co nejlépe. Proto metody odhadu tvoří důležitou část statistické inference a statistické teorie. Odhad provádíme buď jedinou hodnotou, nebo číselným intervalem, v němž se nachází teoretická hodnota parametru se spolehlivostí S. V prvním případe mluvíme o bodovém odhadu, ve druhém případě o intervalovém odhadu. 168 5 ÚVOD 00 STATISTICKÉHO USUZOVANÍ "^7.2 Značeni teoretických a výběrových charakteristik T^wtt Teorelicky Výstovnosl Odhad průmot smeroch™ odchytá modian modus Korelační kosltcienl prgvdepooobnosl inokfly) směmiců regresní pílmky (néhdy) průsečí* icfliesin pŕ.mky s osou y (r-ékdy) 0 li Ě s ß o ml sigma tni s vlnkou ml so stnSkou ró P> boa alfa i nebo M i nebo Me i nebo Mo i p nebo p b 1 5.2.1 Kvalita bodových odhadu Problematiku bodových odhadu ukážeme na odhadu parametru /j. U symetrického rozdělení lze odhadovat teoretický průměr několika způsoby. Například výběrovým průměrem, mediánem nebo průměrem extrémních hodnol (minima a maxima). V čem se tyto charakteristiky liší v souvislosti s kvalitou odhadu teoretického priiměm? Obecně může být kvalita daného bodového odhadu teoretického parametru posuzována s ohledem nu několik požadavků: ■ konzistence - s rostoucím počtem pozorování se odhad blíží k teoretické hodnotě s pravděpodobností I; ■ nestrunnosl - jestliže při opakovaných výborech kolísá odhad kolem teoretické hodnoty symetricky na nhě strany, odhad je nestranný; ■ vydatnost nebo cficicnce rozptyl odhadů při opakovaných výběrech je malý; ■ rezistence - odlehlé hodnoty (způsobené hrubou chybou měření nebo špatným zápisem) nemají vliv na hodnotu odhadu. U odhadů zjišťujeme, do jaké míry jsou uvedené vlastnosti splněné. V případě odhadu průměru /i je aritmetický průměr jeho nejvydatnějším odhadem, méně vydatným je výběrový medián a nejmenší hodnotu elicience (vydatnosti) má průměr z extrémních hodnot, Ten je také velmi citlivý k odlehlým hodnotám. Rezistentním odhadem parametru // je výběrový medián. Medián i průměr /.extrémních hodnot jsou nestranným odhadem p pouze tehdy, jest li že rozdělení náhodné proměnné má symetrický Ivar. 169 PŔEHLEO STATISTICKÝCH METOD 5.2.2 Interval spolehlivosti pro y Jak jsme uvedli, místo hodového odhadu Casio užíváme odhad intervalový - sestrojujeme interval .spolehlivosti. Princip postupu ukážeme na případu odhadu parametru fi. Podobní bydlom postupovali i v prípade odhadu jiných parametrů. Vycházíme ze znalosti výberového rozdělení aritmetického průměru .v. Předpokládáme, že měňme náhodnou proměnou s normálním rozdelením. V prvním kroku je důležité si uvědomit, že výběrový průměr je bodovým odhadem populačního průměru. Proto jeho hodnota Ivon střed, kolem něhož, je interval spolehlivosti situován. Na obě strany od výběrového průměru se ve vzdálenosti určené mezí chyby nacházejí hranice intervalu spolehlivosti. Nalevo od něho je dolní hranice a napravo od něho je horní hranice intervalu spolehlivosti (obr. 5.2). Obr. 52 Bodový (a) a intervalový (b) odhad a) ----------------------------------------------•-------------- b)----------------------4--------------------------fr-------- Když odečteme hodnotu dolní hranice od horní hranice intervalu spolehlivosti, dostaneme délku intervalu spolehlivosti, jež je celkovou mírou nepřesnosti vytvořeného odhadu. Krátké intervaly spolehlivosti jsou přesnější než dlouhé. Délka intervalu spolehlivostí závisí na hladině spolehlivosti, se kterou ho určujeme. Hladina spolehlivosti je pravděpodobnost, s jakou se odhadovaný populační parametr ocitne v tomto intervalu při opakovaném provádění výběru. Nejpoužívanější hladiny jsou 90 %, 95 % nebo 99 %, ale použít lze i jinou hladinu. Když např. pracujeme s 95% hladinou spolehlivosti, znamená lo. že ze 100 vytvořených intervalů jich přibližně 95 pokryje hledanou hodnotu parametru. Interval spolehlivosti tedy není nic absolutně spolehlivého. Naopak má náhodně proměnlivý charakter, stejně jako příslušný bodový odhad, Každý výběr vede k trochu jiném intervalu spolehlivosti. Interval spolehlivosti pro ß při známém o Vycházíme ze znalosti rozdělení aritmetického průměru. Ten má jako náhodná proměnná normální rozděleni s průměrem //. Jeho směrodatná odchylka má 170 5 ÜVO0&O STATISTICKÉHO USUZOVANÍ hodnotu směrodatné chyby průměru, z čehož plyne, hi s pravděpodobností 95 c't leží výběrový průměr v intervalu /j - 1,96ir.í < % < ;/ + 1,96^ . Použitím jednoduchých algebraických úprav z léto nerovnice plyne, že Pí-V - 1.9ĎO-Í < fj < X + 1 ,96o-í) = 0,95. Proto je 95% interval spolehlivosti pro parametr;/ (.V- 1.9o*rt;.ÍH l.9tVri). PŘÍKLAD 5.3 Interval spolehlivosti pro slrodni hodnotu při známem rozptylu Provádíme měření pomoci znalostního lesiu G na jisté škole. O hodnotách G je známo, žo pro populaci dětí v daném věkovém pásmu jsou normálně rozděleny se střední hodnotou 100 a směrodatnou odchylkou 15. Předpokládáme, že ptoménná C mana naši škole u déti v daném vekovom pásmu stejnou rozplýlenost jako v celé populaci. Provedli jsme 9 měřeni a získali jsme průměr 112.8. Vypočítáme 95% interval spolehlivosti pro střední hodnotu znalostního parametru G dětí na škole: (112.8-1.96* 15/\/§: 112.8 . 1.96 x 15/vS) "(112:8- 1.96 «5; 112.8. 1.96-5) = (103.0:122.6) Interpretace intervalu spolehlivosti Hladina spolehlivosti 95 f,í neznamená, že // leží uvnitř tohoto intervalu s touto pravděpodobností vzhledem k nějakému pravděpodobnostnímu rozděleni pnra-mctni //. Teoretický parametr nepředstavuje náhodnou proměnnou, a proto také nelze mluvit o pravdépodobnostech jeho hodnot. Zmínili jsme. že hladina spolehlivosti znamená pravděpodobnost pokrytí hodnoty /í intervalem spolehlivosti při opakovanému použití pokusu a celé procedury. Jedná se a dosti jemný rozdíl, který připomíná, že existuje jenom jeden průměr, ale mnoho intervalu spolehlivosti, jak opakovaně provádíme náhodné výběry. Průměr/i je neznámý, ale má pro danou populaci uréitou danou hodnotu. Interval spolehlivosti je sestrojen tak. aby pokryl parametr ;í s danou spolehlivostí. 171 PňEHLED STATISTICKÝCH METOD Jestliže chceme jinou hladinu spolehlivosti, musíme změnit koelicieni. jíxtfé násobíme směrodatnou chybu odhadu. Nechť o je pravděpodobnost- s níž vý_ zkumnťk toleruje, že interval spolehlivosti nepokryje fi. Pakli -ti)\009r interval spolehlivosti pro/i m;í tvar kde Z|_„/2 odpovídá (I - n/2) kvantilu standardizovaného normálního rozdelení. Například abychom spočítali 90% interval spolehlivosti, volíme ro danou hladinu x X směrodatná chybu odhadu Stejně jako směrodatná chyba průměru jsou směrodatné chyby jiných bodových! odhadu nepřímo úměrné odmocnině z rozsahu výhéru (w). Interval spolehlivosti pro // při neznámém o V případě, že neznáme směrodatnou odchylku tr náhodné proměnné, musíme k získání přesného intervalu spolehlivosti pro průměr ft použít k určení koeficientu spolehlivosti tabulky Studentova /-rozdělení, s nímž jsme se seznámili v kapitole 4.6.2. Opět předpokládáme, že náhodná proměnná je normálně rozdělená. Ve vzorcích nahrazujeme parametr tr, výběrovou směrodatnou chybou s%-Interval spolehlivosti má tvar (-v-Zi-^.S-t + 'i-,,/:*,). kde ve vzorci použijeme kvantu /-rozdělení se stupni volnosti n - 1 a hladinou i-a/a. 172 5 ÚVOD OO STATISTICKÉHO USUZOVÁNI PŘIKLAD 5.4 Interval spolehlivosti pro střední hodnotu pti neznámém rozptylu házíme ze zadaní v p'edchozim přikladu 5.3. Provedli jsme môfoni u 9 náhodné vyora-ůch Žáků a získali Jsme průměr 112.8 a směrodatnou odchylku 9. Vypočítáme 95% interval «neletí livosti pfo strední hodnotu psychologického parametru G dětí na škole. Při hledání v tabulce Mozděleni použijeme 8 stupňů volnosti a zjistíme. Že 97.5% percenlíl f-rozdôlen) má hodnotu 2,306. Výsledný Interval spolehlivosti je širší nož v předchozím přikladu, kdy kme předpokládali znalosl rozptylu: (112 8 - 2,306 » 5; 112.8 .- 2.306 * 5) = (102.3; 124.3) projovuje se tak nejistota pří odhadu směrodatné odchylky. 5.2.3 Potřebný počet pozorováni Uživatel statistiky nikdy neplánuje sběr dat. aniž by zároveň neuvažoval o použití Statistické inference. Vhodný počet pozorováni zajišťuje, že získáme odhady pomocí intervalu spolehlivosti s dostatečnou přesností a spolehlivostí. Za velikost chyby odhadování pomocí intervalu spolehlivosti, kterou označíme A. budeme považovat polovinu délky tohoto intervalu. Jedná se o vzdálenost vypočteného průměru od meze intervalu spolehlivosti. Ze zápisu výpočtu intervalu spolehlivosti pro průměr náhodné proměnné s normálním rozdělením a se známou směrodatnou odchylkou plyne, že velikost chyby A má hodnotu A = Zt-aßO-ti resp. A = Zi-o/iít/V«. Abychom získali intervalový odhad s požadovanou hod notou přesnosti A a spolehlivostí, dosadíme do vzorce příslušnou hodnotu z\-a/z pro zvolenou spolehlivost a vyřešíme rovnici vzhledem k rozsahu výhéru ti. Interval spolehlivosti pro průměr bude mít specifikovanou velikost A, jestliže zvolíme výběru velikosti n. kde n se vypočte podle rovnice -pít- PftÍKLAD 5.5 uvcni rozsahu výběru potřebného pro dosazení požadované spolehlivosti Vraťme se k situaci z příkladů 5.3 a 5.4. Chceme získat odhad průměru rozdělení testu G v8 zkoumané populaci s přesnosti 3 a víme. že smérodalná odchylka hodnol testu G v Populaci je 15. Jaký musíme zvolit rozsah výběru n. jestliže průměr chceme odhadnout se spolehlivosti 95%? V lomlo případě má koeficient z hodnotu 1.96 (97.5% kvantil normální mzdeleni). Dosadíme příslušná čísla do vzorce a dostaneme 173 PŘEHLED STATISTICKÝCH METOD Vypočtenou hodnotu zaokrouhlujeme na nejbližší vyšší celé číslo. 5.2.4 Výhody intervalů spolehlivosti Mnoho těžkostí spojených s usuzováním pomocí statistiky je možné zmírnit nebo se jim vylinout, jestliže hudeme více používal intervaly spolehlivosti. Jejich výhody jsou následující: ■ Šířka intervalu spolehlivosti charakterizuje přesnost odhadu parametru a indikuje potřebu dalších pozorování. ■ Interval spolehlivosti poskytuje informaci o velikosti diference nebo odchylky od normy. Tato informace se vytrácí, pokud používáme jenom testy významnosti. ■ Pokud provádíme rozhodnutío platnosti nulové hypotézy ve vztahu k určitému parametru, interval spolehlivosti obsahuje dostalek informací k provedení tohoto rozhodnuti. ■ Intervaly spolehlivosti se uplatňují v metaanalýze. Výsledky výzkumů lze popsat a porovnat pomoci intervalů spolehlivost mnohem lépe než pomoci p-liodnoi nebo hvězdiček a jiných symbolů, které pouze vypovídají o tom, zda byla kritická mez testu překročena, nebo ne. ■ Velmi často jsou intervaly spolehlivosti Ijako v přikladu 5.4) aproximativně symetrické kolem bodového odhadu a meze odpovídají různým perceniilům normálního rozdělení se směrodatnou chybou SE. V tomto případě se udává zkráceně pouze bodový odhad a směrodatná chyba odhadu SE pro přehled. jaké možné intervaly lze pomocí těchto hodnot sestrojit. Směrodatné chyby SE některých důležitých výběrových charakteristik uvádíme v tabulce 5.3. ■ Přesná interpretace významu intervalu spolehl i vosti je dána jeho vlastností při hypotetickém opakování celého pokusu. Rozdíl mezi spolehlivosti a pravdfi-podobnostnim tvr/cnún. že parametr je s pravděpodobností 1 - \/(l -p)p/n Paznéma.: Vztahy worn* «sledního plnil pr. narnuunfm "< í i< {»•ceniti rwMlenl N'fl: () 5.3 Testy významnosti Procedury pro statistické testování se často používají při analýze dal. Na druhé straně je však lato oblast statistiky mnohdy špatně pochopena. Testování hypotéz je forma statistického usuzováni, které hledá doporučení ve formě „ano" nebo „ne" na určitým způsobeni formulované otázky. Například se můžeme zeptat, zda průměrný krevní tlak v určité subpopulaci je. anebo není nižší než průměrný krevní tlak v celé populaci nebo zda určitá forma výuky zlepšuje úspěšnost žáků v pedagogickém testu. V těchto případech se požaduje odpověď ..ano" nebn „nv" a testuje se určité hypotetické tvrzení pomocí dat. jež máme k dispozici. Popíšeme podrobněji dvě situace z odlišných oblasti. PŘÍKLAD 5-6 Dvě situace uplatnení statistického testováni hypotéz V kapitole o leoni pravděpodobnosti (kap. . Oba způsoby popíšeme podobněji. Hodnota /»odpovídá na olázku: Jestliže nulová hypotéza platí, jaká je pravděpodobnost, že získáme právě vypočítanou hodnotu nebo ještě neobvyklejší hodnotu testovací statistiky?" Hodnota /> tedy kvantifikuje pravděpodobnost realizace hodnoty testovací statistiky, pokud nulová hypotéza platí. Jestliže je malá. je zde doklad, že nulová hypotéza neplatí. Takže pravidlo pro volbu doporučení je jednoduché: Jestliže /»-hodnota je menší než hladina n nebo se jí rovná, data Přinášejí evidenci pro zamítnutí Ho- Jestliže /»-hodnota je větší než a. Ho se Ponechává k dalšímu zkoumání. zopakujeme základní principy interpretace statistického testu pomocí dosa-W p-hladiny: '7- PftEHLED STATISTICKÝCH METOD 1. Chceme potvrdil, že existuje rlíjoký rozdíl (alternativní hypotéza, H)). 2. Postupujeme však tak. že /koumáme předpoklad, že žádný rozdíl neexistuje (nulová hypotéza, H0). a hodnotíme sílu dokladu proti tomuto předpokladu 3. Konkrétně to znamená, že spočítáme pomocí dal pravděpodobnost /i = p (stejná data nebo jealě neobvyklejší) /a předpokladu, že plalí nulová hypotéza. 4. Jestliže hodnota /> je malá. jedná se o evidenci proti nulové hypotéze. 5. Jestliže hodnota p je vetší, jedná se o evidenci připouštějící platnost nulovou hypotézu. V souvislosti s tímto způsobem uvažování je nutné podotknout, že nezamítnutí nulové hypotézy neznamená její důkaz.. Spise to znamená, že nemáme dustj evidence k jejímu zamítnutí. To je důležitý rozdíl. Při dané hypotéze Ho a datech D počítáme /j-hodnotu jako pravděpodobnost, že získáme data nejméně tak odporující (kuntradiktorní) hypotéze Ho. jako jsou nuŠe dala D, za předpokladu, že plalí hypotéza Ho- Druhý způsob posouzení testovací statistiky je velmi názorný. Provedení spočívá v přímém srovnání testovací statistiky s kritickou mezí M„. klerá se určuje v závislosti na zvolené hladině (hodnotě.) významnosti n. Kritická mez určuje kritickou oblast, resp. oblast zamítnutí. Jestliže se hodnota testovací slatisliky ocitne uvnitř kritické oblastí, znamená to. Že existuje evidence pro zamítnuli nulové hypotézy. Tento způsob interpretace nahrazuje výpočet dosažené /i-hoduoty významnosti odpovídající transformaci testovací statistiky do prav-dépodohnnslní škály. Jestliže testovací statistika je uvnitř kritické oblasti, pak dosažená /i-hodnota je menší než příslušná hladina významnosti. TČMOVHCÍ statistiku interpretujeme často jako míiu nekompatibility dal /> fc nulovou hypotézou, tesp.jako statistickou vzdálenost VW.U») «Jul f> od milnvr hypotézy Ho 1'oknd získaní kon-liguracc dal je ve shodí s nulovou hypotézou (nnpf. vypočteny" průměr se rovna* hypotetickém" průměru nebo dva vypočtené průměry si jsou tkom rnvny), statistická vííilíílenosi Vil), Hol ohodnocená lésWvncl statistikou je malá. Jcstliŕc naopak /.ísfcana dala jsou nepodobna opiovým konfiguracím očekávaným /» plamostj nulové hypotézy, vypočtena" statistická vzdáleno« !'(£». Hnije velikú. Kriticko vzdálenost Je určena krilickou mezí M,,. Jcstliíc V(t).Ho) je iilti ne/, kritická mlrtlenosi M„ (kritická mez), získaná daiová konfigurace indikuje neplainosl nulové liypoté2y. Kritická vzílálcnoxi M„ se vn li lak. že la platnosti nulové hypotézy je v/dSenofl V{D. Hi>> vřlSJ neí M„ s pravdepodobnosti pouze a. Proces konstrukce štatistického testu pro nějaký zadaný obecný problém má dvé ŕásti: aí Sestrojeni míry. jci charakterizuje, jak jsou dula v souhlasu s nulovou hypotézou, pficem se zohledňuje tvar Hj. 'hilu míru počítáme z dal. proto se jedná o .statistiku si fikáme j (rolovací statistika. Hodnota testovací slatisliky mčíí kompalibilitu dul D s modelem, ku je určen nulovou hypolézou Hn. Testovací statistiku l/c povazovat za miru nepodobnosti Y(t>, Ho) datové konfigurace D s konfigurací, jií určuje nulová hypotéza Hr>- 178 M S ÚVQD DO STATISTICKÉHO USUZOVANÍ Hledáni výberového rozděleni lesiovaci statistiky /a pluinosli II.|. Tolo rOZfJBIcnf nám tlottíí k určeni kritických mezi M„. icsp kritické nhl.i-.ti pro icsiuvuci sunisiiku a k výpočtu prav-dčpodobnoMi výskytu akluáluf hodnoty testovací StaŮtílky nebu hodnoty je.íič extrémnější m platnosti nulové hypotézy. Co se pova/uje /a CXtréninf hodnotu, závisí »a alternativní hypotéze Hi. nnporuéiiieme analyzoval ka>dou testovací statistiku a vyjasnil, jak je v ni realizován pi bftlp utícní nitry nepodobnosti dat l> a nulové hypotézy Hi>. Fxisiuje mnoho statistických testů. V další části lélo kapitoly se venujeme osvčt-(cní konstrukce jednoduchého testu o průměru pro situaci jednoho výběru. Demonstrujeme na něm koncept jednostranného a dvoustranného testování. 5.3.2 Testováni průměru jednostranným z-testem Tomuto způsobu testování říkáme také testování při jednostranné alternative. Co id znamená? Všimneme si situace, kdy nás zajímá test o pnimérné hodnote p za předpokladu, že známe tr a sledovaná náhodná proměnná má normální rozdělení. Tesiu se říká c-test. protože se opírá o standardizovanou hodnotu rozdílu mezi výberovým průměrem a hodnotou /(. Abychom ilustrovali testovací proceduru, vrátíme se k příkladu 5.3 i odstavce o určování intervalu spolehl i vosi i. Předpokládáme, že hodnotíme polohu rozdelení zvoleného znalostního ukazatele G na určité Škole. Z předchozích výzkumů je známo, že v celé populaci dčtí v určitém věkovém pásmu jsou hodnoty G ukazatele normálně rozděleny se střední hodnotou IIHi a směrodatnou odchylkou 15. I. Nulová a alternativní hypotéza: Obé hypotézy mohou mil jednu ze tří forem: pravostranná hypotéza, levostranná hypotéza a dvoustranná hypotéza. Například se můžeme plál. zda průměr ukazatele G na naší Škole (pro dané věkové pásmo) je vyšší ne ř teoretický průměr v celé populaci pro dyne věkové pásmo. Pak se jedná o test s pravostrannou alternativní hypotézou. Jestliže ľa představuje očekávanou hodnotu za platnosti nulové hypotézy, pak nulová a alternativní hypotéza pro tuio podmínku má tvar: Také však můžeme zkoumal, zda průměr je nižší než očekávaný. Pak se jedná o levrjstrannou alternativu. Nulová a alternativní hypotéza pak mají tvar: Ho: fi > //n proti H i: p 100 Dále budeme předpokládat tuto formulaci obou hypoléz. ĚJÍ; j Rozdelení testovací statistiky a plochy odpovídající statistické významnosti jednostranného klestu. 0,4 -0.3 -0,2 -O.i H 0,0 oblast zamlsnuli iwO.1 p-0,0052 -3 -2 z»1.28 2,56 J nodnota lestovaci slalistlky 0.4 -0.3 -0.2 -0.1 - !lll DOlast zamítnuli u=0.05 paO.0052. 1 2o1.64 2.56 4 hodnola testovací statistiky 180 5 ÚVOD DO STATISTICKÉHO USUZOVÁNI \|f» l"): ^u,u t'i:K'nnlu vou výzkumník, /volíme standardní hodnotu 0,05. Testová statistika: Testová statistika se pro tento případ spočte jako ;-hodnotu: ,_ * ~/*> _ i-A| (Ti crf \fi Předpokládáme, že výběr z naší školy měl rozsah 9. pro který jsme spočítali nriimer žg = 1|2.9. Také předpokládáme, že směrodatná odchylka pro naši školuje stejná jako v celé populaci. SE má tedy hodnotu 15/3 = 5 a testovací Statistiku z= (112.8- 100)/5 = 2.56. Závěn Testovací statistiku srovnáme s kritickou mezí. Při testování na hladine významnosti 0.1 (resp. 0.05) srovnáváme ^-statistiku s kritickou mezí 1.28 (resp. 1.64)- Obé dvě meze jsou znázorněny na obrázku 5.3 spolu s plochami, jejíchž velikost odpovídá hladině významnosti. Pokud c-statistiku převádíme na /j-hodnotu, hledáme plochu pod normální křivkou pro .v-hodnoty nad číslem 2.58. Nalezneme hodnotu p = 0.0052. Jelikož p < 0.01. nulovou hypotézu lze zamítnout na hladině 0.01. Uzavíráme, že existuje dostatečná evidence pro tvrzení, že děti z. naši školy mají vySSí průměr ukazatele G, než je jeho průměrná hodnota v populaci. Poznamenejme. Že náš závěr se týká průměru ukazatele G a ne jeho konkrétní hodnoty u zvolenéhu dílí-te. Pro základní orientaci uvádíme tabulku s hodnotami P(Z > z) pro standardizované normálni rozdělení (tab. 5.4). 5.3.3 Testování průměru dvoustranným z-testem pfedchozf ilustrativní příklad se tykal jednostranné alternativy, která vyjadřovala. že nás zajímá jenom jeden směr odchylky od nulové hypotézy. Pokud nám záleží na odchylce od nulové hypotézy v obou směrech, nahoru i dolü od/Jn. použijeme dvoustranný test. Obecně lze říci. Že dvoustranné testy se používají častěji než jednostranné testy. Obvykle je totiž naším cílem ohodnotit odchylky od nulové hypotézy bez ohledu na to. jaké hýly naše alternativní hypotézy před pokusem. Proto jsou dvoustranné testy standardem. Vede to někdy k opomíjení správné formulace icdnnstranného testu v případech, kdy by to bylo užilečné. Použijeme data z pfe-Mslčho příkladu a ukážeme, jak se na nich aplikuje dvoustranný lest. Nulová a alternativní hypotéza: Ověřujeme, zda 9 dělí z našeho příkladu mä Priíměr znalostního ukazatele G statisticky odlišný od průměru v populaci (zda průměr je statisticky menší nebo větší než populační hodnota 100). To je 161 04 PfiEHLED STATISTICKÝCH METOD I Horní porcenlilové hodnoty pro standardizované normální rozděleni q Í%] * r) = q *i. pätami nafléleni Z \d NlQ 11 ekvivalentní tvrzení, že prfiraSr ukazatele G na naší Škole se liší od hodnoty v populaci. Naše testová situace má tedy tvar: H,,:/í= 100 proti H|:/i í 100 2. Úroveň alfa (u): Opět použijeme tr = 0.05. 3. Testová statistika: Testovou statistiku vypočítáme podle .stejného ledy z = (112.8 - 100í/5 = 2.56. 4. Zavír: Testovací statistiku srovnáme s kritickou me/.í. Při testování na lili významnosti 0,05 srovnáme c-statistiku na rozdíl od předchozího přípac s kritickou mezi 1.96. Tato mez spolu s plochami pod hustotou normálního rozdělení, jejichž" součet odpovídá hladině významnosti pro dvoustranný test, je znázorněna na obrázku 5.4. Testovací statistika je v absolutní hodnotě veisi než kritická mez, což znamená, že existuje evidence pro zamítnutí nulové hypotézy. 182 5 UVOD 00 STATISTICKÉHO USUZOVANÍ Rozděleni testovací statistiky a plachy odpovídající statistické významnosti dvoustranného z-lestu hoOnoia lOSlowaci slali'jlifcy Abychom vypočítali /^hodnotu dvoustranného testu, musíme uvažovat oba konce rozdělení statistiky. Proto vypočtenou plochu z předchozího příkladu pro jednostranný lest vynásobíme dvěma. PloSky pod hustotou na obou stranách rozdčlení mají totiž velikost 0,0052. Dohromady je jejich velikost 0.0052 +■ 0.0052 = 0,0104, To reprezentuje />-liodnoiu pro mis problém. 5.3.4 Chybné interpretace testů nulové hypotézy Výsledky statistických testů se často spatné interpretují. Proto je užitečné na některé chyby předem upozornit, abychom se jim snáze vyhnuli. ■ Jestliže test neindikuje zamítnutí nulové hypotézy, je nesprávné nulovou hypotézu přijmout jako definitivně pravdivou. Správné můžeme pouze prohlásil, že není dostatek dokladů (evidence) pro zamítnutí nulové hypotézy. ■ Hodnota p se nesprávně interpretuje jako pravděpodobnost, že nulová hypotéza platí. Ve skutečnosti je p pravděpodobnost výskytu spočtené hodnoty testovací statistiky za modelových předpokladů, že platí nulová hypotéza. ■ Není pravda, že by hladina významnosti a = 0,05 měla jasné opodstatnění a byla jednou provždy daná. Tato bodnula je zvolena na základě konvence. 183 pAehled statistických metod ■ Neplatí, že by menší /í-hodnnty znamenaly silnější vědeckou evidenci ncí vět.ší /»-hodnoty. Ve skutečností p-hodnoty nevypovídají nic ,í + z' ■ Z* • z' • trs nebo Í-#q <-ť'(TxM íwWt . . *~P z nebo -----— < -z o UZPo\>r. tr, Používání intervalu spolehlivosti při testování má dvě přednosti. Intervalový odhad je vyjádřen v měřítku posuzovaného parametru. Také získáváme představu o přesnosti jeho odhadu a o tom. zda zvolený rozsah výběru u byl dostatečně veliký 184 5 UWD DO STAriSTtCKEHO USUZOVÁNI Jestliže odhadujeme intervalovým odhadem parametr ve dvou populacích. tak plutí: i Pokud se odhadovací intervaly nepřekrývají, zamítneme hypotéza rovností parametrů, a to alespoň na hladině, která odpovídá spolehlivosti použitých odhadovacích intervalů, 2 Pokud se odhadovací intervaly překrývají, nemůžeme provést žádné rozhodnutí bez dalších výpočtů. 5.3.6 Test jako rozhodování V teorii testování hypotéz vznikl koncept chyb 1, a II. druhu o něco později než její základy. Tento příspěvek k hodnoceni testovacích procedur navrhla dvojice Statistiků Neyinan a Pearson, kteří doplnili uvažování o statistickém testováni pojmy, jež se rozvinuly v matematické teorii rozhodování v kontextu matematické ekonomie. Průkopník statistických metod testování R. A. Fisher se opíral o koncept /»-hodnot. Podstata Fisherova přístupu spočíva v tom, že zamítnutí nulové hypotézy má vycházet z malých n-hodnot, jež poukazují na neslučitelnost dat s nulovou hypotézou. Mnoho výzkumníku dokumentuje své výsledky právě tímto způsobem. Přitom srovnávají /'-hodnoty s hraničními pravděpodobnostmi jako 0.05, 0.01 nebo dokonce 0.001. Při popisu testovací procedury v předchozím odstavci jsme zatím uvažovali jenom falešné zamítnutí Hn. Je však také důležité uvažovat falešné ponechání nulové hypotézy v platnosti. Ľx i sluj í tedy dvě možnosti chyby: I- ehyhii I. druhu - nulová hypotéza platí, ale zamítne se; 2. chybu II. druhu - nulová hypotéza neplatí, ale přijme se. Při testování hypotéz proto mohou nastat čtyři možnosti, které popisuje ta- bnlk;i 5.5. Jestliže přirovnáme chybu I. druhu k falešně pozitivnímu výsledku při medicínském testování, pak chyba II. druhu odpovídá falešně negativnímu sledku v medicíně, kdy pacient je nemocen, ale test to neodhalí. Pravdépo- Schema testováni hypotéz Zavér testu Ha platí Ho neptali Skutečnost H, pláli Ho neptali uL"'i'."y chýbal, dtuhu chyba II. dtuhu správný 185 33 PňEHlEO STATISTICKÝCH METOD dobnost chyby I. druhuje podmíněná pravděpodobnost, že zamítneme nulovou hypotézu za předpokladu, že platí, a označujeme ji tt. Pravděpodobnost ehvhv II. druhuje podmíněná pravděpodobnost, že nezamítneme nulovou hypotézu za předpokladu, Že neplatí, a označujeme ji ß: /'lchyb;t I. druhu [ H« plalíl = a /»(chyba II. druhu | H, nepláli) = ß Jakjsme již uvedli, hladinu u-obvykle volíme 0.05 nebo 0.0 i. Konvenční hodí pro ß jsou 0.2 nebo 0.1. Také můžeme někdy mluvit o opačných jevech k chybě I., resp, U. druhu, tzn.o podmíněné pravděpodobnosti, že neuděláme chybu I. druhu (spolehlivost testu)) nebo Že neuděláme ehyhu II. druhu. Síla testu odpovídá hodnotě (1 -ß). Jedná se ledy o podmíněnou pravděpodobnost, že správně odhalíme testem neplatnost nulové hypotézy. To znamená: /»(neuděláme chybu I. druhu | H(> platí) = 1 - a = „spolehlivost" /»(neuděláme chybu II. druhu |H| neplatí) = I -ß = „sila testu" Konvenční hladina pro spolehli vosi je 0.95 nebo 0.99 a konvenční hladina pro sílu je 0,8 nebo 0,9. Cílem při testování nulové hypotézy je omezit úrovně pravděpodobnosti chyb I. u f I druhu. Jinými slovy - usilujeme o maximalizaci spolehlivostí a síly testu. PŘIKLAD 5.7 Analogie mezi testováním hypotéz q soudním procesem Přiblížíme testováni hypotéz metaforou. Odvoláme se na podobnost stalistického usuzováni (interonco) se soudním procesem, kterou isme naznačili v kapitole 3.8- Má padnout rozhodnuli, že obžalovaný spáchal/nespáchal zločin. Soudni systém se řídi zásadou, že obžalovaný je nevinen, pokud se nepodaří prokázat opak. Prolo lormulace hypotéz má tuto podobu: H0: Obžalovaný je nevinný. H,: Obžalovaný |e vinen. Různé možnosti vztahu mezi pravdou a rozhodnutím soudu ukazuje tabulka 5.6. Uvědomujeme si, že chyba I. druhu má pro jedince nedozírné následky. Pioto její možnost eliminujeme na nejmenší možnou mim. Soud musí jasné prokázal vínu obžalovaného. Joho rozhodnuli také podléhají prozkoumáni vyšších instancí. Odpovídá to volbé velmi malé hladiny významnosti. V mnoha připadoch však nevime zcela přesné, klerá chyba je pro nás důležitější. 5 ÚVOD DO STATISTICKÉHO USUZOVANÍ Srovnání situace testováni hypotéz a rozhodování soudu Závéisoudu Obžalovaný ie nevinen Obžalovaný |e vinen * Obžalovaný |e nevlnon správný , chyba I Otuhn Skutečnost ^T_,^Z Obžalovaný |e vinen chyba II. dnjhu í.jir.-iV-iy 5.3.7 Vztah mezi silou testu, počtem pozorování a významnosti představme si, že testujeme klestem nulovou hypotézu uu proti /volené alternativní hodnotení- Při rozhodování pomocí statistického testu použijeme koncept dvou lypíi chyb - chyby 1. a II, druhu - který jsme zavedli v předchozích odstavcích. Vztah mezi nimi lze přiblížit obrázkem 5.5. Jsou na něm /obražena rozdělení testovacích statistik za předpokladu plauiosti nulové hypotézy (levá zvonovitá křivka) a za platnosti specifické alternativní hypotézy (pravá zvonovitá křivka). Kritická hodnota pro danou hladinu významnosti určuje odpovídající hladinu chyby II. druhu jako plošku nalevo od kriiické hodnoty pro rozdělení při alternativní hypotéze, napravo od ní je ploška odpovídající hladině chyby 1. druhu, již vymezuje opět kritická hodnota a okraj rozdělení testovací statistiky za platností nulové hypotézy. .Síla testuje plocha pod křivkou odpovídající alternativní hypotéze napravo od kritické hodnoty. Aktuální hodnota testovací statistiky muže být vyšší nebo nižší než kritická hodnota. Za platnosti nulově hypotézy, resp. její alternatívy bude hodnota testovací statistiky vyšší než kritická mez s pravděpodobností, která se rovná hladině významnosti, resp. síle testu. Sílu testu bychom rádi maximalizovali. Při daném rozsahu výběru tuho dosáhneme, když budeme pohyboval kritickou hodnotou směrem doleva k nižším hodnotám. Je však zřejmé, že tím zvyšujeme hladinu chyby I. druhu. To znamená, že při daném rozsahu výběru je síla testu přímo úměrná hladině významností. ' Hadina významností je nepřímo úmšrná hladině chyby II. druhu. Při různé volbě alternativní hypotézy roste nebo se zmenšuje rozdíl A mezi hodnotou n\ a hodnotou nulové hypotézy /a>. Z uvedeného lze odvodil, jak se budou měnil hladiny pravdepodobností chyb I. a II. druhu. PH rostoucím A se b"de snižoval hladina/? chyby II. druhu a poroste sila testu. Jak vypadá průběh 'élo změny v závislosti na velikosti A pro dvě různé hladiny významnosti o- a dva rozsahy výběrů, ukazuje obrázek 5.6. 187 PftEHLED STATISTICKÝCH METOD jSBCB Kritická hodnota a sila lestu pfi dané hodnoto nulové hypotézy y0 a ailernativnf hypotézy y- Z obrázku 5.6 je vidci, že s rostoucím rozsahem výboru při dané hladině významnosti a fixní hodnoto A roste síla testu. Je-li rozsah výběru malý. neodhalíme ani velkou diferenci me?.i nulovou hypotézou a aktuální hodnotou parametru. Naopak při dostatečně velkém rozsahu bude pravdépodobnost zamítnutí nulové hypotézy veliká i při malé hodnotě A. 1B8 5 ÚVOD DO STATISTICKÉHO USUZOVANÍ Křivky sily /-teslu pro různé podmínky pfi dvoustranném testu ■:,',! Uv.'u ir vĎtSl. n maló nvôlši.omalo o a n malé 0 2 odchylka od li, [a] 5.3.8 Hodnocení velikosti účinku Výsledek testování, ať ve Fishcrové. nebo Ncy m an- Pearson ově tradiei. dává dü-leŕiic informace, ale jsou /.de ještě jiné aspekty dat, které je rovnčž nutné popsal. Například může nýt cílem kvantifikovat velikost nebo sílu účinku, jehož se dosáhlo zkoumanou intervenci - a právě tato informace není ve výsledku statistického testu obsažena. Jako by se student dozvěděl, že prošel zkouškou, ale nevi, kolik hodů dosáhl. Hodnoty p o tom moc nevypovídají -jakkoli malý účinek intervence lze při dostatečném počtu měření prokázal, a naopak při malém počtu měření i velký efekt zůstane testem významnosti neodhalen. Přitom nám §0.0 prokázání nejenom statistické, ale i věcné, praktické, klinické významnosti. Casio proto vycházíme z odhadu koeficientu, který nazýváme velikost účinku (effect size). Tcnje definován pro jednotlivé charakteristiky riizně. Na tomto místě POpßeme pouze jeden případ. Odhad účinku (effect size, ES) ušetřeni nebo intervenci;, jenž závisí na vcli-psti průměru, může mít dvě formy: 189 PftEHLED STATISTICKÝCH METOD 1. Uvedeme dosaženou diferenci průměru (pro dvS skupiny, pni spárovaná moření, pro jednu skupinu): ES =x,- -v2, BS = iL ES =x\-fi 2. Čuslěji používáme Cnhenüv koelicicnt účinku (/: S sj S kde s, resp. $# označuje siněrodalnou odchylku měření, resp. směrodatnou odchylku rozdílu měření (pozor - NE směrodatnou chybu odhadu). Jestliže jsme napr. vypočítali průměry 8,1 a 3.1 a odhadli společnou směrodatnou odchylku náhodné proměnné v obou skupinách 2.3, bude mít Cohcnův koelicicnt hodnotu d a {8.1 - 3.D/2.3 = 2.2. Praktický význam Cohcnovy návrhu spočívá v tom, že rozdíly se standardizují pomocí směrodatné odchylky. Tim se dosáhne toho, že se mohou srovnávat odchylky V působení intervencí a ošetření, kleré byly mořeny úplně jinými prostředky (psychologickými testy, lahoralomími přístroji). Samozřejmě je tálo volnost relativní. Cohen určil pro svůj index d konvenční hodnoty, jež usnadňují rozhodnutí, kdy můžeme mluvit o velkém efektu. Pokud je d větší než 0,8. je efekt velký; pro d z intervalu 0,5-0.8 je efekt .střední; efekty pod mezí 0.2 považujeme za malé. Je nutné si uvědomil, že posouzení, jaký účinek považoval za veliký, závisí na kontextu. Jak hranice navržené Cohencm, tuk různé limity pro korelační koelicicnt nebo jiné míry účinku jsou podobní jako třeba hodnoty hladin významnosti sice do jisté míry zdůvodněné, ale určité nemají absolutní platnost. Ačkoliv o to statistici a výzkumníci usilují, neexistuje a ani nemůže existovat jeden koeficient, který- by dobře ohodnotil a přehledně vyjádřil účinky (effect size) ve všech situacích. Jestliže posuzujeme sílu asociace mezi dvěma náhodnými proměnnými, používá se většinou jako míra účinku korelační koeficient r a jiná míra se nehledá. V určitých případech lze přecházet mezi různými mírami účinku pomocí přepočítavacích vzorců. Podrobnosti k tomuto problému čtenář najde v přehledně práci Blahuše (2000). 5.3.9 Presné a asymptotické testy Skutečně dosaženou hladinu významnosti p pro testovací statistiku zjistíme přesně pouze v určitých případech. Takové testy nazýváme přesné lesly. Je l0 možné, jestliže se např. jedná o /-test průměru, testy v regresní analýze a analyze i ■■„ i 5 LlVOD DO STATISTICKÉHO USUZOVANÍ íoivlu nebo test korelačního koeficientu, pokud jsou splněny jejich předpo-feladv Přesné lcs'>'Jst,u v*íl'i SP'^C výjimkou. Proto je důležité mít ve výbavě ké asymptotické testy, u kterých zjištěná /»-hodnota je aspoň asymptoticky presná s rostoucí velikostí výběru. U asymptoticky platných testů využíváme toho. že se tvar rozdělení po-ijitvch testovacích statistik blíži k dobře známým rozdělením (normální nebo u3) v důsledku působení centrálního limittulio teorému. To značně usnadňuje vvoočet hledané /í-hodnoly. Také u kritických mezí se ptáme, zda k nim pří-síusející hladina významnosti platí přesně, nebo pouze asymptoticky. Zůstává však riziko, že zjištěná /»-hodnota není dostatečně validní, protože rozsah výběru není dostatečně veliký. Pro malé výběry proto raději použijeme postup pro zjištění přesné /»-hodnoty, jenž zohledňuje tuto skutečnost. Například při zkoumaní hypotéz o relativních četnostech vychází příslušný výpočet přesné /»-hodnoty /binomického rozděleni, jestliže výběr je malý. kdežto asymptotický přístup se opírá o normální rozděleni a zjistíme tak pouze přihližné platnou /»-hodnotu. V tomto a dalších případech se rozhodujeme podle problému, velikosti výběru .a dostupnosti vhodných programu, jakou použijeme testovací statistiku a zda spočítáme přesnou /»-hodnotu, nebo využijeme asymptotické vlastnosti chování testovací statistiky pro udhad získané /»-hodnoty nebo pro nalezení kritické meze s asymptoticky platnou hladinou významnosti. U testů, u kterých neznáme tak dobře rozdělení testovací statistiky jako u relativních četností, odhadujeme přesnou /»-hodnotu nižnými metodami. Příslušné výpočty jsou mnohdy značně náročné a bez počítače prakticky neproveditelné. V některých případech se můžeme opřít n tabelovaué kritické hodnoty pro sta-listieké testy na vybraných hladinách významnosti pro danou testovací statistiku a zvolené rozsahy výběrů. To se týká především neparametrických testů založených na pořadí nebo četnostech, 5.4 Neparametrické postupy statistického usuzování Klasické postupy statistického usuzováni obvykle předpokládají normální rozdělení náhodných proměnných. Tento předpoklad - přísně vzato - není skoro nikdy sPlněn. Proto statistici vyvinuli procedury nezávislé na rozdělení, resp. neparametrické metody, které tento předpoklad nepotřebuji. Jejich výhoda spočívá v totn, že o tvaru rozděleni dat nemusíme mít větší vědomosti. Neparametrické a-stupy jsou tedy vhodné pro hodnocení ordinálnfch dat nebo dat naměřených v Poměrovém nebo intervalovém měřítku, jež nemaj í normální rozděleni. 191