Cíl článku je jednoduchý a víc než zřejmý. Chceme, aby všichni pochopili význam p-hodnoty. P-hodnota je pojem, který spadá do oblasti testování hypotéz. Jistě jste se s touto hodnotou ve výstupech z testů již mnohokrát setkali (malou ukázku některých výstupů ve STATISTICE vidíte vpravo). Ve světě počítačů je výstup zahrnující p-hodnotu již standardem a často bývá vyžadován i jako výstup v odborných publikacích. Zhodnocení velikosti p-hodnoty je jednou z možností, které říkají, zda je výsledek testu významný nebo nikoliv. Každý statistický test je založen na nějaké testové statistice, tedy číslu spočtenému z dat, podle kterého se rozhodujeme, jestli test vyšel významně nebo nikoli (o principu testování hypotéz si přečtěte zde, příklady testování naleznete zde nebo zde). U testu máme zvolenu hladinu alfa (chybu prvního druhu), kterou chceme dodržet, podle této hodnoty se typicky vytvoří interval spolehlivosti (pokud je alfa 0,05, pak se jedná o 95 procentní interval, o intervalech si můžete přečíst zde a zde). A my typicky porovnáme, jestli spočtená hodnota statistiky leží nebo neleží v tomto intervalu. A teď, co s tím má společného ta p-hodnota. Uveďme si nejdříve definici: P-hodnota je nejmenší hladina, na které zamítáme. Lidsky řečeno se dá definice p-hodnoty převyprávět následovně: Pravděpodobnost výsledků, které ještě více svědčí proti H0. Dosažená hladina testu. P-hodnota je největší hladina, na které nezamítáme. StatSoft Nebojte se p-hodnot! Když si to ukážeme na příkladu s intervalem spolehlivosti. Pravděpodobnost, že hodnota padne do intervalu je 1-alfa. Čím menší alfa máme, tím větší je interval (alfa se zmenšuje, pravděpodobnost se zvyšuje, tedy i interval musí být širší, abychom měli větší jistotu, že tam hodnota padne) – viz obrázek vpravo. Phodnota je pak hodnota alfa, pro které je interval přesně tak dlouhý, aby jeho okraj byl na naměřené hodnotě testové statistiky. Pokud se podíváme na intervaly pro různé hladiny na obrázku dole, vidíme, že pokud nám tedy vyjde testová statistika rovna například -1,5, pak p-hodnota je 0,1336. Intervaly s hladinou větší než 0,1336 hodnotu -1,5 neobsahují, zatímco hladiny menší ano. Pokud budeme mít hladinu testu alfa rovno 0,05, pak nezamítáme, pokud bychom si ji ale z nějakého zvláštního důvodu potřebovali nastavit na 0,15, pak bychom již zamítli nulovou hypotézu. Pro nejklasičtější testování tedy stačí p-hodnotu porovnat s hodnotou 0,05 (nejběžnější hladina testu) a pokud je p-hodnota menší, pak je jasné (viz obrázek), že interval testovou statistiku nepokrývá (jelikož interval pro 0,05 je uzší než pro p-hodnotu) a tedy zamítáme nulovou hypotézu. Pokud by phodnota byla větší než 0,05, pak nulovou hypotézu nezamítáme. Tuto poučku jste jistě již slyšeli: … zamítáme ve prospěch … nezamítáme Poznámka: S příchodem počítačů se výpočet p-hodnot značně zjednodušil. Bude zde popsán postup, jak vypočíst p-hodnotu z příkladu (obrázek intervalů): Pro úlohu jsme použili jednoduše normální rozdělení se střední hodnotou 0 a rozptylem 1 (jinak řečeno testová statistika by měla předpokládané rozdělení normální s parametry 0 a 1). Intervaly pokrývají hodnotu z daného rozdělení s pravděpodobností 1-alfa. Pokud bychom chtěli spočítat p-hodnotu pro nějakou hodnotu, pak můžeme použít například pravděpodobnostní kalkulátor. Nastavení pro danou úlohu vidíte vpravo. Čím blíže středu intervalu je statistika, tím větší je p-hodnota, krajním případem je p=1, kdy je testová statistika přesně ve středu intervalu pro teoretické rozdělení. Čím dále je statistika od středu intervalu, tím menší je p-hodnota. Výhoda p-hodnoty Tedy pokud nám stačí se pouze rozhodnout, zda vyšel test statisticky významně, pak p-hodnota nám říká vše potřebné a to navíc nezávisle na tom, jakou si zvolíme hladinu alfa, dává nám ihned informaci zároveň pro všechny hladiny. Pokud je p-hodnota menší než zvolená hladina testu (α), tak zamítáme, pokud ne, tak nezamítáme. Poznamenejme, že zásadní je vědět, co daný test má potvrdit či vyvrátit, jinak řečeno, jak zní nulová hypotéza. Pokud například děláme testy normality, pak nulová hypotéza zní, že rozdělení je normální, pokud tedy zamítáme hypotézu, pak data normální nejsou. Podle p-hodnoty klasicky, jako u každého jiného testu, se rozhodneme o zamítnutí podle pravidla výše. P-hodnota v softwaru STATISTICA Prakticky pro jakýkoli test, ať už je to testování středních hodnot, normality nebo přítomnosti odlehlých pozorování, všechny testy ve výstupu budou obsahovat informaci o p-hodnotě. Buď přímo ve výsledkové tabulce nebo v záhlaví tabulky, kde se vypisují hlavní výsledky analýzy. Závěrem P-hodnota je jedním z nejdůležitějších pojmu teorie odhadu, je potřeba vědět, co znamená a jak se podle její velikosti zařídit při vyhodnocování testů. Pochopit p-hodnotu kompletně a ne jen slepě využívat poučky, to byl cíl našeho miničlánečku. Snad se to povedlo a už se p-hodnoty nebudete nikdy bát.