Výrok: „Všechny vrány jsou černé“ Je možné dokázat tento výrok? Nikoli - nelze pozorovat všechny vrány Řešení = Falzifikace výroku: pokud najdeme nečernou vránu, ukážeme že ne všechny vrány jsou černé Jediné pozorování může vést k závěru že výrok je nepravdivý: metoda modus tollens H0: všechny vrány jsou černé H1: ne všechny vrány jsou černé Snažíme se falzifikovat H0 Testování hypotéz: filozofický úvod Aplikace na příklad s IQ • • •Př. Výsledky IQ testu jsou aproximovány (blíží se) normálním rozložením o průměru μ = 100 a σ=16. Třída 36 dětí dosáhne průměru 105 bodů. Učitel si myslí že děti patří do populace μ > 100 • •H 0: μ <= 100 • H 1: μ > 100 • •Snažíme se falzifikovat H0, statisticky řečeno zamítnout H0 • •Kdy zamítáme? Když máme dostatečnou evidenci • •Zamítnutí H0 založíme na náhodě/riziku/šanci • • • Šanci, že najdeme výběrový průměr 105 nebo vyšší pokud je vzorek tahán z populace s μ = 100. • • Pokud je šance malá (α) zamítáme H0. • Testování hypotéz: logika 1.Člověk učiní předpoklad o hodnotě parametru, např. populačního průměru a tímto stanoví nulovou hypotézu H0 2.Za předpokladu že H0 je pravdivá, člověk zkonstruuje distribuci všech možných (potenciálních) hodnot statistiky vzorku, zde průměru vzorku, když vybírá jednoduchý náhodný vzorek o velikosti N z populace o průměru předpokládaném H0. Takto vzniká výběrová distribuce statistiky, zde výběrová distribuce průměru.Tvar této distribuce může být odvozen nezávisle na tvaru populační distribuce (centrální limitní věta) jako normální s průměrem rovným populačnímu průměru, přičemž tvar se blíži normálnímu s rostoucí velikostí vzorku 3.S výběrovou distribucí průměru člověk stanovuje podmíněnou pravděpodobnost (p-hodnotu), s jakou se daná nebo extrémnější hodnota výběrového průměru vyskytne za předpokladu že H0. je pravdivá 4.Pokud je p-hodnota nižší než α (alfa), tj. námi předem stanovená kritická hodnota (též riziko chyby 1.druhu), člověk říká: „Pokud je H0 pravdivá, tak podmíněná pravděpodobnost že najdu danou hodnotu výběrového průměru nebo extrémnější je nižší než α. Tato pravděpodobnost je tak nízká, že již nedůvěřuji H0 a zamítám ji. Pokud je p-hodnota větší než α, pak člověk říká: „Pokud je H0 pravdivá, tak podmíněná pravděpodobnost že najdu danou hodnotu výběrového průměru nebo extrémnější je vyšší než α. Proto nemám potřebnou jistotu (dostatečnou evidenci) a H0 nezamítám. 1. 1. Formulace H1 a regiony zamítnutí •Hypotézy mohou být formulovány jednosměrně nebo obousměrně •Př. Jednosměrně: H0=100, H1≠100 • (průměry H1 mohou být menší nebo větší než 100, proto obousměrně) •Př. Obousměrně: H0=100,H1>100 • (zajímají nás průměry H1 pouze větší než 100, proto jednosměrně) • •Jednosměrně – jednostranný test α=0.05 •Obousměrně – oboustranný test α=0.05 = (0.025 spodní interval + 0.025 horní interval) • • Tabulka z-hodnot pod 1-straným a 2-straným testem (viz tabulka z-skoru) • Test \ α 0.05 0.01 0.001 1-straný 1.645 F(z) = .95 2.33 F(z) = .99 3.09 F(z) = .999 2-straný 1.96 F(z) = .975 2.58 F(z) = .995 3.29 F(z) = .9995 1-straný test pvalue3 •Jednosměrně – jednostranný test α=0.05 2-straný test pvalue1 oboustranný test pro α=0.05 = α / 2 = (0.025 spodní interval + 0.025 horní interval) Chyby 1. a 2. druhu • •Ikdyž podmíněná pravděpodobnost vytáhnutí daného nebo extrémnějšího průměru vzorku bude menší než alfa a člověk důsledkem toho zamítne H0, stále existuje pravděpodobnost, ikdyž nízká (menší než α), že daný průměr pochází z populace s H0a člověk se tak rozhodnu špatně – učiní chybu 1. druhu. • • • •Stejně tak existuje situace kdy podmíněná pravděpodobnost vytáhnutí daného nebo extrémnějšího průměru vzorku bude větší než alfa a člověk důsledkem toho nezamítne H0, ikdyž existuje pravděpodobnost (v závislosti na alternativní hypotéze H1) že daný průměr pochází z populace H1a člověk také učiní špatné rozhodnutí – chybu 2. druhu β. Čtyři možné situace a síla testu skutečnost H0 H1 rozhodnutí „H0“ p(„H0“ | H0) 1 – α Chyba 2. typu (β) riziko chybného nezamítnutí nulové hypotézy p(„H0“ | H1) „H1“ Chyba 1.typu (α) riziko chybného zamítnutí nulové hypotézy p(„H1“ | H0) p(„H1“ | H1) Síla testu (1 – β)