Inference jako statistický proces 1 (Různé typy testů: T-test, F-test. Neparametrické testy.) Parametrický vs. Neparametrický test •Abychom zjistili významnost rozdílů, testujeme jejich rozptyl. Pokud je naše pozorování „normální“, pak používáme tzv. parametrické testy (viz dále), které pracují s průměry (známe rozdíl mezi průměry). Pokud nemůžeme předpokládat „normálnost“ rozložení, musíme (alespoň pro kontrolu) použít tzv. neparametrické testy, které pracují s pořadím – neznáme rozdíl mezi skupinami. •POUČENÍ – pokud si nemůžeme být jisti, použijeme pro kontrolu oba způsoby. POROVNÁNÍ PRŮMĚRŮ (středních hodnot) •Jednoduchá verze •Více-stupňová verze • •Existují ovšem rozdíly, které jsme nalezli ve výběrovém souboru i v souboru základním? Nebo také, porovnáváme-li výsledky dvou výběrových souborů, byly vybrány ze stejného základního souboru? T-TEST •Buď otázku zda jsou dva populační průměry stejné neboli zda mezi nimi není rozdílu = nulová hypotéza. • Např. průměrné mzdy mužů a žen v základním souboru. •Nebo otázku, zda jsou či nejsou porovnávané výběry z jednoho základního souboru. Formy T-TESTU •T-TEST pro jediný výběr neboli INDEPENDENT-SAMPLE T TEST (jak se liší statistika a parametr nebo jak se liší statistika od nějakého standardu) •T-TEST pro dva nezávislé výběry (jak se liší 2 parametry – populační průměry) Je modifikací předchozího, zahrnuje informaci o variabilitě dvou nezávislých průměrů (průměrů z nezávislých výběrů). Standardní chyba průměru rozdílů je odhadována z variancí a velikosti výběrů dvou nezávislých skupin. •T-TEST pro párovaná data •ANOVA Independent Sample T Test POSTUP •Otestujeme shodu variancí obou rozložení pomocí F-testu. –Nelze-li zamítnout nulovou hypotézu (signifikance u F větší jak 0,01), pak použijeme T-testu pro případ EQUAL VARIANCES ASSUMED. –Zamítáme-li nulovou hypotézu, pak použijeme T-testu pro případ EQUAL VARIANCES NOT ASSUMED. •Otestujeme shodu průměrů pomocí T-testu (použití jedné či druhé verze určí F-test - viz výše). Testujeme nulovou hypotézu neboli předpoklad shody. Signifikance T-testu nižší než 0,05 nám ji umožní odmítnout (je-li vyšší jak 0,05, odmítnout ji nemůžeme). POZNÁMKA (Mareš, Rabušic, 2002) •„Při relativně velkých vzorcích s nimiž pracují reprezentativní sociologické výzkumu (pohybují se kolem tisícovky respondentů vycházejí i poměrně malé rozdíly v průměrech jako statisticky významné (signifikantní) – proč asi? Z tohoto důvodu nemůžeme dělat ze statistické signifikance jakýsi fetiš. To, že můžeme zamítnout nulovou hypotézu ještě neznamená, že jsme objevili velký nebo důležitý rozdíl. Statistická významnost totiž ještě neznamená významnost věcnou, meritorní. „ Parametrické a neparametrické testy •T-test je tzv. parametrický test, to znamená, že předpokládá, že proměnná, s níž pracujeme, pochází z populace, v níž je normálně rozložena. •V případě, že máme vážné pochybnosti o tom, že rozložení naší proměnné nesplňuje podmínku normálního rozložení, musíme pro test významnosti dvou nezávislých průměrů použít tzv. distribution-free test, tedy test nezávislý na rozložení proměnné, neparametrický test. Alternativou pro parametrický t-test je tzv. Man-Whitney test. •Analyze - Nonparametric Tests - 2 Independent Samples ANOVA O CO JDE? •V independent t-testu srovnáváme pouze dva průměry, což je limitují a u proměnných s více hodnotami musíme udělat více kombinací. •ANOVA umožňuje srovnat více průměrů. • NULOVÁ HYPOTÉZA: Populační průměry všech srovnávaných skupin jsou shodné. ALTERNATIVNÍ HYPOTÉZA: Rozdíly mezi jednotlivými průměry - přinejmenším mezi dvěma z nich - existují (nevíme však mezi kterými). PŘÍKLAD UŽITÍ ANOVY Poc hoc test •Zadáme ji tak, že v dialogovém okně ANOVY klikneme myší na tlačítko Post Hoc. Celý postup tedy vypadá takto: –Procedura: STATISTICS — COMPARE MEANS — ONE-WAY ANOVA — Dependent list (g33), factor (vek-kat) — Post Hoc — Ú Bonferroni – Signifikance level: ,05 –(Pozn.: Doporučuje se užívat buď Bonferroniho testu nebo testu Tukeyho. LSD test je příliš liberální a Scheffeho test je naopak příliš konzervativní (přísný) Rabušic, Mareš, 2002.) Kruskal-Wallisův test (neparametrický test) •Pokud jsou předpoklady pro použití ANOVY výrazně porušeny, měli bychom použít neparametrického ekvivalentu ANOVY, jímž je Kruskal-Wallisův test. Ten srovnává ne průměry, nýbrž pořadí (ranks). •Kruskal-Wallisův test bohužel neumí testovat signifikanci rozdílů mezi jednotlivými skupinami nezávisle proměnné –Procedura: •Analyze – Nonparametric tests – K Independent Samples – Test variable List: q33 – •Grouping Variable: vek_kat – Define Range – Minimum: 1 – Maximum: 6 Příklad (Mareš, Rabušic, 2002) Uzavíráme, že zamítáme nulovou hypotézu. Rozdíly jsou významné, ale nevíme jaké (resp. mezi jakými skupinami).