Testování hypotéz Testování hypotéz o rozdílu průměrů ot-test pro nezávislé výběry ot-test pro závislé výběry o oPorovnání výzkumných plánů oPrezentace výsledků t-testu o o o Testování hypotéz o rozdílu průměrů o4 možné typy problémů: nporovnáváme průměr vzorku s průměrem populace à jednovýběrový t-test nporovnáváme průměry dvou vzorků à t-test pro nezávislé výběry nporovnáváme dva průměry jednoho vzorku à t-test pro závislé výběry (tzv. párový t-test) nporovnáváme více průměrů à analýza rozptylu n T-test pro nezávislé výběry otento test používáme, pokud chceme porovnat průměry dvou skupin případů onapř. nprůměrné skóre v neurocitismu u mužů a žen nprůměr v indexu životní spokojenosti u extravertů a introvertů atd. T-test pro nezávislé výběry - příklad oVýzkumník chce otestovat účinnost nového léku proti bolesti hlavy. Získá 20 dobrovolníků, náhodně je rozdělí do dvou skupin po 10 osobách: jedna skupina si domů odnese placebo, druhá testovaný lék (ani účastníci, ani výzkumník nevědí, kdo je ve které skupině). Účastníci studie si mají vzít lék ve chvíli, kdy je začne bolet hlava a zaznamenat, jak dlouho poté bolest trvala (kolik minut). T-test pro nezávislé výběry - příklad skupina s placebem skupina s test. lékem 95 75 85 60 100 30 120 65 80 100 90 70 85 40 80 55 75 65 120 110 T-test pro nezávislé výběry oplacebo nprůměrná délka bolesti 93 minut; směrodatná odchylka 16.02 otestovaný lék nprůměrná délka bolesti 67 minut; směrodatná odchylka 24.28 1. Určení statistické hypotézy onulová hypotéza: délka trvání bolesti hlavy po aplikaci léku a po aplikaci placeba se neliší (=účinnost testovaného léku se neliší od účinnosti placeba) ojinými slovy: rozdílné průměry (93 a 67 minut) trvání bolesti je možno vysvětlit náhodou – vzorky mohou pocházet z populace o stejném průměru 1. Určení statistické hypotézy oalternativní hypotéza: délka trvání bolesti hlavy po aplikaci léku a po aplikaci placeba je rozdílná (= mezi účinností testovaného léku a účinností placeba je rozdíl) ojinými slovy: rozdíl v průměrech skupin (93 a 67 minut) v trvání bolesti je velmi nepravděpodobně pouze náhodný (je velmi nepravděpodobné, že by oba vzorky pocházely z populace o stejném průměru) 2. Určení hladiny chyby a ohladina významnosti: použijeme a =5% opokud je pravděpodobnost získání takto rozdílných průměrů z jedné populace menší než 5%, pak zamítneme H0 (závěr – lék je účinný) opokud je pravděpodobnost získání takto rozdílných průměrů z jedné populace větší než 5%, pak H0 nezamítneme T-test pro nezávislé výběry optáme se vlastně: jak velká je pravděpodobnost, že bychom získali dva takto rozdílné průměry, pokud by platila nulová hypotéza, tj. pokud by lék nebyl účinnější než placebo? opokud je tato pravděpodobnost velmi malá, nepřipíšeme zjištěný rozdíl náhodě, ale nezávislé proměnné (lék vs. placebo) 3. Výpočet testovací statistiky oobecně se testová statistika t vypočítá jako nrozdíl výběrových průměrů dvou nezávislých výběrů – očekávaný rozdíl, pokud platí H0 (=0) na vydělíme ho odhadem směrodatné chyby rozdílu výběrových průměrů otj. rozdíl průměrů vydělíme tzv. sdruženým odhadem variability 3. Výpočet testovací statistiky 3. Výpočet testovací statistiky ot = (93 – 67) / (16.022/10 + 24.282/10) t = 26 / 9.198 t = 2.82 odf = n-2 = 20-2 = 18 (počet stupňů volnosti pro vyhledání pravděpodobnosti v tabulce t-rozdělení) 4. Rozhodnutí okritická hodnota t je 2.101 (tj. 95% všech standardizovaných rozdílů průměrů je do hodnoty +/-2.101) ozískaná hodnota t je 2.82 – větší než kritická hodnota orozdíl průměrů obou skupin je tedy statisticky významný na hladině 5% o 4. Rozhodnutí opravděpodobnost, že bychom vzorky o tak rozdílných průměrech získali z jedné populace je menší než 5% oje velmi málo pravděpodobné, že by byl takový rozdíl v průměrech, pokud by lék byl ve skutečnosti neúčinný T-test pro nezávislé výběry v SPSS T-test pro nezávislé výběry opředpoklady t-testu pro nezávislé výběry nvýběry jsou skutečně nezávislé (tj. oba výběry tvoří jiní lidé, zvířata atd.) nměřený znak má normální rozdělení (mírné odchylky je možno tolerovat; u větších odchylek a malých vzorků použít raději neparametrické testy) nhomogenita rozptylů – rozptyly jsou shodné u obou skupin T-test pro nezávislé výběry ohomogenita rozptylů oobvykle nejsou směrodatné odchylky (či rozptyly) zcela shodné, ale rozdíly by neměly být příliš velké o o o T-test pro nezávislé výběry ohomogenita rozptylů ozda se rozptyly liší, je možno otestovat některým testem pro rozdíl rozptylů, např. F-testem npokud nevyjde stat. významný, pak rozptyly pokládáme za shodné npokud vyjde stat. významný, interpretujeme modifikovaný t-test pro rozdílné rozptyly (equal variances not assumed) o o F-test pro shodu rozptylů ve Statistice T-test pro závislé výběry ooznačuje se někdy také jako t-test pro párované výběry ov naprosté většině případů se používá pro porovnání dvou měření u stejných osob (tj. páru měření u jedné skupiny osob) oněkdy také pro porovnání průměrů u dvou skupin osob, které tvoří páry (např. manželské či podle jiného klíče – věku, pohlaví, nemoci atd.) T-test pro závislé výběry - příklad oPsychiatr chce vyhodnotit úspěšnost určitého způsobu terapie poruch příjmu potravy. Terapie se účastnilo 10 dívek. U každé z nich byla zaznamenána váha před a po terapii. Psychiatr si chce ověřit, zda jejich hmotnost průkazně vzrostla. T-test pro závislé výběry - příklad hmotnost před terapií hmotnost po terapii 36 45 38 41 45 40 45 45 38 45 40 63 49 59 54 63 47 54 49 61 T-test pro závislé výběry oprůměrná hmotnost před zahájením terapie 44.1 kg směrodatná odchylka 5.90 oprůměrná hmotnost po ukončení terapie 51.6 kg směrodatná odchylka 9.35 T-test pro závislé výběry - příklad před po rozdíl (před – po) 36 45 -9 38 41 -3 45 40 +5 45 45 0 38 45 -7 40 63 -23 49 59 -10 54 63 -9 47 54 +7 49 61 -12 T-test pro závislé výběry oprůměrný rozdíl hmotnosti před a po terapii byl 7.5 kg směrodatná odchylka rozdílu 7.49 o 1. Určení statistické hypotézy onulová hypotéza: terapie není účinná – rozdíl v hmotnosti před a po terapii je nulový ojinými slovy: je velká pravděpodobnost, že zjištěný rozdíl o této velikosti (7.5 kg) je pouze náhodný 1. Určení statistické hypotézy oalternativní hypotéza: terapie je účinná – existuje rozdíl v hmotnosti před a po terapii ojinými slovy: je jen velmi malá pravděpodobnost, že rozdíl o této velikosti (7.5 kg) je pouze náhodný 2. Určení hladiny chyby a ohladina významnosti: použijeme a =5% opokud je pravděpodobnost získání takto rozdílných průměrů menší než 5%, pak zamítneme H0 (závěr – terapie je účinná) opokud je pravděpodobnost získání takto rozdílných průměrů větší než 5%, pak H0 nemůžeme zamítnout o 3. Výpočet testovací statistiky oprůměrný rozdíl před a po o o osměrodatná odchylka průměrného rozdílu 3. Výpočet testovací statistiky ot = - 7.5 /(7.48/10) t = - 7.5 / 2.37 t = - 3.16 odf = n-1 = 10-1 = 9 (počet stupňů volnosti pro vyhledání pravděpodobnosti v tabulce t-rozdělení) o 4. Rozhodnutí okritická hodnota t je 2.262 ozískaná hodnota t je 3.16 – větší než kritická hodnota orozdíl obou průměrů je tedy statisticky významný na hladině 5% omůžeme zamítnout nulovou hypotézu oterapie je účinná o T-test pro závislé výběry v SPSS Porovnání výzkumných plánů ot-test pro nezávislé výběry se používá většinou u výzkumných plánů s výzkumnou a kontrolní skupinou ozatímco t-test pro závislé výběry většinou u výzkumných plánů s opakovaným měřením u stejných osob Porovnání výzkumných plánů ovýhody opakovaného měření: nkontrola vlivu intervenujících proměnných (všichni jsou v jedné skupině, nehrají roli případné náhodné rozdíly mezi skupinami) npostačí menší vzorek (test pro závislé výběry má větší statistickou sílu – spíše zamítne nulovou hypotézu, pokud neplatí) Porovnání výzkumných plánů onevýhody opakovaných měření: nnemůže být použito pro všechny výzkumné problémy (porovnání mužů a žen, vzdělaných a nevzdělaných…) nmožný vliv učení či únavy při testování výkonovými testy Prezentace výsledků t-testu ouvádějí se obvykle průměry, směrodatné odchylky a počty osob, příp. rozdíly mezi průměry (příp. intervaly spolehlivosti), u párových t-testů korelace ohodnota t, počet stupňů volnosti a hladina významnosti nRozdíl mezi průměrným reakčním časem u sprinterů a vytrvalců byl statisticky významný (t=5.89; sv=60, p<0.05). Prezentace výsledků t-testu opříklad výsledků t-testu v tabulce Prezentace výsledků t-testu opříklad prezentace výsledků t-testu v textu o Kontrolní otázky ojaké testy se používají pro testování hypotéz o rozdílu průměrů? opro jaké typy výzkumných plánů použijete jednovýběrový t-test? oporovnejte užití t-testu pro nezávislé a pro závislé výběry