Testování hypotéz o t-test pro závislé výběry T-test pro závislé výběry o označuje se někdy také jako t-test pro párované výběry o v naprosté většině případů se používá pro porovnání dvou měření u stejných osob (tj. páru měření u jedné skupiny osob) o někdy také pro porovnání průměrů u dvou skupin osob, které tvoří páry (např. manželské či podle jiného klíče -- věku, pohlaví, nemoci atd.) T-test pro závislé výběry - příklad o Psychiatr chce vyhodnotit úspěšnost určitého způsobu terapie poruch příjmu potravy. Terapie se účastnilo 10 dívek. U každé z nich byla zaznamenána váha před a po terapii. Psychiatr si chce ověřit, zda jejich hmotnost průkazně vzrostla. T-test pro závislé výběry - příklad T-test pro závislé výběry o průměrná hmotnost před zahájením terapie 44.1 kg směrodatná odchylka 5.90 o průměrná hmotnost po ukončení terapie 51.6 kg směrodatná odchylka 9.35 T-test pro závislé výběry - příklad T-test pro závislé výběry o průměrný rozdíl hmotnosti před a po terapii byl 7.5 kg směrodatná odchylka rozdílu 7.49 T-test pro závislé výběry o nulová hypotéza: terapie není účinná -- rozdíl v hmotnosti před a po terapii se statisticky významně neliší od nuly o jinými slovy: je velká pravděpodobnost, že rozdíl o této velikosti (7.5 kg) je pouze náhodný T-test pro závislé výběry o alternativní hypotéza: terapie je účinná -- existuje rozdíl v hmotnosti před a po terapii o jinými slovy: je jen velmi malá pravděpodobnost, že rozdíl o této velikosti (7.5 kg) je pouze náhodný T-test pro závislé výběry T-test pro závislé výběry o t = - 7.5 /(7.48/10) t = - 7.5 / 2.37 t = - 3.16 o df = n-1 = 10-1 = 9 (počet stupňů volnosti pro vyhledání pravděpodobnosti v tabulce t-rozdělení) T-test pro závislé výběry o hladina významnosti: použijeme a =5% o pokud je pravděpodobnost získání takto rozdílných průměrů menší než 5%, pak zamítneme H[0] (závěr -- terapie je účinná) o pokud je pravděpodobnost získání takto rozdílných průměrů větší než 5%, pak H[0] nezamítneme -- pozorovaný rozdíl přičteme náhodě T-test pro závislé výběry o kritická hodnota t je 2.262 o získaná hodnota t je 3.16 -- větší než kritická hodnota o rozdíl obou průměrů je tedy statisticky významný na hladině 5% o můžeme zamítnout nulovou hypotézu o terapie je účinná T-test pro závislé výběry ve Statistice Porovnání výzkumných plánů o t-test pro nezávislé výběry se používá většinou u výzkumných plánů s výzkumnou a kontrolní skupinou o zatímco t-test pro závislé výběry většinou u výzkumných plánů s opakovaným měřením u stejných osob Porovnání výzkumných plánů o výhody opakovaného měření: n kontrola vlivu intervenujících proměnných (všichni jsou v jedné skupině, nehrají roli případné náhodné rozdíly mezi skupinami) n postačí menší vzorek (test pro závislé výběry má větší statistickou sílu -- spíše zamítne nulovou hypotézu, pokud neplatí) Porovnání výzkumných plánů o nevýhody opakovaných měření: n nemůže být použito pro všechny výzkumné problémy (porovnání mužů a žen, vzdělaných a nevzdělaných...) n možný vliv učení či únavy při testování výkonovými testy Analýza rozptylu o logika analýzy rozptylu o výpočetní postup o mnohonásobná porovnávání Porovnávání průměrů o t-testy jsou určeny pouze pro porovnávání dvojice průměrů o v mnoha výzkumných plánech je však více skupin než dvě n např. v příkladu s testováním účinnosti nového léku může být kromě skupin s testovaným lékem a placebem ještě skupina se starým lékem Porovnávání průměrů o rozdíly mezi více skupinami by sice bylo možné otestovat po dvojicích pomocí t-testu, ale... n pravděpodobnosti v tabulce t-rozdělení jsou spočítány za předpokladu, že je prováděno pouze jediné srovnání n čím více testů, tím vyšší pravděpodobnost chyby I. druhu (např. pro 3 srovnání je 5% alfa ve skutečnosti 10%, pro 10 srovnání 30% atd.) Analýza rozptylu o proto je vhodnější místo mnoha t-testů použít jinou statistickou techniku -- analýzu rozptylu o analysis of variance --ANOVA o umožňuje otestovat rozdíly mezi průměry více skupin najednou Logika analýzy rozptylu o analýza rozptylu nevyužívá pro testování rozdílu mezi průměry samotné průměry, ale rozptyly o počítají se dva odhady: n rozptyl uvnitř skupin (within-groups nebo within-subjects variance) n rozptyl mezi skupinami (between-groups nebo between-subjects variance) Logika analýzy rozptylu o rozptyl uvnitř skupin je ukazatel celkové variability uvnitř skupin -- tj. jak se od sebe vzájemně liší osoby v rámci jednotlivých skupin o rozptyl mezi skupinami je měřítkem variability mezi skupinami -- tj. jak se od sebe liší skupiny osob Logika analýzy rozptylu o poměr těchto dvou rozptylů je statistika F rozptyl mezi skupinami F = rozptyl uvnitř skupin Logika analýzy rozptylu o pokud nejsou mezi skupinami rozdíly, pak by měl být rozptyl mezi skupinami a uvnitř skupin velmi podobný (teoreticky shodný - F=1) o pokud jsou mezi skupinami rozdíly, pak budou tyto rozdíly (between)větší než vzájemné rozdíly mezi osobami uvnitř skupin (within) Logika analýzy rozptylu o je-li F>1, pak kromě F musíme ještě spočítat pravděpodobnost, že bychom takto vysoké získali náhodou (tj. statistickou významnost) o tabulka F rozdělení je vždy pro konkrétní hodnotu alfa; má v řádcích počet stupňů volnosti pro rozptyl uvnitř skupin a ve sloupcích pro rozptyl mezi skupinami Analýza rozptylu - příklad o v klasickém experimentu testujícím tzv. efekt přihlížejících (bystander effect) zjišťovali Darley a Latane, zda má přítomnost dalších lidí vliv na naši ochotu pomoci někomu v nouzi o ZO čekala v místnosti s dalšími 0, 2 nebo 4 osobami Analýza rozptylu - příklad o experimentátorka odešla něco připravit do vedlejší místnosti a bylo slyšet, že upadla a vykřikla něco o bolesti v kotníku o závislou proměnnou byla doba, která uplynula do nabídnutí pomoci experimentátorce (v sekundách) Analýza rozptylu - příklad Analýza rozptylu [o ] 1. krok -- výpočet celkového rozptylu (součtu čtverců -- sum of squares) SST (SS[total]) = SSB + SSW o SST = S(X-X)^2 o výpočetní rovnice SST = SX^2 --[(SX)^2/n] Analýza rozptylu - příklad ^o SST = SX^2 --[(SX)^2/n] SST = (27^2+20^2+22^2+...+33^2)--[(906)^2/33] SST = 26016 -- 24873,818 SST = 1142,182 Analýza rozptylu o 2. krok -- výpočet rozptylu mezi skupinami SSB (SS[between]) ^o SSB = Sn[k](X[k]-X)^2 n n[k] je počet osob ve skupině n X[k] je průměr skupiny Analýza rozptylu - příklad ^o SSB = Sn[k](X[k]-X)^2 SSB = 12*(23,75-27,45)^2 + 10*(27,60- 27,45)^2 + 11*(31,36-27,45)^2 SSB = 12*(-3,7)^2+10*(0,15)^2+(11*3,91)^2 SSB = 332,968 Analýza rozptylu [o ] 3. krok -- výpočet rozptylu uvnitř skupin SSW (SS[within]) [ ]^o SSW = S(X-X[k])^2 n X[k] je průměr skupiny o výpočetní rovnice SSW = SST - SSB Analýza rozptylu - příklad o SSW = SST -- SSB SSW = 1142,182 -- 332,986 SSW = 809,196 Analýza rozptylu - příklad [o ] 4. krok -- výpočet stupňů volnosti [ ]o pro SST: dft = n-1 (n je celkový počet osob) n dft = 33-1 = 32 [ ]o pro SSB: dfb = k-1 (k je počet skupin) n dfb = 3-1 = 2 [ ]o pro SSW: dfw = n-k [ ]n dfw = 33-3 = 30 Analýza rozptylu - příklad Analýza rozptylu - příklad o F = rozptyl mezi / rozptyl uvnitř F = MSB / MSW F = 166,493 / 26,973 F = 6,17 o F vypadá větší než 1, ale jak je pravděpodobné, že by tento výsledek byl náhodný? tj., je F statisticky významné? Analýza rozptylu - příklad o F (2, 30) = 6,17 Analýza rozptylu - příklad o F (2, 30) = 6,17 o kritická hodnota F pro 5% hladinu významnosti F = 3,32 o kritická hodnota F pro 1% hladinu významnosti F = 5,39 o F (2, 30) = 6,17 p < 0.01 o rozdíl mezi průměry je statisticky významný na 1% hladině významnosti Výstup ve Statistice Předpoklady analýzy rozptylu o měřený znak by měl mít normální rozdělení o homogenita rozptylů - zda se rozptyly liší, je možno otestovat některým testem pro rozdíl rozptylů, např. Leveneovy testy n pokud nevyjde stat. významný, pak rozptyly pokládáme za shodné Mnohonásobná porovnávání o průkaznost F nám řekne, zda existují průkazné rozdíly mezi průměry o ale nedozvíme se tak, mezi kterými skupinami je průkazný rozdíl (která skupina se liší od které) o je třeba provést tzv. mnohonásobná porovnání (multiple comparisons nebo post-hoc comparisons) Mnohonásobná porovnávání Mnohonásobná porovnávání o jde v podstatě o upravené t-testy n upravené vzhledem k počtu porovnávání o existuje více různých typů mnohonásobných porovnávání, např. Fisherův LSD test, Bonferroniho test, Tukeyho test, Scheffeho test atd. Mnohonásobná porovnávání o tyto testy jsou si hodně podobné vzorcem pro jejich výpočet o liší se však ve způsobu, jak se u nich stanovuje hladina významnosti (Fisherův LSD test je liberálnější, zatímco ostatní uvedené přísnější) Mnohonásobná porovnávání o pokud bychom tyto testy spočítali u předchozího příkladu, zjistili bychom, že průkazný rozdíl je mezi skupinou osob, které byly v místnosti sami, a skupinou se 4 dalšími lidmi Mnohonásobná porovnávání