Testování hypotéz 1.vymezení důležitých pojmů 2.testování hypotéz o rozdílu průměrů 3.jednovýběrový t-test 4.t-test pro nezávislé výběry 5.t-test pro závislé výběry 6. 1. 1. Vymezení důležitých pojmů onulová hypotéza, alternativní hypotéza otestování hypotézy ohladina významnosti (alfa) ochyba I. druhu, chyba II. druhu Nulová hypotéza ohypotéza, kterou se snažíme vyvrátit (falzifikovat) oKarl Popper (1968) tvrdil, že platnost hypotézy nemůže být nikdy prokázána pouhou generalizací příkladů, které ji potvrzují njak říká filozof Bertrand Russel, krocan-vědec by mohl zobecnit tvrzení "každý den mě krmí", protože tato hypotéza je potvrzována den po dni celý jeho život. tato generalizace ovšem neposkytuje žádnou jistotu, že krocan bude nakrmen i další den - některý den se pravděpodobně on sám stane pokrmem Nulová hypotéza oPopper došel k závěru, že jedinou možnou metodou je falsifikace hypotézy - nalezení jednoho příkladu, který stačí k jejímu vyvrácení ovědci se proto snaží své hypotézy vyvrátit a tak potvrdit hypotézy opačné - alternativní o Nulová hypotéza onulová hypotéza je opakem naší výzkumné hypotézy oobvykle zní: mezi dvěma průměry není rozdíl, korelace je nulová apod. onapř. průměrná výška mužů a žen se neliší ooznačuje se H0 Alternativní hypotéza oalternativní vzhledem k nulové, tj. naše výzkumná hypotéza onapř. průměrná výška mužů a žen se liší nebo průměrná výška mužů je větší než průměrná výška žen Testování hypotézy oproces, kterým rozhodujeme, zda přijmeme nebo zamítneme nulovou hypotézu opokud zamítneme nulovou hypotézu, přijímáme tak alternativní Hladina významnosti ohladina významnosti je úroveň pravděpodobnosti, kterou používáme při rozhodování, zda zamítnout nebo přijmout nulovou hypotézu ooznačuje se alfa (a) oobvyklá hladina významnosti je 5% nebo 1% - volíme podle vlastního uvážení o o Chyba I. druhu ozvolíme-li hladinu významnosti 5%, pak se rozhodneme zamítnout nulovou hypotézu v případě, že existuje pouze 5% pravděpodobnost, že platí ojde vlastně o 5% riziko, že nulová hypotéza platí a my ji přitom zamítneme – tj. uděláme chybu I. druhu o o Chyba II. druhu oopak chyby I. druhu – riziko, že nezamítneme nulovou hypotézu, která ve skutečnosti neplatí (tj. existuje např. rozdíl mezi průměry, ale ve výběru se neprojeví) ooznačuje se beta (b) o o o Statistická síla opravděpodobnost, že správně zamítneme nulovou hypotézu, která neplatí, je rovna 1 - b ojde o tzv. sílu testu (power) – schopnost zachytit rozdíl, který existuje ohraje velkou roli při rozhodování o dostatečné velikosti vzorku Statistická síla oje ovlivněna 4 faktory: nvelikostí vzorku - s větším vzorkem máme větší pravděpodobnost, že existující rozdíl zachytíme nrozdílem mezi populačními průměry - čím je rozdíl mezi populačními průměry větší, tím větší pravděpodobnost, že najdeme i rozdíl mezi průměry vzorků nvariabilitě měřeného znaku - čím je větší variabilita měřeného znaku, tím menší pravděpodobnost, že zachytíme rozdíl mezi průměry nzvolené hladině významnosti - čím přísněji ji stanovíme (např. 0,1%), tím nižší síla testu Testování hypotézy skutečnost rozhodnutí nulová hypotéza platí nulová hypotéza neplatí zamítneme nulovou hypotézu chyba I. druhu (a) správné rozhodnutí (1-b) nezamítneme nulovou hypotézu správné rozhodnutí (1-a) chyba II. druhu (b) Testování hypotéz o rozdílu průměrů o4 možné typy problémů: nporovnáváme průměr vzorku s průměrem populace à jednovýběrový t-test nporovnáváme průměry dvou vzorků à t-test pro nezávislé výběry nporovnáváme dva průměry jednoho vzorku à t-test pro závislé výběry (tzv. párový t-test) nporovnáváme více průměrů à analýza rozptylu n Jednovýběrový t-test - příklad oRozhodujeme se mezi jazykovými školami v Brně. Zjistíme, že při posledních zkouškách na Britské radě získalo 100 zkoušených osob z různých jazykovek průměrně 85 bodů. Jedna ze škol – ABC - se chlubí, že výsledky jejich absolventů jsou nadprůměrné. Jednovýběrový t-test - příklad oZjistíme, že posledních zkoušek se účastnilo 10 absolventů školy ABC s těmito výsledky: o 80 91 92 87 89 88 86 80 90 89 oMůžeme na základě výsledků tohoto vzorku 10 absolventů dojít k závěru, že škola ABC má lepší průměrné výsledky než ostatní školy v Brně? o Jednovýběrový t-test oprůměr vzorku je 87.2 osměrodatná odchylka 4.18 oznáme průměr populace (m=85), ale nikoli směrodatnou odchylku populace (místo ní použijeme jako odhad směrodatnou odchylku vzorku) o o Jednovýběrový t-test - příklad oNulová hypotéza: průměrné výsledky absolventů školy ABC se neliší od výsledků absolventů ostatních škol ojinými slovy: není nepravděpodobné, že vzorek má čistě náhodou průměr 87.2, pokud je průměr populace 85 a směrodatná odchylka 4.18 Jednovýběrový t-test oAlternativní hypotéza: průměrné výsledky absolventů školy ABC se liší od výsledků absolventů ostatních škol ojinými slovy: je velmi nepravděpodobné, že vzorek má průměr 87.2, pokud je průměr populace 85 a směrodatná odchylka 4.18 Jednovýběrový t-test oHladina významnosti: použijeme a =5% opokud je pravděpodobnost získání vzorku o průměru 87.2 menší než 5%, pak zamítneme H0 opokud je pravděpodobnost získání vzorku o průměru 87.2 větší než 5%, pak H0 nezamítneme o Jednovýběrový t-test opotřebujeme spočítat, jaká je pravděpodobnost získání vzorku (n=10) o průměru 87.2 z populace o průměru 85 a směrodatné odchylce 4.18 opotřebujeme zjistit hodnoty rozdělení výběrových průměrů pro populaci s průměrem 85 a směrodatnou odchylkou 4.18 a výběry o velikosti 10 Jednovýběrový t-test ovzhledem k tomu, že velikost směrodatné odchylky jsme odhadli ze vzorku, nemůžeme použít z-rozdělení, ale Studentovo rozdělení t Jednovýběrový t-test Jednovýběrový t-test ot = (87.2-85) / (4.18/ 10) t = 2.2/1.32 t = 1.66 odf = n-1 = 10 – 1 = 9 (počet stupňů volnosti pro vyhledání pravděpodobnosti v tabulce t-rozdělení) o Jednovýběrový t-test okritická hodnota t pro a=5% je 2.262 (tj. 2.262 výběrové chyby nad nebo pod průměrem populace odděluje celkem 5% výběrů) ozískaná hodnota t je 1.66 Jednovýběrový t-test opokud je získaná hodnota vyšší než kritická, pak je výsledek statisticky významný (tj. pravděpodobnost, že by měl vzorek z populace o průměru 85 průměr 87.2, je menší než 5%) opokud je získaná hodnota nižší než kritická, pak rozdíl průměrů není statisticky významný (tj. pravděpodobnost, že by měl vzorek průměr 87.2, je větší než 5%) o o Jednovýběrový t-test ov našem příkladě je 1.66<2.26 otj. výsledek není statisticky významný onemůžeme zamítnout nulovou hypotézu oa náš závěr: nemůžeme tvrdit, že výsledky absolventů školy ABC se liší od průměru brněnských škol (je vyšší než 5% pravděpodobnost, že průměrný výsledek 87.2 deseti jejích absolventů je lepší jen náhodou) Jednovýběrový t-test v SPSS T-test pro nezávislé výběry otento test používáme, pokud chceme porovnat průměry dvou skupin případů onapř. nprůměrné skóre v neurocitismu u mužů a žen nprůměr v indexu životní spokojenosti u extravertů a introvertů atd. T-test pro nezávislé výběry - příklad oVýzkumník chce otestovat účinnost nového léku proti bolesti hlavy. Získá 20 dobrovolníků, náhodně je rozdělí do dvou skupin po 10 osobách: jedna skupina si domů odnese placebo, druhá testovaný lék (ani účastníci, ani výzkumník nevědí, kdo je ve které skupině). Účastníci studie si mají vzít lék ve chvíli, kdy je začne bolet hlava a zaznamenat, jak dlouho poté bolest trvala (kolik minut). T-test pro nezávislé výběry - příklad skupina s placebem skupina s test. lékem 95 75 85 60 100 30 120 65 80 100 90 70 85 40 80 55 75 65 120 110 T-test pro nezávislé výběry oplacebo: průměrná délka bolesti 93 minut; směrodatná odchylka 16.02 otestovaný lék: průměrná délka bolesti 67 minut; směrodatná odchylka 24.28 T-test pro nezávislé výběry onulová hypotéza: účinnost testovaného léku se neliší od účinnosti placeba ojinými slovy: rozdílné průměry (93 a 67 minut) trvání bolesti je možno vysvětlit náhodou, v populaci jsou průměry shodné T-test pro nezávislé výběry oalternativní hypotéza: mezi účinností testovaného léku a účinností placeba je rozdíl ojinými slovy: rozdíl v průměrech skupin (93 a 67 minut) v trvání bolesti je velmi nepravděpodobně pouze náhodný – je malá pravděpodobnost, že by z populace o stejných průměrech pocházely výběry s tak rozdílnými průměry T-test pro nezávislé výběry ohladina významnosti: použijeme a =5% opokud je pravděpodobnost získání takto rozdílných průměrů z jedné populace menší než 5%, pak zamítneme H0 (závěr – lék je účinný) opokud je pravděpodobnost získání takto rozdílných průměrů z jedné populace větší než 5%, pak H0 nezamítneme T-test pro nezávislé výběry optáme se vlastně: jak velká je pravděpodobnost, že bychom získali dva takto rozdílné průměry, pokud by platila nulová hypotéza, tj. pokud by lék nebyl účinnější než placebo? opokud je tato pravděpodobnost velmi malá, nepřipíšeme zjištěný rozdíl náhodě, ale nezávislé proměnné (lék vs. placebo) T-test pro nezávislé výběry T-test pro nezávislé výběry ot = (93 – 67) / (16.022/10 + 24.282/10) t = 26 / 9.198 t = 2.82 odf = n-2 = 20-2 = 18 (počet stupňů volnosti pro vyhledání pravděpodobnosti v tabulce t-rozdělení) T-test pro nezávislé výběry okritická hodnota t je 2.101 ozískaná hodnota t je 2.82 – větší než kritická hodnota orozdíl průměrů obou skupin je tedy statisticky významný na hladině 5% o T-test pro nezávislé výběry opravděpodobnost, že by takto velký rozdíl v průměrech výběrů byl pouhá náhoda, je menší než 5% oje velmi málo pravděpodobné, že by byl takový rozdíl v průměrech, pokud by lék byl ve skutečnosti neúčinný T-test pro nezávislé výběry v SPSS T-test pro nezávislé výběry opředpoklady t-testu pro nezávislé výběry nvýběry jsou skutečně nezávislé (tj. oba výběry tvoří jiní lidé, zvířata atd.) nměřený znak má normální rozdělení (mírné odchylky je možno tolerovat; u větších odchylek použít raději neparametrické testy) nhomogenita rozptylů – rozptyly jsou shodné u obou skupin T-test pro nezávislé výběry ohomogenita rozptylů oobvykle nejsou směrodatné odchylky (či rozptyly) zcela shodné, ale rozdíly by neměly být příliš velké o o o T-test pro nezávislé výběry ohomogenita rozptylů ozda se rozptyly liší, je možno otestovat některým testem pro rozdíl rozptylů, např. Levenovým testem npokud nevyjde stat. významný, pak rozptyly pokládáme za shodné npokud vyjde stat. významný, použijeme modifikovaný t-test pro rozdílné rozptyly (ve výstupu v SPSS druhý řádek) o o Levenův test pro shodu rozptylů Levenův test pro shodu rozptylů T-test pro závislé výběry ooznačuje se někdy také jako t-test pro párované výběry ov naprosté většině případů se používá pro porovnání dvou měření u stejných osob (tj. páru měření u jedné skupiny osob) oněkdy také pro porovnání průměrů u dvou skupin osob, které tvoří páry (např. manželské či podle jiného klíče – věku, pohlaví, nemoci atd.) T-test pro závislé výběry - příklad oPsychiatr chce vyhodnotit úspěšnost určitého způsobu terapie poruch příjmu potravy. Terapie se účastnilo 10 dívek. U každé z nich byla zaznamenána váha před a po terapii. Psychiatr si chce ověřit, zda jejich hmotnost průkazně vzrostla. T-test pro závislé výběry - příklad hmotnost před terapií hmotnost po terapii 36 45 38 41 45 40 45 45 38 45 40 63 49 59 54 63 47 54 49 61 T-test pro závislé výběry oprůměrná hmotnost před zahájením terapie 44.1 kg směrodatná odchylka 5.90 oprůměrná hmotnost po ukončení terapie 51.6 kg směrodatná odchylka 9.35 T-test pro závislé výběry - příklad před po rozdíl (před – po) 36 45 -9 38 41 -3 45 40 +5 45 45 0 38 45 -7 40 63 -23 49 59 -10 54 63 -9 47 54 +7 49 61 -12 T-test pro závislé výběry oprůměrný rozdíl hmotnosti před a po terapii byl 7.5 kg směrodatná odchylka rozdílu 7.49 o T-test pro závislé výběry onulová hypotéza: terapie není účinná – rozdíl v hmotnosti před a po terapii se statisticky významně neliší od nuly ojinými slovy: je velká pravděpodobnost, že rozdíl o této velikosti (7.5 kg) je pouze náhodný T-test pro závislé výběry oalternativní hypotéza: terapie je účinná – existuje rozdíl v hmotnosti před a po terapii ojinými slovy: je jen velmi malá pravděpodobnost, že rozdíl o této velikosti (7.5 kg) je pouze náhodný T-test pro závislé výběry T-test pro závislé výběry ot = - 7.5 /(7.48/10) t = - 7.5 / 2.37 t = - 3.16 odf = n-1 = 10-1 = 9 (počet stupňů volnosti pro vyhledání pravděpodobnosti v tabulce t-rozdělení) o T-test pro závislé výběry ohladina významnosti: použijeme a =5% opokud je pravděpodobnost získání takto rozdílných průměrů menší než 5%, pak zamítneme H0 (závěr – terapie je účinná) opokud je pravděpodobnost získání takto rozdílných průměrů větší než 5%, pak H0 nezamítneme – pozorovaný rozdíl přičteme náhodě T-test pro závislé výběry okritická hodnota t je 2.262 ozískaná hodnota t je 3.16 – větší než kritická hodnota orozdíl obou průměrů je tedy statisticky významný na hladině 5% omůžeme zamítnout nulovou hypotézu oterapie je účinná o T-test pro závislé výběry Porovnání výzkumných plánů ot-test pro nezávislé výběry se používá většinou u výzkumných plánů s výzkumnou a kontrolní skupinou ozatímco t-test pro závislé výběry většinou u výzkumných plánů s opakovaným měřením u stejných osob Porovnání výzkumných plánů ovýhody opakovaného měření: nkontrola vlivu intervenujících proměnných (všichni jsou v jedné skupině, nehrají roli případné náhodné rozdíly mezi skupinami) npostačí menší vzorek (test pro závislé výběry má větší statistickou sílu – spíše zamítne nulovou hypotézu, pokud neplatí) Porovnání výzkumných plánů onevýhody opakovaných měření: nnemůže být použito pro všechny výzkumné problémy (porovnání mužů a žen, vzdělaných a nevzdělaných…) nmožný vliv učení či únavy při testování výkonovými testy Kontrolní otázky ovysvětlete pojmy nnulová a alternativní hypotéza ntestování hypotéz nchyby I. druhu a II ojaké testy se používají pro testování hypotéz o rozdílu průměrů? opro jaké typy výzkumných plánů použijete jednovýběrový t-test? oporovnejte užití t-testu pro nezávislé a pro závislé výběry