Testování hypotéz
o    vymezení důležitých pojmů
o    testování hypotéz o rozdílu průměrů
o    jednovýběrový t-test
o    t-test pro nezávislé výběry
o    t-test pro závislé výběry




Vymezení důležitých pojmů
o    nulová hypotéza
o    alternativní hypotéza
o    testování hypotézy
o    hladina významnosti (alfa)
o    chyba typu I, chyba typu II
Nulová hypotéza
o    hypotéza, kterou se snažíme vyvrátit (falzifikovat)
o    Karl Popper (1968) tvrdil, že platnost hypotézy nemůže být
nikdy prokázána pouhou generalizací příkladů, které ji potvrzují
  n    jak říká filozof Bertrand Russel, krocan-vědec by mohl
    zobecnit tvrzení "každý den mě krmí", protože tato hypotéza je
    potvrzována den po dni celý jeho život. tato generalizace ovšem
    neposkytuje žádnou jistotu, že krocan bude nakrmen i další den -
    některý den se pravděpodobně on sám stane pokrmem
Nulová hypotéza
o    Popper došel k závěru, že jedinou možnou metodou je
  falsifikace hypotézy - nalezení jednoho příkladu, který stačí k
  jejímu vyvrácení
o    vědci se proto snaží své hypotézy vyvrátit a tak potvrdit
hypotézy opačné - alternativní

Nulová hypotéza
o    nulová hypotéza je opakem naší výzkumné hypotézy
o    obvykle zní: mezi dvěma průměry není rozdíl, korelace je
nulová apod.
o    např. průměrná výška mužů a žen se neliší
o    označuje se H0
Alternativní hypotéza
o    alternativní vzhledem k nulové, tj. naše výzkumná hypotéza
o    např. průměrná výška mužů a žen se liší nebo průměrná výška
mužů je větší než průměrná výška žen
Testování hypotézy
o    proces, kterým rozhodujeme, zda přijmeme nebo zamítneme
  nulovou hypotézu
o    pokud zamítneme nulovou hypotézu, přijímáme tak alternativní
Hladina významnosti
o    hladina významnosti je úroveň pravděpodobnosti, kterou
  používáme při rozhodování, zda zamítnout nebo přijmout nulovou
  hypotézu
o    označuje se alfa (a)
o    obvyklá hladina významnosti je 5% nebo 1% - volíme podle
vlastního uvážení


Chyba I. druhu
o    zvolíme-li hladinu významnosti 5%, pak se rozhodneme
  zamítnout nulovou hypotézu v případě, že existuje pouze 5%
  pravděpodobnost, že platí
o    jde vlastně o 5% riziko, že nulová hypotéza platí a my ji
přitom zamítneme -- tj. uděláme chybu I. druhu

Chyba II. druhu
o    opak chyby I. druhu -- riziko, že nezamítneme nulovou
  hypotézu, která ve skutečnosti neplatí
o    označuje se beta (b)


Chyby typu I a II
Testování hypotéz o rozdílu průměrů
o    4 možné typy problémů:
  n    porovnáváme průměr vzorku
    s průměrem populace
     jednovýběrový t-test
n    porovnáváme průměry dvou vzorků
 t-test pro nezávislé výběry
n    porovnáváme dva průměry jednoho vzorku  t-test pro závislé
výběry (tzv. párový t-test)
n    porovnáváme více průměrů
 analýza rozptylu
  
Jednovýběrový t-test - příklad
o    Rozhodujeme se mezi jazykovými školami v Brně. Zjistíme, že
  při posledních zkouškách na Britské radě získalo 100 zkoušených
  osob z různých jazykovek průměrně 85 bodů.
o    Jedna ze škol -- ABC - se chlubí, že její absolventi dosahují
nadprůměrných výsledků.
Jednovýběrový t-test - příklad
o    Zjistíme, že posledních zkoušek se účastnilo 10 absolventů
  školy ABC s těmito výsledky:
  80 91 92 87 89 88 86 80 90 89
o    Můžeme na základě výsledků tohoto vzorku 10 absolventů dojít
  k závěru, že škola ABC má lepší průměrné výsledky než ostatní
  školy v Brně?

Jednovýběrový t-test
o    průměr vzorku je 87.2
o    směrodatná odchylka 4.18
o    známe průměr populace (m=85), ale nikoli směrodatnou
odchylku populace (místo ní použijeme jako odhad směrodatnou
odchylku vzorku)


Jednovýběrový t-test - příklad
o    Nulová hypotéza: průměrné výsledky absolventů školy ABC se
  neliší od výsledků absolventů ostatních škol
o    jinými slovy: není nepravděpodobné, že vzorek má čistě
náhodou průměr 87.2, pokud je průměr populace 85 a směrodatná
odchylka 4.18
Jednovýběrový t-test
o    Alternativní hypotéza: průměrné výsledky absolventů školy
  ABC se liší od výsledků absolventů ostatních škol
o    jinými slovy: je velmi nepravděpodobné, že vzorek má průměr
87.2, pokud je průměr populace 85 a směrodatná odchylka 4.18
Jednovýběrový t-test
o    Hladina významnosti: použijeme
  a =5%
o    pokud je pravděpodobnost získání vzorku o průměru 87.2 menší
než 5%, pak zamítneme H0
o    pokud je pravděpodobnost získání vzorku o průměru 87.2 větší
než 5%, pak H0 nezamítneme

Jednovýběrový t-test
o    potřebujeme spočítat, jaká je pravděpodobnost získání vzorku
  (n=10) o průměru 87.2 z populace o průměru 85 a směrodatné
  odchylce 4.18
o    vzhledem k tomu, že velikost směrodatné odchylky jsme
odhadli ze vzorku, nemůžeme použít z-rozdělení, ale Studentovo
rozdělení t
Jednovýběrový t-test
Jednovýběrový t-test
o    t = (87.2-85) / (4.18/ 10)
  t = 2.2/1.32
  t = 1.66
o    df = n-1 = 10 -- 1 = 9
(počet stupňů volnosti pro vyhledání pravděpodobnosti v tabulce t-
rozdělení)


Jednovýběrový t-test
o    kritická hodnota t pro a=5% je 2.262
o    získaná hodnota t je 1.66
Jednovýběrový t-test
o    pokud je získaná hodnota vyšší než kritická, pak je výsledek
  statisticky významný (tj. pravděpodobnost, že by měl vzorek
  náhodou průměr 87.2, je menší než 5%)
o    pokud je získaná hodnota nižší než kritická, pak rozdíl
průměrů není statisticky významný (tj. pravděpodobnost, že by měl
vzorek náhodou průměr 87.2, je větší než 5%)


Jednovýběrový t-test
o    v našem příkladě je 1.66<2.26
o    tj. výsledek není statisticky významný
o    nemůžeme zamítnout nulovou hypotézu
o    a náš závěr: nemůžeme tvrdit, že výsledky absolventů školy
ABC se liší od průměru brněnských škol (je vyšší než 5%
pravděpodobnost, že průměrný výsledek 87.2 deseti jejích
absolventů je lepší jen náhodou)
Jednovýběrový t-test ve Statistice
T-test pro nezávislé výběry
o    tento test používáme, pokud chceme porovnat průměry dvou
  skupin případů
o    např.
  n    průměrné skóre v neurocitismu u mužů a žen
n    průměr v indexu životní spokojenosti u extravertů a
introvertů atd.
T-test pro nezávislé výběry - příklad
o    Výzkumník chce otestovat účinnost nového léku proti bolesti
  hlavy. Získá 20 dobrovolníků, náhodně je rozdělí do dvou skupin
  po 10 osobách: jedna skupina si domů odnese placebo, druhá
  testovaný lék (ani účastníci, ani výzkumník nevědí, kdo je ve
  které skupině). Účastníci studie si mají vzít lék ve chvíli, kdy
  je začne bolet hlava a zaznamenat, jak dlouho poté bolest trvala
  (kolik minut).
T-test pro nezávislé výběry - příklad
T-test pro nezávislé výběry
o    placebo: průměrná délka bolesti 93 minut; směrodatná
  odchylka 16.02
o    testovaný lék: průměrná délka bolesti 67 minut; směrodatná
odchylka 24.28
T-test pro nezávislé výběry
o    nulová hypotéza: účinnost testovaného léku se neliší od
  účinnosti placeba
o    jinými slovy: rozdílné průměry (93 a 67 minut) trvání
bolesti je možno vysvětlit náhodou
T-test pro nezávislé výběry
o    alternativní hypotéza: mezi účinností testovaného léku a
  účinností placeba je rozdíl
o    jinými slovy: rozdíl v průměrech skupin (93 a 67 minut) v
trvání bolesti je velmi nepravděpodobně pouze náhodný
T-test pro nezávislé výběry
o    hladina významnosti: použijeme
  a =5%
o    pokud je pravděpodobnost získání takto rozdílných průměrů z
jedné populace menší než 5%, pak zamítneme H0 (závěr -- lék je
účinný)
o    pokud je pravděpodobnost získání takto rozdílných průměrů z
jedné populace větší než 5%, pak H0 nezamítneme
T-test pro nezávislé výběry
o    ptáme se vlastně: jak velká je pravděpodobnost, že bychom
  náhodou získali dva takto rozdílné průměry, pokud by platila
  nulová hypotéza, tj. pokud by lék nebyl účinnější než placebo?
o    pokud je tato pravděpodobnost velmi malá, nepřipíšeme
zjištěný rozdíl náhodě, ale nezávislé proměnné (lék vs. placebo)
T-test pro nezávislé výběry
T-test pro nezávislé výběry
o    t = (93 -- 67) /  (16.022/10 + 24.282/10)
  t = 26 / 9.198
  t = 2.82
o    df = n-2 = 20-2 = 18
(počet stupňů volnosti pro vyhledání pravděpodobnosti v tabulce t-
rozdělení)

T-test pro nezávislé výběry
o    kritická hodnota t je 2.101
o    získaná hodnota t je 2.82 -- větší než kritická hodnota
o    rozdíl průměrů obou skupin je tedy statisticky významný na
hladině 5%

T-test pro nezávislé výběry
o    pravděpodobnost, že by takto velký rozdíl v průměrech výběrů
  byl pouhá náhoda, je menší než 5%
o    je velmi málo pravděpodobné, že by byl takový rozdíl v
průměrech, pokud by lék byl ve skutečnosti neúčinný
T-test pro nezávislé výběry
ve Statistice
T-test pro nezávislé výběry
o    předpoklady t-testu pro nezávislé výběry
  n    výběry jsou skutečně nezávislé (tj. oba výběry tvoří jiní
    lidé, zvířata atd.)
n    měřený znak má normální rozdělení (mírné odchylky je možno
tolerovat; u větších odchylek použít raději neparametrické testy)
n    homogenita rozptylů -- rozptyly jsou shodné u obou skupin
T-test pro nezávislé výběry
o    homogenita rozptylů
o    obvykle nejsou směrodatné odchylky (či rozptyly) zcela
shodné, ale rozdíly by neměly být příliš velké



T-test pro nezávislé výběry
o    homogenita rozptylů
o    zda se rozptyly liší, je možno otestovat některým testem pro
rozdíl rozptylů, např. F-testem
  n    pokud nevyjde stat. významný, pak rozptyly pokládáme za
    shodné
n    pokud vyjde stat. významný, spočítáme modifikovaný t-test
pro rozdílné rozptyly (ve Statistice záložka Možnosti)


F-test pro shodu rozptylů
ve Statistice
T-test pro závislé výběry
o    označuje se někdy také jako t-test pro párované výběry
o    v naprosté většině případů se používá pro porovnání dvou
měření u stejných osob (tj. páru měření u jedné skupiny osob)
o    někdy také pro porovnání průměrů u dvou skupin osob, které
tvoří páry (např. manželské či podle jiného klíče -- věku,
pohlaví, nemoci atd.)
T-test pro závislé výběry - příklad
o    Psychiatr chce vyhodnotit úspěšnost určitého způsobu terapie
  poruch příjmu potravy. Terapie se účastnilo 10 dívek. U každé z
  nich byla zaznamenána váha před a po terapii. Psychiatr si chce
  ověřit, zda jejich hmotnost průkazně vzrostla.
T-test pro závislé výběry - příklad
T-test pro závislé výběry
o    průměrná hmotnost před zahájením terapie 44.1 kg
  směrodatná odchylka 5.90
o    průměrná hmotnost po ukončení terapie 51.6 kg
směrodatná odchylka 9.35
T-test pro závislé výběry - příklad
T-test pro závislé výběry
o    průměrný rozdíl hmotnosti před a po terapii byl 7.5 kg
  směrodatná odchylka rozdílu 7.49

T-test pro závislé výběry
o    nulová hypotéza: terapie není účinná -- rozdíl v hmotnosti
  před a po terapii se statisticky významně neliší od nuly
o    jinými slovy: je velká pravděpodobnost, že rozdíl o této
velikosti (7.5 kg) je pouze náhodný
T-test pro závislé výběry
o    alternativní hypotéza: terapie je účinná -- existuje rozdíl v
  hmotnosti před a po terapii
o    jinými slovy: je jen velmi malá pravděpodobnost, že rozdíl o
této velikosti (7.5 kg) je pouze náhodný
T-test pro závislé výběry
T-test pro závislé výběry
o    t = - 7.5 /(7.48/10)
  t = - 7.5 / 2.37
  t = - 3.16
o    df = n-1 = 10-1 = 9
(počet stupňů volnosti pro vyhledání pravděpodobnosti v tabulce t-
rozdělení)

T-test pro závislé výběry
o    hladina významnosti: použijeme
  a =5%
o    pokud je pravděpodobnost získání takto rozdílných průměrů
menší než 5%, pak zamítneme H0 (závěr -- terapie je účinná)
o    pokud je pravděpodobnost získání takto rozdílných průměrů
větší než 5%, pak H0 nezamítneme -- pozorovaný rozdíl přičteme
náhodě

T-test pro závislé výběry
o    kritická hodnota t je 2.262
o    získaná hodnota t je 3.16 -- větší než kritická hodnota
o    rozdíl obou průměrů je tedy statisticky významný na hladině
5%
o    můžeme zamítnout nulovou hypotézu
o    terapie je účinná

T-test pro závislé výběry
ve Statistice
Porovnání výzkumných plánů
o    t-test pro nezávislé výběry se používá většinou u výzkumných
  plánů s výzkumnou a kontrolní skupinou
o    zatímco t-test pro závislé výběry většinou u výzkumných
plánů s opakovaným měřením u stejných osob
Porovnání výzkumných plánů
o    výhody opakovaného měření:
  n    kontrola vlivu intervenujících proměnných (všichni jsou v
    jedné skupině, nehrají roli případné náhodné rozdíly mezi
    skupinami)
n    postačí menší vzorek (test pro závislé výběry má větší
statistickou sílu -- spíše zamítne nulovou hypotézu, pokud
neplatí)
Porovnání výzkumných plánů
o    nevýhody opakovaných měření:
  n    nemůže být použito pro všechny výzkumné problémy (porovnání
    mužů a žen, vzdělaných a nevzdělaných...)
n    možný vliv učení či únavy při testování výkonovými testy
Kontrolní otázky
o    vysvětlete pojmy
  n    nulová a alternativní hypotéza
n    testování hypotéz
n    chyba I. druhu a chyba II. druhu
o    jaké testy se používají pro testování hypotéz o rozdílu
  průměrů?
o    pro jaké typy výzkumných plánů použijete jednovýběrový t-
test?
o    porovnejte užití t-testu pro nezávislé a pro závislé výběry