Dva výběry Dva výběry: Porovnání variancí Porovnání středních hodnot Porovnání dvou pravděpodobností Příklady různých výběrů Histogram z více proměnných kojeni podle KLUKa.sta 11v*99c hmK = 49*500*normal(x; 7928,5714; 850,1127) hmD = 50*500*normal(x; 7455,26; 779,2897) gr CH gr D 5000 5500 6000 6500 7000 7500 8000 8500 9000 9500 10000 10500 0 2 4 6 8 10 12 14 Početpozorování hmK: SW-W = 0,9885; p = 0,9107 hmD: SW-W = 0,9843; p = 0,7391 Histogram z více proměnných kojeni podle KLUKa.sta 11v*99c deK = 49*1*normal(x; 68,8163; 3,751) delkaD = 50*1*normal(x; 68,28; 2,7482) cm CH cm D62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 0 2 4 6 8 10 12 Početpozorování deK: SW-W = 0,9658; p = 0,1640 delkaD: SW-W = 0,9609; p = 0,0972 Histogram z více proměnných prasniky.sta 10v*19c Var3 = 11*0,08*normal(x; 3,0182; 0,2228) Var4 = 8*0,08*normal(x; 3,6875; 0,1458) Var3 Var4 2,70 2,78 2,86 2,94 3,02 3,10 3,18 3,26 3,34 3,42 3,50 3,58 3,66 3,74 3,82 3,90 0 1 2 3 Početpozorování Var3: SW-W = 0,9614; p = 0,7884 Var4: SW-W = 0,93; p = 0,5161 Histogram z více proměnných kojeni podle Prsu.sta 10v*99c trvANO censored = 33*1*normal(x; 12,1818; 5,6924) trvNE censored = 38*1*normal(x; 9,3421; 6,2484) trvANO censored trvNE censored0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 0 1 2 3 4 5 6 7 8 Početpozorování Dva výběry: F-test shody variancí [homogeneity of variances] Předpoklady testu: • (X1, X2, …, Xk) a (Y1, Y2, …, Ym) všechno nezávislé; 𝑛 𝑋 = 𝑘, 𝑛 𝑌 = 𝑚 • 𝑿𝒊 ~ 𝑵(𝝁 𝑿, 𝝈 𝟐 𝑿), 𝒀𝒊 ~ 𝑵(𝝁 𝒀, 𝝈 𝟐 𝒀), parametry neznáme. Hypotéza: 𝑯 𝟎: 𝝈 𝟐 𝑿 = 𝝈 𝟐 𝒀 ale testujeme 𝝈 𝟐 𝑿 𝝈 𝟐 𝒀 = 1 alternativa 𝑯 𝟏: 𝝈 𝟐 𝑿 ≠ 𝝈 𝟐 𝒀 Testová statistika: 𝑭 = 𝑆 𝑋 2 𝜎 𝑋 2 𝑆 𝑌 2 𝜎 𝑌 2 = 𝑆 𝑋 2 𝜎 𝑋 2 ∙ 𝜎 𝑌 2 𝑆 𝑌 2 = 𝑆 𝑋 2 𝑆 𝑌 2 ∙ 𝜎 𝑌 2 𝜎 𝑋 2 = 𝐻0 𝑺 𝑿 𝟐 𝑺 𝒀 𝟐 ~ 𝑯 𝟎 𝑭 𝒏 𝑿−𝟏,𝒏 𝒀−𝟏 Histogram of multiple variables kojeni podle KLUKa.sta 11v*99c deK = 49*1*Normal(Location=68,8163; Scale=3,751) delkaD = 50*1*Normal(Location=68,28; Scale=2,7482) cm CH cm D62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 0 2 4 6 8 10 12 Noofobs deK: SW-W = 0,9658; p = 0,1640 delkaD: SW-W = 0,9609; p = 0,0972 Dva výběry: Porovnání variancí Porovnání středních hodnot Porovnání dvou pravděpodobností F–test shody variancí Leveneův test Ansari-Bradleyův test Otázka a předpoklady Testová statistika Příklad Konfidenční interval, síla testu Za platnosti hypotézy je zlomek roven 1 Podrobnější odvození testové statistiky F: Teoreticky má být Máme: 𝑆 𝑋 2 𝜎 𝑋 2 = 1 𝜎 𝑋 2 ∙ σ 𝑖=1 𝑘 𝑋 𝑖− ത𝑋 2 𝑘−1 = 1 𝑘−1 ∙ σ 𝑖=1 𝑘 𝑋 𝑖− ത𝑋 2 𝜎 𝑋 2 = 1 𝑘−1 ∙ σ𝑖=1 𝑘 𝑋 𝑖− ത𝑋 𝜎 𝑋 2 Podobně pro S2 Y . Proto má test. statistika F-rozdělení s (k-1) a (m-1) stupni volnosti: s (nX-1) a (nY-1) 𝑉𝑖 ~ 𝑁 0,1 a tedy σ𝒊=𝟏 𝒌 𝑽𝒊 𝟐 ~ 𝝌 𝟐 𝒌 𝑭 = σ𝒊=𝟏 𝒌 𝑽𝒊 𝟐 𝒌 σ𝒋=𝟏 𝒎 𝑾𝒋 𝟐 𝒎 𝑊𝑗 ~ 𝑁 0,1 a tedy σ𝒋=𝟏 𝒎 𝑾𝒋 𝟐 ~ 𝝌 𝟐 𝒎 ~ 𝑁(0,1)Jeden stupeň volnosti ztrácím odhadem 𝜇 𝑋 = ത𝑋 𝑭 = 𝑆 𝑋 2 𝜎 𝑋 2 𝑆 𝑌 2 𝜎 𝑌 2 ~ 𝐹 𝑘−1, 𝑚−1 Dva výběry: Porovnání variancí Porovnání středních hodnot Porovnání dvou pravděpodobností F–test shody variancí: Leveneův test Ansari-Bradleyův test Otázka a předpoklady Testová statistika Příklad Konfidenční interval, síla testu Dva výběry: F-test shody variancí Testová statistika: 𝑭 = 𝑺 𝑿 𝟐 𝑺 𝒀 𝟐 ~ 𝑯 𝟎 𝑭 𝒏 𝑿−𝟏,𝒏 𝒀−𝟏 Kritérium: typicky uvažujeme oboustrannou alternativu 𝑯 𝟏: 𝝈 𝟐 𝑿 ≠ 𝝈 𝟐 𝒀, zajímá nás jen otázka shody či neshody variancí. Proti nulové hypotéze svědčí dvě situace: buď 𝑺 𝟐 𝑿 ≫ 𝑺 𝟐 𝒀 a 𝑭 = 𝑺 𝑿 𝟐 𝑺 𝒀 𝟐 leží na pravém chvostu, srovnám s 𝑭 𝒇𝟏,𝒇𝟐 𝟏 − 𝜶 𝟐 nebo 𝑺 𝟐 𝑿 ≪ 𝑺 𝟐 𝒀 a 𝑭 = 𝑺 𝑿 𝟐 𝑺 𝒀 𝟐 leží na levém chvostu, srovnám s 𝑭 𝒇𝟏,𝒇𝟐 𝜶 𝟐 tedy buď 𝑷 𝑭 ≥ 𝑭 𝒇𝟏,𝒇𝟐 𝟏 − 𝜶 𝟐 = 𝜶 𝟐 nebo 𝑷 𝑭 ≤ 𝑭 𝒇𝟏,𝒇𝟐 𝜶 𝟐 = 𝜶 𝟐 F-rozdělení není souměrné, ale platí, že 𝑷 𝑭 ≤ 𝑭 𝒇𝟏,𝒇𝟐 𝜶 𝟐 = 𝑷 𝟏 𝑭 ≥ 𝑭 𝒇𝟐, 𝒇𝟏 𝟏 − 𝜶 𝟐 = 𝜶 𝟐 Proto kritérium zní: 𝐹 = 𝑣ě𝑡ší 𝑧 𝑜𝑑ℎ𝑎𝑑ů 𝑟𝑜𝑧𝑝𝑡𝑦𝑙𝑢 𝑚𝑒𝑛ší 𝑧 𝑜𝑑ℎ𝑎𝑑ů 𝑟𝑜𝑧𝑝𝑡𝑦𝑙𝑢 ≥ 𝑭č𝒊𝒕𝒂𝒕,𝒋𝒎𝒆𝒏𝒐𝒗 1 − 𝛼 2 Dva výběry: Porovnání variancí Porovnání středních hodnot Porovnání dvou pravděpodobností F–test shody variancí: Leveneův test Ansari-Bradleyův test Otázka a předpoklady Testová statistika Příklad Konfidenční interval, síla testu Dva výběry: F-test shody variancí Příklad: délky miminek ve 24. týdnu Rozlišujeme Chlapce a Dívky H0: σ2 X = σ2 Y H1: σ2 X ≠ σ2 Y R: var.test(x, y, ratio=1, alternative=c("two.sided","less", "greater"), conf.level=0.95, ...)  F test to compare two variances data: delka[Hoch == "ano"] and delka[Hoch == "ne"] F = 1.8629, num df = 48, denom df = 49, p-value = 0.03225 alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 1.054853 3.295444 sample estimates: ratio of variances 1.862886 Odhady rozptylů: 𝑆2 𝐶𝐻 = 14.07, 𝑆2 𝐷 = 7.55 Histogram of multiple variables kojeni podle KLUKa.sta 11v*99c deK = 49*1*Normal(Location=68,8163; Scale=3,751) delkaD = 50*1*Normal(Location=68,28; Scale=2,7482) cm CH cm D62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 0 2 4 6 8 10 12 Noofobs deK: SW-W = 0,9658; p = 0,1640 delkaD: SW-W = 0,9609; p = 0,0972 Numerator degrees of freedom Stupně volnosti v čitateli (nahoře) Denominator degr. of freedom St. volnosti ve jmenovateli (dole). Dva výběry: Porovnání variancí Porovnání středních hodnot Porovnání dvou pravděpodobností F–test shody variancí: Leveneův test Ansari-Bradleyův test Předpoklady a testová statistika Příklad Konfidenční interval Síla testu, poznámky Příklad: F-test shody variancí Jaký výsledek dostaneme, když zadáme proměnné v opačném pořadí? R: var.test(delka[Hoch=="ne"], delka[Hoch=="ano"])  F test to compare two variances data: delka[Hoch == "ne"] and delka[Hoch == "ano"] F = 0.5368, num df = 49, denom df = 48, p-value = 0.03225 alternative hyp.: true ratio of variances is not equal to 1 95 percent confidence interval: 0.3034493 0.9479990 sample estimates: ratio of variances 0.5368016 První zadání:  F test to compare two variances data: delka[Hoch == "ano"] and delka[Hoch == "ne"] F = 1.8629, num df = 48, denom df = 49, p-value = 0.03225 alternative hyp.: true ratio of variances is not equal to 1 95 percent confidence interval: 1.054853 3.295444 sample estimates: ratio of variances 1.862886 14.07 7.55 = 1.86 7.55 14.07 = 1 1.86 = 0.538 𝐹49, 48 0.025 = 0.566 𝐹48, 49 0.975 = 1.766 Dva výběry: Porovnání variancí Porovnání středních hodnot Porovnání dvou pravděpodobností F–test shody variancí: Leveneův test Ansari-Bradleyův test Předpoklady a testová statistika Příklad Konfidenční interval Síla testu, poznámky Příklad: F-test shody variancí STAT: test shody variancí provádí v rámci t-testu rovnosti středních hodnot Statistiky  Základní statistiky  t-test, nezávislé, dle skupin (dle proměn.) Dva výběry: Porovnání variancí Porovnání středních hodnot Porovnání dvou pravděpodobností F–test shody variancí: Leveneův test Ansari-Bradleyův test Předpoklady a testová statistika Příklad Konfidenční interval Síla testu, poznámky Konfidenční interval pro poměr variancí 𝝈 𝟐 𝑿 𝝈 𝟐 𝒀 Je nesouměrný, protože F-rozdělení je nesouměrné: 𝐹𝑛 𝑋−1,𝑛 𝑌−1 𝛼 2 ≤ 𝑺 𝟐 𝑿 𝑺 𝟐 𝒀 ∙ 𝝈 𝟐 𝒀 𝝈 𝟐 𝑿 ≤ 𝐹𝑛 𝑋−1,𝑛 𝑌−1 1 − 𝛼 2 zapracujeme znalost 𝑷 𝑭 ≤ 𝑭 𝒇𝟏,𝒇𝟐 𝜶 𝟐 = 𝑷 𝟏 𝑭 ≥ 𝑭 𝒇𝟐,𝒇𝟏 𝟏 − 𝜶 𝟐 𝐹𝑛 𝑌−1,𝑛 𝑋−1 1 − 𝛼 2 ≥ 𝑺 𝟐 𝒀 𝑺 𝟐 𝑿 ∙ 𝝈 𝟐 𝑿 𝝈 𝟐 𝒀 ≥ 𝐹𝑛 𝑌−1,𝑛 𝑋−1 𝛼 2 Uspořádáme logicky menší < větší a převedeme poměr odhadů rozptylů: 𝑭 𝒏 𝒀−𝟏,𝒏 𝑿−𝟏 𝜶 𝟐 ∙ 𝑺 𝟐 𝑿 𝑺 𝟐 𝒀 ≤ 𝝈 𝟐 𝑿 𝝈 𝟐 𝒀 ≤ 𝑭 𝒏 𝒀−𝟏,𝒏 𝑿−𝟏 𝟏 − 𝜶 𝟐 ∙ 𝑺 𝟐 𝑿 𝑺 𝟐 𝒀 Ad příklad: 0.566 * 1.863 ≤ var(X)/ var(Y) ≤ 1.766 * 1.863 1.055 ≤ var(X)/ var(Y) ≤ 3.295 … nepokrývá 1, H0 zamítáme Dva výběry: Porovnání variancí Porovnání středních hodnot Porovnání dvou pravděpodobností F–test shody variancí: Leveneův test Ansari-Bradleyův test Předpoklady a testová statistika Příklad Konfidenční interval Síla testu, poznámky F-test shody variancí – další poznámky • Pokud nezamítám H0 (rozptyly jsou shodné), počítám odhad společného rozptylu [pooled variance] takto: 𝑆2 = σ𝑖=1 𝑛 𝑋 𝑋𝑖 − ത𝑋 2 + σ 𝑗=1 𝑛 𝑌 𝑌𝑗 − ത𝑌 2 𝑛 𝑋 + 𝑛 𝑌 − 2 = 𝑛 𝑋 − 1 𝑆 𝑋 2 + 𝑛 𝑌 − 1 𝑆 𝑌 2 𝑛 𝑋 + 𝑛 𝑌 − 2 • F-test je dost slabý test, zvláště při malých četnostech výběrů. Uvažte, že pro výběry velikosti 10 (běžné počty v biologii) srovnáváme statistiku F s kvantilem F9, 9 (0.975) = 4.026, tzn. že musí být SX 2 > 4*SY 2, čtyřikrát větší, aby test zamítnul H0. Proto je pravděpod. β chyby 2. druhu velká. • Excel (verze 2010, modul Analýza dat) udává p-hodnotu jednostranného testu. Skutečná p-hodnota testové statistiky je dvojnásobná! Excel počítá 𝑃 𝑛áℎ. 𝑣𝑒𝑙. ≥ 𝑺 𝟐 𝑿 𝑺 𝟐 𝒀 = 𝑝, ale musím přidat také „druhý chvost“. Dva výběry: Porovnání variancí Porovnání středních hodnot Porovnání dvou pravděpodobností F–test shody variancí: Leveneův test Ansari-Bradleyův test Předpoklady a testová statistika Příklad Konfidenční interval Síla testu, poznámky Další testy shody variancí Leveneův test – bude u analýzy rozptylu; pracuje s odchylkami od průměrů (nebo lépe mediánů). Předpokládá normální rozdělení dat. STAT: volitelný test v záložce Možnosti při definování t-testu. R: balík car (Companion to Applied Regression), funkce leveneTest(x, y, …) Brown & Forsythe test – modifikace Leveneova testu na mediány, takto je test robustnější vůči odchylce od normálního rozdělení dat. STAT: tamtéž. Ansari-Bradleyův dvouvýběrový test - pořadový test, neparametrický. Testuje hodnotu s, což je zde poměr směrodatných odchylek (scales). R: ansari.test(x, y, …) R obsahuje také Moodyho test, který je ovšem komentován takto: „existují užitečnější testy pro tento problém“  Dva výběry: Porovnání variancí Porovnání středních hodnot Porovnání dvou pravděpodobností F–test shody variancí Leveneův test Ansari-Bradleyův test Dva výběry: t-test shody průměrů Předpoklady testu: • (X1, X2, …, Xk) a (Y1, Y2, …, Ym) všechno nezávislé • 𝑿𝒊 ~ 𝑵(𝝁 𝑿, 𝝈 𝑿 𝟐), 𝒀𝒊 ~ 𝑵(𝝁 𝒀, 𝝈 𝒀 𝟐), parametry neznáme. • výběry mají stejnou varianci, liší se tedy jen posunutím střední hodnoty; 𝝈 𝑿 𝟐 = 𝝈 𝒀 𝟐 ozn. 𝝈 𝟐 • pokud předpoklad stejných rozptylů není splněn, máme Welchův test (dále) Hypotéza: 𝑯 𝟎: 𝝁 𝑿 = 𝝁 𝒀 testujeme 𝜇 𝑋 − 𝜇 𝑌 = 0 alternativa 𝑯 𝟏: 𝝁 𝑿 ≠ 𝝁 𝒀 t–test shody průměrů Welchovo přibližné t Wilcoxonův dvouvýběrový test Mannův-Whitneyův test Předpoklady a hypotéza Testová statistika Poznámky Příklady Histogram of multiple variables kojeni podle KLUKa.sta 11v*99c deK = 49*1*Normal(Location=68,8163; Scale=3,751) delkaD = 50*1*Normal(Location=68,28; Scale=2,7482) cm CH cm D62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 0 2 4 6 8 10 12 Noofobs deK: SW-W = 0,9658; p = 0,1640 delkaD: SW-W = 0,9609; p = 0,0972 Histogram of multiple variables kojeni podle KLUKa.sta 11v*99c hmK = 49*500*Normal(Location=7928,5714; Scale=850,1127) hmD = 50*500*Normal(Location=7455,26; Scale=779,2897) gr CH gr D5000 5500 6000 6500 7000 7500 8000 8500 9000 9500 10000 10500 0 2 4 6 8 10 12 14 Noofobs hmK: SW-W = 0,9885; p = 0,9107 hmD: SW-W = 0,9843; p = 0,7391 Dva výběry: Porovnání variancí Porovnání středních hodnot Porovnání dvou pravděpodobností Dva výběry: t-test shody průměrů Hypotéza: 𝑯 𝟎: 𝝁 𝑿 = 𝝁 𝒀 testujeme 𝜇 𝑋 − 𝜇 𝑌 = 0 alternativa 𝑯 𝟏: 𝝁 𝑿 ≠ 𝝁 𝒀 Použijeme odhad: 𝑆2 = σ 𝑖=1 𝑛 𝑋 𝑋 𝑖− ത𝑋 2+ σ 𝑗=1 𝑛 𝑌 𝑌 𝑗−ത𝑌 2 𝑛 𝑋+𝑛 𝑌−2 = 𝑛 𝑋−1 𝑆 𝑋 2 + 𝑛 𝑌−1 𝑆 𝑌 2 𝑛 𝑋+𝑛 𝑌−2 Odhad pro společný rozptyl [pooled variance] Testová statistika: 𝑻 = ഥ𝑿 − ഥ𝒀 − 𝟎 𝑺. 𝑬. (ഥ𝑿 − ഥ𝒀) = ഥ𝑿 − ഥ𝒀 𝑺 𝒏 𝑿 𝒏 𝒀 𝒏 𝑿 + 𝒏 𝒀 ~ 𝑯 𝟎 𝒕 𝒏 𝑿+𝒏 𝒀−𝟐 Kritéria podle H1: 𝜇 𝑋 ≠ 𝜇 𝑌 → 𝑻 ≥ 𝒕 𝒏 𝑿+𝒏 𝒀−𝟐 𝟏 − Τ𝜶 𝟐 𝜇 𝑋 > 𝜇 𝑌 → 𝑻 ≥ 𝒕 𝒏 𝑿+𝒏 𝒀−𝟐 𝟏 − 𝜶 𝜇 𝑋 < 𝜇 𝑌 → 𝑻 ≤ 𝒕 𝒏 𝑿+𝒏 𝒀−𝟐 𝜶 = −𝒕 𝒏 𝑿+𝒏 𝒀−𝟐 𝟏 − 𝜶 čti: má za platnosti hypotézy H0 rozdělení … Dva výběry: Porovnání variancí Porovnání středních hodnot Porovnání dvou pravděpodobností t–test shody průměrů Welchovo přibližné t Wilcoxonův dvouvýběrový test Mannův-Whitneyův test Předpoklady a hypotéza Testová statistika Poznámky Příklady Pro zájemce odvození rovnosti 𝑆. 𝐸. ത𝑋 − ത𝑌 = 𝑆 ∙ 𝑛 𝑋+𝑛 𝑌 𝑛 𝑋 𝑛 𝑌 , tedy 𝒗𝒂𝒓 ഥ𝑿 − ഥ𝒀 = 𝒏 𝑿+𝒏 𝒀 𝒏 𝑿 𝒏 𝒀 𝑺 𝟐  𝒗𝒂𝒓 ഥ𝑿 − ഥ𝒀 = 𝐸 ത𝑋 − ത𝑌 − 𝐸 ത𝑋 − ത𝑌 2 = 𝐸 ത𝑋 − 𝐸 ത𝑋 − ത𝑌 + 𝐸 ത𝑌 2 = 𝐸 ( ത𝑋 − 𝐸 ത𝑋) − (ത𝑌 − 𝐸 ത𝑌) 2 = 𝐸ሼ( ത𝑋 − 𝐸 ത𝑋)2 −2 ∙ ത𝑋 − 𝐸 ത𝑋 ത𝑌 − 𝐸 ത𝑌 + Dva výběry: Porovnání variancí Porovnání středních hodnot Porovnání dvou pravděpodobností t–test shody průměrů Welchovo přibližné t Wilcoxonův dvouvýběrový test Mannův-Whitneyův test Předpoklady a hypotéza Testová statistika Poznámky Příklady • Všimněte si rozdílu proti párovému t-testu: Párový t-test H0: 𝝁 𝑿 = 𝝁 𝒀 a počítám 𝑿𝒊 = 𝑼𝒊 − 𝑽𝒊 … průměr rozdílů, tj. má smysl počítat rozdíl v páru pozorování Dvouvýběrový H0: 𝝁 𝑿 = 𝝁 𝒀 (H0 stejná) ഥ𝑿 − ഥ𝒀 … rozdíl průměrů Zde není žádný vztah mezi 𝑋𝑖 a 𝑌𝑖, navíc počet 𝒏 𝑿 a 𝒏 𝒀 se může lišit. • t-test je celkem robustní vůči narušení předpokladů, zvlášť pokud máme dostatek pozorování a výběry jsou zhruba stejně početné (uplatní se CLV). PŘESTO je-li podezření na nestejnost variancí (normálního rozdělení) nebo se 𝒏 𝑿 a 𝒏 𝒀 značně liší, použijeme lépe Welchův přibližný t-test: 𝑻 = ഥ𝑿 − ഥ𝒀 − 𝟎 𝑺 𝑿 𝟐 𝒏 𝑿 + 𝑺 𝒀 𝟐 𝒏 𝒀 ~ 𝑯 𝟎 𝒕 𝒇 , 𝑘𝑑𝑒 𝑓 = 𝑆 𝑋 2 𝑛 𝑋 + 𝑆 𝑌 2 𝑛 𝑌 2 𝑆 𝑋 2 𝑛 𝑋 2 𝑛 𝑋 − 1 + 𝑆 𝑌 2 𝑛 𝑌 2 𝑛 𝑌 − 1 Počet stupňů volnosti f může být i desetinné číslo! Rozdělení testové statistiky známe jen přibližně, proto také p-hodnota je jen přibližná. Dva výběry: Porovnání variancí Porovnání středních hodnot Porovnání dvou pravděpodobností t–test shody průměrů Welchovo přibližné t Wilcoxonův dvouvýběrový test Mannův-Whitneyův test Předpoklady a hypotéza Testová statistika Poznámky Příklady T-test - zadání v softwaru: STAT: Statistiky  Základní statistiky  t-test, nezávislé, dle skupin nebo  t-test, nezávislé, dle proměnných Welchův test: v záložce Možnosti zvolit test se samostatnými odhady rozptylu (Test with separate variance estimates). R: t.test(x, y, alternative=c("two.sided","less", "greater"), mu=0, paired=FALSE, var.equal=FALSE, conf.level=0.95, ...) t.test(měření ~ skupiny, data, subset, …) Přednastavené nestejné rozptyly, počítá rovnou Welchův přibližný test. Dva výběry: Porovnání variancí Porovnání středních hodnot Porovnání dvou pravděpodobností t–test shody průměrů Welchovo přibližné t Wilcoxonův dvouvýběrový test Mannův-Whitneyův test Předpoklady a hypotéza Testová statistika Poznámky Příklady t-test – příklad první: Délka miminek ve 24. týdnu Rozlišujeme Chlapce a Dívky H0: μX = μY H1: μX ≠ μY Předpoklady: Normalita slušná, navíc máme dost pozorování v obou skupinách (49 a 50). Variance se různí  Welchův přibližný t-test. STAT: Zde zadání „dle proměnných“. Histogram of multiple variables kojeni podle KLUKa.sta 11v*99c deK = 49*1*Normal(Location=68,8163; Scale=3,751) delkaD = 50*1*Normal(Location=68,28; Scale=2,7482) cm CH cm D62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 0 2 4 6 8 10 12 Noofobs deK: SW-W = 0,9658; p = 0,1640 delkaD: SW-W = 0,9609; p = 0,0972 Welchovo t zde pokračování horní tabulky Dva výběry: Porovnání variancí Porovnání středních hodnot Porovnání dvou pravděpodobností t–test shody průměrů Welchovo přibližné t Wilcoxonův dvouvýběrový test Mannův-Whitneyův test Předpoklady a hypotéza Testová statistika Poznámky Příklady t-test – příklad první: Délka miminek ve 24. týdnu Rozlišujeme Chlapce a Dívky H0: μX = μY H1: μX ≠ μY Předpoklady: Normalita slušná, navíc máme dost pozorování v obou skupinách (49 a 50). Variance se různí  Welchův přibližný t-test. R: t.test(delka ~ Hoch, data=kojeni, var.equal=FALSE) Welch Two Sample t-test data: delka by Hoch t = 0.81021, df = 87.945, p-value = 0.42 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -0.7791904 1.8518435 sample estimates: mean in group ano mean in group ne 68.81633 68.28000 Histogram of multiple variables kojeni podle KLUKa.sta 11v*99c deK = 49*1*Normal(Location=68,8163; Scale=3,751) delkaD = 50*1*Normal(Location=68,28; Scale=2,7482) cm CH cm D62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 0 2 4 6 8 10 12 Noofobs deK: SW-W = 0,9658; p = 0,1640 delkaD: SW-W = 0,9609; p = 0,0972 Nezamítám hypotézu o shodných průměrech Dva výběry: Porovnání variancí Porovnání středních hodnot Porovnání dvou pravděpodobností t–test shody průměrů Welchovo přibližné t Wilcoxonův dvouvýběrový test Mannův-Whitneyův test Předpoklady a hypotéza Testová statistika Poznámky Příklady t-test – příklad druhý: Hmotnost miminek ve 24. týdnu Rozlišujeme Chlapce a Dívky H0: μX = μY H1: μX ≠ μY Předpoklady: Normalita výborná, navíc máme dost pozorování v obou skupinách (49 a 50). STAT: Zadání „dle skupin“. Zamítám hypotézu o shodných průměrech Histogram z více proměnných kojeni podle KLUKa.sta 11v*99c hmK = 49*500*normal(x; 7928,5714; 850,1127) hmD = 50*500*normal(x; 7455,26; 779,2897) gr CH gr D 5000 5500 6000 6500 7000 7500 8000 8500 9000 9500 10000 10500 0 2 4 6 8 10 12 14 Početpozorování hmK: SW-W = 0,9885; p = 0,9107 hmD: SW-W = 0,9843; p = 0,7391 Dva výběry: Porovnání variancí Porovnání středních hodnot Porovnání dvou pravděpodobností t–test shody průměrů Welchovo přibližné t Wilcoxonův dvouvýběrový test Mannův-Whitneyův test Předpoklady a hypotéza Testová statistika Poznámky Příklady t-test – příklad druhý: Hmotnost miminek ve 24. týdnu Rozlišujeme Chlapce a Dívky H0: μX = μY H1: μX ≠ μY Předpoklady: Normalita výborná, navíc máme dost pozorování v obou skupinách (49 a 50). R: var.test(hmotnost~Hoch,data=kojeni) F test to compare two variances data: hmotnost by Hoch F = 1.19, num df = 48, denom df = 49, p-value = 0.5462 … variance OK t.test(hmotnost ~ Hoch, data=kojeni, var.equal=TRUE) Two Sample t-test data: hmotnost by Hoch t = 2.8887, df = 97, p-value = 0.004772 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: 148.1130 798.5098 sample estimates: mean in group ano mean in group ne 7928.571 7455.260 Zamítám hypotézu o shodných průměrech Histogram z více proměnných kojeni podle KLUKa.sta 11v*99c hmK = 49*500*normal(x; 7928,5714; 850,1127) hmD = 50*500*normal(x; 7455,26; 779,2897) gr CH gr D 5000 5500 6000 6500 7000 7500 8000 8500 9000 9500 10000 10500 0 2 4 6 8 10 12 14 Početpozorování hmK: SW-W = 0,9885; p = 0,9107 hmD: SW-W = 0,9843; p = 0,7391 Dva výběry: Porovnání variancí Porovnání středních hodnot Porovnání dvou pravděpodobností t–test shody průměrů Welchovo přibližné t Wilcoxonův dvouvýběrový test Mannův-Whitneyův test Předpoklady a hypotéza Testová statistika Poznámky Příklady Neparametrický test rovnosti středních hodnot Mannův-Whitneyův test alias dvouvýběrový Wilcoxonův test Předpoklady: (X1, X2, …, Xk) a (Y1, Y2, …, Ym) všechno nezávislé ze spojitého rozdělení. Nulová hypotéza: rozdělení pravděpodobností náh. veličin X a Y je stejné (tedy ani posunutí, ani velký rozdíl ve variabilitě)  Za platnosti nulové hypotézy jsou stejné i populační mediány Princip Wilcoxonova pořadového testu: Sesypeme oba výběry dohromady a hodnoty seřadíme (neřešíme +/- jako u párového testu). Když platí H0, měly by se zhruba pravidelně střídat hodnoty z X a z Y. Součet pořadí by tedy měl být srovnatelný, zhruba polovina z (𝑛 𝑥+𝑛 𝑌)∙(𝑛 𝑥+𝑛 𝑌+1) 2 , tedy (𝑛 𝑥+𝑛 𝑌)∙(𝑛 𝑥+𝑛 𝑌+1) 4 . Protože ale velikosti výběrů nX a nY nemusí být stejné, musím spočtený součet porovnávat s poměrnou částí celého součtu, viz dále: Dva výběry: Porovnání variancí Porovnání středních hodnot Porovnání dvou pravděpodobností t–test shody průměrů Welchovo přibližné t Wilcoxonův dvouvýběrový test Mannův-Whitneyův test Předpoklady, hypotéza, princip Testová statistika Poznámky Příklad Dvouvýběrový Wilcoxonův test Princip Wilcoxonova pořadového testu:  𝑾 𝑿 = σ𝒊=𝟏 𝒏 𝑿 𝑹 𝑿𝒊 … součet pořadí hodnot z výběru X  𝑾 𝒀 = σ𝒋=𝟏 𝒏 𝒀 𝑹 𝒀𝒋 … součet pořadí hodnot z výběru Y  Součet všech pořadí: 𝑾 𝑿 + 𝑾 𝒀 = (𝒏 𝒙+𝒏 𝒀)∙(𝒏 𝒙+𝒏 𝒀+𝟏) 𝟐  Za platnosti H0 je očekávaný součet 𝑬𝑾 𝑿 = 𝒏 𝒙 𝒏 𝒙 + 𝒏 𝒀 (𝒏 𝒙 + 𝒏 𝒀) ∙ (𝒏 𝒙 + 𝒏 𝒀 + 𝟏) 𝟐 = 𝒏 𝒙 ∙ (𝒏 𝒙 + 𝒏 𝒀 + 𝟏) 𝟐 𝒗𝒂𝒓 𝑾 𝑿 = 𝒏 𝒙 ∙ 𝒏 𝒀 ∙ (𝒏 𝒙 + 𝒏 𝒀 + 𝟏) 𝟏𝟐  Při větším množství shod v pořadí ještě úprava výběrového rozptylu…  Pro menší rozsahy výběrů nX a nY lze počítat přesné pravděpodobnosti, pro větší n se používá aproximace normálním rozdělením. Poměrná část vůči celkovému počtu hodnot Dva výběry: Porovnání variancí Porovnání středních hodnot Porovnání dvou pravděpodobností t–test shody průměrů Welchovo přibližné t Wilcoxonův dvouvýběrový test Mannův-Whitneyův test Předpoklady, hypotéza, princip Testová statistika Poznámky Příklad ~ multinomické rozdělení Dvouvýběrový Mannův-Whitneyův test Test je založen na zdánlivě jiné myšlence: porovnává všechny možné dvojice (Xi, Yj) a počítá, v kolika případech je hodnota X menší než Y. Jsou-li distribuce veličin srovnatelné (H0), bude to zhruba polovina dvojic.  Označme 𝑼 𝑿 počet dvojic, kde 𝑿𝒊 < 𝒀𝒋 , 𝑼 𝑿 ~ 𝑯 𝟎 𝑩𝒊(𝒏 𝑿 ∙ 𝒏 𝒀, 𝟎. 𝟓)  Označme 𝑼 𝒀 počet dvojic, kde 𝑿𝒊 > 𝒀𝒋  Případy 𝑿𝒊 = 𝒀𝒋 započítáme polovinou k UX a polovinou k UY  Kritický obor je zpravidla popisován pomocí 𝑈 = min(𝑈 𝑋, 𝑈 𝑌).  Tyto rovnice ukazují souvislost mezi testovými statistikami: 𝑾 𝑿 = 𝒏 𝒙 𝒏 𝒀 + 𝒏 𝒙∙(𝒏 𝒙+𝟏) 𝟐 − 𝑼 𝑿 𝑾 𝒀 = 𝒏 𝒙 𝒏 𝒀 + 𝒏 𝒀∙(𝒏 𝒀+𝟏) 𝟐 − 𝑼 𝒀 Dva výběry: Porovnání variancí Porovnání středních hodnot Porovnání dvou pravděpodobností t–test shody průměrů Welchovo přibližné t Wilcoxonův dvouvýběrový test Mannův-Whitneyův test Předpoklady, hypotéza, princip Testová statistika Poznámky Příklad Poznámky k Mann-Whitneyovu U testu a Wilcoxonovu testu • Oba testy prověřují nulovou hypotézu o shodě rozdělení, ze kterého pocházejí porovnávané výběry. Pokud testujeme nulovou hypotézu o shodě polohy (mediánu), musíme předpokládat, že se distribuce příliš neliší tvarem. • Statistika U zahrnuje úpravu pro shody v pořadí (tied values). • Uvádí se, že pro výběry početnější než 20 pozorování se rozdělení U statistiky rychle blíží normálnímu rozdělení, proto je ve výsledcích testů také Z statistika a Z statistika s opravou na spojitost (Yatesova korekce). • Zároveň je pro menší n spočtena přesná (exact) pravděpodobnost, že náhodná veličina bude větší než spočtená statistika U, tedy prst. na pravém chvostu. Tato p-hodnota je vynásobena *2, což odpovídá pravděpodobnosti oboustranné alternativní hypotézy. Nicméně ve výpočtu není zahrnuta oprava na shody v pořadí, proto R takovou zkreslenou „exact“ pravděpodobnost vůbec nenabízí. Dva výběry: Porovnání variancí Porovnání středních hodnot Porovnání dvou pravděpodobností t–test shody průměrů Welchovo přibližné t Wilcoxonův dvouvýběrový test Mannův-Whitneyův test Předpoklady, hypotéza, princip Testová statistika Poznámky Příklad Neparametrické dvouvýběrové testy v softwaru: STAT: Statistiky  Neparametrické statistiky  Porovnání dvou nezávislých vzorků (skupiny) tzn. data musí být uspořádány jako hodnoty (Var1) a kódování (Var2) Nabídka: Wald-Wolfowitz runs test – testuje rozdíly ve tvaru distribuční funkce, nedá se interpretovat přímo na posunutí středních hodnot. Kolmogorov-Smirnov dvouvýběrový test – totéž Mann-Whitney U test – může být interpretován stejně jako t-test, tedy jako test shody (nebo posunutí) středních hodnot. Yatesova korekce na spojitost – pro velké rozsahy výběrů vypnout. Dva výběry: Porovnání variancí Porovnání středních hodnot Porovnání dvou pravděpodobností t–test shody průměrů Welchovo přibližné t Wilcoxonův dvouvýběrový test Mannův-Whitneyův test Předpoklady, hypotéza, princip Testová statistika Poznámky Příklad Mann-Whitney alias Wilcoxon - příklad: Příklad: data o délce kojení (v týdnech) a záznam, zda bylo dítě do 30 minut po porodu přiloženo k prsu. Z výběru byly „uříznuty“ údaje „24 týdnů“, protože toto číslo zahrnuje všechny matky, které kojily ve 24. týdnu, ale neříkají nic o tom, jak dlouho ještě kojily po tomto datu. R: wilcox.test(x, y, alternative= c("two.sided","less","greater"), mu=0, paired=FALSE, exact=NULL, correct=TRUE, conf.int=FALSE, conf.level=0.95, ...) Pozn. STAT a R se v číslech zcela neshodnou… Histogram z více proměnných kojeni podle Prsu.sta 10v*99c trvANO censored = 33*1*normal(x; 12,1818; 5,6924) trvNE censored = 38*1*normal(x; 9,3421; 6,2484) trvANO censored trvNE censored0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 0 1 2 3 4 5 6 7 8 Početpozorování Dva výběry: Porovnání variancí Porovnání středních hodnot Porovnání dvou pravděpodobností t–test shody průměrů Welchovo přibližné t Wilcoxonův dvouvýběrový test Mannův-Whitneyův test Předpoklady, hypotéza, princip Testová statistika Poznámky Příklad Mediánový test Existuje, je však velmi slabý. Dva výběry: Porovnání variancí Porovnání středních hodnot Porovnání dvou pravděpodobností t–test shody průměrů Welchovo přibližné t Wilcoxonův dvouvýběrový test Mannův-Whitneyův test Porovnání dvou pravděpodobností tj. mám data o dvou znacích nominální proměnné a ptám se, zda se dva výběry shodnou v pravděpodobnosti, že nastane znak A. Toto odpovídá čtyřpolní kontingenční tabulce. (je-li sledovaných znaků více, testuji obecnou kontingenční tabulku) Předpoklad: mám dvě série vzájemně nezávislých pokusů, ve kterých zjišťuji, zda nastal znak (jev) A. Prst. znaku A v jedné sérii je stejný. • Y1 = počet pokusů, kdy nastal znak A v první sérii (celkem n1) • Y2 = počet pokusů, kdy nastal znak A ve druhé sérii (celkem n2) • 𝒀 𝟏~𝑩𝒊 𝒏 𝟏, 𝒑 𝟏 𝒀 𝟐~𝑩𝒊(𝒏 𝟐, 𝒑 𝟐) Nulová hypotéza: obě pravděpodobnosti jsou shodné, 𝒑 𝟏 = 𝒑 𝟐 = 𝒑 Odhady: ෝ𝒑 𝟏 = 𝒀 𝟏 𝒏 𝟏 ෝ𝒑 𝟐 = 𝒀 𝟐 𝒏 𝟐 𝒗𝒂𝒓 ෝ𝒑 𝟏 − ෝ𝒑 𝟐 = 𝒑 𝟏∙(𝟏−𝒑 𝟏) 𝒏 𝟏 + 𝒑 𝟐∙(𝟏−𝒑 𝟐) 𝒏 𝟐 = 𝑯 𝟎 𝒑 ∙ (𝟏 − 𝒑) ∙ 𝟏 𝒏 𝟏 + 𝟏 𝒏 𝟐 Dva výběry: Porovnání variancí Porovnání středních hodnot Porovnání dvou pravděpodobností Dvě pravděpodobnosti binomického rozdělení Binomický test Aproximace normálním rozdělením Chí-kvadrát test Porovnání dvou pravděpodobností 𝒀 𝟏~𝑩𝒊 𝒏 𝟏, 𝒑 𝟏 𝒀 𝟐~𝑩𝒊(𝒏 𝟐, 𝒑 𝟐) Nulová hypotéza: obě pravděpodobnosti jsou shodné, 𝒑 𝟏 = 𝒑 𝟐 = 𝒑 Testovat můžeme trojím způsobem: 1) Přesný binomický test  R: binom.test 2) Přibližný test přes aproximaci normálním rozdělením 𝑍 = ෝ𝒑 𝟏−ෝ𝒑 𝟐 𝑆.𝐸.(ෝ𝒑 𝟏−ෝ𝒑 𝟐) = ෝ𝒑 𝟏−ෝ𝒑 𝟐 ො𝑝(1− ො𝑝) 𝟏 𝒏 𝟏 + 𝟏 𝒏 𝟐 ~ 𝑁(0,1) STAT: Statistiky Základní statistiky  Testy rozdílů 3) Chí-kvadrát test R: prop.test chisq.test STAT: Statistiky Neparametrické statistiky  2x2 tabulky Dva výběry: Porovnání variancí Porovnání středních hodnot Porovnání dvou pravděpodobností Dvě pravděpodobnosti binomického rozdělení Binomický test Aproximace normálním rozdělením Chí-kvadrát test