Dva výběry . Dva výběry: Porovnání variancí Porovnání středních hodnot Porovnání dvou pravděpodobností Příklady různých výběrů Dva výběry: F-test shody variancí [homogeneity of variances] Předpoklady testu: • (X1, X2, …, Xk) a (Y1, Y2, …, Ym) všechno nezávislé; 𝑛 𝑋 = 𝑘, 𝑛 𝑌 = 𝑚 • 𝑿𝒊 ~ 𝑵(𝝁 𝑿, 𝝈 𝑿 𝟐 ), 𝒀𝒊 ~ 𝑵(𝝁 𝒀, 𝝈 𝒀 𝟐 ), parametry neznáme. Hypotéza: 𝑯 𝟎: 𝝈 𝑿 𝟐 = 𝝈 𝒀 𝟐 ale testujeme 𝝈 𝑿 𝟐 𝝈 𝒀 𝟐 = 1 alternativa 𝑯 𝟏: 𝝈 𝑿 𝟐 ≠ 𝝈 𝒀 𝟐 Testová statistika: 𝑭 = 𝑺 𝑿 𝟐 𝑺 𝒀 𝟐 má za platnosti H0 rozdělení 𝑭 𝒏 𝑿−𝟏,𝒏 𝒀−𝟏 Dva výběry: Porovnání variancí Porovnání středních hodnot Porovnání dvou pravděpodobností F–test shody variancí Leveneův test Ansari-Bradleyův test Otázka a předpoklady Testová statistika Příklad Konfidenční interval, síla testu Příklad fosfor: Málo Mg hodně Mg SD(fosforu): 9.4mg/kg 8.6 mg/kg Doplňkově podrobnější odvození testové statistiky F: Teoreticky má být Máme: 𝑆 𝑋 2 𝜎 𝑋 2 = 1 𝜎 𝑋 2 ∙ σ 𝑖=1 𝑘 𝑋 𝑖− ത𝑋 2 𝑘−1 = 1 𝑘−1 ∙ σ 𝑖=1 𝑘 𝑋 𝑖− ത𝑋 2 𝜎 𝑋 2 = 1 𝑘−1 ∙ σ𝑖=1 𝑘 𝑋 𝑖− ത𝑋 𝜎 𝑋 2 Podobně pro S2 Y . Dohromady: 𝑭 = 𝑺 𝑿 𝟐 𝝈 𝑿 𝟐 𝑺 𝒀 𝟐 𝝈 𝒀 𝟐 = 𝑆 𝑋 2 𝜎 𝑋 2 ∙ 𝜎 𝑌 2 𝑆 𝑌 2 = 𝑆 𝑋 2 𝑆 𝑌 2 ∙ 𝜎 𝑌 2 𝜎 𝑋 2 = 𝐻0 𝑺 𝑿 𝟐 𝑺 𝒀 𝟐 ~ 𝑯 𝟎 𝑭 𝒏 𝑿−𝟏,𝒏 𝒀−𝟏 𝑉𝑖 ~ 𝑁 0,1 a tedy σ𝒊=𝟏 𝒌 𝑽𝒊 𝟐 ~ 𝝌 𝟐 𝒌 𝑭 = σ𝒊=𝟏 𝒌 𝑽𝒊 𝟐 𝒌 σ𝒋=𝟏 𝒎 𝑾𝒋 𝟐 𝒎 𝑊𝑗 ~ 𝑁 0,1 a tedy σ𝒋=𝟏 𝒎 𝑾𝒋 𝟐 ~ 𝝌 𝟐 𝒎 ~ 𝑁(0,1)Jeden stupeň volnosti ztrácím odhadem 𝜇 𝑋 = ത𝑋 Dva výběry: Porovnání variancí Porovnání středních hodnot Porovnání dvou pravděpodobností F–test shody variancí: Leveneův test Ansari-Bradleyův test Otázka a předpoklady Testová statistika Příklad Konfidenční interval, síla testu Za platnosti hypotézy je zlomek roven 1 Dva výběry: F-test shody variancí Testová statistika: 𝑭 = 𝑺 𝑿 𝟐 𝑺 𝒀 𝟐 ~ 𝑯 𝟎 𝑭 𝒏 𝑿−𝟏,𝒏 𝒀−𝟏 Kritérium: typicky uvažujeme oboustrannou alternativu 𝑯 𝟏: 𝝈 𝟐 𝑿 ≠ 𝝈 𝟐 𝒀, zajímá nás jen otázka shody či neshody variancí. Proti nulové hypotéze svědčí dvě situace: Buď 𝑺 𝑿 𝟐 ≫ 𝑺 𝒀 𝟐 a 𝑭 = 𝑺 𝑿 𝟐 𝑺 𝒀 𝟐 leží na pravém chvostu, srovnám s 𝑭 𝒇𝟏,𝒇𝟐 𝟏 − 𝜶 𝟐 nebo 𝑺 𝑿 𝟐 ≪ 𝑺 𝒀 𝟐 a 𝑭 = 𝑺 𝑿 𝟐 𝑺 𝒀 𝟐 leží na levém chvostu, srovnám s 𝑭 𝒇𝟏,𝒇𝟐 𝜶 𝟐 Dva výběry: Porovnání variancí Porovnání středních hodnot Porovnání dvou pravděpodobností F–test shody variancí: Leveneův test Ansari-Bradleyův test Otázka a předpoklady Testová statistika Příklad Konfidenční interval, síla testu Dva výběry: F-test shody variancí Doplňkově: F-rozdělení není souměrné, ale platí, že 𝑷 𝑭 ≤ 𝑭 𝒇𝟏,𝒇𝟐 𝜶 𝟐 = 𝑷 𝟏 𝑭 ≥ 𝑭 𝒇𝟐,𝒇𝟏 𝟏 − 𝜶 𝟐 = 𝜶 𝟐 Proto někdy kritérium zní: 𝐹 = 𝑣ě𝑡ší 𝑧 𝑜𝑑ℎ𝑎𝑑ů 𝑟𝑜𝑧𝑝𝑡𝑦𝑙𝑢 𝑚𝑒𝑛ší 𝑧 𝑜𝑑ℎ𝑎𝑑ů 𝑟𝑜𝑧𝑝𝑡𝑦𝑙𝑢 ≥ 𝑭č𝒊𝒕𝒂𝒕,𝒋𝒎𝒆𝒏𝒐𝒗 1 − 𝛼 2 Dva výběry: Porovnání variancí Porovnání středních hodnot Porovnání dvou pravděpodobností F–test shody variancí: Leveneův test Ansari-Bradleyův test Otázka a předpoklady Testová statistika Příklad Konfidenční interval, síla testu Dva výběry: F-test shody variancí Příklad: obsah fosforu v listech pšenice Rozdělených podle obsahu hořčíku. H0: 𝜎 𝑚𝑔.𝑚𝑎𝑙𝑜 2 = 𝜎 𝑚𝑔.ℎ𝑜𝑑𝑛𝑒 2 H1: 𝜎 𝑚𝑔.𝑚𝑎𝑙𝑜 2 ≠ 𝜎 𝑚𝑔.ℎ𝑜𝑑𝑛𝑒 2 R: var.test(x, y, ratio=1, alternative=c("two.sided","less", "greater"), conf.level=0.95, ...)  F test to compare two variances data: fosfor$mg.malo and fosfor$mg.hodne F = 1.1933, num df = 23, denom df = 24, p-value = 0.6696 alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 0.5229178 2.7433662 sample estimates ratio of variances = 1.193335 Odhady rozptylů: 𝑆 𝑚𝑔.𝑚á𝑙𝑜 2 = 88.26, 𝑆 𝑚𝑔.ℎ𝑜𝑑𝑛ě 2 = 73.96 Numerator degrees of freedom Stupně volnosti v čitateli (nahoře) Denominator degr. of freedom St. volnosti ve jmenovateli (dole). Dva výběry: Porovnání variancí Porovnání středních hodnot Porovnání dvou pravděpodobností F–test shody variancí: Leveneův test Ansari-Bradleyův test Předpoklady a testová statistika Příklad Konfidenční interval Síla testu, poznámky Příklad: F-test shody variancí Jaký výsledek dostaneme, když zadáme proměnné v opačném pořadí? > var.test(mg.malo,mg.hodne) F test to compare two variances data: mg.malo and mg.hodne F = 1.1933, num df = 23, denom df = 24, p-value = 0.6696 95 percent confidence interval: (0.5229178 ; 2.7433662) sample estimates: ratio of variances = 1.193335 > var.test(mg.hodne,mg.malo) F test to compare two variances data: mg.hodne and mg.malo F = 0.83799, num df = 24, denom df = 23, p-value = 0.6696 95 percent confidence interval: (0.3645157; 1.9123465) sample estimates: ratio of variances = 0.838 𝐹1 = 1.19 𝐹2 = 0.84 1 1.1933 = 0.8380 𝐹23, 24 0.975 = 2.28 𝐹24, 23 0.025 = 0.44 Dva výběry: Porovnání variancí Porovnání středních hodnot Porovnání dvou pravděpodobností F–test shody variancí: Leveneův test Ansari-Bradleyův test Předpoklady a testová statistika Příklad Konfidenční interval Síla testu, poznámky Konfidenční interval pro poměr variancí 𝝈 𝑿 𝟐 𝝈 𝒀 𝟐 Je nesouměrný, protože F-rozdělení je nesouměrné: 𝐹𝑛 𝑋−1,𝑛 𝑌−1 𝛼 2 ≤ 𝑺 𝟐 𝑿 𝑺 𝟐 𝒀 ∙ 𝝈 𝟐 𝒀 𝝈 𝟐 𝑿 ≤ 𝐹𝑛 𝑋−1,𝑛 𝑌−1 1 − 𝛼 2 zapracujeme znalost 𝑷 𝑭 ≤ 𝑭 𝒇𝟏,𝒇𝟐 𝜶 𝟐 = 𝑷 𝟏 𝑭 ≥ 𝑭 𝒇𝟐,𝒇𝟏 𝟏 − 𝜶 𝟐 𝐹𝑛 𝑌−1,𝑛 𝑋−1 1 − 𝛼 2 ≥ 𝑺 𝟐 𝒀 𝑺 𝟐 𝑿 ∙ 𝝈 𝟐 𝑿 𝝈 𝟐 𝒀 ≥ 𝐹𝑛 𝑌−1,𝑛 𝑋−1 𝛼 2 Uspořádáme logicky menší < větší a převedeme poměr odhadů rozptylů: 𝑭 𝒏 𝒀−𝟏,𝒏 𝑿−𝟏 𝜶 𝟐 ∙ 𝑺 𝟐 𝑿 𝑺 𝟐 𝒀 ≤ 𝝈 𝟐 𝑿 𝝈 𝟐 𝒀 ≤ 𝑭 𝒏 𝒀−𝟏,𝒏 𝑿−𝟏 𝟏 − 𝜶 𝟐 ∙ 𝑺 𝟐 𝑿 𝑺 𝟐 𝒀 Dva výběry: Porovnání variancí Porovnání středních hodnot Porovnání dvou pravděpodobností F–test shody variancí: Leveneův test Ansari-Bradleyův test Předpoklady a testová statistika Příklad Konfidenční interval Síla testu, poznámky F-test shody variancí – další poznámky • Pokud nezamítám H0 (rozptyly jsou shodné), počítám odhad společného rozptylu [pooled variance] takto: 𝑆2 = σ𝑖=1 𝑛 𝑋 𝑋𝑖 − ത𝑋 2 + σ 𝑗=1 𝑛 𝑌 𝑌𝑗 − ത𝑌 2 𝑛 𝑋 + 𝑛 𝑌 − 2 = 𝑛 𝑋 − 1 𝑆 𝑋 2 + 𝑛 𝑌 − 1 𝑆 𝑌 2 𝑛 𝑋 + 𝑛 𝑌 − 2 • F-test je dost slabý test, zvláště při malých četnostech výběrů. Uvažte, že pro výběry velikosti 10 (běžné počty v biologii) srovnáváme statistiku F s kvantilem F9, 9 (0.975) = 4.026, tzn. že musí být SX 2 > 4*SY 2, čtyřikrát větší, aby test zamítnul H0. Proto je pravděpod. β chyby 2. druhu velká. Dva výběry: Porovnání variancí Porovnání středních hodnot Porovnání dvou pravděpodobností F–test shody variancí: Leveneův test Ansari-Bradleyův test Předpoklady a testová statistika Příklad Konfidenční interval Síla testu, poznámky Další testy shody variancí Leveneův test – bude u analýzy rozptylu; pracuje s odchylkami od průměrů (nebo lépe mediánů). Předpokládá normální rozdělení dat. Brown & Forsythe test – modifikace Leveneova testu na mediány, takto je test robustnější vůči odchylce od normálního rozdělení dat. R: balík car (Companion to Applied Regression), funkce leveneTest(x, y, …) Zahrnuje již modifikaci na mediány, je to tedy Brown & Forsythův test. Ansari-Bradleyův dvouvýběrový test - pořadový test, neparametrický. Testuje hodnotu s, což je zde poměr směrodatných odchylek (scales). R: ansari.test(x, y, …) R obsahuje také Moodyho test, který je ovšem komentován takto: „existují užitečnější testy pro tento problém“  Dva výběry: Porovnání variancí Porovnání středních hodnot Porovnání dvou pravděpodobností F–test shody variancí Leveneův test Ansari-Bradleyův test Dva výběry: t-test shody průměrů Předpoklady testu: • (X1, X2, …, Xk) a (Y1, Y2, …, Ym) všechno nezávislé • 𝑿𝒊 ~ 𝑵(𝝁 𝑿, 𝝈 𝑿 𝟐 ), 𝒀𝒊 ~ 𝑵(𝝁 𝒀, 𝝈 𝒀 𝟐 ), parametry neznáme. • výběry mají stejnou varianci, liší se tedy jen posunutím střední hodnoty; 𝝈 𝑿 𝟐 = 𝝈 𝒀 𝟐 ozn. 𝝈 𝟐 • pokud předpoklad stejných rozptylů není splněn, máme Welchův test (dále) Hypotéza: 𝑯 𝟎: 𝝁 𝑿 = 𝝁 𝒀 testujeme 𝜇 𝑋 − 𝜇 𝑌 = 0 alternativa 𝑯 𝟏: 𝝁 𝑿 ≠ 𝝁 𝒀 t–test shody průměrů Welchovo přibližné t Wilcoxonův dvouvýběrový test Mannův-Whitneyův test Předpoklady a hypotéza Testová statistika Poznámky Příklady Histogram of multiple variables kojeni podle KLUKa.sta 11v*99c deK = 49*1*Normal(Location=68,8163; Scale=3,751) delkaD = 50*1*Normal(Location=68,28; Scale=2,7482) cm CH cm D62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 0 2 4 6 8 10 12 Noofobs deK: SW-W = 0,9658; p = 0,1640 delkaD: SW-W = 0,9609; p = 0,0972 Histogram of multiple variables kojeni podle KLUKa.sta 11v*99c hmK = 49*500*Normal(Location=7928,5714; Scale=850,1127) hmD = 50*500*Normal(Location=7455,26; Scale=779,2897) gr CH gr D5000 5500 6000 6500 7000 7500 8000 8500 9000 9500 10000 10500 0 2 4 6 8 10 12 14 Noofobs hmK: SW-W = 0,9885; p = 0,9107 hmD: SW-W = 0,9843; p = 0,7391 Dva výběry: Porovnání variancí Porovnání středních hodnot Porovnání dvou pravděpodobností Dva výběry: t-test shody průměrů Hypotéza: 𝑯 𝟎: 𝝁 𝑿 = 𝝁 𝒀 testujeme 𝜇 𝑋 − 𝜇 𝑌 = 0 alternativa 𝑯 𝟏: 𝝁 𝑿 ≠ 𝝁 𝒀 Použijeme odhad pro společný rozptyl [pooled variance] 𝑆2 = σ𝑖=1 𝑛 𝑋 𝑋𝑖 − ത𝑋 2 + σ 𝑗=1 𝑛 𝑌 𝑌𝑗 − ത𝑌 2 𝑛 𝑋 + 𝑛 𝑌 − 2 = 𝑛 𝑋 − 1 𝑆 𝑋 2 + 𝑛 𝑌 − 1 𝑆 𝑌 2 𝑛 𝑋 + 𝑛 𝑌 − 2 Testová statistika: 𝑻 = ഥ𝑿 − ഥ𝒀 − 𝟎 𝑺. 𝑬. (ഥ𝑿 − ഥ𝒀) = ഥ𝑿 − ഥ𝒀 𝑺 𝒏 𝑿 𝒏 𝒀 𝒏 𝑿 + 𝒏 𝒀 ~ 𝑯 𝟎 𝒕 𝒏 𝑿+𝒏 𝒀−𝟐 Kritéria podle H1: 𝜇 𝑋 ≠ 𝜇 𝑌 → 𝑻 ≥ 𝒕 𝒏 𝑿+𝒏 𝒀−𝟐 𝟏 − Τ𝜶 𝟐 𝜇 𝑋 > 𝜇 𝑌 → 𝑻 ≥ 𝒕 𝒏 𝑿+𝒏 𝒀−𝟐 𝟏 − 𝜶 𝜇 𝑋 < 𝜇 𝑌 → 𝑻 ≤ 𝒕 𝒏 𝑿+𝒏 𝒀−𝟐 𝜶 = −𝒕 𝒏 𝑿+𝒏 𝒀−𝟐 𝟏 − 𝜶 čti: má za platnosti hypotézy H0 rozdělení … Dva výběry: Porovnání variancí Porovnání středních hodnot Porovnání dvou pravděpodobností t–test shody průměrů Welchovo přibližné t Wilcoxonův dvouvýběrový test Mannův-Whitneyův test Předpoklady a hypotéza Testová statistika Poznámky Příklady Pro zájemce odvození rovnosti 𝑆. 𝐸. ത𝑋 − ത𝑌 = 𝑆 ∙ 𝑛 𝑋+𝑛 𝑌 𝑛 𝑋 𝑛 𝑌 , tedy 𝒗𝒂𝒓 ഥ𝑿 − ഥ𝒀 = 𝒏 𝑿+𝒏 𝒀 𝒏 𝑿 𝒏 𝒀 𝑺 𝟐  𝒗𝒂𝒓 ഥ𝑿 − ഥ𝒀 = 𝐸 ത𝑋 − ത𝑌 − 𝐸 ത𝑋 − ത𝑌 2 = 𝐸 ത𝑋 − 𝐸 ത𝑋 − ത𝑌 + 𝐸 ത𝑌 2 = 𝐸 ( ത𝑋 − 𝐸 ത𝑋) − (ത𝑌 − 𝐸 ത𝑌) 2 = 𝐸ሼ( ത𝑋 − 𝐸 ത𝑋)2 −2 ∙ ത𝑋 − 𝐸 ത𝑋 ത𝑌 − 𝐸 ത𝑌 + Dva výběry: Porovnání variancí Porovnání středních hodnot Porovnání dvou pravděpodobností t–test shody průměrů Welchovo přibližné t Wilcoxonův dvouvýběrový test Mannův-Whitneyův test Předpoklady a hypotéza Testová statistika Poznámky Příklady • Všimněte si rozdílu proti párovému t-testu: Párový t-test H0: 𝝁 𝑿 = 𝝁 𝒀 a počítám 𝑿𝒊 = 𝑼𝒊 − 𝑽𝒊 … průměr rozdílů, tj. má smysl počítat rozdíl v páru pozorování Dvouvýběrový H0: 𝝁 𝑿 = 𝝁 𝒀 (H0 stejná) ഥ𝑿 − ഥ𝒀 … rozdíl průměrů Zde není žádný vztah mezi 𝑋𝑖 a 𝑌𝑖, navíc počet 𝒏 𝑿 a 𝒏 𝒀 se může lišit. • t-test je celkem robustní vůči narušení předpokladů, zvlášť pokud máme dostatek pozorování a výběry jsou zhruba stejně početné (uplatní se CLV). PŘESTO je-li podezření na nestejnost variancí (normálního rozdělení) nebo se 𝒏 𝑿 a 𝒏 𝒀 značně liší, použijeme lépe Welchův přibližný t-test: 𝑻 = ഥ𝑿 − ഥ𝒀 − 𝟎 𝑺 𝑿 𝟐 𝒏 𝑿 + 𝑺 𝒀 𝟐 𝒏 𝒀 ~ 𝑯 𝟎 𝒕 𝒇 , 𝑘𝑑𝑒 𝑓 = 𝑆 𝑋 2 𝑛 𝑋 + 𝑆 𝑌 2 𝑛 𝑌 2 𝑆 𝑋 2 𝑛 𝑋 2 𝑛 𝑋 − 1 + 𝑆 𝑌 2 𝑛 𝑌 2 𝑛 𝑌 − 1 Počet stupňů volnosti f může být i desetinné číslo! Rozdělení testové statistiky známe jen přibližně, proto také p-hodnota je jen přibližná. Dva výběry: Porovnání variancí Porovnání středních hodnot Porovnání dvou pravděpodobností t–test shody průměrů Welchovo přibližné t Wilcoxonův dvouvýběrový test Mannův-Whitneyův test Předpoklady a hypotéza Testová statistika Poznámky Příklady T-test - zadání v Rku: R: t.test(x, y, alternative=c("two.sided","less", "greater"), mu=0, paired=FALSE, var.equal=FALSE, conf.level=0.95, ...) tady každá skupina ve vlastním sloupečku př. fosfor: mg.malo a mg.hodne Zadání pomocí formule: t.test(měření ~ skupiny, data, subset, …) tady jednom sloupečku kódování příslušnosti ke skupině (faktor skupiny) a ve druhém sloupečku naměřené hodnoty (měření) př. fosfor.kody: P ~ skup datová tabulka musí být „attach“ nebo ji musím zadat jako data = fosfor.kody Přednastavené nestejné rozptyly, počítá rovnou Welchův přibližný test. Dva výběry: Porovnání variancí Porovnání středních hodnot Porovnání dvou pravděpodobností t–test shody průměrů Welchovo přibližné t Wilcoxonův dvouvýběrový test Mannův-Whitneyův test Předpoklady a hypotéza Testová statistika Poznámky Příklady t-test – příklad fosfor: Obsah fosforu v listech pšenice Skupiny podle obsahu hořčíku. H0: μ1 = μ2 H1: μ1 ≠ μ2 H0: průměrný populační obsah fosforu je v obou skupinách srovnatelný. Předpoklady: n1 = 24, n2 = 25 Normalita: histogramy, Q-Q ploty > shapiro.test(fosfor$mg.malo) data: fosfor$mg.malo W = 0.96787, p-value = 0.6147 > shapiro.test(fosfor$mg.hodne) data: fosfor$mg.hodne W = 0.97993, p-value = 0.8838 Normalita splněna, počet pozorování rozumný. Variance jsou srovnatelné. Dva výběry: Porovnání variancí Porovnání středních hodnot Porovnání dvou pravděpodobností t–test shody průměrů Welchovo přibližné t Wilcoxonův dvouvýběrový test Mannův-Whitneyův test Předpoklady a hypotéza Testová statistika Poznámky Příklady > var.test(fosfor$mg.malo, fosfor$mg.hodne) F test to compare two variances F = 1.1933, num df = 23, denom df = 24, p-value = 0.6696 Nezamítám hypotézu o shodných rozptylech. t-test – příklad fosfor: Obsah fosforu v listech pšenice Skupiny podle obsahu hořčíku. H0: μ1 = μ2 H1: μ1 ≠ μ2 > t.test(fosfor$mg.malo, fosfor$mg.hodne, var.equal = T) Two Sample t-test data: fosfor$mg.malo and fosfor$mg.hodne t = -2.4352, df = 47, p-value = 0.01873 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: ( -11.434431; -1.088902 ) sample estimates: mean of x mean of y 46.45833 52.72000 Zamítám hypotézu o shodných populačních průměrech na hladině 5 %. Dva výběry: Porovnání variancí Porovnání středních hodnot Porovnání dvou pravděpodobností t–test shody průměrů Welchovo přibližné t Wilcoxonův dvouvýběrový test Mannův-Whitneyův test Předpoklady a hypotéza Testová statistika Poznámky Příklady t-test – příklad myši: Jsou hmotnosti myší v základním a „prvním“ chovu srovnatelné? H0: μX = μY H1: μX ≠ μY Předpoklady: Normalita dobrá, víme z DÚ. > var.test(mysi, mysi1) F test to compare two variances F = 2.2339, num df = 19, denom df = 19, p-value = 0.08788 alternative hypothesis: true ratio of variances is not equal to 1 sample estimates:ratio of variances = 2.233919 > t.test(mysi, mysi1) Welch Two Sample t-test data: mysi and mysi1 t = -1.9661, df = 33.171, p-value = 0.0577 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -8.8504732 0.1504732 sample estimates:mean of x mean of y 42.45 46.80 Rozdíl v rozptylech dvojnásobný => Welchův přibližný t-test. Dva výběry: Porovnání variancí Porovnání středních hodnot Porovnání dvou pravděpodobností t–test shody průměrů Welchovo přibližné t Wilcoxonův dvouvýběrový test Mannův-Whitneyův test Předpoklady a hypotéza Testová statistika Poznámky Příklady Těsně nezamítám hypotézu o srovnatelných populačních průměrech. Neparametrický test rovnosti středních hodnot Mannův-Whitneyův test alias dvouvýběrový Wilcoxonův test Předpoklady: (X1, X2, …, Xk) a (Y1, Y2, …, Ym) všechno nezávislé ze spojitého rozdělení. Nulová hypotéza: rozdělení pravděpodobností náh. veličin X a Y je stejné (tedy ani posunutí, ani velký rozdíl ve variabilitě, stejné histogramy)  Za platnosti nulové hypotézy jsou stejné i populační mediány Princip Wilcoxonova pořadového testu: Sesypeme oba výběry dohromady a hodnoty seřadíme (neřešíme +/- jako u párového testu). Když platí H0, měly by se zhruba pravidelně střídat hodnoty z X a z Y. Součet pořadí by tedy měl být srovnatelný, zhruba polovina z (𝑛 𝑥+𝑛 𝑌)∙(𝑛 𝑥+𝑛 𝑌+1) 2 , tedy (𝑛 𝑥+𝑛 𝑌)∙(𝑛 𝑥+𝑛 𝑌+1) 4 . Protože ale velikosti výběrů nX a nY nemusí být stejné, musím spočtený součet porovnávat s poměrnou částí celého součtu, viz dále: Dva výběry: Porovnání variancí Porovnání středních hodnot Porovnání dvou pravděpodobností t–test shody průměrů Welchovo přibližné t Wilcoxonův dvouvýběrový test Mannův-Whitneyův test Předpoklady, hypotéza, princip Testová statistika Poznámky Příklad Dvouvýběrový Wilcoxonův test Princip Wilcoxonova pořadového testu:  𝑾 𝑿 = σ𝒊=𝟏 𝒏 𝑿 𝑹 𝑿𝒊 … součet pořadí hodnot z výběru X  𝑾 𝒀 = σ𝒋=𝟏 𝒏 𝒀 𝑹 𝒀𝒋 … součet pořadí hodnot z výběru Y  Součet všech pořadí: 𝑾 𝑿 + 𝑾 𝒀 = (𝒏 𝒙+𝒏 𝒀)∙(𝒏 𝒙+𝒏 𝒀+𝟏) 𝟐  Za platnosti H0 je očekávaný součet 𝑬𝑾 𝑿 = 𝒏 𝒙 𝒏 𝒙 + 𝒏 𝒀 (𝒏 𝒙 + 𝒏 𝒀) ∙ (𝒏 𝒙 + 𝒏 𝒀 + 𝟏) 𝟐 = 𝒏 𝒙 ∙ (𝒏 𝒙 + 𝒏 𝒀 + 𝟏) 𝟐 𝒗𝒂𝒓 𝑾 𝑿 = 𝒏 𝒙 ∙ 𝒏 𝒀 ∙ (𝒏 𝒙 + 𝒏 𝒀 + 𝟏) 𝟏𝟐  Při větším množství shod v pořadí ještě úprava výběrového rozptylu…  Pro menší rozsahy výběrů nX a nY lze počítat přesné pravděpodobnosti, pro větší n se používá aproximace normálním rozdělením. Poměrná část vůči celkovému počtu hodnot Dva výběry: Porovnání variancí Porovnání středních hodnot Porovnání dvou pravděpodobností t–test shody průměrů Welchovo přibližné t Wilcoxonův dvouvýběrový test Mannův-Whitneyův test Předpoklady, hypotéza, princip Testová statistika Poznámky Příklad ~ multinomické rozdělení Dvouvýběrový Mannův-Whitneyův test Test je založen na zdánlivě jiné myšlence: porovnává všechny možné dvojice (Xi, Yj) a počítá, v kolika případech je hodnota X menší než Y. Jsou-li distribuce veličin srovnatelné (H0), bude to zhruba polovina dvojic.  Označme 𝑼 𝑿 počet dvojic, kde 𝑿𝒊 < 𝒀𝒋 , 𝑼 𝑿 ~ 𝑯 𝟎 𝑩𝒊(𝒏 𝑿 ∙ 𝒏 𝒀, 𝟎. 𝟓)  Označme 𝑼 𝒀 počet dvojic, kde 𝑿𝒊 > 𝒀𝒋  Případy 𝑿𝒊 = 𝒀𝒋 započítáme polovinou k UX a polovinou k UY  Kritický obor je zpravidla popisován pomocí 𝑈 = min(𝑈 𝑋, 𝑈 𝑌).  Tyto rovnice ukazují souvislost mezi testovými statistikami: (Wilcoxon) 𝑾 𝑿 = 𝒏 𝒙 𝒏 𝒀 + 𝒏 𝒙∙(𝒏 𝒙+𝟏) 𝟐 − 𝑼 𝑿 (Mann-Whitney) (Wilcoxon) 𝑾 𝒀 = 𝒏 𝒙 𝒏 𝒀 + 𝒏 𝒀∙(𝒏 𝒀+𝟏) 𝟐 − 𝑼 𝒀 (Mann-Whitney) Dva výběry: Porovnání variancí Porovnání středních hodnot Porovnání dvou pravděpodobností t–test shody průměrů Welchovo přibližné t Wilcoxonův dvouvýběrový test Mannův-Whitneyův test Předpoklady, hypotéza, princip Testová statistika Poznámky Příklad Poznámky k Mann-Whitneyovu U testu a Wilcoxonovu testu • Oba testy prověřují nulovou hypotézu o shodě rozdělení, ze kterého pocházejí porovnávané výběry. Pokud testujeme nulovou hypotézu o shodě polohy (mediánu), musíme předpokládat, že se distribuce příliš neliší tvarem. Dva výběry: Porovnání variancí Porovnání středních hodnot Porovnání dvou pravděpodobností t–test shody průměrů Welchovo přibližné t Wilcoxonův dvouvýběrový test Mannův-Whitneyův test Předpoklady, hypotéza, princip Testová statistika Poznámky Příklad Mann-Whitney alias Wilcoxon - příklad: R: wilcox.test(x, y, alternative=c("two.sided","less","greater"), mu=0, paired=FALSE, exact=NULL, correct=TRUE, conf.int=FALSE, conf.level=0.95, ...) Příklad: stromky > wilcox.test(Health~Cultivar, data=stromky) Wilcoxon rank sum test with continuity correction data: Health by Cultivar W = 40, p-value = 0.4619 alternative hypothesis: true location shift is not equal to 0 Warning message: In wilcox.test.default(x = c(2, 2, 1, 2, 3, 4, 2, 3, 1, 5), y = c(4, : cannot compute exact p-value with ties Dva výběry: Porovnání variancí Porovnání středních hodnot Porovnání dvou pravděpodobností t–test shody průměrů Welchovo přibližné t Wilcoxonův dvouvýběrový test Mannův-Whitneyův test Předpoklady, hypotéza, princip Testová statistika Poznámky Příklad Mediánový test Existuje, je však velmi slabý. Dva výběry: Porovnání variancí Porovnání středních hodnot Porovnání dvou pravděpodobností t–test shody průměrů Welchovo přibližné t Wilcoxonův dvouvýběrový test Mannův-Whitneyův test Porovnání dvou pravděpodobností tj. mám data o dvou znacích nominální proměnné a ptám se, zda se dva výběry shodnou v pravděpodobnosti, že nastane znak A. Toto odpovídá čtyřpolní kontingenční tabulce. (je-li sledovaných znaků více, testuji obecnou kontingenční tabulku) Předpoklad: mám dvě série vzájemně nezávislých pokusů, ve kterých zjišťuji, zda nastal znak (jev) A. Prst. znaku A v jedné sérii je stejný. • Y1 = počet pokusů, kdy nastal znak A v první sérii (celkem n1) • Y2 = počet pokusů, kdy nastal znak A ve druhé sérii (celkem n2) • 𝒀 𝟏~𝑩𝒊 𝒏 𝟏, 𝒑 𝟏 𝒀 𝟐~𝑩𝒊(𝒏 𝟐, 𝒑 𝟐) Nulová hypotéza: obě pravděpodobnosti jsou shodné, 𝒑 𝟏 = 𝒑 𝟐 = 𝒑 Odhady: ෝ𝒑 𝟏 = 𝒀 𝟏 𝒏 𝟏 ෝ𝒑 𝟐 = 𝒀 𝟐 𝒏 𝟐 𝒗𝒂𝒓 ෝ𝒑 𝟏 − ෝ𝒑 𝟐 = 𝒑 𝟏∙(𝟏−𝒑 𝟏) 𝒏 𝟏 + 𝒑 𝟐∙(𝟏−𝒑 𝟐) 𝒏 𝟐 = 𝑯 𝟎 𝒑 ∙ (𝟏 − 𝒑) ∙ 𝟏 𝒏 𝟏 + 𝟏 𝒏 𝟐 Dva výběry: Porovnání variancí Porovnání středních hodnot Porovnání dvou pravděpodobností Dvě pravděpodobnosti binomického rozdělení Binomický test Aproximace normálním rozdělením Chí-kvadrát test Porovnání dvou pravděpodobností 𝒀 𝟏~𝑩𝒊 𝒏 𝟏, 𝒑 𝟏 𝒀 𝟐~𝑩𝒊(𝒏 𝟐, 𝒑 𝟐) Nulová hypotéza: obě pravděpodobnosti jsou shodné, 𝒑 𝟏 = 𝒑 𝟐 = 𝒑 Testovat můžeme trojím způsobem: 1) Přesný binomický test  R: binom.test 2) Přibližný test přes aproximaci normálním rozdělením 𝑍 = ෝ𝒑 𝟏−ෝ𝒑 𝟐 −𝟎 𝑆.𝐸.(ෝ𝒑 𝟏−ෝ𝒑 𝟐) = ෝ𝒑 𝟏−ෝ𝒑 𝟐 ො𝑝(1− ො𝑝) 𝟏 𝒏 𝟏 + 𝟏 𝒏 𝟐 ~ 𝑁(0,1) 3) Chí-kvadrát test R: prop.test chisq.test Dva výběry: Porovnání variancí Porovnání středních hodnot Porovnání dvou pravděpodobností Dvě pravděpodobnosti binomického rozdělení Binomický test Aproximace normálním rozdělením Chí-kvadrát test