Analýza závislosti dvou nominálních náhodných veličin Motivace Při zpracování dat se velmi často setkáme s úkolem zjistit, zda dvě náhodné veličiny nominálního typu jsou stochasticky nezávislé. Např. nás může zajímat, zda ve sledované populaci je barva očí a barva vlasů nezávislá. Zpravidla chceme také zjistit intenzitu případné závislosti sledovaných dvou veličin. K tomuto účelu byly zkonstruovány různé koeficienty, které nabývají hodnot od 0 do 1. Čím je takový koeficient bližší 1, tím je závislost mezi danými dvěma veličinami silnější a čím je bližší 0, tím je slabší. Kontingenční tabulky Nechť X,Y jsou dvě nominální náhodné veličiny (tj. obsahová interpretace je možná jenom u relace rovnosti). Nechť X nabývá variant x[[1]], ..., x[[r]] a Y nabývá variant y[[1]], ..., y[[s]]. Označme: … simultánní pravděpodobnost dvojice variant (x[[j]], y[[k]]) … marginální pravděpodobnost varianty x[[j]] … marginální pravděpodobnost varianty y[[k]] Simultánní a marginální pravděpodobnosti zapíšeme do kontingenční tabulky: y y[[1]] ... y[[s]] π[j.] x π[jk] x[[1]] π[11] ... π[1s] π[1.] ... ... ... ... ... x[[r]] π[r1] ... π[rs] π[r.] π[.k] π[.1] ... π[.s] 1 Nyní pořídíme dvourozměrný náhodný výběr rozsahu n z rozložení, kterým se řídí dvourozměrný diskrétní náhodný vektor (X, Y). Zjištěné absolutní simultánní četnosti n[jk] dvojice variant (x[[j]], y[[k]]) uspořádáme do kontingenční tabulky: y y[[1]] ... y[[s]] n[j.] x n[jk] x[[1]] n[11] ... n[1s] n[1.] ... ... ... ... ... x[[r]] n[r1] ... n[rs] n[r.] n[.k] n[.1] ... n[.s] n n[j.] = n[j1] + ... + n[js] je marginální absolutní četnost varianty x[[j]] n[.k] = n[1k] + ... + n[rk] je marginální absolutní četnost varianty y[[k]] Simultánní pravděpodobnost π[jk] odhadneme pomocí simultánní relativní četnosti , marginální pravděpodobnosti π[j.] a π[.k] odhadneme pomocí marginálních relativních četností a . Testování hypotézy o nezávislosti Testujeme nulovou hypotézu H[0]: X, Y jsou stochasticky nezávislé náhodné veličiny proti alternativě H[1]: X, Y nejsou stochasticky nezávislé náhodné veličiny. Kdyby náhodné veličiny X, Y byly stochasticky nezávislé, pak by platil multiplikativní vztah , : π[jk] = π[j.] π[.k] neboli , tj. . Číslo se nazývá teoretická četnost dvojice variant (x[[j]], y[[k]]). Testová statistika: . Platí-li H[0], pak K se asymptoticky řídí rozložením χ^2((r-1)(s-1)). Kritický obor: . Hypotézu o nezávislosti veličin X, Y tedy zamítáme na asymptotické hladině významnosti α, když K ≥ χ^2[1-α]((r-1)(s-1)). Podmínky dobré aproximace Rozložení statistiky K lze aproximovat rozložením χ^2((r-1)(s-1)), pokud teoretické četnosti aspoň v 80% případů nabývají hodnoty větší nebo rovné 5 a ve zbylých 20% neklesnou pod 2. Není-li splněna podmínka dobré aproximace, doporučuje se slučování některých variant. Měření síly závislosti Cramérův koeficient: , kde m = min{r,s}. Tento koeficient nabývá hodnot mezi 0 a 1. Čím blíže je 1, tím je těsnější závislost mezi X a Y, čím blíže je 0, tím je tato závislost volnější. Význam hodnot Cramérova koeficientu: mezi 0 až 0,1 … zanedbatelná závislost, mezi 0,1 až 0,3 … slabá závislost, mezi 0,3 až 0,7 … střední závislost, mezi 0,7 až 1 … silná závislost. Carl Harald Cramér (1893 – 1985): Švédský matematik Příklad V sociologickém průzkumu byl z uchazečů o studium na vysokých školách pořízen náhodný výběr rozsahu 360. Mimo jiné se zjišťovala sociální skupina, ze které uchazeč pochází (veličina X) a typ školy, na kterou se hlásí (veličina Y). Výsledky jsou zaznamenány v kontingenční tabulce: Sociální skupina Typ školy n[j.] univerzitní technický ekonomický I 50 30 10 90 II 30 50 20 100 III 10 20 30 60 IV 50 10 50 110 n[.k] 140 110 110 360 Na asymptotické hladině významnosti 0,05 testujte hypotézu o nezávislosti typu školy a sociální skupiny. Vypočtěte Cramérův koeficient. Řešení: Nejprve vypočteme všech 12 teoretických četností: Vidíme, že podmínky dobré aproximace jsou splněny, všechny teoretické četnosti převyšují číslo 5. Nyní dosadíme do vzorce pro testovou statistiku K: . Dále stanovíme kritický obor: Protože K W, hypotézu o nezávislosti typu školy a sociální skupiny zamítáme na asymptotické hladině významnosti 0,05. Vypočteme Cramérův koeficient: . Hodnota Cramérova koeficientu svědčí o tom, že mezi veličinami X a Y existuje středně silná závislost. Výpočet pomocí systému STATISTICA: Vytvoříme nový datový soubor o třech proměnných (X - sociální skupina, Y – typ školy, četnost) a 12 případech: Statistiky – Základní statistiky/tabulky – OK – Specif. Tabulky – List 1 X, List 2 Y – OK, zapneme proměnnou vah četnost – OK, Výpočet – na záložce Možnosti zaškrtneme Očekávané četnosti. Dostaneme kontingenční tabulku teoretických četností: Všechny teoretické četnosti jsou větší než 5, podmínky dobré aproximace jsou splněny. V záhlaví tabulky je uvedena hodnota testové statistiky K = 76,8359, počet stupňů volnosti 6 a odpovídající p-hodnota. Je velmi blízká 0, tedy na asymptotické hladině významnosti 0,05 zamítáme hypotézu o nezávislosti typu školy a sociální skupiny. Hodnotu testové statistiky a Cramérův koeficient dostaneme také tak, že na záložce Možnosti zaškrtneme Pearsonův & M-V chí kvadrát, Cramérovo V, na záložce Detailní výsledky vybereme Detailní 2 rozm. tabulky. Testování hypotézy o homogenitě (o shodnosti struktury) Na asymptotické hladině významnosti α testujeme hypotézu H[0]: π[1k] = π[2k] = … = π[rk], k = 1, 2, …, s proti alternativě H[1]: aspoň jedna dvojice pravděpodobností se liší. Nulová hypotéza tvrdí, že rozložení pravděpodobností náhodné veličiny Y je stejné za různých podmínek, které vyjadřují varianty náhodné veličiny X. (Jde o podobný problém jako v analýze rozptylu jednoduchého třídění, kde porovnáváme shodu středních hodnot intervalové či poměrové proměnné. V tomto případě však porovnáváme shodu pravděpodobnostního rozložení nominální proměnné.) Testová statistika i kritický obor jsou stejné jako při testování hypotézy o nezávislosti. Příklad: V severozápadním Skotsku byla provedena studie, která měla prokázat, zda je procentuální zastoupení krevních skupin na celém území homogenní či nikoliv. V oblasti Eskdale bylo náhodně vybráno 100 osob, v oblasti Annandale 125 osob a v oblasti Nithsdale 253 osob. Výsledky jsou uvedeny v tabulce: oblast Krevní skupina n[j.] A B 0 AB Eskdale 33 6 56 5 100 Annandale 54 14 52 5 125 Nithsdale 98 35 115 5 253 n[.k] 185 55 223 15 478 Na asymptotické hladině významnosti 0,05 proveďte test homogenity. Výpočet pomocí systému STATISTICA: Vytvoříme nový datový soubor o třech proměnných (X - oblast, Y – krevní skupina, četnost) a 12 případech: Nejprve vytvoříme kontingenční tabulku řádkově podmíněných relativních četností, abychom získali představu o procentuálním zastoupení krevních skupin ve sledovaných třech oblastech: Ověříme podmínky dobré aproximace: Podmínky dobré aproximace jsou splněny. Testová statistika nabývá hodnoty 10,45372, p-hodnota je 0,10681, což znamená, že na asymptotické hladině významnosti 0,05 nelze zamítnout hypotézu, že procentuální zastoupení krevních skupin ve sledovaných třech oblastech Skotska je shodné. Čtyřpolní tabulky Nechť r = s = 2. Pak hovoříme o čtyřpolní kontingenční tabulce a používáme označení: n[11] = a, n[12] = b, n[21] = c, n[22] = d. X Y n[j.] y[[1]] y[[2]] x[[1]] a b a+b x[[2]] c d c+d n[.k] a+c b+d n Test nezávislosti ve čtyřpolní tabulce Testovou statistiku pro čtyřpolní kontingenční tabulku lze zjednodušit do tvaru: . Platí-li hypotéza o nezávislosti veličin X, Y, pak K se asymptoticky řídí rozložením χ^2(1). Kritický obor: Nulovou hypotézu zamítáme na asymptotické hladině významnosti α, když K W. Povšimněte si, že za platnosti hypotézy o nezávislosti ad = bc. Pro tuto tabulku navrhl R. A. Fisher přesný (exaktní) test nezávislosti známý jako Fisherův faktoriálový test. Sir Ronald Aylmer Fisher (1890 – 1962): Britský statistik a genetik. (Fisherův přesný test je popsán např. v knize K. Zvára: Biostatistika, Karolinum, Praha 1998. Princip spočívá v tom, že pomocí kombinatorických úvah se vypočítají pravděpodobnosti toho, že při daných marginálních četnostech dostaneme tabulky, které se od nulové hypotézy odchylují aspoň tak, jako daná tabulka.) Upozornění: STATISTICA poskytuje p-hodnotu pro Fisherův přesný test. Jestliže vyjde p ≤ α, pak hypotézu o nezávislosti zamítáme na hladině významnosti α. Příklad: V náhodném výběru 50 obézních dětí ve věku 6 – 14 let byla zjišťována obezita rodičů. Veličina X – obezita matky, veličina Y – obezita otce. Výsledky průzkumu jsou uvedeny v kontingenční tabulce: X Y n[j.] ano ne ano[] 15 9 24 ne 7 19 26 n[.k] 22 28 50 Pomocí Fisherova exaktního testu ověřte, zda lze na hladině významnosti 0,05 zamítnout hypotézu o nezávislosti náhodných veličin X a Y. Výpočet pomocí systému STATISTICA: Vytvoříme datový soubor o třech proměnných X, Y (varianty 0 – neobézní, 1 – obézní) a četnost a čtyřech případech: Statistiky – Základní statistiky/tabulky – OK – Specif. Tabulky – List 1 X, List 2 Y – OK, zapneme proměnnou vah četnost – OK, Výpočet – na záložce Možnosti zaškrtneme Fisher exakt. Dostaneme výstupní tabulku: Vidíme, že p-hodnota pro Fisherův exaktní oboustranný test je 0,02163, tedy na hladině významnosti 0,05 zamítáme hypotézu, že obezita matky a otce spolu nesouvisí. Test homogenity ve čtyřpolní tabulce Na asymptotické hladině významnosti α testujeme hypotézu H[0]: π[1k] = π[2k], k = 1, 2 proti alternativě H[1]: aspoň jedna dvojice pravděpodobností se liší. Na problém lze pohlížet tak, že máme dva nezávislé výběry z alternativních rozložení, první má rozsah n[1] = a+c a pochází z rozložení A( ), druhý má rozsah n[2] = b+d a pochází z rozložení A( ). Testujeme hypotézu H[0]: = 0 proti oboustranné alternativě. V kapitole o hodnocení dvou nezávislých náhodných výběrů z alternativních rozložení jsme použili testovou statistiku , která se za platnosti nulové hypotézy asymptoticky řídí rozložením N(0,1). (M[*] je vážený průměr výběrových průměrů.) Nyní použijeme testovou statistiku , stejně jako u testu nezávislosti. Tato statistika se v případě platnosti nulové hypotézy asymptoticky řídí rozložením χ^2(1). Kritický obor: . Nulovou hypotézu zamítáme na asymptotické hladině významnosti α, když K W. Příklad: Očkování proti chřipce se zúčastnilo 460 dospělých, z nichž 240 dostalo očkovací látku proti chřipce a 220 dostalo placebo. Na konci experimentu onemocnělo 100 lidí chřipkou. 20 z nich bylo z očkované skupiny a 80 z kontrolní skupiny. Na asymptotické hladině významnosti 0,01 testujte hypotézu, že výskyt chřipky v očkované a kontrolní skupině je shodný. Řešení: Údaje uspořádáme do čtyřpolní kontingenční tabulky, kde roli veličiny X hraje onemocnění chřipkou a roli veličiny Y existence očkování. X onemocnění chřipkou Y existence očkování n[j.] ano ne ano[] 20 80 100 ne 220 140 360 n[.k] 240 220 460 Vypočteme sloupcově podmíněné relativní četnosti: X onemocnění chřipkou Y existence očkování ano ne ano[] ne Vidíme, že v očkované skupině onemocnělo chřipkou 8,3% lidí, v kontrolní skupině však 36,4%. Zjistíme, zda takto velký rozdíl je způsoben pouze náhodnými vlivy. Ověříme splnění podmínek dobré aproximace, tedy nejprve vypočteme teoretické četnosti: Všechny teoretické četnosti jsou větší než 5, podmínky dobré aproximace jsou splněny. Realizace testové statistiky: . Kritický obor: . Protože K W, H[0] zamítáme na asymptotické hladině významnosti 0,01. S rizikem omylu nejvýše 0,01 jsme tedy prokázali, že výskyt chřipky v očkované a kontrolní skupině se liší. Nyní ještě provedeme test hypotézy, že výskyt chřipky v očkované a kontrolní skupině je shodný, pomocí testové statistiky , která se za platnosti nulové hypotézy asymptoticky řídí rozložením N(0,1). V tomto případě , , , n[1] = 240, n[2] = 220 Realizace testové statistiky: Kritický obor: Testová statistika se realizuj ev kritickém oboru, tedy na asymptotické hladině významnosti 0,05 zamítáme hypotézu, že výskyt chřipky v očkované a kontrolní skupině se neliší. (Povšimněte si, že kvadrát testové statistiky T[0] má stejnou hodnotu jako testová statistika K.) Výpočet pomocí systému STATISTICA: Vytvoříme datový soubor o třech proměnných X (varianty 1 – chřipka ano, 0 – chřipka ne), Y (varianty 1 – očkování ano, 0 – očkování ne) a četnost a čtyřech případech: Statistiky – Základní statistiky/tabulky – OK – Specif. Tabulky – List 1 X, List 2 Y – OK, zapneme proměnnou vah četnost – OK, Výpočet – na záložce Možnosti zaškrtneme Fisher exakt. Dostaneme výstupní tabulku: Vidíme, že p-hodnota pro Fisherův exaktní oboustranný test je blízká 0, tedy na hladině významnosti 0,01 zamítáme hypotézu, že výskyt chřipky v očkované a kontrolní skupině se neliší. (Testová statistika K je uvedena v 1., řádku výstupní tabulky.) Pokud chceme posoudit sílu vlivu očkování na výskyt chřipky, vypočteme pomocí systému STATISTICA Cramérův koeficient: na záložce Možnosti zaškrtneme Fí (tabulky 2x2) & Cramérovo V & C: Cramérův koeficient je roven absolutní hodnotě koeficientu Fí, tedy 0,3395. Vidíme, že se jedná o středně silnou závislost. Podíl šancí ve čtyřpolní kontingenční tabulce Ve čtyřpolních tabulkách používáme charakteristiku , která se nazývá podíl šancí (odds ratio). Můžeme si představit, že pokus se provádí za dvojích různých okolností a může skončit buď úspěchem nebo neúspěchem. Výsledek pokusu okolnosti n[j.] I II úspěch[] a b a+b neúspěch c d c+d n[.k] a+c b+d n Poměr počtu úspěchů k počtu neúspěchů (tzv. šance) za 1. okolností je , za druhých okolností je . Podíl šancí je . Pomocí 100(1-α)% asymptotického intervalu spolehlivosti pro podíl šancí lze na asymptotické hladině významnosti α testovat hypotézu o nezávislosti nominálních veličin X a Y. Asymptotický 100(1-α)% interval spolehlivosti pro skutečný podíl šancí má meze: , . Jestliže interval spolehlivosti neobsahuje 1, pak hypotézu o nezávislosti zamítneme na asymptotické hladině významnosti α. Příklad (testování nezávislosti pomocí podílu šancí a pomocí statistiky K): U 135 uchazečů o studium na jistou fakultu byl hodnocen dojem, jakým zapůsobili na komisi u ústní přijímací zkoušky. Na asymptotické hladině významnosti 0,05 testujte hypotézu, že přijetí na fakultu nezávisí na dojmu u přijímací zkoušky. přijetí dojem n[j.] dobrý špatný ano[] 17 11 28 ne 39 58 97 n[.k] 56 69 125 Řešení: a) Testování pomocí podílu šancí: . Podíl šancí nám říká, že uchazeč, který zapůsobil na komisi dobrým dojmem, má asi 2,3 x větší šanci na přijetí než uchazeč, který zapůsobil špatným dojmem. Provedeme další pomocné výpočty: Dosadíme do vzorců pro meze asymptotického intervalu spolehlivosti pro podíl šancí: Po odlogaritmování dostaneme: Protože interval (0,972; 5,433) obsahuje číslo 1, na asymptotické hladině významnosti 0,05 nezamítáme hypotézu o nezávislosti dojmu u přijímací zkoušky a přijetí na fakultu. b) Testování pomocí statistiky K: Ověříme splnění podmínek dobré aproximace: , , , Podmínky dobré aproximace jsou splněny. Dosadíme do zjednodušeného vzorce pro testovou statistiku K: Kritický obor: . Protože testová statistika se nerealizuje k kritickém oboru, nulovou hypotézu nezamítáme na asymptotické hladině významnosti 0,05. Vypočteme ještě Cramérův koeficient: Vidíme, že mezi dojmem u přijímací zkoušky a přijetím na fakultu je pouze slabá závislost. Výpočet pomocí systému STATISTICA: a) Testování pomocí podílu šancí: Vytvoříme datový soubor s proměnnými dm (dolní mez) a hm (horní mez). Do Dlouhého jména proměnné dm napíšeme: =exp(log((17*58)/(11*39))-sqrt(1/17+1/11+1/39+1/58)*VNormal(0,975;0;1)) a do Dlouhého jména proměnné hm napíšeme: =exp(log((17*58)/(11*39))+sqrt(1/17+1/11+1/39+1/58)*VNormal(0,975;0;1)) Získáme výsledek: Protože interval (0,9724; 5,4324) obsahuje číslo 1, na asymptotické hladině významnosti 0,05 nezamítáme hypotézu o nezávislosti dojmu u přijímací zkoušky a přijetí na fakultu. b) Testování pomocí statistiky K: Vytvoříme datový soubor s proměnnými prijeti (varianta 1 – přijat, 0 – nepřijat), dojem (varianta 1 – dobrý, 0 – špatný) a cetnost a čtyřmi případy: Ověříme splnění podmínek dobré aproximace: Statistiky – Základní statistiky/tabulky – OK – Specif. Tabulky – List 1 prijeti, List 2 dojem – OK, zapneme proměnnou vah četnost – OK, Výpočet – na záložce Možnosti zaškrtneme Očekávané četnosti. Dostaneme kontingenční tabulku teoretických četností: Vidíme, že podmínky dobré aproximace jsou splněny. V záhlaví této tabulky je uvedena hodnota testové statistiky K = 3,69533 a odpovídající asymptotická p-hodnota = 0,054568. Nulovou hypotézu tedy nelze zamítnout na asymptotické hladině významnosti 0,05. Poznámka k jednostranným alternativám: Nulová hypotéza tvrdí, že podíl šancí je roven 1, tj. H[0]: OR = 1. Pokud víme, že za prvních okolností je šance na úspěch vyšší než za druhých okolností, pak proti nulové hypotéze postavíme pravostrannou alternativu H[1]: OR > 1. Nulovou hypotézu zamítáme na asymptotické hladině významnosti α ve prospěch pravostranné alternativy, když 100(1-α)% empirický asymptotický levostranný interval spolehlivosti pro OR neobsahuje číslo 1. Pokud víme, že za prvních okolností je šance na úspěch nižší než za druhých okolností, pak proti nulové hypotéze postavíme levostrannou alternativu H[1]: OR < 1. Nulovou hypotézu zamítáme na asymptotické hladině významnosti α ve prospěch levostranné alternativy, když 100(1-α)% empirický asymptotický pravostranný interval spolehlivosti pro OR neobsahuje číslo 1. Pokud jsou šance na úspěch stejné za prvních i druhých okolností, pak proti nulové hypotéze postavíme oboustrannou alternativu H[1]: OR ≠ 1. Nulovou hypotézu zamítáme na asymptotické hladině významnosti α ve prospěch oboustranné alternativy, když 100(1-α)% empirický asymptotický oboustranný interval spolehlivosti pro OR neobsahuje číslo 1. Příklad: U 24 žáků 6. třídy základní školy bylo zjišťováno, zda jsou úspěšní v matematice (tj. mají na posledním vysvědčení známku 1 nebo 2 z matematiky) a zda hrají na nějaký hudební nástroj. Z 10 úspěšných matematiků 6 hrálo na nějaký hudební nástroj, kdežto ve skupině neúspěšných matematiků hrál pouze 1 žák na hudební nástroj. Na asymptotické hladině významnosti 0,05 testujte hypotézu, že úspěch v matematice a hra na hudební nástroj jsou nezávislé veličiny. Proti nulové hypotéze postavte a) oboustrannou alternativu, tj. tvrzení, úspěch v matematice a hra na hudební nástroj spolu souvisí, b) pravostrannou alternativu, tj. tvrzení, že šance na úspěch v matematice jsou vyšší pro žáky, kteří hrají na nějaký hudební nástroj, c) levostrannou alternativu, tj. tvrzení, že šance na úspěch v matematice jsou nižší pro žáky, kteří hrají na nějaký hudební nástroj. Řešení: Máme kontingenční tabulku úspěch v M hra na hudební nástroj n[j.] ano ne ano[] 6 4 10 ne 1 13 14 n[.k] 7 17 24 Vypočteme podíl šancí: . Podíl šancí nám říká, že žák, který hraje na nějaký hudební nástroj, má 19,5 x větší šanci na úspěch v matematice než žák, který nehraje na žádný hudební nástroj. ad a) Pro testování nulové hypotézy proti oboustranné alternativě sestrojíme oboustranný interval spolehlivosti: Dolní a horní mez intervalu spolehlivosti pro OR zjistíme pomocí STATISTIKY. Vytvoříme datový soubor o dvou proměnných DM a HM a jednom případu. Do Dlouhého jména proměnné DM napíšeme vzorec pro dolní mez: =exp(log(19,5)-sqrt(1/6+1/4+1/1+1/13)*VNormal(0,975;0;1)) a analogicky do Do Dlouhého jména proměnné HM napíšeme vzorec pro horní mez: =exp(log(19,5)+sqrt(1/6+1/4+1/1+1/13)*VNormal(0,975;0;1)) Vidíme, že 1,7773 < OR < 213,9486 s pravděpodobností aspoň 0,95. Protože tento interval neobsahuje 1, nulovou hypotézu zamítáme na asymptotické hladině významnosti 0,05 ve prospěch oboustranné alternativy. S rizikem omylu nejvýše 5% se tedy prokázalo, že úspěch v matematice souvisí s hrou na hudební nástroj. ad b) Pro testování nulové hypotézy proti pravostranné alternativě sestrojíme levostranný interval spolehlivosti: Do Dlouhého jména proměnné DM napíšeme vzorec pro dolní mez: =exp(log(19,5)-sqrt(1/6+1/4+1/1+1/13)*VNormal(0,95;0;1)) Protože interval (2,612213; ∞) neobsahuje 1, nulovou hypotézu zamítáme na asymptotické hladině významnosti 0,05 ve prospěch pravostranné alternativy. S rizikem omylu nejvýše 5% se tedy prokázalo, že žáci, kteří hrají na nějaký hudební nástroj, mají vyšší šance na úspěch v matematice. Ad c) Pro testování nulové hypotézy proti levostranné alternativě sestrojíme pravostranný interval spolehlivosti: Do Dlouhého jména proměnné HM napíšeme vzorec pro dolní mez: =exp(log(19,5)+sqrt(1/6+1/4+1/1+1/13)*VNormal(0,95;0;1)) Protože interval (-∞; 145,5663) obsahuje 1, nulovou hypotézu nezamítáme na asymptotické hladině významnosti 0,05 ve prospěch levostranné alternativy. Neprokázalo se tedy, že žáci, kteří hrají na nějaký hudební nástroj, mají nižší šance na úspěch v matematice.