část B06–B10
Často potřebujeme zjistit, zda se dva soubory (sportovci-nesportovci, pokusná a kontrolní skupina, apod.) od sebe liší v některém parametru, který lze změřit (tělesná výška, sportovní výkon, fyziologická hodnota apod.) K tomu použijeme tzv. test nepárovaných hodnot.
K provedení tohoto testu se používají aritmetické průměry, směrodatné odchylky a četnosti (počty osob) obou souborů. Nejdříve porovnáme velikosti směrodatných odchylek F-testem. Ten porovnáme s kritickou hodnotou Fkrit ze statistických tabulek pro četnosti obou souborů a zvolenou hladinu významnosti (v tělovýchově zpravidla p = 0.05 = 5 %). Podle výsledku F-testu provedeme pak jeden ze dvou možných t-testů. K vypočítané hodnotě t vložíme kritickou hodnotu tk rozdělení t ze statistických tabulek pro zvolenou hladinu významnosti a je-li vypočítané t větší nežli kritická hodnota, je rozdíl aritmetických průměrů statisticky významný na zvolené hladině významnosti. Můžeme ještě ověřit, zda je vypočítané t větší nežli tk pro p = 1 %, tedy pro 99 % pravděpodobnost (téměř jistotu) našeho závěru.
INPUT "m1,s1,n1="; m1, s1, n1
INPUT "m2,s2,n2="; m2, s2, n2
g1 = s1 * SQR(n1 / (n1 – 1)): g2 = s2 * SQR(n2 / (n2 – 1))
F = (g1 / g2) ^ 2
IF F < 1 THEN F = 1 / F
PRINT "F="; F
INPUT "Fkrit="; Fc
IF Fc < F THEN GOTO c
t = ABS(m1 – m2) * SQR((n1 + n2 – 2) / (n1 * s1 * s1 + n2 * s2 * s2) /
(1 / n1 + 1 / n2))
PRINT "t,n1,n2="; t; " "; n1; " "; n2
INPUT "tkrit="; tc: GOTO d
c:
a = s1 * s1 / (n1 – 1)
b = s2 * s2 / (n2 – 1)
t = ABS(m1 – m2) / SQR(a + b)
PRINT "t="; t
PRINT "n1-1="; n1 – 1: INPUT "t1="; t1
PRINT "n2-1="; n2 – 1: INPUT "t2="; t2
tk = (t1 * a + t2 * b) / (a + b)
PRINT "tk="; tk
d:
IF tk > t THEN PRINT "rozdíl není statisticky významný!": GOTO e
PRINT "rozdíl je statisticky významný!!!"
e:
END
Změříme-li jedné skupině osob některý parametr dvakrát, např. na začátku a konci daného časového intervalu nebo před působením nějakého vlivu (např. tréninku) a po něm,dostaneme dva soubory dat, kterým říkáme párované, protože ke každé osobě patří dva výsledky měření.
Statistickou významnost rozdílu těchto dvou párovaných souborů posoudíme pomocí testu párovaných dat. V něm počítáme rozdíly mezi dvojicemi, jejich aritmetický průměr p a směrodatnou odchylku sx a nakonec testovací kriterium
Hodnotu tohoto kriteria porovnáme s kritickou hodnotou tk z tabulek rozdělení t pro zvolenou hladinu významnosti p a počet stupňů volnosti.
DATA.38,.39,.56,.58,.45,.44,.49,.52,.38,.41,.41,.45
DATA.6,.59,.36,.37,.26,.28,.41,.42,.43,.42,.4,.38
a:
READ x, y: ON ERROR GOTO b
sx = sx + x: kx = kx + x * x
sy = sy + y: ky = ky + y * y
xy = xy + x * y: d = x – y
sd = sd + d: kd = kd + d * d
n = n + 1: GOTO a
b:
mx = sx / n: my = sy / n
s1 = SQR((kx – sx * sx / n) / (n – 1))
s2 = SQR((ky – sy * sy / n) / (n – 1))
c = (xy – sx * sy / n) / (n – 1)
r = c / (s1 * s2)
t = ABS(sd) / SQR((n * kd – sd * sd) / (n – 1))
PRINT
PRINT "mx,sx="; mx, s1
PRINT "my,sy="; my, s2
PRINT "r="; r
PRINT "t,n="; t, n
END
Testujeme-li rozdíl mezi dvěma průměry dvou souborů (např. t-testem), předpokládáme účinek změny jediného faktoru na aritmetický průměr závislé proměnné. Pro více nežli dva průměry a více než jeden faktor byl tento test zobecněn FISCHERem, zakladatelem analýzy variance (ANOVA). Jednoduchá analýza variance testuje účinek jednoho faktoru na více průměrů. Následující program může vzít libovolný počet souborů dat, každý s libovolným počtem dat. Program vypočítá průměry všech souborů a kriterium F, které srovnáme s kritickou hodnotou F ze statistických tabulek pro daný pár stupňů volnosti a zvolenou hladinu významnosti p (%).
DATA 9,11,10,12,7,11,12,10,13,11,13,11,10,12,13
DATA 15,16,15,10,13,14,15,7,13,15,15,14,11,15,10
DATA 18,14,17,9,14,17,16,15,16,8,14,10,16,15,17
INPUT "pocet souboru="; n: DIM b(n), c(n)
FOR i = 1 TO n: PRINT i;
INPUT "pocet prvku="; b(i)
NEXT i: PRINT
d = 0: e = 0: f = 0
FOR i = 1 TO n: s = 0
FOR j = 1 TO b(i)
READ x
s = s + x: d = d + x * x: e = e + 1
NEXT j: g = g + s
c(i) = s * s: p = s / b(i)
PRINT "p"; i; "="; p
NEXT i
me = 0
FOR i = 1 TO n
me = me + c(i) / b(i)
NEXT i
me = me – g * g / e
ce = d – g * g / e
uv = ce – me
f = me / (n – 1) / uv * (e – n)
PRINT "F="; f
PRINT "n1,n2="; n – 1; e – n
END
Známe-li všechny tři korelační součinitele mezi třemi parametry téhož souboru, které označíme r12, r13, r23, pak můžeme stanovit částečnou (parciální) korelaci mezi kterýmikoliv dvěma parametry s vyloučením vlivu třetího, tedy za předpokladu, že třetí parametr je konstantní. Vzorce pro parciální korelační součinitele jsou
tělesnou výškou a hmotností | r12 = 0,91 |
výškou a výkonem ve skoku vysokém | r13 = 0,86 |
hmotností a výkonem ve skoku vysokém | r23 = 0,69 |
Korelace mezi hmotností a výkonem ve skoku vysokém je překvapivě vysoká a kladná. Uvědomíme-li si ale, že těžší dítě bývá také vyšší, je zřejmé, že vazbu hmotnost/výkon zprostředkuje tělesná výška, kterou bychom měli vyloučit. Pak parciální korelační součinitel mezi hmotností a výkonem ve skoku vysokém tuto vazbu vylučuje:
Místo původní kladné korelace jsme dostali zápornou parciální korelaci, protože byl vyloučen zprostředkující vliv tělesné výšky. S rostoucí hmotností při stálé tělesné výšce výkon ve skoku vysokém klesá.
INPUT "r12,r13,r23="; r12, r13, r23
p12 = (r12 – r13 * r23) / SQR((1 – r13 * r13) * (1 – r23 * r23))
p13 = (r13 – r12 * r23) / SQR((1 – r12 * r12) * (1 – r23 * r23))
p23 = (r23 – r12 * r13) / SQR((1 – r12 * r12) * (1 – r13 * r13))
PRINT "p12,p13,p23="; p12, p13, p23
END
Naměříme-li u souboru data o 4 nezávislých proměnných, existuje mezi proměnnými 4.3/2 = 6 možných korelací: r12, r13, r14, r23, r24, r34. Součinitele parciální korelace mezi dvojicemi s vyloučením vlivu zbývajících dvou proměnných počítáme pomocí následujících vzorců, např. pro r12.34, kde 1, 2 jsou indexy proměnných a 3, 4 jsou indexy konstantních parametrů.:
Z nich pak hledaný
Je nutno poznamenat, že ne všechny možné kombinace součinitelů korelace musí dát reálný výsledek. Při výpočtu podle následujícího programu bude takový případ hlášen jako chyba.
INPUT "r12,r13,r14=";r12,r13,r14
INPUT "r23,r24,r34=";r23,r24,r34
r123=(r12-r13*r23)/SQR((1-r13*r13)*(1-r23*r23))
r143=(r14-r13*r34)/SQR((1-r13*r13)*(1-r34*r34))
r243=(r24-r23*r34)/SQR((1-r23*r23)*(1-r34*r34))
r12=(r123-r143*r243)/SQR((1-r143*r143)*(r243*r243))
PRINT "r12.34=";r12
END
Technické řešení této výukové pomůcky je spolufinancováno Evropským sociálním fondem a státním rozpočtem České republiky.