Přechod na menu, Přechod na obsah, Přechod na patičku
     

B. Statistika

část B06–B10


B06 Statistický test rozdílu aritmetických průměrů dvou nepárovaných souborů

Často potřebujeme zjistit, zda se dva soubory (sportovci-nesportovci, pokusná a kontrolní skupina, apod.) od sebe liší v některém parametru, který lze změřit (tělesná výška, sportovní výkon, fyziologická hodnota apod.) K tomu použijeme tzv. test nepárovaných hodnot.

K provedení tohoto testu se používají aritmetické průměry, směrodatné odchylky a četnosti (počty osob) obou souborů. Nejdříve porovnáme velikosti směrodatných odchylek F-testem. Ten porovnáme s kritickou hodnotou Fkrit ze statistických tabulek pro četnosti obou souborů a zvolenou hladinu významnosti (v tělovýchově zpravidla p = 0.05 = 5 %). Podle výsledku F-testu provedeme pak jeden ze dvou možných t-testů. K vypočítané hodnotě t vložíme kritickou hodnotu tk rozdělení t ze statistických tabulek pro zvolenou hladinu významnosti a je-li vypočítané t větší nežli kritická hodnota, je rozdíl aritmetických průměrů statisticky významný na zvolené hladině významnosti. Můžeme ještě ověřit, zda je vypočítané t větší nežli tk pro p = 1 %, tedy pro 99 % pravděpodobnost (téměř jistotu) našeho závěru.

INPUT "m1,s1,n1="; m1, s1, n1
INPUT "m2,s2,n2="; m2, s2, n2
g1 = s1 * SQR(n1 / (n1 – 1)): g2 = s2 * SQR(n2 / (n2 – 1))
F = (g1 / g2) ^ 2
IF F < 1 THEN F = 1 / F
PRINT "F="; F
INPUT "Fkrit="; Fc
IF Fc < F THEN GOTO c
t = ABS(m1 – m2) * SQR((n1 + n2 – 2) / (n1 * s1 * s1 + n2 * s2 * s2) /
(1 / n1 + 1 / n2))
PRINT "t,n1,n2="; t; " "; n1; " "; n2
INPUT "tkrit="; tc: GOTO d
c:
a = s1 * s1 / (n1 – 1)
b = s2 * s2 / (n2 – 1)
t = ABS(m1 – m2) / SQR(a + b)
PRINT "t="; t
PRINT "n1-1="; n1 – 1: INPUT "t1="; t1
PRINT "n2-1="; n2 – 1: INPUT "t2="; t2
tk = (t1 * a + t2 * b) / (a + b)
PRINT "tk="; tk
d:
IF tk > t THEN PRINT "rozdíl není statisticky významný!": GOTO e
PRINT "rozdíl je statisticky významný!!!"
e:
END
Příklad:

m1,s1,n1 = 40,2.32,20
m2,s2,n2 = 38,3.31,18
F = 2.047516
Fk = 2.49
t = 2.115398
tk = 2.09

B07 Statistický test významnosti rozdílu
mezi dvěma párovanými soubory

Změříme-li jedné skupině osob některý parametr dvakrát, např. na začátku a konci daného časového intervalu nebo před působením nějakého vlivu (např. tréninku) a po něm,dostaneme dva soubory dat, kterým říkáme párované, protože ke každé osobě patří dva výsledky měření.

Statistickou významnost rozdílu těchto dvou párovaných souborů posoudíme pomocí testu párovaných dat. V něm počítáme rozdíly mezi dvojicemi, jejich aritmetický průměr p a směrodatnou odchylku sx a nakonec testovací kriterium

t=abs(p).\frac{\sqrt{n-1}}{s_x}

Hodnotu tohoto kriteria porovnáme s kritickou hodnotou tk z tabulek rozdělení t pro zvolenou hladinu významnosti p a počet stupňů volnosti.

DATA.38,.39,.56,.58,.45,.44,.49,.52,.38,.41,.41,.45
DATA.6,.59,.36,.37,.26,.28,.41,.42,.43,.42,.4,.38
a:
READ x, y: ON ERROR GOTO b
sx = sx + x: kx = kx + x * x
sy = sy + y: ky = ky + y * y
xy = xy + x * y: d = x – y
sd = sd + d: kd = kd + d * d
n = n + 1: GOTO a
b:
mx = sx / n: my = sy / n
s1 = SQR((kx – sx * sx / n) / (n – 1))
s2 = SQR((ky – sy * sy / n) / (n – 1))
c = (xy – sx * sy / n) / (n – 1)
r = c / (s1 * s2)
t = ABS(sd) / SQR((n * kd – sd * sd) / (n – 1))
PRINT
PRINT "mx,sx="; mx, s1
PRINT "my,sy="; my, s2
PRINT "r="; r
PRINT "t,n="; t, n
END
Příklad:

z dvojic dat, vepsaných do řádků DATA dostaneme
mx,sx =.4275, 9.056643E-02
my,sy =.4375, 8.884319E-02
r =.9775883
t,n = 1.816588, 12
Pro počet stupnů volnosti 11 najdeme kritickou hodnotu tkrit (2.201) a protože t je menší, není rozdíl statisticky významný na hladině p=5%.

B08 Analýza variance (ANOVA)

Testujeme-li rozdíl mezi dvěma průměry dvou souborů (např. t-testem), předpokládáme účinek změny jediného faktoru na aritmetický průměr závislé proměnné. Pro více nežli dva průměry a více než jeden faktor byl tento test zobecněn FISCHERem, zakladatelem analýzy variance (ANOVA). Jednoduchá analýza variance testuje účinek jednoho faktoru na více průměrů. Následující program může vzít libovolný počet souborů dat, každý s libovolným počtem dat. Program vypočítá průměry všech souborů a kriterium F, které srovnáme s kritickou hodnotou F ze statistických tabulek pro daný pár stupňů volnosti a zvolenou hladinu významnosti p (%).


Literatura

  1. Clauss G.-Ebner H.: Grundlagen der Statistik fuer Psychologen, Pedagogen und Soziologen. Berlin,Volk u. Wissen, 7. vyd., 1983
  2. Thomas J. R. – Nelson J. K.: Research Methods in Physical Activity Human Kinetics, Champaign, Illinois, 1990, 2nd. ed., p. 140

DATA 9,11,10,12,7,11,12,10,13,11,13,11,10,12,13
DATA 15,16,15,10,13,14,15,7,13,15,15,14,11,15,10
DATA 18,14,17,9,14,17,16,15,16,8,14,10,16,15,17
INPUT "pocet souboru="; n: DIM b(n), c(n)
FOR i = 1 TO n: PRINT i;
INPUT "pocet prvku="; b(i)
NEXT i: PRINT
d = 0: e = 0: f = 0
FOR i = 1 TO n: s = 0
FOR j = 1 TO b(i)
READ x
s = s + x: d = d + x * x: e = e + 1
NEXT j: g = g + s
c(i) = s * s: p = s / b(i)
PRINT "p"; i; "="; p
NEXT i
me = 0
FOR i = 1 TO n
me = me + c(i) / b(i)
NEXT i
me = me – g * g / e
ce = d – g * g / e
uv = ce – me
f = me / (n – 1) / uv * (e – n)
PRINT "F="; f
PRINT "n1,n2="; n – 1; e – n
END
Příklad:

z dat v řádcích DATA dostaneme:
pocet souboru=? 3
    1 pocet prvku=? 15
    2 pocet prvku=? 15
    3 pocet prvku=? 15
p 1 = 11
p 2 = 13.2
p 3 = 14.4 F= 7.149618
n1,n2= 2 42

V tabulkách najdeme pro n1, n2 kritickou hodnotu Fk = 4,05 (p=5%). Protože vypočítané F je větší, je rozdíl mezi třemi soubory statisticky významný.

B09 Součinitel parciální korelace mezi dvěma ze tří parametrů

Známe-li všechny tři korelační součinitele mezi třemi parametry téhož souboru, které označíme r12, r13, r23, pak můžeme stanovit částečnou (parciální) korelaci mezi kterýmikoliv dvěma parametry s vyloučením vlivu třetího, tedy za předpokladu, že třetí parametr je konstantní. Vzorce pro parciální korelační součinitele jsou

r_{12.3}=\frac{r_{12}-r_{13}.r_{23}}{\sqrt{(1-r_{13}^2).(1-r_{23}^2)}}
r_{13.2}=\frac{r_{13}-r_{12}.r_{23}}{\sqrt{(1-r_{12}^2).(1-r_{23}^2)}}
r_{23.1}=\frac{r_{23}-r_{12}.r_{13}}{\sqrt{(1-r_{12}^2).(1-r_{13}^2)}}
Příklad:

u skupiny dětí byly vypočítány korelační součinitele mezi
tělesnou výškou a hmotností r12 = 0,91
výškou a výkonem ve skoku vysokém r13 = 0,86
hmotností a výkonem ve skoku vysokém r23 = 0,69

Korelace mezi hmotností a výkonem ve skoku vysokém je překvapivě vysoká a kladná. Uvědomíme-li si ale, že těžší dítě bývá také vyšší, je zřejmé, že vazbu hmotnost/výkon zprostředkuje tělesná výška, kterou bychom měli vyloučit. Pak parciální korelační součinitel mezi hmotností a výkonem ve skoku vysokém tuto vazbu vylučuje:

r_{23.1}=\frac{0,69-0,91.0,86}{\sqrt{(1-0,91^2).(1-0,86^2)}}=-0,438

Místo původní kladné korelace jsme dostali zápornou parciální korelaci, protože byl vyloučen zprostředkující vliv tělesné výšky. S rostoucí hmotností při stálé tělesné výšce výkon ve skoku vysokém klesá.


Literatura

  1. Jahn W., Wahle H.: Die Faktoranalyse. Die Wirtschaft, Berlin, 1970, str. 36
  2. Storm Regina: Wahrscheinlichkeitsrechnung, mathematische Statistik und statistische Qualitatskontrolle. Fachbuchverlag, 1976, str. 242

INPUT "r12,r13,r23="; r12, r13, r23
p12 = (r12 – r13 * r23) / SQR((1 – r13 * r13) * (1 – r23 * r23))
p13 = (r13 – r12 * r23) / SQR((1 – r12 * r12) * (1 – r23 * r23))
p23 = (r23 – r12 * r13) / SQR((1 – r12 * r12) * (1 – r13 * r13))
PRINT "p12,p13,p23="; p12, p13, p23
END

B10 Součinitel parciální korelace mezi dvěma ze čtyř parametrů

Naměříme-li u souboru data o 4 nezávislých proměnných, existuje mezi proměnnými 4.3/2 = 6 možných korelací: r12, r13, r14, r23, r24, r34. Součinitele parciální korelace mezi dvojicemi s vyloučením vlivu zbývajících dvou proměnných počítáme pomocí následujících vzorců, např. pro r12.34, kde 1, 2 jsou indexy proměnných a 3, 4 jsou indexy konstantních parametrů.:

r_{12.3}=\frac{r_{12}-r_{13}.r_{23}}{\sqrt{(1-r_{13}^2).(1-r_{23}^2)}}
r_{14.3}=\frac{r_{14}-r_{13}.r_{34}}{\sqrt{(1-r_{13}^2).(1-r_{34}^2)}}
r_{24.3}=\frac{r_{24}-r_{23}.r_{34}}{\sqrt{(1-r_{23}^2).(1-r_{34}^2)}}

Z nich pak hledaný

r_{12.34}=\frac{r_{12.3}-r_{14.3}.r_{24.3}}{\sqrt{(1-r_{14.3}^2).(1-r_{24.3}^2)}}

Je nutno poznamenat, že ne všechny možné kombinace součinitelů korelace musí dát reálný výsledek. Při výpočtu podle následujícího programu bude takový případ hlášen jako chyba.

INPUT "r12,r13,r14=";r12,r13,r14
INPUT "r23,r24,r34=";r23,r24,r34
r123=(r12-r13*r23)/SQR((1-r13*r13)*(1-r23*r23))
r143=(r14-r13*r34)/SQR((1-r13*r13)*(1-r34*r34))
r243=(r24-r23*r34)/SQR((1-r23*r23)*(1-r34*r34))
r12=(r123-r143*r243)/SQR((1-r143*r143)*(r243*r243))
PRINT "r12.34=";r12
END
Příklad:

r12=0.8
r13=0.7
r14=0.9
r23=0.7
r24=0.6
r34=0.5
r12.34 = 0.59375
autor: Ing. Josef Kopřiva, recenzent: Mgr. Martin Sebera, Ph.D. |
Fakulta sportovních studií, Masarykova univerzita |
Návrat na úvodní stránku webu, přístupnost |
Stránky Fakulty sportovních studií MU
| Technická spolupráce:
| Servisní středisko pro e-learning na MU
| Fakulta informatiky Masarykovy univerzity, 2011

Technické řešení této výukové pomůcky je spolufinancováno Evropským sociálním fondem a státním rozpočtem České republiky.