Sport, matematika, počítač
Fakulta sportovních studií Masarykovy univerzity
Ing. Josef Kopřiva

Kliknutím na šedou plochu pod nápisem se vrátíte zpět nahoru

B. Statistika

část B06–B10

B06 Statistický test rozdílu aritmetických průměrů dvou nepárovaných souborů

Často potřebujeme zjistit, zda se dva soubory (sportovci-nesportovci, pokusná a kontrolní skupina, apod.) od sebe liší v některém parametru, který lze změřit (tělesná výška, sportovní výkon, fyziologická hodnota apod.) K tomu použijeme tzv. test nepárovaných hodnot.

K provedení tohoto testu se používají aritmetické průměry, směrodatné odchylky a četnosti (počty osob) obou souborů. Nejdříve porovnáme velikosti směrodatných odchylek F-testem. Ten porovnáme s kritickou hodnotou F_krit ze statistických tabulek pro četnosti obou souborů a zvolenou hladinu významnosti (v tělovýchově zpravidla p = 0.05 = 5 %). Podle výsledku F-testu provedeme pak jeden ze dvou možných t-testů. K vypočítané hodnotě t vložíme kritickou hodnotu t_k rozdělení t ze statistických tabulek pro zvolenou hladinu významnosti a je-li vypočítané t větší nežli kritická hodnota, je rozdíl aritmetických průměrů statisticky významný na zvolené hladině významnosti. Můžeme ještě ověřit, zda je vypočítané t větší nežli t_k pro p = 1 %, tedy pro 99 % pravděpodobnost (téměř jistotu) našeho závěru.


INPUT "m1,s1,n1="; m1, s1, n1

INPUT "m2,s2,n2="; m2, s2, n2

g1 = s1 * SQR(n1 / (n1 – 1)): g2 = s2 * SQR(n2 / (n2 – 1))

F = (g1 / g2) ^ 2

IF F < 1 THEN F = 1 / F

PRINT "F="; F

INPUT "Fkrit="; Fc

IF Fc < F THEN GOTO c

t = ABS(m1 – m2) * SQR((n1 + n2 – 2) / (n1 * s1 * s1 + n2 * s2 * s2) /

(1 / n1 + 1 / n2))

PRINT "t,n1,n2="; t; " "; n1; " "; n2

INPUT "tkrit="; tc: GOTO d

c:

a = s1 * s1 / (n1 – 1)

b = s2 * s2 / (n2 – 1)

t = ABS(m1 – m2) / SQR(a + b)

PRINT "t="; t

PRINT "n1-1="; n1 – 1: INPUT "t1="; t1

PRINT "n2-1="; n2 – 1: INPUT "t2="; t2

tk = (t1 * a + t2 * b) / (a + b)

PRINT "tk="; tk

d:

IF tk > t THEN PRINT "rozdíl není statisticky významný!": GOTO e

PRINT "rozdíl je statisticky významný!!!"

e:

END

Příklad:

m1,s1,n1 = 40,2.32,20
m2,s2,n2 = 38,3.31,18
F = 2.047516
Fk = 2.49
t = 2.115398
tk = 2.09

Nahoru

B07 Statistický test významnosti rozdílu
mezi dvěma párovanými soubory

Změříme-li jedné skupině osob některý parametr dvakrát, např. na začátku a konci daného časového intervalu nebo před působením nějakého vlivu (např. tréninku) a po něm,dostaneme dva soubory dat, kterým říkáme párované, protože ke každé osobě patří dva výsledky měření.

Statistickou významnost rozdílu těchto dvou párovaných souborů posoudíme pomocí testu párovaných dat. V něm počítáme rozdíly mezi dvojicemi, jejich aritmetický průměr p a směrodatnou odchylku s_x a nakonec testovací kriterium

$t=abs(p).\frac{\sqrt{n-1}}{s_x}$

Hodnotu tohoto kriteria porovnáme s kritickou hodnotou t_k z tabulek rozdělení t pro zvolenou hladinu významnosti p a počet stupňů volnosti.


DATA.38,.39,.56,.58,.45,.44,.49,.52,.38,.41,.41,.45

DATA.6,.59,.36,.37,.26,.28,.41,.42,.43,.42,.4,.38

a:

READ x, y: ON ERROR GOTO b

sx = sx + x: kx = kx + x * x

sy = sy + y: ky = ky + y * y

xy = xy + x * y: d = x – y

sd = sd + d: kd = kd + d * d

n = n + 1: GOTO a

b:

mx = sx / n: my = sy / n

s1 = SQR((kx – sx * sx / n) / (n – 1))

s2 = SQR((ky – sy * sy / n) / (n – 1))

c = (xy – sx * sy / n) / (n – 1)

r = c / (s1 * s2)

t = ABS(sd) / SQR((n * kd – sd * sd) / (n – 1))

PRINT

PRINT "mx,sx="; mx, s1

PRINT "my,sy="; my, s2

PRINT "r="; r

PRINT "t,n="; t, n

END

Příklad:

z dvojic dat, vepsaných do řádků DATA dostaneme
mx,sx =.4275, 9.056643E-02
my,sy =.4375, 8.884319E-02
r =.9775883
t,n = 1.816588, 12
Pro počet stupnů volnosti 11 najdeme kritickou hodnotu tkrit (2.201) a protože t je menší, není rozdíl statisticky významný na hladině p=5%.

Nahoru

B08 Analýza variance (ANOVA)

Testujeme-li rozdíl mezi dvěma průměry dvou souborů (např. t-testem), předpokládáme účinek změny jediného faktoru na aritmetický průměr závislé proměnné. Pro více nežli dva průměry a více než jeden faktor byl tento test zobecněn FISCHERem, zakladatelem analýzy variance (ANOVA). Jednoduchá analýza variance testuje účinek jednoho faktoru na více průměrů. Následující program může vzít libovolný počet souborů dat, každý s libovolným počtem dat. Program vypočítá průměry všech souborů a kriterium F, které srovnáme s kritickou hodnotou F ze statistických tabulek pro daný pár stupňů volnosti a zvolenou hladinu významnosti p (%).

Literatura

Clauss G.-Ebner H.: Grundlagen der Statistik fuer Psychologen, Pedagogen und Soziologen. Berlin,Volk u. Wissen, 7. vyd., 1983
Thomas J. R. – Nelson J. K.: Research Methods in Physical Activity Human Kinetics, Champaign, Illinois, 1990, 2nd. ed., p. 140


DATA 9,11,10,12,7,11,12,10,13,11,13,11,10,12,13

DATA 15,16,15,10,13,14,15,7,13,15,15,14,11,15,10

DATA 18,14,17,9,14,17,16,15,16,8,14,10,16,15,17

INPUT "pocet souboru="; n: DIM b(n), c(n)

FOR i = 1 TO n: PRINT i;

INPUT "pocet prvku="; b(i)

NEXT i: PRINT

d = 0: e = 0: f = 0

FOR i = 1 TO n: s = 0

FOR j = 1 TO b(i)

READ x

s = s + x: d = d + x * x: e = e + 1

NEXT j: g = g + s

c(i) = s * s: p = s / b(i)

PRINT "p"; i; "="; p

NEXT i

me = 0

FOR i = 1 TO n

me = me + c(i) / b(i)

NEXT i

me = me – g * g / e

ce = d – g * g / e

uv = ce – me

f = me / (n – 1) / uv * (e – n)

PRINT "F="; f

PRINT "n1,n2="; n – 1; e – n

END

Příklad:

z dat v řádcích DATA dostaneme:
pocet souboru=? 3
    1 pocet prvku=? 15
    2 pocet prvku=? 15
    3 pocet prvku=? 15
p 1 = 11
p 2 = 13.2
p 3 = 14.4 F= 7.149618
n1,n2= 2 42

V tabulkách najdeme pro n1, n2 kritickou hodnotu F_k = 4,05 (p=5%). Protože vypočítané F je větší, je rozdíl mezi třemi soubory statisticky významný.

Nahoru

B09 Součinitel parciální korelace mezi dvěma ze tří parametrů

Známe-li všechny tři korelační součinitele mezi třemi parametry téhož souboru, které označíme r₁₂, r₁₃, r₂₃, pak můžeme stanovit částečnou (parciální) korelaci mezi kterýmikoliv dvěma parametry s vyloučením vlivu třetího, tedy za předpokladu, že třetí parametr je konstantní. Vzorce pro parciální korelační součinitele jsou

$r_{12.3}=\frac{r_{12}-r_{13}.r_{23}}{\sqrt{(1-r_{13}^2).(1-r_{23}^2)}}$

$r_{13.2}=\frac{r_{13}-r_{12}.r_{23}}{\sqrt{(1-r_{12}^2).(1-r_{23}^2)}}$

$r_{23.1}=\frac{r_{23}-r_{12}.r_{13}}{\sqrt{(1-r_{12}^2).(1-r_{13}^2)}}$

Příklad:

u skupiny dětí byly vypočítány korelační součinitele mezi

tělesnou výškou a hmotností	r₁₂ = 0,91
výškou a výkonem ve skoku vysokém	r₁₃ = 0,86
hmotností a výkonem ve skoku vysokém	r₂₃ = 0,69

Korelace mezi hmotností a výkonem ve skoku vysokém je překvapivě vysoká a kladná. Uvědomíme-li si ale, že těžší dítě bývá také vyšší, je zřejmé, že vazbu hmotnost/výkon zprostředkuje tělesná výška, kterou bychom měli vyloučit. Pak parciální korelační součinitel mezi hmotností a výkonem ve skoku vysokém tuto vazbu vylučuje:

$r_{23.1}=\frac{0,69-0,91.0,86}{\sqrt{(1-0,91^2).(1-0,86^2)}}=-0,438$

Místo původní kladné korelace jsme dostali zápornou parciální korelaci, protože byl vyloučen zprostředkující vliv tělesné výšky. S rostoucí hmotností při stálé tělesné výšce výkon ve skoku vysokém klesá.

Literatura

Jahn W., Wahle H.: Die Faktoranalyse. Die Wirtschaft, Berlin, 1970, str. 36
Storm Regina: Wahrscheinlichkeitsrechnung, mathematische Statistik und statistische Qualitatskontrolle. Fachbuchverlag, 1976, str. 242


INPUT "r12,r13,r23="; r12, r13, r23

p12 = (r12 – r13 * r23) / SQR((1 – r13 * r13) * (1 – r23 * r23))

p13 = (r13 – r12 * r23) / SQR((1 – r12 * r12) * (1 – r23 * r23))

p23 = (r23 – r12 * r13) / SQR((1 – r12 * r12) * (1 – r13 * r13))

PRINT "p12,p13,p23="; p12, p13, p23

END

Nahoru

B10 Součinitel parciální korelace mezi dvěma ze čtyř parametrů

Naměříme-li u souboru data o 4 nezávislých proměnných, existuje mezi proměnnými 4.3/2 = 6 možných korelací: r₁₂, r₁₃, r₁₄, r₂₃, r₂₄, r₃₄. Součinitele parciální korelace mezi dvojicemi s vyloučením vlivu zbývajících dvou proměnných počítáme pomocí následujících vzorců, např. pro r_12.34, kde 1, 2 jsou indexy proměnných a 3, 4 jsou indexy konstantních parametrů.:

$r_{12.3}=\frac{r_{12}-r_{13}.r_{23}}{\sqrt{(1-r_{13}^2).(1-r_{23}^2)}}$

$r_{14.3}=\frac{r_{14}-r_{13}.r_{34}}{\sqrt{(1-r_{13}^2).(1-r_{34}^2)}}$

$r_{24.3}=\frac{r_{24}-r_{23}.r_{34}}{\sqrt{(1-r_{23}^2).(1-r_{34}^2)}}$

Z nich pak hledaný

$r_{12.34}=\frac{r_{12.3}-r_{14.3}.r_{24.3}}{\sqrt{(1-r_{14.3}^2).(1-r_{24.3}^2)}}$

Je nutno poznamenat, že ne všechny možné kombinace součinitelů korelace musí dát reálný výsledek. Při výpočtu podle následujícího programu bude takový případ hlášen jako chyba.


INPUT "r12,r13,r14=";r12,r13,r14

INPUT "r23,r24,r34=";r23,r24,r34

r123=(r12-r13*r23)/SQR((1-r13*r13)*(1-r23*r23))

r143=(r14-r13*r34)/SQR((1-r13*r13)*(1-r34*r34))

r243=(r24-r23*r34)/SQR((1-r23*r23)*(1-r34*r34))

r12=(r123-r143*r243)/SQR((1-r143*r143)*(r243*r243))

PRINT "r12.34=";r12

END

Příklad:

r12=0.8
r13=0.7
r14=0.9
r23=0.7
r24=0.6
r34=0.5
r12.34 = 0.59375

autor: Ing. Josef Kopřiva, recenzent: Mgr. Martin Sebera, Ph.D. |
Fakulta sportovních studií, Masarykova univerzita |
Návrat na úvodní stránku webu, přístupnost |

| Technická spolupráce:
| Servisní středisko pro e-learning na MU
| Fakulta informatiky Masarykovy univerzity, 2011

Technické řešení této výukové pomůcky je spolufinancováno Evropským sociálním fondem a státním rozpočtem České republiky.

Nahoru

INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ

B. Statistika

B06 Statistický test rozdílu aritmetických průměrů dvou nepárovaných souborů

B07 Statistický test významnosti rozdílumezi dvěma párovanými soubory

B08 Analýza variance (ANOVA)

Literatura

B09 Součinitel parciální korelace mezi dvěma ze tří parametrů

Literatura

B10 Součinitel parciální korelace mezi dvěma ze čtyř parametrů

B07 Statistický test významnosti rozdílu
mezi dvěma párovanými soubory