Jednoduchá, mnohonásobná a parciální korelace Pearsonův koeficient korelace Nechť X, Y jsou náhodné veličiny se středními hodnotami E(X), E(Y) a rozptyly D(X), D(Y). Číslo se nazývá Pearsonův koeficient korelace. (Pro výpočet Pearsonova koeficentu korelace musíme znát simultánní distribuční funkci Φ(x,y) v obecném případě resp. simultánní hustotu pravděpodobnosti φ(x,y) ve spojitém případě resp. simultánní pravděpodobnostní funkci π(x,y) v diskrétním případě.) Vlastnosti Pearsonova koeficientu korelace a) R(a[1], Y) = R(X, a[2]) = R(a[1], a[2]) = 0 b) R(a[1] + b[1]X, a[2] + b[2]Y) = sgn(b[1]b[2]) R(X, Y) = c) R(X, X) = 1 pro D(X) ≠ 0, R(X, X) = 0 jinak d) R(X, Y) = R(Y, X) e) a rovnost nastane tehdy a jen tehdy, když mezi veličinami X, Y existuje s pravděpodobností 1 úplná lineární závislost, tj. existují konstanty a, b tak, že pravděpodobnost P(Y = a + bX) = 1. Přitom R(X, Y) = 1, když b > 0 a R(X, Y) = -1, když b < 0. (Uvedená nerovnost se nazývá Cauchyova – Schwarzova – Buňakovského nerovnost.) Z vlastností Pearsonova koeficientu korelace vyplývá, že se hodí pouze k měření těsnosti lineárního vztahu veličin X a Y. Při složitějších závislostech může dojít k paradoxní situaci, že Pearsonův koeficient korelace je nulový. Ilustrace: Definice nekorelovanosti Je-li R(X, Y) = 0, pak řekneme, že náhodné veličiny jsou nekorelované. (Znamená to, že mezi X a Y neexistuje žádná lineární závislost. Jsou-li náhodné veličiny X,Y stochasticky nezávislé, pak jsou samozřejmě i nekorelované.) Je-li R(X, Y) > 0, pak řekneme, že náhodné veličiny jsou kladně korelované. (Znamená to, že s růstem hodnot veličiny X rostou hodnoty veličiny Y a s poklesem hodnot veličiny X klesají hodnoty veličiny Y.) Je-li R(X, Y) < 0, pak řekneme, že náhodné veličiny jsou záporně korelované. (Znamená to, že s růstem hodnot veličiny X klesají hodnoty veličiny Y a s poklesem hodnot veličiny X rostou hodnoty veličiny Y.) Výběrový koeficient korelace Nechť (X[1], Y[1]), ..., (X[n], Y[n]) náhodný výběr rozsahu n z dvourozměrného rozložení daného distribuční funkcí Φ(x,y). Z tohoto dvourozměrného náhodného výběru můžeme stanovit: výběrové průměry , , výběrové rozptyly , , výběrovou kovarianci a s jejich pomocí zavedeme výběrový koeficient korelace . Vlastnosti Pearsonova koeficientu korelace se přenášejí i na výběrový koeficient korelace. (Výběrový koeficient korelace není nestranným odhadem skutečného koeficientu korelace, je odhadem vychýleným. Vychýlení je zanedbatekně malé pro rozsahy výběrů nad 30.) Pearsonův koeficient korelace dvourozměrného normálního rozložení Nechť náhodný vektor (X, Y) má dvourozměrné normální rozložení s hustotou , přičemž μ[1] = E(X), μ[2] = E(Y), σ[1]^2 = D(X), σ[2]^2 = D(Y), ρ = R(X,Y). Marginální hustoty jsou: , . Je-li ρ = 0, pak pro , tedy náhodné veličiny X, Y jsou stochasticky nezávislé. Jinými slovy: stochastická nezávislost složek X, Y normálně rozloženého náhodného vektoru je ekvivalentní jejich nekorelovanosti. Pro jiná dvourozměrná rozložení to neplatí! Upozornění: nadále budeme předpokládat, že (X[1], Y[1]), ..., (X[n], Y[n]) je náhodný výběr rozsahu n z dvourozměrného normálního rozložení N[2] . Předpoklad dvourozměrné normality lze orientačně ověřit pomocí dvourozměrného tečkového diagramu: tečky by měly zhruba rovnoměrně vyplnit vnitřek elipsovitého obrazce. Vrstevnice hustoty dvourozměrného normálního rozložení jsou totiž elipsy: Graf hustoty a vrstevnice dvourozměrného normálního rozložení s parametry μ[1] = 0, μ[2] = 0, σ[1]^2 = 1, σ[2]^2 = 1, ρ = -0,75: Do dvourozměrného tečkového diagramu můžeme ještě zakreslit 100(1-α)% elipsu konstantní hustoty pravděpodobnosti. Bude-li více než 100α% teček ležet vně této elipsy, svědčí to o porušení dvourozměrné normality. Bude-li mít hlavní osa elipsy kladnou resp. zápornou směrnici, znamená to, že mezi veličinami X a Y existuje určitý stupeň přímé resp. nepřímé lineární závislosti. Testování hypotézy o nezávislosti Na hladině významnosti α testujeme H[0]: X, Y jsou stochasticky nezávislé náhodné veličiny (tj. ρ = 0) proti - oboustranné alternativě H[1]: X, Y nejsou stochasticky nezávislé náhodné veličiny (tj. ρ ≠ 0) - levostranné alternativě H[1]: X, Y jsou záporně korelované náhodné veličiny (tj. ρ < 0) - pravostranné alternativě H[1]: X, Y jsou kladně korelované náhodné veličiny (tj. ρ > 0). Testová statistika má tvar: . Platí-li nulová hypotéza, pak T[0] ~ t(n-2). Kritický obor pro test H[0] proti - oboustranné alternativě: , - levostranné alternativě: , - pravostranné alternativě: . H[0] zamítáme na hladině významnosti α, když . Příklad: Testování hypotézy o nezávislosti proti oboustranné alternativě V dílně pracuje 15 dělníků. Byl u nich zjištěn počet směn odpracovaných za měsíc (náhodná veličina X) a počet zhotovených výrobků (náhodná veličina Y): X 20 21 18 17 20 18 19 21 20 14 16 19 21 15 15 Y 92 93 83 80 91 85 82 98 90 60 73 86 96 64 81. Orientačně ověřte dvourozměrnou normalitu dat, vypočtěte výběrový koeficient korelace mezi X a Y a na hladině 0,01 testujte hypotézu o nezávislosti X a Y proti oboustranné alternativě. Řešení: Dvourozměrnou normalitu dat ověříme pomocí dvourozměrného tečkového diagramu. Vidíme, že předpoklad dvourozměrné normality je oprávněný. Vypočteme realizace výběrových průměrů: m[1] = = 18,267, m[2] = = 83,6, výběrových rozptylů: s[1]^2 = = 5,6381, s[2]^2 = = 121,4, výběrové kovariance: s[12] = = 24,2571, výběrového koeficientu korelace: = 0,927. Realizace testové statistiky: = 8,912, kritický obor . Protože , hypotézu o nezávislosti veličin X a Y zamítáme na hladině významnosti 0,01. S rizikem omylu nejvýše 1% jsme tedy prokázali, že mezi počtem směn odpracovaných za měsíc a počtem zhotovených výrobků existuje závislost. Výpočet pomocí systému STATISTICA Vytvoříme datový soubor o dvou proměnných X, Y a 15 případech. Dvourozměrnou normalitu dat ověříme pomocí dvourozměrného tečkového diagramu – viz výše. Statistiky – Základní statistiky/tabulky – Korelační matice – OK – 1 seznam proměn. – X, Y – OK – na záložce Možnosti vybereme Zobrazit detailní tabulku výsledků – Výpočet. Výběrový koeficient korelace se realizoval hodnotou 0,92718, testová statistika nabyla hodnoty 8,924, odpovídající p-hodnota je 0,000001, tedy na hladině významnosti 0,01 zamítáme hypotézu o nezávislosti veličin X, Y. Výpočet pomocí systému SPSS Analyze – Correlate – Bivariate – Variables X, Y – OK Vidíme, že na rozdíl od systému STATISTICA systém SPSS neposkytuje hodnotu testové statistiky, ve výstupní tabulce lze najít pouze realizaci výběrového koeficientu korelace, odpovídající p-hodnotu a rozsah náhodného výběru. Interval spolehlivosti pro korelační koeficient Náhodná veličina má přibližně normální rozložení se střední hodnotou (2. sčítanec lze při větším n zanedbat) a rozptylem . Standardizací veličiny Z dostaneme veličinu , která má asymptoticky rozložení N(0,1). Tudíž 100(1-α)% asymptotický interval spolehlivosti pro bude mít meze . Interval spolehlivosti pro ρ pak dostaneme zpětnou transformací. Poznámka: Jelikož Z = arctgh R[12], dostáváme R[12] = tgh Z a meze intervalu spolehlivosti pro ρ můžeme psát ve tvaru , přičemž . Příklad: Pracovník personálního oddělení určité firmy zkoumá, zda existuje vztah mezi počtem dní absence za rok (veličina Y) a věkem pracovníka (veličina X). Proto náhodně vybral údaje o 10 pracovnících. Č.prac. 1 2 3 4 5 6 7 8 9 10 X 27 61 37 23 46 58 29 36 64 40 Y 15 6 10 18 9 7 14 11 5 8 Za předpokladu, že uvedené údaje tvoří číselné realizace náhodného výběru rozsahu 10 z dvourozměrného normálního rozložení, vypočtěte výběrový korelační koeficient a na hladině významnosti 0,05 testujte hypotézu, že X a Y jsou nezávislé náhodné veličiny. Sestrojte 95% asymptotický interval spolehlivosti pro skutečný korelační koeficient ρ. Řešení: Předpoklad o dvourozměrné normalitě dat ověříme orientačně pomocí dvourozměrného tečkového diagramu. Vzhled diagramu svědčí o tom, že předpoklad je oprávněný. Testujeme H[0]: ρ = 0 proti H[1]: ρ ≠ 0. Vypočítáme R[12] = -0,9325, tedy mezi věkem pracovníka a počtem dnů pracovní neschopnosti existuje silná nepřímá lineární závislost. Testová statistika: T = -7,3053, kvantil t[0,975](8) = 2,306, kritický obor . Jelikož , zamítáme na hladině významnosti 0,05 hypotézu o nezávislosti veličin X a Y. Vypočítáme . Meze 95% asymptotického intervalu spolehlivosti pro ρ jsou , tedy -0,9842 < ρ < -0,7336 s pravděpodobností přibližně 0,95. Výpočet pomocí systému STATISTICA: Ve STATISTICE vypočteme meze 100(1-α)% asymptotického intervalu spolehlivosti pro koeficient korelace ρ tak, že otevřeme nový datový soubor se dvěma proměnnými (pojmenujeme je DM a HM) a jedním případem. Do Dlouhého jména proměnné DM zapíšeme příkaz = TanH(0,5*log((1-0,9325)/(1+0,9325))-VNormal(0,975;0;1)/sqrt(7)) a do Dlouhého jména proměnné HM zapíšeme příkaz = TanH(0,5*log((1-0,9325)/(1+0,9325))+VNormal(0,975;0;1)/sqrt(7)) 95% asymptotický interval spolehlivosti pro koeficient korelace ρ má tedy meze –0,98425 a -0,73358. (Protože nepokrývá hodnotu 0, zamítáme hypotézu o nezávislosti veličin X, Y na asymptotické hladině významnosti 0,05.) Výpočet pomocí systému SPSS Vzhledem k tomu, že v SPSS není dostupná funkce TanH, využijeme toho, že . Dále pro výpočet kvantilů rozložení N(0,1) použijeme funkci IDF.NORMAL(x, mean, std). K datovému souboru přidáme 4 proměnné pojmenované pom1, pom2, dm, hm. Transform – Compute Variable – Target Variable pom1 = 0.5*ln((1-0.9325)/(1+0.9325))-IDF.Normal(0.975,0,1)/sqrt(7) OK – OK Transform – Compute Variable – Target Variable pom2 = 0.5*ln((1-0.9325)/(1+0.9325))+IDF.Normal(0.975,0,1)/sqrt(7) OK - OK Transform – Compute Variable – Target Variable dm = (exp(pom1)-exp(-pom1))/(exp(pom1)+exp(-pom1)) OK - OK Transform – Compute Variable – Target Variable hm = (exp(pom2)-exp(-pom2))/(exp(pom2)+exp(-pom2)) OK – OK Dostaneme výsledek dm = –0,9842 a hm = -0,7336. Varianční, kovarianční a korelační matice Nechť X = (X[1], …, X[p])’ je náhodný vektor. Označme μ[i] = E(X[i]) střední hodnotu náhodné veličiny X[i], σ[i]^2 = D(X[i]) rozptyl náhodné veličiny X[i], σ[ij] = C(X[i], X[j]) kovarianci náhodných veličin X[i], X[j] ρ[ij] = R(X[i], X[j]) koeficient korelace náhodných veličin X[i], X[j] Vektor E(X) = (μ[1], …, μ[p])’ se nazývá vektor středních hodnot náhodného vektoru X. Čtvercová matice řádu p var(X) = (σ[ij])[i,j=1, …, p] se nazývá varianční matice náhodného vektoru X. Čtvercová matice řádu p cor(X) = (ρ[ij])[ i,j=1, …, p] se nazývá korelační matice náhodného vektoru X. Je zřejmé, že varianční matice a korelační matice jsou symetrické. Nechť X = (X[1], …, X[p])’ a Y = (Y[1], …, Y[q])’ jsou náhodné vektory. Matice typu pxq cov(X,Y) = (C(X[i], Y[j])) se nazývá kovarianční matice vektorů X, Y. Matice typu pxq cor(X,Y) = (ρ(X[i], Y[j])) se nazývá korelační matice vektorů X,Y. Odhady vektoru středních hodnot, varianční a korelační matice jednoho náhodného vektoru X Nechť X je náhodný vektor, který má p-rozměrné rozložení s vektorem středních hodnot μ, varianční maticí var(X) a korelační maticí cor(X). Nechť je dán náhodný výběr X[1] = (X[11], …, X[1p])’, …, X[n] = (X[n1], …, X[np])’ rozsahu n z tohoto rozložení. Nestranný odhad vektoru μ je vektor výběrových průměrů M = (M[1], …, M[p])’, kde je výběrový průměr j-tého výběru, j = 1, …, p. Nestranný odhad matice var(X) je výběrová varianční matice S = (S[ij]) = řádu p. Vychýlený odhad matice cor(X) je výběrová korelační matice R = (R[ij]), kde R[ij] je výběrový korelační koeficient i-té a j-té složky vektoru X, tedy , i, j = 1, …, p. (Je zřejmé, že diagonální prvky matice R jsou jedničky a matice R je symetrická.) Odhady kovarianční a korelační matice dvou náhodných vektorů X, Y Nechť náhodný vektor X má p-rozměrné rozložení a nechť X[1], …, X[n] je náhodný výběr z tohoto rozložení. Nechť náhodný vektor Y má q-rozměrné rozložení a nechť Y[1], …, Y[n] je náhodný výběr z tohoto rozložení. Předpokládejme, že obě rozložení mají konečné druhé momenty. Nechť cov(X, Y) je kovarianční matice těchto vektorů a cor(X, Y) je korelační matice těchto vektorů. Označme , M[X] = (M[X][1], …, M[X][p])’, M[Y] = (M[Y][1], …, M[Y][q])’. Nestranným odhadem kovarianční matice cov(X, Y) vektorů X, Y je výběrová kovarianční matice vektorů X, Y definovaná vzorcem S[XY] = (S[ij]) = , i = 1, …, p, j = 1, …, q. Vychýleným odhadem korelační matice cor(X, Y) vektorů X, Y je výběrová korelační matice vektorů X, Y definovaná vzorcem R[XY] = (R[ij]), kde R[ij] je výběrový korelační koeficient i-té a j-té složky vektorů X, Y, i = 1, …, p, j = 1, …, q. Koeficient mnohonásobné korelace a výběrový koeficient mnohonásobné korelace Intenzitu lineární závislosti mezi náhodnou veličinou Y a náhodným vektorem X = (X[1], …, X[p])’ měříme pomocí koeficientu mnohonásobné korelace ρ[Y. X]. Jeho druhá mocnina je dána vzorcem ρ[Y. X]^ 2 = cor(Y, X) cor(X)^-1 cor(X, Y). Má tyto vlastnosti: a) ρ[Y. X] ≥ 0 b) ρ[Y. X] ≥ c) d) ρ[Y. X] = 1 existují konstanty β[0], β[1], …, β[p] tak, že Y = β[0] + β[1]X[1] +… + β[p] X[p]. Nechť náhodný vektor (Y, X[1], …, X[p])’ má (p+1)-rozměrné rozložení s koeficientem mnohonásobné korelace ρ[Y. X]. Nechť je dán náhodný výběr (Y[1], X[11], …, X[1p])’, …, (Y[n], X[n1], …, X[np])’ rozsahu n z tohoto rozložení. Pak jako odhad ρ[Y. X] slouží výběrový koeficient mnohonásobné korelace r[Y. X], jehož druhá mocnina je dána vzorcem r[Y. X]^ 2 = R[YX] R^-1 R[X][Y], kde R[YX] je výběrová korelační matice veličiny Y a vektoru X (v tomto případě se redukuje na vektor ) a R je výběrová korelační matice vektoru X. Vlastnosti (a), (b), (c), (d) koeficientu mnohonásobné korelace se přenášejí i na výběrový koeficient mnohonásobné korelace. Testování hypotézy o nezávislosti veličiny Y a vektoru X Popis testu Nechť náhodný výběr (Y[1], X[11], …, X[1p])’, …, (Y[n], X[n1], …, X[np])’ pochází z (p+1)-rozměrného normálního rozložení, které má koeficient mnohonásobné korelace ρ[Y. X]. Musí platit n > p+1. Testujeme hypotézu H[0]: ρ[Y. X] = 0 proti H[1]: ρ[Y. X] ≠ 0. Vzhledem k tomu, že se jedná o výběr z (p+1)-rozměrného normálního rozložení, testujeme, zda existuje závislost mezi veličinou Y a vektorem X. (Je-li ρ[Y. X] = 0, pak z vlastnosti (b) plyne, že ρ(Y,X[i]) = 0 pro všechna i = 1, …, p, tudíž náhodné veličiny Y a X[i] jsou stochasticky nezávislé pro všechna i = 1, …, p.) Testová statistika se řídí rozložením F(p, n-p-1), pokud H[0] platí. Kritický obor: . Jestliže , H[0] zamítáme na hladině významnosti α. Příklad Při zkoumání závislosti hodinové výkonnosti dělníka (veličina Y – v kusech) na jeho věku (veličina X[1] – v letech) a době zapracovanosti (veličina X[2] – v letech) byly u 10 náhodně vybraných dělníků zjištěny tyto údaje: Y 67 65 75 66 77 84 69 60 70 66 X[1] 43 40 49 46 41 41 48 34 32 42 X[2] 6 8 14 14 8 12 16 1 5 7 Za předpokladu, že uvedené hodnoty představují číselné realizace náhodného výběru rozsahu 10 ze třírozměrného normálního rozložení, testujte na hladině významnosti 0,05 hypotézu, že výkon dělníka nezávisí na jeho věku a době zapracovanosti. Řešení: , R[YX] = (0,2287, 0,4538)’, R = , r[Y. X]^ 2 = (0,2287, 0,4538) = 0,2917 Interpretace: Variabilita výkonů dělníků je z 29% vysvětlena jejich věkem a dobou zapracovanosti. r[Y. X] = . Testujeme hypotézu H[0]: ρ[Y. X] = 0 proti H[1]: ρ[Y. X] ≠ 0. Testová statistika: , kvantil F[0,95](2,7) = 4,737, kritický obor , tedy a H[0] nezamítáme na hladině významnosti 0,05. Výpočet pomocí systému STATISTICA: Závislost mezi dvojicemi proměnných posoudíme pomocí dvourozměrných tečkových diagramů: Grafy – Maticové grafy – Proměnné – Vybrat vše – OK Ve všech třech případech existuje mezi dvojicemi proměnných určitý stupeň přímé lineární závislosti. Statistiky – Vícenásobná regrese – Proměnné – Závislá proměnná Y, seznam nezáv. proměnných X1, X2 – OK – OK. Koeficient najdeme v záhlaví výstupní tabulky pod označením Vícenás. R = 0,54 Hodnota testové statistiky pro test nevýznamnosti koeficientu mnohonásobné korelace je 1,4411, počet stupňů volnosti čitatele je 2, jmenovatele 7, odpovídající p-hodnota je 0,2991, tedy na hladině významnosti 0,05 nezamítáme hypotézu, že výkon dělníka není závislý na jeho věku a době zapracovanosti. Výpočet pomocí systému SPSS Analyze – Regression – Linear – Dependent Y, Independent X1, X2 – OK Koeficient parciální korelace Nechť Y, Z jsou náhodné veličiny a X = (X[1], …, X[p])’ je náhodný vektor. Korelační koeficient ρ(Y,Z) udává míru těsnosti lineárního vztahu mezi veličinami Y a Z. Ta však může být ovlivněna i tím, že mezi veličinami X[1], …, X[p] existují veličiny, které silně korelují jak s Y, tak se Z. Zajímá nás proto, jaká je „čistá“ korelace mezi Y a Z, když se eliminuje vliv náhodného vektoru X. Pokud se omezíme na lineární vztahy, můžeme vliv vektoru X na veličinu Y popsat lineární regresní funkcí = α + β’X, kde β = var(X)^-1 cov(X,Y), α = E(Y) - β’E(X). Tu část veličiny Y, kterou vektor X nevysvětlí, si můžeme představit jako reziduum Y - . Analogicky pro veličinu Z dostáváme = γ + δ’X, kde δ = var(X)^-1 cov(X,Z), γ = E(Z) - δ’E(X), tudíž reziduum Z - chápeme jako tu část veličiny Z, kterou vektor X nevysvětlí. Korelační koeficient mezi rezidui Y - a Z - se nazývá parciální korelační koeficient mezi náhodnými veličinami Y a Z při pevně daném vektoru X a značí se . Tedy = ρ(Y - , Z - ). Počítá se podle vzorce . Nechť náhodný vektor (Y, Z, X[1], …, X[p])’ pochází z (p+2)-rozměrného rozložení, které má parciální korelační koeficient . Nechť je dán náhodný výběr (Y[1], Z[1], X[11], …, X[1p])’, …, (Y[n], Z[n], X[n1], …, X[np])’ rozsahu n z tohoto rozložení. Musí platit n > p+2. Jako odhad slouží výběrový parciální korelační koeficient : Testování hypotézy o nezávislosti veličin Y a Z při eliminaci vlivu vektoru X Popis testu Budeme předpokládat, že uvedený náhodný výběr pochází z (p+2)-rozměrného normálního rozložení. Testujeme hypotézu H[0]: ρ[y, z . x] = 0 proti H[1]: ρ[y, z . x] ≠ 0. Vzhledem k tomu, že se jedná o výběr z normálního rozložení, testujeme, zda existuje závislost mezi Y a Z při eliminaci vlivu X. Testová statistika se řídí rozložením t(n-p-2), pokud H[0] platí. Kritický obor: . Jestliže , H[0] zamítáme na hladině významnosti α Příklad Pro data z příkladu o výkonnosti dělníků vypočtěte výběrové parciální korelační koeficienty , interpretujte je, porovnejte je s obyčejnými výběrovými korelačními koeficienty a pro α = 0,05 otestujte významnost uvedených parciálních korelačních koeficientů. Řešení: = 0,2287, = 0,4538, = 0,847 a) Interpretace: Korelační koeficient mezi výkonem a věkem vyšel 0,2287, tedy s rostoucím věkem roste výkon. Parciální korelační koeficient mezi výkonem a věkem při vyloučení vlivu doby zapracovanosti vyšel -0,3286, tedy u dělníků se stejnou dobou zapracovanosti klesá s rostoucím věkem výkon. Testujeme H[0]: = 0 proti H[1]: ≠ 0 Testová statistika: Kvantil: t[0,975](7) = 2,3646 Kritický obor: H[0] nezamítáme na hladině významnosti 0,05. b) Interpretace: Korelační koeficient mezi výkonem a dobou zapracovanosti vyšel 0,4538, tedy čím delší doba zapracovanosti, tím lepší výkon dělník podává. Parciální korelační koeficient mezi výkonem a dobou zapracovanosti při vyloučení vlivu věku vyšel 0,5026, tedy u stejně starých dělníků je poněkud silnější přímá lineární vazba mezi výkonem a dobou zapracovanosti. Testujeme H[0]: = 0 proti H[1]: ≠ 0 Testová statistika: Kvantil: t[0,975](7) = 2,3646 Kritický obor: H[0] nezamítáme na hladině významnosti 0,05. Výpočet pomocí systému STATISTICA Statistiky – Základní statistiky/tabulky – Korelační matice – OK – na záložce Možnosti zaškrtneme Zobrazit r, úrovně p, počty N a zaškrtneme Zobrazit dlouhá jména proměnných, na záložce Detaily zvolíme Parciální korelace – 1. seznam proměnných Y, X1, druhý seznam proměnných X2 – OK Vidíme, že výběrový parciální korelační koeficient je -0,3286, p-hodnota je 0,388, tedy na hladině významnosti 0,05 nezamítáme hypotézu o nevýznamnosti . Analogicky 1. seznam proměnných Y, X2, druhý seznam proměnných X1 – OK V tomto případě výběrový parciální korelační koeficient je 0,5026, p-hodnota je 0,168, tedy na hladině významnosti 0,05 nezamítáme hypotézu o nevýznamnosti . Výpočet pomocí systému SPSS Analyze – Correlate – Partial – Variables Y, X1 – Controlling for X2 – OK