Cvičení 11 – Korelační analýza Výběrový Spearmanův koeficient pořadové korelace: ( ) ( )∑= − − −= n 1i 2 ii2S QR 1nn 6 1r , kde n je rozsah dvourozměrného náhodného výběru (X1, Y1), ..., (Xn, Yn), Ri pořadí náhodné veličiny Xi a Qi pořadí náhodné veličiny Yi, i = 1, ..., n. Testování nezávislosti ordinálních veličin Na hladině významnosti α testujeme H0: X, Y jsou pořadově nezávislé náhodné veličiny proti H1: X, Y jsou pořadově závislé náhodné veličiny Jako testová statistika slouží Spearmanův koeficient pořadové korelace rS. H0 zamítáme na hladině významnosti α, když ( )nrr 21,SS α−≥ , kde ( )nr 21,S α− je kritická hodnota, kterou pro α = 0,05 nebo 0,01 a n ≤ 30 najdeme v tabulkách. Asymptotická varianta testu Pro n > 20 lze použít testovou statistiku ( )2nt r1 2nr T 2 S S 0 −≈ − − = za platnosti H0. Kritický obor ( ) ( ) )( ∞−∪−−∞−= α−α− ,2nt2nt,W 2/12/1 Výběrový Pearsonův koeficient korelace: jinak0,0SSpro SS S R 21 21 12 12 =>= Testování nezávislosti intervalových a poměrových veličin Důležitý předpoklad: daný náhodný výběr (X1, Y1), ..., (Xn, Yn) pochází z dvourozměrného normálního rozložení s koeficientem korelace ρ. Pak jsou pojmy „stochastická nezávislost“ a „nekorelovanost“ ekvivalentní. Na hladině významnosti α testujeme H0: X, Y jsou stochasticky nezávislé náhodné veličiny (tj. ρ = 0) proti H1: X, Y jsou stochasticky závislé náhodné veličiny (tj. ρ ≠ 0). Testová statistika ( )2nt~ R1 2nR T 2 12 12 0 − − − = za platnosti H0. Kritický obor: ( ) ( ) )( ∞−∪−−∞−= α−α− ,2nt2nt,W 2/12/1 Porovnání koeficientu korelace s danou konstantou Testujeme H0: ρ = c proti H1: ρ ≠ c. Pro n ≥ 10: testová statistika ( ) ( )1,0N3n 1n2 c c1 c1 ln 2 1 ZU ≈−      − − − + −= za platnosti H0, přičemž 12 12 R1 R1 ln 2 1 Z − + = je tzv. Fisherova Z-transformace. Kritický obor: ( )∞∪−∞−= α−α− ,uu,W 2/12/1 . Porovnání dvou korelačních koeficientů Máme dva nezávislé náhodné výběry o rozsazích n a n* z dvourozměrných normálních rozložení s korelačními koeficienty ρ a ρ* . Testujeme H0: ρ = ρ* proti H1: ρ ≠ ρ* . Označme R12 výběrový korelační koeficient 1. výběru a R12 * výběrový korelační koeficient 2. výběru. Položme 12 12 R1 R1 ln 2 1 Z − + = a * 12 * 12* R1 R1 ln 2 1 Z − + = . Platí-li H0, pak testová statistika 3n 1 3n 1 * * ZZ U −− + − = má asymptoticky rozložení N(0,1). Kritický obor: ( )∞∪−∞−= α−α− ,uu,W 2/12/1 . Interval spolehlivosti pro koeficient korelace ( )       − = α− 3n u Ztghh,d 2/1 m , přičemž xx xx ee ee xtgh − − + − = . Příklad 1.: (viz př. 11.5.2 ze skript) 12 různých softwarových firem nabízí speciální programové vybavení pro vedení účetnictví. Jednotlivé programy byly posouzeny odbornou komisí složenou z počítačových odborníků a komisí složenou z profesionálních účetních. Úkolem bylo doporučit vhodný program na základě stanovení pořadí jednotlivých programů. Výsledky posouzení: Produkt firmy číslo 1 2 3 4 5 6 7 8 9 10 11 12 Pořadí dle odborníků 6 7 1 8 4 2,5 9 12 10 2,5 5 11 Pořadí dle účetních 4 5 2 10 6 1 7 11 8 3 12 9 Vypočtěte Spearmanův koeficient pořadové korelace a na hladině významnosti 0,05 testujte hypotézu, že hodnocení obou komisí jsou nezávislá. Příklad 2.: Pět mužů, kteří bydlí v jednom panelovém domě, se rozhodlo zjistit a zapsat svou hmotnost [kg] a výšku [cm]. Zapsané hodnoty jsou: (76, 170), (86, 177), (73, 169), (84, 174), (79, 175). Najděte realizaci výběrového koeficientu korelace a na hladině významnosti 0,05 testujte hypotézu, že hmotnost a výška jsou nezávislé veličiny proti oboustranné alternativě. Pro úsporu času máte uvedeny tyto číselné realizace: 5,16s,5,11s,3,29s 12 2 2 2 1 === . Příklad 3.: V pedagogicko – psychologické poradně bylo vyšetřeno 12 hochů a 15 dívek. Mimo jiné byla zjišťována jejich verbální složka IQ a performační složka IQ. Předpokládáme, že v obou skupinách dětí se zjištěná data řídí dvourozměrným normálním rozložením, v prvním případě s koeficientem korelace ρ, ve druhém případě s koeficientem korelace ρ* . Ve skupině hochů nabyl výběrový koeficient korelace mezi verbálním a performačním IQ hodnoty 0,6033, u dívek pak 0,5833. a) Sestrojte 95% asymptotický interval spolehlivosti pro ρ. b) Na hladině významnosti 0,05 testujte H0: ρ = ρ* proti oboustranné alternativě H0: ρ ≠ ρ* .