Korelace Kde jsme •Souvislost kategorických proměnných à crosstab • •Souvislost kategorické a kardinální proměnné à srovnání průměrů • •Souvislost kardinálních proměnných à korelační koeficient Korelace •Jak se pozná souvislost: •S růstem hodnot jedné proměnné narůstají nebo klesají hodnoty druhé proměnné • •Lineární vztah: nárůst/pokles musí být pro nízké i vysoké hodnoty proměnné stejný • •Typy korelačních koeficientů: •Pearson •Spearman •Kendall • • • • • • Korelace •Hodnoty koeficientu: •Rozsah od -1 po 1 •+1 = perfektní kladná souvislost – s růstem jedné proměnné roste druhá •-1 = perfektní záporná souvislost – s růstem jedné proměnné klesá druhá •0 = žádná souvislost • •Čím více je hodnota vzdálena od nuly, tím je souvislost silnější •Existují „tabulky“ k hodnocení síly vztahu • Autor: DenisBoigelot, original uploader was Imagecreator, CC0, https://commons.wikimedia.org/w/index.php?curid=15165296 Korelace •Hodnoty koeficientu: •Rozsah od -1 po 1 •+1 = perfektní kladná souvislost – s růstem jedné proměnné roste druhá •-1 = perfektní záporná souvislost – s růstem jedné proměnné klesá druhá •0 = žádná souvislost • •Čím více je hodnota vzdálena od nuly, tím je souvislost silnější •Existují „tabulky“ k hodnocení síly vztahu • •Je vhodné si data vizualizovat • Pearsonův korelační koeficient •Parametrická operace • •Předpoklady: •Kardinální data (výjimka - jedna z proměnných může být dichotomická) •Normální rozložení / dostatečná velikost vzorku (min. 200-500) • •Značení - R • •Citlivost na odlehlé případy • Práce v SPSS •Analyze à Correlate à Bivariate: •Zvolit proměnné •Pearsonův koeficient je přednastavený •Pro sledování signifikance zvolit Flag significant correlations • •Options: •Možnost spočítat základní statistiky •Vynechání hodnot / případů •Listwise – pokud počítáme více korelačních koeficientů, všechny budou založeny na stejných datech •Pairwise – missing odstraněny zvlášť v každém páru • Příklad •Existuje souvislost mezi počtem obyvatel obcí a volební účastí? • •Máme data ze všech měst v zemi • •Co potřebujeme zjistit: •Je mezi proměnnými vztah? •Je statisticky významný? Je to vůbec důležité? •Má výsledek věcný význam? Pearsonův korelační koeficient •Síla vztahu: •± 0,1 – slabý •± 0,3 – střední •± 0,5 – silný • •Spíše informativní hodnoty (mezi r = 0,49 a r = 0,51 žádný zásadní rozdíl není) • • • Pearsonův korelační koeficient •Výjimka z kardinálních dat à korelace jedné kardinální proměnné a jedné dichotomické • •Tzv. point-biserial korelace • •Kladné / záporné výsledné hodnoty závisí na kódování dichotomické proměnné • Populace obcí (2 kategorie) a účast Populace obcí (2 kategorie) a účast Kardinální a dichotomická proměnná • •Můžeme použít Pearsonův korelační koeficient • •Máme (vhodnější) alternativu? Neparametrická korelace •Využívá pořadí případů, nikoli samotné hodnoty proměnné • •Spearmanovo Rho: •Využíván zejména pro kombinaci ordinálních proměnných •V menších vzorcích (do 200-500) při porušení normality •Výsledné hodnoty jsou ve stejném pásmu jako u PKK (od -1 po 1) • •Kendallovo Tau: •Pro malé vzorky a menší množství kategorií •Volba mezi kendallem a crosstabem •Některé hodnoty se velice často opakují • • SPSS •Analyze à Correlate à Bivariate: •Zvolit proměnné •Vybrat Spearman a/nebo Kendall • • Interpretace výsledků •Základní pravidlo – korelace ≠ kauzalita • •Korelace vyjadřuje pouze souvislost mezi proměnnými, neukazuje na žádnou příčinu a následek • •Vliv třetích proměnných • •Nemožnost konstatovat kauzalitu i pokud se jeví jako logická • •Statistické zjištění nemá automaticky věcný význam • Práce s koeficienty •Co uvádět: • •Jaký koeficient byl použit, kolik případů bylo v analýze • •V tabulce: hodnoty koeficientu, hvězdičky a sig. jen pokud je potřeba zohlednit signifikanci • •K hvězdičkám je nutné dodat legendu •