LEKCE 8 MĚŘENÍ (SÍLY) ASOCIACE MEZI DVĚMA PROMĚNNÝMI: KORELAČNÍ KOEFICIENTY SÍLA ASOCIACE 0M Je dána rozdíly mezi jednotlivými variantami proměnné. 0M Měříme ji speciálními statistickými koeficienty asociace. 0M Jednotlivé úrovně měření (nominální, ordinální, kardinální) a některé typy znaků (znaménkové znaky ap.) mají své specifické koeficienty. 0M Použití koeficientů je ovlivněno i velikostí kontingenční tabulky (své koeficienty mají čtyřpolní tabulky vyjadřující vztah dvou dichotomických znaků). K měření síly statistické závislosti MEZI PROMĚNNÝMI (vazby, souvislosti, asociace) jsou určeny sumarizační statistiky nazývané ASOCIAČNÍ ČI KORELAČNÍ KOEFICIENTY (koeficienty, závislosti, explanační síly ap.). Tyto koeficienty podávají souhrnnou informaci o existenci vztahů mezi proměnnými a o jejich síle. KOEFICIENTY ASOCIACE K jejich základním charakteristikám KOEFICIENTŮ ASOCIACE patří, že: 0M Hodnoty koeficientů se většinou pohybují v intervalech: 0M <0;1> Příklad: Mezi volbou politické strany a subjektivní třídou existuje silný vztah. Koeficient vypovídá o síle tohoto vztahu, nikoliv o jeho směru (u nominálního znaku jako je politická strana nemá směr smysl). 0M <-1;+1> Příklad: "S růstem vzdělání roste výše platu (pozitivní vztah) nebo naopak (negativní vztah). Koeficient vypovídá o síle tohoto vztahu, znaménko o jeho směru. 0M Čím vyšší je hodnota koeficientů (v absolutní hodnotě), tím silnější je vztah. 0M Znaménko určuje směr vztahu (koeficienty pro ordinální a kardinální proměnné). Záporné koeficienty znamenají negativní asociaci a kladné koeficienty pozitivní asociaci. Znaménko neříká nic o síle vztahu (o té vypovídá absolutní hodnota koeficientu). 0M Nula má obvykle význam neexistence vztahu (někdy ovšem, jak jsme již viděli, je však jen výrazem toho, že vztah sice existuje, ale je nelineární). 0M Hodnota 1,00 má význam existence perfektního vztahu. Příklad: +--------------------------------------------------------------------------------------------+ | ŽÁDNÁ | STŘEDNÍ | PERFEKTNÍ | | | | | | ASOCIACE | ASOCIACE | ASOCIACE | |------------------------------+------------------------------+------------------------------| | 65%| 65%| 30%| 75%| 0%| 100%| |--------------+---------------+--------------+---------------+--------------+---------------| | 35%| 35%| 70%| 25%| 100%| 0%| |------------------------------+------------------------------+------------------------------| | korelace 0,000 | korelace 0,500 | korelace 1,000 | +--------------------------------------------------------------------------------------------+ PAMATUJME SI! 0M Pro každou úroveň měření (nominální, ordinální a kardinální) jsou určeny zvláštní koeficienty. 0M Máme-li proměnné různého charakteru (například nominální a kardinální), musíme volit vždy koeficient pro proměnnou nižší úrovně (v tomto případě nominální). 0M V některých případech jsou pro takový případ vyvinuty speciální koeficienty (pro zmíněný případ je to například koeficient eta). 0M Některé z koeficientů lze použít jen při lineárním vztahu, jiné i pro vztahy nelineární. 0M Některé koeficienty rozlišují, která z proměnných je závisle a která nezávisle proměnná (asymetrické), jiné to nerozlišují (symetrické). 0M Některé dokonce rozlišují i velikost kontingenční tabulky. 0M Prokázání asociace není důkazem kauzality vztahu. KOEFICIENTY MÍRY ASOCIACE PRO DVĚ RŮZNÉ ÚROVNĚ MĚŘENÍ Jestliže jedna proměnná je nominální a druhá ordinální nebo kardinální, nebo je-li jedna proměnná ordinální a druhá kardinální, existují celkem tři možnosti jak vybrat pro měření síly asociace mezi nimi vhodný koeficient. 0M Použijeme KOEFICIENTU PRO NIŽŠÍ ÚROVEŇ MĚŘENÍ (proměnnou vyšší úrovně měření lze vždy transformovat v proměnnou nižší úrovně měření, nikoliv však naopak). Musíme si být vědomi toho, že tím ztrácíme část informací. 0M Jestliže jedna z proměnných má jen 2 varianty (DICHOTOMICKÉ PROMĚNNÉ), můžeme ignorovat její úroveň měření a volbu koeficientu určí druhá (nedichotomická) proměnná. 0M Použijeme SPECIÁLNĚ PRO TENTO PŘÍPAD VYVINUTÝCH KOEFICIENTŮ. Příkladem je ETA KOEFICIENT, který může být použit, když závisle proměnná je měřena na intervalové nebo dlouhé ordinální škále a nezávisle proměnná na nominální škále. PŘEHLED KOEFICIENTŮ MÍRY ASOCIACE +--------------------------------------------------------------------------------------------+ | ÚROVEŇ MĚŘENÍ | VHODNÁ | VHODNÝ | INFERENČNÍ | | | | | | | A VELIKOST TABULEK | METODA | KOEFICIENT | STATISTIKA | |------------------------+------------------+----------------------+-------------------------| |NOMINÁLNÍ |2x2 |kontingenční |Phí, Yules Q |chí-kvadrát | | | | | | | |NOMINÁLNÍ | |tabulka |Goodmanoovo a | | | | | |Kruskalovo tau | | |----------+-------------+------------------+----------------------+-------------------------| |NOMINÁLNÍ |3 a více x |kontingenční |Lambda, Goodmanoovo a |chí-kvadrát | | | | |Kruskalovo tau, | | |NOMINÁLNÍ |2 a více |tabulka |Cramerovo V | | |----------+-------------+------------------+----------------------+-------------------------| |NOMINÁLNÍ |nominální |kontingenční |Theta, Goodmanoovo a |Mann-Whitney U test | | | | |Kruskalovo tau, |(dichotomická nominální | |ORDINÁLNÍ |s 3 a více |tabulka | |nezávislá); K-sample | | | | |Cramerovo V |median test | | | | | |Kruskal-Wallis | |----------+-------------+------------------+----------------------+-------------------------| |NOMINÁLNÍ |nominální |kontingenční |Eta (korelační poměr);|F-test (ONEWAY) | | | | |lze i Goodmanovo a | | |KARDINÁLNÍ|nezávislá |tabulka* |Kruskallovo tau, |chí-kvadrát | | | | |Cramerovo V, Eta | | | | |porovnání průměrů*| | | | | | | | | | | | | |F-test (ONEWAY) | |----------+-------------+------------------+----------------------+-------------------------| |ORDINÁLNÍ |obě s málo |kontingenční |Gamma, |test významnosti pro | | |variantami | | |Gamma | |ORDINÁLNÍ | |tabulka |Kendallovo tau[b]** , | | | | | | |test významnosti | | | | |Kendallovo tau[c | | | | | | |pro tau | |----------+-------------+------------------+----------------------+-------------------------| |ORDINÁLNÍ |jedna |pořadová korelace |]Kendallovo tau |test významnosti pro tau | | | | | | | |ORDINÁLNÍ |s mnoha | | | | | |variantami | | | | |----------+-------------+------------------+----------------------+-------------------------| |ORDINÁLNÍ |obě |pořadová korelace |Kendallovo tau |testy významnosti pro tau| | | | | |a pro ró | |ORDINÁLNÍ |s mnoha | |Spearmanovo ró | | | |variantami | | | | |----------+-------------+------------------+----------------------+-------------------------| |ORDINÁLNÍ |obě s málo |kontingenční |Eta, Gamma |F-test | | |variantami | | | | |KARDINÁLNÍ| |tabulka*** |Kendallovo tau | | |----------+-------------+------------------+----------------------+-------------------------| |ORDINÁLNÍ |ordinální s |porovnání průměrů |Eta |F-test | | |málo | | | | |KARDINÁLNÍ|variantami |pořadová korelace |Kendallovo tau |test významnosti pro tau | |----------+-------------+------------------+----------------------+-------------------------| |ORDINÁLNÍ |obě s mnoha |pořadová korelace |Kendallovo tau, |testy významnosti pro tau| | |variantami | | |a pro ró | |KARDINÁLNÍ| | |Spearmanovo ró | | |----------+-------------+------------------+----------------------+-------------------------| |KARDINÁLNÍ|obě s málo |kontingenční |Pearsonovo R |test významnosti pro R | | |variantami |tabulka | | | |KARDINÁLNÍ| | | | | |----------+-------------+------------------+----------------------+-------------------------| |KARDINÁLNÍ|nejméně jedna|scattegram |Pearsonovo R, | | | |s mnoha | | | | |KARDINÁLNÍ|variantami |regrese |regresení koeficienty | | +--------------------------------------------------------------------------------------------+ *podle počtu variant kardinální proměnné ** tau[b] pro čtvercovou tabulku *** pokud je kardinální závislá Vaus, D. A. de: Surveys in Social Research. Unwin Hyman, London 1990, p.182. KORELAČNÍ MATICE