Míry asociace oobecná definice – síla a směr vztahu omíry asociace pro nominální data omíry asociace pro ordinální data okorelace o Míry asociace omíry asociace vyjadřují těsnost vztahu proměnných (a případně směr vztahu) oz chí-kvadrátu se dozvíme pouze, zda nějaký vztah mezi proměnnými existuje (tj. zda se liší četnosti pozorované a četnosti očekávané za předpokladu, že proměnné jsou nezávislé) Míry asociace otěsnost (síla) vztahu – vyjádřena absolutní hodnotou koeficientu onení shoda v tom, od jaké hodnoty je vztah považován za těsný (někdy uváděno >0.70, jindy >0.30), středně těsný či slabý Míry asociace osměr vztahu – pouze u ordinálních a kardinálních proměnných opozitivní vztah – čím vyšší hodnoty jedné proměnné, tím vyšší hodnoty druhé proměnné onegativní vztah - čím vyšší hodnoty jedné proměnné, tím nižší hodnoty druhé proměnné o Míry asociace pro nominální data omíry asociace pro nominální data ukazují pouze sílu vztahu dvou proměnných, nikoli směr či jiné informace o povaze vztahu o o Míry asociace pro nominální data orozsah koeficientů je obvykle mezi 0 a 1 nčím vyšší hodnota, tím těsnější vztah n0 – žádný vztah n1 – absolutní vztah (z hodnot jedné proměnné můžeme předpovědět hodnoty druhé proměnné) opro koeficienty je možno spočítat statistickou významnost Míry založené na chí-kvadrátu ovelikost hodnoty chí-kvadrát je ovlivněna velikostí výběru a počtem kategorií (políček tabulky) oúčelem koeficientů založených na chí-kvadrátu je eliminovat tyto vlivy Míry založené na chí-kvadrátu omezi nejčastěji užívané míry asociace založené na chí-kvadrátu patří koeficienty nFí (Phi) nCramerovo V (Cramer’s V) Míry založené na chí-kvadrátu oFí koeficient - užívá se pro tabulky 2x2 (tj. pro dichotomické proměnné, např. pohlaví) ovypočte se tak, že se hodnota chí-kvadrátu vydělí počtem osob a výsledek se odmocní Míry založené na chí-kvadrátu oCramerovo V – podobný výpočet jako Fí; počet osob se navíc násobí (počtem řádků – 1) n(pokud je počet řádků menší než počet sloupců, jinak počtem sloupců – 1) opoužívá se pro tabulky větší než 2x2 Příklad opříklad z přednášky o Chí-kvadrátu - jak souvisí model manželství s jeho vydařeností oChí-kvadrát = 18.71 opočet osob N = 154 om = (počet řádků – 1) = 3 – 1 = 2 Kontingenční tabulka Příklad otabulka 3x3 – použijeme Cramerovo V o oV = c2/(N*m) o oV = 18.71/(154*2) o oV = 0,246 Příklad ointerpretace: hodnota 0,246 je poměrně nízká – vztah mezi modelem manželství a jeho vydařeností není příliš těsný (i když statisticky významný – viz výstup v SPSS) Výstup v SPSS o Další míry asociace oCohenova kappa – koeficient shody ovětšinou používán pro měření shody mezi posuzovateli Další testy oMcNemarův test – pro závislé výběry (opakovaná měření) opro tabulky 2x2 – zachycuje míru změny (kolik osob z určité kategorie při prvním měření přejde při druhém měření do jiné kategorie) oobdobný test pro více než dvě měření – Cochranův test Míry asociace pro ordinální data ou ordinálních dat je výpočet založen na poměru tzv. souhlasných a nesouhlasných párů případů osouhlasný pár případů – hodnota obou proměnných je u jednoho člena páru vyšší (nebo nižší) než u druhého onesouhlasný pár případů – hodnota jedné proměnné je u jednoho člena páru vyšší a hodnota druhé proměnné je nižší než u druhého člena páru o o Příklad osouvisí spokojenost v manželství n3 velmi šťastné, 2 spíše šťastné, 1 ne příliš šťastné os hodnocením života njako 3 vzrušujícího, 2 stereotypního až 1 nudného? Příklad Případ manželství život Osoba 1 2 3 Osoba 2 1 2 Osoba 3 2 1 Příklad oPÁR 1: osoba 1 (2, 3) a osoba 2 (1, 2) - souhlasný oPÁR 2: osoba 1 (2, 3) a osoba 3 (2, 1) – nerozhodně (tzv. tie) oPÁR 3: osoba 2 (1, 2) a osoba 3 (2, 1) - nesouhlasný o o Míry asociace pro ordinální data okoeficient gamma = počet souhlasných mínus počet nesouhlasných párů, tento rozdíl vzhledem k celkovému počtu párů (jen souhlasných a nesouhlasných) onerozhodné páry nebere gamma v úvahu Míry asociace pro ordinální data o souhlasné - nesouhlasné ogamma = souhlasné + nesouhlasné o ogamma = (1-1)/2 = 0 Míry asociace pro ordinální data opokud je většina párů souhlasných, je hodnota gamma kladná – tj. pozitivní vztah (až +1) opokud je většina párů nesouhlasných, je hodnota gamma záporná – tj. negativní vztah (až -1) opokud je počet souhlasných a nesouhlasných párů vyrovnán – gamma kolem 0 o Míry asociace pro ordinální data ogamma je symetrická míra – nedělá rozdíly mezi závislou a nezávislou proměnnou oasymetrická varianta koeficientu gamma – Sommerovo D oKendallovo tau b – stejný výpočet jako gamma, ale bere v úvahu i nerozhodné páry (tzv. ties); hodnoty v rozsahu -1 až +1 mohou být získány pouze pro čtvercové tabulky (tj. stejný počet kategorií obou proměnných) oKendallovo tau c – kromě korekce pro ties obsahuje i korekci pro velikost tabulky oSpearmanův koeficient korelace (viz dále) o Shrnutí ou nominálních dat hodnota míry asociace proměnných indikuje sílu vztahu – rozsah od 0 do 1 ou ordinálních dat míry asociace indikují jak sílu vztahu (abs. hodnota koeficientu), tak směr vztahu Pearsonův korelační koeficient ou intervalových a poměrových dat můžeme jako míru asociace - vztahu mezi proměnnými - použít Pearsonův korelační koeficient okorelace nko = s, spolu, vzájemně nrelace = vztah nkorelace = vzájemný vztah proměnných Pearsonův korelační koeficient oabsolutní hodnota koeficientu vyjadřuje sílu (těsnost) vztahu oznaménko (+ nebo -) směr vztahu orozsah -1 až +1 ooznačuje se r o Pearsonův korelační koeficient osám o sobě je deskriptivní statistikou, ale podobně jako u ostatních měr asociace je možno spočíst statistickou významnost (=zda se se významně liší od nuly, tj. zda nějaký vztah mezi proměnnými vůbec existuje) ozávisí na velikosti výběru – čím vyšší, tím nižší koeficient vychází průkazný o Pearsonův korelační koeficient oje mírou pouze pro lineární vztahy opřed výpočtem je vhodné zobrazit vztah mezi proměnnými graficky – tzv. scatter (dvourozměrný bodový diagram) Scatter opozitivní vztah (přímá úměra) – čím vyšší hodnoty proměnné X, tím vyšší hodnoty proměnné Y or > 0 Scatter onegativní vztah (nepřímá úměra) – čím vyšší hodnoty proměnné X, tím nižší hodnoty proměnné Y or < 0 o Scatter ožádný vztah - hodnoty proměnné X nesouvisí s hodnotami proměnné Y or = 0 Scatter onelineární vztah or = 0 o Příklad ojak spolu souvisí pocit štěstí a míra extraverze? o10 osob, 2 proměnné – skór z dotazníku štěstí a skór ze škály extraverze o Příklad Příklad štěstí 15 8 7 18 4 12 10 10 6 9 extraverze 12 7 5 14 6 3 5 10 4 13 Příklad ovýpočet r orxy = sxy/sxsy o osxy= kovariance o o o o osx, sy = směrodatné odchylky o n n Příklad ox = mx = 9,90 osx = 4,20 oy = my = 7,90 osy = 4,01 on = 10 Příklad (+)(+) (-)(-) (-)(+) mx my Příklad osxy= (∑ni=1 (xi-x)(yi-y))/(n-1) o osxy= (∑ni=1 (xi-9,9)(yi-7,9)/(10-1) osxy= ( (15-9,9)(12-7,9) + (8-9,9)(7-7,9) + (7-9,9)(5-7,9) + (18-9,9)(14-7,9) + (4-9,9)(6-7,9) + (12-9,9)(3-7,9) + (10-9,9)(5-7,9) + (10-9,9)(10-7,9) + (6-9,9)(4-7,9) + (9-9,9)(13-7,9) )/9 osxy= ((5,1*4,1) + (-1,9*-0,9) + (-2,9*-2,9) + (8,1*6,1) + (-5,9*-1,9) + (2,1*-4,9) + (0,1*-2,9) + (0,1*2,1) + (-3,9*-3,9) + (-0,9*5,1))/9 osxy= (20,91+1,71+8,41+49,41+11,21+(-10,29)+(-0,29)+0,21+15,21+(-4,59))/9 osxy= 91,9/9 osxy= 10,21 o o o Příklad orxy = sxy/sxsy o orxy = 10,21/4,20*4,01 orxy = 10,21/16,84 orxy = 0,606 o Výstup v SPSS Interpretace r onení shoda v tom, jaká hodnota r je považována za těsný vztah ointerpretace navržená Guilfordem: n<0.20 zanedbatelný vztah n0.20-0.40 nepříliš těsný vztah n0.40-0.70 středně těsný vztah n0.70-0.90 velmi těsný vztah n>0.90 extrémně těsný vztah Interpretace r opro lepší interpretaci je možné převést koeficient korelace na koeficient determinace (r2) oukazuje, kolik rozptylu v jedné proměnné může být vysvětleno rozptylem ve druhé proměnné Interpretace r ov našem příkladu nr = 0,606 nr2 = 0,367 o36,7% rozdílů v míře štěstí můžeme vysvětlit rozdíly v míře extraverze Interpretace r okorelace neznamená příčinný vztah mezi proměnnými nten můžeme ověřovat např. experimentem, kdy jsou všechny ostatní proměnné udržovány konstantní, proměnná X předchází Y v čase atd. Faktory ovlivňující r oomezený rozsah hodnot proměnné opoužití extrémních skupin onehomogenní soubor oextrémní hodnoty (outliers) onelineární vztahy oreliabilita použitých nástrojů (nízká reliabilita snižuje odhad těsnosti vztahu) o Omezený rozsah hodnot oomezený rozsah hodnot jedné nebo obou proměnných snižuje hodnotu r ostejně tak nízká variabilita Použití extrémních skupin opoužití extrémních skupin (např. jen osob s vysokým a nízkým IQ) vede k vyššímu r o Nehomogenní soubor omůže zkreslit r jak směrem nahoru, tak dolů Extrémní hodnoty oextrémní hodnoty v jedné nebo obou proměnných mohou r výrazně zkreslit (nejen hodnotu, ale i směr), zvláště když je počet osob v souboru nízký Extrémní hodnoty or= 0,606 or= 0,766 Neparametrický koeficient opro ordinální data je možno spočítat Spearmanův koeficient pořadové korelace (r) opočítá se tak, že nhodnoty obou proměnných se seřadí od nejnižší po nejvyšší a přidělí se jim pořadí nz pořadí se pak počítá Pearsonův koeficient korelace Literatura oHendl: kapitoly 8.3, 7.1 a 7.2