KAPITOLA 8 Procenta a procentní body Kromě „normálních" procent používáme ještě tzv. procentní body. Jaký je mezi proce centními body rozdíl? Představte si, že prohlížeč Firefox před dvěma lety používalo jn £.Pr°~ ale tento rok ho používá již 30 % lidi. Jaký je nárůst mezi těmito dvěma lety? Chyb h říci, že nárůst je desetiprocentní. Pokud Firefox používalo nejdříve 20 % lidí a poté°30 Iby'° to znamená, že ho nyní používá o polovinu více lidí než předtím, tj. o 50 % více (z'kih * tj. 100 % byla pětina populace). Jenomže je trochu neobratné říkat, že nárůst je 50 všechny bylo srozumitelnější sdělení, že se počet procent zvedl o deset. A přesně k tom procentní body. V tomto případě můžeme říci, že nárůst využívání prohlížeče Firefox činí de^ T centních bodů. Procentní body tedy použijeme v případě, když chceme vyjádřit rozdíl mezíd ľ™" procentuálními údaji (procento je tedy vztaženo k absolutnímu základu, procentní body k relati ™ mu základu, tj. k procentům). Není překvapením, že běžně se procentní body používají v ekon""'" (rozdíl v úrokových mírách, míře inflace), ale čím dál více pronikají i do ostatních věd, proto si na""]! zvykněme. Dodejme, že zatímco procenta značíme známou značkou„%", pro procentní bodv se n"* užívá plného výrazu, nebo zkratky „p.b.". Rámeček 8.2 Měření vztahů mezi dvěma proměnnými (korelační analýza) Literatura Linhart, Z., & Safäŕ. J. (1967). Programování třídění a statistických výpočtů pomocí samočinných počítačů. Sociologický časopis, 3(4), 435 443. Řehák, J., & Řeháková, B. (1978). Analýza kontingenínfch tabulek: rozlišení dvou základních typů úloh a znaménkové schéma. Sociologický časopis, 14(6), 619-631. 9.1 Asociace a korelace V minulé kapitole jsme si ukázali, jak hledat asociaci mezi proměnnými v kontingentní tabulce na základě rozložení případů v jejich políčkách, a naučili jsme se také používat test chí-kvadrát pro potvrzení existence takové asociace v základním souboru. Řekli jsme si ale také, že chí-kvadrát nám sice dovolí zamítnout nulovou hypotézu 0 neexistenci asociace mezi sledovanými proměnnými, ale neposkytne nám žádnou informaci o síle této asociace. Vysvětlení, co asociace vlastně jsou a jaké jsou jejich charakteristiky, jsme v předchozí kapitole tak trochu odbyli, takže to nyní napravíme. To. /dali je mezi dvěma proměnnými vztah (asociace, kontingence, korelace), je jedna ze základních otázek, kterou si při dvojrozměrné analýze dat klademe. Při hledání vztahu mezi dvěma proměnnými sledujeme, zda změny v jedné proměnné jsou doprovázeny i změnami v druhé proměnné. Zajímá nás například, zdali existuje vztah mezi vzděláním a průměrným věkem v době prvního sňatku, zdali školní prospěch dětí souvisí s majetkovou úrovní jejich rodičů, zdali míra anomie souvisí s postojem k systému českého sociálního zabezpečení atd. Hledání vztahu mezi proměnnými (hledání asociace) je z analytického hlediska operace, která má čtyři kroky. Při zkoumání párové asociace bychom si totiž, jak říkají Loether a McTavish (1988), měli klást čtyři následujíc! otázky: 1. Zdali asociace existuje, či nikoliv. 2. Jak je asociace silná (těsná) - to je, jak silně rozložení variant jedné proměnné určují rozložení variant druhé proměnné. 264 265 KAPITOLA 9 3. Jaký má asociace směr - to je, zdali se jedná o asociaci kladnou, nebo zápornou.206 4. Jakou má povahu - zdali je monotónní (lineární) či jiného druhu. Pokud například zjistíme, že mezi vzděláním a průměrným věkem v době prvního sňatku existuje souvislost, zajímá nás, jak je tato souvislost silná/těsná, jaký má směr a zda tento věk se zvyšujícím se vzděláním (monotónně) roste, nebo klesá. Nebo zjistíme-li existenci asociace například mezi úhrnnou plodnosti a výší hrubého domácího produktu (GDP) na hlavu (jednotkami jsou v tomto případějednotlivé státy světa), zajímá nás vedle sily této asociace a jejího směru (roste, nebo klesá úhrnná plodnost, když roste GDP?) také to, zda jde či nejde o lineárni vztah. Blíže se k povaze lineárních vztahů a k jejich analýze dostaneme v kapitole 11, věnované lineární regresi. V této kapitole se budeme zabývat předevšim otázkami měření síly/těsnosti asociací pomocí statistických koeficientů asociace. Pokud jste přeskočili první kapitoly této knihy, doporučujeme, abyste se k nim nyní raději vrátili. Konkrétní koeficienty asociace, o kterých bude řeč, byly totiž konstruovány pro jednotlivé úrovně měření (typy proměnných) a je velmi častou chybou nepoučených, že tento fakt ignorují. Použití nesprávného koeficientu je vlastně prohřešek stejného druhu, jako kdybychom tvrdošíjně počítali aritmetické průměry u nominálních proměnných. Jak jsme již řekli výše, pro zjištění síly či těsnosti vztahu počítáme tzv. koeficienty asociace (nebo korelace).207 Koeficient asociace je číslo, které zpravidla nabývá hodnot v intervalu od 0 do 1. Hodnota blízká nule indikuje nezávislost (neboli neexistenci vztahu), čím více se blíží jedné, tím silnější souvislost mezi proměnnými existuje. Hledáme-li souvislost mezi ordinálními či kardinálními znaky, míra korelace se zpravidla bude pohybovat v intervalu od —1 do +1 .208 I zde platí, že čím blíže je hodnota +1 nebo -1, tím silnější je mezi proměnnými vztah. Pro měření síly vztahu se používá řada nejrůznějších měr asociace a korelace. V SPSS je získáme následnou procedurou: Analýze - Descriptive Statistics - Crosstabs - Statistics - volba příslušných koeficientů (viz obr. 9.1a. 9.1b, datový soubor „EVS99-cvicny"). KORELAČNÍ ANALÝZA # q111b Anna 4*321 £ w&KJcaů # VoljJiel I jjjffldeä $ q23_rec Bootstrap ;" Dispäay clustered oar cnaite í 3« I Pas* R***t CanCel H*lp Obr. 9.1a Postup pro výpočet koeficientů asociace a korelace Crosstab*: Statistics M Ctihsquare [■Nominal--- j"Contingency coefficient V Phi arid Cramer's V I I !_"_■ Lambda Uncertainty coefficient : [7j Correlations 1 [Ordinal"-— ■ Somers" d , Kendall's tau-b j Kendslľs tau-c r Nominal by interval ; [""; Kappa S Eta j □Rs* j [7J McMemar H Caehran's and Marrtemasoszél statistics Continue Cancel He* Obr. 9.1 b Dodejme, že toto ale můžeme dělat pouze u proměnných ordinálních a spojitých, u nominálních proměnných nemá smysl o pozitivní či negativní asociaci hovořit. Existuje úzus, že při měření síly souvislosti mezi nominálními znaky hovoříme o asociaci nebo kontingenci, při měření síly souvislosti mezi ordinálními a kardinálními znaky hovoříme o korelaci. I příslušné dvourozměrné tabulky nazýváme kontingenění či korelační dle povahy proměnných. Znaménko plus nebo minus u korelačních koeficientů logicky znamená pozitivní nebo negativní směr závislosti. 266 Jaký druh koeficientu zaškrtnutím příslušného okénka zvolíme, závisí na několika okolnostech, z nichž ta nejdůležitější je povaha proměnných (tj. nominální, dicho-tomická, ordinálni, kardinální), jejichž vztah hledáme. Ostatně i této logice odpovídá dialog v SPSS, který je členěn na jednotlivé části dle povahy proměnných. 267