Metodologie pro ISK 2, jaro 2014. Ladislava Z. Suchá Metodologie pro Informační studia a knihovnictví 2 Modul 7: Třídění druhého stupně. Kontingenční tabulky Co se dozvíte v tomto modulu? • Co je třídění druhého stupně • Jak vytvořit a interpretovat kontingenční tabulku Třídění druhého stupně Doposud jsme se zabývali jen popisem jednotlivých proměnných – prováděli jsme tzv. třídění prvního stupně. Často jsou pro nás ale mnohem zajímavější data, která vzniknou tzv. tříděním druhého stupně, ve kterém se porovnávají dvě proměnné. Třídění druhého stupně se používá například: • chceme-li zjistit, zda odpovídali různě muži a ženy, • chceme-li zjistit, zda jsou rozdíly v odpovědích respondentů dle věku, • chceme-li zjistit, zda jsou rozdíly v odpovědích respondentů dle vzdělání, • chceme-li zjistit, zda jsou rozdíly v odpovědích respondentů dle postojů k jinému problému. Pro třídění druhého stupně se používá speciální tabulka četností – tzv. kontingenční tabulka (v Excelu funkce pivot table, v SPSS Crosstabs). Příklad: Chceme zjistit, zda v našem souboru existují rozdíly v tom, jak často chodí do knihoven muži a ženy. Mužů a žen bylo ale v souboru rozdílné množství!! Abychom mohli odpovědi porovnat, potřebujeme znát relativní četnosti!!! Klikneme na data pravým tlačítkem myši a vybereme v nabídce Zobrazit hodnoty jako – řádková/sloupcová procenta. Nyní dostaneme tabulku, kde již hodnoty u mužú a žen můžeme porovnávat – nejsou totiž závislé na tom, že mužů a žen odpovídal různý počet. Tuto tabulku můžeme číst následujícím způsobem: • 7,66 % mužů ve vzorku chod do knihovny jednou týdně. 5,53 % mužů chodí do knihovny jednou za 14 dní. • 11,45 % žen chodí do knihovny jednou týdně. 7,53 % žen chodí do knihovny jednou za 14 dní. • Atd… Abychom mohli lépe rychle porovnat rozdíly mezi muži a ženami, necháme si zobrazit skládaný graf: Zde vidíme patrné rozdíly. Ještě markantněji by byly patrné, kdybychom si překódovali proměnnou frekvence návštěv knihovny např. na pravidelné návštěvníky (hodnoty 1,2,3 – tedy chodí alespoň jednou za měsíc), nepravidelné návštěvníky (hodnoty 4, 5, 6) a nenávštěvním (hodnota 7). Tady se rozdíly pohybují již v desítkách procent. 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% muž žena nechodí jednou za rok a méně často jednou za půl roku jednou za čtvrt roku jednou měsíčně jednou za 14 dní jednou týdně Tvorba a interpretace kontingenční tabulky Vytvoření kontingenční tabulky je velmi jednoduché, je však třeba mít na paměti několik základních pravidel: 1. Důležité jsou pro nás relativní četnosti. Absolutní hodnoty jsou závislé na zastoupení jednotlivých skupin respondentů ve výběrovém vzorku. 2. Musíme určit, kterou proměnnou považujeme za závislou a kterou za nezávislou. 3. Je-li nezávislá proměnná ve sloupcích, porovnáváme sloupcová procenta. Je-li nezávislá proměnná v řádcích, porovnáváme řádková procenta. Kontingenční tabulka v Excelu V Excelu budeme opět používat funkci Pivot tables (Kontingenční tabulka). Pozor! V bodě 3 se velmi často chybuje Nejprve si musíme vybrat, jaké proměnné se budou zobrazovat v řádcích a jaké ve sloupcích. Neexistuje jednoznačný úzus (např. nezávislé proměnné v řádcích). Pokud má jedna z proměnných mnoho variant, je vhodné ji umístit do řádků (umístění do sloupců by znesnadňovalo orientaci v tabulce, případně by se tabulka musela umístit do listu s horizontální orientací. Pokud v datech zůstaly nevalidní hodnoty (missing values), je lepší je pro analýzu vyřadit. V tuto chvíli máme tabulku s absolutními četnostmi. Potřebujeme však tabulku, kde budou uvedeny i četnosti relativní. Kliknete pravým tlačítkem na datovou oblast a nastavíme si zobrazení polí hodnot. Podle toho, kde máme nezávislou proměnnou, vybereme řádková či sloupcová procenta. Kontingenční tabulka v SPSS V SPSS jsou kontingenční tabulky v záložce Analyze  Descriptive Statistics Crosstabs. Zobrazení řádkových a sloupcových procent se nastavuje v nabídce „Cells“. SPSS umí generovat tabulku obsahující dohromady jak absolutní, tak relativní četnosti.