Metodologie pro Informační studia a knihovnictví 2 Modul 7: Třídění druhého stupně. Kontingenční tabulky Co se dozvíte v tomto modulu? • Co je třídění druhého stupně • Jak vytvořit a interpretovat kontingenční tabulku Třídění druhého stupně Doposud jsme se zabývali jen popisem jednotlivých proměnných - prováděli jsme tzv. třídění prvního stupně. Často jsou pro nás ale mnohem zajímavější data, která vzniknou tzv. tříděním druhého stupně, ve kterém se porovnávají dvě proměnné. Třídění druhého stupně se používá například: • chceme-li zjistit, zda odpovídali různě muži a ženy, • chceme-li zjistit, zda jsou rozdíly v odpovědích respondentů dle věku, • chceme-li zjistit, zda jsou rozdíly v odpovědích respondentů dle vzdělání, • chceme-li zjistit, zda jsou rozdíly v odpovědích respondentů dle postojů k jinému problému. Pro třídění druhého stupně se používá speciální tabulka četností - tzv. kontingenční tabulka (v Excelu funkce pivot table, v SPSS Crosstabs). Příklad: Chceme zjistit, zda v našem souboru existují rozdíly v tom, jak často chodí do knihoven muži a ženy. Počet z 1 frekvencenavstev l_f re ^ 13_pohlavi @ 1 2 3 4 5 6 7 Celkový součet 1 18 13 31 25 19 33 96 235 2 38 25 103 38 24 22 82 332 Celkový součet 56 38 134 63 43 55 178 567 Mužů a žen bylo ale v souboru rozdílné množství!! Abychom mohli odpovědi porovnat, potřebujeme znát relativní četnosti!!! Klikneme na data pravým tlačítkem myši a vybereme v nabídce Zobrazit hodnoty jako - řádková/sloupcová procenta. Nastavení polí hodnot Název zdroje; ljrekvencenavstev Vlastní název: Počet z l_frekvencenavstev Souhrn , Zobrazit hodnoty jako Zobrazit hodnoty jako Základní pole: UCOtazatele Jménotazatele OnbneneboFTF ljrekvencenavstev 2_Duvody _nena vste v y Formát osla , Základní položka: DC Nyní dostaneme tabulku, kde již hodnoty u mužů a žen můžeme porovnávat - nejsou totiž závislé na tom, že mužů a žen odpovídal různý počet. Počet z 1 frekvencenavstev l_frekve[»j 13_pohlavi 1 2 3 4 5 6 7 Celkový součet 1 7,66% 5,53% 13,19% 10,64% 8,09% 14,04% 40,85% 100,00% 2 11,45% 7,53% 31,02% 11,45% 7,23% 6,63% 24,70% 100,00% Celkový součet 9,88% 6,70% 23,63% 11,11% 7,58% 9,70% 31,39% 100,00% Tuto tabulku můžeme číst následujícím způsobem: • 7,66 % mužů ve vzorku chod do knihovny jednou týdně. 5,53 % mužů chodí do knihovny jednou za 14 dní. • 11,45 % žen chodí do knihovny jednou týdně. 7,53 % žen chodí do knihovny jednou za 14 dní. • Atd... Abychom mohli lépe rychle porovnat rozdíly mezi muži a ženami, necháme si zobrazit skládaný graf: I nechodí l jednou za rok a méně často jednou za půl roku I jednou za čtvrt roku l jednou měsíčně I jednou za 14 dní l jednou týdně muz zena Zde vidíme patrné rozdíly. Ještě markantněji by byly patrné, kdybychom si překódovali proměnnou frekvence návštěv knihovny např. na pravidelné návštěvníky (hodnoty 1,2,3 -tedy chodí alespoň jednou za měsíc), nepravidelné návštěvníky (hodnoty 4,5,6) a nenávštěvním (hodnota 7). Tady se rozdíly pohybují již v desítkách procent. Tvorba a interpretace kontingenční tabulky Vytvoření kontingenčnítabulky je velmi jednoduché, je všaktřeba mít na paměti několik základních pravidel: 1. Důležité jsou pro nás relativní četnosti. Absolutní hodnoty jsou závislé na zastoupení jednotlivých skupin respondentů ve výběrovém vzorku. 2. Musíme určit, kterou proměnnou považujeme za závislou a kterou za nezávislou. 3. Je-li nezávislá proměnná ve sloupcích, porovnáváme sloupcová procenta. Je-li nezávislá proměnná v řádcích, porovnáváme řádková procenta. Pozor! V bodě 3 se velmi často chybuje Kontingenční tabulka vExcelu V Excelu budeme opět používat funkci Pivot tables (Kontingenční tabulka). Kontingenční tabulka - Obrázek Klipart Tvary Ilustrace 1 . Na které z těchto dvou následujících fakult Masarykovy un 2 1 13. 04. 20112:13:08 3 2 13.04.20112:14:59 Přírodovědecká fakulta 4 3 13. 04. 20112:15:08 Přírodovědecká fakulta 5 4 13.04.20112:15:09 Přírodovědecká fakulta 6 5 13. 04. 20112:16:09 Přírodovědecká fakulta 7 6 13.04.20112:16:37 Přírodovědecká fakulta 8 7 13. 04. 20112:18:16 Přírodovědecká fakulta 9 8 13.04.20112:18:17 Přírodovědecká fakulta 10 9 13.04.20) 12:18:18 Přírodovědecká fakulta 11 10 13.04.20112:18:50 Přírodovědecká fakulta 12 11 13.04.20112:19:01 Přírodovědecká fakulta 13 12 13.04.20112:20:21 Přírodovědecká fakulta 14 13 13. 04. 20112:20:26 15 14 13. 04. 20112:20:27 Přírodovědecká fakulta Ifi 15 13 (14 20112:2(1:40 Nejprve si musíme vybrat, jaké proměnné se budou zobrazovat v řádcích a jaké ve sloupcích. Neexistuje jednoznačný úzus (např. nezávislé proměnné v řádcích). Pokud má jedna z proměnných mnoho variant, je vhodněji umístit do řádků (umístění do sloupců by znesnadňovalo orientaci v tabulce, případně by se tabulka musela umístit do listu s horizontální orientací. Název kontingenční tabulky; Kontingenční tabulka 2 Možnosti * Kontingenční tabulka 1 a3 Chcete-li vytvořit e zvolte pole ze seznd kontingenční tabj Zde vybíráme proměnné a přetahujeme je do políček „popisky řádků" a „popisky sloupců". Nakonec vybereme, co se bude zobrazovat v políčku „hodnoty". 19 20 Filtrem si můžete „vyfiltrovať | odpovědi - např. pokud chcete zobrazit jen odpovědi u žen, pak zadáte do filtru pohlaví a v tabulce nastavíte H o ni Ust2Otipovl si t vybrat Přesunout Kontingenční Vzorce l - lU ■ Seznam Tlačítka Záhlaví poli +/-Zobrazit či i krýt Seznam poli kontingenční tabulky Zvolte pole, které chcete přidat do sestavy: !_-Znalost knihovny: [Nedťm se v kniho... '~ Znalost knihovny: [Chci se naučit, jak... |_;Znalost knihovny: [Knihovna je bezp... '— Mechanické bariéry: [Kopírky bývají o.., i "Mechanické bariéry: [V tiskárnách ča... G Mechanické bariéry: [Výpůjčníautom,,. | 10. Další bariéry [Při vyhledávání v d... i_ 10. Dala bariéry [Dělá mi velké potze... !J 10. Další' bariéry [Vadí mi, že v datab... G10. Dala bariéry [Když potřebuji něja,. |_i 11. Pociťujete při využívání služeb i~; 12, Jaké je vaše pohlaví? □ 13. Jaký je Váš věk? :ja... ""F Přetáhnout pole mezi následujícími oblastmi: i/ Filtr sestavy ~j Popisky sloupců Popisky řádků z Hodnoty ; Odložit aktualizaci rozto... Aktualizj Pokud v datech zůstaly nevalidní hodnoty (missing values), je lepší je pro analýzu vyřadit. Počet z 1 frekvencenavstev 1 frekvencenavstev •* 13_pohlavi ,l jednou týdně jedí muž _ M L žena 38 Celkový součet 56 V tuto chvíli máme tabulku s absolutními četnostmi. Potřebujeme však tabulku, kde budou uvedeny i četnosti relativní. Kliknete pravým tlačítkem na datovou oblast a nastavíme si zobrazení polí hodnot. Podle toho, kde máme nezávislou proměnnou, vybereme řádková či sloupcová procenta. Nastavení polí hodnot Název zdroje: l_frekvencenavstev Vlastní název: Počet z 1 frekvencenavstev Souhrn Zobrazit hodnoty jako [ ^ Zobrazit hodnoty jako % řádku Základní pole: UCOtazatele Jméno tazatele OnlineneboFTF l_frekvencenavstev 2 Důvody nenavstevy Formát čísla OK Pokud chceme zobrazit procenta: 1. klikneme pravým tlačítkem na datovou oblast a dáme „Nastavení pole" a „Zobrazit hodnoty jako". 2. Vybereme sloupcová nebo řádková procenta (je-li nezávislá proměnná ve sloupcích, pak sloupce, jeli v řádcích, pak řádky)! Storno Kontingenční tabulka v SPSS V SPSS jsou kontingenční tabulky v záložce Analyze -> Descriptive Statistics ->Crosstabs. Zobrazení řádkových a sloupcových procent se nastavuje v nabídce „Celis". SPSS umí generovat tabulku obsahující dohromady jak absolutní, tak relativní četnosti.