Téma č. 10.: Aplikace shlukové analýzy Článek Ladislava Rabušice Koho Češi nechtějí? (uveřejněn ve Sborníku prací FSS MU Sociální studia 5, 2000) se zabývá touto problematikou: V roce 1999 proběhlo ve 24 evropských zemích sociologické šetření, v němž měli respondenti za úkol odpovědět na otázku „Můžete prosím z následujícího seznamu vybrat všechny ty, koho byste nechtěl(a) mít za sousedy?“ V seznamu byly tyto skupiny osob: Kriminálníci, osoby jiné rasy, levicoví extrémisté, alkoholici, pravicoví extrémisté, početné rodiny, citově nestabilní lidé, muslimové, imigranti, lidé s AIDS, narkomani, homosexuálové, židé, Romové. V datovém souboru netolerance.sta jsou zaznamenány relativní četnosti vybraných skupin osob. V České republice se výzkumu, který proběhl v květnu 1999, zúčastnilo 1908 osob. Úkol 1.: Zaměřte se na ČR. Vytvořte sloupkový diagram tohoto tvaru: Úkol 2.: Do jednoho grafu nakreslete krabicové diagramy všech 14 proměnných. Krabicový graf z více proměnných netolerance.sta 14v*24c Medián; Krabice: 25%-75%; Svorka: Rozsah neodleh. Medián 25%-75% Rozsah neodleh. Odlehlé Extrémya c e g i k m -0,2 0,0 0,2 0,4 0,6 0,8 1,0 Vzhledem k velmi rozdílné variabilitě proměnných se jeví vhodnější pracovat se standardizovanými daty. Úkol 3.: Na ploše prvních dvou hlavních komponent znázorněte rozmístění zemí. Projekce případů do faktorové roviny ( 1 x 2) Případy se součtem cos()^2 >= 0,00 Aktiv. France United Kin West Germa East Germa Austria Italy Spain Portugal Netherland Belgium Denmark Sweden Finland Estonia Latvia Lithuania Poland CzechiaSlovakia Hungary Romania Bulgaria Russia Slovenia -14 -12 -10 -8 -6 -4 -2 0 2 4 6 8 Faktor 1: 57,72% -5 -4 -3 -2 -1 0 1 2 3 4 Faktor2:10,38% France United Kin West Germa East Germa Austria Italy Spain Portugal Netherland Belgium Denmark Sweden Finland Estonia Latvia Lithuania Poland CzechiaSlovakia Hungary Romania Bulgaria Russia Slovenia Úkol 4.: Použijte metodu nejbližšího souseda, nejvzdálenějšího souseda, metodu průměrné vazby a Wardovu metodu pro nalezení shluků zemí podobných z hlediska tolerance. Výsledky znázorněte pomocí dendrogramů. Dendrogram pro Wardovu metodu: Str. diagram pro 24 případů Wardova metoda Euklid. vzdálen. na druhou 0 50 100 150 200 250 Vzdálenost spoje Hungary Russia Bulgaria Poland Slovakia Romania Lithuania Estonia Sweden Denmark Netherland East Germa Belgium Austria West Germa Slovenia Latvia Czechia Finland Italy United Kin Portugal Spain France Úkol 5.: Určete 5 shluků navzájem si podobných zemí. Úkol 6.: Proveďte shlukovou analýzu pro proměnné. Dendrogram pro metodu nejvzdálenějšího souseda: Tree Diagram for 14 Variables Complete Linkage Squared Euclidean distances 0 10 20 30 40 50 60 70 Linkage Distance e c k g f m i h b n j d l a Úkol 7.: Použijte metodu k-průměrů k nalezení 5 shluků navzájem si podobných zemí a uložte skupinovou příslušnost do datového souboru. K určení významnosti jednotlivých proměnných proveďte analýzu rozptylu. Nakreslete graf průměrů všech 5 shluků a pokuste se o interpretaci. Graf průměrů: Graf průměrů všech shluků Shluk 1 Shluk 2 Shluk 3 Shluk 4 Shluk 5 b d f h j l n Proměnné -3 -2 -1 0 1 2 3 4 5 6