Grafy POLb1139 Statistické myšlení v sociálních vědách Úvod •Navazujeme na: •Četnosti •Medián, průměr •Bude důležité pro: •Normální rozdělení •Crosstaby •korelace • Důležitost typu proměnné •Různé vizualizace pro různé typy proměnných •Kategorické – srovnání četností kategorií – sloupcový graf (bar chart) •zlomky – koláčový graf (pie charts) •kardinální – distribuce (histogram, box plot) • Vizualizace •Základní pravidlo – nekomplikovat si grafy (život) • •Cíl – vizualizovat distribuci hodnot • •Plně postačí jednoduché sloupcové grafy (bar charts) • •Je zbytečné přidávat různé prvky typu 3D, kombinovat barvy, používat pro efekt koláčové grafy (pie charts) atd. Kde se v SPSS dělají grafy •Analyze à Descriptive Statistics à Frequencies à Charts •Graphs à Chart Builder à Bar… •Graphs à Legacy dialogsà Bar… • • Koláčový graf •Jen pokud je počet kategorií malý (max okolo 7) •Není příliš informativní pokud jsou počty malé nebo podobné •Analyze à Descriptive Statistics à Frequencies à Charts à pie chart • •Dvojklikem na graf lze otevřít okno pro editaci Problém v případě mnoha kategorií Sloupcový graf •Ukazuje četnosti každé z kategorií •Neukazuje procenta •Řešení -> export do excelu Možnosti exportu •Export konkrétní tabulky nebo grafu •Kliknutím pravým tlačítkem myši na věc v outputu •Copy as -> excel worksheet pro tabulky • ->image nebo microsoft object pro grafy • •Export celého outputu • • • • •Používejte export do excelu, v něm je snazší tabulky upravit, až po úpravě v excelu je kopírujte do wordu Kardinální proměnné •Intervalové a poměrové (SPSS nerozlišuje – obě jsou scale) • •Numerické kódy (zpravidla) odpovídají reálným pozorovaným hodnotám • •Více možností jednorozměrné analýzy oproti nominálním a ordinálním proměnným • •Vizualizace – stejná pravidla • Analyze à Descriptive Statistics à Frequencies à Charts Proměnná teplota v místnosti • Proměnná vzdálenost !!! Logaritmovaná osa •Řešení pro situaci kdy máme velké množství nízkých hodnot a několik případů s velmi vysokými hodnotami •Typická situace: populace •Důležité také pro scatter plot •Problem: nefunguje pro 0 a záporná čísla • Logaritmus vyjadřuje hodnotu kterou je třeba umocnit základ (zde 10), aby vzniklo dané číslo (např. pro 100 je to 2, protože10 na druhou je 100) •Úprava sloupců •Dvojklik na některý ze sloupců •Binning •Buďto zvýšení počtu kategorií •Nebo změna šířky intervalu Odlehlé případy (outliers) •< Q1 – 1,5*IQR •> Q3 + 1,5*IQR • •Outliers leží za těmito hodnotami •Vhodné poznat pro určité druhy analýzy (vliv na výsledky) • •vizualizace pomocí krabicového grafu (boxplot) • Graphs -> Chart Builder -> Boxplot Q3 + 1,5*IQR Q1 - 1,5*IQR outlieři Q1 Q3 medián Grafy pro ilustraci souvislosti •kategorická x kategorická – složený sloupcový graf (clustered/stacked bar chart) •kategorická x kardinální – sada boxplotů •kardinální x kardinální – bodový graf (scatterplot) • Sloupcový graf • • Stacked bar chart • Set of boxplots • Scatter plot •Vztah 2 kardinálních proměnných •korelace • •Výška x váha •Nezaměstananost x kupní síla • • Three types of correlation in a scatter plot undefined outliers overplotting • • •