Metodologie pro ISK II ¡Všechny hodnoty z daného intervalu ¡ ¡Zjišťujeme: §Centrální míry §Variabilitu §Šikmost, špičatost §Percentily (decily, kvantily…) ¡ ¡Zobrazení: histogram ¡MODUS je hodnota, která se v datech vyskytuje nejčastěji. ¡MEDIÁN dělí řadu výsledků seřazených podle velikosti na dvě stejně početné poloviny ¡MEDIÁNOVÁ KATEGORIE je ta, ve které je dosaženo 50% všech údajů, postupujeme-li od první kategorie výše. ¡ARITMETICKÝ PRŮMĚR je součet všech hodnot vydělený jejich počtem ¡Analyze à Descriptive Statistics à Frequencies à Statistics à Mean, Median, Mode ¡V roce 2011 dosáhla v ČR průměrná mzda výše 24 319 Kč. Můžeme z toho usuzovat, že typický Čech má plat 24 319 Kč? ¡ ¡V roce 2011 dosáhla v ČR průměrná mzda výše 24 319 Kč. Můžeme z toho usuzovat, že typický Čech má plat 24 319 Kč? ¡ ¡MINIMUM ¡MAXIMUM ¡ROZPĚTÍ Analyze – Frequencies - Statistics MIN: minimální hodnota MAX: maximální hodnota RANGE: rozpětí (maximální minus minimální hodnota) ¡Rozptyl je definován jako střední hodnota kvadrátů odchylek od střední hodnoty (průměru). ¡vyjadřuje variabilitu rozdělení souboru náhodných hodnot kolem její střední hodnoty. ¡SMĚRODATNÁ ODCHYLKA je druhá odmocnina rozptylu, a v podstatě nám říká, uvnitř jakého intervalu okolo průměru leží zvolené procento případů ¡Čím je směrodatná odchylka menší, tím lépe pro aritmetický průměr http://wilderdom.com/images/IQBellCurveEinstein.gif Zdroj: http://wilderdom.com/intelligence/IQUnderstandingInterpreting.html ¡Rozptyl a směrodatná odchylka mají vždy stejnou jednotku jako daná proměnná (věk v letech, výška v cm, plat v EUR…) ¡Chceme-li porovnávat mezi sebou různé proměnné (s různými jednotkami), vypočítáme variační koeficient ¡ Analyze - Frequencies - Statistics ¡Nejčastěji používané: ¡ ¡MEDIÁN (x50) ¡KVARTILY (x25, x50, x75) ¡DECILY (x10, x20, x30, x40, x50, x60, x70, x80, x90) •„spodních“ 10 % čtenářů čte jen jednu knihu ročně • polovina čtenářů přečte do 10 knih ročně • tři čtvrtiny čtenářů přečte do 20 knih ročně zešikmení ¡Symetrické (normální) rozložení - aritmetický průměr, medián a modus mají stejné nebo velmi podobné hodnoty. (0) ¡Pokud je aritmetický průměr větší než medián, který je zase větší než modus, znamená to, že je více případů menších než průměr a naše rozložení je šikmé doprava. (+) ¡Třetí možností je, že je více případů větších než aritmetický průměr. Ten je pak menší než medián a ten je menší než modus. Naše rozložení je šikmé doleva. (-) http://allaboutalpha.com/blog/wp-content/uploads/2010/08/kurtosis.jpg Pozitivní špičatost Negativní špičatost šikmost špičatost ¡Velmi podrobné a přehledné vizualizace distribuce spojitých dat http://informationandvisualization.de/files/boxplot_explanation.png nejvyšší hodnota výběru, která je menší nebo rovna součtu hodnoty horního kvartilu a 1.5 násobku interkvartilového rozpětí nejvyšší hodnota výběru, která je menší nebo rovna součtu hodnoty horního kvartilu a 1.5 násobku interkvartilového rozpětí nejvyšší hodnota výběru, která je menší nebo rovna součtu hodnoty horního kvartilu a 1.5 násobku interkvartilového rozpětí nejnižší hodnota výběru, která je větší nebo rovna rozdílu hodnoty dolního kvartilu a 1.5 násobkuinterkvartilového rozpětí Analyze – Explore - Plots outliers extremes ¡Kolik průměrně naši respondenti kupují knih za rok? ¡Je průměr v tomto případě vhodný ukazatel? Zdůvodněte své stanovisko… ¡Vytvořte boxploty pro přečtené a nakoupené knihy a porovnejte je. ¡ ¡Vytvořte novou proměnnou spokojenost_2, kde budou jen tři kategorie: §Spokojen/a §Ani/ani §Nespokojen/a ¡Vytvořte novou proměnnou „vek“ a okomentujte rozložení (max, min, středové hodnoty) ¡Z jakých zdrojů získávají knihy muži a ženy? (vytvořte tabulku četností podle pohlaví) ¡Z kolika zdrojů získáváme knihy? ¡