Návod pro práci s SPSS Návody pro práci s programem SPSS pro kurz Metodologie pro Informační studia a knihovnictví 2 (jaro 2013) Ladislava Zbiejczuk Suchá Instalace programu SPSS najdete v INETu. Po přihlášení se se svým UČO a sekundárním heslem najdete programy v sekci Provozní služby – Software – Nabídka softwaru. Program si můžete stáhnout ve formátu ISO. Pro spuštění je tedy nutné jej vypálit na DVD nebo vytvořit virtuální disk. Při registraci nezapomeňte uvést registrační kód dostupný v INETu. Dostupných je hned několik druhů licencí – doporučuji vybrat licenci IBM SPSS Statistics 21 (nejnovější verze programu). Otevření souborů s daty SPSS tedy máme nainstalované – najdete jej v nabídce Start nebo v přehledu vašich programů. Do SPSS můžete data dostat několika způsoby – ten nejzákladnější je přímé tvoření datasetu v SPSS. My ale budeme potřebovat pracovat s daty, která již máme ve formátu .xls. Postupovat budeme následovně: 1. Uložíme si na své PC datový soubor ve formátu pro Excel (najdeme jej v ISu). 2. Pro převedení excelového souboru do souboru typu .sav spustíme „Database Wizzard“: 3. Z nabízených možností v dalším okně si vyberte „Excel files“: 4. Vyberte soubor ze svého PC: 5. Vyberte si oblast, kterou chcete převést a poté potvrďte stistem „Finish“ 6. V počítači se vám otevřou dvě nová okna. Jedno přímo s datasetem a druhé je tzv. „Output“ – okno, kam se zapisují procesy a výsledky operací SPSS. Práce s datasetem Dataset je neprve potřeba upravit a popsat. Všimněte si, že v SPSS lze přepínat mezi dvěma druhy zobrazení: • pohled na data, • pohled na proměnné. Pohled na data je velmi podobný tomu, co znáte z Excelu – co řádek, to respondent, co sloupec, to proměnná. Pohled na proměnné upřesňuje parametry jednotlivých proměnných. Ukažme si to na příkladu této otázky: Takto bude vypadat matice dat: Zároveň je potřeba popsat jednotlivé proměnné na kartě Variable view: • Name: zkrácené označení proměnné. • Typ: číselné/slovní (SPSS potřebuje vědět, jaké operace může provádět s jednotlivými proměnnými) • Decimal: desetinná místa (pouze kardinální proměnné) – automaticky jsou nastavena dvě desetinná místa, snižte si jejich počet na 0. • Label: většinou kopírujeme znění otázky. • Value labels: hodnoty proměnné – popíšeme všechny hodnoty proměnné včetně „missing values“ • Missing values: které hodnoty nezahrnujeme do dané analýzy – SPSS s nimi v konkrétních operacích nebude počítat. • Measure: typ proměnné (nominální/ordinální/kardinální) Ve studijních materiálech v ISu máte již datasety s popsanými proměnnými. Slučování datových souborů Někdy potřebujeme sloučit více datových souborů. Máme na výběr dvě varianty: • Chceme sloučit více dat o stejných případech: Merge Files  Add variables • Chceme sloučit soubory s různými jednotkami a stejnými proměnnými Merge Files  Add Cases Výběr případů Někdy naopak potřebujeme pracovat jen s některými případy (například se ženami): • Data  Select Cases • Lze vybírat náhodně nebo dle kritéria – pokud např. chceme pracovat jen s muži, pak musíme použít proceduru IF Kontrola dat V SPSS probíhá kontrola dat se stejnou logikou jako v jakénkoliv jiném programu. Její provedení je jen jednodušší, protože SPSS je přizpůsobeno na provádění statistických operací. SPSS má také tu výhodu, že nám v Outputu dává tabulky již v té podobě, v jaké by se měly objevit v odborné práci – tedy kompletní tabulky četností s nevalidními validními absolutními i relativními hodnotami. Pro použití v odborné práci je pouze třeba přeložit popisky tabulek. Kontrola kategorizovaných dat SPSS nám prostřednictvím jednoduchého příkazu Analyze  Descriptive Statistics  Frequencies (zde si vyberete konkrétní proměnnou) vrátí počet validních a nevalidních hodnot proměnných. Výsledky najdeme v okně Output: Stejně jako v případě SPSS nás bude zajímat výpis četností jednotlivých výskytů hodnot proměnné. Zde máme příklad chybného zápisu jména studentky či chybného zápisu v proměnné „pohlaví“: Poté co naleznete chybná data, můžete je v datasetu vyhledat pomocí příkazu CTRL+F stějně jako v Excelu. Tabulky četností a grafy v SPSS Tabulky četností v SPSS získáme příkazem Analyze  Descriptive Statistics  Frequencies . Grafy vytvoříme cestou Analyze  Descriptive Statistics  Frequencies  Charts. Modus a medián v SPSS Modus, medián a aritmetický průměr jednoduše získáte v SPSS touto cestou: Analyze  Descriptive Statistics  Frequencies  Statistics  Mean, Median, Mode