Seminární cvičení

Základní editace dat v JASP

Data v JASPU lze upravovat čtyřmi různými způsoby: (1) úpravou označení proměnných; (2) Nastavením chybějících hodnot; (3) Filtrováním dat a (4) Přidáním nového sloupce. První dva způsoby jsme si již zkusili na datech Mental ability. Pro úplnost zmíníme i první dva způsoby (1,2), a vyzkoušíme si filtraci dat několika způsoby (3) a vytvoření nového sloupce (4). 


Úprava labelů (označení proměnné)

Označení proměnné lze upravit kliknutím na její název v datové matici. Úpravu labelů jsme si již zkusili na příkladu proměnné school v datové matici Mental ability, kdy jsme přejmenovali číselné labely na jména škol.  


Chybějící hodnoty

Při sběru dat pomocí dotazníku se běžně stává, že respondent u některé otázky neoznačí žádnou odpověď (ať již z přehlédnutí nebo neochoty odpovědět). V takovém případě při přepisu dotazníku do datové matice zadáme jinou hodnotu. Například pokud respondent zapomene vyplnit svůj věk, nebo pokud vynechá položku s 5bodovou Likertovou škálou, zapíšeme hodnotu NA. Šlo by sice buňku ponechat jednoduše prázdnou (tzv. system missing), ale zvykem je používat missing hodnotu, aby bylo jasné, že respondent skutečně otázku nezodpověděl a nejde třeba o přehlédnutí kodéra při přepisu dat. JASP automaticky vnímá hodnoty zapsané ve formě NaN, nan, ., NA, [prázdná buňka] jako missing values. Takto uvedenou hodnotu jako missing pak JASP při všech analýzách jednoduše ignoruje, jako by tam nebyla.

Nastavení chybějících hodnot provedeme prostřednictvím nabídky preference v Hlavním menu (tři modré proužky v levém horním rohu). S chybějícími hodnotami a jejich nastavením jsme již pracovali v kapitole Základní menu JASP. 


Filtrování dat

V některých případech potřebujeme počítat analýzy pro určitý podsoubor případů v našich datech, ale nechceme je z datového souboru trvale odstranit. Například v datovém souboru Mental ability bychom chtěli analyzovat data pouze od dětí ze sedmé třídy. JASP na základě tohoto výběru bude brát v úvahu pouze data osob, které kritérium splňují, a ostatní případy v datové matici bude ignorovat. 

Funkce filtrování v systému JASP má tři rozhraní: filtrování kliknutím (Filter Click), filtrování přetažením (Drag and Drop Filter) a R filtrování (R Filter). Ukážeme si první dva způsoby. Poslední způsob zahrnuje napsání syntaxe do programu R a je pro pokročilé uživatele statistického programu R.

Vyzkoušejte si


Filtrování proměnných kliknutím 

Filtraci kliknutím používáme pro filtrování nominálních a ordinálních proměnných. Tento filtr,  jsme již zmínili při představování prostředí s maticí dat. Filtr je přístupný kliknutím na záhlaví sloupce proměnné, kterou je třeba filtrovat. U dané proměnné se nám objeví malý symbol filtru.

Zkusíme si zmíněný příklad, kdy chceme pro analýzu použít jenom žáky sedmých tříd. Klikneme na jméno proměnné, kterou chceme filtrovat – v našem případě se jedná o proměnnou grade (třída). Nad datovou maticí se nám zobrazí okno na úpravu proměnné. Ve sloupci Filter jednoduše odklikneme fajfku u třídy s označením osm. Fajfka se změní na křížek, což nám říká, že osmáci nejsou zahrnuti do analýz.    


Úspěšné nastavení filtru poznáme podle toho, že řádky se žáky osmých tříd jsou méně výrazné, tedy že nejsou aktivní. Tímto způsobem můžeme filtrovat i více proměnných najednou.



Filtrování proměnných přetažením

Filtrování přetažením je o něco složitější a lze jej provádět kliknutím na ikonu filtru  v levém horním rohu datové matice. Tímto způsobem lze filtrovat jak nominální/ordinální proměnné, tak intervalové proměnné. 


Zkusme tento způsob filtrování na stejném příkladu s vyřazením žáků osmé třídy. Po otevření filtru poklikem na jeho ikonu v levém horním rohu datové matice se nám zobrazí filtrační okno.


Nalevo od filtračního okna se nachází seznam proměnných, které máme ve svém datovém souboru, počínaje proměnnou V1, která odkazuje na pořadí respondenta v datovém souboru. Chytíme a přetáhneme (proto „drag and drop“) do filtrovacího pole proměnnou grade. Nad filtračním oknem se nachází několik tzv. operátorů (+, -, %, = atd.). Do filtračního pole vložíme symbol =. Za vloženým symbolem se automaticky objeví … které přepíšeme na číslo 7. Pod filtračním oknem se nám zobrazí tlačítko „Apply pass-trough filter“ (Použít průchozí filtr). To nám říká, že můžeme aplikovat navržený filtr.


Po jeho stlačení se objeví potvrzení „Filter apllied“ a známý symbol filtru u proměnné grade. Při kontrole dat vidíme, že řádky žáků osmých tříd nejsou aktivní. Proměnné nebo operátory lze přidávat do filtračního pole i poklikem.

Podobným způsobem lze filtrovat i intervalové proměnné, kdy místo symbol = použijeme symboly menší, menší než, větší, větší než nebo vytvářet složitější operace. K tomu lze použít funkce, které se nachází napravo od filtračního okna.

Například bychom chtěli analyzovat jenom ty žáky, kteří v testu zrakového vnímání (proměnná x1) dosáhly nižších skórů, než byl medián celé skupiny. Z nabídky proměnných vybereme x1, z nabídky operátorů vybereme symbol < a z nabídky funkcí vybereme median(y). Písmeno „y“ ve funkci median(y) nahradíme přetažením proměnné x1 na jeho místo. Při přetažení proměnné x1 se nám místo písmena y zobrazí zelené okénko, do kterého proměnnou umístíme. Zmáčkneme „Apply pass-trough filter“. Podíváme se na data a přesvědčíme se, že řádky s hodnotami 5 a více nejsou aktivní.



Chcete-li vymazat všechny vytvořené filtry, chytíme a přetáhneme celou rovnici na ikonu koše, nebo na koš dvakrát dva krát klikneme myší.


Vytvoření nových sloupců (proměnných)

Může se stát, že ve své datové matici nenajdete proměnnou, kterou byste potřebovali a je potřeba je "vytvořit". Nové proměnné mohou usnadnit interpretaci výsledků. Například místo jednotlivých známek žáků za celý podzim může být vytvořena nová proměnná reprezentující celkový průměr. Dalším dobrým příkladem je celkový počet bodů za  jednotlivé úkoly, které žáci plnili v průběhu letního pololetí. 

JASP nabízí trochu kostrbatou verzi pro vytvoření nových proměnných s pomocí funkce "Vytvoření nového sloupce". V případě, že budete potřebovat vytvořit proměnné součtem nebo průměrováním, doporučíme spíše excel. Při obtížnějších úkonech jako je například normování (vytvoření z-skórů) nebo převody na logaritmické funkce se tato funkce bude hodit více.

Vyzkoušejte si


V naší datové matici Mental ability máme dvě proměnné, které se týkají věku žáků. První ageyr nám říká, kolik mají žáci let a druhá agemo k tomu ještě přidává počet měsíců. První žák má 13 let a jeden měsíc. S touto informací se nedá v analýzách pracovat, jelikož je věk ve dvou sloupcích. Vytvoříme si proto sloučenou proměnnou, která nám řekne, jaký je věk žáka v měsících.

Nejdříve klikneme na symbol černého plus v pravém horním rohu datového souboru. Objeví se nám okno, ve kterém vyplníme název nové proměnné, v našem případě age, označíme typ proměnné, v našem případě scale a zmáčkneme „Create column“, tj. vytvořit sloupec. 



Zobrazí se nám nové okno nad datovou maticí, pomocí kterého budeme vytvářet proměnnou. Toto okno je v podstatě stejné jako filtrační okno, které jsme používali v předešlém případě editace dat z pomoci filtrace přetažením (drag-and-drop filter). Navíc nám v datové matici přibyl poslední sloupec s proměnnou age.


Abychom mohli použít proměnnou ageyr musíme změnit její typ z ordinální na intervalovou. Novou proměnnou age vytvoříme tak, že proměnnou ageyr nejdříve proměníme na měsíce tím, že ji vynásobíme číslem 12 a poté ji přičteme k proměnné agemo.

Ze seznamu proměnných proto vybereme proměnnou ageyr a ze seznamu operátorů vybereme symbol *. Na tři tečky dopíšeme číslo 12 a zmáčkneme „enter“ (nesmíme mít blikající kurzor v rovnici). Poté klikneme na symbol +. Tím se nám první část rovnice ageyr * 12 zabalí do závorky, po které následuje symbol +. Na tři tečky po symbolu plus přetáhneme proměnnou agemo a zmáčkneme tlačítko „Compute column“ (Vytvoř sloupec). 


Program nám zahlásí, že sloupec byl spočten “Computed column code applied” a do posledního sloupce se doplní výsledná data.