Seminární cvičení

Prostředí JASP

Hlavní prostředí

JASP má zjednodušené rozhraní a přepínáme mezi třemi částmi hlavního okna:

  1. okno s maticí dat ve formě „excelovské“ tabulky,
  2. okno pro zobrazení analýz
  3. okno pro zobrazení výsledků.

Při menším rozlišení monitoru je velká pravděpodobnost, že budeme mít otevřenou jenom matici dat (1) nebo současně otevřené okno s analýzami (2) a výsledky (3)Svislé pruhy umožňují posouvat okna doprava nebo doleva kliknutím a přetažením tří svislých teček a tím zvětšovat nebo zmenšovat jejich prostor. Jednotlivá okna lze také zcela sbalit pomocí ikon se šipkou doprava nebo doleva.

V následujícím textu si postupně projdeme každou ze tří části hlavního okna JASP, tj. okno s maticí dat, okno pro analýzu dat a okno pro zobrazování výsledků. 


Prostředí s maticí dat

Datová matice je strukturovaný formát pro organizaci a prezentaci dat, která je běžně používána ve statistikách, výzkumu, analýzách dat a výpočetní technice. Je to tabulka, kde jsou data uspořádána do řádků a sloupců.

Struktura datové matice

  • Řádky: Každý řádek obvykle reprezentuje jeden záznam nebo pozorování. Například v tabulce obsahující údaje o studentech může každý řádek představovat jednoho studenta.
  • Sloupce: Každý sloupec obsahuje určitý typ informace, který je shromažďován pro všechna pozorování. V případě dat o studentech mohou sloupce zahrnovat jméno, věk, známky, atd.

 Představme si jednoduchou datovou matici, která obsahuje údaje o několika osobách:

StudentVěkPočet bodůZnámkaSlovní hodnocení
Anička922,51 Výborně, vidím zlepšení v interpunkci, jen pozor na shodu podmětu s přísudkem. 
Petr10231 Skvělý pokrok, jen několik drobných chyb, pokračuj ve cvičení a zlepšíš se ještě více. 
Honza9183 Dobrá práce, většina slov je napsána správně, ale zaměř se na diakritiku. 
Jana9202 Chválím za snahu a pečlivost, ještě je třeba zapracovat na pravopisu některých slov. 

Pro různé statistické operace musíme být pozorní, s jakými proměnnými pracujeme, např. různé korelační koeficienty jsou vhodné pro různé proměnné, v zásadě rozdělujeme tři druhy proměnných:

  • nominální proměnné jsou proměnné, u nichž nejsme schopni nijak odlišit jejich intenzitu, neexistuje více nebo méně. Typickou nominální proměnnou je pohlaví (přestože v datové matici přidělíme např. 1-muž a 2-žena neznamená to, že jedno pohlaví je lepší 😊) nebo například výsledek zápočtového testu P – prošel a N – neprošel. V naší datové matici se jedná o jména studentů.
  • ordinální proměnné jsou proměnné, u nichž jsme schopni odlišit intenzitu, tzn. můžeme odlišit více nebo méně, ale máme pouze menší množství kategorií (typicky 5-10). Typickou ordinální proměnnou může být výše příjmu, která je rozdělena do několika kategorií (do 9 999; 10 000 – 14 999; 15 000 -  19 999; 20 000 – 29 999; 30 000 – 49 999; 50 000 – 99 999; 100 000 a více) nebo například známka , kterou obdržíte při zkoušce od A až po F. 
  • intervalové proměnné jsou proměnné, u nichž jsme velmi dobře schopni odlišit intenzitu, máme velké množství kategorií. Typickou intervalovou proměnnou může být výše příjmu, kterou respondent vypisuje číslem nebo počet bodů, které jste získali v testu.
Vyzkoušejte si


Jako příklad použijeme datový soubor z knihovny JASP s názvem Mental ability. Otevřeme ho tak, že v hlavním menu (tři modré proužky) zvolíme možnost Open – Data Library – 6. Factor – Mental ability


Po načtení se soubor dat zobrazí v okně jako matice dat. Datový soubor Mental ability (Holzinger a Swineford, 1939) se skládá z výsledků testů mentálních schopností žáků sedmých a osmých tříd ze dvou různých škol (Pasteurova a Grant-Whiteova). V původním souboru dat jsou výsledky 26 testů. V literatuře se však častěji používá menší podsoubor s 9 proměnnými (Joreskog, 1969).

Datový soubor Mental ability má v záhlaví (tzv. header) 15 proměnných:

  • id - Identifikátor
  • sex - Pohlaví
  • ageyr - Věk, roky
  • agemo - Věk, měsíce
  • school - Škola (Pasteur nebo Grant-White)
  • grade - Třída
  • x1 – Zrakové vnímání
  • x2 – Kostky
  • x3 – Vnímání prostoru
  • x4 - Porozumění odstavcům
  • x5 - Doplňování vět 
  • x6 - Význam slov
  • x7 - Zrychlené sčítání
  • x8 - Zrychlené počítání teček
  • x9 - Zrychlené rozlišování rovných a zakřivených velkých písmen

Tento ukázkový soubor JASP demonstruje použití konfirmační faktorové analýzy (CFA). V našem případě ho budeme používat pro jednoduchou úpravu dat a popisné statistiky.

Když budeme chtít v JASP otevřít vlastní datovou matici vytvořenou v excelu je nutné, aby první řádek obsahoval názvy proměnných. Při otevření souboru program automaticky odhadne a přiřadí jednotlivé typy proměnných k našim datům. Rozlišujeme tři typy proměnných: (1) nominální; (2) ordinální; (3) intervalové (continuos) (viz vysvětlení v úvodu podkapitoly). 


Pokud JASP nesprávně označí typ proměnné, stačí kliknout na příslušnou ikonu proměnné v názvu sloupce a změnit ji na správný formát.

Po kliknutí na název proměnné (např. school) se vám otevře okno nad hlavní datovou maticí, ve kterém můžete přejmenovat jednotlivé označení proměnných ve sloupci Label. Většinou se to používá u nominálních/ordinálních proměnných, jinak to nemá smysl. Sloupec Value udává hodnotu, kterou máte přiřazenou k jednotlivým označením proměnné (Label). Zde by mohla být například i uvedena hodnota 1 = vanilková zmrzlina, 2 = čokoládová zmrzlina, 3 = jahodová zmrzlina.   

V naší současné matici jsou dvě školy – proměnná s názvem school. V sloupci Value (hodnota) najdeme školu Grant-White a Pasteur. V sloupci Label (označení) jsou k nim přislouchající názvy škol Grant-White a Pasteur. V datové matici to někdy může být matoucí a lze to zpřehlednit přepsáním označení (Label). Můžeme si zkusit přejmenovat tyto skupiny. První Grant-White můžeme označit číslem 1 a druhou Pasteur číslem 2. Tyto přepsané popisky okamžitě nahradí kódy v tabulkovém zobrazení. Pokud tento soubor uložíme jako soubor .jasp, uloží se tyto kódy automaticky, stejně jako všechny analýzy a poznámky.


V tomto okně můžeme také provádět jednoduchou filtraci dat odznačením fajfky v sloupci Filter. Po zrušení fajfky Pasteur se data z této skupiny nebudou započítávány v následujících analýzách. Složitější filtrování dat lze provádět kliknutím na ikonu filtru v levém horním rohu datové matice. Filtraci dat si podrobně vysvětlíme v kapitole Práce s daty v JASP – Základní editace dat. 

Pokud chceme upravit data v tabulce, stačí dvakrát kliknout na buňku a data se otevřou v naší původní tabulce, tj. v aplikaci Excel. Po úpravě dat a uložení původní tabulky se JASP automaticky aktualizuje tak, aby odrážel provedené změny, za předpokladu, že jsme nezměnili název souboru. Více v kapitole Základní editace dat.

 


Prostředí pro analýzu dat

Analýza dat je proces zkoumání, transformace, čištění a statistického zpracování dat s cílem získat užitečné informace, podporovat rozhodovací procesy a ověřovat hypotézy. Tento proces zahrnuje několik kroků a metod, které mohou být různé v závislosti na konkrétní oblasti aplikace a typu analyzovaných dat. 

Význam analýzy dat

  • Podpora rozhodování: Pomáhá činit informovaná rozhodnutí na základě důkazů (evidence based approach).
  • Identifikace trendů: Umožňuje sledování a předvídání trendů a vzorců, které mohou být klíčové pro strategické plánování.
  • Zlepšení procesů: Pomáhá optimalizovat a zlepšovat různé procesy tím, že identifikuje neefektivní oblasti a navrhuje způsoby jejich vylepšení.
  • Výzkum a inovace: Umožňuje objevování nových poznatků a inovací v různých oblastech, včetně pedagogiky (educational science).

Analýza dat je tedy klíčový nástroj v dnešním datově řízeném světě, který umožňuje efektivní využití informací pro dosažení lepších výsledků a rozhodnutí.

Základní možnosti práce s daty jsou přístupné na hlavním panelu analýz. Jedná se o nejčastěji užívané statistické analýzy v sociálních vědách.


V současné době JASP nabízí následující frekvenční (parametrické a neparametrické standardní statistické testy) a alternativní Bayesovské testy:

Popisné statistiky

  • Popisná statistika (Descriptive stats)

Regresní analýza

  • Korelace (Correlation)
  • Lineární regrese (Linear r.)
  • Logistická regrese (Logistic r.)

T-tests (srovnání dvou skupin)

  • Nezávislý t-test (Indipendent)
  • Párový t-test (Paired)
  • Jednovýběrový t-test (One sample)

Frekvenční analýza

  • Bionomiální test (Binomial t.)
  • Multionomiální test (Multinomial t.)
  • Kontingenční tabulky (Contingency tables)
  • Log-lineární regrese (Log-linear r.)

ANOVA (srovnání více skupin)

  • Nezávislá měření (Independent)
  • Opakovaná měření (Repeated measures)
  • ANCOVA
  • MANOVA

Faktorová analýza

  • Analýza hlavních komponent (PCA)
  • Explorační faktorová analýza (EFA)
  • Konfirmační faktorová analýza (CFA)

Mixed Models

  • Linear Mixed Models
  • Generalised linear mixed models

 


Kliknutím na ikonu velkého modrého plus v pravém horním řádku nabídky získáme přístup k pokročilým volitelným modulům. Po jejich zaškrtnutí budou přidány na hlavní panel analýz.

Vyzkoušejte si


Zkusíme si to prakticky na příkladu popisných statistik. V levém horním rohu klikneme na  ikonku Descriptives. V levém okně se nám zobrazí možnosti práce s daty a v pravém okně se budou interaktivně objevovat výsledky.  V okně analýz můžeme jednotlivé analýzy přejmenovat pomocí černé ikony pera nebo odstranit pomocí červeného křížku. Zelená ikona + vytvoří kopii vybrané analýzy. Modrá informační ikona poskytuje podrobné informace o každém z použitých statistických postupů a obsahuje možnost vyhledávání. Ikonka s bílým R v modrém kroužku vytváří syntaxi pro software R


Uspořádání analýz lze změnit jednoduchým chycením a přetažením na požadované místo. Můžeme si zkusit přejmenovat název analýzy „Descriptive statistics“ na „Popisné statistiky“. Zkusíme si vytvořit kopii souboru a tu následně smazat.   



Prostředí pro zobrazení výsledků

Po kliknutí na ikonu male černé šípky směřující dolů vedle nadpisu analýzy se zobrazí řada možností, včetně:

  • Upravit název (Edit title)
  • Kopírovat (Copy)
  • Exportovat výsledky (Export results)
  • Přidat poznámky (Add note)
  • Odstranit vše (Remove all)
  • Obnovit vše (Refresh all)
  • Ukázat syntaxi pro program R (Show R syntax

Možnost přidat poznámky (Add note) umožňuje snadné přidání poznámek k výstupu výsledků a jejich následný export do formátu HTML nebo PDF, a to příkazem Soubor > Exportovat výsledky. Lze zde změnit písmo textu, velikost, barvy atd.

Poznámky jsou skvělou příležitostí k zapsání interpretace výsledků. Když si soubor znovu otevřeme budeme tak mít přehled, co, jak a proč jsme analyzovali a co jsme z výsledků odvodili. Můžeme si zde psát i myšlenky, na další postup, postřehy pro diskuzi v závěrečné práci atp. Navíc, kdokoliv další, komu pošleme soubor, (např. vedoucí závěrečné práce) bude mít představu, jak rozumíme výsledkům.

Velikost všech tabulek a grafů můžeme změnit pomocí klávesových zkratek ctrl+ (zvětšit) ctrl- (zmenšit) ctrl= (zpět na výchozí velikost). Velikost grafů lze měnit také přetažením pravého dolního rohu grafu. Jak již bylo zmíněno, všechny tabulky a obrázky jsou zobrazovány ve výchozím formátu APA normy a lze je jednoduše zkopírovat do libovolného jiného dokumentu například do Wordu.