Hlavní
prostředí
JASP má
zjednodušené rozhraní a přepínáme mezi třemi částmi hlavního okna:
- okno s maticí dat ve formě „excelovské“ tabulky,
- okno pro zobrazení analýz
- okno pro zobrazení výsledků.
Při menším
rozlišení monitoru je velká pravděpodobnost, že budeme mít otevřenou jenom
matici dat (1) nebo současně otevřené okno s analýzami (2) a výsledky (3). Svislé pruhy umožňují posouvat okna doprava nebo doleva kliknutím a přetažením tří svislých teček a tím zvětšovat nebo zmenšovat jejich prostor. Jednotlivá okna lze také zcela sbalit pomocí ikon se šipkou doprava nebo doleva.
V následujícím
textu si postupně projdeme každou ze tří části hlavního okna JASP, tj. okno s
maticí dat, okno pro analýzu dat a okno pro zobrazování výsledků.
Prostředí
s maticí dat
Datová matice je strukturovaný formát pro organizaci a prezentaci dat, která je běžně používána ve statistikách, výzkumu, analýzách dat a výpočetní technice. Je to tabulka, kde jsou data uspořádána do řádků a sloupců.
Struktura datové matice
- Řádky: Každý řádek obvykle reprezentuje jeden záznam nebo pozorování. Například v tabulce obsahující údaje o studentech může každý řádek představovat jednoho studenta.
- Sloupce: Každý sloupec obsahuje určitý typ informace, který je shromažďován pro všechna pozorování. V případě dat o studentech mohou sloupce zahrnovat jméno, věk, známky, atd.
Představme si jednoduchou datovou matici, která obsahuje údaje o několika osobách:
Student | Věk | Počet bodů | Známka | Slovní hodnocení |
Anička | 9 | 22,5 | 1 | Výborně, vidím zlepšení v interpunkci, jen pozor na shodu podmětu s přísudkem. |
Petr | 10 | 23 | 1 | Skvělý pokrok, jen několik drobných chyb, pokračuj ve cvičení a zlepšíš se ještě více. |
Honza | 9 | 18 | 3 | Dobrá práce, většina slov je napsána správně, ale zaměř se na diakritiku. |
Jana | 9 | 20 | 2 | Chválím za snahu a pečlivost, ještě je třeba zapracovat na pravopisu některých slov. |
Pro různé statistické operace musíme být pozorní, s jakými proměnnými pracujeme, např. různé korelační koeficienty jsou vhodné pro různé proměnné, v zásadě rozdělujeme tři druhy proměnných:
- nominální proměnné jsou proměnné, u nichž nejsme schopni nijak odlišit jejich intenzitu, neexistuje více nebo méně. Typickou nominální proměnnou je pohlaví (přestože v datové matici přidělíme např. 1-muž a 2-žena neznamená to, že jedno pohlaví je lepší 😊) nebo například výsledek zápočtového testu P – prošel a N – neprošel. V naší datové matici se jedná o jména studentů.
- ordinální proměnné jsou proměnné, u nichž jsme schopni odlišit intenzitu, tzn. můžeme odlišit více nebo méně, ale máme pouze menší množství kategorií (typicky 5-10). Typickou ordinální proměnnou může být výše příjmu, která je rozdělena do několika kategorií (do 9 999; 10 000 – 14 999; 15 000 - 19 999; 20 000 – 29 999; 30 000 – 49 999; 50 000 – 99 999; 100 000 a více) nebo například známka , kterou obdržíte při zkoušce od A až po F.
- intervalové proměnné jsou proměnné, u nichž jsme velmi dobře schopni odlišit intenzitu, máme velké množství kategorií. Typickou intervalovou proměnnou může být výše příjmu, kterou respondent vypisuje číslem nebo počet bodů, které jste získali v testu.
Jako
příklad použijeme datový soubor z knihovny JASP s názvem Mental
ability. Otevřeme ho tak, že v hlavním menu (tři modré proužky) zvolíme
možnost Open – Data Library – 6. Factor – Mental ability.
Po načtení se
soubor dat zobrazí v okně jako matice dat. Datový soubor Mental
ability (Holzinger a Swineford, 1939) se skládá z výsledků testů mentálních
schopností žáků sedmých a osmých tříd ze dvou různých škol (Pasteurova a
Grant-Whiteova). V původním souboru dat jsou výsledky 26 testů. V literatuře se
však častěji používá menší podsoubor s 9 proměnnými (Joreskog, 1969).
Datový soubor Mental
ability má v záhlaví (tzv. header) 15 proměnných:
- id - Identifikátor
- sex - Pohlaví
- ageyr - Věk, roky
- agemo - Věk, měsíce
- school - Škola (Pasteur nebo Grant-White)
- grade - Třída
- x1 – Zrakové vnímání
- x2 – Kostky
- x3 – Vnímání prostoru
- x4 - Porozumění odstavcům
- x5 - Doplňování vět
- x6 - Význam slov
- x7 - Zrychlené sčítání
- x8 - Zrychlené počítání teček
- x9 - Zrychlené rozlišování rovných a
zakřivených velkých písmen
Tento ukázkový
soubor JASP demonstruje použití konfirmační faktorové analýzy (CFA). V našem
případě ho budeme používat pro jednoduchou úpravu dat a popisné statistiky.
Když budeme chtít
v JASP otevřít vlastní datovou matici vytvořenou v excelu je nutné,
aby první řádek obsahoval názvy proměnných. Při otevření souboru program
automaticky odhadne a přiřadí jednotlivé typy proměnných k našim
datům. Rozlišujeme tři typy proměnných: (1) nominální; (2) ordinální; (3)
intervalové (continuos) (viz vysvětlení v úvodu podkapitoly).
Pokud JASP
nesprávně označí typ proměnné, stačí kliknout na příslušnou ikonu
proměnné v názvu sloupce a změnit ji na správný formát.
Po kliknutí na
název proměnné (např. school) se vám otevře okno nad hlavní datovou
maticí, ve kterém můžete přejmenovat jednotlivé označení proměnných ve sloupci Label.
Většinou se to používá u nominálních/ordinálních proměnných, jinak to nemá
smysl. Sloupec Value udává hodnotu, kterou máte přiřazenou
k jednotlivým označením proměnné (Label). Zde by mohla být například i
uvedena hodnota 1 = vanilková zmrzlina, 2 = čokoládová zmrzlina, 3 = jahodová
zmrzlina.
V naší
současné matici jsou dvě školy – proměnná s názvem school. V sloupci Value
(hodnota) najdeme školu Grant-White a Pasteur. V sloupci Label
(označení) jsou k nim přislouchající názvy škol Grant-White a Pasteur.
V datové matici to někdy může být matoucí a lze to zpřehlednit přepsáním
označení (Label). Můžeme si zkusit přejmenovat tyto skupiny. První Grant-White můžeme
označit číslem 1 a druhou Pasteur číslem 2. Tyto přepsané popisky okamžitě
nahradí kódy v tabulkovém zobrazení. Pokud tento soubor uložíme jako soubor
.jasp, uloží se tyto kódy automaticky, stejně jako všechny analýzy a poznámky.
V tomto okně
můžeme také provádět jednoduchou filtraci dat odznačením fajfky
v sloupci Filter. Po zrušení fajfky Pasteur se data z této
skupiny nebudou započítávány v následujících analýzách. Složitější
filtrování dat lze provádět kliknutím na ikonu filtru v levém horním rohu datové
matice. Filtraci dat si podrobně vysvětlíme v kapitole Práce s daty
v JASP – Základní editace dat.
Pokud chceme upravit
data v tabulce, stačí dvakrát kliknout na buňku a data se otevřou v naší
původní tabulce, tj. v aplikaci Excel. Po úpravě dat a uložení původní tabulky
se JASP automaticky aktualizuje tak, aby odrážel provedené změny, za
předpokladu, že jsme nezměnili název souboru. Více v kapitole Základní
editace dat.
Prostředí pro
analýzu dat
Analýza dat je proces zkoumání, transformace, čištění a statistického zpracování dat s cílem získat užitečné informace, podporovat rozhodovací procesy a ověřovat hypotézy. Tento proces zahrnuje několik kroků a metod, které mohou být různé v závislosti na konkrétní oblasti aplikace a typu analyzovaných dat.
Význam analýzy dat
- Podpora rozhodování: Pomáhá činit informovaná rozhodnutí na základě důkazů (evidence based approach).
- Identifikace trendů: Umožňuje sledování a předvídání trendů a vzorců, které mohou být klíčové pro strategické plánování.
- Zlepšení procesů: Pomáhá optimalizovat a zlepšovat různé procesy tím, že identifikuje neefektivní oblasti a navrhuje způsoby jejich vylepšení.
- Výzkum a inovace: Umožňuje objevování nových poznatků a inovací v různých oblastech, včetně pedagogiky (educational science).
Analýza dat je tedy klíčový nástroj v dnešním datově řízeném světě, který umožňuje efektivní využití informací pro dosažení lepších výsledků a rozhodnutí.
Základní možnosti
práce s daty jsou přístupné na hlavním panelu analýz. Jedná se o
nejčastěji užívané statistické analýzy v sociálních vědách.
V současné době
JASP nabízí následující frekvenční (parametrické a neparametrické standardní
statistické testy) a alternativní Bayesovské testy:
Popisné statistiky
- Popisná
statistika (Descriptive stats)
|
Regresní analýza
- Korelace (Correlation)
- Lineární regrese (Linear r.)
- Logistická regrese (Logistic r.)
|
T-tests (srovnání dvou skupin)
- Nezávislý t-test (Indipendent)
- Párový t-test (Paired)
- Jednovýběrový t-test (One sample)
|
Frekvenční analýza
- Bionomiální test (Binomial t.)
- Multionomiální test (Multinomial t.)
- Kontingenční tabulky (Contingency
tables)
- Log-lineární regrese (Log-linear r.)
|
ANOVA (srovnání více skupin)
- Nezávislá
měření (Independent)
- Opakovaná
měření (Repeated measures)
- ANCOVA
- MANOVA
|
Faktorová analýza
- Analýza hlavních komponent (PCA)
- Explorační faktorová analýza (EFA)
- Konfirmační
faktorová analýza (CFA)
|
Mixed Models
- Linear Mixed Models
- Generalised linear mixed models
|
|
Kliknutím na
ikonu velkého modrého plus v pravém horním
řádku nabídky získáme přístup k pokročilým volitelným modulům. Po jejich
zaškrtnutí budou přidány na hlavní panel analýz.
Zkusíme si to prakticky
na příkladu popisných statistik. V levém horním rohu klikneme na
ikonku
Descriptives. V levém okně se nám zobrazí možnosti práce s daty
a v pravém okně se budou interaktivně objevovat výsledky.
V okně analýz můžeme jednotlivé analýzy přejmenovat pomocí černé ikony pera nebo odstranit pomocí červeného křížku. Zelená ikona + vytvoří kopii vybrané analýzy. Modrá informační ikona poskytuje podrobné informace o každém z použitých statistických postupů a obsahuje možnost vyhledávání. Ikonka s bílým R v modrém kroužku vytváří syntaxi pro software R.
Uspořádání analýz lze změnit jednoduchým chycením a přetažením na požadované místo. Můžeme si zkusit přejmenovat název analýzy „Descriptive statistics“ na „Popisné statistiky“. Zkusíme si vytvořit kopii souboru a tu následně smazat.
Prostředí pro
zobrazení výsledků
Po kliknutí na ikonu male černé šípky
směřující dolů vedle nadpisu analýzy se zobrazí řada možností, včetně:
- Upravit název (Edit title)
- Kopírovat (Copy)
- Exportovat výsledky (Export results)
- Přidat poznámky (Add note)
- Odstranit vše (Remove all)
- Obnovit vše (Refresh all)
- Ukázat syntaxi pro program R (Show R syntax
Možnost přidat poznámky (Add note)
umožňuje snadné přidání poznámek k výstupu výsledků a jejich následný export do
formátu HTML nebo PDF, a to příkazem Soubor > Exportovat výsledky. Lze zde
změnit písmo textu, velikost, barvy atd.
Poznámky jsou skvělou příležitostí
k zapsání interpretace výsledků. Když si
soubor znovu otevřeme budeme tak mít přehled, co, jak a proč jsme analyzovali a
co jsme z výsledků odvodili. Můžeme si zde psát i myšlenky, na další
postup, postřehy pro diskuzi v závěrečné práci atp. Navíc, kdokoliv další,
komu pošleme soubor, (např. vedoucí závěrečné práce) bude mít představu, jak rozumíme
výsledkům.
Velikost všech tabulek a grafů můžeme
změnit pomocí klávesových zkratek ctrl+ (zvětšit) ctrl- (zmenšit)
ctrl= (zpět na výchozí velikost). Velikost grafů lze měnit také
přetažením pravého dolního rohu grafu. Jak již bylo zmíněno, všechny tabulky a
obrázky jsou zobrazovány ve výchozím formátu APA normy a lze je jednoduše
zkopírovat do libovolného jiného dokumentu například do Wordu.