PřF:Bi8190 Vizualizace dat v R - Informace o předmětu
Bi8190 Manipulace a vizualizace dat v R
Přírodovědecká fakultapodzim 2024
- Rozsah
- 0/2/0. 2 kr. (příf plus uk plus > 4). Ukončení: k.
Vyučováno kontaktně - Vyučující
- Mgr. Irena Axmanová, Ph.D. (cvičící)
Mgr. Bc. Klára Klinkovská (cvičící) - Garance
- Mgr. Irena Axmanová, Ph.D.
Ústav botaniky a zoologie – Biologická sekce – Přírodovědecká fakulta
Kontaktní osoba: Mgr. Irena Axmanová, Ph.D.
Dodavatelské pracoviště: Ústav botaniky a zoologie – Biologická sekce – Přírodovědecká fakulta - Předpoklady
- Bi7560 Úvod do R ||SOUHLAS
Předpokladem pro bezproblémový průchod kurzem je základní znalost práce v R, ideálně absolvování Úvodu do R Bi7560 Úvod do R před tímto kurzem. - Omezení zápisu do předmětu
- Předmět je nabízen i studentům mimo mateřské obory.
- Mateřské obory/plány
- předmět má 7 mateřských oborů, zobrazit
- Cíle předmětu
- V průběhu kurzu představíme pokročilé metody manipulace a vizualizace dat v programu R, zejména s využitím knihoven z kolekce tidyverse (tidyr, dplyr, tibble, purr, stringr, ggplot2, readr). Cílem předmětu je naučit studenty rutinní manipulaci s daty, tak aby si je uměli importovat, upravit, filtrovat, připojit nové informace z externích dat, vytvořit nové proměnné (např. na základě výpočtu), seskupit vzorky na základě nějaké charakteristiky/informace a pro tyto skupiny vypočítat další parametry. Dále se studenti naučí základní i pokročilé metody vizualizace dat pomocí ggplot2 a tvorbu základních map v R. Cílem předmětu je i osvojení přístupu open data science, kdy se naučí připravit skript tak, aby bylo možné ho na závěr publikovat na platformě GitHub.
- Výstupy z učení
- Po absolvování předmětu bude student schopen:
- samostatně sestrojit graf v grafice ggplot2,
- vybrat vhodný typ grafu,
- používat fasetování,
- prokládat daty modely,
- upravovat škálování estetických atributů grafu,
- upravit graf do finální, publikovatelné podoby. - Osnova
- 1 Úvod
- R jako programovací jazyk
- Tidyverse package, %>%, |>
- projekty v RStudiu, cheatsheets, keyboard shortcuts
- zásady tidy skriptu (úprava, nadpisy, záložky, poznámky)
- zdroje informací a kde hledat pomoc
- import pomocí readr, readxl, na co si dávat pozor (encoding)
- struktura dat (names, table, glimpse)
- tidy data (zásady, příprava, kontrola), přejmenování proměnných (rename) 2 Základní manipulace s daty
- základní manipulace s daty (select, filter, mutate, arrange, slice)
- export dat (write_csv)
- Literatura
- http://www.cookbook-r.com/Graphs/
- MURRELL, Paul. R graphics. Boca Raton: Chapman & Hall/CRC, 2006, xix, 301. ISBN 158488486X. info
- https://www.stat.auckland.ac.nz/~paul/RGraphics/rgraphics.html
- Výukové metody
- Výuka bude probíhat v počítačové učebně přímo u zapnutého počítače. Pracovat budeme v prostředí programu R s pomocí RStudia. Na začátku každé hodiny bude prezentována nová metoda, kterou si studenti následně sami vyzkouší a procvičí na svých počítačích. Aktivní účast na přednáškách není povinná, nicméně je silně doporučená.
- Metody hodnocení
- Zatím plánuji zachovat ukončení v modelu, který zavedl David Zelený, tj.:
(1) budou zadány 3 domácí úkoly, z nichž alespoň 2 budou vyžadovány,
(2) studenti na závěrečné dvouhodině odprezentují vizuální zpracování vlastních dat.
Vyhrazuji si však právo na zápočtovou úlohu, pokud by zapojení studentů v hodině nesplnilo má očekávání. - Navazující předměty
- Informace učitele
- http://vitsyrovatka.info/doku.php?id=visbiodat:cs:start
Přednáška s cvičením bude probíhat každý týden.
Pro práci doporučuji nosit si vlastní notebook s přístupem na internet. Práce na stolních počítačích je někdy obzvláště pomalá. - Další komentáře
- Předmět je vyučován každoročně.
Výuka probíhá každý týden.
- Statistika zápisu (nejnovější)
- Permalink: https://is.muni.cz/predmet/sci/podzim2024/Bi8190