Bi8190 Manipulace a vizualizace dat v R

Přírodovědecká fakulta
podzim 2024
Rozsah
0/2/0. 2 kr. (příf plus uk plus > 4). Ukončení: k.
Vyučováno kontaktně
Vyučující
Mgr. Irena Axmanová, Ph.D. (cvičící)
Mgr. Bc. Klára Klinkovská (cvičící)
Garance
Mgr. Irena Axmanová, Ph.D.
Ústav botaniky a zoologie – Biologická sekce – Přírodovědecká fakulta
Kontaktní osoba: Mgr. Irena Axmanová, Ph.D.
Dodavatelské pracoviště: Ústav botaniky a zoologie – Biologická sekce – Přírodovědecká fakulta
Předpoklady
Bi7560 Úvod do R ||SOUHLAS
Předpokladem pro bezproblémový průchod kurzem je základní znalost práce v R, ideálně absolvování Úvodu do R Bi7560 Úvod do R před tímto kurzem.
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
Cíle předmětu
V průběhu kurzu představíme pokročilé metody manipulace a vizualizace dat v programu R, zejména s využitím knihoven z kolekce tidyverse (tidyr, dplyr, tibble, purr, stringr, ggplot2, readr). Cílem předmětu je naučit studenty rutinní manipulaci s daty, tak aby si je uměli importovat, upravit, filtrovat, připojit nové informace z externích dat, vytvořit nové proměnné (např. na základě výpočtu), seskupit vzorky na základě nějaké charakteristiky/informace a pro tyto skupiny vypočítat další parametry. Dále se studenti naučí základní i pokročilé metody vizualizace dat pomocí ggplot2 a tvorbu základních map v R. Cílem předmětu je i osvojení přístupu open data science, kdy se naučí připravit skript tak, aby bylo možné ho na závěr publikovat na platformě GitHub.
Výstupy z učení
Po absolvování předmětu bude student schopen:
- samostatně sestrojit graf v grafice ggplot2,
- vybrat vhodný typ grafu,
- používat fasetování,
- prokládat daty modely,
- upravovat škálování estetických atributů grafu,
- upravit graf do finální, publikovatelné podoby.
Osnova
  • 1 Úvod
  • R jako programovací jazyk
  • Tidyverse package, %>%, |>
  • projekty v RStudiu, cheatsheets, keyboard shortcuts
  • zásady tidy skriptu (úprava, nadpisy, záložky, poznámky)
  • zdroje informací a kde hledat pomoc
  • import pomocí readr, readxl, na co si dávat pozor (encoding)
  • struktura dat (names, table, glimpse)
  • tidy data (zásady, příprava, kontrola), přejmenování proměnných (rename)
  • 2 Základní manipulace s daty
  • základní manipulace s daty (select, filter, mutate, arrange, slice)
  • export dat (write_csv)
Literatura
  • http://www.cookbook-r.com/Graphs/
  • MURRELL, Paul. R graphics. Boca Raton: Chapman & Hall/CRC, 2006, xix, 301. ISBN 158488486X. info
  • https://www.stat.auckland.ac.nz/~paul/RGraphics/rgraphics.html
Výukové metody
Výuka bude probíhat v počítačové učebně přímo u zapnutého počítače. Pracovat budeme v prostředí programu R s pomocí RStudia. Na začátku každé hodiny bude prezentována nová metoda, kterou si studenti následně sami vyzkouší a procvičí na svých počítačích. Aktivní účast na přednáškách není povinná, nicméně je silně doporučená.
Metody hodnocení
Zatím plánuji zachovat ukončení v modelu, který zavedl David Zelený, tj.:
(1) budou zadány 3 domácí úkoly, z nichž alespoň 2 budou vyžadovány,
(2) studenti na závěrečné dvouhodině odprezentují vizuální zpracování vlastních dat.
Vyhrazuji si však právo na zápočtovou úlohu, pokud by zapojení studentů v hodině nesplnilo má očekávání.
Navazující předměty
Informace učitele
http://vitsyrovatka.info/doku.php?id=visbiodat:cs:start
Přednáška s cvičením bude probíhat každý týden.
Pro práci doporučuji nosit si vlastní notebook s přístupem na internet. Práce na stolních počítačích je někdy obzvláště pomalá.

Další komentáře
Předmět je vyučován každoročně.
Výuka probíhá každý týden.
Předmět je zařazen také v obdobích jaro 2008 - akreditace, jaro 2007, jaro 2008, jaro 2010, jaro 2012, jaro 2012 - akreditace, jaro 2014, podzim 2016, podzim 2018.
  • Statistika zápisu (nejnovější)
  • Permalink: https://is.muni.cz/predmet/sci/podzim2024/Bi8190