R101: Praktický úvod pro používání statistického programu R
Týden 3. Transformace dat.
Filtrování (výběr případů/pozorování), řazení, výběr
proměnných, tvorba nových proměnných, sumarizace, převod mezi long a wide
formátem. Použití balíčků dplyr a tidyr.
Příprava
- Nainstalujte si balíček nycflights13.
- Stáhněte si skript a dataset rses_data.sav (ten je pak nutné umístit do podsložky "data" v rámci RProjektu).
- Připojte se v úterý v 18:00 na zoom: https://cesnet.zoom.us/j/94068720787?pwd=eHFBc3Awa2JqZ05wSnF3S2ZmZS91dz09
Literatura
Základní:
- Grolemund, G., & Wickham, H. (2017). R for Data
Science. O'Reilly Media. Data Transformation.
https://r4ds.had.co.nz/transform.html - Data transformation with dplyr cheatsheet.
https://github.com/rstudio/cheatsheets/raw/master/data-transformation.pdf
Rozšiřující
- Grolemund, G., & Wickham, H. (2017). R for Data Science. O'Reilly Media. Tidy Data. https://r4ds.had.co.nz/tidy-data.html
- dplyr reference manual: https://dplyr.tidyverse.org/reference/
Cvičení
Základní (povinné)
- Data Manipulation with dplyr. https://learn.datacamp.com/courses/data-manipulation-with-dplyr
Rozšiřující (nepovinné)
- Joining data with dplyr. https://learn.datacamp.com/courses/joining-data-with-dplyr