E0410 Fundamentals of Statistics for Scientific Data Using R

Přírodovědecká fakulta
jaro 2025
Rozsah
0/2/0. 2 kr. (plus ukončení). Ukončení: z.
Vyučováno kontaktně
Vyučující
Mgr. et Mgr. Jiří Kalina, Ph.D. (cvičící)
Daria Sapunova (cvičící)
Garance
Mgr. et Mgr. Jiří Kalina, Ph.D.
RECETOX – Přírodovědecká fakulta
Kontaktní osoba: Mgr. et Mgr. Jiří Kalina, Ph.D.
Dodavatelské pracoviště: RECETOX – Přírodovědecká fakulta
Předpoklady
Basic math (high-school level). No need of statistical knowledge.
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
předmět má 8 mateřských oborů, zobrazit
Cíle předmětu
The aim of the course is to provide students with the essentials of common scientific statistical background and fundamental R programming skills.
Výstupy z učení
After completing the course, students will be able to use R for solving common scientific data analytical tasks (designing data collection, data handling, elementary statistical tests and graphs, linear modeling) and further develop using tools provided in the course.
Osnova
  • 1. Course description (content, assesment etc.). Basic statistical definitions, descriptive statistics. Practical in R, familiarization with RStudio, uploading data, basic calculations. 2. Descriptive statistics. Outliers, missing values. Practical in R. 3. Visualization - common graphs,aesthetics. Practical in R. 4. Data cleaning, Tidyverse package in R. Practical in R. Inspection and visualization of a dataset, results communication. 5. Hypothesis testing, p-values, distributions, data normality testing, data transformation. Practical in R. 6. Parametric and non-parametric statistics, parametric tests (t-test, ANOVA). Practical in R performing the tests, interpretation of the results. 7.Non-parametric tests (Kruskal-Wallis, Mann-Whitney). Practical in R performing the tests, interpretation of the results. 8. Pearson and Spearman correlation. Practical in R. 9. Linear regression (OLS). Practical in R. 10. Linear regression (OLS). Assumptions, model evaluation. Practical in R. 11. Multiple regression. Variables selection for a model, preparation of the model – good practice steps. Practical in R.
Literatura
    doporučená literatura
  • WICKHAM, Hadley, Mine ÇETINKAYA-RUNDEL a Garrett GROLEMUND. R for data science : import, tidy, transform, visualize, and model data. 2nd edition. Tokyo: O'Reilly, 2023, xxiii, 548. ISBN 9781492097402. info
  • TORGO, Luís. Data mining with R : learning with case studies. Second edition. Boca Raton: CRC Press/Taylor & Francis Group, 2017, xix, 405. ISBN 9781482234893. info
  • BRUCE, Peter C. a Andrew BRUCE. Practical statistics for data scientists : 50 essential concepts. First edition. Beijing: O'Reilly, 2017, xvi, 298. ISBN 9781491952962. info
  • FIELD, Andy P. An adventure in statistics : the reality enigma. Illustrated by James Iles. First published. Los Angeles: Sage, 2016, xvi, 746. ISBN 9781446210451. info
  • FIELD, Andy P., Jeremy MILES a Zoë FIELD. Discovering statistics using R. First published. Los Angeles: Sage, 2012, xxxiv, 957. ISBN 9781446200452. info
Výukové metody
Each lesson is divided into a theoretical part with a following practical part.
Metody hodnocení
Final at the end of the course - working on a dataset provided by a student or the teacher. The results should be presented as a pdf file consisting of a small introduction regarding the topic, statistical method description, data visualization and interpretation of the results.
Vyučovací jazyk
Angličtina
Navazující předměty
Informace učitele
Practical lessons are held in R statistical environment (freely available).
Další komentáře
Předmět je dovoleno ukončit i mimo zkouškové období.
Předmět je vyučován každoročně.
Výuka probíhá každý týden.
Poznámka k četnosti výuky: možno i blokově.
Předmět je zařazen také v obdobích jaro 2024.
  • Statistika zápisu (nejnovější)
  • Permalink: https://is.muni.cz/predmet/sci/jaro2025/E0410