PřF:Bi1121 Analýza dat v R pro EMB - Informace o předmětu
Bi1121 Analýza dat v R pro experimentální a molekulární biology
Přírodovědecká fakultajaro 2024
- Rozsah
- 2/0/0. 2 kr. (plus 1 za k). Ukončení: k.
- Vyučující
- Mgr. Petra Ovesná, Ph.D. (přednášející)
Mgr. Kristína Gömöryová, Ph.D. (přednášející)
Mgr. Radek Fedr (přednášející)
Mgr. Antónia Mikulová (přednášející) - Garance
- prof. Mgr. Vítězslav Bryja, Ph.D.
Ústav experimentální biologie – Biologická sekce – Přírodovědecká fakulta
Kontaktní osoba: prof. Mgr. Vítězslav Bryja, Ph.D.
Dodavatelské pracoviště: Ústav experimentální biologie – Biologická sekce – Přírodovědecká fakulta - Rozvrh
- Po 19. 2. až Ne 26. 5. Pá 8:00–9:50 B09/316
- Předpoklady
- Předmět nemá žádné prerekvizity. Nutný je současný zápis předmětu Bi1121c (cvičení k přednášce).
- Omezení zápisu do předmětu
- Předmět je nabízen i studentům mimo mateřské obory.
Předmět si smí zapsat nejvýše 24 stud.
Momentální stav registrace a zápisu: zapsáno: 16/24, pouze zareg.: 0/24, pouze zareg. s předností (mateřské obory): 0/24
Jiné omezení: Na předmět se vztahuje povinnost registrace; bez registrace může být znemožněn zápis předmětu! - Mateřské obory/plány
- Buněčná biologie (program PřF, N-CELLBI)
- Fyziologie (program PřF, N-EBZ)
- Imunologie (program PřF, N-EBZ)
- Virologie (program PřF, N-VIR)
- Vývojová biologie (program PřF, N-EBZ)
- Cíle předmětu
- Cílem předmětu je naučit studenty (i) základy programování v jazyce R, (ii) základní manipulaci s daty, jejich vizualizaci, statistické hodnocení a reportování, (iii) základy správného experimentálního designu a reprodukovatelnosti ve výzkumu, (iv) úvod do vyhodnocování dat z omics technologií (např. hmotnostní spektrometrie, scRNA-seq), flow cytometrie a analýzy obrazu.
- Výstupy z učení
- Na konci kurzu budou studenti schopni samostatně navrhovat biologické experimenty z omics metod, vyhodnotit je a vytvářet reprodukovatelné reporty s využitím jazyka R.
- Osnova
- 1. Úvod - instalace R, prostředí Rstudio, základní pravidla psaní syntaxu (baseR) 2. Práce s daty - načtení dat, datové typy, transformace dat, základní sumarizace dat, balík dplyr 3. Grafika v R (base R, ggplot2, interaktivní vizualizace), typy grafů v molekulární biologii 4. Statistické metody - principy statistického uvažování, intervaly spolehlivosti, typy základních statistických testů a modelů 5. Experimentální design, power analýza 6. Reprodukovatelnost - Git, GitHub, R Markdown, WorkflowR 7. Základy zpracování obrazů nejen z mikroskopu - bodové transformace, prahování, animace 8. Umělá inteligence a strojové učení - redukce dimenzí, klastrování, neuronové sítě 9. Flow cytometrie - FCS datová struktura, automatický gating, grafické výstupy 10. Analýza proteomických dat - úvod do hmotnostní spektrometrie, typy dat generovaných MS a způsoby jejich zpracování, navazující biologická analýza hitů (gene ontologies, interakční sítě, apod.) 11. Analýza scRNA-seq dat - úvod do scRNA-seq, kontrola kvality dat a jejich zpracování, klastrování a vizualizace 12. Analýza scRNA-seq dat - automatická anotace klastrů pomocí strojového učení, modelování vývojových trajektorií, integrace dat
- Literatura
- doporučená literatura
- Modern Statistics for Modern Biology - https://www.huber.embl.de/msmb/
- WICKHAM, Hadley a Garrett GROLEMUND. R for data science : import, tidy, transform, visualize, and model data. First edition. Sebastopol, CA: O'Reilly, 2016, xxv, 492. ISBN 9781491910399. info
- WILKE, C. Fundamentals of data visualization : a primer on making informative and compelling figures. Beijing: O'Reilly, 2019, xvi, 370. ISBN 9781492031086. info
- Orchestrating Single-Cell Analysis with Bioconductor - http://bioconductor.org/books/release/OSCA/
- Výukové metody
- Kurz je vyučován v češtině, každý týden přednáška odborníka z dané oblasti. Kurz nemá prerekvizity, ale studenti mají povinnost zapsat si současně Bi1121c (navazující cvičení k Bi1121). Výhodou je alespoň základní znalost programování, jinak kurz vyžaduje samostatnou práci doma.
- Metody hodnocení
- Ukončení kolokviem: v průběhu semestru dostanou studenti k dispozici datasety z probíraných oblastí (proteomika, scRNA-seq, flow cytometrie), z nichž si jeden vyberou. Tento dataset následně samostatně zanalyzují a připraví repdodukovatelný RMarkdown dokument popisující analýzu dat a jejich biologické zhodnocení.
- Navazující předměty
- Další komentáře
- Studijní materiály
Předmět je vyučován každoročně. - Nachází se v prerekvizitách jiných předmětů
- Statistika zápisu (jaro 2024, nejnovější)
- Permalink: https://is.muni.cz/predmet/sci/jaro2024/Bi1121