Bi1121 Analýza dat v R pro experimentální a molekulární biology

Přírodovědecká fakulta
jaro 2024
Rozsah
2/0/0. 2 kr. (plus 1 za k). Ukončení: k.
Vyučující
Mgr. Petra Ovesná, Ph.D. (přednášející)
Mgr. Kristína Gömöryová, Ph.D. (přednášející)
Mgr. Radek Fedr (přednášející)
Mgr. Antónia Mikulová (přednášející)
Garance
prof. Mgr. Vítězslav Bryja, Ph.D.
Ústav experimentální biologie – Biologická sekce – Přírodovědecká fakulta
Kontaktní osoba: prof. Mgr. Vítězslav Bryja, Ph.D.
Dodavatelské pracoviště: Ústav experimentální biologie – Biologická sekce – Přírodovědecká fakulta
Rozvrh
Po 19. 2. až Ne 26. 5. Pá 8:00–9:50 B09/316
Předpoklady
Předmět nemá žádné prerekvizity. Nutný je současný zápis předmětu Bi1121c (cvičení k přednášce).
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Předmět si smí zapsat nejvýše 24 stud.
Momentální stav registrace a zápisu: zapsáno: 16/24, pouze zareg.: 0/24, pouze zareg. s předností (mateřské obory): 0/24
Jiné omezení: Na předmět se vztahuje povinnost registrace; bez registrace může být znemožněn zápis předmětu!
Mateřské obory/plány
Cíle předmětu
Cílem předmětu je naučit studenty (i) základy programování v jazyce R, (ii) základní manipulaci s daty, jejich vizualizaci, statistické hodnocení a reportování, (iii) základy správného experimentálního designu a reprodukovatelnosti ve výzkumu, (iv) úvod do vyhodnocování dat z omics technologií (např. hmotnostní spektrometrie, scRNA-seq), flow cytometrie a analýzy obrazu.
Výstupy z učení
Na konci kurzu budou studenti schopni samostatně navrhovat biologické experimenty z omics metod, vyhodnotit je a vytvářet reprodukovatelné reporty s využitím jazyka R.
Osnova
  • 1. Úvod - instalace R, prostředí Rstudio, základní pravidla psaní syntaxu (baseR) 2. Práce s daty - načtení dat, datové typy, transformace dat, základní sumarizace dat, balík dplyr 3. Grafika v R (base R, ggplot2, interaktivní vizualizace), typy grafů v molekulární biologii 4. Statistické metody - principy statistického uvažování, intervaly spolehlivosti, typy základních statistických testů a modelů 5. Experimentální design, power analýza 6. Reprodukovatelnost - Git, GitHub, R Markdown, WorkflowR 7. Základy zpracování obrazů nejen z mikroskopu - bodové transformace, prahování, animace 8. Umělá inteligence a strojové učení - redukce dimenzí, klastrování, neuronové sítě 9. Flow cytometrie - FCS datová struktura, automatický gating, grafické výstupy 10. Analýza proteomických dat - úvod do hmotnostní spektrometrie, typy dat generovaných MS a způsoby jejich zpracování, navazující biologická analýza hitů (gene ontologies, interakční sítě, apod.) 11. Analýza scRNA-seq dat - úvod do scRNA-seq, kontrola kvality dat a jejich zpracování, klastrování a vizualizace 12. Analýza scRNA-seq dat - automatická anotace klastrů pomocí strojového učení, modelování vývojových trajektorií, integrace dat
Literatura
    doporučená literatura
  • Modern Statistics for Modern Biology - https://www.huber.embl.de/msmb/
  • WICKHAM, Hadley a Garrett GROLEMUND. R for data science : import, tidy, transform, visualize, and model data. First edition. Sebastopol, CA: O'Reilly, 2016, xxv, 492. ISBN 9781491910399. info
  • WILKE, C. Fundamentals of data visualization : a primer on making informative and compelling figures. Beijing: O'Reilly, 2019, xvi, 370. ISBN 9781492031086. info
  • Orchestrating Single-Cell Analysis with Bioconductor - http://bioconductor.org/books/release/OSCA/
Výukové metody
Kurz je vyučován v češtině, každý týden přednáška odborníka z dané oblasti. Kurz nemá prerekvizity, ale studenti mají povinnost zapsat si současně Bi1121c (navazující cvičení k Bi1121). Výhodou je alespoň základní znalost programování, jinak kurz vyžaduje samostatnou práci doma.
Metody hodnocení
Ukončení kolokviem: v průběhu semestru dostanou studenti k dispozici datasety z probíraných oblastí (proteomika, scRNA-seq, flow cytometrie), z nichž si jeden vyberou. Tento dataset následně samostatně zanalyzují a připraví repdodukovatelný RMarkdown dokument popisující analýzu dat a jejich biologické zhodnocení.
Navazující předměty
Další komentáře
Studijní materiály
Předmět je vyučován každoročně.
Nachází se v prerekvizitách jiných předmětů
Předmět je zařazen také v obdobích jaro 2022, jaro 2023, jaro 2025.