Bi1121 Analýza dat v R pro experimentální a molekulární biology

Přírodovědecká fakulta
jaro 2023
Rozsah
2/0/0. 2 kr. (plus 1 za k). Ukončení: k.
Vyučující
Mgr. Petra Ovesná, Ph.D. (přednášející)
Mgr. Kristína Gömöryová, Ph.D. (přednášející)
Mgr. Petr Tauš, Ph.D. (přednášející)
Mgr. Radek Fedr (přednášející)
Garance
prof. Mgr. Vítězslav Bryja, Ph.D.
Ústav experimentální biologie – Biologická sekce – Přírodovědecká fakulta
Kontaktní osoba: prof. Mgr. Vítězslav Bryja, Ph.D.
Dodavatelské pracoviště: Ústav experimentální biologie – Biologická sekce – Přírodovědecká fakulta
Rozvrh
Pá 8:00–9:50 B09/316
Předpoklady
Predmet nemá žádné prerekvizity. Nutný je současný zápis předmětu Bi1121c (cvičení k přednášce).
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Předmět si smí zapsat nejvýše 24 stud.
Momentální stav registrace a zápisu: zapsáno: 8/24, pouze zareg.: 0/24, pouze zareg. s předností (mateřské obory): 0/24
Jiné omezení: Na předmět se vztahuje povinnost registrace; bez registrace může být znemožněn zápis předmětu!
Mateřské obory/plány
Cíle předmětu
Cílem předmětu je naučit studenty (i) základy programování v jazyce R, (ii) základné manipulace s datami, jejich vizualizace a reportování, (iii) základy správného experimentálního designu, (iv) úvod do vyhodnocování dat z omics technologií (např. hmotnostní spektrometrie, scRNA-seq), flow cytometrie a analýzy obrazu, (v) základy reprodukovatelnosti ve výzkumu.
Výstupy z učení
Na konci kurzu budou studenti schopní samostatně navrhovat biologické experimenty z omics metod, vyhodnotit je a vytvářet reprodukovatelné reporty s využitím jazyka R.
Osnova
  • 1. Úvod - instalace R, prostředí Rstudio, základní pravidla psaní syntaxu (baseR) 2. Práce s daty - načtení dat, datové typy, transformace dat, základní sumarizace dat 3. Statistické metody - principy statistického uvažování, intervaly spolehlivosti, typy základních statistických testů, úvod do analýzy přežití 4. Experimentální design, power analýza 5. Grafika v R (base R, ggplot2, interaktivní vizualizace), typy grafů v molekulární biologii 6. Umělá inteligence a strojové učení - redukce dimenzí, klastrování, neuronové sítě 7. Flow cytometrie - FCS datová struktura, automatický gating, grafické výstupy 8. Analýza proteomických dat - úvod do hmotnostní spektrometrie, typy dat generovaných MS a způsoby jejich zpracování, navazující biologická analýza hitů (gene ontologies, interakční sítě, apod.) 9. Analýza scRNA-seq dat - úvod do scRNA-seq, kontrola kvality dat a jejich zpracování, klastrování a vizualizace 10. Analýza scRNA-seq dat - automatická anotace klastrů pomocí strojového učení, modelování vývojových trajektorií, integrace dat 11. Základy zpracování obrazů nejen z mikroskopu - bodové transformace, prahování, animace 12. Reprodukovatelnost - Git, GitHub, R Markdown, WorkflowR
Literatura
    doporučená literatura
  • Modern Statistics for Modern Biology - https://www.huber.embl.de/msmb/
  • WICKHAM, Hadley a Garrett GROLEMUND. R for data science : import, tidy, transform, visualize, and model data. First edition. Sebastopol, CA: O'Reilly, 2016, xxv, 492. ISBN 9781491910399. info
  • WILKE, C. Fundamentals of data visualization : a primer on making informative and compelling figures. Beijing: O'Reilly, 2019, xvi, 370. ISBN 9781492031086. info
  • Orchestrating Single-Cell Analysis with Bioconductor - http://bioconductor.org/books/release/OSCA/
Výukové metody
Kurz je vyučován v češtině, každý týden. Kurz nemá prerekvizity, ale studenti mají povinnost zapsat si současně Bi1121c (navazující cvičení k Bi1121).
Metody hodnocení
Ukončení kolokviem: na konci semestru dostanou studenti k dispozici datasety z probíraných oblastí (proteomika, scRNA-seq, flow cytometrie), z nichž si jeden vyberou. Tento dataset následně samostatně zanalyzují a připraví repdodukovatelný RMarkdown dokument popisující analýzu dat a jejich biologické zhodnocení.
Navazující předměty
Další komentáře
Předmět je vyučován každoročně.
Nachází se v prerekvizitách jiných předmětů
Předmět je zařazen také v obdobích jaro 2022, jaro 2024, jaro 2025.