E7528 Analýza genomických a proteomických dat

Přírodovědecká fakulta
jaro 2025
Rozsah
2/1/0. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: k, z.
Vyučováno kontaktně
Vyučující
Mgr. Eva Budinská, Ph.D. (přednášející)
Mgr. Barbora Zwinsová (pomocník)
Garance
Mgr. Eva Budinská, Ph.D.
RECETOX – Přírodovědecká fakulta
Kontaktní osoba: Mgr. Eva Budinská, Ph.D.
Dodavatelské pracoviště: RECETOX – Přírodovědecká fakulta
Předpoklady
( Bi5040 Biostatistika - základní kurz || Bi5045 Biostatistika pro mat. biol. || Bi5046 Biostatistika pro mat. biol. || E5046 Biostatistika pro mat. biol. ) && E8600 Vícerozměrné metody && E7527 Analýza dat v R && Bi4010 Základy molekulární biologie && E0034 Analýza a klasif dat
Bi5040 Biostatistika – základní kurz, nebo Bi5045 Biostatistika pro matematickou biologii Nutným předpokladem je dobrá znalost základní metodologie biostatistiky a základů molekulární biologie a genetiky . Doporučeno je absolvování předmětu Bi7527 Analýza dat v R, Bi8600 Vícerozměrné statistické metody, Bi4010 Základy molekulární biologie, Bi3060 Obecná genetika a B7250 Genetika člověka
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Předmět si smí zapsat nejvýše 30 stud.
Momentální stav registrace a zápisu: zapsáno: 0/30, pouze zareg.: 5/30, pouze zareg. s předností (mateřské obory): 5/30
Jiné omezení: Doporučení absolvovat Bi8600, Bi4010, Bi3060
Mateřské obory/plány
Cíle předmětu
Cílem kurzu je naučit studenty analyzovat data z mikročipových experimentů a dat proteinové hmotnostní spektrometrie a to od úpravu a normalizace základních dat až po biologickou interpretaci výsledků, za použití pokročilých statistických metod.
Výstupy z učení
Student po absolvování kurzu:;
Zná otázky, na které lze odpovědět studiem genomických a proteomických dat.;
Zná vybrané technologie, které jsou zdroji vysokohustotních genomických a proteomických dat (typy DNA mikročipů, arrayCGH, hmotnostní spektrometrie);
Zná typy dat produkovaných genomickými a proteomickými technologiemi a jejich problémy z pohledu analytika;
Umi vyjmenovat obecné základní kroky analýzy genomických a proteomických dat.;
Zná pro analýzu potřebné technické detaily technologie mikročipů a hmotnostní spektrometrie.;
Rozumí základním metodám kvantifikace měření těchto technologií a následným úpravám jejich hodnot při vytváření finálního datového souboru.;
Zná specifické, na technologii závislé zdroje nežádoucího technického šumu v datech.;
Pomocí grafických nástrojů a statistických metod dokáže identifikovat přítomnost a zdroj tohoto šumu v datech.;
Umí aplikovat statistické metody používané pro odstranění nežádoucího šumu.;
Dokáže provést transformaci zdrojových dat (normalizaci);
Standardizuje měření mezi jednotlivými datovými soubory.;
Vytvoří finální datový soubor pro další analýzy.;
Dokáže identifikovat a odstranit efekt dávky (batch effect) v datech.;
Popíše obecné principy analýzy genomických a proteomických dat.;
Na základě biologického zadání správně určí typ potřebné analýzy.;
Navrhne analytický postup pro příkladovou studii. ;
Na základě biologického zadání správně určí typ hypotézy a metody jejího testování.;
Rozumí specifickým metodám porovnávání hypotéz, jako je SAM a limma.;
Aplikuje testování hypotéz pro určení odlišně exprimovaných genů/proteinů.;
Zná statistické metody predikce tříd a umí je aplikovat na příkladová data.;
Zná metody dolování dat pro predikci tříd a umí je použít v genomických datech.;
Zná pozitiva a negativa metod pro predikci a umí se rozhodnout, kterou aplikovat.;
Aplikuje MAQC II standardy pro tvorbu klasifikátorů z microarray dat.;
Vybere a aplikuje vhodné vícerozměrné regresní metody pro propojení vztahu exprese genů/proteinů s dalšími (např. klinickými) faktory.;
Na genomických datech provede analýzu přežití pomocí Kaplan-Meierovych odhadů a Coxova modelu proporcionálních rizik.;
Zná princip a metody analýzy genových sad;
Zná princip a základní metody konstrukce genových sítí;
Aplikuje na modelovém příkladu nejběžnější metody analýzy genových sad a pathway analýzy.;
Vyhledá vysokohustotní genomické a proteomické data ve veřejných databázích.;
Použije Fisherovu Z-transformaci a další meta-analytické transformace.;
Aplikuje meta-analytické metody seřazení výsledků analýzy odlišné genové/proteinové exprese z více zdrojů.;
Pracuje v SW prostředí R a Bioconductor pro úpravy a analýzu genomických a proteomických dat.;
Aplikuje vybrané balíky R a Bioconductor a jejich funkce v úpravě a analýze dat.;
Osnova
  • 1.Současné výzvy a technologie genomiky a proteomiky;
  • 2.Princip a analýza obrazu DNA mikročipů;
  • 3.Úprava a normalizace dat cDNA mikročipů;
  • 4.Úprava a normalizace dat oligonukleotidových mikročipů;
  • 5.Úprava a normalizace dat dalších typů mikročipů (Epigenetické mikročipy, SNP mikročipy, Illumina BeadChip, ....);
  • 6.Získávání, úprava a normalizace dat proteinové hmotnostní spektrometrie;
  • 7.Základní principy analýzy genomických a proteomických dat ;
  • 8.Porovnávání tříd;
  • 9.Predikce tříd ;
  • 10.Objevování tříd ;
  • 11.Analýza přežití a další regrese;
  • 12.Analýza genových sad a genových sítí ;
  • 13.Meta-analýza;
Literatura
    doporučená literatura
  • Meta-analysis and combining information in genetics and genomics. Edited by Rudy Guerra - Darlene Renee Goldstein. Boca Raton: CRC Press, 2010, xxiii, 335. ISBN 9781584885221. info
  • GENTLEMAN, Robert. R programming for bioinformatics. Boca Raton: CRC Press, 2009, xii, 314. ISBN 9781420063677. info
  • Bioinformatics and computational biology solutions using R and bioconductor. Edited by Robert Gentleman. New York: Springer, 2005, xix, 473. ISBN 0387251464. info
  • Data analysis and visualization in genomics and proteomics. Edited by Francisco Azuaje - Joaquín Dopazo. Hoboken, NJ: John Wiley, 2005, xv, 267. ISBN 0470094397. info
  • DRĄGHICI, Sorin. Data analysis tools for DNA microaarays. Boca Raton: Chapman & Hall/CRC, 2003, 477 s. +. ISBN 1-58488-315-4. info
Výukové metody
Výuka bude probíhat formou přednášek s teoretickou přípravou a praktickými cvičeními v programu R a jeho nástavbě Bioconductor. V úvodu přednášky se vysvětlí koncepty a metody, a následně si studenti vyzkouší jejich aplikaci na reálných datech. Začátkem semestru si student vybere jeden projekt, který bude splňovat nároky (detaily v první přednášce), na kterém pak bude v průběhu semestru pracovat. Ve druhé půlce semestru pak budou studenti své průběžné výsledky prezentovat na přednáškách.
Metody hodnocení
Závěrečný písemný test se bude skládat z přibližně 10 otázek hodnocených 20 body. Body získané za tento test budou tvořit 50% z celkového finálního hodnocení. Dalších 20 bodů (50% hodnocení) bude uděleno za aktivitu při přednáškách a cvičeních (5 bodů) a za kvalitu zpracování projektu (15 bodů). Pro úspěšné ukončení předmětu je nutné dosáhnout minimálně 21 bodů, z toho 10 bodů z projektu. Studenti můžou při testu používat všechny studijní materiály, protože otázky jsou koncipovány tak, aby vyzkoušeli především znalost obecných principů a schopnost využít nabyté znalosti při řešení praktických příkladů.
Další komentáře
Předmět je vyučován každoročně.
Výuka probíhá každý týden.
Předmět je zařazen také v obdobích jaro 2023, jaro 2024.
  • Statistika zápisu (nejnovější)
  • Permalink: https://is.muni.cz/predmet/sci/jaro2025/E7528