PřF:E7528 Analýza genom proteom dat - Informace o předmětu
E7528 Analýza genomických a proteomických dat
Přírodovědecká fakultajaro 2024
- Rozsah
- 2/0/0. 2 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: k, z.
- Vyučující
- Mgr. Eva Budinská, Ph.D. (přednášející)
Mgr. Barbora Zwinsová (pomocník) - Garance
- Mgr. Eva Budinská, Ph.D.
RECETOX – Přírodovědecká fakulta
Kontaktní osoba: Mgr. Eva Budinská, Ph.D.
Dodavatelské pracoviště: RECETOX – Přírodovědecká fakulta - Rozvrh
- Po 19. 2. až Ne 26. 5. St 12:00–13:50 F01B1/709
- Předpoklady
- ( Bi5040 Biostatistika - základní kurz || Bi5045 Biostatistika pro mat. biol. || Bi5046 Biostatistika pro mat. biol. || E5046 Biostatistika pro mat. biol. ) && E8600 Vícerozměrné metody && E7527 Analýza dat v R && Bi4010 Základy molekulární biologie && E0034 Analýza a klasif dat
Bi5040 Biostatistika – základní kurz, nebo Bi5045 Biostatistika pro matematickou biologii Nutným předpokladem je dobrá znalost základní metodologie biostatistiky a základů molekulární biologie a genetiky . Doporučeno je absolvování předmětu Bi7527 Analýza dat v R, Bi8600 Vícerozměrné statistické metody, Bi4010 Základy molekulární biologie, Bi3060 Obecná genetika a B7250 Genetika člověka - Omezení zápisu do předmětu
- Předmět je nabízen i studentům mimo mateřské obory.
Předmět si smí zapsat nejvýše 30 stud.
Momentální stav registrace a zápisu: zapsáno: 7/30, pouze zareg.: 0/30, pouze zareg. s předností (mateřské obory): 0/30
Jiné omezení: Doporučení absolvovat Bi8600, Bi4010, Bi3060 - Mateřské obory/plány
- Biomedicínská bioinformatika (program PřF, N-MBB)
- Epidemiologie a modelování (program PřF, N-MBB)
- Cíle předmětu
- Cílem kurzu je naučit studenty analyzovat data z mikročipových experimentů a dat proteinové hmotnostní spektrometrie a to od úpravu a normalizace základních dat až po biologickou interpretaci výsledků, za použití pokročilých statistických metod.
- Výstupy z učení
- Student po absolvování kurzu:;
Zná otázky, na které lze odpovědět studiem genomických a proteomických dat.;
Zná vybrané technologie, které jsou zdroji vysokohustotních genomických a proteomických dat (typy DNA mikročipů, arrayCGH, hmotnostní spektrometrie);
Zná typy dat produkovaných genomickými a proteomickými technologiemi a jejich problémy z pohledu analytika;
Umi vyjmenovat obecné základní kroky analýzy genomických a proteomických dat.;
Zná pro analýzu potřebné technické detaily technologie mikročipů a hmotnostní spektrometrie.;
Rozumí základním metodám kvantifikace měření těchto technologií a následným úpravám jejich hodnot při vytváření finálního datového souboru.;
Zná specifické, na technologii závislé zdroje nežádoucího technického šumu v datech.;
Pomocí grafických nástrojů a statistických metod dokáže identifikovat přítomnost a zdroj tohoto šumu v datech.;
Umí aplikovat statistické metody používané pro odstranění nežádoucího šumu.;
Dokáže provést transformaci zdrojových dat (normalizaci);
Standardizuje měření mezi jednotlivými datovými soubory.;
Vytvoří finální datový soubor pro další analýzy.;
Dokáže identifikovat a odstranit efekt dávky (batch effect) v datech.;
Popíše obecné principy analýzy genomických a proteomických dat.;
Na základě biologického zadání správně určí typ potřebné analýzy.;
Navrhne analytický postup pro příkladovou studii. ;
Na základě biologického zadání správně určí typ hypotézy a metody jejího testování.;
Rozumí specifickým metodám porovnávání hypotéz, jako je SAM a limma.;
Aplikuje testování hypotéz pro určení odlišně exprimovaných genů/proteinů.;
Zná statistické metody predikce tříd a umí je aplikovat na příkladová data.;
Zná metody dolování dat pro predikci tříd a umí je použít v genomických datech.;
Zná pozitiva a negativa metod pro predikci a umí se rozhodnout, kterou aplikovat.;
Aplikuje MAQC II standardy pro tvorbu klasifikátorů z microarray dat.;
Vybere a aplikuje vhodné vícerozměrné regresní metody pro propojení vztahu exprese genů/proteinů s dalšími (např. klinickými) faktory.;
Na genomických datech provede analýzu přežití pomocí Kaplan-Meierovych odhadů a Coxova modelu proporcionálních rizik.;
Zná princip a metody analýzy genových sad;
Zná princip a základní metody konstrukce genových sítí;
Aplikuje na modelovém příkladu nejběžnější metody analýzy genových sad a pathway analýzy.;
Vyhledá vysokohustotní genomické a proteomické data ve veřejných databázích.;
Použije Fisherovu Z-transformaci a další meta-analytické transformace.;
Aplikuje meta-analytické metody seřazení výsledků analýzy odlišné genové/proteinové exprese z více zdrojů.;
Pracuje v SW prostředí R a Bioconductor pro úpravy a analýzu genomických a proteomických dat.;
Aplikuje vybrané balíky R a Bioconductor a jejich funkce v úpravě a analýze dat.; - Osnova
- 1.Současné výzvy a technologie genomiky a proteomiky;
- 2.Princip a analýza obrazu DNA mikročipů;
- 3.Úprava a normalizace dat cDNA mikročipů;
- 4.Úprava a normalizace dat oligonukleotidových mikročipů;
- 5.Úprava a normalizace dat dalších typů mikročipů (Epigenetické mikročipy, SNP mikročipy, Illumina BeadChip, ....);
- 6.Získávání, úprava a normalizace dat proteinové hmotnostní spektrometrie;
- 7.Základní principy analýzy genomických a proteomických dat ;
- 8.Porovnávání tříd;
- 9.Predikce tříd ;
- 10.Objevování tříd ;
- 11.Analýza přežití a další regrese;
- 12.Analýza genových sad a genových sítí ;
- 13.Meta-analýza;
- Literatura
- doporučená literatura
- Meta-analysis and combining information in genetics and genomics. Edited by Rudy Guerra - Darlene Renee Goldstein. Boca Raton: CRC Press, 2010, xxiii, 335. ISBN 9781584885221. info
- GENTLEMAN, Robert. R programming for bioinformatics. Boca Raton: CRC Press, 2009, xii, 314. ISBN 9781420063677. info
- Bioinformatics and computational biology solutions using R and bioconductor. Edited by Robert Gentleman. New York: Springer, 2005, xix, 473. ISBN 0387251464. info
- Data analysis and visualization in genomics and proteomics. Edited by Francisco Azuaje - Joaquín Dopazo. Hoboken, NJ: John Wiley, 2005, xv, 267. ISBN 0470094397. info
- DRĄGHICI, Sorin. Data analysis tools for DNA microaarays. Boca Raton: Chapman & Hall/CRC, 2003, 477 s. +. ISBN 1-58488-315-4. info
- Výukové metody
- Výuka bude probíhat formou přednášek s teoretickou přípravou a praktickými cvičeními v programu R a jeho nástavbě Bioconductor. V úvodu přednášky se vysvětlí koncepty a metody, a následně si studenti vyzkouší jejich aplikaci na reálných datech. Začátkem semestru si student vybere jeden projekt, který bude splňovat nároky (detaily v první přednášce), na kterém pak bude v průběhu semestru pracovat. Ve druhé půlce semestru pak budou studenti své průběžné výsledky prezentovat na přednáškách.
- Metody hodnocení
- Závěrečný písemný test se bude skládat z přibližně 10 otázek hodnocených 20 body. Body získané za tento test budou tvořit 50% z celkového finálního hodnocení. Dalších 20 bodů (50% hodnocení) bude uděleno za aktivitu při přednáškách a cvičeních (5 bodů) a za kvalitu zpracování projektu (15 bodů). Pro úspěšné ukončení předmětu je nutné dosáhnout minimálně 21 bodů, z toho 10 bodů z projektu. Studenti můžou při testu používat všechny studijní materiály, protože otázky jsou koncipovány tak, aby vyzkoušeli především znalost obecných principů a schopnost využít nabyté znalosti při řešení praktických příkladů.
- Další komentáře
- Studijní materiály
Předmět je vyučován každoročně.
- Statistika zápisu (nejnovější)
- Permalink: https://is.muni.cz/predmet/sci/jaro2024/E7528