GENOME ORGANIZATION, PROCESSING NGS DATA 13. 2. 2023
1. ORGANIZACE KURZU
Vyučující: dr.Lexa
65% kurzu bude postaveno na materiálu
Relevantní kapitoly pro kurz:
1. Introduction to DNA sequencing (jako přehled technik sekvenování, probírá se v jiných kurzech, pro nove informace spis viz Lin et al.)
2. Quality Control and Data Preprocessing (1.týden, opakovanie)
5. Visualization of NGS Data (2. týden)
6. DNA Sequence Alignment (jako přehled klíčových algoritmů, probírá se v IV107/8)
7. Genome Assembly Using Generalized de Bruijn Digraphs (podle potreby/zajmu 5.týden/IV108)
10. Genome Annotation (7.-8.týden)
11. Using NGS to detect sequence Variants (2.-3. týden)
12. ChIP-seq (4.týden?)
2. STRUKTURA GENOMU
***ÚKOL: doplnit záložky - pošlete mi e-mailem 8-16 podobných záložek k videu
Obsah (ChIP, 3C až Hi-C, LAD, TAD)
(Links Michalik, Juric & Ondrejka)
Nucleus model https://youtu.be/tO--CnMDaI0?t=68
Nucleus-DNA scale https://youtu.be/tO--CnMDaI0?t=190
DNA compaction https://youtu.be/tO--CnMDaI0?t=310
Chromosomal domains https://youtu.be/tO--CnMDaI0?t=350
What we will learn https://youtu.be/tO--CnMDaI0?t=403
Molecular methods for studying genome organization https://youtu.be/tO--CnMDaI0?t=511
Locus-landmark interactions: ChIP and DamID principles https://youtu.be/tO--CnMDaI0?t=598
Locus-locus interactions https://youtu.be/tO--CnMDaI0?t=808
3C https://youtu.be/tO--CnMDaI0?t=869
C-three https://youtu.be/tO--CnMDaI0?t=1016
Hi-C description https://youtu.be/tO--CnMDaI0?t=1109
Checkerboard pattern of interaction https://youtu.be/tO--CnMDaI0?t=1450
ChIA-PET https://youtu.be/tO--CnMDaI0?t=1765
Chromosome compartmentalization https://youtu.be/tO--CnMDaI0?t=1874
Active/in-active compartmentalization https://youtu.be/tO--CnMDaI0?t=2145
Topologically associated domains (TADs) https://youtu.be/tO--CnMDaI0?t=2276
Hi-C data processing https://youtu.be/tO--CnMDaI0?t=2553
Bias normalization https://youtu.be/tO--CnMDaI0?t=2668
Interpretation of data https://youtu.be/tO--CnMDaI0?t=2977
LADs https://youtu.be/tO--CnMDaI0?t=2982
Hi-C features https://youtu.be/tO--CnMDaI0?t=3246
CTCF loop extrusion https://youtu.be/tO--CnMDaI0?t=3326
Inter-species conservation of genome organization https://youtu.be/tO--CnMDaI0?t=3867
LAD inter-species conservation https://youtu.be/tO--CnMDaI0?t=3916
Prediction of lamina association https://youtu.be/tO--CnMDaI0?t=4093
A/T content influence https://youtu.be/tO--CnMDaI0?t=4100
Folding during cell cycle https://youtu.be/tO--CnMDaI0?t=4264
CTCF binding site removal https://youtu.be/tO--CnMDaI0?t=4445
Úvod https://youtu.be/sAkH51R0DNg?t=111
Regulační elementy v genomech https://youtu.be/sAkH51R0DNg?t=222
Identifikace regulačních elementů sekvenací DNA https://youtu.be/sAkH51R0DNg?t=421
Nezodpovězené otázky https://youtu.be/sAkH51R0DNg?t=642
3. NGS DATA (DNA-seq, RNA-seq)
viz učebnice
***ÚKOL: zjistit, ktere jsou porad funkcni nebo se vyviji a doplnit seznam novsich metod vizualizace - pošlete mi e-mailem nazvy a URL
(Contetn by Michalik, Juric & Ondrejka)
IGV - funkcny a udrziavany
UCSC Genome Browser - funkcny a udrziavany
JBrowse (https://jbrowse.org/jb2/)
Podporuje vela formatov (BAM, VCF, GFF3, BED, CRAM, ...), vie vizualizovat Hi-C
contact matrix
Genome View - posledna verzia 2018
Staden (https://staden.sourceforge.net/) Posledny release v 2016. Stale funkcny a udrziavany, problem s novel macOS (Big Sur a novsie)
Illumina Genome studio - funkcny a udrziavany
Bioconductor (http://bioconductor.org/) Tiez by malo vediet robit vizualizacie (napr. ggbio, rtracklayer, GViz)
Newbler - da sa vraj vyziadat od Roche, nenasiel som ale spravny formular. 454 Assembler, nie vizualizator.
Mauve https://darlinglab.org/mauve/mauve.html "No longer maintained". Komparator genomov, nie vizualizator
genomeview (https://github.com/nspies/genomeview) Vyzera, ze nie je maintained
Michalik: alen - https://github.com/jakobnissen/alen- text-based (môže byť potrebné ak sú dáta na servery kde nie je XWS a nechceme ich sťahovať)
panX - https://pangenome.org/- vizualizácia bakteriálnych genómov, vyzerá veľmi vizuálne pekne
pyGenome tracks - https://github.com/deeptools/pyGenomeTracks- vizuálne pekné, veľa možností vrátane HI-C matrices
Juric: Objavil som zaujimavy software: https://github.com/cmdcolin/awesome-genome-visualization, na ktorom su odkazy na zmienene ale aj nove dalsie nastroje na vizualizaciu.
novy format - CRAM
Analyze https://www.ncbi.nlm.nih.gov/sra/SRX2006496[accn]
4. HiC data analysis
HiC-Pro + Protocols from Bicciato and Ferrari (2022)
Analyze SRR19139574 (alternativne SRR15458782)
5. ChIP-seq analysis
Analyze https://www.ncbi.nlm.nih.gov/sra/?term=maizels+AND+xpd (alternative SRR13161616)