Výpočetní metody v bioinformatice a systémové biologii

Týden 3 - UCSC a Ensembl Genome Browser - programovatelne dotazy a zber dat

ir <- IRanges(start=c(1,12,15,36), end=c(7,24,27,45))
gr <- GRanges("chr1",ir)
seqlevels(gr) <- c("chr1","chr2")
seqlengths(gr) <- c(250000,170000)
gr <- GRanges(gr, name=c("A","B","C","D"))
mcols(gr)$name
start(gr)
width(gr)
ranges(gr)
plot(coverage(gr)$chr1, xlim=c(0,50), type="l")

Anotace a vizualizace v R

1. Ziskejte anotaci lidskeho genomu v oblasti chr19:44,840,000-45,000,000
   Ulozte BED5 a GFF3 format

2. Vytvorte objekt IRanges pro tyto data ze souboru BED5

3. Vytvorte objekt GenomicRanges pro tyto data z datove struktury v bode 2 a dalsich potrebnych dat v GFF3 nacteneho do tabulky

4. Vytvorte objekt GenomicRanges pomoci vhodne funkce primo nactenim GFF3 souboru

5. Ve skupinkach vizualizujte tuto oblast za pomoci
   Gviz, genoPlotR, GenomeGraphs, ggbio, genoPlotR, trackViewer


Namapujte NGS ready v adresari Data-NGS v materialech kurzu v ISu na oblast lidskeho genomu chr1:153350000-153633000 (S100 gene cluster). Vysledky vizualizujte v prohlizeci IGV.
Pracujte na stroji biolinux.fi.muni.cz. Software: bowtie (nebo bowtie2), samtools, igv
Pozn.: Sekvence pochazi z experimentu SRR3213016 v archivu SRA.