Výpočetní metody v bioinformatice a systémové biologii

Týden 3 - UCSC a Ensembl Genome Browser - programovatelne dotazy a zber dat

ir <- IRanges(start=c(1,12,15,36), end=c(7,24,27,45))
gr <- GRanges("chr1",ir)
seqlevels(gr) <- c("chr1","chr2")
seqlengths(gr) <- c(250000,170000)
gr <- GRanges(gr, name=c("A","B","C","D"))
mcols(gr)$name
start(gr)
width(gr)
ranges(gr)
plot(coverage(gr)$chr1, xlim=c(0,50), type="l")

Anotace a vizualizace v R

1. Ziskejte anotaci lidskeho genomu v oblasti chr19:44,840,000-45,000,000
   Ulozte BED5 a GFF3 format

2. Vytvorte objekt IRanges pro tyto data ze souboru BED5

3. Vytvorte objekt GenomicRanges pro tyto data z datove struktury v bode 2 a dalsich potrebnych dat v GFF3 nacteneho do tabulky

4. Vytvorte objekt GenomicRanges pomoci vhodne funkce primo nactenim GFF3 souboru

5. Ve skupinkach vizualizujte tuto oblast za pomoci
   Gviz, genoPlotR, GenomeGraphs, ggbio Namapujte NGS ready v adresari Data-NGS v materialech kurzu v ISu na oblast lidskeho genomu chr1:153350000-153633000 (S100 gene cluster). Vysledky vizualizujte v prohlizeci IGV.
Pracujte na stroji biolinux.fi.muni.cz. Software: bowtie (nebo bowtie2), samtools, igv
Pozn.: Sekvence pochazi z experimentu SRR3213016 v archivu SRA.