Výpočetní metody v bioinformatice a systémové biologii
Týden 3 - UCSC a Ensembl Genome Browser - programovatelne dotazy a zber dat
ir <- IRanges(start=c(1,12,15,36), end=c(7,24,27,45))
gr <- GRanges("chr1",ir)
seqlevels(gr) <- c("chr1","chr2")
seqlengths(gr) <- c(250000,170000)
gr <- GRanges(gr, name=c("A","B","C","D"))
mcols(gr)$name
start(gr)
width(gr)
ranges(gr)
plot(coverage(gr)$chr1, xlim=c(0,50), type="l")
Anotace a vizualizace v R
1. Ziskejte anotaci lidskeho genomu v oblasti chr19:44,840,000-45,000,000
Ulozte BED5 a GFF3 format
2. Vytvorte objekt IRanges pro tyto data ze souboru BED5
3. Vytvorte objekt GenomicRanges pro tyto data z datove struktury v bode 2 a dalsich potrebnych dat v GFF3 nacteneho do tabulky
4. Vytvorte objekt GenomicRanges pomoci vhodne funkce primo nactenim GFF3 souboru
5. Ve skupinkach vizualizujte tuto oblast za pomoci
Gviz, genoPlotR, GenomeGraphs, ggbio, genoPlotR, trackViewer
Pracujte na stroji biolinux.fi.muni.cz. Software: bowtie (nebo bowtie2), samtools, igv
Pozn.: Sekvence pochazi z experimentu SRR3213016 v archivu SRA.
gr <- GRanges("chr1",ir)
seqlevels(gr) <- c("chr1","chr2")
seqlengths(gr) <- c(250000,170000)
gr <- GRanges(gr, name=c("A","B","C","D"))
mcols(gr)$name
start(gr)
width(gr)
ranges(gr)
plot(coverage(gr)$chr1, xlim=c(0,50), type="l")
Anotace a vizualizace v R
1. Ziskejte anotaci lidskeho genomu v oblasti chr19:44,840,000-45,000,000
Ulozte BED5 a GFF3 format
2. Vytvorte objekt IRanges pro tyto data ze souboru BED5
3. Vytvorte objekt GenomicRanges pro tyto data z datove struktury v bode 2 a dalsich potrebnych dat v GFF3 nacteneho do tabulky
4. Vytvorte objekt GenomicRanges pomoci vhodne funkce primo nactenim GFF3 souboru
5. Ve skupinkach vizualizujte tuto oblast za pomoci
Gviz, genoPlotR, GenomeGraphs, ggbio, genoPlotR, trackViewer
Pracujte na stroji biolinux.fi.muni.cz. Software: bowtie (nebo bowtie2), samtools, igv
Pozn.: Sekvence pochazi z experimentu SRR3213016 v archivu SRA.