Výpočetní metody v bioinformatice a systémové biologii
Týden 3 - UCSC a Ensembl Genome Browser - programovatelne dotazy a zber dat
ir <- IRanges(start=c(1,12,15,36), end=c(7,24,27,45))
gr <- GRanges("chr1",ir)
seqlevels(gr) <- c("chr1","chr2")
seqlengths(gr) <- c(250000,170000)
gr <- GRanges(gr, name=c("A","B","C","D"))
mcols(gr)$name
start(gr)
width(gr)
ranges(gr)
plot(coverage(gr)$chr1, xlim=c(0,50), type="l")
Anotace a vizualizace v R
1. Ziskejte anotaci lidskeho genomu v oblasti chr19:44,840,000-45,000,000
Ulozte BED5 a GFF3 format
2. Vytvorte objekt IRanges pro tyto data ze souboru BED5
3. Vytvorte objekt GenomicRanges pro tyto data z datove struktury v bode 2 a dalsich potrebnych dat v GFF3 nacteneho do tabulky
4. Vytvorte objekt GenomicRanges pomoci vhodne funkce primo nactenim GFF3 souboru
5. Ve skupinkach vizualizujte tuto oblast za pomoci
Gviz, genoPlotR, GenomeGraphs, ggbio Namapujte NGS ready v adresari Data-NGS v materialech kurzu v ISu na oblast lidskeho genomu chr1:153350000-153633000 (S100 gene cluster). Vysledky vizualizujte v prohlizeci IGV.
Pracujte na stroji biolinux.fi.muni.cz. Software: bowtie (nebo bowtie2), samtools, igv
Pozn.: Sekvence pochazi z experimentu SRR3213016 v archivu SRA.
gr <- GRanges("chr1",ir)
seqlevels(gr) <- c("chr1","chr2")
seqlengths(gr) <- c(250000,170000)
gr <- GRanges(gr, name=c("A","B","C","D"))
mcols(gr)$name
start(gr)
width(gr)
ranges(gr)
plot(coverage(gr)$chr1, xlim=c(0,50), type="l")
Anotace a vizualizace v R
1. Ziskejte anotaci lidskeho genomu v oblasti chr19:44,840,000-45,000,000
Ulozte BED5 a GFF3 format
2. Vytvorte objekt IRanges pro tyto data ze souboru BED5
3. Vytvorte objekt GenomicRanges pro tyto data z datove struktury v bode 2 a dalsich potrebnych dat v GFF3 nacteneho do tabulky
4. Vytvorte objekt GenomicRanges pomoci vhodne funkce primo nactenim GFF3 souboru
5. Ve skupinkach vizualizujte tuto oblast za pomoci
Gviz, genoPlotR, GenomeGraphs, ggbio Namapujte NGS ready v adresari Data-NGS v materialech kurzu v ISu na oblast lidskeho genomu chr1:153350000-153633000 (S100 gene cluster). Vysledky vizualizujte v prohlizeci IGV.
Pracujte na stroji biolinux.fi.muni.cz. Software: bowtie (nebo bowtie2), samtools, igv
Pozn.: Sekvence pochazi z experimentu SRR3213016 v archivu SRA.