Projekt z bioinformatiky I

Týden 2 - Cvičení Metagenomika 19. 9. 2022

Cvičení dr.Lexa

Ve cvičení si ukážeme jak lze sekvence namapovane na NCBI databázi sekvencí spočítat taxonomicky (tzv. binning). Tyto sekvence můžou být sekvence ze sekvenátora (FASTQ) nebo kontigy získané skládáním a čištěním krátkých i dlouhých readů (FASTA). Dle způsobu volání programu DIAMOND budou ve formátech .m8 nebo .daa ("nemeganizovaná" forma, čili před binningem).

Prihlaste se na helix.fi.muni.cz jako uzivatel studentx99

Prikaz pro spusteni programu je megan6

Soubory contigs*.m8 a contigs*.daa najdete v adresari /mnt/nas/biodata/iv114

Meganizer a dalsi programy lze spustit z adresare /mnt/nas/software/megan/tools

Namapované sekvence byli získány příkazem podobným:

  diamond blastx -q contigs2.fa -d /mnt/nas/biodata/nr.dmnd -o contigs2.m8 -F 15 -f 6 --range-culling --top 10 -p 6

"Meganizace" např:

  /mnt/nas/software/megan/tools/daa2rma -lg -alg longReads -mdb /mnt/nas/backup/megan-map-Oct2019.db -i contigs2.daa -o contigs2.rma

/mnt/nas/software/megan/tools/daa-meganizer -i contigss.daa -mdb /mnt/nas/backup/megan-map-Oct2019.db --longReads --alg longReads

ÚKOL:

Prostudujte formou stromu reprezentované taxony a biologické funkce.

Exportujte data do tabulky.

(Navíc: Srovnejte dvě sady dat.)