Týden 2 - Cvičení Metagenomika 19. 9. 2022
Cvičení dr.Lexa
Ve cvičení si ukážeme jak lze sekvence namapovane na NCBI databázi sekvencí spočítat taxonomicky (tzv. binning). Tyto sekvence můžou být sekvence ze sekvenátora (FASTQ) nebo kontigy získané skládáním a čištěním krátkých i dlouhých readů (FASTA). Dle způsobu volání programu DIAMOND budou ve formátech .m8 nebo .daa ("nemeganizovaná" forma, čili před binningem).
Prihlaste se na helix.fi.muni.cz jako uzivatel studentx99
Prikaz pro spusteni programu je megan6
Soubory contigs*.m8 a contigs*.daa najdete v adresari /mnt/nas/biodata/iv114
Meganizer a dalsi programy lze spustit z adresare /mnt/nas/software/megan/tools
Namapované sekvence byli získány příkazem podobným:
diamond blastx -q contigs2.fa -d /mnt/nas/biodata/nr.dmnd -o contigs2.m8 -F 15 -f 6 --range-culling --top 10 -p 6
"Meganizace" např:
/mnt/nas/software/megan/tools/daa2rma -lg -alg longReads -mdb /mnt/nas/backup/megan-map-Oct2019.db -i contigs2.daa -o contigs2.rma
/mnt/nas/software/megan/tools/daa-meganizer -i contigss.daa -mdb /mnt/nas/backup/megan-map-Oct2019.db --longReads --alg longReads
ÚKOL:
Prostudujte formou stromu reprezentované taxony a biologické funkce.
Exportujte data do tabulky.
(Navíc: Srovnejte dvě sady dat.)