VARIANT CALLING (SNPs/SV/CNV?) 20. 2. 2023
V adresari /mnt/nas/biodata/pv269 jsem pripravil mapovanim DNA-seq experimentu na genom CHM13v2 (T2T) programem bowtie2 soubor formatu BAM:
=====
bowtie2-build ../genome/CHM13v2.fa ../genome/CHM13v2.fa --threads 4
bowtie2 -x ../genome/CHM13v2.fa -1 ../reads/SRR4009287_R1.fastq -2 ../reads/SRR4009287_R2.fastq -I 100 -X 15000 -p 4 -S SRR4009287_CHM13v2.sam
=====
Converting between SAM and BAM, sorting, indexing and viewing BAM: link
Z tohoto souboru vyberte jenom cast genomu (cca 1-5%), abychom zbytecne nepracovali s velkymi soubory a necekali dlouho na vysledky.
Jak extrahovat specifickou oblast nebo chromozom z BAM souboru
Dale nas bude zajimat:
- vytvoreni VCF souboru, variant (SNP) calling
- zobrazeni dat v IGV, inspekce zajimavych mist v genomu (dokazete najit jednoduchy SNP, deleci, inzerci?)