Pokročilé metody bioinformatiky

VARIANT CALLING (SNPs/SV/CNV?) 20. 2. 2023

V adresari /mnt/nas/biodata/pv269 jsem pripravil mapovanim DNA-seq experimentu na genom CHM13v2 (T2T) programem bowtie2 soubor formatu BAM:

=====

bowtie2-build ../genome/CHM13v2.fa ../genome/CHM13v2.fa --threads 4

bowtie2 -x ../genome/CHM13v2.fa -1 ../reads/SRR4009287_R1.fastq -2 ../reads/SRR4009287_R2.fastq -I 100 -X 15000 -p 4 -S SRR4009287_CHM13v2.sam

=====

Converting between SAM and BAM, sorting, indexing and viewing BAM: link

Z tohoto souboru vyberte jenom cast genomu (cca 1-5%), abychom zbytecne nepracovali s velkymi soubory a necekali dlouho na vysledky.


Dale nas bude zajimat:

- vytvoreni VCF souboru, variant (SNP) calling

- zobrazeni dat v IGV, inspekce zajimavych mist v genomu (dokazete najit jednoduchy SNP, deleci, inzerci?)