IV108 Bioinformatika II

3. týden - Korelované mutace a úvod k práci se strukturami proteinů v Pymol - 4. 10. 2023

Chyba: Odkazovaný objekt neexistuje nebo nemáte právo jej číst.
https://is.muni.cz/el/fi/podzim2023/IV108/um/IV108-02-2019.pdf

CVICENI

Pro rodinu pribuznych proteinovych sekvenci (paralogy v Arabidopsis, jejich ortology z UniProt) naleznete nejpodobnejsi protein z PDB ).

  1. Vytvorte databazi pro BLAST (makeblastdb) ze souboru ATH1.fa a pdb_seqres.txt
  2. Napiste skript, ktery vybere (nahodne a/nebo dle specifikace) jeden protein z ATH1.fa (nabizi se preformatovat sekvence pres one-liner na jeden radek a pouzit 'shuf | head -1' pripadne vygenerovat nahodne cislo a hledat prislusnou sekvenci). K tomuto proteinu pak pomoci prikazu blastp/blastall nalezne nejpodobnejsi sekvenci v PDB. Pokud je podobnost dostatecna, pokracuje dale hledanim paralogu, pokud ne, zopakuje se nahodny vyber a hledani v PDB. Berte skript jako cviceni, ktere nemusite dokoncit. Jak jsem se uz zminil ve vyuce, lze vykonat jednoduse volanim "blastp -db ATH1.fa -query pdb_nodna.fa" s pripadnou optimalizaci -evalue, -word_len nebo -outfmt. Z vystupu vyberte dvojici sekvenci z ATH1.fa a PDB, ktera ma co nejvyssi podobnost a rozumnou delku (predstavuji si jako identita >80% na >80% delky kratsiho z proteinu).

  3. UKOL 3 (1b)

    Vyhledejte paralogy (dalsi podobne sekvence v ATH1.fa) s rozumnou delkou a procentem identity/podobnosti.

    Dohledejte ortology v Uniprot (k nahodne vybrane sekvenci, pripadne k zastupci z PDB) tak, aby vseho vsudy bylo 10-15 podobnych sekvenci k analyze.

    Sekvence vicenasobne zarovnejte (CLUSTAL Omega, Muscle, Mafft), sekvence by se meli "rozumne" zarovnat. Pokud ne, mohl blast najit prilis lokalni podobnosti a je potreba, hlavne u vicedomenovych proteinu nepodobne casti v sekvencich ignorovat (napr. editaci FASTA souboru).

    UKOL 4 (2b)

    V zarovnani (ulozenem v nekterem z beznych formatu) spocitejte pomoci MI pripadne SCA korelaci/kovariaci mezi vsemi dvojicemi sloupcu a data odlozte pro dalsi ukol. Odevzdejte funkcni skript/program k otestovani na jinem zarovnani. Poznamka: mezery v zarovnani muzete brat jako zvlastni znak.

  4. Pokud zustane cas po bodu 4, zacneme se seznamovat s programem Pymol pro vizualizaci proteinovych struktur. Podivejte se na https://www.youtube.com/watch?v=UR6Vl5fB9xc

-----

Chyba: Odkazovaný objekt neexistuje nebo nemáte právo jej číst.
https://is.muni.cz/el/fi/podzim2023/IV108/um/Xu_et_al_2009_cma.pdf
Chyba: Odkazovaný objekt neexistuje nebo nemáte právo jej číst.
https://is.muni.cz/el/fi/podzim2023/IV108/um/E1293.full.pdf
Chyba: Odkazovaný objekt neexistuje nebo nemáte právo jej číst.
https://is.muni.cz/el/fi/podzim2023/IV108/um/1110.5091.pdf

Chyba: Odkazovaný objekt neexistuje nebo nemáte právo jej číst.
https://is.muni.cz/el/fi/podzim2023/IV108/um/journal.pcbi.1000923.pdf
Chyba: Odkazovaný objekt neexistuje nebo nemáte právo jej číst.
https://is.muni.cz/el/fi/podzim2023/IV108/um/bioinformatics_2014_30_14_-_btu154.pdf

From the paper above:

"CorMut incorporates three classical methods to detect corre-
lated mutations, including conditional selection pressure, mutual
information and Jaccard index. Conditional selection pressure,
also known as conditional Ka/Ks, indicates the Ka/Ks of one
mutation (X) in the presence of non-synonymous mutations (Y).
It can be used to evaluate the influence of X on Y. Mutual in-
formation can be used to measure the mutual dependence of two
random variables, making it possible to measure the correlated
mutations between two positions (Cover and Thomas, 2012)."

Na FI máte přístup k počítači biolinux.fi.muni.cz (virtuální stroj, přihlašování jako na jiné počítače na FI).