Výpočetní metody v bioinformatice a systémové biologii

Týden 5 - diskuse zadání hodnoceného úkolu, konec 1.části - 13. 3. 2023

Sesbírejte sekvence, které tvoří širší rodinu virů, do které patří SARS-CoV-2 (minimálně 15 sekvencí, maximálně 5 SARS-CoV-2). Zvolte vhodnou vědeckou publikaci či jiný podobný zdroj informací k celkové orientaci. Identifikujte v sekvencich kodujici sekvenci S proteinu. Vytvořte sbírků sekvencí S proteinu, sestrojte vícenásobné zarovnání jeho RNA a AK sekvencí, sestrojte fylogenetický strom. Identifikujte konsenzuální AA sekvenci a polohu ORF obsahujici kodujici sekvenci S proteinu. Rozdílnost aminokyselin na jednotlivých pozicích namapujte na vhodnou strukturu z PDB tak, aby barva AK ve strukture odpovidala poctu sekvenci ve sbirce obsahujici nejvice zastoupenou AK.

Odevzdávejte/prezentujte soubory se sekvencemi, skripty potřebné k řešení a obrázky zarovnání, stromu a vizualizace na struktuře + popis reprodukovatelneho postupu s dalsimi drobnymi informacemi pozadovanymi v zadani.

Tento projekt budete obhajovat jako součást zkoušky.
Andersen et al. 2020
The proximal origin of SARS-CoV-2

Elayadeth-Meethal et al. 2020
COVID-19 and SARS-CoV-2: Molecular Genetics Perspectives


POZNAMKY K UKOLU

Anchored multiple alignment http://dialign.gobics.de/anchor/manual

Konzervovane AA mimo CCHH naznacuje orientaaciu

Niektore motivy ZF su viac konzervovane, ine menej

Viac ZF motivov u rastlin

mezi rostlinou a zvířetem odpovídají některé části motivu, ale krom umístění C a H se spíše liší

Dva ucely zarovnavania - najst motiv alebo zistit evolucnu pribuznost/funkcnu podobnost


To determine the phylogenetic relationship between copies within each family, the remaining3

sequences were aligned with MUSCLE using default settings (41). These aligned sequences4

were then trimmed using trimAL with paramters ‘-automated1’ (42). Trimmed sequences were5

then aligned again using MUSCLE and default parameters. A phylogenetic tree was generated6

for eacfh family using RAxML with settings ‘-f a -m GTRGAMMA -p 12345 -x 12345 -#7

autoMRE’ (43). Phylogenetic trees were plotted with the ggtree R package (44).

https://www.biorxiv.org/content/10.1101/2023.03.02.530873v1