Týden 5 - diskuse zadání hodnoceného úkolu, konec 1.části - 13. 3. 2023
Sesbírejte sekvence, které tvoří širší rodinu virů, do které patří
SARS-CoV-2 (minimálně 15 sekvencí, maximálně 5 SARS-CoV-2). Zvolte
vhodnou vědeckou publikaci či jiný podobný zdroj informací k celkové
orientaci. Identifikujte v sekvencich kodujici sekvenci S proteinu.
Vytvořte sbírků sekvencí S proteinu, sestrojte vícenásobné
zarovnání jeho RNA a AK sekvencí, sestrojte fylogenetický strom.
Identifikujte konsenzuální AA sekvenci a polohu ORF obsahujici kodujici
sekvenci S proteinu. Rozdílnost aminokyselin na jednotlivých pozicích
namapujte na vhodnou strukturu z PDB tak, aby barva AK ve strukture
odpovidala poctu sekvenci ve sbirce obsahujici nejvice zastoupenou AK.
Odevzdávejte/prezentujte soubory se sekvencemi, skripty potřebné k řešení a obrázky zarovnání, stromu a vizualizace na struktuře + popis reprodukovatelneho postupu s dalsimi drobnymi informacemi pozadovanymi v zadani.
Tento projekt budete obhajovat jako součást zkoušky.POZNAMKY K UKOLU
Anchored multiple alignment http://dialign.gobics.de/anchor/manual
Konzervovane AA mimo CCHH naznacuje orientaaciu
Niektore motivy ZF su viac konzervovane, ine menej
Viac ZF motivov u rastlin
mezi rostlinou a zvířetem odpovídají některé části motivu, ale krom umístění C a H se spíše liší
Dva ucely zarovnavania - najst motiv alebo zistit evolucnu pribuznost/funkcnu podobnost
To determine the phylogenetic relationship between copies within each family, the remaining3
sequences were aligned with MUSCLE using default settings (41). These aligned sequences4
were then trimmed using trimAL with paramters ‘-automated1’ (42). Trimmed sequences were5
then aligned again using MUSCLE and default parameters. A phylogenetic tree was generated6
for eacfh family using RAxML with settings ‘-f a -m GTRGAMMA -p 12345 -x 12345 -#7
autoMRE’ (43). Phylogenetic trees were plotted with the ggtree R package (44).