Fylogenetická evoluční analýza Pro zajímavost… Důležité… evolution Fylogeneze = vývoj druhu (vývoj nových druhů) procesem evoluce. Fylogenetika = věda zkoumající fylogenezi, příbuzenské vztahy a vývoj organismů. Evoluce bioinformatika ch16f1 Fylogeneze Fylogeneze nezahrnuje pouze podobnosti a rozdíly mezi organismy (taxonomie)… …ale také jejich evoluční vztahy. Fylogenetická data •Fylogenetická data jsou získávána zkoumáním charakteristických znaků studovaných organismů. • Prvotně používány MORFOLOGICKÉ znaky. • Problém – fosilní pozůstatky většinou NEKVALITNÍ, neposkytují žádané informace nebo se VŮBEC nedochovají. fosilie-amonit-na-bielom fosilie-turitella-musle trilobit Molekulární fylogenetická data •Jediný experiment může poskytnout informace o mnoha znacích. • • • •Jednotlivé stavy jsou jednoznačné a nezaměnitelné (A x C x G x T). Na rozdíl od morfologických znaků (tvar), u nichž existuje mnoho přechodových forem. • •Molekulární data se dají snadno převést do „číselné“ formy. Vhodné pro matematické a statistické analýzy. • AAGACGGCACCGACAACGACTACAACGACGCCGTCGTGGTGATCAACTGGCCGCTCGGCT AGGATGGTACCGACATGGACTACAACGACTCCATCGTCATCCTGAACTGGCCGCTGGGCT GGGACGGCAACGGC-TGGAC--CAAGGGCGCCTACACCGCCACGAACTGA---------- ACGACGTGCCCGGAACCTATGGCAATAACTCCGGC-TCGTTCAGTGTCAATATTGGAAAG Každá nukleotidová pozice v sekvenci může být považována za jeden ZNAK, který se vyskytuje ve ČTYŘECH rozdílných STAVECH. Proteinové sekvence x DNA sekvence •Pro fylogenetickou analýzu využívány PŘEVÁŽNĚ DNA sekvence. • DNA poskytuje mnohem více fylogenetických informací než protein. ch16f2 Tiché mutace Variabilita uspořádání genomu (kódující x nekódují oblasti) PCR, automatické sekvencování Fylogenetický strom •Cíl fylogenetické analýzy - fylogenetický strom popisující evoluční vztahy mezi studovanými organismy. Fylogenetický strom (strom) Větve Terminální (externí) uzly Interní uzly Periferní větve Vnitřní větve Současné taxony (geny) = terminální (externí) uzly, vrcholy Interní uzly = rozdělení společného „předka“ Délky větví = uměrné velikosti změny v průběhu evoluce Fylogenetický strom ch16f3 Fylogenetický strom BEZ KOŘENE (unrooted). Není známý nejstarší společný předek (bod). Vypovídá pouze o příbuzenských vztazích mezi geny, ne o „cestě“ kterou se evoluce ubírala. ch16f3 Fylogenetický strom S KOŘENEM (rooted). Nutný alespoň jeden gen, který je méně příbuzný s A,B,C,D, než jsou tyto geny mezi sebou navzájem = „outgroup“ Fylogenetický strom ch16f3 Fylogenetický strom S KOŘENEM (rooted). Nutný alespoň jeden gen, který je méně příbuzný s A,B,C,D, než jsou tyto geny mezi sebou navzájem = „outgroup“ „Genový“ strom x „druhový strom“ •Genový strom – odvozen ze srovnání ortologních genů. Předpokládá se, že bude přesnější než strom získaný pomocí morfologických dat. •Genový strom druhový strom. • Genový strom – vnitřní uzly představují rozdělení původního GENU (mutace). • Druhový strom – vnitřní uzly představují rozdělení populace původního DRUHU do dvou skupin (geografická izolace). ¹ „Genový“ strom x „druhový strom“ •Mutace a vznik nového druhu se s největší pravděpodobností neodehrají současně. • •Mutace předchází separaci – v populaci se nacházejí obě alely genu. Po rozdělení populací může dojít ke ztrátě jedné alely. ch16f6 „Genový“ strom x „druhový strom“ ch16f7 ch16f7 ch16f7 Tvorba evolučních stromů •„Alignment“ sekvencí – nezbytný pro vytvoření stromu. Vyhodnocení rozdílů mezi jednotlivými nukletidovými sekvencemi, většinou „multiple alignment“. Jak převést „multiple alignment“ na strom? •Neexistuje „nejlepší metoda“. Několik metod je používáno souběžně, žádnou nelze označit za lepší než ostatní. • •Distanční matice. • Slouží k určení délky větví. 4/20 •Neighbor-joining method– „spojování sousedních objektů“ (Saitou a Nei 1987) . Využívá distanční matici. Jak převést „multiple alignment“ na strom? ch16f11 ch16f11 •Neighbor-joining method – „spojování sousedních objektů“ (Saitou a Nei 1987) . Využívá distanční matrici. Jak převést „multiple alignment“ na strom? + Jednoduché = rychlé + Vhodné pro velké soubory dat + Vhodné pro prvotní analýzu - Informace z alignmentu velmi zredukována - Poskytuje pouze jeden výsledný strom •Metody maximální úspornosti – maximum parsimony method. Předpokládá (správně???), že evoluce jde nejkratší možnou cestou, tj. správný fylogenetický strom je ten, který požaduje minimum nukleotidových změn, aby bylo dosaženo daného rozdílů mezi sekvencemi. • Jak převést „multiple alignment“ na strom? + Preciznější - Větší nároky na manipulaci s daty - Čím vice sekvencí, tím více topologií stromů je nutné vyzkoušet - 5 sekvencí = 15 stromů, 10 sekvencí = 2 027 025 stromů •Parsimonie: Fitchova parsimonie » Wagnerova parsimonie (reverzibilita změn) » Dollova parsimonie („novinka“ může zaniknout) » Caminova-Sokalova parsimonie (změny ireverzibilní) » Vážená parsimonie » Generalizovaná parsimonie » Jak převést „multiple alignment“ na strom? •Metoda maximální pravděpodobnosti •Metoda minimální evoluce Software pro fylogenetickou analýzu •BioNJ (Neighbor-joining method) •PAUP - Phylogenetic Analysis Using Parsimony http://paup.csit.fsu.edu/index.html Software pro fylogenetickou analýzu •PHYLIP – PHYLogeny Inference Package [PHYLIP logo here] http://evolution.genetics.washington.edu/phylip.html Software pro fylogenetickou analýzu title http://abacus.gene.ucl.ac.uk/software/paml.html mc128 http://macclade.org/index.html Shrnutí •Fylogenetika = věda zkoumající fylogenezi, příbuzenské vztahy a vývoj organismů. • •Morfologická data/molekulární data (sekvence). • •Fylogenetické stromy: topologie (příbuznost + evoluce). • •Tvorba stromů: alignment + parsimonie, Neighbor-joining method, … • •BioNJ, PAUP, PHYLIP, PAML • • Použitá literatura