Fylogenetická evoluční analýza • • •Pro zajímavost… • • • •Důležité… • • evolution •Fylogeneze = vývoj druhu (vývoj nových druhů) procesem evoluce. •Fylogenetika = věda zkoumající fylogenezi, příbuzenské vztahy a vývoj organismů. •Evoluce bioinformatika ch16f1 Fylogeneze •Fylogeneze nezahrnuje pouze podobnosti a rozdíly mezi organismy (taxonomie)… •…ale také jejich evoluční vztahy. Fylogenetická data •Fylogenetická data jsou získávána zkoumáním charakteristických znaků studovaných organismů. • Prvotně používány MORFOLOGICKÉ znaky. • Problém – fosilní pozůstatky většinou NEKVALITNÍ, neposkytují žádané informace nebo se VŮBEC nedochovají. fosilie-amonit-na-bielom fosilie-turitella-musle trilobit • Molekulární fylogenetická data •Jediný experiment může poskytnout informace o mnoha znacích. • • • •Jednotlivé stavy jsou jednoznačné a nezaměnitelné (A x C x G x T). Na rozdíl od morfologických znaků (tvar), u nichž existuje mnoho přechodových forem. • •Molekulární data se dají snadno převést do „číselné“ formy. Vhodné pro matematické a statistické analýzy. • •AAGACGGCACCGACAACGACTACAACGACGCCGTCGTGGTGATCAACTGGCCGCTCGGCT AGGATGGTACCGACATGGACTACAACGACTCCATCGTCATCCTGAACTGGCCGCTGGGCT GGGACGGCAACGGC-TGGAC--CAAGGGCGCCTACACCGCCACGAACTGA---------- ACGACGTGCCCGGAACCTATGGCAATAACTCCGGC-TCGTTCAGTGTCAATATTGGAAAG •Každá nukleotidová pozice v sekvenci může být považována za jeden ZNAK, který se vyskytuje ve ČTYŘECH rozdílných STAVECH. • Proteinové sekvence x DNA sekvence •Pro fylogenetickou analýzu využívány PŘEVÁŽNĚ DNA sekvence. • DNA poskytuje mnohem více fylogenetických informací než protein. ch16f2 •Tiché mutace •Variabilita uspořádání genomu (kódující x nekódují oblasti) •PCR, automatické sekvencování • Fylogenetický strom •Cíl fylogenetické analýzy - fylogenetický strom popisující evoluční vztahy mezi studovanými organismy. •Fylogenetický strom (strom) •Větve •Terminální (externí) uzly •Interní uzly •Periferní větve •Vnitřní větve •Současné taxony (geny) = terminální (externí) uzly, vrcholy •Interní uzly = rozdělení společného „předka“ •Délky větví = uměrné velikosti změny v průběhu evoluce • Fylogenetický strom ch16f3 •Fylogenetický strom BEZ KOŘENE (unrooted). •Není známý nejstarší společný předek (bod). •Vypovídá pouze o příbuzenských vztazích mezi geny, ne o „cestě“ kterou se evoluce ubírala. ch16f3 •Fylogenetický strom S KOŘENEM (rooted). •Nutný alespoň jeden gen, který je méně příbuzný s A,B,C,D, než jsou tyto geny mezi sebou navzájem = „outgroup“ • Fylogenetický strom ch16f3 •Fylogenetický strom S KOŘENEM (rooted). •Nutný alespoň jeden gen, který je méně příbuzný s A,B,C,D, než jsou tyto geny mezi sebou navzájem = „outgroup“ • „Genový“ strom x „druhový strom“ •Genový strom – odvozen ze srovnání ortologních genů. Předpokládá se, že bude přesnější než strom získaný pomocí morfologických dat. •Genový strom druhový strom. • Genový strom – vnitřní uzly představují rozdělení původního GENU (mutace). • Druhový strom – vnitřní uzly představují rozdělení populace původního DRUHU do dvou skupin (geografická izolace). •¹ • „Genový“ strom x „druhový strom“ •Mutace a vznik nového druhu se s největší pravděpodobností neodehrají současně. • •Mutace předchází separaci – v populaci se nacházejí obě alely genu. Po rozdělení populací může dojít ke ztrátě jedné alely. ch16f6 „Genový“ strom x „druhový strom“ ch16f7 ch16f7 ch16f7 Tvorba evolučních stromů •„Alignment“ sekvencí – nezbytný pro vytvoření stromu. Vyhodnocení rozdílů mezi jednotlivými nukletidovými sekvencemi, většinou „multiple alignment“. • Jak převést „multiple alignment“ na strom? •Neexistuje „nejlepší metoda“. Několik metod je používáno souběžně, žádnou nelze označit za lepší než ostatní. • •Distanční matice. • Slouží k určení délky větví. • • • • •4/20 • •Jak převést „multiple alignment“ na strom? •UPGMA (Unweighted Pair Group Method with Arithmetic mean, Unweighted Pair Group Method Using Arithmetic Average). Využívá distanční matici. •Essential •Bioinformatics •JIN XIONG •Texas A&M University • •Jak převést „multiple alignment“ na strom? •Essential •Bioinformatics •JIN XIONG •Texas A&M University • •Jak převést „multiple alignment“ na strom? • •Essential •Bioinformatics •JIN XIONG •Texas A&M University •Neighbor-joining method– „spojování sousedních objektů“ (Saitou a Nei 1987) . Využívá distanční matici, korekce vzdáleností. Jak převést „multiple alignment“ na strom? ch16f11 ch16f11 • •Essential •Bioinformatics •JIN XIONG •Texas A&M University •Essential •Bioinformatics •JIN XIONG •Texas A&M University •Neighbor-joining method– „spojování sousedních objektů“ (Saitou a Nei 1987) . Využívá distanční matici, korekce vzdáleností. Jak převést „multiple alignment“ na strom? ch16f11 ch16f11 • •Neighbor-joining method – „spojování sousedních objektů“ (Saitou a Nei 1987) . Využívá distanční matrici. Jak převést „multiple alignment“ na strom? •+ Jednoduché = rychlé •+ Vhodné pro velké soubory dat •+ Vhodné pro prvotní analýzu •- Informace z alignmentu velmi zredukována •- Poskytuje pouze jeden výsledný strom • • •Metody maximální úspornosti – maximum parsimony method. Předpokládá (správně???), že evoluce jde nejkratší možnou cestou, tj. správný fylogenetický strom je ten, který požaduje minimum nukleotidových změn, aby bylo dosaženo daného rozdílů mezi sekvencemi. • Jak převést „multiple alignment“ na strom? •+ Preciznější •- Větší nároky na manipulaci s daty •- Čím vice sekvencí, tím více topologií stromů je nutné vyzkoušet •- 5 sekvencí = 15 stromů, 10 sekvencí = 2 027 025 stromů • • •Parsimonie: Fitchova parsimonie » Wagnerova parsimonie (reverzibilita změn) » Dollova parsimonie („novinka“ může zaniknout) » Caminova-Sokalova parsimonie (změny ireverzibilní) » Vážená parsimonie » Generalizovaná parsimonie » » Jak převést „multiple alignment“ na strom? •Metoda maximální pravděpodobnosti Software pro fylogenetickou analýzu •BioNJ (Neighbor-joining method) •PAUP - Phylogenetic Analysis Using Parsimony • • Software pro fylogenetickou analýzu •PHYLIP – PHYLogeny Inference Package • [PHYLIP logo here] •http://evolution.genetics.washington.edu/phylip.html Software pro fylogenetickou analýzu • title •http://abacus.gene.ucl.ac.uk/software/paml.html mc128 •http://macclade.org/index.html Shrnutí •Fylogenetika = věda zkoumající fylogenezi, příbuzenské vztahy a vývoj organismů. • •Morfologická data/molekulární data (sekvence). • •Fylogenetické stromy: topologie (příbuznost + evoluce). • •Tvorba stromů: alignment + parsimonie, Neighbor-joining method, … • •BioNJ, PAUP, PHYLIP, PAML • • • Použitá literatura •