Dosud: co se s populací stane v příští generaci? Co předcházelo současnému stavu? Þ „pohled zpět“ Základní premisa populační genetiky: DNA replikuje... ... opakem replikace je koalescence Základní premisa populační genetiky: DNA replikuje... WF populace – opakování: • diploidní, hermafrodit • velikost omezená, žádné fluktuace N • náhodné oplození • kompletní izolace (žádný tok genů) • diskrétní generace • žádná věková struktura • žádná selekce • rozptyl výběru gamet do další generace ® Poissonovo rozdělení Wrightův-Fisherův model: http://blog.uvm.edu/cgoodnig/files/2014/05/Sewall_Wright.jpg http://www.economics.soton.ac.uk/staff/aldrich/fisherguide/Doc1_files/image001.gif Sewall Wright Ronald A. Fisher l = 2 Sortování linií ve WF modelu: http://blog.uvm.edu/cgoodnig/files/2014/05/Sewall_Wright.jpg http://www.economics.soton.ac.uk/staff/aldrich/fisherguide/Doc1_files/image001.gif Sewall Wright Ronald A. Fisher Koalescence_1_c.tif čas http://blog.uvm.edu/cgoodnig/files/2014/05/Sewall_Wright.jpg http://www.economics.soton.ac.uk/staff/aldrich/fisherguide/Doc1_files/image001.gif Sewall Wright Ronald A. Fisher Koalescence_1_c.tif čas Sortování linií ve WF modelu: http://blog.uvm.edu/cgoodnig/files/2014/05/Sewall_Wright.jpg http://www.economics.soton.ac.uk/staff/aldrich/fisherguide/Doc1_files/image001.gif Sewall Wright Ronald A. Fisher čas Sortování linií ve WF modelu: http://blog.uvm.edu/cgoodnig/files/2014/05/Sewall_Wright.jpg http://www.economics.soton.ac.uk/staff/aldrich/fisherguide/Doc1_files/image001.gif Sewall Wright Ronald A. Fisher Koalescence_1_c.tif čas lineage sorting Sortování linií ve WF modelu: Koalescence: John F.C. Kingman [JFC Kingman in 2002] Koalescence_2_c.tif čas současná generace John F.C. Kingman [JFC Kingman in 2002] čas koalescence Koalescence: John F.C. Kingman [JFC Kingman in 2002] Koalescence_2_c.tif čas koalescence Koalescence: John F.C. Kingman [JFC Kingman in 2002] Koalescence_2_c.tif čas MRCA Koalescence: MRCA = nejbližší společný předek (most recent common ancestor) Koalescence_1_c.tif John F.C. Kingman [JFC Kingman in 2002] čas nevíme, kolik kopií bylo v generaci MRCA Koalescence: John F.C. Kingman [JFC Kingman in 2002] Koalescence_2_c.tif čas MRCA nevíme, co bylo před MRCA Koalescence: Koalescence3 N = 20 kopií v populaci n = 5 kopií ve vzorku většinou n << N iStock_5308392Small_Cockroach.jpg iStock_5308392Small_Cockroach.jpg iStock_5308392Small_Cockroach.jpg iStock_5308392Small_Cockroach.jpg iStock_5308392Small_Cockroach.jpg Pravděpodobnost setkání 2 švábů je n(n – 1)/4N, kde n = počet švábů v krabici, N = počet „míst“ v krabici iStock_5308392Small_Cockroach.jpg iStock_5308392Small_Cockroach.jpg při koalescenci se počet švábů (kopií) sníží o 1 ... iStock_5308392Small_Cockroach.jpg iStock_5308392Small_Cockroach.jpg iStock_5308392Small_Cockroach.jpg iStock_5308392Small_Cockroach.jpg iStock_5308392Small_Cockroach.jpg iStock_5308392Small_Cockroach.jpg iStock_5308392Small_Cockroach.jpg iStock_5308392Small_Cockroach.jpg s tím, jak klesá počet švábů (n), roste čas k dalšímu kontaktu (koalescenci) při koalescenci se počet švábů (kopií) sníží o 1 ... iStock_5308392Small_Cockroach.jpg ... až nakonec zůstane jen 1 kopie n f(n) rozdělení času mezi koalescencemi je přibližně exponenciální: s tím, jak klesá počet kopií (n), roste čas k další koalescenci*) *) viz počet švábů v krabici n = 2 n = 3 n = 4 John F.C. Kingman [JFC Kingman in 2002] čas Kingmanova koalescence: vždy max. jedna koelascence za generaci zanedbáváme koalescenci > 2 kopií střední hodnota doby ke koalescenci, která generuje n – 1 kopií = 4N/[n(n – 1)] sleduje exponenciální rozdělení pravděpodobnost, že dvě kopie splynou v následující generaci = identita původem díky rodokmenovému inbreedingu = 1/2NeF pro diploidní gen obecně 1/xNeF, kde x = ploidie pravděpodobnost, že v té době nedojde ke koalescenci = 1 – 1/xNeF Þ pravděpodobnost koalescence před t generacemi = Pr[žádné koalescence pro prvních t – 1 generací] ´ Pr[koalescence v gen. t] pro diploidní gen: průměrná doba ke koalescenci 2 kopií = čas od jedné koalescence ke druhé se řídí geometrickým rozdělením, které se dá aproximovat exponenciálním Þ střední hodnota času do příští koalescence: s každou koalescencí se počet kopií sníží o 1, tj. Þ proces koalescence se postupně zpomaluje doba koalescence MRCA všech n kopií pro n = 2 ® t = 2N pro velká n ® t » 4N (obecně t » 2xN) splynutí posledních k kopií zabere generací Þ prvních 90 % kopií splyne během 9 % celkového času, zbývajících 91 % času se čeká na splynutí posledních 10 % kopií! jestliže máme 100 kopií ve vzorku, pravděpodobnost, že přidáním 101. kopie dospějeme k hlubšímu kořenu, je pouze 0,02% Þ přidání další genové kopie pravděpodobně nepovede ke starší koalescenci Koal_Simtree2 Koal_simtree přidání dalších sekvencí pravděpodobně nepovede k hlubší koalescenci ... s klesajícím počtem volných kopií se proces zpomaluje ... Koalescence5 50 genových kopií, 10 náhodně vybraných: v tomto případě 10 kopií stačilo k nalezení nejhlubšího kořene koalescenčního stromu Pokud nás zajímají „staré“ koalescence, nepotřebujeme velké vzorky např. pouhé 2 kopie poskytují v průměru 50 % koalescenčního času pro celou populaci! Naopak pokud nás zajímá čas do první koalescence z n na n – 1, odhad NeF/[n/(n – 1)] je citlivý vůči n např. rozptyl průměrné doby první a poslední koalescence pro 10 genů je 0,0444NeF až 3,60NeF; zvýšením n na 100 genů, rozmezí bude 0,0004NeF – 3,96NeF Z toho plyne, že pro odhady starých evolučních genových událostí stačí malé vzorky, pro odhady recentních událostí jsou velké vzorky nezbytné zvýšením n 10´ se rozdíl zvýší 100´ ... ... pro poslední koalescenci prakticky žádný rozdíl Koalescence pro různé typy ploidie: střední hodnota času koalescence (viz výše) pro velká n = 2xNeF (pro 2 kopie = 2NeF) autozomální lokus: 4NeF chr. X (při poměru pohlaví 1:1 ® x = 1,5): 3NeF mtDNA, chr. Y (při poměru pohlaví 1:1): NeF ALE: u savců většinou rozptyl reprodukční úspěšnosti samců > samic Þ NeF samců < NeF samic Z toho plyne, že ke koalescenci Y dochází dřív než u mtDNA a mnohem dřív než u ostatních lokusů (srv. mitochondriální Eva ´ Y-Adam) Př.: časy koalescence pro 12 autozomálních genů, 11 genů na X, mtDNA a Y u člověka (Templeton 2005): divergence šimpanz-člověk » 6 MY (tj. 12 MY celkem) chr. Y – nejkratší koalescence autozomy – nejdelší koalescence velký rozptyl koalescenčních časů – koalescence jsou náhodné (srv. drift)! rozptyl času k MRCA úměrný NeF2, tj. s2 >> průměr Ještě jednou Buriho experiment (Buri 1956): fixace rozprostřeny od 4. generace po konec experimentu většina linií v 19. generaci teprve čeká na fixaci Přes identické podmínky velký rozptyl fixací; v přírodě jen 1 „experiment“ ® musíme očekávat velkou „chybu“ v odhadech koalescencí, která nezávisí na velikosti vzorku ani na dalších typech chyb! Čas a koalescence: V základní podobě je čas koalescencí měřen v jednotkách N generací pokud existují rozdíly mezi příslušníky populace z hlediska jejich reprodukční úspěšnosti (rozptyl 0 < s2 < ¥), ale velikost populace je pořád stejná, koalescenční proces je měřen v jednotkách N/s2 generací Vyšší rozptyl reprodukční úspěšnosti vede k rychlejším koalescencím (nižší Ne) Lineární změnou časové škály můžeme vzít v úvahu např. nediskrétní generace, oddělená pohlaví, odlišné systémy páření atd. Þ můžeme využít i na reálné organismy Při aplikaci na reálné organismy ale potřebujeme nezávislé odhady Ne, s2 (popř. dalších parametrů) tyto odhady nejsou vždy k dispozici, navíc jsou zdrojem další chyby (např. divergence sekvencí, datování fosilního záznamu, odhad generační doby atd.) Navíc odhady koalescenčních časů často ignorují evoluční nahodilost fixačního/koalescenčního procesu (viz výše) – použité metody vycházející z NT jsou založeny na mezidruhové divergenci, tzn. považují fixaci alel za náhlý proces, který tím pádem nepřispívá do celkového rozptylu odhadu. Např. odhad koalescence mtDNA člověka » 290 000 let ® vzhledem k rozptylu spojenému s molekulárními hodinami a koalescenčním procesem*) 95% CI = 152 000 – 473 000 let (tj. > 300 000 let!)**) *) ignorujeme výběrovou chybu (sampling error), chybu měření (measurement error) a ne zcela přesně známou mutační rychlost m Þ ve skutečnosti by byl konfidenční interval mnohem větší **) rozptyl v časech fixací/koalescencí způsobený driftem nelze odstranit jednoduše zvýšením velikosti vzorku (n), protože populace představují pouze jednu realizaci evolučního procesu (můžeme ale použít víc lokusů) Při datování evolučních událostí pomocí vnitrodruhové molekulární variability bychom si měli být těchto skutečností vědomi! Koalescence_5.jpg Koalescence_6.jpg Koalescence a neutrální mutace: Jestliže m je velmi malé a NeF velmi velké, můžeme výskyt obou jevů během jedné generace zanedbat. Pokud jdeme zpět v čase, dokud 2 kopie buď nesplynou, nebo jedna z nich nezmutuje, pak pravděpodobnost , že k mutaci došlo dřív než ke koalescenci, je Pr[mutace před koal.|mutace, nebo koal.] » kde q = 4NeFm podmíněná pravděpodobnost Koalescence a neutrální mutace: » očekávaná heterozygotnost při náhodném oplození – jestliže dojde k mutaci před koalescencí, pak obě kopie musí reprezentovat odlišné alely (infinite-alleles model) Þ Při pohybu v čase dopředu i zpět je dopad rovnováhy driftu a mutace na genetickou variabilitu stejný. III.11.tif Vliv změn velikosti populace na tvar koalescenčního stromu rostoucí populace: koalescence se postupně zpomalují zmenšující se populace: koalescence se postupně zrychlují Ne = 100 Ne = 10 Ne = 25 360 gen. 90 gen. 36 gen. n = 10 Koalescence a tok genů: 10.12.jpg Slabá migrace vede k většině koalescencí uvnitř lokálních populací,.... .... k prodloužení času k MRCA a zvýšení jeho rozptylu. MRCA 10.14.jpg Koalescence a rekombinace: více podrobností viz Selekce_tree neutrální recentní balancující selective sweep Vliv selekce na tvar koalescenčního stromu pozitivní selekce vede ke dřívější koalescenci balancující selekce vede k pozdější koalescenci