Dosud: co se s populací stane v příští generaci? Teď: co předcházelo současnému stavu? Þ „pohled zpět“ Základní premisa populační genetiky: DNA replikuje... ... opakem replikace je koalescence Základní premisa populační genetiky: DNA replikuje... S. Wright R.A. Fisher Wrightova-Fisherova populace: diploidní, hermafroditi velikost omezená, žádné fluktuace N náhodné oplození kompletní izolace (žádný tok genů) diskrétní generace žádná věková struktura žádná selekce rozptyl výběru gamet do další generace*) ® Poissonovo rozdělení *) tj. každý jedinec může přispět 0, 1, 2, 3,…, ¥ gametami http://upload.wikimedia.org/wikipedia/commons/thumb/1/16/Poisson_pmf.svg/360px-Poisson_pmf.svg.png Poissonovo rozdělení » binomické pro velký počet pokusů (n ® ¥) a malou pravděpodobnost jevu (p ® 0) (v praxi n > 30; p £ 1/10, pak l = np) např. mutace http://blog.uvm.edu/cgoodnig/files/2014/05/Sewall_Wright.jpg http://www.economics.soton.ac.uk/staff/aldrich/fisherguide/Doc1_files/image001.gif Sewall Wright Ronald A. Fisher Koalescence_1_c.tif čas Sortování linií ve WF modelu: http://blog.uvm.edu/cgoodnig/files/2014/05/Sewall_Wright.jpg http://www.economics.soton.ac.uk/staff/aldrich/fisherguide/Doc1_files/image001.gif Sewall Wright Ronald A. Fisher Koalescence_1_c.tif čas Sortování linií ve WF modelu: http://blog.uvm.edu/cgoodnig/files/2014/05/Sewall_Wright.jpg http://www.economics.soton.ac.uk/staff/aldrich/fisherguide/Doc1_files/image001.gif Sewall Wright Ronald A. Fisher čas Sortování linií ve WF modelu: http://blog.uvm.edu/cgoodnig/files/2014/05/Sewall_Wright.jpg http://www.economics.soton.ac.uk/staff/aldrich/fisherguide/Doc1_files/image001.gif Sewall Wright Ronald A. Fisher Koalescence_1_c.tif čas lineage sorting Sortování linií ve WF modelu: Koalescence: John F.C. Kingman [JFC Kingman in 2002] Koalescence_2_c.tif čas současná generace čas koalescence Koalescence: John F.C. Kingman [JFC Kingman in 2002] Koalescence_2_c.tif čas koalescence Koalescence: John F.C. Kingman [JFC Kingman in 2002] Koalescence_2_c.tif čas MRCA MRCA = nejbližší společný předek (most recent common ancestor) Koalescence: John F.C. Kingman [JFC Kingman in 2002] Koalescence_1_c.tif čas nevíme, kolik kopií bylo v generaci MRCA Koalescence: John F.C. Kingman [JFC Kingman in 2002] Koalescence_2_c.tif MRCA nevíme, co bylo před MRCA Koalescence: John F.C. Kingman [JFC Kingman in 2002] Koalescence3 N = 20 kopií v populaci n = 5 kopií ve vzorku většinou n << N iStock_5308392Small_Cockroach.jpg iStock_5308392Small_Cockroach.jpg iStock_5308392Small_Cockroach.jpg iStock_5308392Small_Cockroach.jpg iStock_5308392Small_Cockroach.jpg Pravděpodobnost setkání 2 švábů je n(n – 1)/4N, kde n = počet švábů v krabici, N = velikost krabice iStock_5308392Small_Cockroach.jpg iStock_5308392Small_Cockroach.jpg při koalescenci se počet švábů (kopií) sníží o 1 ... iStock_5308392Small_Cockroach.jpg iStock_5308392Small_Cockroach.jpg iStock_5308392Small_Cockroach.jpg iStock_5308392Small_Cockroach.jpg iStock_5308392Small_Cockroach.jpg iStock_5308392Small_Cockroach.jpg iStock_5308392Small_Cockroach.jpg iStock_5308392Small_Cockroach.jpg s tím, jak klesá počet švábů (n), roste čas k dalšímu kontaktu (koalescenci) při koalescenci se počet švábů (kopií) sníží o 1 ... iStock_5308392Small_Cockroach.jpg ... až nakonec zůstane jen 1 šváb (kopie) = MRCA k f(k) n f(n) rozdělení času mezi koalescencemi je přibližně exponenciální: s tím, jak klesá počet kopií (n), roste čas k další koalescenci*) *) viz počet švábů v krabici n = 2 n = 3 n = 4 čas vždy max. jedna koelascence za generaci zanedbáváme koalescenci > 2 kopií střední hodnota doby ke koalescenci, která generuje n – 1 kopií = 4N/[n(n – 1)] sleduje exponenciální rozdělení Kingmanova koalescence: John F.C. Kingman [JFC Kingman in 2002] pravděpodobnost, že dvě kopie splynou v následující generaci = = identita původem = 1/(2NeF) = 1/(2N)*) obecně 1/(xN), kde x = ploidie pravděpodobnost, že v té době nedojde ke koalescenci = 1 – [1/(2N)] Þ pravděpodobnost koalescence před t generacemi = Pr[žádné koalescence pro prvních (t – 1) generací] ´ Pr[koalescence v gen. t] pro diploidní gen: průměrná doba ke koalescenci 2 kopií = *) v ideální populaci, diploidní lokus čas od jedné koalescence ke druhé se řídí geometrickým rozdělením, které se dá aproximovat exponenciálním Þ střední hodnota času do příští koalescence: s každou koalescencí se počet kopií sníží o 1, tj. Þ proces koalescence se postupně zpomaluje počet kopií pro n = 2 ® t = 2N pro velká n ® t » 4N doba koalescence MRCA všech n kopií splynutí posledních k kopií zabere generací Þ prvních 90 % kopií splyne během 9 % celkového času, zbývajících 91 % času se čeká na splynutí posledních 10 % kopií! jestliže máme 100 kopií ve vzorku, pravděpodobnost, že přidáním 101. kopie dospějeme k hlubšímu kořenu, je pouze 0,02% Þ přidání další genové kopie pravděpodobně nepovede ke starší koalescenci Koal_simtree s klesajícím počtem volných kopií se proces zpomaluje ... doba MRCA je vysoce variabilní... drift! Koal_Simtree2 Koal_simtree přidání dalších sekvencí pravděpodobně nepovede k hlubší koalescenci ... Koalescence5 50 genových kopií, 10 náhodně vybraných: v tomto případě 10 kopií stačilo k nalezení nejhlubšího kořene koalescenčního stromu Pokud nás zajímají „staré“ koalescence, nepotřebujeme velké vzorky např. pouhé 2 kopie poskytují v průměru 50 % koalescenčního času pro celou populaci! Naopak pokud nás zajímá čas do první koalescence z n na n – 1, odhad N/[n/(n – 1)] je citlivý vůči n např. rozptyl průměrné doby první a poslední koalescence pro 10 genů je 0,0444N až 3,60N; zvýšením n na 100 genů, rozmezí bude 0,0004N – 3,96N Z toho plyne, že pro odhady starých evolučních genových událostí stačí malé vzorky, pro odhady recentních událostí jsou velké vzorky nezbytné zvýšením n 10´ se rozdíl zvýší 100´ ... ... pro poslední koalescenci prakticky žádný rozdíl Koalescence pro různé typy ploidie: střední hodnota času koalescence (viz výše) pro velká n = 2xNe (pro 2 kopie = 2Ne) autozomální lokus: 4Ne chr. X (při poměru pohlaví 1:1 ® x = 1,5): 3Ne mtDNA, chr. Y (při poměru pohlaví 1:1): Ne ALE: u savců většinou rozptyl reprodukční úspěšnosti samců > samic Þ Ne samců < Ne samic Z toho plyne, že ke koalescenci Y dochází dřív než u mtDNA a mnohem dřív než u ostatních lokusů (srv. mitochondriální Eva ´ Y-Adam) Př.: časy koalescence pro 12 autozomálních genů, 11 genů na X, mtDNA a Y u člověka (Templeton 2005): divergence šimpanz-člověk » 6 MY (tj. 12 MY celkem) chr. Y – nejkratší koalescence autozomy – nejdelší koalescence velký rozptyl koalescenčních časů – koalescence jsou náhodné (srv. drift)! rozptyl času k MRCA úměrný Ne2, tj. s2 >> průměr doba MRCA je vysoce variabilní... Ještě jednou Buriho experiment (Buri 1956): fixace rozprostřeny od 4. generace po konec experimentu většina linií v 19. generaci teprve čeká na fixaci Přes identické podmínky velký rozptyl fixací; v přírodě jen 1 „experiment“ ® musíme očekávat velkou „chybu“ v odhadech koalescencí, která nezávisí na velikosti vzorku ani na dalších typech chyb! Čas a koalescence: V základní podobě je čas koalescencí měřen v jednotkách N generací pokud existují rozdíly mezi příslušníky populace z hlediska jejich reprodukční úspěšnosti (rozptyl 0 < s2 < ¥), ale velikost populace je pořád stejná, koalescenční proces je měřen v jednotkách N/s2 generací Vyšší rozptyl reprodukční úspěšnosti vede k rychlejším koalescencím (nižší Ne) Lineární změnou časové škály můžeme vzít v úvahu např. nediskrétní generace, oddělená pohlaví, odlišné systémy páření atd. Þ můžeme využít i na reálné organismy Při aplikaci na reálné organismy ale potřebujeme nezávislé odhady Ne, s2 (popř. dalších parametrů) Tyto odhady nejsou vždy k dispozici, navíc jsou zdrojem další chyby (např. divergence sekvencí, datování fosilního záznamu, odhad generační doby atd.). Navíc odhady koalescenčních časů často ignorují evoluční nahodilost fixačního/koalescenčního procesu (viz výše) – použité metody vycházející z NT jsou založeny na mezidruhové divergenci, tzn. považují fixaci alel za náhlý proces, který tím pádem nepřispívá do celkového rozptylu odhadu. Např. odhad koalescence mtDNA člověka » 290 000 let ® vzhledem k rozptylu spojenému s molekulárními hodinami a koalescenčním procesem*) 95% CI = 152 000 – 473 000 let (tj. > 300 000 let!)**) *) ignorujeme výběrovou chybu (sampling error), chybu měření (measurement error) a ne zcela přesně známou mutační rychlost m Þ ve skutečnosti by byl konfidenční interval mnohem větší **) rozptyl v časech fixací/koalescencí způsobený driftem nelze odstranit jednoduše zvýšením velikosti vzorku (n), protože populace představují pouze jednu realizaci evolučního procesu (můžeme ale použít víc lokusů) Při datování evolučních událostí pomocí vnitrodruhové molekulární variability bychom si měli být těchto skutečností vědomi! Dosud jsme uvažovali koalescence stejných alel ... Koalescence_2_c.tif ... ve skutečnosti můžeme sledovat jen různé alely ® mutace! Koalescence_5.jpg můžeme sledovat jen změny Koalescence_6.jpg můžeme sledovat jen změny Koalescence a neutrální mutace: Jestliže m je velmi malé a Ne velmi velké, můžeme výskyt obou jevů během jedné generace zanedbat. Pokud jdeme zpět v čase, dokud 2 kopie buď nesplynou, nebo jedna z nich nezmutuje, pak pravděpodobnost , že k mutaci došlo dřív než ke koalescenci, je Pr[mutace před koal.|mutace, nebo koal.] » kde q = 4NeFm podmíněná pravděpodobnost » očekávaná heterozygotnost při náhodném oplození – jestliže dojde k mutaci před koalescencí, pak obě kopie musí reprezentovat odlišné alely (infinite-alleles model) Þ Při pohybu v čase dopředu i zpět je dopad rovnováhy driftu a mutace na genetickou variabilitu stejný. III.11.tif Vliv změn velikosti populace na tvar koalescenčního stromu: rostoucí populace: koalescence se postupně zpomalují zmenšující se populace: koalescence se postupně zrychlují n = 10 Vliv bottlenecku na koalescenci: Koalescence a tok genů: 10.12.jpg genový tok koalescence Slabá migrace vede k většině koalescencí uvnitř lokálních populací,.... .... zároveň ale k prodloužení času k MRCA a zvýšení jeho rozptylu. MRCA 10.14.jpg Koalescence a rekombinace: více podrobností viz vliv selekce na koalescenci viz Selekce