Analýza mtDNA 1) Jak to, že máme společného předka 2) Metodika výzkumu mtDNA 3) Analýza mtDNA – mitochondriální Eva, kdy a kde žila Hledání našeho společného předka Jak to, že máme společného předka? • každý máme dva společné předky v předchozí generaci = rodiče • v další generaci 4 (babičky a dědečky, prarodiče) a v další již 8 (prababičky a pradědečky, praprarodiče), atd. • počet předků v generaci n je tedy 2n • pokud bychom sledovali například 40. generaci (asi 1000 let zpátky), pak by předků bylo v této 40. generaci 240 = 1,09 x 1012 • tolik lidí však ještě na planetě Zemi ani nežilo (dnes žije asi 7,0 x 109) Hledání našeho společného předka místo 24 = 16, je to jen 14 • ve skutečnosti, čím více jdeme zpátky, tím je pravděpodobnější, že nějací dva mí předci si byli příbuzní a tím se počet předků snižuje, např. • čím jdeme více do historie, tím častěji budeme narážet na příbuzenská propojení a počet předků se tak bude dál a dál výrazněji snižovat Hledání našeho společného předka • ovšem hledat příbuznost studiem všech předků v rodokmenu např. studiem jaderné DNA by bylo velmi složité – každý jedinec dostane polovinu genetické informace od své matky a otce a stejně tak oni mají polovinu od své matky a otce atd. Hledání našeho společného předka • proto k těmto studiím s výhodou využíváme mtDNA, kterou každý jedinec získává jen od matky (modrá kolečka) a nebo chromozom Y, který dědí pouze synové od svých otců (žluté čtverečky) • počet takto studovaných příbuzných se nám výrazně zmenší Hledání našeho společného předka • Andy a Alice tak mají, co se týče mtDNA, pouze jediného předka – neboli jejich společným předkem je Diana, žijící před třemi generacemi • obdobná situace u rozsáhlejšího rodokmene méně příbuzných jedinců 1) Jak to, že máme společného předka 2) Metodika výzkumu mtDNA 3) Analýza mtDNA – mitochondriální Eva, kdy a kde žila Analýza mtDNA Hledání našeho společného předka Mitochondriální DNA (mtDNA) člověka • součástí mitochondrií • kruhová molekula DNA o průměrné velikosti 16 569 pb, dnes známe kompletní sekvenci • 5-10 molekul v jedné organele, 1 000 až 10 000 mitochondrií v buňce • 37 různých genů, dědí se jako celek • neprobíhá rekombinace, mění se pouze procesem mutace • vysoká mutační rychlost (až 10násobná oproti jaderné DNA) • maternální dědičnost Hledání našeho společného předka • maternální dědičnost výrazně zmenší počet studovaných příbuzných Hledání našeho společného předka • stejně tak se přenos zastaví, pokud Alice bude mít pouze syny • Andy a Alice, mají pouze jediného předka – neboli jejich společným předkem je Diana, žijící před třemi generacemi • v další generaci se mtDNA tohoto společného předka bude předávat už pouze v rodokmenu Alice, protože Andy jako muž mtDNA do dalších generací nepředává Hledání našeho společného předka • některé mtDNA linie tak zanikají a jiné se přenáší dál a „pomnožují“ • díky tomu při pohledu ze současnosti do minulosti sledujeme tzv. koalescenci = = splývání linií mtDNA • systém zanikání a splývání mtDNA linií ukazuje následující obrázek • vzhledem k tomuto postupnému zanikání a předávání mtDNA pouze přes ženskou linii, jsme nakonec schopni v daleké minulosti dospět až k jediné ženě – společnému předku, jejíž mtDNA se přenášela nejdéle – „pramáti Eva“ Hledání našeho společného předka • simulaci začínáme někde v minulosti se čtyřmi ženami – Amandou, Alexis, Anne a Alicí • každé se narodí dvě děti (C-chlapec, D-děvče) 2 děti pravděpodobnost25 % 2C 25 % 2D 25 % 1D+1C 25 % 1D+1C • mtDNA Ann zaniká – má pouze chlapce • u ostatních žen se přenáší do další generace, protože mají alespoň jedno děvče současná generace Hledání našeho společného předka • v každé generaci se pak situace opakuje • po šesti generacích vidíme, že se zachovala mtDNA pouze Alice, jejíž potomci měli v každé generaci alespoň jednu dceru • u Grace, Giny, Gabriely a Gertrudy nalezneme „stejnou“ mtDNA jakou měla Alice současná generace Hledání našeho společného předka • zachovala se pouze mtDNA Alice, přičemž pomocí mtDNA můžeme zjistit, že nejbližším společným předkem Grace, Giny, Gabriely a Gertrudy byla Dawn (MRCA – most recent common ancestor) současná generace Hledání našeho společného předka • avšak to, že mají Grace, Gina, Gabriela a Gertruda „stejnou“ mtDNA jako Dawn nebo Alice není ve skutečnosti úplně pravda (ani být nemůže, protože pokud by přežila do současnosti mtDNA jediné ženy, pak bychom dle tohoto postulátu měli všichni stejnou mtDNA) • ve skutečnosti se jejich mtDNA navzájem liší – např. mtDNA Gertrudy a Gabriely jsou si podobnější než je jejich mtDNA podobná k mtDNA Grace • to, čím se mtDNA těchto žen liší, jsou náhodné mutace, které v ní vznikly • jakmile se tedy objeví v mtDNA nějaká mutace, tato je pak dále předávána v dané linii • čím je tato linie starší, tím více mutací se v ní nahromadí Hledání našeho společného předka Kde v mtDNA mutace hledáme: • kódující region x kontrolní region HVR (regulace replikace mtDNA, HVSI a HVSII) • kódující region – lze analyzovat pomocí RFLP, specifickou sadou restrikčních enzymů • kontrolní region – variabilita studována přímým sekvencováním Hledání našeho společného předka Co v mtDNA zkoumáme: • některé mutace se předávají na potomky vždy spolu = haplotyp = určují tedy dědičnou linii • některé haplotypy jsou si podobnější (sdílejí stejné mutace) a ukazují na společného příbuzného předka – tyto haplotypy se sdružují do tzv. haploskupin Lze si to přiblížit na analogii se značkou aut: • na světě existuje mnoho automobilek – Škoda, Ford, Honda apod. • každá vyrábí mnoho různých modelů – např. Škodovka – Fabia, Octavia; Honda – Civic, Acord = tyto modely představují jednotlivé haplotypy • některá tato auta různých značek jsou vybavena například klimatizací nebo GPS navigací (nesou podobné mutace) – jsou si tedy v tomto podobnější a tvoří haploskupiny (např. malé vozy x limuzíny) Haplotypy x haploskupiny Hledání našeho společného předka Haplotypy x haploskupiny Hledání našeho společného předka Haplotyp • sestava mutací • podobnější haplotypy sdílejí příbuznější jedinci větší příbuznost menší příbuznost Haploskupina • příbuzné haplotypy sdílejí stejné nebo podobné sestavy mutací • tvoří haploskupinu • mají svůj geografický původ (vzhledem k původnímu předkovi) Hledání našeho společného předka • na základě haplotypů a haploskupin jsme schopni určit, ke které linii daní jedinci náleží (hledáme příbuznost na základě rozdílů a podobností) = identifikace společného předka • již víme - selekčně neutrální mutace – v čase se hromadí konstantní rychlostí = molekulární hodiny • podle počtu těchto mutací lze také odvodit stáří sledované linie, předka Hledání našeho společného předka Haplotypy x haploskupiny Hledání našeho společného předka • ukážeme si na příkladu tří žen – Alice, Betty a Cindy, u nichž známe část nějaké sekvence mtDNA a víme, že se liší mezi sebou v jednom nukleotidu Alice (A) Betty (G) Cindy (A) • existují tři možnosti (vývojové stromy), které ukazují, jak k těmto odlišnostem (mutaci) mohlo dojít • stanovit podobnost (příbuznost) mezi jedinci na základě rozdílů v sekvenci nemusí být vždy úplně jednoduché (viz následující příklad) Problémy: Hledání našeho společného předka Alice a Betty jsou si podobnější (příbuznější) než je každá z nich k Cindy Varianta 1 Hledání našeho společného předka Alice a Cindy jsou si podobnější (příbuznější) než je každá z nich k Betty Varianta 2 Hledání našeho společného předka Betty a Cindy jsou si podobnější (příbuznější) než je každá z nich k Alici Varianta 3 Hledání našeho společného předka Který z těchto stromů je nejpravděpodobněji správný? • Alice i Cindy nesou obě stejný nukleotid A, zatímco Betty má ve stejném místě G • první možností je, že v minulosti došlo k jedné mutační události, kdy se pravděpodobně A zaměnil za G nebo naopak G za A • druhou možností je, že již oba nukleotidy jsou mutací nějakého jiného nukleotidu = dvě mutační události Ockhamova břitva – budeme uvažovat jednu mutační událost G Hledání našeho společného předka Který z těchto stromů je nejpravděpodobněji správný? • abychom mohli konstruovat strom, musíme vědět, kdo byl společným předkem všech tří lidí, tak budeme vědět, který nukleotid je původní a který je mutovanou formou • jak to můžeme zjistit – nejvhodnější metodou je sekvencování nějaké jiné blízce příbuzné skupiny jedinců („outgroup“) – pro člověka je např. nejvhodnější šimpanz • hypotetické srovnání se šimpanzí DNA nám odhalí, že původní je báze G • v našich třech uvažovaných stromech tedy máme nastaveno, že společný předek všech tří žen měl ve své sekvenci G Hledání našeho společného předka Který z těchto stromů je nejpravděpodobněji správný? • první strom – Alice a Betty mají společného předka, který se odštěpil ze společného předka se Cindy • víme, že původní byl v sekvenci G = muselo zde dojít ke dvěma odděleným mutačním událostem – v obou případech mutoval G na A • pro vysvětlení druhého stromu, kde mají Alice a Cindy společného předka, který vzniknul ze společného předka s Betty, nám postačí jediná mutační událost, která nastala u společného předka Alice a Cindy • u třetího stromu opět potřebujeme dvě mutační události Ockhamova břitva nám říká, že nejpravděpodobnější je to jednodušší, tedy strom č. 2 Hledání našeho společného předka • takto však ve skutečnosti nepostupujeme, změna jediné báze v jedné sekvenci je málo informativní – vycházíme z mnoha změn na různých místech a také u většího vzorku jedinců • například pokud bychom analyzovali sekvenční rozdíl v jiné sekvenci, mohl by jako pravděpodobnější vyjít např. strom č. 1 • pokud však budeme uvažovat více sekvencí, pak nám ale geometrickou řadou narůstá počet možných stromů, s nimiž musíme počítat – celková analýza je velmi náročná a složitá např. máme 3 jedince a 3 odlišné sekvence (každá sekvence od jednoho jedince), pak jsou 3 možné stromy, ale při 4 odlišných sekvencích už je počet možných stromů 15 atd. Počet DNA Počet možných sekvencí stromů 3 3 4 15 5 105 6 945 7 10 395 8 135 135 9 2 027 025 10 4 459 425 20 8,2 x 1021 50 2,8 x 1076 Hledání našeho společného předka • většinou však analyzujeme stovky sekvencí – počet možných stromů je pak astronomický např. Linda Vigilant a kol. analyzovali 135 mtDNA sekvencí, jejichž rozdíly vedly až k 10267 možných stromů • jakkoliv rozumně velký vzorek nám vždy bude generovat takový počet možných stromů, které nejsme schopni analyzovat ani pomocí moderní výpočetní techniky • avšak byly vytvořeny programy, které umí vyhledat a pracovat se skupinou statisticky nejpravděpodobnějších stromů – nejpoužívanějším je PAUP (Phylogenetic Analysis Using Parsimony, D. Swofford) Hledání našeho společného předka • z pohledu analýzy dat je tu však ještě jeden problém – vícenásobné substituce, kdy v jedné sekvenci proběhne více změn např. u společného předka máme sekvenci CAGT, ale následně došlo ke dvěma záměnám – u jedné linie mutoval A na C a v jiné následné linii A na T = máme tady dvě následovnické linie se sekvencí CCGT a CTGT porovnáme-li tyto dvě linie, vypadá to jakoby šlo o jednu mutační událost – C na T nebo T na C, ve skutečnosti však jde o dvě mutace ve stejném místě – to může vést k podhodnocení výsledků – PAUP a podobné programy však umí tento problém také vyřešit Hledání našeho společného předka Ilustrační příklad: Zcela hypoteticky - víme, že průměrná sekvenční odlišnost mezi žijícími lidmi a kmenem vývojového stromu je 0,45 %. 0,45 % • po úspěšné konstrukci vývojového stromu se dále snažíme odpovědět na otázku: • na základě fylogenetického stromu dokážeme odhadnout počet genetických změn pro každou skupinu, při znalosti průměrné mutační rychlosti na generaci je pak možné lehce dopočítat počet generací ke společnému předku (viz dříve molekulární hodiny, zde aplikujeme uvnitř druhu) Kdy žil společný předek? Hledání našeho společného předka Ilustrační příklad: • pokud je průměrná mutační rychlost 3 % za 50 000 generací, což je 0,00006 % na generaci • pak můžeme odhadnout dobu od společného předka jako 0,45 / 0,00006 = = 7 500 generací • budeme-li uvažovat 28 let na generaci, pak je výsledek 7 500 x 28 = 210 000 let zpátky • výsledek však, jak vidíme, hodně záleží na správnosti hodnot, které do výpočtu vstupují (o tom bude řeč ještě později) Nyní se již můžeme podívat, na co přišli ve svém převratném článku Cann, Stoneking a Wilson (Nature, 1987, „Mitochondrial DNA and human evolution“) 1) Jak to, že máme společného předka 2) Metodika výzkumu mtDNA 3) Analýza mtDNA – mitochondriální Eva, kdy a kde žila Analýza mtDNA Hledání našeho společného předka Co bylo zjištěno – kde a kdy Eva žila • Cann a kol. analyzovali mtDNA 147 lidí (145 izolováno z placenty z USA, Austrálie, Nová Guinea), jako zdroj kromě placenty lze využít také např. vlasy • každý vzorek byl na základě informací příbuzných přidělen do jedné skupiny podle geografického původu - sub-saharská Afrika, kavkazsko (zahrnující Evropu, Severní Afriku a Blízký Východ), Východní Asie, Austrálie (původní obyvatelé) a Nová Guinea (původní obyvatelé) • k analýze použili 12 restrikčních enzymů (průměrně připadlo 370 restrikčních míst na osobu) • v některých případech poskytlo štěpení různých mtDNA shodné výsledky – tyto vzorky proto byly z analýzy vyloučeny = analyzováno tak bylo 133 jedinečných mtDNA • analýza pomocí PAUP, bez systému „outgroup“ pro stanovení kmene stromu (nebyla k dispozici mtDNA šimpanze) Hledání našeho společného předka • získaný strom obsahuje dva významné shluky: 1) zástupci se sub-saharským předkem 2) ostatní regiony včetně Afriky = s největší pravděpodobností byl společný předek z Afriky = druhé vysvětlení je méně pravděpodobnější a vyžadovalo by opakované oboustranné migrace mezi Afrikou a ostatními kontinenty • společný africký předek je však v souladu jak s hypotézou nahrazení, tak i s multiregionálním modelem • dávný africký předek (Homo erectus) je zřejmý v obou modelech • avšak africký model počítá s ještě jedním mladším předkem • oba základní modely se tedy liší názorem na to, jak a kdy k tomu došlo Výsledek 1 • Cann a kol. se na základě odhadu četnosti mutací v mtDNA a sledované variability pokusili o výpočet, kdy došlo k oddělení od tohoto společného předka • vycházeli z rozdílů v četnostech mutací domorodých obyvatel Nové Guineje a Austrálie – kalibrace pomocí archeologických dat, známe dobu, kdy předchůdci kolonizovali tyto světy • vypočítaná četnost je v průměru 2 – 4 % rozdílů za milion let (zhruba odpovídá četnosti změn vypočítané u řady druhů obratlovců) • vypočítali, že společný předek žil před 285 000 lety (2 % na milion let) až 143 000 lety (při divergenci 4 % za milion let) = průměrný odhad tedy je 214 000 let Hledání našeho společného předka Výsledek 2 mtDNA moderních lidí pochází od společného předka, který žil v Africe před zhruba 200 000 lety. ? Co se stalo s mtDNA předků, kteří v té době žili mimo Afriku? • podle všeho byl H. erectus, neanderthalensis aj. zcela nahrazen moderním člověkem bez vzájemného křížení, jinak bychom nalezli nějaké starší stopy v mtDNA = budeme testovat v kapitole „Analýza archaické DNA“ Hledání našeho společného předka mtDNA moderních lidí pochází od společného předka, který žil v Africe před zhruba 200 000 lety. • tento společný předek, žena, začala být nazývána Evou nebo mitochondriální Evou na základě spodobnění s biblickým původem lidí v Evě a Adamovi • avšak pozor, ve skutečnosti neexistovala v té době v Africe pouze jediná Eva, ale těchto Ev, předchůdkyň bylo zcela logicky určitě několik stovek nebo tisíce • z Afriky expandovala řada malých populací, avšak postupem času mtDNA linie ostatních předchůdkyň zanikaly (neměly dcery, zanikaly populace apod.) až se do současnosti zachovala mtDNA té jediné africké předchůdkyně (viz dříve recept na impalí polévku, nebo stejně jako zanikají ženská jména) • každá z dalších (mladších) předchůdkyň nám zanechala část své mtDNA v té naší = můžeme tak provést další dělení podle geografického původu (viz sedm dcer Eviných) a stopovat tak např. postupné osidlování Evropy těmito mladšími předchůdkyněmi současného člověka Hledání našeho společného předka 3 v Africe (haploskupiny L1, L2 a L3) 7 v Asii (odvozené od společné předchůdkyně z Afriky označované jako M: A, B, C, D, E, F a G 9 v Evropě, z toho 7 tzv. hlavních (H - Helena, J – Jasmina, K - Kateřina, T – Tara, U – Uršula, V – Valda a X – Xenie) 4 v Americe – A, B, C, D (nedávné osídlení z Asie) Hledání našeho společného předka Hledání našeho společného předka • přestože řada prací i z nedávné doby (viz dále) potvrzuje získané výsledky, zmíníme si i názory proti africkému původu člověka vycházející z mtDNA Námitky proti modelu nahrazení • rozdělení mtDNA na africkou a neafrickou nemusí odrážet reálné rozdělení populací (neboli geografická asociace tohoto rozdělení nemusí představovat ono následné nahrazení expandující africkou populací) Otázka interpretace genetických stromů (Alan Templeton, 1993, 1997, 1998) 1) získané genetické stromy nemusí odpovídat populačním stromům • avšak řada studií až do současnosti ukazuje na vysokou korelaci mezi genetickými a populačními údaji = námitku lze zamítnout Hledání našeho společného předka 2) odlišnost afrických populací od ostatních nemusí být důsledkem nahrazení, ale příčinou může být omezený genový tok v důsledku prostorové izolace • jsou-li populace příliš vzdálené, neprobíhá genový tok a výsledek vypadá jako při nahrazení jedněch populací jinými Templeton 1997 • omezený genový tok prostorovou izolací je tak příčinou odlišnosti africké populace od ostatních (nikoliv její největší stáří jako původní populace) = Templetonův model omezeného genového toku Hledání našeho společného předka • dle Templetona neexistuje důkaz o expanzi africké populace mimo Afriku • africké stopy přítomné ve všech populacích jsou spíše důsledkem stálého genového toku mezi geograficky blízkými oblastmi v uplynulých několika stech tisících letech (africké znaky se tak do těchto populací rozšířily) Hledání našeho společného předka Templeton (2002) • nové analýzy genetických stromů (kombinuje až 10 různých znaků) ukazují dle něj na několik migrací z Afriky s neustálým genovým tokem • první expanze proběhla před 1,7 miliony let – Homo erectus • druhá vlna před 800 až 400 000 lety a) expanze Homo heidelbergensis (předek Neandrtálce) nebo b) možná migrace jiného předka Neandrtálce a moderního člověka • třetí vlna před asi 150 000 lety Hledání našeho společného předka Templetonovy výsledky svědčící o opakovaném genovém toku (expanze z Afriky a následné křížení) v průběhu posledních 2 milionů let: • podporují africké genetické kořeny = moderní člověk se mohl rozšířit z Afriky, avšak nejen odtud = Eva mohla žít kdekoliv • do jisté míry podporuje multiregionální model – opakované migrace s genovým tokem vedou ke stejnému výsledku, tedy africkému původu, přestože je původ ve skutečnosti multiregionální • plně však nepodporuje ani jeden ze dvou modelů = uznáván jako další model „Out of Africa again and again“ Hledání našeho společného předka V současné době probíhá tzv. „Genographic Project“ (www.nationalgeographic.com/genographic) odkaz Hledání našeho společného předka • cílem je vytvořit celosvětovou, rozsáhlou, veřejně přístupnou databázi mtDNA • u každého vzorku je přímým sekvencováním analyzována oblast HVS-I a dále 22 SNP v kódující oblasti • projekt byl spuštěn začátkem roku 2005 • na začátku se do něj přihlásilo přes 188 000 dobrovolníků a více než 55 000 také zaslalo svoji DNA pro analýzu mtDNA nebo MSY (studium variability chromozomu Y), zatím převládají vzorky z USA a Západní Evropy (95 % databáze) • v polovině roku 2007 (Behar et al., 2007) bylo analyzováno již 78 590 různých mtDNA • spuštěn projekt 2.0 • analyzuje se 750 000* markerů v kompletní DNA • umožňuje popsat vlastní dávnou historii mateřskou, otcovskou • migrační vlny • zjišťuje příměs neandrtálské a děnisovanské DNA • analyzováno již více než 740 000* vzorků DNA * aktualizováno 2016 Hledání našeho společného předka Hledání našeho společného předka Výsledky dalších aktuálních studií mtDNA • Behar et al. - 18 843 kompletních sekvencí mtDNA (z toho je 8 216 z dobrovolnické genealogické databáze Family Tree DNA = zejména západní euroasijský původ) • jako „outgroup“ poprvé použita mtDNA Neandrtálce • stáří společného předka moderního člověka přepočteno na ~ 177 000 let Behar et al., 2012 Hledání našeho společného předka Výsledky dalších aktuálních studií mtDNA • Rieux et al. – využili nejnovější údaje o mutační rychlosti (substitucí), do jejíž výpočtů (vedle lidské a šimpanzí) byla zahrnuta i mutační rychlost stanovená v archaických sekvencích (celkem 146 archaických mitochondriálních genomů) • stáří společného předka moderního člověka přepočteno na ~ 143 000 let (112 000 – 180 000 let) Rieux et al., 2014 Hledání našeho společného předka mtDNA lze použít jako bohatý zdroj genetických informací pro evoluční studie, avšak s nevýhodou studia pouze evoluce ženské části populací. Celkový závěr