Analýza populační struktury Hierarchická populační struktura Druh → populace → subpopulace (demy) • lokusy používané pro analýzu populační struktury jsou neutrální vůči selekci • množství adaptivní variability koreluje s neutrální variabilitou • popsáno mnoho výjimek (rozdíly v subpopulacích - neutrální vs. adaptivní) Hierarchická populační struktura Druh → populace → subpopulace (demy) • Jak je variabilní daná populace a jaká je její efektivní velikost (neutrální genetická teorie: He=4N[e]µ/[4N[e]µ+1]) • Nachází se daná populace v období demografické expanze nebo poklesu? • Existuje mezi dvěma subpopulacemi bariéra toku genů a jak je silná? Jaká je prostorová genetická struktura? • Vyskytují se v populacích imigranti nebo jejich potomci (hybridi)? Diploidní single-locus markery (mikrosatelity) Velké množství populačně-genetických programů Účel populačně-genetické analýzy • Vnitropopulační variabilita (popis získaných dat) Polymorfismus • podíl polymorfních lokusů (znaků) – 95 % nebo 99 % (např. 0,8 = 4 z pěti zkoumaných mikrosatelitů mají v populaci alespoň 2 alely, z nichž ta vzácnější dosahuje frekvence alespoň 1% nebo 5%) Počet alel (number of alleles) • počet alel na lokus Alelická bohatost (allelic richness) • počet alel na lokus vztažený k velikosti vzorku (metodou „rarefaction“) Pozorovaná heterozygotnost (observed heterozygosity) • průměrná četnost heterozygotů v jednotlivých lokusech Použití údajů o genetické variabilitě • neutrální genetická teorie: He=4N[e]µ/[4N[e]µ+1] • mutation-drift equilibrium [• ]srovnání různých populací a jejich N[e] ... nemusí to být pravda • vliv historického vývoje populací („bottlenecks“) • Northern elephant seals Mirounga angustirostrus – 120 000 jedinců – 50 allozymových lokusů – žádná variabilita Indian rhinoceros • 29 allozyme loci – výrazně vyšší variabilita než byla očekávána • ještě nedávno až 100 000 nosorožců v Nepálu a Indii • 1960 – 60-80 jedinců v Nepálu • 1980 – nárůst populace na několik set – max. 2 alely na lokus • méně intenzivní bottleneck (H[o] odpovídá historické N[e]) Hardy-Weinbergova rovnováha (HWE) Předpoklady HWE • random mating (panmixia) • negligible effects of mutation and migration („closed populations“) • infinitely large population size • Mendelian inheritance • no selection • check for linkage disequilibrium (vazebná nerovnováha) Odchylky od HW rovnováhy • Test HWE – nejlépe Genepop („exact probability tests“) – pokud jsou odchylky, tak některý předpoklad HWE nebyl splněn • nadbytek heterozygotů = negativní asortativní páření (tj. cílené rozmnožování nepodobných jedinců) – použité lokusy mohou být výhodné v heterozygotním stavu (např. geny MHC) • nedostatek heterozygotů • inbreeding (postihuje všechny lokusy stejně) • nulové alely (jen na některých lokusech bude deficit heterozygotů) Detekce bottlenecku • Při bottlenecku vymizí nejdříve vzácné alely – Alely rozděleny do kategorií podle frekvence – Relativní nedostatek alel s nízkou frekvencí → bottleneck • Zvýšená heterozygotnost – program BOTTLENECK – Nutný předpoklad mutačního modelu (SSM, TPM, IAM) – Testuje „mutation-drift equilibrium“ • Bayesiánský přístup (založen na koalescenční teorii) – Detekce bottlenecku i expanze – Předpoklad rovnováhy – Vhodné při dlouhodobějších změnách – Markov chain Monte Carlo simulations – Beaumont M. – např. program MSVAR Bottleneck • Při bottlenecku → redukce počtu alel → ovlivnění heterozygotnosti není tak rychlé → více heterozygotů než by vyplývalo z populačního modelu (IAM, TPM, SMM) • Nutno definovat model, nepředpokládám HW rovnováhu • Program BOTTLENECK • Strnadi • Záleží na zvoleném modelu • Ale SMM asi neplatí stoprocentně Otters in central Europe • strong decline of population numbers in last century • fragmentation of distribution area 2. Analysis of population subdivision (mezipopulační variabilita) Hierarchická populační struktura Druh → populace → subpopulace (demy) • lokusy používané pro analýzu populační struktury jsou neutrální vůči selekci • klasický populačně-genetický přístup = jednotlivé populace jsou předem známy (např. chceme zjistit úroveň genetických rozdílů mezi dvěma lokalitami) Genetická struktura populací drift, mutace a migrace • Drift → diferenciace subpopulací díky fixaci alternativních alel • Mutace mohou zvýšit diferenciaci (odlišit subpopulace) ale riziko homoplázií • Diferenciaci „pokazí“ migrace 1 migrant na generaci může stačit k setření rozdílů! Genetická struktura populací drift, mutace a migrace Vliv populační struktury na heterozygotnost • Extrémní příklad • Dvě izolované subpopulace s fixovanými alelami • Subpopulace v HW, celkově v populaci však nedostatek heterozygotů Wahlundův princip (isolate breaking) • Pokles homozygotnosti při sloučení subpopulací Jak zjišťovat strukturovanost populací? F-statistika [• ]Wright, Nei F[IS], F[ST], F[IT] • Popisují heterozygotnost (odchylky od HW) na různých měřítkách Odhad vlivu populační struktury na genetický make-up populace Koncept heterozygotnosti F statistiky Výpočet F statistik - příklad F-statistika • F[IS] snížení heterozygotnosti v lokální subpopulaci vysoké hodnoty – inbreeding • F[IT] souhrnná hodnota, heterozygotnost v celé populaci • F[ST] míra „rozdělenosti“ = snížení toku mezi subpopulacemi Vliv driftu – fixuje odlišné alely v subpopulacích Hodnoty F[ST] • 0 – 0.05 malá diferenciace (zanedbatelná) • 0.05 – 0.15 střední • 0.15 – 0.25 velká • > 0.25 velmi velká Emberiza citrinella Lee et al. 2001 [• ]7 mikrosatelitových lokusů, F[ST] • Průkazné rozdíly mezi populacemi • Ve Velké Británii není panmiktická populace Populační cykly hrabošovitých hlodavců (Berthier et al. 2006) • Výrazné cyklické změny v početnosti populací – střídají se období „izolovanosti“ s „kontinuálním rozšířením“ G[ST ](Nei 1973) [• ]Analogie F[ST] [ ] • Haploidní (haplodiploidní) organismy, sekvence mtDNA • Počítá s „gene diversity“ místo heterozygotnosti • Pracuje tedy jen s frekvencemi alel, ne s procentem heterozygotů [ ] Myotis bechsteinii Kerth et al. 2002 • Letní kolonie samic (15-40 jedinců) • Vzorky - jen ♀♀ • Nukleární i mitochondriální mikrosatelity • ♀♀ filopatrie • ♂♂ disperze R[ST] [• ]Obdoba F[ST] • Pracuje však s velikostí alel (počet repeatů u mikrosatelitů) • Předpoklad známého mutačního modelu jen při platnosti SMM (stepwise mutation model) • „Paměť“ mutací v minulosti • R[ST]>F[ST][ ]větší vliv mutací • R[ST]=F[ST][ ]větší vliv driftu [ ] • Potvrzení významnosti rozdílu randomizačními testy (Hardy et al. 2003, program SPAGeDi 1.1) Lagopus lagopus scoticus Piertney et al. 1998 a 2000 • Mikrosatelity a mtDNA [• ]R[ST], AMOVA[] • NcDNA strukturovanost • mtDNA není strukturovanost • Filopatrie samců, disperze samic, průkazný vztah R[ST] a vzdálenosti Bombus pascuorum Widmer & Schmid-Hempel 1999 Neighbour-joining PC1 z alelických frekvencí vs. zeměpisná délka AMOVA Excoffier et al. 1992 • Analýza Molekulární Variance [• ]Analogie R[ST ]a spojení s ANOVA[] [ ] • Analýza variance alelických frekvencí (již dříve Cockerham & Weir 1987,1993) • Započítává se ale rozdílnost (mutace) alel • Φ[ST ],[ ]Program ARLEQUIN (umí i F[ST]) [ ] • Data: sekvence mikrosatelity (jen při platnosti SMM stepwise mutation model) AMOVA a F statistika popis výsledku nikoliv příčin → možná alternativní vysvětlení Modely toku genů (alel) • Island model (Wright) Stejně velké subpopulace Symetrický tok genů Stejná pravděpodobnost výměny mezi jakýmikoliv subpopulacemi • Stepping-stone model (Kimura) Výměna jen mezi sousedními subpopulacemi • Isolation by distance Tok slábne se vzrůstající vzdáleností subpopulací Isolation by distance • rozumné geografické měřítko (závisí na schopnosti disperze) • musí být ustanovena rovnováha mezi migrací a driftem • IBD (isolation-by-distance) nebude – u velmi recentně izolovaných populací – u zcela izolovaných populací – při značné migraci Isolation by distance Crotaphytus collaris Hutchinson & Templeton 1999 Tok genů – metody Nm = počet migrantů / subpopulace / generace Jde o hrubý odhad ve škále: málo, středně, hodně! • Privátní alely (Slatkin) Alely vyskytující se jen v jedné subpopulaci p(1) frekvence privátních alel lnp(1) = -0,505 ln(Nm) - 2.44 • F statistika Co ale rozhodně NE! • Dvě hodně vzdálené populace [• ]F[ST] [ ] [ ] • Vyjde nenulové Nm • → v minulosti došlo k výměně jedinců • I populace, které si nikdy nevyměnily migranty mohou mít nenulové Nm. Odobenus rosmarus Andersen et al. 1998 • Mikrosatelity • Nejvíce izolované SZ Grónsko • Nízké hodnoty FST (okolo 0.05) • Několik migrantů za generaci (asi 4) • Shodně vyšla i mtDNA Aquila adalberti Martínez-Cruz et al. 2004 • Mikrosatelity (a mtDNA), F[ST], GENETIX, GENEPOP • Průkazné rozdíly, hlavně Doňana a zbytek • Průkazně vyšlo Isolation by distance • Asi rychlý drift, malé N[e], rozdíly v reprodukčním úspěchu Shrnutí • Klasické fixační indexy (F[ST]) – Značně robustní – Mutačního model není nutný – Nutno mít rozumnou škálu (geografickou vzdálenost) • AMOVA – Jemnější rozlišení – Možno použít i na sekvence (např. mtDNA) – Předpoklad modelu (SMM) – Platnost modelu většinou není známa Genetika metapopulací • Jednoduchá populační struktura vs. metapopulace → populační genetika • stabilní vs. nestabilní populačně-genetický pattern AMOVA Excoffier et al. 1992 • Analýza Molekulární Variance [• ]Analogie ANOVA na molekulární data[] [ ] • Analýza variance alelických frekvencí (již dříve Cockerham & Weir 1987,1993) • Započítává se ale rozdílnost (mutace) alel • Φ[ST ],[ ]Program ARLEQUIN (umí i F[ST]) [ ] • Data: sekvence mikrosatelity (jen při platnosti SMM stepwise mutation model) Atlantic salmon – Sainte Marguerite river (Quebec) (Garant et al. 2000) • výrazná populační struktura mezi řekami • v rámci jedné řeky – různé mikrohabitaty obývané (1) demy nebo (2) metapopulacemi? • dvouleté sledování, mikrosatelity, hierarchická AMOVA • lokálně adaptované demy, ale i metapopulace (např. po povodních je mikrohabitat obsazen náhodně a ne jedinci z původního demu) • long-term (stable) vs. short-term (metapopulations) struktura Který typ metapopulační struktury? • ad a) Cristatella mucedo - Bryozoa (Freeland et al. 2000) – long-distance migration (birds), no IBD, 5 ms for clone identification • black rats in Senegal – transport by traffic (no isolation-by-distance in genetic differentiation) ad b) Mainland-island model • Bufo calamita (Rowe et al. 2000) – různé rybníky mají různý reprodukční úspěch • klasické subpopulace (Area 1) i metapopulace (Area 2); křížek – vyšší tok genů než by se předpokládalo (jsou v nich obsaženy vysoce úspěšné rybníky = „mainland“) 3. Population assignments Klasické problémy populační genetiky • Populace dány, jedinci předem zařazeni do populací, zajímají nás vlastnosti populací (F-statistiky) → ad (1) nebo (2) • Populace sice definovány, ale chceme k nim přiřadit jedince neznámého původu • Kryptická populační struktura = předem není dáno nic → chci zjistit klastry (tj. přirozené populace) a rozřadit individua do klastrů (population assignments) Unraveling migratory connectivity A. Direct methods • morphological variation (geographical races) • leg-bands or similar markers (ex. over one million Ficedula hypoleuca have been ringed in UK and Sweden – only six recaptured on wintering grounds in Africa • satellite telemetry – expensive, not useful for small animals C. Genetic approaches • « very few birds have bands, but all have genotypes » • genetic data on population structure • problems: (1) week genetic differentiation among populations (widespread dispersal), (2) lack of differentiation in northern temperate zone – recent postglaciation expansion • solution: (1) more genetic markers, (2) study of avian parasites DNA Useful (and used) genetic markers • mtDNA – smaller efective population size, population specific markers arise quickly, often fixed differences • microsatellites – pronounced polymorphism; rare in the avian genome • dominant nuclear markers (RAPD, AFLP) – almost infinite number of markers Population assignment tests Individual-based assignments • Kryptická populační struktura • Neznámý počet skupin (klastrů) • Úroveň jedince • Vytvořit klastry a současně k nim přiřadit jedince • K dispozici máme individuální genotypy (případně i souřadnice) • Data: msat (jiné kodominantní lokusy, Alu), AFLP • Therein lies the fundamental difference between phylogeographic and theoretical population genetic thinking: phylogeographic studies traditionally assume that ancestral history can be directly deduced from estimated gene trees, whereas population genetic theory asserts that gene trees are random outcomes of stochastic population-level processes. Bayesian clustering approach STRUCTURE - Pritchard et al. 2000 • Neznámý počet populací charakterizovaných různými frekvencemi alel → počet populací a frekvence zjišťuji • Současně přiřazuji individua do populací • Lokusy, které nejsou ve vazbě, HW uvnitř subpopulací (např. mikrosatelity, SNPs) • Možno předem zahrnout geografickou polohu individuí • Model se snaží vyložit HW nebo vazebnou nerovnováhu zavedením populační struktury • Místo přímého výpočtu – odhad pomocí Markov chain Monte Carlo Turdus helleri • Fragmenty deštného pralesa • Lokality Chawia, Ngangao, Mbololo, Yale (Kenya) • 7 mikrosatelitových lokusů • Neighbour-joining • * špatně zařazení jedinci Program STRUCTURE - Bayesiánský přístup Stanovení počtu „přirozených“ subpopulací 4. Spatially explicit analyses = spatial genetics = landscape genetics • vychází z Bayesian clustering approach (typu STRUCTURE) – individual-based models • do modelování genetické informace přidává i geografické koordináty • např. programy BAPS, TESS, Geneland (automaticky stanovují nejlepší počet populací K) Spatial models – tesselation, Voronoi polygons Př.: Geneland