Analýza populační struktury Hierarchická populační struktura Druh → populace → subpopulace (demy) • lokusy používané pro analýzu populační struktury jsou neutrální vůči selekci • množství adaptivní variability koreluje s neutrální variabilitou • popsáno mnoho výjimek (rozdíly v subpopulacích - neutrální vs. adaptivní) Hierarchická populační struktura Druh → populace → subpopulace (demy) • neutrální genetická teorie: He=4N[e]µ/[4N[e]µ+1] • mutation-drift equilibrium ... nemusí to být pravda • vliv historického vývoje populací („bottlenecks“) • Northern elephant seals Mirounga angustirostrus – 120 000 jedinců – 50 allozymových lokusů – žádná variabilita Indian rhinoceros • 29 allozyme loci – vyšší variabilita než byla očekávána • 1960 – 60-80 jedinců v Nepálu • 1980 – nárůst populace na několik set – max. 2 alely na lokus • méně intenzivní bottleneck Hierarchická populační struktura Druh → populace → subpopulace (demy) • Fixační indexy • AMOVA Analýza genetické variance • Assignements • Fylogeneze alel, fylogeografie (někdy příště) Polymorfismus a heterozygotnost Polymorfismus • podíl polymorfních lokusů (znaků) – 95 % nebo 99 % (např. 0,8 = 4 z pěti zkoumaných mikrosatelitů mají v populaci alespoň 2 alely) Heterozygotnost • průměrná četnost heterozygotů v jednotlivých lokusech Očekávaná heterozygotnost: H[oček]=1-(p^2+q^2) ..... pro 1 lokus se 2 alelami s četností p a q Hardy-Weinbergova rovnováha Genetická struktura populací drift, mutace a migrace • Drift → diferenciace subpopulací díky fixaci alternativních alel • Mutace mohou zvýšit diferenciaci (odlišit subpopulace) ale riziko homoplázií • Diferenciaci „pokazí“ migrace 1 migrant na generaci může stačit k setření rozdílů! Mirounga leonina Fabiani et al. 2003 Genetická struktura populací drift, mutace a migrace Vliv populační struktury na heterozygotnost • Extrémní příklad • Dvě izolované subpopulace s fixovanými alelami • Subpopulace v HW, celkově v populaci však nedostatek heterozygotů Wahlundův princip (isolate breaking) • Pokles homozygotnosti při sloučení subpopulací F-statistika [• ]Wright, Nei F[IS], F[ST], F[IT] • Popisují heterozygotnost (odchylky od HW) na různých měřítkách Odhad vlivu populační struktury na genetický make-up populace Koncept heterozygotnosti F statistiky Výpočet F statistik - příklad Výpočet • Software FSTAT, GENEPOP, GENETIX… • S.E. - jackknifing • Průkaznost odchylky od nulové hodnoty – permutační (randomizační) testy F-statistika • F[IS] snížení heterozygotnosti v lokální subpopulaci vysoké hodnoty – inbreeding • F[IT] souhrnná hodnota, heterozygotnost v celé populaci • F[ST] míra „rozdělenosti“ = snížení toku mezi subpopulacemi Vliv driftu – fixuje odlišné alely v subpopulacích Hodnoty F[ST] • 0 – 0.05 malá diferenciace (zanedbatelná) • 0.05 – 0.15 střední • 0.15 – 0.25 velká • > 0.25 velmi velká Emberiza citrinella Lee et al. 2001 [• ]7 mikrosatelitových lokusů, F[ST] • Průkazné rozdíly mezi populacemi • Ve Velké Británii není panmiktická populace Populační cykly hrabošovitých hlodavců (Berthier et al. 2006) • Výrazné cyklické změny v početnosti populací – střídají se období „izolovanosti“ s „kontinuálním rozšířením“ Myotis bechsteinii Kerth et al. 2002 • Letní kolonie samic (15-40 jedinců) • Vzorky - jen ♀♀ • Nukleární i mitochondriální mikrosatelity • ♀♀ filopatrie • ♂♂ disperze G[ST ](Nei 1973) [• ]Analogie F[ST] [ ] • Haploidní (haplodiploidní) organismy, sekvence mtDNA • Počítá s „gene diversity“ místo heterozygotnosti • Pracuje tedy jen s frekvencemi alel, ne s procentem heterozygotů [ ] R[ST] [• ]Obdoba F[ST] • Pracuje však s velikostí alel (počet repeatů u mikrosatelitů) • Předpoklad známého mutačního modelu jen při platnosti SMM (stepwise mutation model) • „Paměť“ mutací v minulosti • R[ST]>F[ST][ ]větší vliv mutací • R[ST]=F[ST][ ]větší vliv driftu [ ] • Potvrzení významnosti rozdílu randomizačními testy (Hardy et al. 2003, program SPAGeDi 1.1) AMOVA Excoffier et al. 1992 • Analýza Molekulární Variance [• ]Analogie R[ST ]a spojení s ANOVA[] [ ] • Analýza variance alelických frekvencí (již dříve Cockerham & Weir 1987,1993) • Započítává se ale rozdílnost (mutace) alel • Φ[ST ],[ ]Program ARLEQUIN (umí i F[ST]) [ ] • Data: sekvence mikrosatelity (jen při platnosti SMM stepwise mutation model) Lagopus lagopus scoticus Piertney et al. 1998 a 2000 • Mikrosatelity a mtDNA [• ]R[ST], AMOVA[] • NcDNA strukturovanost • mtDNA není strukturovanost • Filopatrie samců, disperze samic, průkazný vztah R[ST] a vzdálenosti Bombus pascuorum Widmer & Schmid-Hempel 1999 Neighbour-joining PC1 z alelických frekvencí vs. zeměpisná délka AMOVA a F statistika popis výsledku nikoliv příčin → možná alternativní vysvětlení Modely toku genů (alel) • Island model (Wright) Stejně velké subpopulace Symetrický tok genů Stejná pravděpodobnost výměny mezi jakýmikoliv subpopulacemi • Stepping-stone model (Kimura) Výměna jen mezi sousedními subpopulacemi • Isolation by distance Tok slábne se vzrůstající vzdáleností subpopulací Isolation by distance • rozumné geografické měřítko (závisí na schopnosti disperze) • musí být ustanovena rovnováha mezi migrací a driftem • IBD (isolation-by-distance) nebude – u velmi recentně izolovaných populací – u zcela izolovaných populací – při značné migraci Isolation by distance Crotaphytus collaris Hutchinson & Templeton 1999 Isolation by distance Myotis myotis Ruedi & Castella 2003 • Regrese Φ[ST]/(1- Φ[ST]) nebo F[ST]/(1-F[ST]) oproti logaritmu geografické vzdálenosti • Průkaznost testována permutacemi • Mantelův test (FSTAT) • Lépe vyšly mikrosatelity než mtDNA Tok genů – metody Nm = počet migrantů / subpopulace / generace Jde o hrubý odhad ve škále: málo, středně, hodně! • Privátní alely (Slatkin) Alely vyskytující se jen v jedné subpopulaci p(1) frekvence privátních alel lnp(1) = -0,505 ln(Nm) - 2.44 • F statistika Co ale rozhodně NE! • Dvě hodně vzdálené populace [• ]F[ST] [ ] [ ] • Vyjde nenulové Nm • → v minulosti došlo k výměně jedinců • I populace, které si nikdy nevyměnily migranty mohou mít nenulové Nm. Odobenus rosmarus Andersen et al. 1998 • Mikrosatelity • Nejvíce izolované SZ Grónsko • Nízké hodnoty FST (okolo 0.05) • Několik migrantů za generaci (asi 4) • Shodně vyšla i mtDNA Aquila adalberti Martínez-Cruz et al. 2004 • Mikrosatelity (a mtDNA), F[ST], GENETIX, GENEPOP • Průkazné rozdíly, hlavně Doňana a zbytek • Průkazně vyšlo Isolation by distance • Asi rychlý drift, malé N[e], rozdíly v reprodukčním úspěchu Detekce bottlenecku • Při bottlenecku vymizí nejdříve vzácné alely – Alely rozděleny do kategorií podle frekvence – Relativní nedostatek alel s nízkou frekvecí → bottleneck • Zvýšená heterozygotnost – program BOTTLENECK – Nutný předpoklad mutačního modelu (SSM, TPM, IAM) – Testuje „mutation-drift equilibrium“ • Bayesiánský přístup (založen na koalescenční teorii) – Detekce bottlenecku i expanze – Předpoklad rovnováhy – Vhodné při dlouhodobějších změnách – Markov chain Monte Carlo simulations – Beaumont MA – např. program MSVAR Bottleneck • Při bottlenecku → redukce počtu alel → ovlivnění heterozygotnosti není tak rychlé → více heterozygotů než by vyplývalo z populačního modelu (IAM, TPM, SMM) • Nutno definovat model, nepředpokládám HW rovnováhu • Program BOTTLENECK • Strnadi • Záleží na zvoleném modelu • Ale SMM asi neplatí stoprocentně Shrnutí • Klasické fixační indexy (F[ST]) – Značně robustní – Mutačního model není nutný – Nutno mít rozumnou škálu (geografickou vzdálenost) • AMOVA – Jemnější rozlišení – Možno použít i na sekvence (např. mtDNA) – Předpoklad modelu (SMM) – Platnost modelu většinou není známa Genetika metapopulací • Jednoduchá populační struktura vs. metapopulace → populační genetika • stable pattern of genetic differentiation vs. pattern vary over time Atlantic salmon – Sainte Marguerite river (Quebec) (Garant et al. 2000) • výrazná populační struktura mezi řekami • v rámci jedné řeky – různé mikrohabitaty obývané (1) demy nebo (2) metapopulacemi? • dvouleté sledování, mikrosatelity, hierarchická AMOVA • lokálně adaptované demy, ale i metapopulace (např. po povodních je mikrohabitat obsazen náhodně a ne jedinci z původního demu) • long-term (stable) vs. short-term (metapopulations) substructures Který typ metapopulační struktury? • ad a) Cristatella mucedo - Bryozoa (Freeland et al. 2000) – long-distance migration (birds), no IBD, 5 ms for clone identification • black rats in Senegal – transport by traffic ad b) Mainland-island model • Bufo calamita (Rowe et al. 2000) – different ponds have different breeding success • klasické subpopulace (Area 1) i metapopulace (Area 2); křížek – vyšší tok genů než by se předpokládalo Population assignments Klasické problémy populační genetiky – Populace dány, jedinci předem zařazeni do populací, zajímají nás vlastnosti populací – Populace sice definovány, ale chceme k nim přiřadit jedince neznámého původu – Kryptická populační struktura = předem není dáno nic → chci zjistit klastry (tj. přirozené populace) a rozřadit individua do klastrů (population assignments) Unraveling migratory connectivity 1. Direct methods • morphological variation (geographical races) • leg-bands or similar markers (ex. over one million Ficedula hypoleuca have been ringed in UK and Sweden – only six recaptured on wintering grounds in Africa • satellite telemetry – expensive 2. Biogeochemical approaches • ratios of stable isotopes of naturally occurring elements (C, H, N, Sr) vary across the landscape • determined by the relative frequency of C3 and C4 plants, climate, and bedrock (1) geographical structure of isotopic ratio distributions (2) knowledge about where animals incorporate isotopes (3) tissue samples from individuals at different parts of their annual cycle 3. Genetic approaches • « very few birds have bands, but all have genotypes » • genetic data on population structure • problems: (1) week genetic differentiation among populations (widespread dispersal), (2) lack of differentiation in northern temperate zone – recent postglaciation expansion • solution: (1) more genetic markers, (2) study of avian parasites DNA Useful (and used) genetic markers • mtDNA – smaller efective population size, population specific markers arise quickly, often fixed differences • microsatellites – pronounced polymorphism; rare in the avian genome • dominant nuclear markers (RAPD, AFLP) – almost infinite number of markers Population assignment tests Klastrování • Distance based methods Matice párových vzdáleností (vzdálenosti mezi každým párem individuí) Znázornění mnohorozměrným grafem → klastry Explorační metoda! Důvěryhodnost klastrů není známa Závislost na distanční míře i na grafickém zobrazení Např. neighbour-joining • Model based methods Použiji parametrický model Současně hledám parametry pro klastry a určuji členy klastrů Určím věrohodnost výsledků (Maximum likelihood, Bayesianská metoda) Bayesian clustering approach STRUCTURE - Pritchard et al. 2000 • Neznámý počet populací charakterizovaných různými frekvencemi alel → počet populací a frekvence zjišťuji • Současně přiřazuji individua do populací • Lokusy, které nejsou ve vazbě, HW uvnitř subpopulací (mikrosatelity, RFLPs, SNPs) • Možno předem zahrnout geografickou polohu individuí • Model se snaží vyložit HW nebo vazebnou nerovnováhu zavedením populační struktury • Místo přímého výpočtu – odhad pomocí Markov chain Monte Carlo Turdus helleri • Fragmenty deštného pralesa • Lokality Chawia, Ngangao, Mbololo, Yale (Kenya) • 7 mikrosatelitových lokusů • Neighbour-joining • * špatně zařazení jedinci Program STRUCTURE - Bayesiánský přístup Stanovení počtu „přirozených“ subpopulací