pop_lidi Analýza populační variability a struktury Hierarchická populační struktura Druh → populace → subpopulace (demy) •lokusy používané pro analýzu populační struktury jsou neutrální vůči selekci •množství adaptivní variability koreluje s neutrální variabilitou • •popsáno mnoho výjimek (rozdíly v subpopulacích - neutrální vs. adaptivní) Předpoklady studia populačně-genetické struktury Hierarchická populační struktura Druh → populace → subpopulace (demy) •Jak je variabilní daná populace a jaká je její efektivní velikost (neutrální genetická teorie: He=4Neµ/[4Neµ+1]) • •Nachází se daná populace v období demografické expanze nebo poklesu? • •Existuje mezi dvěma subpopulacemi bariéra toku genů a jak je silná? Jaká je prostorová genetická struktura? • •Vyskytují se v populacích imigranti nebo jejich potomci (hybridi)? Hlavní otázky populačně-genetické analýzy: Diploidní single-locus markery (mikrosatelity) počet lokusů počet jedinců počet populací počet vzorků v 1. populaci počet vzorků v 2. populaci, atd. genotypy, tj. velikosti fragmentů v populaci geografické koordináty pop1 pop2 Velké množství populačně-genetických programů Účel populačně-genetické analýzy frekvence alel frekvence alel + mutační model 1.Vnitropopulační variabilita (popis získaných dat) •Polymorfismus •podíl polymorfních lokusů (znaků) – 95 % nebo 99 % (např. 0,8 = 4 z pěti zkoumaných mikrosatelitů mají v populaci alespoň 2 alely, z nichž ta vzácnější dosahuje frekvence alespoň 1% nebo 5%) • •Počet alel (number of alleles) •počet alel na lokus • •Alelická bohatost (allelic richness) •počet alel na lokus vztažený k velikosti vzorku (metodou „rarefaction“) • •Pozorovaná heterozygotnost (observed heterozygosity) •průměrná četnost heterozygotů v jednotlivých lokusech • • Sample size Použití údajů o genetické variabilitě •neutrální genetická teorie: He=4Neµ/[4Neµ+1] • •mutation-drift equilibrium • •srovnání různých populací a jejich Ne (He, AR atd.) br05f01 N ~ He ... nemusí to být pravda •vliv historického vývoje populací („bottlenecks“) •Northern elephant seals Mirounga angustirostrus – 120 000 jedinců – 50 allozymových lokusů – žádná variabilita rypouš severní Indian rhinoceros •29 allozyme loci – výrazně vyšší variabilita než byla očekávána •ještě nedávno až 100 000 nosorožců v Nepálu a Indii •1960 – 60-80 jedinců v Nepálu •1980 – nárůst populace na několik set – max. 2 alely na lokus •méně intenzivní bottleneck (Ho odpovídá historické Ne) • • • Hardy-Weinbergova rovnováha (HWE) Alela Četnost alely A p a q Př. Jeden lokus se 2 alelami p + q = 1 p, q - zjistíme analýzou svých vzorků Genotyp Očekávaná četnost genotypu AA p2 Aa 2pq aa q2 = Hardy-Weinbergova rovnováha Ø četnosti genotypů zjistíme analýzou svých vzorků Ø odchylky od očekávaných četností Þ např. c2 test Očekávaná heterozygotnost (expected heterozygosity, He) při HWE He=1-(p2+q2) ..... pro 1 lokus se 2 alelami s četností p a q Předpoklady HWE •random mating (panmixia) •negligible effects of mutation and migration („closed populations“) •infinitely large population size •Mendelian inheritance •no selection • •check for linkage disequilibrium (vazebná nerovnováha) • 2 lokusy ve fyzické blízkosti (snížená pravděpodobnost rekombinace linkage disequilibrium) vs. 2 lokusy fyzicky vzdálené (pravděpodobnost rekombinace není ovlivněna linkage equilibrium) nebo Odchylky od HW rovnováhy •Test HWE – nejlépe Genepop („exact probability tests“) – pokud jsou odchylky, tak některý předpoklad HWE nebyl splněn • •nadbytek heterozygotů = negativní asortativní páření (tj. cílené rozmnožování nepodobných jedinců) – použité lokusy mohou být výhodné v heterozygotním stavu (např. geny MHC) • •nedostatek heterozygotů •inbreeding (postihuje všechny lokusy stejně) •nulové alely (jen na některých lokusech bude deficit heterozygotů) Genetický drift Random_sampling_genetic_drift.gif •Náhodné změny ve frekvencích alel •Intenzita driftu závisí na velikosti populace (viz ochranářská genetika) •Specifické případy – founder effect, bottleneck Founder effect („jev zakladatele“) Bottleneck Detekce bottlenecku Při bottlenecku vymizí nejdříve vzácné alely, rychleji než se sníží heterozygotnost nebo rozsah alel Nutno znát (předpokládat) mutační model – pak se nasimuluje „mutation-drift“ rovnováha a srovnává se se skutečným stavem Program BOTTLENECK: počet alel vs. heterozygotnost Program M Ratio: počet alel vs. rozsah alel Předpoklad testů: Populace v HW rovnováze Bottleneck •Při bottlenecku → redukce počtu alel → ovlivnění heterozygotnosti není tak rychlé → více heterozygotů než by vyplývalo z populačního modelu (IAM, TPM, SMM) •Nutno definovat mutační model, předpokladem je HW rovnováha, testuje se mutation-drift equilibrium •Program BOTTLENECK • •Záleží na zvoleném modelu •Ale SMM asi neplatí stoprocentně Detekce bottlenecku nebo expanze – Bayesiánský přístup •Komplexní Bayesiánský přístup (založen na koalescenční teorii) –Detekce bottlenecku i expanze –Vhodné při dlouhodobějších změnách –Markov chain Monte Carlo simulations –Beaumont M. – např. program MSVAR nebo DIY ABC scenario_1_0.bmp scenario_1_1.bmp scenario_1_0.bmp scenario_3_0.bmp Logisticregression.bmp Testování alternativních scénářů vývoje populací v programu DIY ABC Otters in central Europe •strong decline of population numbers in last century • •fragmentation of distribution area vydraVasek2_orezana_zelena vydra3 mapaCS_modraKev2004 kopie stable rare Czech Republic Austria Slovakia Hungary Poland Hájková et al. 2006, J. Zoology Czech Slovak pop_lidi 2. Analysis of population subdivision (mezipopulační variabilita) Hierarchická populační struktura Druh → populace → subpopulace (demy) •lokusy používané pro analýzu populační struktury jsou neutrální vůči selekci • •klasický populačně-genetický přístup = jednotlivé populace jsou předem známy (např. chceme zjistit úroveň genetických rozdílů mezi dvěma lokalitami = populacemi) Předpoklady studia populačně-genetické struktury Genetická struktura populací drift, mutace •Drift → diferenciace subpopulací díky změnám frekvencí (až fixaci) alternativních alel • • •Mutace mohou zvýšit diferenciaci (nebo ne – homoplázií) • • AA AA AA AA AA AA aa Aa AA aa Aa AA aa Aa Aa aa AA AA aa aa aa aa aa aa Aa Aa Aa Aa drift Migrace (genový tok) - působí proti diferenciaci subpopulací AB ac Vliv populační struktury na heterozygotnost •Wahlundův princip • •Dvě izolované subpopulace s fixovanými alelami • •Subpopulace v HW, celkově v populaci však nedostatek heterozygotů AA AA AA AA AA AA AA AA AA aa aa aa aa aa aa aa aa aa aa Wahlundův princip (isolate breaking) •Pokles homozygotnosti při sloučení subpopulací AA AA AA AA AA AA AA AA AA aa aa aa aa aa aa aa aa aa aa Aa Aa Aa Aa Aa Aa Aa Aa Aa Wahlundův princip - příklad •Jezero Bunnersjöarna (severní Švédsko) – brown trout •2 alely na alozymovém markeru 100/100 100/null null/null Total p 2pq Přítok 50 0 0 50 1.000 0.000 Odtok 1 13 36 50 0.150 0.255 Celé jezero (expected) 51 (33.1) 13 (48.9) 36 (18.1) 100 0.575 0.489 Ryman et al. 1979 Jak zjišťovat strukturovanost populací? vydraVasek2_orezana_zelena vydra3 mapaCS_modraKev2004 kopie stable rare Czech Republic Austria Slovakia Hungary Poland Slovensko Česká republika Nízký Jeseník Factorial correspondence analysis (Genetix) F-statistiky •Wright, Nei FIS, FST, FIT • •Popisují heterozygotnost (odchylky od HW) na různých měřítkách • • wright-sewall9 Sewall Wright 1889 - 1988 Masatoshi Nei *1931 Odhad vlivu populační struktury na genetický make-up populace • 3 úrovně (T, S, I) • x subpopulací (x = 1 až k; zde k = 3) • každá subpopulace má Nx jedinců • AA, Aa, aa – odlišný symbol • př. I1-13 = 13. jedinec z první subpopulace Koncept heterozygotnosti HI – průměrná pozorovaná heterozygotnost jedince v subpopulaci HS - očekávaná heterozygotnost jedince v subpopulaci za předpokladu náhodného páření HT - očekávaná heterozygotnost jedince v celé populaci za předpokladu náhodného páření Hx = pozorovaná heterozygotnost v subpopulaci x pi,x2 = frekvence i-té alely v subpopulaci x průměrná oček. heterozygotnost v populaci Ø pouze pro dvě alely na jednom lokusu (Wright 1931) Ø pro více alel je výpočet složitější (Nei 1987) F statistiky Snížení heterozygotnosti jedince kvůli nenáhodnému páření v subpopulaci (~ HWE) Vliv rozdělení populace na subpopulace Celkový koeficient inbreedingu FIT - měří redukci heterozygotnosti jedince ve vztahu k celkové populaci (1-FIT)= (1-FST)(1-FIS) Weir & Cockerham (1984) f, θ , F Korekce na velikost vzorku a počet subpopulací Výpočet odlišnosti od nuly – nejčastěji permutace (FSTAT, Genetix, Genepop etc.) Výpočet F statistik - příklad Subpopulace 1 (N1=40) Subpopulace 2 (N2=20) Lokus AA AB BB p1(j) AA AB BB p2(j) p0(j) Pozn. A 10 20 10 0.5 5 10 5 0.5 0.5 H.-W. rovnováha B 16 8 16 0.5 4 4 12 0.3 0.4 deficit heterozygotů C 12 28 0 0.65 6 12 2 0.6 0.625 přebytek heterozygotů D 0 0 40 0.0 20 0 0 1.0 0.5 alternativně fixované alely Výpočet alelových frekvencí Pozorovaná heterozygotnost Očekávaná heterozygotnost Wrightova F-statistika Lokus H1 (j) H2 (j) HI (j) HS (j) HT (j) FIS (j) FST (j) FIT (j) A 0.5 0.5 0.5 0.5 0.5 0.0 0.0 0.0 B 0.2 0.2 0.2 0.46 0.48 0.565 0.042 0.583 C 0.7 0.6 0.65 0.4675 0.46875 -0.39 0.0027 -0.387 D 0.0 0.0 0.0 0.0 0.5 --- 1.0 1.0 Průměr 0.058 0.261 0.300 Průměrné hodnoty F statistik mohou maskovat odlišnou evoluční historii na různých lokusech Průměrná frekvence alely A v celé populaci F-statistika • •FIS snížení heterozygotnosti v lokální subpopulaci vysoké hodnoty – inbreeding • •FIT souhrnná hodnota, heterozygotnost v celé populaci • •FST míra „rozdělenosti“ = snížení toku mezi subpopulacemi (tj. existence bariéry – Wahlundův princip) Vliv driftu – fixuje odlišné alely v subpopulacích • • Výpočet FST - příklad •Jezero Bunnersjöarna (severní Švédsko) – brown trout •2 alely na alozymovém markeru 100/100 100/null null/null Total p 2pq Přítok 50 0 0 50 1.000 0.000 Odtok 1 13 36 50 0.150 0.255 Celé jezero (expected) 51 (33.1) 13 (48.9) 36 (18.1) 100 0.575 0.489 Ryman et al. 1979 V důsledku bariéry toku genů je heterozygotnost o 72.8% nižší než by byla v panmiktické populaci Emberiza citrinella Lee et al. 2001 •7 mikrosatelitových lokusů, FST •Průkazné rozdíly mezi populacemi •Ve Velké Británii není panmiktická populace Populační cykly hrabošovitých hlodavců (Berthier et al. 2006) •Výrazné cyklické změny v početnosti populací – střídají se období „izolovanosti“ s „kontinuálním rozšířením“ hryzec-vodni-0013 Arvicola terrestris •Nízká hustota – extrémní vliv driftu • •S nárůstem populační hustoty se zvyšuje intenzita toku genů mezi subpopulacemi a narůstá genetická variabilita subpopulací Snižování Fst Hodnoty FST •0 – 0.05 malá diferenciace (zanedbatelná) • •0.05 – 0.15 střední • •0.15 – 0.25 velká • •> 0.25 velmi velká Absolutní hodnoty závisí na heterozygotnosti !!! Nutno testovat odlišnost od nuly !!! Nutno standardizovat: FST´ = FST/FSTmax (Hedrick 2005) GST (Nei 1973) •Analogie FST • •Haploidní (haplodiploidní) organismy, sekvence mtDNA • •Počítá s „gene diversity“ místo heterozygotnosti • •Pracuje tedy jen s frekvencemi alel, ne s procentem heterozygotů • • Myotis bechsteinii Kerth et al. 2002 •Letní kolonie samic (15-40 jedinců) • •Vzorky - jen ♀♀ • •Nukleární i mitochondriální mikrosatelity • •♀♀ filopatrie • •♂♂ disperze RST •Obdoba FST • •Pracuje však s velikostí alel (počet repeatů u mikrosatelitů) • •Předpoklad známého mutačního modelu jen při platnosti SMM (stepwise mutation model) • •„Paměť“ mutací v minulosti •RST>FST větší vliv mutací •RST=FST větší vliv driftu • • •Potvrzení významnosti rozdílu randomizačními testy (Hardy et al. 2003, program SPAGeDi 1.1) • • • Lagopus lagopus scoticus Piertney et al. 1998 a 2000 •Mikrosatelity a mtDNA •RST, AMOVA • •NcDNA strukturovanost •mtDNA není strukturovanost •Filopatrie samců, disperze samic, průkazný vztah RST a vzdálenosti AMOVA Excoffier et al. 1992 •Analýza Molekulární Variance • •Analogie RST a spojení s ANOVA • •Analýza variance alelických frekvencí (již dříve Cockerham & Weir 1987,1993) • •Započítává se ale rozdílnost (mutace) alel • •ΦST , Program ARLEQUIN (umí i FST) • •Data: sekvence mikrosatelity (jen při platnosti SMM stepwise mutation model) • anova Bombus pascuorum Widmer & Schmid-Hempel 1999 Mikrosatelity, AMOVA Nejvíc vysvětlují Alpy Neighbour-joining AMOVA a F statistika popis výsledku nikoliv příčin → možná alternativní vysvětlení Tok genů – metody 1.Přímé metody: Capture-Mark-Recapture + parentage analýzy 2. Nepřímé metody stanovení toku genů – populačně-genetické modely •Island model (Wright) Stejně velké subpopulace Symetrický tok genů Stejná pravděpodobnost výměny mezi jakýmikoliv subpopulacemi • •Stepping-stone model (Kimura) Výměna jen mezi sousedními subpopulacemi • Tok genů – metody •Privátní alely (Slatkin) Alely vyskytující se jen v jedné subpopulaci p(1) frekvence privátních alel lnp(1) = -0,505 ln(Nem) - 2.44 • •F statistika • Nem = počet migrantů / subpopulace / generace Jde o hrubý odhad ve škále: málo, středně, hodně! 1.Přímé metody: Capture-Mark-Recapture + parentage analýzy 2. 2.Nepřímé metody – na základě distribuce genetické variability Co ale rozhodně NE! •Dvě hodně vzdálené populace •FST → vždy bude nenulové Nem → v minulosti došlo k výměně jedinců •I populace, které si nikdy nevyměnily migranty mohou mít nenulové Nem Předpoklady použití Nem: •„island model“ (= infinite number of populations, absence of selection, the same size of all populations etc.) • •migration-drift equilibrium (= no range expansions, habitat fragmentation or population bottlenecks) Modely toku genů (alel) •Island model (Wright) Stejně velké subpopulace Symetrický tok genů Stejná pravděpodobnost výměny mezi jakýmikoliv subpopulacemi • •Stepping-stone model (Kimura) Výměna jen mezi sousedními subpopulacemi • •Isolation by distance Tok slábne se vzrůstající vzdáleností subpopulací Isolation by distance •rozumné geografické měřítko (závisí na schopnosti disperze) • •musí být ustanovena rovnováha mezi migrací a driftem • •IBD (isolation-by-distance) nebude • –u velmi recentně izolovaných populací – –u zcela izolovaných populací – –při značné migraci • • Isolation by distance Crotaphytus collaris Hutchinson & Templeton 1999 desítky tisíc let nejsou bariéry rovnováha mezi driftem a migrací postglaciálně fragmentace vliv driftu postglaciálně nejsou bariéry vliv migrace postglaciálně vzrůstající fragmentace vliv driftu na velkých měřítkách rovnováha na malých měřítkách Genetika metapopulací •Jednoduchá populační struktura vs. metapopulace → populační genetika •stabilní vs. nestabilní populačně-genetický pattern br05f04 Metapopulace: časté lokální extinkce a kolonizace Atlantic salmon – Sainte Marguerite river (Quebec) (Garant et al. 2000) •výrazná populační struktura mezi řekami •v rámci jedné řeky – různé mikrohabitaty obývané (1) demy nebo (2) metapopulacemi? •dvouleté sledování, mikrosatelity, hierarchická AMOVA •lokálně adaptované demy, ale i metapopulace (např. po povodních je mikrohabitat obsazen náhodně a ne jedinci z původního demu) •long-term (stable) vs. short-term (metapopulations) struktura Variance component D.f. % of total variance F-statistic P Mezi přítoky 1 0,1 0,0014 0,167 Mezi lokalitami 6 0,9 0,0085 0,001 Mezi roky uvnitř lokality 7 2,5 0,0255 < 0,0001 Uvnitř vzorku 1352 96,6 0,0337 < 0,0001 Který typ metapopulační struktury? •ad a) Cristatella mucedo - Bryozoa (Freeland et al. 2000) – long-distance migration (birds), no IBD, 5 ms for clone identification • •black rats in Senegal – transport by traffic (no isolation-by-distance in genetic differentiation) • br05f04 „classical“ „mainland-island“ „source and sinks“ ad b) Mainland-island model •Bufo calamita (Rowe et al. 2000) – různé rybníky mají různý reprodukční úspěch •klasické subpopulace (Area 1) i metapopulace (Area 2); křížek – vyšší tok genů než by se předpokládalo (jsou v nich obsaženy vysoce úspěšné rybníky = „mainland“) • br05f05 Klasická subpopulační struktura + IBD Mainland-island metapopulace FST = 0.06-0.22 Populační struktura - shrnutí Connected populations (gene flow) Isolated populations (no gene flow) Ne ¯ Genetic drift ¯ Genetic diversity ¯ Population differentiation ¯ > 3. Population assignments •Klasické problémy populační genetiky • •Populace dány, jedinci předem zařazeni do populací, zajímají nás vlastnosti populací (F-statistiky) → ad (1) nebo (2) – •Populace sice definovány, ale chceme k nim přiřadit jedince neznámého původu • •Kryptická populační struktura = předem není dáno nic → chci zjistit klastry (tj. přirozené populace) a rozřadit individua do klastrů (population assignments) • 1.vnitropopulační variabilita – deskriptivní statistiky 2.popis populačně-genetické struktury, bariéry toku genů Unraveling migratory connectivity (a) strong vs. (b) weak connectivity A. Direct methods •morphological variation (geographical races) •leg-bands or similar markers (ex. over one million Ficedula hypoleuca have been ringed in UK and Sweden – only six recaptured on wintering grounds in Africa •satellite telemetry – expensive, not useful for small animals • B. Biogeochemical approaches •ratios of stable isotopes of naturally occurring elements (C, H, N, Sr) vary across the landscape •determined by the relative frequency of C3 and C4 plants, climate, and bedrock (1) geographical structure of isotopic ratio distributions (2) knowledge about where animals incorporate isotopes (3) tissue samples from individuals at different parts of their annual cycle C. Genetic approaches •« very few birds have bands, but all have genotypes » •genetic data on population structure •problems: (1) week genetic differentiation among populations (widespread dispersal), (2) lack of differentiation in northern temperate zone – recent postglaciation expansion •solution: (1) more genetic markers, (2) study of avian parasites DNA Population assignment tests 5 microsatellite loci Fst = 0.14 99.9% assigned correctly 5 microsatellite loci Fst = 0.04 90.2% assigned correctly § program GeneClass (Piry et al. 2004) § calculates the probability that an individual’s genotype might exist in a particular population § can combine data from multiple genetic marker types •Kryptická populační struktura • •Neznámý počet skupin (klastrů) • •Úroveň jedince • •Vytvořit klastry a současně k nim přiřadit jedince • •K dispozici máme individuální genotypy (případně i souřadnice) • • •Data: msat (jiné kodominantní lokusy, Alu), AFLP • Individual-based assignments mys4-225x300 mys4-225x300 mys4-225x300 mys4-225x300 mys4-225x300 mys4-225x300 mys4-225x300 mys4-225x300 mys4-225x300 mys4-225x300 mys4-225x300 mys4-225x300 mys4-225x300 mys4-225x300 mys4-225x300 mys4-225x300 mys4-225x300 mys4-225x300 mys4-225x300 mys4-225x300 mys4-225x300 mys4-225x300 mys4-225x300 mys4-225x300 mys4-225x300 mys4-225x300 mys4-225x300 mys4-225x300 mys4-225x300 mys4-225x300 mys4-225x300 mys4-225x300 •Therein lies the fundamental difference between phylogeographic and theoretical population genetic thinking: phylogeographic studies traditionally assume that ancestral history can be directly deduced from estimated gene trees, whereas population genetic theory asserts that gene trees are random outcomes of stochastic population-level processes. • Bayesian clustering approach STRUCTURE - Pritchard et al. 2000 •Neznámý počet populací charakterizovaných různými frekvencemi alel → počet populací a frekvence zjišťuji •Současně přiřazuji individua do populací •Lokusy, které nejsou ve vazbě, HW uvnitř subpopulací (např. mikrosatelity, SNPs) •Možno předem zahrnout geografickou polohu individuí •Model se snaží vyložit HW nebo vazebnou nerovnováhu zavedením populační struktury •Místo přímého výpočtu – odhad pomocí Markov chain Monte Carlo Turdus helleri •Fragmenty deštného pralesa • •Lokality Chawia, Ngangao, Mbololo, Yale (Kenya) • •7 mikrosatelitových lokusů • •Neighbour-joining • •* špatně zařazení jedinci • • Program STRUCTURE - Bayesiánský přístup K (number of clusters) 7 10 Stanovení počtu „přirozených“ subpopulací K7 K10 K = 7 K = 10 Proporce genomu každého jedince náležející určitému „clusteru“ Alternativní vizualizace výsledků ze STRUCTURE New%20K%20for%20paper „forced clustering“ Zobrazení hierarchické struktury mezi populacemi 4. Spatially explicit analyses = spatial genetics = landscape genetics •vychází z Bayesian clustering approach (typu STRUCTURE) – individual-based models • •do modelování genetické informace přidává i geografické koordináty • •např. programy BAPS, TESS, Geneland (automaticky stanovují nejlepší počet populací K) Spatial models – tesselation, Voronoi polygons CS_K13Voronoi The example of very fragmented populations: the best model in BAPs for Central and Southern Dinaromys populations (spatial clustering of groups of individuals): K=13 (i.e. evidence of very high structuration) Best Partition: Cluster 1: {C9, C13} Cluster 2: {S6} Cluster 3: {C8, C14} Cluster 4: {C4} Cluster 5: {C1, C2} Cluster 6: {S1, S2, S3, S4} Cluster 7: {C6} Cluster 8: {C3, C15} Cluster 9: {C5, C7} Cluster 10: {C10} Cluster 11: {C11, C12} Cluster 12: {S5} Cluster 13: {C16} CS_K13tree Př. program BAPS Př.: Geneland R platform Posterior probability maps Spatial population genetics Fontaine et al. 2007 Phocoena phocoena