prof. Ing. Tomáš Urban, Ph.D. urban@mendelu.cz Odhad heritability v přírodních populací Kovariance mezi příbuznými pro kvantitativní znaky je základem pro odhad dědičnosti znaků a jejich genetických korelací (Falconer, 1989). Klasicky se úroveň příbuznosti mezi příbuznými vypočítává ze známých rodokmenů. K odhadu genetických a environmentálních komponent rozptylu kvantitativních znaků na základě porovnání úplných sourozenců a polosourozenců, rodičů a jejich potomků nebo podle reakce na selekci lze použít řadu statistických metod. Dva důsledky omezení, která vyplývají z tradičních kvantitativních genetických postupů, jsou: 1. organismy s dlouhou generační dobou (např. stromy, velcí obratlovci) je velmi obtížné studovat a 2. neznámý vztah mezi odhady heritability a genetickými korelacemi vytvořenými v laboratoři a těmi, které se projevují ve volně žijících populacích v přirozených podmínkách prostředí. Problém přírodních populací - zkoumání kvantitativní genetické variability v přírodních populacích, které nevyžadují experimentální manipulaci, a umožnit genetické studie organismů, které nelze studovat v laboratoři buď z důvodu dlouhého života, nebo obtížného chovu v zajetí. Ve většině přírodních populací není možné vytvořit křížence a obvykle není ani možné sledovat přirozené vzorce rozmnožování. A i když si organismy vytvářejí teritoria a zdánlivě se rozmnožují monogamně, takže je možné identifikovat pravděpodobné rodiče (např. mnoho ptáků), mimopárové rozmnožování a jejich vliv na vztahy v rámci rodiny není snadné zjistit. ‘Natural’ heritability Vytváření umělých populací ve volné přírodě, cross-fostering design nebo vytváření populací přizpůsobených laboratornímu prostředí (např. linie Rose u Drosophila melanogaster; Chippindale et al., 1996). U drozofily se odhadovala heritabilita v přírodě pomocí regrese laboratorně vypěstovaných potomků na rodiče nasbírané v terénu. h2 - dvojnásobek regresního koeficientu z hodnot samic odchycených ve volné přírodě s hodnotami průměrů jejich laboratorně chovaných dcer. Cross-fostered – „kříženě“ odchovávaná mláďata Smith, James N. M.; Dhondt, André A. (1980). EXPERIMENTAL CONFIRMATION OF HERITABLE MORPHOLOGICAL VARIATION IN A NATURAL POPULATION OF SONG SPARROWS. Evolution, 34(6), 1155–1158. doi:10.1111/j.1558- 5646.1980.tb04058.x - regrese skóre středu rodičů vůči průměrnému skóre potomků pro experimentální rodiny s pravými i náhradními (foster, pěstouni) rodiči a pro kontrolní rodiny. Více markerů (tj. celkový počet alel) by zvýšilo přesnost odhadu příbuznosti a zvýšení celkového počtu jedinců výrazně zvyšuje přesnost a správnost odhadů heritability a genetických korelací. Nyní: odhad heritability na základě podílu fenotypové variance vysvětlené genotypovanými SNP. Yang et al. (2010) hodnotili svou metodu odhadem podílu variance vysvětlené ~290 k SNP u 3925 lidí a po korekci na SNP, které nejsou genotypizovány, a na SNP s nižší frekvencí minoritních alel se poměrně blíží heritabilitě výšky odhadované ze sourozeneckých modelů, ~0,8. Software GCTA byl také použit k odhadu heritability pro hmotnost u lidí (Yang et al. 2011), inteligenci (Davies et al. 2011), náchylnost k nemocem (Lee et al. 2012) a osobnost (Verweij et al. 2012). Podobné metody byly použity k rozdělení genetické variability v délce křídel (Robinson et al. 2013), velikosti snůšky a hmotnosti vajec populace volně žijících ptáků (Santure et al. 2013). Heritabilita odhadnutá pomocí genetických markerů - metoda umožňující kvantitativní genetickou analýzu volně žijících populací s přirozenými vzorci rozmnožování. - metody byly založeny na lineárních vztazích mezi odhady příbuznosti na základě markerů a fenotypy. Kvůli nejistotě v odhadu příbuznosti a záměně příbuznosti s prostředím však odhady h2 z těchto metod nebyly přesné. 1) jedinci jsou ve studované populaci genotypizováni pro lokusy molekulárních markerů a vyhodnoceni z hlediska kvantitativních znaků. 2) na základě údajů z markerů postupem maximální pravděpodobnosti (ML) odvodí příbuznosti mezi dvojicemi jedinců, přičemž se předpokládá směs nepříbuzných a úplných sourozeneckých párů. 3) odhady příbuznosti jsou kombinovány s údaji o kvantitativních znacích ve smíšeném modelu, aby bylo možné odvodit h2 a genetické korelace. Odhad podílu fenotypové variance vysvětlené genotypovanými SNP Analýza GCTA se skládá ze dvou kroků. Nejprve se všechny SNP použijí k výpočtu matice genetické příbuznosti vztahů (GRM) mezi vzorky. GRM se pak použije jako prediktor ve smíšeném lineárním modelu s rysem jako odpovědí k odhadu h2. Vliv velikosti vzorku a hustoty markerů na korelaci mezi skutečnou a teoretickou genetickou příbuzností prof. Ing. Tomáš Urban, Ph.D. urban@mendelu.cz Dvojčata Jedinci s identickým genotypem ~ podobně jako inbrední linie Studie dvojčat (lidé, skot) Zohlednění společného prostředí – od zygoty po narození, a v dalším období, kdy jsou spolu -> variance mezi páry dvojčat obsahuje varianci společného prostředí (VEc), spojená s VG Tento problém lze řešit analýzou dvou typů dvojčat: monozygotní (MZ) a dizygotní(DZ) MZ ~ genetická identita DZ ~ úplní sourozenci - ve společném prostředí mají přibližně stejný rozměr jako MZ Odhad množství genetické variance, ptáme se nakolik méně jsou si podobní DZ než MZ? Pokud jsou si MZ dvojčata fenotypově podobnější než DZ dvojčata, pak to naznačuje, že genetická variabilita více ovlivňuje fenotypové rozdíly. Klasický design dvojčat je také známý jako model ACE. Model ACE odhaduje heritabilitu v úzkém smyslu za předpokladu, že genetická variance dominance je nulová Zavedením modelu ADE [v němž jsou složky variance modelovány jako aditivní (A), dominantní a epistázové (D) a nesdílené vlivy prostředí] lze odhadovanou heritabilitu rozdělit na aditivní a dominantní složky variance. Pokud se u dvojčat MZ a DZ projevují nepřímé genetické účinky rodičů podobně, budou tyto účinky zahrnuty do složky společného prostředí (C). Předpoklady studia dvojčat - Společné prostředí přispívá k danému fenotypu stejnou měrou u obou párů dvojčat MZ i DZ, což se označuje jako "předpoklad stejného prostředí" (equal environment assumption - EAA) - Pokud by EEA neplatila, odhady heritability by byly pravděpodobně nadsazené, protože rozdílná prostředí by byla mylně přisuzována rozdílům v genetické variabilitě - Dvojčata jsou zobecnitelná na obecnou populaci, pokud jde o fenotyp, který je předmětem zájmu. Platnost tohoto předpokladu byla prokázána v mnoha studiích - V rámci populace dochází k „náhodnému páření“. - „nejasná role podobnosti prostředí“ na genetické faktory a výsledky je omezená. Pokud všechny tyto předpoklady platí, pak porovnáním fenotypových korelací MZ a DZ dvojčat lze spolehlivě odhadnout heritability. Složení komponent variance mezi páry dvojčat Uvnitř párů, 𝝈 𝒘 𝟐 Mezi páry, 𝝈 𝒃 𝟐 VEwVA + VD + VEcMZ dvojčata ½ VA + ¾ VD + VEw½ VA + ¼ VD + VEcDZ dvojčata ½ VA + ¾ VD½ VA + ¾ VDRozdíl (MSMZ - MSDZ) Za předpokladu, že obě složky variance prostředí, VEc a VEw, jsou stejné pro MZ a DZ, se VI neuvažuje; celková genetická variance je stejná u MZ a u DZ Rozdíly mezi MZ a DZ dvojčaty v obou komponentách odhadují ½ VA společně se ¾ VD (𝜎 𝜎 )+(𝜎 𝜎 ) Korelace mezi páry dvojčat je podílem komponenty variance mezi páry fenotypovou variancí ~ dvojnásobek rozdílu mezi MZ korelace a DZ korelace: „Heritabilita“ Výpočet se více blíží heritabilitě v širším smyslu, než v úzkém smyslu. Odhady heritability – genomické metody - U nepříbuzných jedinců - genomické metody se týkají statistických metod aplikovaných na molekulárně genetická (včetně celogenomových) data, která byla buď přímo změřena, nebo imputována pomocí referenčních panelů. - Některé genomové metody se zaměřují na odhad „SNP heritability“ - což je zvláštní případ heritability v úzkém smyslu odhadované z měřených SNP. - LD score regression - Genomic relatedness restricted maximum likelihood Genomické metody: příbuzní jedinci Společným omezením genomických metod aplikovaných na nepříbuzné jedince je nemožnost zohlednit vliv prostředí. Byly vyvinuty různé metody, které umožňují implementaci genomických metod ve velkých vzorcích příbuzných jedinců. Sibling regression Může poskytnout odhad heritability v úzkém slova smyslu; žádné další předpoklady o distribuci účinků SNP; zahrnuje účinky vzácných SNP do odhadů heritability; odolný vůči chybám genotypování a určitému chybění; částečně zohledňuje stratifikaci populace. Pro přesné výsledky je nutná velká velikost vzorku vzhledem k malé směrodatné odchylce IBD sdílených mezi sourozenci, např. Visscher et al. stanovili v rámci svého vzorku průměrný podíl IBD sdílených genomem v rámci sourozeneckých párů se směrodatnou odchylkou 0,036; odhad je vztažen ke zvolené referenční populaci. Další genetické parametry Genetika kvantitativních znaků Koeficient opakovatelnosti Opakované měření stejné vlastnosti na stejném jedinci v průběhu jeho života (nejlépe za stejných podmínek) → podobnost měření je závislá na velikosti genetické determinace. Koeficient opakovatelnosti udává podíl proměnlivosti zapříčiněný genetickými rozdíly z celkové fenotypové proměnlivosti. – Na stejném místě (prostorové opakování, topografická) – Opakování v časovém období (s věkem) Zdroj proměnlivosti mezi jedinci Zdroj proměnlivosti mezi měřeními u jedince Měření jsou rozdílná → vlivy dočasné jsou různé Měření jsou podobná → vlivy stálé jsou stejné 2 22 2 P GEpEp oprh     rop je horní hranicí h2 Př.: U 250 prasnic ve velkochovu byly sledovány počty všech narozených selat za jejich první čtyři vrhy. Vypočítejte odhad koeficientu opakovatelnosti této užitkové vlastnosti včetně jeho střední chyby. 2 g0 2 e n  2 e složení MSMSdfSSProměnlivost 6,777dfa = p – 1 = 2491681,99 Mezi skupinami jedinců mezi prasnicemi (a) 4,059dfe = n - p = 7503044,25Uvnitř skupin (e) -dfc = n – 1 = 9994756,24Celková (c) p = 250 počet prasnic n = 1000 počet sledovaných vrhů k = 4 počet opakování u jedné prasnice, zde platí: k = n0 vážený počet potomků Odhad variance genetické: 2 0 2 gea nMS   6740,0 0 2    n MSMS ea g Odhad variance fenotypové: 7330,4)( 22222222  egGEtEtGEpEpGP  2 eeMS  Výpočet odhadu intraklasního koeficientu korelace ρ = rop - koeficientu opakovatelnosti: 1424,02 2  P g opr     0317,0 )1)(1( )1(1)1.(2 00 2 0 2     pnn n se opr  To estimate variances with the repeatability model, REML, was used. Yijkl is milk, fat, or protein yield with twice daily milking and complete records of length 240 to 305 d for cow k in herd-year i, calving month j, and lactation l; HYi is effect of herd-year i; Mj is effect of calving month j ; xijkl is the cow age at calving; ak is additive genetic effect of cow k; pk is the permanent environmental effect of cow k; b1 and b2 are the partial regression coefficients for linear and quadratic effects of age at calving; eijkl is random residual associated with each record. Heritability and Repeatability for Milk Production Traits of Japanese Holsteins from an Animal Model. Suzuki M., Van Flack L.D., 1994, J Dairy Sci 77:583-588 Význam rop Určuje horní hranici koeficientu heritability (obsahuje i vlivy dominance a interakce genů, navíc i složku stálých vlivů prostředí a interakci genů a prostředí. Pro odhad není nutné mít skupiny příbuzných jedinců. Upřesňuje stanovení skutečně geneticky podmíněné užitkové hodnoty (odhad genotypové odchylky). Pro výpočet odhadu koeficientu heritability. Zpřesnění účinnosti selekce. Vztahy mezi vlastnostmi • pozitivní – zvýšením jednoho znaku se zvyšuje i druhý • negativní – zvýšením jednoho znaku se snižuje druhý Fenotypová korelace - závislost mezi pozorovanými hodnotami Px a Py je daná kombinací závislostí genotypových hodnot a účinků prostředí; - korelační páry = dvojice měření znaku x a znaku y u téhož jedince; rP rPxPy Genetická korelace genotypová = závislost mezi genotypovými hodnotami znaků x a y; rG; rGxGy; genetická = závislost aditivních hodnot obou znaků – častější; - vyjadřuje rozsah, ve kterém dvě měření odrážejí, co je geneticky stejná vlastnost (délka křídel : délka těla r = 0,75) Paratypová korelace Prostřeďová korelace Závislost mezi efekty prostředí rE rExEy Ze schématu vyplývá rozklad fenotypové korelace: yxyxyx EEyxGGyxPP reerhhr ....     yxyxyx EEyxGGyxPP rhhrhhr .11.. 22  Výpočet korelace – obecně Zohledňuje variance (rozptyly) obou vlastností a jejich vzájemnou kovarianci:       22 )()( )]()[( yyxx yyxx rPxPy Zjednodušeně: )var()var( cov yx r xy PxPy   Vznik genetických korelací Pleiotropní působení genů = gen ovlivňuje více znaků ve stejném čase Vazba genů = geny lokalizovány v jedné vazbové skupině - čím blíže, tím je vazba silnější - není stálá – crossing over - vazba mezi skupinami genů • zavedení genů do populace – ~ dočasné korelace – dané intenzivním využíváním vybraných jedinců – Při změně intenzity rozmnožování určitých jedinců genetické korelace zanikají – narušení náhodným pářením Metody odhadu genetické korelace • metoda korelace křížem • analýza variance a kovariance • realizovaná genetická korelace na základě výsledku selekce 1. Korelace křížem - známe fenotypovou hodnotu znaku x, y u rodiče a potomka XDXM YD YM fenotyp matek fenotyp dcer DM XXr DMYYr MDYXr DMYXr DMDM DMMD YX YYXX YXYX GG rr rr r    2 Křížová korelace různých vlastností u matek a dcer Křížová korelace stejných vlastností u matek a dcer 2. Analýza variance a kovariance • Jednofaktorová • Dvoufaktorová • u skupin příbuzných jedinců • Cíl: určit variance a kovariance genetické a prostřeďové • Počítáme 2 ANOVY pro 2 vlastnosti a navíc analýzu kovariance současně pro obě vlastnosti )var()var( )cov( )var()var( )cov( )var()var( )cov( yx xy PP yx xy EE yx xy GG PP P r EE E r GG G r YX YX YX       střední produkt (kovariance) střední čtverec (variance) součet součinů stupně volnostisoučet čtverců MPxyMSyMSxSPxyFSSySSxZdroj proměnlivosti MPa xy = 0,318328MSa y = 0,514485MSa x = 0,685128 SPa xy = 2,2283 fa = k -1 = 7 SSa y = 3,6014 SSa x = 4,7959 - mezi chovy MPo xy = 0,072887MSo y = 0,206668MSo x = 0,100204 SPo xy = 4,4461 fo = b – k = 61 SSo y = 12,6068 SSo x = 6,1125 - mezi otci uvnitř chovů MPe xy = 0,024274MSe y = 0,077952MSe x = 0,043528 SPe xy = 10,1466 fe = n – b = 418 SSe y = 32,5841 SSe x = 18,1950 - mezi dojnicemi uvnitř skupin otců --- SPc xy = 16,8210 fc = n – 1 = 486 SSc y = 48,7923 SSc x = 29,1034 - celková Vztah mezi obsahem bílkovin (x) a tuku (y) v mléce dojnic byl sledován v osmi chovech (k), u skupin polosester (b). Výpočet odhadu byl proveden u 487 dojnic (n), dcer po 69 otců (b) bez ohledu na pořadí laktace. % bílkovin xijk =  + ai + bij + eijk % tuku yijk =  + ai + bij + eijk Protože ve skupinách byly různé počty pozorování, tak byl vypočítán vážený počet pozorování n0 = 6,6494. 0,00852 0 2    n MSMS xexO gx  0,01936 0 2    n MSMS yeyO gy  0,00731 covcov cov 00      n MPMP n xyexyOxyexyO gxy 0,1239 .3.3 cov3 .3.3 cov3cov 222222        yyxx xyxy yyxx xyxy yx gege ge gege ge EE MSMS MP r   0,4464 .. cov 22  yx xy yx xy yx cc c cc c PP SSSS SP r   0,569 . cov 22  yx xy yx gg g GGr   Správnost výpočtu odhadů korelací je možno ověřit rozkladem fenotypové korelace 0,4438....  yxyxyx EEyxGGyxPP reerhhr  0,65544.4 2 2 22 2 2    x x xx x P g eg g xh      0,795744.4 2 2 22 2 2    y Y yy y P g eg g yh      0,58741 22  xxx hee 0,45201 22  yyy hee 0,80932  xx hh 0,89212  yy hh 3. Z výsledku selekce • Realizovaná genetická korelace 2 vlastností na základě výsledků selekce, podle výše genetického zisku – selekční pokus – selekce v běžných podmínkách a) Selekční pokus • ΔGX/YS genetický zisk v selektované části populace • ΔGX/Y genetický zisk v neselektované části populace X YS Y XS GG G G G G r YX       b) Selekce v běžných podmínkách • provádíme selekci dle jednoho znaku • stanovíme dosažený genetický zisk pro oba znaky • známe-li heritabilitu obou znaků, pak při selekci podle X YY YX PYXx Y GXx Y GG hhi G hi G r      Korelovaný selekční efekt • o kolik se v generaci po selekci na znak X změní znak Y, který nebyl předmětem selekce • vlastnosti ve vazbě (skot: mléčné složky) a) přímá selekce – selekční zisk za jednu generaci lze získat za pomoci vztahu: Pxxx hiG .. 2  Pyyy hiG .. 2  xyGxykor bGG ..  Gx Gy GxGyyxG rb   . xyGyxkor bGG ..  Gy Gx GxGyxyG rb   . PxGxGyyxxkor rhhiG .....  PyGxGyyxykor rhhiG .....  Příklady genetických korelací skot rP rG rE produkce mléka : % tuku -0,26 -0,38 -0,18 prod. mléka v 1 : 2 laktaci 0,40 0,75 0,26 prasata přírůstek : hřbetní tuk 0,00 0,13 -0,18 přírůstek : výkrmnost 0,66 0,69 0,64 drůbež hm. těla : hm. vejce 0,33 0,42 0,23 hm. těla : snáška 0,01 -0,17 0,08