prof. Ing. Tomáš Urban, Ph.D. urban@mendelu.cz Genetika kvantitativních znaků Heredity and Heritability – výsledek dotazu chatGPT Heredity refers to the transmission of genetic information from one generation to  the next. This genetic information is stored in the DNA and is inherited from the parents to their offspring during the reproductive process. Heritability, on the other hand, refers to the extent to which individual differences in a trait can be attributed to genetic factors. Heritability is often expressed as a  percentage ranging from 0% to 100%, with higher heritability indicating that genetic factors play a larger role in determining individual differences in a trait. It is important to note that heritability does not indicate the extent to which a trait is determined solely by genetic factors. Environmental factors can also play a  significant role in the development and expression of many traits. Heritability estimates can be influenced by factors such as the genetic relatedness of the individuals being studied, the environment in which they are raised, and the measurement techniques used to assess the trait in question. Variance kvantitativní vlastnosti Projev kvantitativní vlastnosti je ovlivněn genetickými a protřeďovými faktory: P = G + E Základní ? Kolik z celkové variance v populaci je způsobeno genetickými příčinami a kolik prostřeďovými VP = VG + VE Odhalení genetické komponenty variance (určuje stupeň, kterým vlastnosti odpovídají na selekci) 2 A A P A D I E V V h V V V V V      Komponenty (~ složky) variance Odhad genetických parametrů je synonymem pro odhad komponent pozorovatelné variance (včetně kovariancí) mezi příbuznými jedinci do příčinných komponent (VA, VD, VI, VEP, VET) Využití znalosti stupně příbuznosti mezi jedinci a z toho vyplývající očekávané kovariance mezi nimi Proč předpokládáme, že komplexní vlastnost může mít genetický základ? Protože je podobnost mezi příbuznými jedinci pro tu vlastnost! Chtěl kvantifikovat tyto rodinné podobnosti. Založil biometrický přístup ke genetice (regrese a korelace) Francis Galton F.R.S. 1822-1911 Vymyslel korelační koeficient (r) - Možno měřit stupeň asociace pro proměnnou mezi 2 příbuznými jedinci Pro vlastnost, která je kompletně geneticky determinovaná, s malým nebo bez vlivu prostředí, se očekává, že r bude stejný jako koeficient příbuznosti Příklady koeficientů příbuznosti 1. stupeň (rodič, sourozenci, dítě) ½ 2. Stupeň (strýc, neteř, vnuk) ¼ 3 . stupeň (bratranec, pra-) 1/8 4 . stupeň (bratranec z 2. kolena) 1/16 Koeficient příbuznosti vyjadřuje podíl genů sdílených 2 jedinci. Metody pro rozdělení fenotypové variance do dílčích komponent Princip: fenotypová podobnost mezi příbuznými jedinci poskytuje informaci o stupni genetických rozdílů mezi jedinci - aditivní komponenta primárně určuje stupeň, kterým se potomci podobají rodičům - tak ovládá míru odpovědi vlastnosti na selekci (G) VA ~ VPH Genetická podobnost Aditivně genetická podobnost ‘additive genetic relationship (A)’ mezi jedinci x a y je aXY Podíl alel, které jedinci x a y mají společné (IBD) Rodič – potomek a = 0,5 polosourozenci a = 0,25 Příbuznost Regresní koeficient Stupeň příbuznostiZdroj bR h21Vlastní užitkovost ½ h2½Rodič ¼ h2¼Prarodič 1/8 h21/8Praprarodič h21Vl. sourozenci – dvojče ½ h2½Vlastní sourozenec ¼ h2¼Polosourozenec ½ h2½Potomek Aditivně genetická příbuznost XDCBA A B C D X XDCBA A B 0,5C D X aCD = (0,5*0,5) + (0,5*0,5) = 0,5 = 0,5(aCA + aCB) = 0,5(0,5 + 0,5) = 0,5 aXX = 1 + (acd/2) = 1,25 XDCBA 0,50,50,501A 0,50,50,510B 0,750,510,50,5C 0,7510,50,50,5D 1,250,750,750,50,5X aii = 1 + 0,5(aom) aij = 0,5(ajo + ajm) 1,25 - Metodou úsekových koeficientů - Pomocí vzorců nad maticí Genetická podobnost koeficient příbuznosti („coefficient of relationship“) (rxy) Podobný k axy, ale je upraven pro inbriding rodičů (0 – 1) )F1)(F1( a r yx xy xy   Podobnost mezi příbuznými jedinci Měření stejné vlastnosti na dvou příbuzných jedincích X a Y PX = AX + EX PY = AY + EY Korelace mezi fenotypy stejné vlastnosti existuje pro pár příbuzných jedinců v důsledku podobnosti genů a podobného prostředí Kovariance mezi PH stejné vlastnosti příbuzných jedinců = genetická příbuznost x genetická variance covAxAy = rXY . VA yx yx xyr  ,cov  A AXY A AA AA AA AA V Vr r YX YX YX YX  2 covcov  2 covcovcov hr V Vr V r XY P AXY P AA PP EEAA PP YX YX YXYX YX     Obecný vzorec korelace Korelace mezi PH (aditivně genetické) příbuzných jedinců je rovna koeficientu příbuznosti Korelace mezi fenotypy příbuzných jedinců je rovna koeficientu příbuznosti x heritabilita 0cov YX EE Předpoklad: zvířata jsou chována v různém prostředí bez prostře. korelace Závěr Fenotypová podobnost mezi příbuznými jedinci závisí na stupni příbuznosti (podobné geny) a heritabilitě Genetická podobnost mezi příbuznými jedinci závisí na stupni přibuznosti: kovariance mezi PH: 2 hrr XYPP YX  AXYAA VrYX cov Způsoby odhadování heritability Odpověď na selekci: Regrese potomek – rodič: Regrese potomek – střed rodičů: Korelace polosourozenců: Korelace vlastních sourozenců: VCE s AM: d G hˆ2   RP 2 b2hˆ  OMP 2 bhˆ  ˆ4hˆ2  ˆ2hˆ2  2 P 2 A2 ˆ ˆ hˆ    Metody odhadu heritability na základě: • podobnost rodičů a potomků • rozklad proměnlivosti • neparametrické metody • selekční experimenty 1. podobnost rodičů a potomků • regrese potomka na rodiče: h2 = 2.bxy • regrese potomka na průměr rodičů: h2 = bxy • regrese průměru potomků na průměr rodičů: h2 = bxy • korelace mezi sourozenci: h2 = 2.rxy • korelace mezi polosourozenci: h2 = 4.rxy Regrese potomek – rodič Model statistický: Zi = Xi + ei Zi – střední hodnota potomka i-tého otce  - regrese Z na X Xi – pozorovaná hodnota u i-tého otce ei – náhodná chyba spojená s Zi Př.: Ve velké neinbrední populaci slepic byla zjišťována ve věku osmi týdnů živá hmotnost kohoutů s přesností na jeden gram. V pohlavní dospělosti bylo 17 kohoutků (~ otcové) náhodně pářeno se slepicemi a u jejich potomků samčího pohlaví byla opět zjišťována živá hmotnost ve stejném věku. Zjišťovaný genetický parametr, koeficient dědivosti, se bude vztahovat na populaci otců. rpbh . 2 .2ˆ  Výpočet vstupních hodnot regresního stavu  Zzi n ZX zxSS i iixz    . .    i ix n X xSS 2 2    i iz n Z zSS 2 2        i i i ii zx n X x n ZX zx b 2 2 . . zxbh .22  i xi . zizi 2xi 2zixin 5469108281003612019106011 7205399662895372899837332 7739689525766288499767933 834750110250063202510507954 883440116640066912410808185 871520108160070224410408386 888160108160072931610408547 902000105062577440010258808 8767089880367779249948829 9218501060900801025103089510 9719921042441906304102195211 10273341162084908209107895312 92640492929692352196496113 95550495257695844197697914 11044501232100990025111099515 10378771083681994009104199716 1076400107122510816001035104017 1531980617752029133755061735314966  Xxi Následuje výsledek této regresní analýzy (variance a kovariance), který byl získán v programu SAS. The GLM Procedure Dependent Variable: y Analysis of Variance Sum of Mean Source DF Squares Square F Value Pr > F Model 1 9256.15665 9256.15665 4.72 0.0463 Error 15 29443 1962.86015 Corrected Total 16 38699 Root MSE 44.30418 R-Square 0.2392 Dependent Mean 1020.76471 Adj R-Sq 0.1885 Coeff Var 4.34029 Parameter Estimates Parameter Standard Variable DF Estimate Error t Value Pr > |t| Intercept 1 831.44274 87.84239 9.47 <.0001 x 1 0.21505 0.09903 2.17 0.0463 Program R reg <- lm(z ~ x, data=data_reg1) summary(reg) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 831.44274 87.84239 9.465 1.02e-07 *** x 0.21505 0.09903 2.172 0.0463 * Střední chyba odhadu   )2.( 2 2    nSS SS SS SS SS s se x x xz z x zxb zxb ZXbh sese .22  zxbh .22  2*0,21505 = 0,4301 2*0,09903 = 0,19806 • U některých druhů hospodářských zvířat může být otec připařován na několik matek a každá matka může mít několik potomků. Vliv otců může být odstraněn na základě výpočtu regrese potomků na matku uvnitř otců podle modelu: • Model: Zij =  + i + (xij – x..) + ei •Zij – střední hodnota potomků z páření i-tého otce a j-té matky •i – vliv i-tého otce - obecný střed populace  - regrese Z na X Xij - pozorovaná hodnota j-té matky pářené s i-tým otcem x.. - fenotypový průměr ei – náhodná chyba spojená s zij (odchylka od zij) Tabulka analýzy variance a kovariance: Střední produkt xz (kovariance) Součet produkt ů xz Průměrný čtverec (variance) Stupeň volnost i Součet čtverců odchylek Zdroj proměnlivosti MPSPMSzMSxdfSSzSSx tato data nejsou třeba k výpočtůmdfs = s-1SSszSSsxMezi otci MPdxzSPdxzMSdzMSdxdfd = d – sSSdzSSdx Mezi matkami uvnitř otců --dfc = d – 1SSczSScxCelková s – počet otců (sire), d – počet matek (dam), SS – součet čtverců, MS – střední čtverec (variance), SP – součet produktů, MP – střední produkt (kovariance) ZX ZX ZX d d d d MP df SP cov Odhad regrese a dědivosti mezi matkami a dcerami uvnitř otců: X ZX ZXd ZXd X ZX X ZX d d sd S sd SP d d d d zx S SPMP b    2 var cov  zxbh .22  Odhad střední chyby koeficientu regrese a dědivosti: 1 )( 2 2    sd S SP S s X ZX Z ZX d d d b X ZX ZX d b b s s se 2  ZXbh sese .22  2 2 h seh  xij . zijz2 ijX2 ijniZi•Xi•Potomci zijMatky xijOtcové 609232652864568516 322282283 8087541 4536004900004199047006481 6343205184007761617208811 536500525625547600 323652264 7257402 5980807056005069448407122 6496006400006593448008122 596700608400585225 216201572 7807653 6778807056006512498408073 823650722500938961 324822550 8509694 6808986432047208018028494 6075606889005358248307324 596440649636547600 216411481 8067405 6187356972255490818357415 689730688900690561 321342203 8308316 5112006400004083218006396 3694322540165372895047336 965355798308709643381161247012353Σ     i i i i j ijd n X xSS X 2 2 SS pro X SS pro Y     i i i i j ijd n Z zSS Z 2 2 Výpočet součtu produktů (součinů) vlastností X a Z mezi matkami uvnitř otců    i i ii i j ijijd n ZX zxSP ZX . . sd SP MP ZX ZXZX d dd  cov X ZX d d zx SS SP b  zxbh .22  Následuje výsledek této analýzy variance a kovariance, který byl získán v programech SAS a R The GLM Procedure v SAS Dependent Variable: P Sum of Source DF Squares Mean Square F Value Pr > F Model 6 31134.0501 5189.0083 0.58 0.7409 Error 9 80929.6999 8992.1889 Corrected Total 15 112063.7500 R-Square Coeff Var Root MSE P Mean 0.277824 12.16708 94.82715 779.3750 Source DF Type I SS Mean Square F Value Pr > F O 5 30330.58333 6066.11667 0.67 0.6534 M 1 803.46673 803.46673 0.09 0.7718 Parameter Estimate Stdr. Error t Value Pr > |t| Intercept 637.7152160 B 252.2943565 2.53 0.0324 O 1 28.6599564 B 77.9408706 0.37 0.7216 O 2 74.9615501 B 77.7257832 0.96 0.3600 O 3 93.4869989 B 88.2822372 1.06 0.3172 O 4 104.4042276 B 86.6005504 1.21 0.2587 O 5 108.5484483 B 86.5896538 1.25 0.2416 O 6 0.0000000 B . . . M 0.1002516 0.3353824 0.30 0.7718 P – užitkovost potomků; M – užitkovost matek; O – otcové Následuje výsledek této analýzy variance a kovariance, který byl získán v programech SAS a R V programu R reg2 <- lm(PotomciZ ~ Otcové + MatkyX, data=data_reg2) summary(reg2) Residuals: Min 1Q Median 3Q Max -207.200 -28.756 8.328 34.907 108.976 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 666.3752 261.0320 2.553 0.031 * OtcovéB 46.3016 77.4552 0.598 0.565 OtcovéC 64.8270 86.9701 0.745 0.475 OtcovéD 75.7443 82.9805 0.913 0.385 OtcovéF 79.8885 86.8376 0.920 0.382 OtcovéG -28.6600 77.9409 -0.368 0.722 MatkyX 0.1003 0.3354 0.299 0.772 h2 = 0,20 ± 0,67 2. Rozklad proměnlivosti • z analýzy variance • teoreticky vychází z předpokladu podobnosti příbuzných • Čím si jsou příbuzní podobnější náhodní jedinci v populaci, tím pro danou vlastnost odhadujeme vyšší hodnotu koeficientu heritability Využití užitkovostí rodin k odhadu heritability • Vysoká heritabilita – nízká variance v rodinách – vysoká variance mezi rodinami • Nízká heritabilita – vysoká variance v rodinách – nízká variance mezi rodinami Typ podobnosti rodiny VysokáStředníŽádná 321321321Otec 321123111 Hodnota jedinců 321312222 321321333 VelkáStředníNízká Var mezi rodinami NízkáStředníVelkáVar v rodinách Celková var = var mezi rodinami + var v rodinách Stená jako cov v rodinách vysokástřednínízkáh2 Odhad dědivosti Nutná variance mezi a v rodinách Více rodin > větší přesnost odhadu Variance mezi rodinami = kovariance v rodinách Vysoká variance mezi rodinami (jsou odlišné) = vysoká kovariance v rodinách (členové v rodinách jsou podobní) Špatný odhad Dobrý odhad Odhad h2 u rodin polosourozenců •Variance mezi rodinami polosourozenců = kovariance mezi polosourozenci = ¼ VA •Variance v rodinách polosourozenců = reziduální varianci = VP – ¼ VA = ¾ VA + VE + VD P S P A V V V V h 42  • Komplikovanější odhad > společné prostředí > VEC (efekt maternálního prostředí) a VD (efekt dominance) • Variance mezi rodinami úplných sourozenců = kovariance mezi úplných sourozenci = ½ VA + VEC + ¼ VD • Variance v rodinách úplných sourozenců = reziduální varianci = VP – (½ VA + VEC + ¼ VD) = ½ VA + VE + ¾ VD Často bývá h2 přeodhadnuto, protože je obtížné oddělit genetické a ostatní efekty Odhad h2 u rodin vlastních sourozenců Metody odhadu genetických parametrů Analýza variance (ANOVA) – nejmenší čtverce Balancovaná data Nebalancovná data Hendersonovy metody (SAS, Harvey, SPSS, …) Věrohodnostní metody – maximální věrohodnost Maximální věrohodnost (ML) Restringovaná maximální věrohodnost (REML) Bayesian Methody Monte Carlo, Gibbs Sampling Odhadované parametry Komponenty variance HeritabilitaVA VE OpakovatelnostVEP Korelacekovariance