prof. Ing. Tomáš Urban, Ph.D. urban@mendelu.cz Genetika kvantitativních znaků Variance kvantitativní vlastnosti Projev kvantitativní vlastnosti je ovlivněn genetickými a prostřeďovými faktory: P = G + E Základní ? Kolik z celkové variance v populaci je způsobeno genetickými příčinami a kolik prostřeďovými? VP = VP + VE Odhalení genetické komponenty variance (určuje stupeň, kterým vlastnosti odpovídají na selekci) EIDA A P A VVVV V V V h  2 Komponenty (~ složky) variance Odhad genetických parametrů je synonymem pro odhad komponent pozorovatelné variance (včetně kovariancí) mezi příbuznými jedinci do příčinných komponent (VA, VD, VI, VEP, VET) Využití znalosti stupně příbuznosti mezi jedinci a z toho vyplývající očekávané kovariance mezi nimi Proč předpokládáme, že komplexní vlastnost může mít genetický základ? Protože je podobnost mezi příbuznými jedinci pro tu vlastnost! Chtěl kvantifikovat tyto rodinné podobnosti. Založil biometrický přístup ke genetice (regrese a korelace) Francis Galton F.R.S. 1822-1911 Vymyslel korelační koeficient (r) - Možno měřit stupeň asociace pro proměnnou mezi 2 příbuznými jedinci Pro vlastnost, která je kompletně geneticky determinovaná, s malým vlivem nebo bez vlivu prostředí, se očekává, že r bude stejný jako koeficient příbuznosti Příklady koeficientů příbuznosti 1. stupeň (rodič, sourozenci, dítě) ½ 2. Stupeň (strýc, neteř, vnuk) ¼ 3 . stupeň (bratranec, pra-) 1/8 4 . stupeň (bratranec z 2. kolena) 1/16 Koeficient příbuznosti vyjadřuje podíl genů sdílených 2 jedinci. Metody pro rozdělení fenotypové variance do dílčích komponent Princip: fenotypová podobnost mezi příbuznými jedinci poskytuje informaci o stupni genetických rozdílů mezi jedinci - aditivní komponenta primárně určuje stupeň, kterým se potomci podobají rodičům - tak ovládá míru odpovědi vlastnosti na selekci (G) VA ~ VPH Genetická podobnost Aditivně genetická podobnost ‘additive genetic relationship (A)’ mezi jedinci x a y je aXY Podíl alel, které jedinci x a y mají společné (IBD) Rodič – potomek a = 0,5 polosourozenci a = 0,25 Příbuznost Zdroj Stupeň příbuznosti Regresní koeficient R b Vlastní užitkovost 1 h2 Rodič ½ ½ h2 Prarodič ¼ ¼ h2 Praprarodič 1/8 1/8 h2 Vl. sourozenci – dvojče 1 h2 Vlastní sourozenec ½ ½ h2 Polosourozenec ¼ ¼ h2 Potomek ½ ½ h2 Aditivně genetická příbuznost A B C D X A B C D X A B C D X A B C 0,5 D X aCD = (0,5*0,5) + (0,5*0,5) = 0,5 = 0,5(aCA + aCB) = 0,5(0,5 + 0,5) = 0,5 aXX = 1 + (acd/2) = 1,25 A B C D X A 1 0 0,5 0,5 0,5 B 0 1 0,5 0,5 0,5 C 0,5 0,5 1 0,5 0,75 D 0,5 0,5 0,5 1 0,75 X 0,5 0,5 0,75 0,75 1,25 aii = 1 + 0,5(aom) aij = 0,5(ajo + ajm) 1,25 Genetická podobnost koeficient příbuznosti („coefficient of relationship“) (rxy) Podobný k axy, ale je upraven pro inbriding rodičů (0 – 1) )F1)(F1( a r yx xy xy   Podobnost mezi příbuznými jedinci Měření stejné vlastnosti na dvou příbuzných jedincích X a Y PX = AX + EX PY = AY + EY Korelace mezi fenotypy stejné vlastnosti existuje pro pár příbuzných jedinců v důsledku podobnosti genů a podobného prostředí Kovariance mezi PH stejné vlastnosti příbuzných jedinců = genetická příbuznost x genetická variance covAxAy = rXY . VA yx yx xyr  ,cov  A AXY A AA AA AA AA V Vr r YX YX YX YX  2 covcov  2 covcovcov hr V Vr V r XY P AXY P AA PP EEAA PP YX YX YXYX YX     Obecný vzorec korelace Korelace mezi PH příbuzných jedinců je rovna koeficientu příbuznosti Korelace mezi fenotypy příbuzných jedinců je rovna koeficientu příbuznosti x heritabilita 0cov YX EE Předpoklad: zvířata jsou chována v různém prostředí bez prostře. korelace Závěr Fenotypová podobnost mezi příbuznými jedinci závisí na stupni příbuznosti (podobné geny) a heritabilitě Genetická podobnost mezi příbuznými jedinci závisí na stupni přibuznosti: kovariance mezi PH: 2 hrr XYPP YX  AXYAA VrYX cov Způsoby odhadování heritability Odpověď na selekci: Regrese potomek – rodič: Regrese potomek – střed rodičů: Korelace polosourozenců: Korelace vlastních sourozenců: VCE s AM: d G hˆ2   RP 2 b2hˆ  OMP 2 bhˆ  ˆ4hˆ2  ˆ2hˆ2  2 P 2 A2 ˆ ˆ hˆ    Metody • podobnost rodičů a potomků • rozklad proměnlivosti • neparametrické metody • selekční experimenty 1. podobnost rodičů a potomků • regrese potomka na rodiče: h2 = 2.bxy • regrese potomka na průměr rodičů: h2 = bxy • regrese průměru potomků na průměr rodičů: h2 = bxy • korelace mezi sourozenci: h2 = 2.rxy • korelace mezi polosourozenci: h2 = 4.rxy Regrese potomek – rodič Model statistický: Zi = Xi + ei Zi – střední hodnota potomka i-tého otce  - regrese Z na X Xi – pozorovaná hodnota u i-tého otce ei – náhodná chyba spojená s Zi Př.: Ve velké neinbrední populaci slepic byla zjišťována ve věku osmi týdnů živá hmotnost kohoutů s přesností na jeden gram. V pohlavní dospělosti bylo 17 kohoutků náhodně pářeno se slepicemi a u jejich potomků samčího pohlaví byla opět zjišťována živá hmotnost ve stejném věku. Zjišťovaný genetický parametr, koeficient dědivosti, se bude vztahovat na populaci otců. rpbh . 2 .2ˆ  Výpočet vstupních hodnot regresního stavu  Zzi n ZX zxSS i iixz    . .    i ix n X xSS 2 2    i iz n Z zSS 2 2        i i i ii zx n X x n ZX zx b 2 2 . . zxbh .22  i n xi zi xi 2 zi 2 xi . zi 1 601 910 361201 828100 546910 2 733 983 537289 966289 720539 3 793 976 628849 952576 773968 4 795 1050 632025 1102500 834750 5 818 1080 669124 1166400 883440 6 838 1040 702244 1081600 871520 7 854 1040 729316 1081600 888160 8 880 1025 774400 1050625 902000 9 882 994 777924 988036 876708 10 895 1030 801025 1060900 921850 11 952 1021 906304 1042441 971992 12 953 1078 908209 1162084 1027334 13 961 964 923521 929296 926404 14 979 976 958441 952576 955504 15 995 1110 990025 1232100 1104450 16 997 1041 994009 1083681 1037877 17 1040 1035 1081600 1071225 1076400 14966 17353 13375506 17752029 15319806  Xxi Následuje výsledek této regresní analýzy (variance a kovariance), který byl získán v programu SAS. The REG Procedure Dependent Variable: y Analysis of Variance Sum of Mean Source DF Squares Square F Value Pr > F Model 1 9256.15665 9256.15665 4.72 0.0463 Error 15 29443 1962.86015 Corrected Total 16 38699 Root MSE 44.30418 R-Square 0.2392 Dependent Mean 1020.76471 Adj R-Sq 0.1885 Coeff Var 4.34029 Parameter Estimates Parameter Standard Variable DF Estimate Error t Value Pr > |t| Intercept 1 831.44274 87.84239 9.47 <.0001 x 1 0.21505 0.09903 2.17 0.0463 Střední chyba odhadu   )2.( 2 2    nSS SS SS SS SS s se x x xz z x zxb zxb ZXbh sese .22  • U některých druhů hospodářských zvířat může být otec připařován na několik matek a každá matka může mít několik potomků. Vliv otců může být odstraněn na základě výpočtu regrese potomků na matku uvnitř otců podle modelu: • Model: Zij =  + i + (xij – x..) + ei •Zij – střední hodnota potomků z páření i-tého otce a j-té matky •i – vliv i-tého otce - obecný střed populace  - regrese Z na X Xij - pozorovaná hodnota j-té matky pářené s i-tým otcem x.. - fenotypový průměr ei – náhodná chyba spojená s zij (odchylka od zij) Tabulka analýzy variance a kovariance: Zdroj proměnlivosti Součet čtverců odchylek Stupeň volnosti Průměrný čtverec Součet produktů xz Střední produkt xz SSx SSz df MSx MSz SP MP Mezi otci SSsx SSsz dfs = s-1 tato data nejsou třeba k výpočtům Mezi matkami uvnitř otců SSdx SSdz dfd = d – s MSdx MSdz SPdxz MPdxz Celková SScx SScz dfc = d – 1 - s – počet otců (sire), d – počet matek (dam), S – součet čtverců, MS – střední čtverec, Sp – součet produktů, MP – střední produkt (variance) ZX ZX ZX d d d d MP df SP cov Odhad regrese a dědivosti mezi matkami a dcerami uvnitř otců: X ZX ZXd ZXd X ZX X ZX d d sd S sd SP d d d d zx S SPMP b    2 var cov  zxbh .22  Odhad střední chyby koeficientu regrese a dědivosti: 1 )( 2 2    sd S SP S s X ZX Z ZX d d d b X ZX ZX d b b s s se 2  ZXbh sese .22  2 2 h seh  Otcové Matky xij Potomci zij Xi• Zi• ni X2 ij z2 ij xij . zij 1 754 808 2283 2228 3 568516 652864 609232 1 648 700 419904 490000 453600 1 881 720 776161 518400 634320 2 740 725 2264 2365 3 547600 525625 536500 2 712 840 506944 705600 598080 2 812 800 659344 640000 649600 3 765 780 1572 1620 2 585225 608400 596700 3 807 840 651249 705600 677880 4 969 850 2550 2482 3 938961 722500 823650 4 849 802 720801 643204 680898 4 732 830 535824 688900 607560 5 740 806 1481 1641 2 547600 649636 596440 5 741 835 549081 697225 618735 6 831 830 2203 2134 3 690561 688900 689730 6 639 800 408321 640000 511200 6 733 504 537289 254016 369432 Σ 12353 12470 16 9643381 9830870 9653557     i i i i j ijd n X xSS X 2 2 SS pro X SS pro Y     i i i i j ijd n Z zSS Z 2 2 Výpočet součtu produktů (součinů) vlastností X a Z mezi matkami uvnitř otců    i i ii i j ijijd n ZX zxSP ZX . . sd SP MP ZX ZXZX d dd  covX ZX d d zx SS SP b  zxbh .22  Následuje výsledek této analýzy variance a kovariance, který byl získán v programu SAS The GLM Procedure Dependent Variable: P Sum of Source DF Squares Mean Square F Value Pr > F Model 6 31134.0501 5189.0083 0.58 0.7409 Error 9 80929.6999 8992.1889 Corrected Total 15 112063.7500 R-Square Coeff Var Root MSE P Mean 0.277824 12.16708 94.82715 779.3750 Source DF Type I SS Mean Square F Value Pr > F O 5 30330.58333 6066.11667 0.67 0.6534 M 1 803.46673 803.46673 0.09 0.7718 Parameter Estimate Stdr. Error t Value Pr > |t| Intercept 637.7152160 B 252.2943565 2.53 0.0324 O 1 28.6599564 B 77.9408706 0.37 0.7216 O 2 74.9615501 B 77.7257832 0.96 0.3600 O 3 93.4869989 B 88.2822372 1.06 0.3172 O 4 104.4042276 B 86.6005504 1.21 0.2587 O 5 108.5484483 B 86.5896538 1.25 0.2416 O 6 0.0000000 B . . . M 0.1002516 0.3353824 0.30 0.7718 P – užitkovost potomků; M – užitkovost matek; O - otcové 2. Rozklad proměnlivosti • z analýzy variance • teoreticky vychází z předpokladu podobnosti příbuzných • Čím si jsou příbuzní podobnější náhodní jedinci v populaci, tím pro danou vlastnost odhadujeme vyšší hodnotu koeficientu heritability Využití užitkovostí rodin k odhadu heritability •Vysoká heritabilita –nízká variance v rodinách –vysoká variance mezi rodinami •Nízká heritabilita –vysoká variance v rodinách –nízká variance mezi rodinami Typ podobnosti rodiny Žádná Střední Vysoká Otec 1 2 3 1 2 3 1 2 3 Hodnota jedinců 1 1 1 3 2 1 1 2 3 2 2 2 2 1 3 1 2 3 3 3 3 1 2 3 1 2 3 Var mezi rodinami Nízká Střední Velká Var v rodinách Velká Střední Nízká Celková var = var mezi rodinami + var v rodinách Stená jako cov v rodinách h2 nízká střední vysoká Odhad dědivosti Nutná variance mezi a v rodinách Více rodin > větší přesnost odhadu Variance mezi rodinami = kovariance v rodinách Vysoká variance mezi rodinami (jsou odlišné) = vysoká kovariance v rodinách (členové v rodinách jsou podobní) Špatný odhad Dobrý odhad Odhad h2 u rodin polosourozenců •Variance mezi rodinami polosourozenců = kovariance mezi polosourozenci = ¼ VA •Variance v rodinách polosourozenců = reziduální varianci = VP – ¼ VA = ¾ VA + VE + VD P S P A V V V V h 42  • Komplikovanější odhad > společné prostředí > VEC (efekt maternálního prostředí) a VD (efekt dominance) • Variance mezi rodinami úplných sourozenců = kovariance mezi úplných sourozenci = ½ VA + VEC + ¼ VD • Variance v rodinách úplných sourozenců = reziduální varianci = VP – (½ VA + VEC + ¼ VD) = ½ VA + VE + ¾ VD Často bývá h2 přeodhadnuto, protože je obtížné oddělit genetické a ostatní efekty Odhad h2 u rodin vlastních sourozenců Metody odhadu genetických parametrů Analýza variance (ANOVA) – nejmenší čtverce Balancovaná data Nebalancovná data Hendersonovy metody (SAS, Harvey, SPSS, …) Věrohodnostní metody – maximální věrohodnost Maximální věrohodnost (ML) Restringovaná maximální věrohodnost (REML) Bayesian Methody Monte Carlo, Gibbs Sampling Komponenty variance Odhadované parametry VA Heritabilita VE VEP Opakovatelnost kovariance Korelace