Genetika kvantitativních znaků Heritabilita II - metody odhadu koeficientu heritability prof. Ing. Tomáš Urban, Ph.D. urban@mendelu. cz Variance kvantitativní vlastnosti Projev kvantitativní vlastnosti je ovlivněn genetickými a protřeďovými faktory: P = G + E Základní ? Kolik z celkové variance v populaci je způsobeno genetickými příčinami a kolik prostřeďovými VP = VP + VE y y h2 — _A — A vp vA+vD+vl+vE Odhalení genetické komponenty variance (určuje stupeň, kterým vlastnosti odpovídají na selekci) Komponenty (~ složky) variance Odhad genetických parametrů je synonymem pro odhad komponent pozorovatelné variance (včetně kovariancí) mezi příbuznými jedinci do příčinných komponent (VA, VD, Vh VEP, VET) Využití znalosti stupně příbuznosti mezi jedinci a z toho vyplývající očekávané kovariance mezi nimi Proč předpokládáme, že komplexní vlastnost může mít genetický základ? Protože je podobnost mezi příbuznými jedinci pro tu vlastnost! Francis Galton F.R.S. 1822-1911 Chtěl kvantifikovat tyto rodinné podobnosti. Založil biometrický přístup ke genetice (regrese a korelace) Vymyslel korelační koeficient (r) - Možno měřit stupeň asociace pro proměnnou mezi 2 příbuznými jedinci Pro vlastnost, která je kompletně geneticky determinovaná, s malým nebo bez vlivu prostředí, se očekává, že r bude stejný jako koeficient příbuznosti Koeficient příbuznosti vyjadřuje podíl genů sdílených 2 jedinci. Příklady koeficientů příbuznosti 1. stupeň (rodič, sourozenci, dítě) Ví 2. Stupeň (strýc, neteř, vnuk) 1á 3 . stupeň (bratranec, pra-) 1/8 4 . stupeň (bratranec z 2. kolena) 1/16 Metody pro rozdělení fenotypové variance do dílčích komponent Princip: fenotypová podobnost mezi příbuznými jedinci poskytuje informaci o stupni genetických rozdílů mezi jedinci - aditivní komponenta primárně určuje stupeň, kterým se potomci podobají rodičům - tak ovládá míru odpovědi vlastnosti na selekci (AG) VA ~ Vph Genetická podobnost Aditivně genetická podobnost 'additive genetic relationship (A)' mezi jedinci x a yje Podíl alel, které jedinci x a y mají společné (IBD) Rodič - potomek a = 0,5 polosourozenci a = 0,25 Příbuznost Zdroj Stupeň příbuznosti Regresní koeficient R b Vlastní užitkovost 1 h2 Rodič 1/2 1/2h2 Prarodič % %h2 Prapra rodič 1/8 1/8 h2 VI. sourozenci - dvojče 1 h2 Vlastní sourozenec 1/2 1/2h2 Polosourozenec % %h2 Potomek 1/2 1/2h2 Aditivně genetická příbuznost a» =1 + °<5(a°m) aä = 0,5(ajo + ajm) A B C D X A 1 0 0,5 0,5 0,5 B 0 1 0,5 0,5 0,5 C 0,5 0,5 m 0,75 D 0,5 0,5 0,5 i 0,75 X 0,5 0,5 0,75 0,75 1,25 aCD _ axx _ (0,5*0,5) + (0,5*0,5) = 0,5 = 0,5(aCA + aCB) = 0,5(0,5 + 0,5) 1 + (acd/2) = 1,25 - Metodou úsekových koeficientů 0,5 - Pomocí vzorců nad maticí Genetická podobnost koeficient příbuznosti ^coefficient of relationship") (rxy) Podobný k axy, ale je upraven pro inbriding rodičů (0-1) r = xy xy Vd + Fx)(1 + Fy) Podobnost mezi příbuznými jedinci Měření stejné vlastnosti na dvou příbuzných jedincích X a Y Px = A* + Ex Korelace mezi fenotypy stejné vlastnosti existuje pro pár příbuzných jedinců v důsledku podobnosti genů a podobného prostředí Kovariance mezi PH stejné vlastnosti příbuzných jedinců genetická příbuznost x genetická variance C0VAxAy = ľXY ■ COVxy Obecný vzorec korelace ^xy Korelace mezi PH COV, , COV, , rV. příbuzných jedinců r _ "x"y _ »xay _ 'XY"A je rovna koeficientu AxAr (7Ax(TAy g\ Va \ Příbuznosti r = cov^ + cov^ = covAxAf = rXYVA = f ft2 w apaPy \ Vp Vp XY * Korelace mezi fenotypy covfxfy = 0 příbuzných jedinců Předpoklad: zvířata jsou chována v je rovna koeficientu různém prostředí bez prostře, korelace příbuznosti x heritabilita Závěr Fenotypová podobnost mezi příbuznými jedinci závisí na stupni příbuznosti (podobné geny) a heritabilitě ľ —r h2 'PXPy 'XY" Genetická podobnost mezi příbuznými jedinci závisí na stupni příbuznosti: kovariance mezi PH: covMr = rXYVA Způsoby odhadování heritability Odpověď na selekci: h2 _ AG ~ d Regrese potomek - rodič: h2 = 2 bp_R Regrese potomek - střed rodičů: h2 = b Korelace polosourozenců: h2 = 4p Korelace vlastních sourozenců: h2 = 2p VCEsAM: h2 Ar2 Metody odhadu heritability na základě: • podobnost rodičů a potomků • rozklad proměnlivosti • neparametrické metody • selekční experimenty 1. podobnost rodičů a potomků • regrese potomka na rodiče: h2 = 2.bxy • regrese potomka na průměr rodičů: h2 = bxy • regrese průměru potomků na průměr rodičů: h2 = b • korelace mezi sourozenci: h2 = 2.rYV • korelace mezi polosourozenci: h2 = 4.rxv Regrese potomek - rodič h2 = 2.bpj Model statistický: Z, = pX, + e, Z, - střední hodnota potomka i-tého otce p - regrese Z na X Xi - pozorovaná hodnota u i-tého otce e, - náhodná chyba spojená s Z, Př.: Ve velké neinbrední populaci slepic byla zjišťována ve věku osmi týdnů živá hmotnost kohoutů s přesností najeden gram. V pohlavní dospělosti bylo 17 kohoutků(otcové) náhodně pářeno se slepicemi a u jejich potomků samčího pohlaví byla opět zjišťována živá hmotnost ve stejném věku. Zjišťovaný genetický parametr, koeficient dědivosti, se bude vztahovat na populaci otců. Výpočet vstupních hodnot regresního stavu 55xz = X x,.z, -^'Z n 5S, = Z X 2 Xl n ss2 = X^2-- n ; -Z; b = ZX X. .Z. n Z2 X. x,-- n n xi xi2 Zj2 xi ■ zi 1 601 910 361201 828100 546910 2 733 983 537289 966289 720539 3 793 976 628849 952576 773968 4 795 1050 632025 1102500 834750 5 818 1080 669124 1166400 883440 6 838 1040 702244 1081600 871520 7 854 1040 729316 1081600 888160 8 880 1025 774400 1050625 902000 g 882 994 777924 988036 876708 10 895 1030 801025 1060900 921850 11 952 1021 906304 1042441 971992 12 953 1078 908209 1162084 1027334 13 961 964 923521 929296 926404 14 979 976 958441 952576 955504 15 995 1110 990025 1232100 1104450 16 997 1041 994009 1083681 1037877 17 1040 1035 1081600 1071225 1076400 14966 17353 13375506 17752029 15319806 Sx, = x. Sz; = Z. h2=2.b ZX Následuje výsledek této regresní analýzy (variance a kovariance), který byl získán v programu SAS. The REG Procedure Dependent Variable: y Analysis of Variance Source DF Squares Sum of Square Mean F Value Pr > F Model Error Corrected Total 1 15 16 9256.15665 29443 38699 9256.15665 1962.86015 4 . 72 0.0463 Root MSE Dependent Mean Coeff Var 44 . 30418 1020.76471 4 . 34029 R-Square Adj R-Sq 0.2392 0.1885 Parameter Estimates Variable DF Parameter Estimate Standard Error t Value Pr > I t I Intercept 831.44274 0.21505 87 .84239 0.09903 9 . 47 2 . 17 <.0001 0.0463 Střední chyba odhadu SS. i SS _ x SSY.{n-2) seh2 = 2.seb zx • U některých druhů hospodářských zvířat může být otec připařován na několik matek a každá matka muže mít několik potomků. Vliv otců může být odstraněn na základě výpočtu regrese potomků na matku uvnitř otců podle modelu: • Model: Zy = jlx + a, + p(xy - x ) + e, •Zjj - střední hodnota potomků z páření i-tého otce a j-té matky •a, - vliv i-tého otce obecný střed populace p - regrese Z na X Xjj - pozorovaná hodnota j-té matky pářené s i-tým otcem x - fenotypový průměr e, - náhodná chyba spojená s Zy (odchylka od Zy) Tabulka analýzy variance a kovariance: Zdroj proměnlivosti Součet čtverců odchylek Stupeň volnosti Průměrný čtverec Souc.et.*° Střední produkt produktu ^ M xz xz ssx ssz df MSX MSZ SP MP Mezi otci sssx sssz dfs = s-1 tato data nejsou třeba k výpočtům Mezi matkami uvnitř otců ssdx ssdz dfd = d - s MSdx MSdz SPdxz MPdxz Celková sscx sscz dfc=d-1 - - s - počet otců (sire), d - počet matek (dam), S - součet čtverců, MS - střední čtverec, Sp - součet produktů, MP - střední produkt (variance) cov. SP dt MP, Odhad regrese a dědivosti mezi matkami a dcerami uvnitř otců: COV, sp. 'zx Jzx zx var d-s SdZX d-s 'zx h2=2.b zx Odhad střední chyby koeficientu regrese a dědivosti: wj2 Sb7y °zx C/-S-1 Jzx se., =2.se. Jzx h2±seh2 Otcové Matky xy Potomci zy xi- ni X2y z2y xy-zij 1 754 808 568516 652864 609232 1 648 700 2283 2228 3 419904 490000 453600 1 881 720 776161 518400 634320 2 740 725 547600 525625 536500 2 712 840 2264 2365 3 506944 705600 598080 2 812 800 659344 640000 649600 3 3 765 807 780 840 1572 1620 2 585225 651249 608400 705600 596700 677880 4 969 850 938961 722500 823650 4 849 802 2550 2482 3 720801 643204 680898 4 732 830 535824 688900 607560 5 5 740 741 806 835 1481 1641 2 547600 549081 649636 697225 596440 618735 6 831 830 690561 688900 689730 6 639 800 2203 2134 3 408321 640000 511200 6 733 504 537289 254016 369432 Z 12353 12470 16 9643381 9830870 9653557 b = zx SP, 'zx h2=2.b zx mezi matkami uvnitř otců SS pro X x. SS pro Y Výpočet součtu produktů (součinů) vlastností X a Z ' i SP, covrf = MPd = ^*- dzx dzx Následuje výsledek této analýzy variance a kovariance, který byl získán v programu SAS The GLM Procedure Dependent Variable: P _Source_ PF Sum of Sauares Mean Square F Value Pr > F Model Error Corrected Total 6 9 15 31134.0501 80929.6999 112063.7500 5189.0083 8992.1889 0 . 5E 0.7409 R-Square Source 0.277824 _DF Coeff Var Root MSE P Mean 12.1670Í Type I SS 94.82715 779.3750 Mean Square_F Value Pr > F 0 M 30330.58333 803.46673 6066.11667 803.46673 0 . 67 0 . 09 0.6534 0.7718 Parameter Estimate Stdr. Error t Value Pr > It Intercept 637.7152160 B 252 2943565 2 53 0 0324 0 1 28.6599564 B 77 9408706 0 37 0 7216 0 2 74.9615501 B 77 7257832 0 96 0 3600 0 3 93.4869989 B 88 2822372 1 06 0 3172 0 4 104.4042276 B 86 6005504 1 21 0 2587 0 5 108.5484483 B 86 5896538 1 25 0 2416 0 6 0.0000000 B M 0.1002516 0 3353824 0 30 0 7718 užitkovost potomků; M - užitkovost matek; 0 - otcové 2. Rozklad proměnlivosti • z analýzy variance • teoreticky vychází z předpokladu podobnosti příbuzných • Čím si jsou příbuzní podobnější náhodní jedinci v populaci, tím pro danou vlastnost odhadujeme vyšší hodnotu koeficientu heritability Využití užitkovostí rodin k odhadu heritability •Vysoká heritabilita -Nízká heritabilita -nízká variance v rodinách -vysoká variance mezi rodinami -vysoká variance v rodinách -nízká variance mezi rodinami Otec Hodnota jedinců Var mezi rodinami Typ podobnosti rodiny Žádná Střední Vysoká 1 1 Nízká Střední i Velká Varv rodinách Velká Střední h2 nízká střední Celková var = var mezi rodinami + var v rodinách Nízká vysoká Stená jako covv rodinách Odhad dědivosti Nutná variance mezi a v rodinách Více rodin > větší přesnost odhadu Variance mezi rodinami = kovariance v rodinách Vysoká variance mezi rodinami (jsou odlišné) = vysoká kovariance v rodinách (členové v rodinách jsou podobní) 0 0 0 0 ^f-i 4-i 4-J v^j Špatný odhad o °o° o00 o°0 Dobrý odhad Odhad h2 u rodin polosourozenců •Variance mezi rodinami polosourozenců = kovariance mezi polosourozenci = 1áVa •Variance v rodinách polosourozenců = reziduálni varianci = Vp - V* VA = 3A VA + VE + VD Odhad h2 u rodin vlastních sourozenců • Komplikovanější odhad > společné prostředí > VEC (efekt maternálního prostředí) a VD (efekt dominance) • Variance mezi rodinami úplných sourozenců = kovariance mezi úplných sourozenci = y2vA + vEC + y4vD • Variance v rodinách úplných sourozenců = reziduálni varianci = Vp - (1/2 VA + VEC + 1á Vd) = y2vA+vE+3/4VD Často bývá h2 přeodhadnuto, protože je obtížné oddělit genetické a ostatní efekty Metody odhadu genetických parametrů Analýza variance (ANOVA) - nejmenší čtverce Balancovaná data Nebalancovná data Hendersonovy metody (SAS, Harvey, SPSS, ...) Věrohodnostní metody - maximální věrohodnost Maximální věrohodnost (ML) Restringovaná maximální věrohodnost (REML) Bayesian Methody Monte Carlo, Gibbs Sampling Komponenty Odhadované variance parametry vA Heritabilita VE Vep Opakovatelnost kovariance Korelace