Odhad plemenné hodnoty prof. Ing. Tomáš Urban, Ph.D. urban@mendelu.cz Genetika kvantitativních znaků Genetická variabilita > jedinci s různými genotypy > různí jedinci mají různou genetickou hodnotu Pro šlechtitele je důležitá plemenná hodnota > ovlivněna např. interakcemi mezi alelami v lokusu, … Gamety = 1 alela >>> PH závisí na efektech individuální alely, ne na efektech alelického páru na lokusu Plemenná hodnota – hodnota genů zvířete, které jsou předány jeho potomkům (součet efektů všech jeho genů pro danou vlastnost) Plemenná hodnota – pravděpodobnost, že potomstvo bude vykazovat dobré genetické založení Plemenná hodnota a genetické založení Kvantitativní charakter užitkových vlastností Lze zjistit rozdíly mezi užitkovostmi způsobené různými genotypy. Tyto rozdíly jsou odhadnutelné PH - odhad genetického založení jedince (jeho jedinečný genotyp) vyjádřené odchylkou v užitkové vlastnosti od průměru vrstevníků Odhad plemenné hodnoty (OPH) - je proces očištění genetických vlivů působících na užitkovost od činitelů NEGENETICKÉ povahy a vše ostatní „odstranit“ z vlivu Na základě závisle proměnné užitkovosti chci odhadnout genetické založení jedince  testace zvířat a jejich matematické vyhodnocení Stanovit přímý účinek genotypu jedince na vlastní užitkovost a to genů s aditivním účinkem OPH – odhad odchylky genetického založení. Genetické založení je „neodhadnutelné“, ale odhadnutelné jsou rozdíly v genetickém založení pomocí PH přímé změření: h2 =1, nebo ∞ potomků OPH = odhad rozdílů genetického založení (nejde o absolutní užitkovost) - vychází z fenotypové odchylku od průměru vrstevníků (referenční populace): D = yi -  Kontrola užitkovosti a výkonná výpočetní technika  přesto získáváme jen odhady Prostřeďové efekty Náhodné prostřeďové efekty (nesystematické) Nezjistitelná proměnlivost U každého jedince v různém směru (+ -) a velikosti Působí krátkodobě a na jedince (nelze kvantifikovat) Nelze fenotypovou hodnotu od těchto efektů očistit Systematické efekty pevné Působí na celou skupinu jedinců a dlouhodobě Většinou jsou prostřeďové Můžeme je eliminovat uspořádáním podmínek (standardizace) Matematicky – efekty v modelech u BLUP se rozlišují pevné a náhodné systematické efekty Vnější (oblast, podnik, stáj, rok, období, výživa, ošetřovatelé, …) Vnitřní (věk jedinců, věk matky, pohlaví, četnost vrhu, pořadí vrhu, pořadí laktace, …) Eliminace – pomocí korekčních faktorů se očišťují data pro OPH či genetických parametrů (h2, rop, rG) – v metodě MNČ Fenotypová hodnota: P = A + E* E* (D, I, náhodné prostředí) A (aditivní efekt) Odhad PH Př. Býk měl výrazně lepší (350 kg) hmotnost v 1 roce) než populační průměr (300 kg). Jeho fenotyp jako odchylka je +50 kg. Je však tato fenotypová odchylka způsobena jen genetickými rozdíly? Býk by mohl být dobrý podle svých genů, ale také z důvodu, že se vyvíjel v lepších podmínkách. Otázka zní, jaká část fenotypových odchylek je způsobena genetickými, tzn. plemennou hodnotou? OPH = heritabilita + fenotypová odchylka Větší část fenotypových rozdílů je připisována plemenné hodnotě, je-li heritabilita vyšší. Plemenná hodnota je odhadována regresí. Směrnice regresní přímky je heritabilita, která nám říká, jak velký rozdíl plemenné hodnoty lze očekávat za jednotku rozdílu fenotypu. Při informaci o vlastní užitkovosti zvířete je váha informace b = h2 více informací - zvýšení přesnosti OPH, tj. informace o korelovaných vlastnostech nebo o příbuzných jedincích, a lze vypočítat více vah mnohonásobným regresním modelem. Jednoduché vyjádření OPH OPH = b . D D = yi -  a r b 2  r2 – spolehlivost odhadu PH (reliability  R – v katalozích) – determinační koeficient; umocněná korelace r – přesnost (odmocnina spolehlivosti), korelace mezi genotypem (skutečnou PH) a fenotypem (OPH); spolehlivost je větší než přesnost a – aditivní příbuznost ke zdroji informací Regrese PH na fenotypovou hodnotu jedince     2 2 2 ,, 2 , , var cov var cov hb y a y eaa y ya y ya ya       Přesnost OPH - r hbr a y ya ya ya ya      ., , , aa,ya, rr Při odhadu PH na základě fenotypu platí: ya ya ya, ya ya, yba yba, aa aa, aa, r σσσbσ b σσσσ r , )( )( ˆ ˆ ˆ cov .. cov.covcov      Zvíře s  r2 má  D - nízká spolehlivost JE LEPŠÍ - -> lze očekávat větší ΔG  obě mají stejnou PH Zvíře s  r2 má  D Spolehlivost OPH – r2 2 r Přesnost: kolik rozdílů mezi SPH jsme schopni vysvětlit na základě OPH Přesnost: korelace mezi SPH a OPH Porovnání OPH zvířat s různými skupinami vrstevníků jedinec Hmotnost v 1 roce Průměr vrstevníků Fenotypová odchylka OPH Karel 330 300 +30 +12 Rudolf 300 260 +40 +16 40,02 h OPH = b . D = h2 .D PHp = ½ (PHO + PHM) PH rodičů ½ + ½ = 1 potomek Up = U + PHp otec PH + 500 ½ matka PH + 100 ½ PHp Cíl: růst genetické úrovně ve stádě; chceme, aby posun od U k Up byl co nejvyšší - maximální. Př. + 300 1 průměrná užitkovost rodičů (stáda) 5000 kg mléka ? Průměrná užitkovost potomků ? Spolehlivost selekce ( OPH) Předpovídáme PHP se spolehlivostí 25 %. 2 2 2 G I r    2 2 2 2 G A G OPH      Spolehlivost potomstva (PHp) )( 22 4 12 MO rrr  PH r2 (%) otec + 500 80 matka + 100 20 PHp + 300 25 (100:4) Př. 222 . GOPH r   Stejná chyba je, když je: - malý počet zvířat ohodnocených přesně - větší počet zvířat ohodnocených méně přesně PH zvířete je vyjádřena vzhledem k vrstevníkům v konkrétním čase a místě! Genetický zisk na základě OPH Genetický zisk: G = ½ (dotce + dmatky) (popř. G = d) Genetický zisk na základě vlastní užitkovosti rIA = h a pak 22 AOPH   phiG .. 2  Aph  . AIAriG .. A matekotcu matekIAmatekotcuIAotcu rok LL riri G . ..    Genetický zisk je přímo vázán na přesnost OPH. Př. Selekce na r Očekávaný genetický zisk Realizovaný genetický zisk OPH – průměru rodičů 0,45 +6,8 +5 OPH – vlastní užitkovost 0,63 +9,5 +11 Skutečná PH 1 +15 +17 σA = 19 i = 0,80 AIAriG .. Historie vývoje metod OPH Selekční indexy pro OPH jedince Vypočítaná hodnota > selekční kritérium (obsahovaly váhy pro různé informace); jedinci s nejvyšší hodnotou > pro plemenitbu Hazel a Lush (1942), rozvinul Henderson (1963) – metodu nejmenších čtverců Problém vychýlenosti pro nebalancovanost údajů pro systematické efekty prostředí OPH plemeníků na základě užitkovosti potomků Robertson a Rendel (1954) – dcery plemeníka se porovnávaly se současnými vrstevnicemi (contemporary comparison) Henderson et al. (1954) – dcera plemeníka se všemi stádovými vrstevnicemi po jiných plemenících (s průměrnou užitkovostí stáda v daném období) Těžko splnitelné podmínky – neexistence interakcí mezi plemeníky a stádem, nezohlednění genetické úrovně skupin dojnic BLUP pro OPH Lineární smíšené modely (korekce na fixní systematické efekty, pak odhad genetických parametrů a PH) Spolehlivý odhad variance a kovariance; system. efekty – fixní a náhodné Henderson (1963, 1973) – sire model, dam model BLUP – AM (komplexnější přístup) – individuální model (animal model) (Henderson 1988) (Quaas a Pollak (1980) Hodnotí se každé zvíře samostatně a současně v závislosti na příbuzných jedincích Každé zvíře má svou rovnici Spojení rovnic pomocí matice aditivní genetické příbuznosti A Zpřesnění odhadu plemenné hodnoty  opakování užitkovosti  počty jedinců  počty vrstevnic  zohlednění příbuzenských vztahů  korelované vlastnosti  korekce na vlivy prostředí (systematické) ),,( iiii eGFfy  iiii eGFy  1. Teoretický model (nemusí být vyhodnotitelný) y = f(x) 2. Praktický model –lineárně kombinujeme efekty ovlivňující veličinu y = a + b + … 3. Proveditelný model y = SRO + J + …další efekty  přesnost stoupá LSM - metoda nejmenších čtverců (MNČ) BLUP - nejlepší lineární nestranná předpověď (NLNP) (dokáže pracovat s náhodnými efekty, nemusí být na sobě nezávislé, ale mohou být i příbuzní jedinci AM - individuální model (IM) (zahrnuje každého jedince, využívá kompletně vzájemnou příbuznost zkoumaných zvířat) Nejlepší předpovědi BLUP - Best Linear Unbiased Prediction - nejlepší lineární nevychýlená předpověď NLNP (metoda nejmenších čtverců) - metoda odhadu nejmenších čtverců náhodných nebo smíšených modelů smíšený model: y = Xb + Zu + e X, Z – incidenční matice , udávající, které efekty jsou obsaženy v pozorování b – vektor obsahující všechny fixní efekty (fixní genetické rozdíly a systematické vlivy prostředí) u – vektor všech náhodných efektů (stádo, rok, sezóna); obsahuje také OPH e – náhodné nesystematické zbytkové efekty Odhad PH - BLUP AM BLUP - AM se provádí pomocí distribuční funkce f(T/y) T – hledané veličiny (vektor) y – naměřené užitkovosti (vektor) parciální derivací fce  hledáme průběh a extrém funkce  pomocí soustavy normálních rovnic  (maticová soustava) – Mixed Model Equation (MME) (W´R-1W + H-1)T = W´R-1y W – matice plánu experimentu, incidenční, designová (odhad PH) – rozepisuje se na matice X a Z ! R – kovarianční matice reziduí (chyb v datech) H – kovarianční matice mezi hledanými veličinami T – hledaná veličina u  PH • modelová rovnice (maticový zápis): smíšený lineární model yijk = bi + uj + eijk užitkovost = součet faktorů, které ji ovlivňují y = Xb + Zu + e • Aditivní plemenné hodnoty jsou náhodnými efekty se známou VCV maticí. • U vektorů u a e se předpokládá N a E(u) = E(e) = 0 • Vektor pozorování y má multivariátní normální rozdělení s průměrem Xb (E(y) = Xb) a variancí V V = V(Zu + e) = ZGZ` + R G je variančně kovarianční matice vektoru náhodných efektů u  V(u) R je variančně kovarianční matice reziduálních chyb  V(e) Nejsou-li otcové příbuzní pak je G = I σ2 O (σ2 O = ¼ σ2 A) Jsou-li otcové příbuzní pak G = A σ2 O (~ animal model) BLUE a BLUP jsou nejlepší, protože minimalizují výběrovou varianci; lineární v tom smyslu, že jsou lineárními funkcemi pozorovaných fenotypů y; nevychýlené ve smyslu, že E[BLUE(b)] = b a E[BLUP(u)] = u. BLUE pro pevné efekty b: BLUP pro náhodné efekty u: ~ OPH yVXXVXb 111 )(ˆ   )ˆ(ˆ 1 bXyVZGu   (Henderson, 1963)           - HZRZXRZ ZRXXRX 11 11       u b            yRZ yRX 1 1 LS T PS LS .T = PS T = LS-1.PS • modelová rovnice (maticový zápis): y = Xb + Zu + e • soustava normálních rovnic y – vektor naměřených užitkovostí (n) (n x 1) X – incidenční matice udávající plán pokusu pevných efektů X (n x p) Z – incidenční matice udávající plán pokusu náhodných efektů Z (n x q) b – vektor odhadů pevných efektů (odhad úrovní p) (p x 1) u – vektor odhadů náhodných efektů; u ~ PH (odhad úrovní q) (q x 1) e – vektor nekontrolovatelných náhodných reziduálních efektů (vektor reziduálních odchylek, u kterých se předpokládá, že jsou nezávislé na náhodných genetických efektech (n x 1) H- – kovarianční matice inverzní (Henderson, 1950) • Když jsou rezidua nekorelována a mají stejnou, konstantní varianci pak: 2 eIR  21 / eIR          2 e - 1 GZZXZ ZXXX       u b ˆ ˆ         yZ yX =         K-1 AZZXZ ZXXX       u b ˆ ˆ         yZ yX =       2 2 2 2 A e u e K 2 2 1 h h K   2 2 4 h h K   BLUP AM           - HZRZXRZ ZRXXRX 11 11       u b            yRZ yRX 1 1 BLUP Postup řešení BLUP AM • stanovit modelovou rovnici • ujasnit si teoretický model (vezmu v úvahu všechny faktory, které by mohly podle mě působit na výslednou užitkovost) • sestavit praktický model - proveditelný (tj. vyloučíme z vlivů ty, které nejsme schopni evidovat; SRO – snaha aby období bylo co nejkratší, protože krmení se může změnit během 14 dnů) • sestavit soustavu normálních rovnic, které se řeší: metoda nejmenších čtverců MNČ (LSM) – nejméně vhodná, protože řeší jen pevné efekty (X´X a b) body 2. a 3. závisí na konkrétním případě (každá země počítá AM trochu jinak – různé podmínky) lepší je metoda BLUP (NLNP) nejlepší je AM (IM) BLUP AM: yijkl =  + Si + Lj + gk + eijkl y = Xb +Zu + ePř.         KAZZXZ ZXXX 1-       u b          YZ YX 2 2 h h1 K                        15,0005,00 5,010025,00 001000 000100 5,025,00010 000001 A jedince stádo laktace užitkovost 1 1 1 4500 2* 1 1 5000 3 1 2 6500 4 2 2 8000 5* 2 1 7000 yijkl [~ y] - naměřená užitkovost  [~ X] - populační průměr Si , Lj [~ b] - stádo a laktace- působení chovatele na zvířata, na jejich užitkovost gk [~ u] – efekt jedince (genetický) – ten chceme určit - PH ! eijkl [~ e] – reziduum BLUP AM: yijkl =  + Si + Lj + gk + eijkl y = Xb +Zu + ePř.         KAZZXZ ZXXX 1-       u b          YZ YX 2 2 h h1 K                        15,0005,00 5,010025,00 001000 000100 5,025,00010 000001 A 1. stádo: 5472 kg 2. stádo: 7352 kg 1. laktace: - 574,4 kg 2. laktace: + 861,6 kg PH jedinců (krav): 1. –88 kg 2. 47 kg 3. 53 kg 4. – 53 kg 5. 62 kg PH otce: 44 kg mléka pořadí 5  3  2  4  1 jedince stádo laktace užitkovost 1 1 1 4500 2* 1 1 5000 3 1 2 6500 4 2 2 8000 5* 2 1 7000 pořadí kráva OPH užitkovost 1 5 +62 7000 2 3 +53 6500 3 2 +47 5000 4 4 -53 8000 5 1 -88 4500 yijkl [~ y] - naměřená užitkovost  [~ X] - populační průměr Si , Lj [~ b] - stádo a laktace- působení chovatele na zvířata, na jejich užitkovost gk [~ u] – efekt jedince (genetický) – ten chceme určit - PH ! eijkl [~ e] – reziduum Systém genetického hodnocení pomáhá při navrhování šlechtitelských programů Systém genetického hodnocení pomáhá při navrhování šlechtitelských programů Selekce na fenotyp Selekce na OPH Year of Birth 1992 1993 1994 1995 1996 1997 Phenotype Year of Birth 1992 1993 1994 1995 1996 1997 BLUP EBV Rok narozeníRok narození Rok narozeníRok narození fenotypfenotyp BLUP OPHBLUP OPH Principy genetického zlepšení pomocí selekce P fm fm rok h LL ii G 2    AapriG  L ri G Aap rok   P p d i   Kvantitativně molekulární přístup – genomická selekce 34 Typy molekulárně genetických dat (z hlediska aplikace) Kandidátní geny Funkční markery (Funkcional marker) Přímé markery (Direct marker) Lokusy kvantitativních znaků, QTL LD markery (Linkage Disequilibrum markers) LE markery (Linkage Equilibrum markers) SNP označují alelickou diferenci mezi dvěma homologními chromozomy Nukleotidové sekvence obou chromozomů jsou identické kromě markeru SNP a alely QTL. 36 Genetické markery I. typ - kódující geny, kandidátní geny II. typ - mikrosatelity (MS), krátkodobé tandemové sekvence bazí (STR1) III typ - bi-alelický jednonukleotidový polymorfismus (SNP) v kódujících nebo častěji v nekódujících intronových či intergenových regionech 37 Molekulární genetika ve šlechtění MAS – marker assisted selection (vazba s QTL) GAS – gene assisted selection (QTN – quantitative trait nucleotide – použití kandidátních genů) Genomická selekce (GS) – Genomic selection (SNP rovnoměrně po celém genomu) Využívání znalosti skutečné genetické variability (mutace v genech nebo v jejich blízkosti) detekovatelné metodami molekulární genetiky Jejich aplikace ve šlechtění v systémech selekce GS – začlenění matice genomických SNP markerů do rovnic BLUPAM (různé varianty) a odhadnutí GEBV (genomická OPH) This approach permits simultaneous selection of most quantitative trait loci (QTLs) determining the selected trait GS makes it possible to save 92% of the funds spent on traditional selection and is twice as efficient as the latte. Náklady na sekvenování 1 Mb DNA 2001: 5,292.39 $ 2003: 2,230.98 $ 2005: 766.73 $ 2007: 397.09 $ 2009: 0.78 $ 2011: 0.19 $ Zdroj: NHGRI Metody předpovědi genomické plemenné hodnoty Bylo vyvinuto několik různých metod pro zahrnutí informací z genetických čipů do hodnocení jedinců vycházející z metody BLUP. Metody lze jednoduše dělit na metody jednokrokové a vícekrokové. Nebo na metody založené na předpovědi regresních koeficientů jednotlivých SNP a na metody založené na nahrazení matice příbuznosti, nebo její úpravě. (Jiménez-Montero et al., 2013) 42 y = Zu + Qq + e -> MA-BLUP -> MEBV u – vektor polygenních efektů q – vektor QTL efektů Použití metody BLUP pro odhad genomické plemenné hodnoty