prof. Ing. Tomáš Urban, Ph.D.
urban@mendelu.cz
Genetika kvantitativních znaků
Variance kvantitativní vlastnosti
Projev kvantitativní vlastnosti je ovlivněn genetickými a
protřeďovými faktory: P = G + E
Základní ?
Kolik z celkové variance v populaci je způsobeno
genetickými příčinami a kolik prostřeďovými
VP = VP + VE
Odhalení genetické komponenty variance (určuje stupeň,
kterým vlastnosti odpovídají na selekci)
Komponenty (~ složky) variance
Odhad genetických parametrů je synonymem pro odhad
komponent pozorovatelné variance (včetně
kovariancí) mezi příbuznými jedinci do příčinných
komponent (VA, VD, VI, VEP, VET)
Využití znalosti stupně příbuznosti mezi jedinci a z toho
vyplývající očekávané kovariance mezi nimi
Proč předpokládáme, že komplexní vlastnost může
mít genetický základ?
Protože je podobnost ve vlastnosti mezi
příbuznými jedinci než mezi nepříbuznými!
Chtěl kvantifikovat tyto rodinné podobnosti.
Založil biometrický přístup (regrese a korelace)
Francis Galton F.R.S. 1822-1911
Vymyslel korelační koeficient (r)
- Možno měřit stupeň asociace pro proměnnou
mezi 2 příbuznými jedinci
Pro vlastnost, která je kompletně geneticky
determinovaná, s malým vlivem nebo bez vlivu
prostředí, se očekává, že r bude stejný jako
koeficient příbuznosti
Příklady koeficientů příbuznosti
1. stupeň (rodič, sourozenci, dítě) ½
2. stupeň (strýc, neteř, vnuk) ¼
3 . stupeň (bratranec, pra-) 1/8
4 . stupeň (bratranec z 2. kolena) 1/16
Koeficient příbuznosti vyjadřuje podíl genů
sdílených dvěma jedinci
Metody pro rozdělení fenotypové
variance do dílčích komponent
Princip: fenotypová podobnost mezi příbuznými jedinci
poskytuje informaci o stupni genetických rozdílů mezi
jedinci
- aditivní komponenta primárně určuje stupeň, kterým se
potomci podobají rodičům
- tak ovládá míru odpovědi vlastnosti na selekci (G)
VA ~ VPH
Genetická podobnost
Aditivně genetická podobnost ‘additive genetic
relationship (A)’ mezi jedinci x a y je aXY
Podíl alel, které jedinci x a y mají společné (IBD)
Rodič – potomek a = 0,5
polosourozenci a = 0,25
Příbuznost
Zdroj
Stupeň
příbuznosti
Regresní
koeficient
R b
Vlastní užitkovost 1 h2
Rodič ½ ½ h2
Prarodič ¼ ¼ h2
Praprarodič 1/8 1/8 h2
Vl. sourozenci – dvojče 1 h2
Vlastní sourozenec ½ ½ h2
Polosourozenec ¼ ¼ h2
Potomek ½ ½ h2
Aditivně genetická příbuznost
A B C D X
A
B
C
D
X
A B C D X
A
B
C 0,5
D
X
aCD = (0,5*0,5) + (0,5*0,5) = 0,5
= 0,5(aCA + aCB) = 0,5(0,5 + 0,5) = 0,5
aXX = 1 + (acd/2) = 1,25
A B C D X
A 1 0 0,5 0,5 0,5
B 0 1 0,5 0,5 0,5
C 0,5 0,5 1 0,5 0,75
D 0,5 0,5 0,5 1 0,75
X 0,5 0,5 0,75 0,75 1,25
aii = 1 + 0,5(aom)
aij = 0,5(ajo + ajm)
1,25
Genetická podobnost
koeficient příbuznosti („coefficient of relationship“)
(rxy)
Podobný k axy, ale je upraven pro inbreeding rodičů
(0 – 1)
)F1)(F1(
a
r
yx
xy
xy


Podobnost mezi příbuznými jedinci
Měření stejné vlastnosti na dvou příbuzných jedincích X a Y
PX = AX + EX
PY = AY + EY
Korelace mezi fenotypy stejné vlastnosti existuje pro pár
příbuzných jedinců v důsledku podobnosti genů a
podobného prostředí
Kovariance mezi PH stejné vlastnosti příbuzných jedinců =
genetická příbuznost x genetická variance
covAxAy = rXY . VA
yx
yx
xyr

,cov

A
AXY
A
AA
AA
AA
AA
V
Vr
r YX
YX
YX
YX
 2
covcov

2
covcovcov
hr
V
Vr
V
r XY
P
AXY
P
AA
PP
EEAA
PP
YX
YX
YXYX
YX




Obecný vzorec korelace
Korelace mezi PH
příbuzných jedinců
je rovna koeficientu
příbuznosti
Korelace mezi fenotypy
příbuzných jedinců
je rovna koeficientu
příbuznosti x heritabilita
0cov YX EE
Předpoklad: zvířata jsou chována v různém
prostředí bez prostřeďové korelace
Závěr
Fenotypová podobnost mezi příbuznými jedinci
závisí na stupni příbuznosti (podobné geny) a
heritabilitě
Genetická podobnost mezi příbuznými jedinci závisí
na stupni přibuznosti: kovariance mezi PH:
2
hrr XYPP YX

AXYAA VrYX
cov
Způsoby odhadování heritability
Odpověď na selekci:
Regrese potomek – rodič:
Regrese potomek – střed rodičů:
Korelace polosourozenců:
Korelace vlastních sourozenců:
VCE s AM:
d
G
hˆ2 

RP
2
b2hˆ

OMP
2
bhˆ

ˆ4hˆ2

ˆ2hˆ2

2
P
2
A2
ˆ
ˆ
hˆ



Metody
• podobnost rodičů a potomků
• rozklad proměnlivosti
• neparametrické metody
• selekční experimenty
1. podobnost rodičů a potomků
• regrese potomka na rodiče: h2 = 2.bxy
• regrese potomka na průměr rodičů: h2 = bxy
• regrese průměru potomků na průměr rodičů: h2 = bxy
• korelace mezi sourozenci: h2 = 2.rxy
• korelace mezi polosourozenci: h2 = 4.rxy
Regrese potomek – rodič
Model statistický: Zi = Xi + ei
Zi – střední hodnota potomka i-tého otce
 - regrese Z na X
Xi – pozorovaná hodnota u i-tého otce
ei – náhodná chyba spojená s Zi
Př.: Ve velké neinbrední populaci slepic byla zjišťována ve
věku osmi týdnů živá hmotnost kohoutů s přesností na
jeden gram. V pohlavní dospělosti bylo 17 kohoutků
náhodně pářeno se slepicemi a u jejich potomků
samčího pohlaví byla opět zjišťována živá hmotnost ve
stejném věku. Zjišťovaný genetický parametr, koeficient
dědivosti, se bude vztahovat na populaci otců.
rpbh .
2
.2ˆ 
Výpočet vstupních hodnot
regresního stavu
 Zzi
n
ZX
zxSS
i
iixz

 
.
.
 

i
ix
n
X
xSS
2
2
 

i
iz
n
Z
zSS
2
2
215,0
.
.
2
2








i
i
i
ii
zx
n
X
x
n
ZX
zx
b
43,0.22
 zxbh
i
n xi zi xi
2 zi
2 xi . Zi
1 601 910 361201 828100 546910
2 733 983 537289 966289 720539
3 793 976 628849 952576 773968
4 795 1050 632025 1102500 834750
5 818 1080 669124 1166400 883440
6 838 1040 702244 1081600 871520
7 854 1040 729316 1081600 888160
8 880 1025 774400 1050625 902000
9 882 994 777924 988036 876708
10 895 1030 801025 1060900 921850
11 952 1021 906304 1042441 971992
12 953 1078 908209 1162084 1027334
13 961 964 923521 929296 926404
14 979 976 958441 952576 955504
15 995 1110 990025 1232100 1104450
16 997 1041 994009 1083681 1037877
17 1040 1035 1081600 1071225 1076400
14966 17353 13375506 17752029 15319806
 Xxi
covxz
Vx
Vz
Střední chyba odhadu
 
099,0
)2.(
2
2




nSS
SS
SS
SS
SS
s
se
x
x
xz
z
x
zxb
zxb
198,0.22  ZXbh
sese
198,043,02
2
 h
seh
Následuje výsledek této regresní analýzy (variance a kovariance),
který byl získán v programu SAS.
The REG Procedure
Dependent Variable: x
Analysis of Variance
Sum of Mean
Source DF Squares Square F Value Pr > F
Model 1 9256.15665 9256.15665 4.72 0.0463
Error 15 29443 1962.86015
Corrected Total 16 38699
Root MSE 44.30418 R-Square 0.2392
Dependent Mean 1020.76471 Adj R-Sq 0.1885
Coeff Var 4.34029
Parameter Estimates
Parameter Standard
Variable DF Estimate Error t Value Pr > |t|
Intercept 1 831.44274 87.84239 9.47 <.0001
x 1 0.21505 0.09903 2.17 0.0463
U některých druhů hospodářských zvířat může být otec připařován na několik
matek a každá matka může mít několik potomků. Vliv otců může být odstraněn
na základě výpočtu regrese potomků na matku uvnitř otců podle modelu:
• Model: Zij =  + i + (xij – x..) + ei
Zij – střední hodnota potomků z páření i-tého otce a j-té matky
- obecný střed populace
i – vliv i-tého otce
 - regrese Z na X
Xij - pozorovaná hodnota j-té matky pářené s i-tým otcem
x.. - fenotypový průměr
ei – náhodná chyba spojená s zij (odchylka od zij)
Tabulka analýzy variance a kovariance:
Zdroj proměnlivosti
Součet čtverců
odchylek
Stupeň
volnosti
Průměrný čtverec
Součet
produktů
xz
Střední produkt
xz
SSx SSz df MSx MSz SP MP
Mezi otci SSsx SSsz dfs = s-1 tato data nejsou třeba k výpočtům
Mezi matkami
uvnitř otců
SSdx SSdz dfd = d – s MSdx MSdz SPdxz MPdxz
Celková SScx SScz dfc = d – 1 - s
– počet otců (sire), d – počet matek (dam), S – součet čtverců, MS – střední čtverec, Sp – součet produktů, MP – střední produkt
(variance)
ZX
ZX
ZX d
d
d
d MP
df
SP
cov
Odhad regrese a dědivosti mezi matkami a dcerami uvnitř otců:
X
ZX
ZXd
ZXd
X
ZX
X
ZX
d
d
sd
S
sd
SP
d
d
d
d
zx
S
SPMP
b 


2
var
cov

zxbh .22

Odhad střední chyby koeficientu regrese a dědivosti:
1
)( 2
2



sd
S
SP
S
s X
ZX
Z
ZX
d
d
d
b
X
ZX
ZX
d
b
b
s
s
se
2
 ZXbh
sese .22 
2
2
h
seh 
Otcové Matky xij Potomci zij Xi• Zi• ni X2
ij z2
ij xij . zij
1 754 808
2283 2228 3
568516 652864 609232
1 648 700 419904 490000 453600
1 881 720 776161 518400 634320
2 740 725
2264 2365 3
547600 525625 536500
2 712 840 506944 705600 598080
2 812 800 659344 640000 649600
3 765 780
1572 1620 2
585225 608400 596700
3 807 840 651249 705600 677880
4 969 850
2550 2482 3
938961 722500 823650
4 849 802 720801 643204 680898
4 732 830 535824 688900 607560
5 740 806
1481 1641 2
547600 649636 596440
5 741 835 549081 697225 618735
6 831 830
2203 2134 3
690561 688900 689730
6 639 800 408321 640000 511200
6 733 504 537289 254016 369432
Σ 12353 12470 16 9643381 9830870 9653557
  

i i i
i
j
ijd
n
X
xSS X
2
2
SS pro X
SS pro Y
  

i i i
i
j
ijd
n
Z
zSS Z
2
2
Výpočet součtu
produktů
(součinů)
vlastností X a Z
mezi matkami
uvnitř otců
 

i i
ii
i j
ijijd
n
ZX
zxSP ZX
.
.
sd
SP
MP ZX
ZXZX
d
dd

cov
10,0
X
ZX
d
d
zx
SS
SP
b 20,0.22
 zxbh
Následuje výsledek této analýzy variance a kovariance, který byl získán
v programu SAS
The GLM Procedure
Dependent Variable: P
Sum of
Source DF Squares Mean Square F Value Pr > F
Model 6 31134.0501 5189.0083 0.58 0.7409
Error 9 80929.6999 8992.1889
Corrected Total 15 112063.7500
R-Square Coeff Var Root MSE P Mean
0.277824 12.16708 94.82715 779.3750
Source DF Type I SS Mean Square F Value Pr > F
O 5 30330.58333 6066.11667 0.67 0.6534
M 1 803.46673 803.46673 0.09 0.7718
Parameter Estimate Stdr. Error t Value Pr > |t|
Intercept 637.7152160 B 252.2943565 2.53 0.0324
O 1 28.6599564 B 77.9408706 0.37 0.7216
O 2 74.9615501 B 77.7257832 0.96 0.3600
O 3 93.4869989 B 88.2822372 1.06 0.3172
O 4 104.4042276 B 86.6005504 1.21 0.2587
O 5 108.5484483 B 86.5896538 1.25 0.2416
O 6 0.0000000 B . . .
M 0.1002516 0.3353824 0.30 0.7718
P – užitkovost potomků; M – užitkovost matek; O - otcové
2. Rozklad proměnlivosti
• z analýzy variance
• teoreticky vychází z předpokladu fenotypové
podobnosti příbuzných jedinců
• Čím si jsou příbuzní podobnější náhodní jedinci
v populaci, tím pro danou vlastnost odhadujeme
vyšší hodnotu koeficientu heritability
Využití užitkovostí rodin k odhadu
heritability
• Vysoká heritabilita
– nízká variance v
rodinách
– vysoká variance
mezi rodinami
• Nízká heritabilita
– vysoká variance
v rodinách
– nízká variance
mezi rodinami
Typ podobnosti rodiny
Žádná Střední Vysoká
Otec 1 2 3 1 2 3 1 2 3
Hodnota
jedinců
1 1 1 3 2 1 1 2 3
2 2 2 2 1 3 1 2 3
3 3 3 1 2 3 1 2 3
Var mezi
rodinami
Nízká Střední Velká
Var v rodinách Velká Střední Nízká
Celková var = var mezi rodinami + var v rodinách
Stená jako cov v rodinách
h2 nízká střední vysoká
Odhad dědivosti
Nutná variance mezi a v rodinách
Více rodin > větší přesnost odhadu
Variance mezi rodinami = kovariance v rodinách
Vysoká variance mezi rodinami (jsou odlišné) = vysoká kovariance
v rodinách (členové v rodinách jsou podobní)
Špatný odhad
Dobrý odhad
Odhad h2 u rodin polosourozenců
•Variance mezi rodinami polosourozenců
= kovariance mezi polosourozenci = ¼ VA
•Variance v rodinách polosourozenců
= reziduální varianci = VP – ¼ VA = ¾ VA + VE + VD
P
S
P
A
V
V
V
V
h
42

• Komplikovanější odhad > společné prostředí > VEC (efekt
maternálního prostředí) a VD (efekt dominance)
• Variance mezi rodinami úplných sourozenců
= kovariance mezi úplných sourozenci
= ½ VA + VEC + ¼ VD
• Variance v rodinách úplných sourozenců
= reziduální varianci = VP – (½ VA + VEC + ¼ VD)
= ½ VA + VE + ¾ VD
Často bývá h2 přeodhadnuto, protože je obtížné oddělit genetické a ostatní
efekty
Odhad h2 u rodin vlastních sourozenců
Metody odhadu genetických parametrů
Analýza variance (ANOVA) – nejmenší čtverce
Balancovaná data
Nebalancovná data
Hendersonovy metody (SAS, Harvey, SPSS, …)
Věrohodnostní metody – maximální věrohodnost
Maximální věrohodnost (ML)
Restringovaná maximální věrohodnost (REML)
Bayesian Methody
Monte Carlo, Gibbs Sampling
Komponenty
variance
Odhadované
parametry
VA Heritabilita
VE
VEP Opakovatelnost
kovariance Korelace