Genetika kvantitativních znaků - principy, vlastnosti a aplikace statistiky prof. Ing. Tomáš Urban, Ph.D. urban@mendelu.cz Genetika kvantitativních znaků Genetika kvantitativních vlastností vychází z Mendelistická genetika – dědičnost (přenos GI) vlastností s diskrétními hodnotami fenotypu – individuální efekt genu Genetika populací kvalitativních znaků – Model genetiky populací – 1 gen a 2 alely – změny v alelových frekvencích genů u vlastností s diskrétními hodnotami – nutné určit, kterou alelu jedinec nese Mnoho vlastností však nemá diskrétní hodnoty, nýbrž kontinuální variabilitu,  genetika populací kvantitativních vlastností Kvantitativní genetika Základní typy vlastností Diskontinuální / diskrétní (nespojité) vlastnosti – výrazně definované fenotypové kategorie – vlastnosti určované 1 nebo několika geny (major gen), bez vlivu prostředí → Mendelistický polymorfismus → většina fenotypové variability KVALITATIVNÍ VLASTNOST Kontinuální / spojité / komplexní vlastnosti – nevýrazně definované kategorie fenotypů – rozdělení fenotypů vykazuje více nebo méně kontinuální variabilitu (lze zjistit jen rozmezí hodnot pro vlastnost) – vlastnosti jsou určovány geny na mnoha lokusech → polygenní dědičnost – geny kvantitativních vlastností (QTL)  polygeny – většina genů má malý, ale aditivní účinek (minor geny) – vlivy prostředí na projev a distribuci fenotypů – každý gen je děděn mendelisticky, ale nelze vidět jeho efekt  KVANTITATIVNÍ VLASTNOST Kvalitativní vlastnosti Kvantitativní vlastnosti • diskontinuální, nespojitá (diskrétní) variabilita • kontinuální, spojitá variabilita • podmíněna 1 nebo několika málo geny • podmíněna mnoha geny na více lokusech • monogenní (popř. oligenní) dědičnost • polygenní dědičnost • mendelistické poměry v F1 • poměry v F1 nejsou mendelistické • lze určit fenotypovou hodnotu každého genotypu • rozdělení fenotypů vykazují více nebo méně kontinuální variabilitu (lze určit rozmezí hodnot) • vlastnosti jsou hodnoceny podle kvality projevu (rohatost - bezrohost, červený - bílý květ, ...) • vlastnosti jsou kvantifikovány měřením, vážení, počítáním, ... • geny s interakčními účinky (dominance, epistáze) • vlastnosti jsou determinovány geny velkého účinku (nepřispívají kvantitativně) a větším počtem genů malého účinku (polygeny), většina genů má aditivní účinek • na projev vlastnosti nemá vliv prostředí • projev vlastnosti modifikuje vliv prostředí • lze detekovat efekt jednotlivých genů podílejících se na vlastnosti • nelze rozpoznat účinek jednotlivých genů podílejících se na vlastnosti Přesto se všechny geny se dědí jako informační jednotky, t.j. u diploidních organizmů je každý gen v buňce přítomen 2x (jeden od otce a druhý od matky), bez ohledu determinují-li vlastnost kvalitativní nebo kvantitativní (rozdíl lze pozorovat v jejich fenotypovém projevu + specifické odchylky jako např. imprinting genů!) Hodnocení genetické variability u kvantitativních vlastností Klasický přístup – jsou změřeny fenotypy jedinců se známými příbuzenskými vztahy a genetické a prostřeďové zdroje fenotypové variance jsou určeny statistickými metodami (ANOVA, ML,…) Příbuzní jedinci sdílejí určitý podíl společných genů (to je kvantifikováno koeficientem příbuznosti rIJ) Molekulárně statistický přístup – nejnovější technika mapování lokusů kvantitativních vlastností (QTL – quantitative trait loci) pomocí markerů a asociování s fenotypovými hodnotami Hledají se sekvence DNA pomocí genetických markerů (SNP) po celém genomu a jejich statistické asociace k fenotypové variabilitě, popř. expresi (opět má slovo statistika!) Mouse Models of Blood Pressure Regulation and Hypertension: Fumihiro Sugiyama, Ken-ichi Yagami, and Beverly Paigen ; Current Hypertension Reports (2001). 3:41-48 Příklady kvantitativních vlastností Vlastnosti s plynulou kontinuální proměnlivostí - výnos obilí, rezistence k nemocem u rostlin i živočichů, přírůstek hmotnosti, výška v kohoutku, obsah tuku v mase, IQ, schopnost naučit se, krevní tlak, … Vlastnosti prahové (threshold) – projev nemoci (schizofrenie, cukrovka), výskyt dvojčat Vlastnosti meristické - počet selat ve vrhu, počet zrn v klase Základní otázky Základní zásada QG: viditelná variabilita je způsobena kombinací působení mnoha genů a faktorů prostředí Nebo: fenotyp = „genotyp“ + prostředí Základní otázky (a odpovědi?): 1. Jaká je genetická podstata kvantitativních vlastností? (jsou podmíněny normálními geny podléhající Mendelovým pravidlům). 2. Jak můžeme odlišit efekty genů od efektů prostředí? (např. inbreedingem lze eliminovat genetickou varianci). 3. Jak můžeme předpovědět a kontrolovat výsledky z křížení? (např. umělou selekcí). Kvantitativní geny jsou mendelovské geny V r. 1909 Herman Nilsson-Ehle (Švédsko) provedl řadu experimentů s pšenicí - barva zrna. Současná pšenice je hexaploidní, výsledek 3 různých druhů tvořící stabilního hybrida, allopolyploid. > 3 podobné, ale trochu odlišné genomy pšenice, nazvané A, B a D. Každý genom má jeden gen, který ovlivňuje barvu zrna, a každý tento lokus má alelu pro červenou barvu a alelu pro bílou barvu. • červené alely: A, B a D, • bílé alely a, b a d. Forma dědičnosti těchto alel je „aditivita“. Množství červeného pigmentu v zrnu je úměrné přítomnému počtu červených alel, od 0 do 6. Počet aditivních alel: 0 1 2 3 4 5 6 Segregace a volná kombinovatelnosti tří genů a aditivním působením Průměr = 3 Variance = 1,5 Přechod od kvality ke kvantitě Př.: 2 geny, A & B kontrolují vlastnost Alela A = 4 jednotky B = 2 jednotky a = 2 jednotky b = 1 jednotka Genotyp G. poměr v F2 Metrická hodnota AABB 1 12 AABb 2 11 AAbb 1 10 AaBB 2 10 AaBb 4 9 Aabb 2 8 aaBB 1 8 aaBb 2 7 aabb 1 6 Grafické znázornění příkladu 0 1 2 3 4 5 6 aabb 7 aaBb 8 Aabb aaBB 9 AaBb 10 Aabb AaBB 11 AABb 12 AABB Frekvence Očekávaná distribuce za současné segregace dvou alel na každém lokusu: Vlivy prostředí na kvantitativní vlastnosti Rok Výnos genotypů (bu/akr) Roughrider Seward Agassiz 1986 47,9 55,9 47,5 1987 63,8 72,5 59,5 1988 23,1 25,7 28,4 1989 61,6 66,5 60,5 1990 0 0 0 1991 60,3 71,0 55,4 1992 46,6 49,0 41,5 1993 58,2 62,9 48,8 1994 41,7 53,2 39,8 1995 53,1 65,1 53,5 Poznámka … Všechny rostliny v r. 1990 nepřezimovaly. Modifikující vliv prostředí Důležitý koncept v kvantitativní genetice Fenotyp = genetické faktory + faktory prostředí P = G + E Variabilita –> variance (VP) Pro pochopení heritability je třeba znát více kvantitativní variabilitu. Co to je, přesně, co pozorujeme, když studujeme kvantitativní vlastnost? Variabilitu mezi fenotypy! -> fenotypová variance (VP) je základní informace používaná v kvantitativní genetice Fenotyp vyplývá z genotypu interagujícího s prostředím Lze říci, že VP je způsobena variancí genů (genotypů) a variancí prostředí: VP = VG + VE Studované otázky QG Jaký je podíl genetických faktorů a prostředí na fenotypu? Kolika geny je ovlivněna vlastnost? Je příspěvek genů stejný? Jak alely na různých lokusech interagují: aditivně? epistaticky? Jak rychle se změní vlastnost pod selekcí? Kontinuální variabilita - normální distribuce • Problémy kontinuálních vlastností lze rozdělit do dvou typů: – většina je ovlivněna alelami na dvou a více lokusech a segregace jakéhokoliv genu v rodokmenu je zastřena segregací ostatních genů ovlivňujících vlastnost, – většina kontinuálních vlastností jsou ovlivněny faktory prostředí stejně jako geny a genetická segregace je zastřena prostřeďovými efekty. • Pokud se u mnoha kontinuálních vlastností fenotypy seskupí do vhodných intervalů a zobrazen pomocí pruhového grafu, pak bude distribuce fenotypů vyhovovat normálnímu rozložení, které je symetrické, s křivkou zvonovitého tvaru. Hladká křivka je normálním rozložením, které nejlépe odpovídá datům. – Rovnice normální křivky (funkci hustoty pravděpodobnosti) je: 22 2)( 2 1 )(       x ef x Popis kvantitativních vlastností Tyto vlastnosti nemohou být analyzovány tradičními technikami mendelistické genetiky (~ genetikou populací kvalitativních znaků) Statistické analýzy n x n xxx x in    .....21 n xxxxxx s n X 22 2 2 12 )(.....)()(   V n xxi     2 )( 2 xx ss  Graf distribuce fenotypové proměnlivosti Variance je změřená variabilita distribuce  1  zahrnuje 68,3 %  2  zahrnuje 95,5 %  3  zahrnuje 99,7 % Příklad: Délka ouška u kukuřice a Mendelův design pokusu Generace Průměr (cm) sx (cm) P1 16,80 0,817 P2 6,63 1,887 F1 12,12 1,519 F2 12,89 2,252 •závěry: – průměrná délka ouška linie P2 je menší, sx je větší  je zde větší variabilita než v linii s delšími oušky P1 – variabilita v populaci F1 je v důsledku variability prostředí – průměr vlastnosti v F1 populaci je střední mezi oběma rodiči a průměr F2 populace je přibližně stejný jako v F1 – F2 populace má větší variabilitu než F1 – extrémní hodnoty distribuce by měly být rovny hodnotám rodičů, protože část populace bude mít jejich genotyp Generace Průměr (cm) sx (cm) P1 16,80 0,817 P2 6,63 1,887 F1 12,12 1,519 F2 12,89 2,252 http://www.ebi.ac.uk/gwas/home 2017 2018 m 2022 Animal QTL databáze Animal Quantitative Trait Loci (QTL) Database (Animal QTLdb) se snaží sbírat všechny publikované mapovací data, tj. QTL (fenotyp/exprese, eQTL), kandidátní gen a asociační data (GWAS), a copy number variations (CNV) zmapované v genomech HZ. (v závorce stav 2016) Cattle QTL There are 177 199 (81,652) QTLs from 1090 (710) publications curated into the database. Those QTLs represent 689 (519) different traits. Chicken QTL There are 16 271 (5,683) QTLs from 367 (250) publications curated into the database. Those QTLs represent 442 (355) different traits. Horse QTL There are 2 605 (1,197) QTLs from 104 (66) publications curated into the database. Those QTLs represent 64 (41) different traits. Pig QTL There are 34 342 (16,033) QTLs from 757 (557) publications curated into the database. Those QTLs represent 708 (627) different traits. Sheep QTL There are 4 072 (1,336) QTLs from 211 (119) publications curated into the database. Those QTLs represent 278 (212) different traits. Rainbow Trout QTL There are 1 413 QTLs from 21 publications curated into the database. Those QTLs represent 28 different traits. www.animalgenome.org Year Number of QTL 1994 10 1995 9 1996 1 1997 2 1998 99 1999 72 2000 129 2001 98 2002 232 2003 379 2004 343 2005 234 2006 164 2007 350 2008 887 2009 875 2010 5,680 2011 19,073 2012 4,675 2013 25,434 2014 8,142 2015 5,337 2016 25,894 2017 15,409 2018 6,824 2019 10,680 2020 43,461 2021 2,422 Chromosome Number of QTL 1 4,174 2 4,650 3 4,430 4 5,456 5 8,098 6 23,469 7 4,094 8 2,155 9 2,364 10 3,410 11 4,678 12 2,125 13 3,636 14 18,958 15 2,199 16 2,405 17 5,992 18 3,185 19 4,246 20 5,485 21 4,179 22 1,712 23 2,015 24 1,254 25 3,597 26 14,545 27 1,775 28 1,167 29 5,657 30 8 X 25,797 Analýza variance - ANOVA Příklad jednofaktorové analýzy variance hodnocení fenotypové proměnlivosti snášky u slepic jednoho chovu. Na základě jednofaktorové analýzy variance chceme zjistit, zda existují průkazné rozdíly ve snášce u potomstva po čtyřech kohoutech, chceme znát, zda „genetický“ vliv otec byl průkazný nebo neprůkazný. Ve sledování jsou čtyři skupiny slepic a v každé je potomstvo po jednom ze čtyř kohoutů, jedná se tedy o skupiny polosourozenců. Model jednofaktorové analýzy variance: yij =  + ai + eij yij – užitkovost j-tého potomka po i-tém otci  – obecný průměr populace ai – vliv i-tého otce eij – ostatní nahodilé vlivy Tabulka analýzy variance: proc glm ; class otec; MODEL y = otec /solution; proc mixed; class otec; MODEL y = ; random otec; proc nested; CLASS otec; VAR y; proc varcomp maxiter=50 method=reml; class otec; model y = otec ; Různé způsoby výpočtů variance otcovské v SASu Syntaxe v programu R Načtení dat z EXCELU (soubor ve formátu csv) a provedení 1f ANOVA data2 <- read.table("C:/R/data2.csv") #načte data, ale i s hlavičkou a oddělené středníkem data2 <- read.table("C:/R/data2.csv", header=T, sep=";") #načte data do tabulky, bez hlavičky a odstraní středník anova.data2=aov(snaska~otec, data=data2) # provede 1 faktorovou ANOVA (efekt otce) summary(anova.data2) # ukáže souhrnnou tabulku ANOVA print(model.tables(anova.data2,"means"),digits=3) # zpráva průměrů a počtu subjektů boxplot(y~kohouti,data=data2) # grafický souhrn TukeyHSD (anova.data2) # následné testování pomocí Tukey vícenásobného porovnání průměrů plot(TukeyHSD(anova.data2), ordered=T) ---------------------------------- lm.data2 <- lm(y~ kohouti, data=data2)# alternativní zápis pomocí lineárního modelu (lm) anova(lm.data2) # ukáže souhrnnou tabulku ANOVA summary(lm.data2) # odhad úrovní efektů