Genetika kvantitativních znaků - principy, vlastnosti a aplikace statistiky prof. Ing. Tomáš Urban, Ph.D. urban@mendelu.cz Genetika kvantitativních znaků Genetika kvantitativních vlastností vychází z Mendelistická genetika – dědičnost (přenos GI) vlastností s diskrétními hodnotami fenotypu – individuální efekt genu Genetika populací kvalitativních znaků – Model genetiky populací – 1 gen a 2 alely – změny v alelových frekvencích genů u vlastností s diskrétními hodnotami – nutné určit, kterou alelu jedinec nese Mnoho vlastností však nemá diskrétní hodnoty, nýbrž kontinuální variabilitu,  genetika populací kvantitativních vlastností Kvantitativní genetika Základní typy vlastností Diskontinuální / diskrétní (nespojité) vlastnosti – výrazně definované fenotypové kategorie – vlastnosti určované 1 nebo několika geny (major gen), bez vlivu prostředí → Mendelistický polymorfismus → většina fenotypové variability KVALITATIVNÍ VLASTNOST Kontinuální / spojité / komplexní vlastnosti – nevýrazně definované kategorie fenotypů – rozdělení fenotypů vykazuje více nebo méně kontinuální variabilitu (lze zjistit jen rozmezí hodnot pro vlastnost) – vlastnosti jsou určovány geny na mnoha lokusech → polygenní dědičnost – geny kvantitativních vlastností (QTL)  polygeny – většina genů má malý, ale aditivní účinek (minor geny) – vlivy prostředí na projev a distribuci fenotypů – každý gen je děděn mendelisticky, ale nelze vidět jeho efekt  KVANTITATIVNÍ VLASTNOST Kvalitativní vlastnosti Kvantitativní vlastnosti • diskontinuální, nespojitá (diskrétní) variabilita • kontinuální, spojitá variabilita • podmíněna 1 nebo několika málo geny • podmíněna mnoha geny na více lokusech • monogenní (popř. oligenní) dědičnost • polygenní dědičnost • mendelistické poměry v F1 • poměry v F1 nejsou mendelistické • lze určit fenotypovou hodnotu každého genotypu • rozdělení fenotypů vykazují více nebo méně kontinuální variabilitu (lze určit rozmezí hodnot) • vlastnosti jsou hodnoceny podle kvality projevu (rohatost - bezrohost, červený - bílý květ, ...) • vlastnosti jsou kvantifikovány měřením, vážení, počítáním, ... • geny s interakčními účinky (dominance, epistáze) • vlastnosti jsou determinovány geny velkého účinku (nepřispívají kvantitativně) a větším počtem genů malého účinku (polygeny), většina genů má aditivní účinek • na projev vlastnosti nemá vliv prostředí • projev vlastnosti modifikuje vliv prostředí • lze detekovat efekt jednotlivých genů podílejících se na vlastnosti • nelze rozpoznat účinek jednotlivých genů podílejících se na vlastnosti Přesto se všechny geny se dědí jako informační jednotky, t.j. u diploidních organizmů je každý gen v buňce přítomen 2x (jeden od otce a druhý od matky), bez ohledu determinují-li vlastnost kvalitativní nebo kvantitativní (rozdíl lze pozorovat v jejich fenotypovém projevu + specifické odchylky jako např. imprinting genů!) Hodnocení genetické variability u kvantitativních vlastností Klasický přístup – jsou změřeny fenotypy jedinců se známými příbuzenskými vztahy a genetické a prostřeďové zdroje fenotypové variance jsou určeny statistickými metodami (ANOVA, ML,…) Příbuzní jedinci sdílejí určitý podíl společných genů (to je kvantifikováno koeficientem příbuznosti rIJ) Molekulárně statistický přístup – nejnovější technika mapování lokusů kvantitativních vlastností (QTL – quantitative trait loci) pomocí markerů a asociování s fenotypovými hodnotami Hledají se sekvence DNA pomocí genetických markerů (SNP) po celém genomu a jejich statistické asociace k fenotypové variabilitě, popř. expresi (opět má slovo statistika!) Mouse Models of Blood Pressure Regulation and Hypertension: Fumihiro Sugiyama, Ken-ichi Yagami, and Beverly Paigen ; Current Hypertension Reports (2001). 3:41-48 Příklady kvantitativních vlastností Vlastnosti s plynulou kontinuální proměnlivostí - výnos obilí, rezistence k nemocem u rostlin i živočichů, přírůstek hmotnosti, výška v kohoutku, obsah tuku v mase, IQ, schopnost naučit se, krevní tlak, … Vlastnosti prahové (threshold) – projev nemoci (schizofrenie, cukrovka), výskyt dvojčat Vlastnosti meristické - počet selat ve vrhu, počet zrn v klase Základní otázky Základní zásada QG: viditelná variabilita je způsobena kombinací působení mnoha genů a faktorů prostředí Nebo: fenotyp = „genotyp“ + prostředí Základní otázky (a odpovědi?): 1. Jaká je genetická podstata kvantitativních vlastností? (jsou podmíněny normálními geny podléhající Mendelovým pravidlům). 2. Jak můžeme odlišit efekty genů od efektů prostředí? (např. inbreedingem lze eliminovat genetickou varianci). 3. Jak můžeme předpovědět a kontrolovat výsledky z křížení? (např. umělou selekcí). Kvantitativní geny jsou mendelovské geny V r. 1909 Herman Nilsson-Ehle (Švédsko) provedl řadu experimentů s barvou zrna pšenice. Pšenice je hexaploidní, výsledek 3 různých druhů tvořící stabilního hybrida, allopolyploid. Jsou zde 3 podobné, ale trochu odlišné genomy pšenice, nazvané A, B a D. Každý genom má jeden gen, který ovlivňuje barvu zrna, a každý tento lokus má alelu pro červenou barvu a alelu pro bílou barvu. Červené alely: A, B a D, a bílé alely a, b a d. Dědičnost těchto alel je neúplná dominance, nebo „aditivita“. Množství červeného pigmentu v zrnu je úměrné přítomnému počtu červených alel, od 0 do 6. Počet aditivních alel: 0 1 2 3 4 5 6 Segregace a volná kombinovatelnosti tří genů a aditivním působením Průměr = 3 Variance = 1,5 Přechod od kvality ke kvantitě Př.: 2 geny, A & B kontrolují vlastnost Alela A = 4 jednotky B = 2 jednotky a = 2 jednotky b = 1 jednotka Genotyp G. poměr v F2 Metrická hodnota AABB 1 12 AABb 2 11 AAbb 1 10 AaBB 2 10 AaBb 4 9 Aabb 2 8 aaBB 1 8 aaBb 2 7 aabb 1 6 Grafické znázornění příkladu 0 1 2 3 4 5 6 aabb 7 aaBb 8 Aabb aaBB 9 AaBb 10 Aabb AaBB 11 AABb 12 AABB Frekvence Očekávaná distribuce za současné segregace dvou alel na každém lokusu: Vlivy prostředí na kvantitativní vlastnosti Rok Výnos genotypů (bu/akr) Roughrider Seward Agassiz 1986 47,9 55,9 47,5 1987 63,8 72,5 59,5 1988 23,1 25,7 28,4 1989 61,6 66,5 60,5 1990 0 0 0 1991 60,3 71,0 55,4 1992 46,6 49,0 41,5 1993 58,2 62,9 48,8 1994 41,7 53,2 39,8 1995 53,1 65,1 53,5 Poznámka … Všechny rostliny v r. 1990 nepřezimovaly. Modifikující vliv prostředí Důležitý koncept v kvantitativní genetice Fenotyp = genetické faktory + faktory prostředí P = G + E Variabilita –> variance (VP) Pro pochopení heritability je třeba znát více kvantitativní variabilitu. Co to je, přesně, co pozorujeme, když studujeme kvantitativní vlastnost? Variabilitu mezi fenotypy! -> fenotypová variance (VP) je základní informace používaná v kvantitativní genetice Fenotyp vyplývá z genotypu interagujícího s prostředím Lze říci, že VP je způsobena variancí genů (genotypů) a variancí prostředí: VP = VG + VE Studované otázky QG Jaký je podíl genetických faktorů a prostředí na fenotypu? Kolika geny je ovlivněna vlastnost? Je příspěvek genů stejný? Jak alely na různých lokusech interagují: aditivně? epistaticky? Jak rychle se změní vlastnost pod selekcí? Kontinuální variabilita - normální distribuce • Problémy kontinuálních vlastností lze rozdělit do dvou typů: – většina je ovlivněna alelami na dvou a více lokusech a segregace jakéhokoliv genu v rodokmenu je zastřena segregací ostatních genů ovlivňujících vlastnost, – většina kontinuálních vlastností jsou ovlivněny faktory prostředí stejně jako geny a genetická segregace je zastřena prostřeďovými efekty. • Pokud se u mnoha kontinuálních vlastností fenotypy seskupí do vhodných intervalů a zobrazen pomocí pruhového grafu, pak bude distribuce fenotypů vyhovovat normálnímu rozložení, které je symetrické, s křivkou zvonovitého tvaru. Hladká křivka je normálním rozložením, které nejlépe odpovídá datům. – Rovnice normální křivky (funkci hustoty pravděpodobnosti) je: 22 2)( 2 1 )(       x ef x Popis kvantitativních vlastností Tyto vlastnosti nemohou být analyzovány tradičními technikami mendelistické genetiky (~ genetikou populací kvalitativních znaků) Statistické analýzy n x n xxx x in    .....21 n xxxxxx s n X 22 2 2 12 )(.....)()(   V n xxi     2 )( 2 xx ss  Graf distribuce fenotypové proměnlivosti Variance je změřená variabilita distribuce  1  zahrnuje 68,3 %  2  zahrnuje 95,5 %  3  zahrnuje 99,7 % Příklad: Délka ouška u kukuřice a Mendelův design pokusu Generace Průměr (cm) sx (cm) P1 16,80 0,817 P2 6,63 1,887 F1 12,12 1,519 F2 12,89 2,252 •závěry: –průměrná délka ouška linie P2 je menší, sx je větší  je zde větší variabilita než v linii s delšími oušky P1 –variabilita v populaci F1 je v důsledku variability prostředí –průměr vlastnosti v F1 populaci je střední mezi oběma rodiči a průměr F2 populace je přibližně stejný jako v F1 –F2 populace má větší variabilitu než F1 –extrémní hodnoty distribuce by měly být rovny hodnotám rodičů, protože část populace bude mít jejich genotyp Generace Průměr (cm) sx (cm) P1 16,80 0,817 P2 6,63 1,887 F1 12,12 1,519 F2 12,89 2,252 Analýza variance - ANOVA Příklad jednofaktorové analýzy variance hodnocení fenotypové proměnlivosti snášky u slepic jednoho chovu. Na základě jednofaktorové analýzy variance chceme zjistit, zda existují průkazné rozdíly ve snášce u potomstva po čtyřech kohoutech, chceme znát, zda „genetický“ vliv otec byl průkazný nebo neprůkazný. Ve sledování jsou čtyři skupiny slepic a v každé je potomstvo po jednom ze čtyř kohoutů, jedná se tedy o skupiny polosourozenců. Model jednofaktorové analýzy variance: yij =  + ai + eij yij – užitkovost j-tého potomka po i-tém otci  – obecný průměr populace ai – vliv i-tého otce eij – ostatní nahodilé vlivy Tabulka analýzy variance: Syntaxe v programu R Načtení dat z EXCELU (soubor ve formátu csv) a provedení 1f ANOVA data2 <- read.table("K:/R/data2.csv") #načte data, ale i s hlavičkou a oddělené středníkem data2 <- read.table("K:/R/data2.csv", header=T, sep=";") #načte data do tabulky, bez hlavičky a odstraní středník anova.data2=aov(snaska~otec, data=data2) # provede 1 faktorovou ANOVA (efekt otce) summary(anova.data2) # ukáže souhrnnou tabulku ANOVA print(model.tables(anova.data2,"means"),digits=3) # zpráva průměrů a počtu subjektů boxplot(y~kohouti,data=data2) # grafický souhrn TukeyHSD (anova.data2) # následné testování pomocí Tukey vícenásobného porovnání průměrů plot(TukeyHSD(anova.data2), ordered=T) ---------------------------------- anova.data2 <- lm(y~ kohouti, data=data2) # alternativní zápis pomocí lineárního modelu (lm) anova(anova.data2) # ukáže souhrnnou tabulku ANOVA summary(anova.data2) # odhad úrovní efektů