Exprimované geny a přírodní selekce Produkty funkčních genů a jejich význam v ekologických studiích MODULARIZACE VÝUKY EVOLUČNÍ A EKOLOGICKÉ BIOLOGIE CZ.1.07/2.2.00/15.0204 Geny a adaptace •studium selekčních tlaků daných prostředím a evoluční odpovědi na ně ® vznik adaptací, tj. geneticky podmíněné přizpůsobení se prostředí (vs. fenotypová plasticita) • •např. interakce s abiotickým prostředím Proč geny v molekulární ekologii? •Geny mají funkční význam – geneticky determinovaný polymorfismus •-> studium proximátních mechanismů • •Př.: Proč je samec hýla rudého červeně zbarven? •ultimátní vysvětlení – aby se líbil samicím a zplodil s nimi více potomků •proximátní vysvětlení – protože karotenoidy získané z potravy ukládá více do peří a méně je používá v imunitní odpovědi (protože má dobré geny) Funkční vs. neutrální genetická variabilita 97% lidské DNA nic nekóduje!!! kódující DNA = funkční geny nekódující DNA (repetice, pseudogeny, introny atd.) fenotyp adaptace ke specifickému prostředí přírodní výběr Jak relevantní je informace získaná z genetických dat Příklad: 10 microsatelitů = „neutrální znaky“ üpopulačně-genetická struktura üinbreeding übottleneck • Xadaptace Xproximátní evoluční mechanismy • a priori neutrální k působení přírodního výběru • • •Exons à protein coding, under selection •Introns à non-coding, neutral •Intergenic regions à non-coding, neutral • • • • • • Struktura genů The first two are as said the motors generating variation. The remaining ones are what happens in populations. Shapes variation and reshuffels variation. Their relative importance determines what happens to new variants in populations. The study of allele frequency changes induced my them is the domain of population genetics. But of course all of them are reflected also in DNA sequence, and all of them can be studies using phylogenetic methods. he sequence data we look at is influenced by all of them, and depending on the application we have to consider some of them that we are not even interested in, in order to not falsely interpret results. In the following I’ll go into applications. And will refer to which assumptions we make in which case, and how we have to take these factors into account. à3rd position evolves neutrally à 1st and 2nd position under selection Degenerovaný genetický kód The first two are as said the motors generating variation. The remaining ones are what happens in populations. Shapes variation and reshuffels variation. Their relative importance determines what happens to new variants in populations. The study of allele frequency changes induced my them is the domain of population genetics. But of course all of them are reflected also in DNA sequence, and all of them can be studies using phylogenetic methods. he sequence data we look at is influenced by all of them, and depending on the application we have to consider some of them that we are not even interested in, in order to not falsely interpret results. In the following I’ll go into applications. And will refer to which assumptions we make in which case, and how we have to take these factors into account. • • Gene-tree versus species tree • • • • • • • • • • • population split speciation complete A B Species tree Gene tree Studium selekce – fylogenetická analýza Jak poznat, že na daný gen působí selekce? First polymorphisms are segregating within species. After speciation the gene-flow is usually interrupted. Thus the evolution is uncoupled, and mutation, drift and selection happen independently in both taxa. Over time, the polymorphisms (can) get species specific. It is the accumulation of • • Gene-tree versus species tree • • • • • • • • • • • A B C A B C A B C Studium selekce – fylogenetická analýza The two genes show incongruencies. Still, if you imagine many species and many gene-trees, they will have common signals corresponding to species. There is a growing number of methods to estimate species trees from gene-trees. It is here that certain population processes come into play! • • Gene-trees & Selection: The case of C4 photosynthesis • • Christin et al. 2007, Curr Biol • PEPC gene • àC4 photosynthesis • • • • • • • • Studium selekce – fylogenetická analýza The first two are as said the motors generating variation. The remaining ones are what happens in populations. Shapes variation and reshuffels variation. Their relative importance determines what happens to new variants in populations. The study of allele frequency changes induced my them is the domain of population genetics. But of course all of them are reflected also in DNA sequence, and all of them can be studies using phylogenetic methods. he sequence data we look at is influenced by all of them, and depending on the application we have to consider some of them that we are not even interested in, in order to not falsely interpret results. In the following I’ll go into applications. And will refer to which assumptions we make in which case, and how we have to take these factors into account. • •Y • •x • • • • • • • • species-tree ◄intronic sequences gene-tree coding sequences► Christin et al. 2007, Curr Biol The first two are as said the motors generating variation. The remaining ones are what happens in populations. Shapes variation and reshuffels variation. Their relative importance determines what happens to new variants in populations. The study of allele frequency changes induced my them is the domain of population genetics. But of course all of them are reflected also in DNA sequence, and all of them can be studies using phylogenetic methods. he sequence data we look at is influenced by all of them, and depending on the application we have to consider some of them that we are not even interested in, in order to not falsely interpret results. In the following I’ll go into applications. And will refer to which assumptions we make in which case, and how we have to take these factors into account. Selekce na úrovni sekvencí The first two are as said the motors generating variation. The remaining ones are what happens in populations. Shapes variation and reshuffels variation. Their relative importance determines what happens to new variants in populations. The study of allele frequency changes induced my them is the domain of population genetics. But of course all of them are reflected also in DNA sequence, and all of them can be studies using phylogenetic methods. he sequence data we look at is influenced by all of them, and depending on the application we have to consider some of them that we are not even interested in, in order to not falsely interpret results. In the following I’ll go into applications. And will refer to which assumptions we make in which case, and how we have to take these factors into account. • •Testing for selection: dN/dS • • • • • • •dN/dS = 1 as many syn as non-syn substitutions à neutral evolution • •dN/dS < 1 less non-syn than syn substitutions à purifying selection • •dN/dS > 1 more non-syn than syn substitutions à positive selection • • • • • • • dS Rate of synonsymous substitutions, ‘neutral’ evolutionary rate dN Rate of non-synonsymous substitutions Selekce na úrovni sekvencí The first two are as said the motors generating variation. The remaining ones are what happens in populations. Shapes variation and reshuffels variation. Their relative importance determines what happens to new variants in populations. The study of allele frequency changes induced my them is the domain of population genetics. But of course all of them are reflected also in DNA sequence, and all of them can be studies using phylogenetic methods. he sequence data we look at is influenced by all of them, and depending on the application we have to consider some of them that we are not even interested in, in order to not falsely interpret results. In the following I’ll go into applications. And will refer to which assumptions we make in which case, and how we have to take these factors into account. coding sequences► without positively selected sites Christin et al. 2007, Curr Biol ◄intronic sequences The first two are as said the motors generating variation. The remaining ones are what happens in populations. Shapes variation and reshuffels variation. Their relative importance determines what happens to new variants in populations. The study of allele frequency changes induced my them is the domain of population genetics. But of course all of them are reflected also in DNA sequence, and all of them can be studies using phylogenetic methods. he sequence data we look at is influenced by all of them, and depending on the application we have to consider some of them that we are not even interested in, in order to not falsely interpret results. In the following I’ll go into applications. And will refer to which assumptions we make in which case, and how we have to take these factors into account. • •Y • •x • • • • • • • • PEPC gene 12 codons with dN/dS > 1 Sequences of unrelated but ecologically similar species more similar at these positions than they are in related species. à convergent evolution! Christin et al. 2007, Curr Biol The first two are as said the motors generating variation. The remaining ones are what happens in populations. Shapes variation and reshuffels variation. Their relative importance determines what happens to new variants in populations. The study of allele frequency changes induced my them is the domain of population genetics. But of course all of them are reflected also in DNA sequence, and all of them can be studies using phylogenetic methods. he sequence data we look at is influenced by all of them, and depending on the application we have to consider some of them that we are not even interested in, in order to not falsely interpret results. In the following I’ll go into applications. And will refer to which assumptions we make in which case, and how we have to take these factors into account. Metody studia funkční variability 1.Sledování kandidátních genů 2. 2. 2.Genomické přístupy (mnoho genů najednou) pytlouš Chaetodipus intermedius Hoekstra, Nachman et al. •Tmavé a světlé zbarvení •Odpovídá barvě prostředí (tmavé zbarvení na lávě) •Arizona • •Korelace zbarvení s prostředím i na malé škále • •mtDNA nekoreluje se zbarvením • •Sekvenování kandidátních genů (známých z inbredních myší) • •melanocortin-1 receptor MC1R • •Záměna 4 aminokyselin • •Jednoduchá dědičnost alel a zbarvení • • • MC1R u člověka, mamuta a dalších •U člověka zrzavé vlasy a neschopnost se opálit •Zbarvení krav, koňů a psů •Výskyt dvou odlišných variant u mamutů mys Mus musculus Značení teritorií pachovými značkami (kapky moči) Přeznačkovávání V moči proteiny vážící volatilní molekuly MUPs Major Urinary Proteins - komplex velmi podobných genů • •Obtížně se studují (isoelektrická fokusace) • •Různé alely • •Navíc různá míra exprese • •→ individuální profil • •Čárový kód jedince Major histocompatibility complex (MHC) = adaptivní imunitní odpověď u čelistnatých obratlovců 107_1 Pathogen Antigen-specifická imunitní odpověď 107_1 Pathogen Antigen-specifická imunitní odpověď 107_1 Pathogen Antigen-specifická imunitní odpověď 107_1 Likvidace parazitů T buněčná cytotoxicita Pathogen Antigen-specifická imunitní odpověď 107_1 Likvidace parazitů T buněčná cytotoxicita Pathogen Antigen-specifická imunitní odpověď 107_1 Likvidace parazitů T buněčná cytotoxicita Protilátky Antigen-specifická imunitní odpověď Pathogen 107_1 Likvidace parazitů T buněčná cytotoxicita Protilátky Molekulární ekologie: Kdo a jak rozpozná parazita ? Pathogen MHC VŠECHNY JADERNÉ BUŇKY (imunitní i neimunitní) MHC třídy I MHC třídy II ANTIGEN PREZENTUJÍCÍ BUŇKY (imunitní) Major histocompatibility complex (MHC) ch7_MHC-proteins Major histocompatibility complex (MHC) Class I Class II Oblast rozeznávající antigen Funkce MHC: rozeznání a prezentace cizorodého antigenu h_mhcPathway > Funkce MHC: rozeznání a prezentace cizorodého antigenu h_mhcPathway MHC Class I všechny buňky s jádrem MHC Class II makrofágy, dendritické buňky aj. 107_1 Likvidace parazitů T buněčná cytotoxicita Protilátky Buňka nabízející antigen spustí imunitní odpověď Pathogen MHC Jak zjistit, že je MHC pod selekcí? ch7_MHC-proteins Major histocompatibility complex (MHC) Class I Class II Oblast rozeznávající antigen (antigen-binding sites = ABS) Je variabilita MHC důsledkem přírodního výběru? Trans-species polymorfismus - výhodné alelické linie přetrvávají i po oddělení druhů = detekce selekce fylogenetickou analýzou - - „gene tree“ vs. „species tree“ Pozitivní selekce - vytvoření a udržení velkého množství funkčních variant Microtus Arvicola Clethrionomys Mus Rattus Kuličky Šikmá jemná mřížka Šikmá jemná mřížka Kuličky Šikmá jemná mřížka Šikmá jemná mřížka Kuličky Kuličky Kuličky Kuličky Kuličky Kuličky Šikmá jemná mřížka Šikmá jemná mřížka Šikmá jemná mřížka Šikmá jemná mřížka Šikmá jemná mřížka Šikmá jemná mřížka Šikmá jemná mřížka Šikmá jemná mřížka Šikmá jemná mřížka Šikmá jemná mřížka Kuličky Šikmá jemná mřížka Šikmá jemná mřížka MHC Class II, DQA gene, Exon 2 (Neighbour Joining Tree) Fylogenetická analýza MHC sekvencí Bryja et al. 2006, Immunogenetics Pozitivní historická selekce na MHC Class II 1)Poměr nesynonymních a synonymních mutací (dN/dS) na různých pozicích MHC molekuly dN/dS ABS Non ABS DRB 5.25 3.00 DQA 3.16 0.33 Šipky ukazují ABS místa identifikovaná na základě krystalografického modelu DQA proteinu u myši DQA 2)Detekce aminokyselin pod pozitivní selekcí – Bayesian modelling (CodeML) ch7_MHC-proteins ABS špatně určená pozice ABS (?) Důkaz a mechanismus recentní selekce •Srovnání populačně-genetické struktury na MHC genech a neutrálních znacích (mikrosatelity) • •Asociace MHC genů a výskytu parazitů •Srovnání populačně-genetické struktury na MHC genech a neutrálních znacích (mikrosatelity) neutrální znaky migrace náhodný drift MHC – pokud nepůsobí selekce migrace náhodný drift neutrální znaky migrace náhodný drift MHC migrace náhodný drift selekce diverzifikující selekce MHC migrace náhodný drift selekce balancující selekce 1) Analýza populačně-genetické struktury Studované lokality – 7 populací ve stejné fázi populačního cyklu Canton Nozeroy (pohoří Jura, région Franche-Comté) 07 01 06 05 04 03 02 Bryja et al. 2007, Molecular Ecology Důkaz přírodního výběru v současnosti: analýza populačně-genetické struktury - Srovnání neutrálních znaků a MHC à 2001-2003: fáze růstu populační hustoty April 2002 October 2002 April 2003 October 2003 Diferenciace populací v průběhu růstu denzity Pokles diferenciace s nárůstem denzity (nárůst disperze, tj. toku genů) MHC (zejména DQA1) – signifikantně odlišné od mikrosatelitů * * * Signifikantní rozdíl DQA1 vs. mikrosatelity Bryja et al. 2007, Molecular Ecology Závěr: Typ selekce na MHC závisí na početnosti populace arvicola6 Nízká denzita Lokální rozdíly ve společenstvech patogenů Lokální diverzifikující selekce Vysoká denzita Nárůst diverzity parazitů v důsledku disperze Balancující selekce Bryja et al. 2007, Molecular Ecology Jaké jsou mechanismy přírodního výběru pro udržení vysoké variability MHC? •Hypotéza výhody heterozygotů (= „overdominance hypothesis“) • •Výhoda vzácné alely (= selekce negativně závislá na frekvenci) Výhoda heterozygotů - mají 2x více alel než homozygoti, tj. mohou rozeznávat 2x více patogenů •Dva druhy ryb – heterozygoti mají vyšší přežívání při umělém vystavení virům a helmintům •Nejednoznačné výsledky v mnoha dalších příkladech •Teoretické modely tuto hypotézu nepodporují ... •Člověk – rychlost vývoje onemocnění HIV nebo hepatitidy B je asociována s MHC heterozygotností • • Pravděpodobnost detekce ptačí malárie roste s počtem MHC alel - vysoká variabilita MHC = vysoká pravděpodobnost přežití akutní fáze Výhoda vzácné (výhodné) alely •Dynamická koevoluce mezi hostitelem a parazitem (= hypotéza „červené královny“) = selekce negativně závislá na frekvenci Výhoda vzácné (výhodné) alely Čas Čas „vzácná alela“ clostridium_tetani_1s Clostridium botullinum ch7_MHC-proteins ch7_MHC-proteins Výhoda vzácné (výhodné) alely Čas Čas •Zdá se být pravděpodobnější než „výhoda heterozygotů“ •Nutno prokázat, že skutečně dochází k časovým změnám ve frekvenci alel a parazitů – dlouhodobé studie neexistují !!! Asociace MHC genů a parazitů Gerbillurus paeba (Harf & Sommer, Mol. Ecol. 2005) gerbillurus vajíčka Nematoda v trusu černé – infikovaní bílé – neinfikovaní nematoda-vajicka Microcebus murinus (Schad et al., Evolution 2005) Apodemus flavicollis (Meyer-Lucht & Sommer, Mol. Ecol. 2005 ) • Velké množství testů, riziko "false positives" ® využití vícerozměrných metod Canton Nozeroy (pohoří Jura, région Franche-Comté) Př. Arvicola terrestris – hryzec vodní arvicola6 • 6 populací, 3 roky • téměř kompletní parazitologická analýza (včetně některých virů) • vícerozměrné analýzy Tollenaere, Bryja, et al., Journal of Evolutionary Biology (2008) 258px-Tenia_solium_scolex taenia_saginata_r poxvirus ekinokok Nematoda Frenkelia microti SSCP analýza ch7_MHC-proteins Analýza koinercie (co-inertia analysis) Alely DRB-11 a DRB-15 mají antagonistický efekt vzhledem k Trichuris arvicolae a k celkové diverzitě parazitů trichuris_vulpis-dospelec Tollenaere, Bryja, et al., Journal of Evolutionary Biology (2008) •„Mapping and association studies have revealed that approximately half of the genetic variability for resistance to infection is attributable to non-MHC genes, suggesting that MHC-independent immune responses also undergo host–pathogen coevolution.“ Acevedo-Whitehouse & Cunningham 2006 Sledování mnoha genů najednou Genome Transcriptome Proteome DNA mRNA Proteins Transcription Translation Genomics Transcriptomics Proteomics GP_FA7TYN03040706_inv 3 billion bases 20-30,000 genes ~100,000 proteins Functional Genomics Exome capture and NGS (někdy příště) Transkriptomika 1. microarrays 2. RNA seq (NGS) 1. Analysis of gene expression by microarrays Ranz JM, Machado CA: Uncovering evoutionary patterns of gene expression using microarrays. TREE, 21(1): 29-37 Microarray analysis of transcriptome (~ specific DNA hybridization) Target (i.e. mix of transcripts in a form of cDNA = mRNA přepsaná do DNA reverzní transkriptázou, tj. neobsahuje introny) Probe (i.e. synthesized oligonucleotides complementary to particular genes) The GeneAtlas System Sledování exprese genů microarrays •Sledování exprese mnoha (tisíce) genů najednou •Založeno na hybridizaci •Sleduje se rozdíl vůči kontrole ("heterologous hybridization") = dvoukanálový experiment http://upload.wikimedia.org/wikipedia/commons/f/f2/Cdnaarray.jpg Affymetrix Agilent Technologies Vyhodnocení chipu – analýza obrazu (srovnání úrovně exprese mezi kontrolou a experimentem) http://upload.wikimedia.org/wikipedia/commons/0/0e/Microarray2.gif - komerčně dostupné pro kompletní transkriptom cca 25 druhů (Affymetrix) (další jsou rychle vyvíjeny, i na zakázku) - celkově ale microarrays ustupují před RNAseq desítky tisíc transkriptů Populus trichocarpa x deltoides a Malacosoma disstria bourovec Ralph et al. 2006 •cDNA microarray • •15496 genů > ¾ genomu • •Po 24 hodinách 1191 genů up-regulated 537 down-regulated • •Obrana: endochitinázy, inhibitory proteáz •Signální funkce • •Transport, metabolismus, regulace transkripce 2. RNAseq („next-generation sequencing“) Adapted from Zeng and Mortazavi, Nature Immunology 13 (2012) RNA-Seq workflow for gene expression analysis Fragmented mRNA List of differentially expressed genes RNA-Seq quantification The reference transcriptome is required (RPKM = reads per kilobase per million reads) Gene ontology (http://geneontology.org/) = functional annotation analysis •založena na databázích dostupných anotovaných genů u modelových organismů •Cellular Component - the parts of a cell or its extracellular environment •Molecular Function - the elemental activities of a gene product at the molecular level, such as binding or catalysis •Biological Process - operations or sets of molecular events with a defined beginning and end, pertinent to the functioning of integrated living units: cells, tissues, organs, and organisms. Gene ontology as a graph diag-ontology-graph.gif Example: A set of terms under the biological process node pigmentation. Příklady Jaká je úroveň exprese v různých tkáních? quantitative real-time PCR vliv aklimatizace k chladu (20° vs 15°C) - srdeční, červená a bílá svalovina - rozdíly v expresi 113, 81 a 196 genů - rozdíly jsou způsobeny tkáňově specifickým stupněm endotermie http://www.biomedcentral.com/content/figures/1471-2164-15-754-1-l.jpg •cca 334 miliónů sekvencí („reads“); 42 mil./sample • •210 DEGs („differentially expressed genes“) – 119 up-regulated, 91 down-regulated u žlutých jedinců • • xanthophory melanophory erythrophory Konzistence výsledků http://www.biomedcentral.com/content/figures/1471-2164-15-754-1-l.jpg •změny v expresi jdou stejným směrem u RNA-seq i RT-qPCR vybraných genů • •hierarchical clustering of expression level •„žlutí“ a „červení“ jsou si navzájem podobní Functional annotation clustering (= gene ontology) up-regulated in yellow down-regulated in yellow •xanthophory u žlutých jedinců jsou asociovány s melanogenezí •v dalším kroku je možné studovat roli jednotlivých kandidátních genů • Závěr •Molekulární ekologie se rychle vyvíjí • •Metody se zásadně vylepšují a mění • •Co platilo dnes, nemusí platit zítra – těšme se tedy na zítřek • •