Eduard Kejnovský + Zdeněk Kubát + Roman Hobza EVOLUČNÍ GENOMIKA: V. DYNAMIKA GENOMŮ Paradox hodnoty C Velikost genomu (hodnota C) není závislá na komplexitě organismu. Polychaos dubium Sladkovodní měňavka (Amoebozoa) s největším známým genomem 670 Mb Polychaos dubium Eukaryotní genom obsahuje mnoho různých sekvencí, z nichž jen velmi malá část kóduje proteiny. Přesto je většina genomu aktivní, přičemž její aktivita spočívá v regulaci exprese protein kódujících genů (regulační sekvence, netranslatované části genů) a v produkci RNA, která reguluje aktivitu genů (miRNA), mobilních elementů (piRNA) a lokální strukturu chromatinu (endogenní siRNA) nebo má strukturní funkci (rRNA, tRNA, snoRNA ...). Řada různých RNA je asociovaná s regulačními sekvencemi genů nebo se strukturami chromosomu, které jsou nezbytné pro jejich fungování (centromery), tzv. dlouhá nekódující RNA (lnRNA) se podílí např. na inaktivaci chromosomu X u savců nebo regulaci telomer. Odhaduje se, že cca 80% lidského genomu je přepisováno do RNA, přičemž exony protein kódujících genů zaujímají jen 1,5% genomu. Fakt, že eukaryotní genomy neobsahují jen protein kódující geny, je znám už dlouhou dobu. První indicie pochází z počátku 70. let 20. století, kdy C.A. Thomas, Jr. při měření velikosti genomu různých eukaryot zjistil, že velikost genomu některých méně složitých organizmů je mnohem větší než těch složitějších, což ho vedlo k formování tzv. paradoxu hodnoty C („Velikost haploidního genomu neodpovídá komplexitě organismu“). Příkladem platnosti tohoto výroku je Polychaos dubium (Amoebozoa), organismus s největším známým genomem (737 pg, 670 Gbp), který je 200x větší než lidský. Mezi obratlovci má největší genom bahník východoafrický (Protopterus aethiopicus, 130 Gbp, 132,8 pg), typicky velké genomy mají krytosemenné rostliny (největší rostlinný genom Paris japonica (Melanthiaceae) –133 Gbp). Teprve později se přišlo na to, že velké části genomu zabírají mobilní elementy a tandemové repetice, které pro nositele nemají (zdánlivě) žádný význam a tyto složky byly dlouho považovány za odpadní (junk) DNA, v případě mobilních elementů (patrně správně) za sobeckou DNA. Jak je zmíněno výše, řada tandemových repetic má regulační i strukturní funkci a je pro fungování genomu důležitá. Mobilní elementy, podle současného stavu vědění, se skutečně šíří po genomu na úkor hostitele a pro jedince jsou spíše zdrojem nepříjemností, ale z dlouhodobého hlediska jsou důležité pro evoluci genomu (delece/duplikace DNA mezi různě lokalizovanými kopiemi ME prostřednictvím nerovnoměrného crossing-overu, delece/duplikace okolí ME při transpozici) a vznik nových genů (adaptace genů a regulačních sekvencí ME pro účely hostitele, vznik retrogenů, ...). 1. Promiskuitní DNA 2. Tandemové repetice 3. Transpozony Dynamické složky genomu 1. PROMISKUITNÍ DNA Endosymbiotická evoluce a strom života (Timmis et al., 2004) „Endosymbiotic origin of organelles“ (Lynn Sagan (Margulis), 1967) “Promiscuous DNA” (Ellis, 1982) – cp DNA v mt genomu “Endosymbiotic gene transfer is ubiquitous… … at frequencies that were previously unimaginable”. Vznik Eukaryotické buňky (mitochondrie) HGT je velice rozšířený jev u Eubakterií i Archeí, je považován za dominantní proces v evoluci prokaryot, hovoří se o Pan-genomu prokaryotických druhů. -> ancestrální Archaeon obsahoval mnoho bakteriálních genů a patrně měl již znaky Eukaryotické buňky. Podle jiných teorií tyto znaky získal až po pohlcení endosymbionta. HGT přispěl k evolučnímu přechodu (evolutionary transition) od prokaryotické k eukaryotické buňce. Masivní tok genů z endosymbionta (protomitochondrie) do jádra. V současnosti je (EGT) tok genů utlumen. EGT = Endosymbiotic Gene Transfer HGT = Horizontal Gene Transfer LGT = Lateral Gene Transfer (Koonin, 2016) Figure 2. Eukaryogenesis and horizontal gene transfer.The figure presents the ‘endosymbiotic’ model of eukaryogenesis under which the host of the protomitochondrial endosymbiont was a typical archaeon albeit one with a relatively complex intracellular organization and numerous genes captured from bacteria via HGT. Abbreviations: HGT, horizontal gene transfer. https://dx.doi.org/10.12688%2Ff1000research.8737.1 Over a decade ago, the question has been asked whether the concept of HGT would soon ‘come of age’, causing a rather tense discussion ^84^, ^85. These days, I believe, it is clear that the field has matured. There is no reasonable doubt anymore that HGT is a dominant process in microbial evolution that generally occurs at a high rate. Moreover, the relevance of ‘horizontal’ as applied to gene flow is validated by the strong evidence of the existence of a central vertical, tree-like trend in genome evolution. Thus, the focus of research has shifted towards the ‘how’s’ and ‘why’s’ of HGT and, in these directions, much more remains to be done than has been accomplished already. Endosymbiotický vznik plastidů a strom života (Ponce-Toledo et al., 2019) Primární endosymbióza pouze 2x: - Archeplastida (endosymbiont = Gloeomargarita) - Paulinella (endosymbiont = Synechococcus) Sekundární a terciární endosymbióza mnohokrát: - Euglenozoa, Chlorarachniophyta (endosymbiont = Viridiplantae) -Cryptophyta, Haptophyta, Alveolata, Stramenopiles (endosymbiont = Rhodophyta) - - Proč? - Bariéry proti adopci primárního endosymbionta - Sekundární endosymbionti vznikají mnohem častěji – odstranění bariér díky toku genů a převzetí mnoha funkcí jádrem Fig. 1 The distribution of photosynthesis in global eukaryotic phylogeny. Coloured solid branches correspond to photosynthetic lineages endowed with primary plastids and coloured dashed branches to lineages with secondary plastids (green and red colours indicate the type of secondary endosymbiont, green or red algae, respectively). Blue arrows show the two known primary endosymbioses (in Archaeplastida and Paulinella) and green and red arrows indicate secondary endosymbioses involving green and red algal endosymbionts. Grey branches correspond to nonphotosynthetic eukaryotic phyla. The tree has been largely modified from Adl et al. (2012). New Phytologist (2019) 224: 618–624 doi: 10.1111/nph.15965) Primární endosymbióza – charakteristiky plastidů (Ponce-Toledo et al., 2019) Table 1. Comparison of plastid characteristics between Archaeplastida and Paulinella chromatophora. New Phytologist (2019) 224: 618–624 doi: 10.1111/nph.15965) Promiskuitní DNA Endosymbióza a tok genů do jádra a mitochondrií Sinice ~ 3000 kb ~ 3000 genů Chloroplast ~ 150 kb ~ 100 genů Proteobakterie ~ 4000 kb ~ 4000 genů Mitochondrie ~ 10-400 kb ~ 60 genů (Timmis et al., 2004) EGT dnes: Donor Akceptor Mitochondrie -> Jádro Jádro ->> Mitochondrie Chloroplast ->>> Mitochondrie (1-6 %) Chloroplast ->>>> Jádro Velikosti organelových a prokaryotických genomů (Timmis et al., 2004) Nejdříve – regulační funkce (sigma factor of RNApolymerase, gamma subunit of ATPase) Poslední – translace - respirace Některé geny se přenášejí do jádra dříve jiné později Rubisco: katalýza - v plastidu (rbcL) regulace – v jádře (rbcS) Proč některé geny zůstávají v organelách? 1.Hydrophobicita - hydrofóbní proteiny jsou těžko importovány do organel 2.Řízení redoxního stavu - organely řídí expresi genů, které kódují komponenty jejich elektronového transportu, jejich lokalizace je výhodnější v organelách Zmenšení genomů u organel a parazitů: Parazité: - specializace na intracelulární prostředí - ztráta genů Organely: - export genů do jádra hostitele - import produktů Mechanizmy genového přenosu 1.Přenos velkých kusů DNA (“bulk DNA” hypothesis) intergenové spacery, introns experimenty u kvasinek >100kb 2. Přenos prostřednictvím cDNA (“cDNA intermediates”) přenesená DNA je sestřižena a editována rekombinace sestřižené mtDNA s nesestřiženou mtDNA heterogenita velikostí mtDNA Genový přenos z organel do jádra v reálném čase EXPERIMENT: - exprese/rezistence jen po přenosu do jádra Frekvence přenosu: - v gametách – 1 : 16 000 - v somatických buňkách – 1 : 5 million Příčina rozdílu (300x): - programovaná degenerace plastidů při vývoji pylových zrn zvyšuje frekvenci přenosu Kam se přenesená DNA integruje? - žádné důkazy preferovaných sekvencí či částí chromosomů - Sekvenční proměnlivost promiskuitní DNA >95% identity svědčí o velké obměně organelových sekvencí Faktory vedoucí k degeneraci sekvencí: - asexualita - poškozující zplodiny metabolismu - selekce na malé genomy - Kompenzující faktory (u rostlin) - polyploidie - reparace DNA Laterální (horizontální) transfer genů a „Pan-genom“ Eukaryot? Laterální (horizontální) transfer genů a „Pan-genom“ u Prvoků? U jednobuněčných Eukaryot je HGT významným faktorem. U mnohobuněčných Eukaryot je HGT občasným jevem a souvisí obvykle s parazitismem nebo symbiózou. Figure 1. Key Figure. Possible Sources of Foreign DNA Contributing to Lateral Gene Transfer (LGT) in Eukaryotes. Eukaryotic cells are exposed to many potential sources of exogenous DNA, including from: (i) lysed endosymbiont-derived organelles (mitochondria and chloroplasts), prokaryotic or eukaryotic endosymbionts, (ii) viral infection, (iii) bacterial conjugation (e.g., Agrobacterium tumefaciens), and (iv) lysed phagosomes containing food organisms. Koncept „Pan-genomu“ u nižších Eukaryot Studie genomů stejného druhu z různých lokalit odhalily populačně specifické geny odvozené od jiných organizmů žijících v místě (bakterií nebo eukaryot) = accessory genome Pan-genom = Základní (core) genom + Přídavné (accessory) genomy všech jednotlivých populací. Sibbald et al., 2020 Figure 2. The Pan-Genome Concept. The pan-genome consists of all the genes found in all strains of a given species and is depicted at the top of the figure as the union of all ellipses (each ellipse is the set of genes present in that strain) in the Venn diagram. The pan-genome can be further broken down into the ‘core’ genome (genes found in all strains shown in dark teal) and the ‘accessory’ genome (shown in colors ranging from green to blue) which are genes found in a single strain (i.e., they are strain-specific) or in a subset of strains (i.e., strain-select). HGT u mnohobuněčných Eukaryot Desítky zdokumentovaných příkladů, ale pozor! Ne všechny jsou spolehlivě prokázané (metodika, kontaminace vzorků nebo veřejných zdrojů dat). Některé studie odhadují, že asi 1-2 % genů eukaryotických genomů je tvořeno geny získanými HGT od virů, bakterií a jiných eukaryot relativně nedávno. (Filip a Skuza, 2021) Jaké geny se nejčastěji přenáší HGT Geny poskytující okamžitou adaptivní výhodu: Biosyntéza proteinů – Rhodoquinone (akceptor elektronu během syntézy ATP, umožňuje dýchání v anaerobních podmínkách), bakterie -> prvoci (2x) -> další prvoci Geny pro transportéry látek – transport a využití konkrétních metabolitů, známo mnoho příkladů HGT mezi houbami Celé bakteriální operony – biosyntéza siderophoru, enterobakterie -> střevní kvasinky hmyzu, lepší využití železa Rezistence k chorobám a stresu (Filip a Skuza, 2021) HGT u mnohobuněčných Eukaryot Přenos genu Fhb7 pro rezistenci k fusarióze z endofytické houby do příbuzného pšenice Thinopyrum elongatum Fusarióza: Růžovění pšenice Poškození zrn Mykotoxiny Fhb7 – glutathionsyntetáza, detoxikace trichothecenů produkovaných fusariem prostřednictvím vazby glutathionu. 97% homologie s genem E. fungus 0% homologie se všemi rostlinnými databázemi (Wang et al., 2020, Science) Fhb7 confers FHB resistance by detoxifying trichothecenes. (A) Fhb7 in Th. elongatum genome likely came from an Epichloë fungus through horizontal gene transfer. Fhb7 drives FHB resistance when introgressed from Thinopyrum into wheat. (B) Fhb7 encodes a GST that detoxifies Fusarium-produced trichothecenes by conjugating GSH (blue) to the epoxy group (red). R1 to R5 refer to the variable groups in trichothecenes. Pijavenky (vířníci Bdelloidea) – 40-60 milionů let stará linie, 18 rodů, 360 druhů. Partenogenetické samičky, žádný sex. Klidová stadia na přežití nepříznivých podmínek - vyschnutí. Unikátní způsob získávání genetické informace od bakterií, hub, prvoků, řas – vypůjčují si jejich geny (horizontální genový transfer) - náhrada sexu? Případ Bdelloid Rotifers, vířníci) (Eyres et al., 2015) U Eukaryot je výměna GI zprostředkována redukčním dělením = vznikem gamet, a následným oplozením. Tento proces nazýváme Pohlavní rozmnožování. Existují ale výjimky. Dokonce i některé druhy mnohobuněčných eukaryot se nerozmnožují pohlavně. Vždy se jedná o partenogenetické samičky a ve většině případů takové druhy přežívají maximálně několik stovek tisíc let, než dojde ke změně prostředí, jíž se tyto poměrně neměnné druhy nedokážou přizpůsobit. Z toho důvodu takové druhy nacházíme na koncových větvích fylogenetického stromu, nevyvine se z nich nový druh, zkrátka po vyčerpání svého potenciálu nebo nahromadění příliš velkého množství škodlivých mutací vyhynou. Výjimkou z výjimky jsou například Pijavenky (vířníci Bdelloidea). Tyto organismy si vyvinuly unikátní způsob získávání GI od organismů, jimiž se živí. Ten spočívá v začlenění genů kořisti do vlastního genomu a jejich následném využití pro vlastní metabolismus. Díky tomuto procesu (z kategorie Horizontální genový transfer = mezidruhový přenos genů) existují Pijavenky již nejméně 40 milionů let a vytvořily 18 rodů a 360 druhů. Obrázek 1: Desiccation tolerance and the proportion of horizontally transferred genes in four species of Rotaria. Left, blue: the proportion of individuals surviving desiccation and rehydration per species. Error bars show 95 % binomial confidence intervals. Right, red: the proportion of foreign genes with h [U][ ]≥30 with respect to the total number of transcripts analyzed per species. Note that the axis starts at proportion of 0.08, not 0, in order to display variation among species Obrázek 2: Average rates of gain and loss of foreign orthologs along the branch leading to each species, within the two clades of sister species (including stem and terminal branches) and across all Rotaria. MCL clusters corrected for false negative rates inferred from analysis of the R. magnacalcarata genome were used to estimate gains and losses; values for other versions of the analysis are in Additional file 1: Table S7. Error bars indicated 95 % HPD across BEAST trees also incorporating Poisson errors in the rate process Eyres, I., Boschetti, C., Crisp, A. et al. Horizontal gene transfer in bdelloid rotifers is ancient, ongoing and more frequent in species from desiccating habitats. BMC Biol 13, 90 (2015). https://doi.org/10.1186/s12915-015-0202-9 Případ Bdelloid Rotifers, vířníci) Vířníci si osvojují geny bakterií, hub i řas (Gladyshev et al., 2008) DOI: 10.1126/science.1156407 2. TANDEMOVÉ REPETICE Tandemové repetice Jednotka (= monomer) se opakuje n-krát za sebou Satelity – objeveny při hustotní gradientové centrifugaci - tvoří satelitní proužek kvůli jinému složení bazí. - Přítomny ve všech genomech (prokaryota i eukaryota) - Klasifikace: • Satelity – významná složka genomu (i > 50%), tvoří bloky heterochromatinu, délka monomerů i >2 kbp) • Minisatelity – 0,5-30 kbp, délka monomeru 10-100 bp • Mikrosatelity – krátké úseky, délka monomeru ≤6 bp Strukturní a regulační funkce, expanze mikrosatelitů u některých chorob Typické rozložení tandemových repetic na chromosomech šťovíku Tandemové repetice, neboli satelity, byly objeveny při hustotní gradientové centrifugaci (density gradient centrifugation), kdy díky jinému složení bází tvořily tzv. satelitní proužky, lišící se od hlavního proužku se zbytkem genomu. Jak název napovídá, jejich jednotky (tzv. monomery) jsou uspořádány tandemově za sebou, na rozdíl od mobilních elementů, které jsou rozptýleny po genomu. Často, ale ne vždy, se od dalších částí genomu liší složením bazí (AT- nebo GCbohaté). Podle jejich množství v genomu se dělí na klasické satelity, mini- a mikrosatelity (Sumner 2003). Klasické satelity zabírají významnou část genomu (i více než 50%) a tvoří viditelné bloky heterochromatinu, ve kterých se ale mohou vyskytovat i různé typy satelitů spolu s dalšími sekvencemi. Délka jejich monomeru může být i několik kbp. Často se vyskytují v centromerách, kde jsou klíčové pro jejich fungovaní (Sumner 2003). Minisatelity zabírají 0,5-10 kbp úseky a délka monomerů je 10-100 bp. Mikrosatelity zabírají krátké úseky genomu a jejich monomery jsou maximálně 6 bp dlouhé. Byly nalezeny ve všech zkoumaných genomech, nacházejí se i v kódujících sekvencích a jejich expanze může způsobit různá onemocnění (např. Huntingtonova chorea). Délka a množství mini- a mikrosatelitů je mezi jedinci a druhy poměrně variabilní, ale dostatečně stálá pro fylogenetické a populační studie, variabilita mikrosatelitů v lidském genomu se používá jako tzv. DNA fingerprinting pro identifikaci jedince (kriminalistické účely) a pro paternitní testy. Hustotní gradientová centifugace – metoda k separaci různých molekul DNA (např. virové partikule, DNA fragmenty o různém složení bazí. Ultracentrifugace se provádí za vysokých otáček několik hodin v hustotním gradientu sacharózy nebo chloridu cesného (CsCl). Stejně dlouhé fragmenty DNA lišící se složením bazí jsou centrifugací rozděleny. Fragment s vyšším podílem lehkých AT párů je blíž ose než fragment s více těžkých GC párů. Tandemové repetice, „knihovna“ satelitní DNA Hlavní parametry: - počet kopií (změna v B a D) - sekvence DNA (změny C a D) Evoluce tandemových repeticí Evoluce v koncertu (concerted evolution) Genová konverze Nerovnoměrný crossing-over Evoluce satelitních sekvencí – skládání ze segmentů – vznik higher order repeats (HORs) Genová konverze - interchromosomální - intrachromosomální Genová konverze transposonů na pohlavních chromosomech mikrodisekce chromosomů Y a X LASER PCR amplifikace TE na mikrodisektovaných chromosomech Y-kopie X-kopie Satelity mohou vznikat i z retroelementů gag LTR LTR LTR LTR tandem - NON-AUTONOMOUS ELEMENT (3.7 kb) pol env? tandem Retand element (Silene latifolia) Figure 4. Detection of the Ogre sequences coding for the retrotransposon conserved protein domains in the genomic regions adjacent to the satellite repeat arrays. (a) The plots show the proportions of similarity hits from the individual domains and their orientation with respect to the forward-oriented satellite arrays. (b) A schematic representation of the Ogre element with the positions of the protein domains and short tandem repeats downstream of the coding region. 3. TRANSPOZONY Mobilní elementy = transpozony (TE) Barbara McClintock (1948) Nobelova cena (1983) Disociátor (Ds) Aktivátor (Ac) Mění polohy na chromozomu a ovlivňují přilehlé geny → změna barev kukuřičných semen Výsledek obrázku pro corn McClintock jádro cytoplazma DNA transposon „cut and paste“ Transpozony (disponují vlastním aparátem pro transpozici) transposase TIR TIR PR RT IN IN PR RT GAG VLP Reverzní transkripce jádro cytoplazma mRNA translace transkripce integrace IN IN IN IN LTR retrotransposon „copy and paste“ DNA transposon „cut and paste“ gag pro rt rnaseH int eORF PBS PPT LTR AAAAAAAA LTR retrovirus transposase TIR TIR Havecker et al. (2004) Transpozony (disponují vlastním aparátem pro transpozici) Autonomní X Neautonomní Klasifikace transpozonů Třída I. Retrotranspozony Replikativní transpozice prostřednictvím RNA meziproduktu (copy and paste) Třída II. DNA transpozony Transpozice bez RNA meziproduktu Podtřída I – konzervativní „cut and paste“ mechanizmus transpozice Podtřída II – replikativní mechanizmus transpozice (např. Helitrony) (I – štěpí oba řetězce DNA, II – štěpí jen jeden řetězec DNA v místě inzerce i v novém místě) Autonomní - plně funkční, obsahují všechny geny pro transpozici Neautonomní – nefunkční, absence genů, transpozice je zajištěna proteiny autonomních elementů Dle typu transpozice Dle struktury Základní typy transpozonů dle transpozice Lisch 2013, Nature Rev. Genet. Rolling circle replication Třída II DNA transpozony Třída I Retrotranspozony Třída I. Třída II. LTR retrotranspozony Non-LTR retrotranspozony (retropozony) Vysvětlivky k předchozímu obrázku: Třída II. DNA transpozony jádro cytoplazma DNA transposon „cut and paste“ Transpozony (disponují vlastním aparátem pro transpozici) transposase TIR TIR Bakteriální DNA transpozony transposase TIR TIR transposase TIR TIR transposase TIR TIR Inzerční sekvence (IS) Složené transpozony TIR TIR transposase TIR TIR kan str kan str Mobilní v rámci bakteriálního chromozomu nebo mezi chromozomem a plazmidy Transpozony prokaryot Levý IS element Pravý IS element Oblast kódující proteiny IS-elementy •obvykle méně než 2500 bp •ohraničeny krátkými identickými sekvencemi – obrácenými koncovými repeticemi •mutace v koncových repeticích eliminuje přemísťovací schopnost •obsahují pouze geny pro zajištění a regulaci transpozice •kódují transpozázu: váže se ke koncům elementu, kde štěpí oba řetězce DNA – tím je element uvolněn z původního místa Výsledek obrázku pro is elements Transpozon Tn3 •obsahuje geny, které nejsou pro transpozici nezbytné •na koncích jsou jednoduché obrácené repetice •replikativní typ transpozonu, dočasně spojuje molekuly za vzniku kointegrátu, po rozložení každá molekula obsahuje 1xTn3 •v cílovém místě nastává duplikace • •Struktura: • gen pro transpozázu a resolvázu (represor transpozázy) • gen pro beta-laktamázu (rezistence k Amp) Výsledek obrázku pro tn3 transposon Složené transpozony bakterií Rezistence k antibiotikům: Kanamycin Gentamycin Ampicilin Tetracyklin Chloramfenikol Streptomycin Horizontální genový přenos Horizontal gene transfer (HGT) Přenos genů mezi bakteriemi při konjugaci Zprostředkován IS elementy •Transpozony často obsahují geny pro rezistenci k antibiotikům •tím se tyto geny mohou snadno šířit a zvyšovat tak odolnost patogenních bakterií k antibiotikům •dnes je obtížné léčit řadu infekčních onemocnění (úplavice, kapavka, tuberkulóza, atd.) •šíření rezistence umožnilo široké používání antibiotik (selekce rezistentů) •transpozóny (přenos mezi molekulami DNA uvnitř bakteriální buňky) a konjugativní plazmidy (přenos mezi různými bakteriálními kmeny) Význam HGT zprostředkovaného transpozony v lékařství: Eukaryotické DNA transpozony Obsah obrázku pes, interiér, ležící, savci Popis byl vytvořen automaticky DNA transposony 1. Prokaryotické: - IS elementy - Tn elementy 2. Eukaryotické: - Ac a Ds elementy – autonomní a neautonomní u kukuřice - P elementy – hybridní dysgeneze u drozofily (samci P+ a samice P-) - Tc1/mariner – u C. elegans (Tc1) a drozofily (Mariner) Výsledek obrázku pro corn McClintock Ac/Ds transpozony u kukuřice (hAT superfamily) Výsledek obrázku pro corn McClintock • rostlinné ekvivalenty lidských Alu, délka: 125 - 500bp • neautonomní elementy (master = DNA TE Mariner) • obrácené koncové repetice (TIR) - konzervativní 10-15 bp • AT-bohaté (~72% Stowaway) • tvoří sekundární struktury DNA (hairpins) • preference cílového místa - TA(A) • asociace s geny – v intronech, poblíž 5‘ nebo 3‘ konců genů MITE elementy rodiny: - Stowaway (jednoděložné, dvouděložné, živočichové) - Tourist (trávy) - Emigrant, Alien, Heartbreaker, Bigfoot, … (rostliny) Helitrony – nedávno objevené transposony využívající mechanismus otáčející se kružnice - replikace mechanizmem otáčivé kružnice (jako plazmidy, ss fágy, geminiviry) - výskyt u eukaryot - 2% genomu A.thaliana, C. elegans, také v Oryza sativa - nedělají duplikaci cílové sekvence (TSD) - cílená inzerce do AT dinukleotidu - začínají 3’-AT a končí CTRR-5’, nemají TIR - konzervace palindromu před 3’CTRR (sekvence není konzervativní) - většina elementů je neautonomní (0.5-3kb), vzácné dlouhé Helitrony (5.5-15kb) - kódující proteiny pro RC replikaci: helikázu (HEL), nukleázu/ligázu a proteiny vážící jednořetězcovou DNA (RPA) - mechanizmus tvorby neautonomních elementů nejasný - Helitrony jako evoluční spojovník mezi prokaryotickými RC elementy a geminiviry (potomci geminivirů intergrovaných do genomů časných eukaryot) Třída I. Retrotranspozony (Retroelementy) Obsah obrázku pes, interiér, ležící, hnědá Popis byl vytvořen automaticky PR RT IN IN PR RT GAG VLP Reverzní transkripce jádro cytoplazma mRNA translace transkripce integrace IN IN IN IN LTR retrotransposon „copy and paste“ gag pro rt rnaseH int eORF PBS PPT LTR AAAAAAAA LTR retrovirus Havecker et al. (2004) Transpozony (disponují vlastním aparátem pro transpozici) Autonomní X Neautonomní Téměř polovinu lidského genomu tvoří mobilní elementy 20 až > 1 500 000 kopií Eukaryotické genomy: geny plovoucí po moři retrotransposonů Endogenní retroviry – otisky dávných infekcí primátů L1 elementy Alu elementy H-ERVs Co jsou retroelementy? •Retroelementy = sekvence DNA nebo RNA obsahující gen pro enzym reverzní transkriptázu (katalyzuje přepis RNA do DNA). • Širší definice zahrnuje veškeré sekvence vzniklé reverzní transkripcí RNA do DNA. • Po genomech se šíří procesem retropozice. • •Retropozice = přesun genetického materiálu z jednoho místa v genomu do místa jiného prostřednictvím RNA intermediátu. Má vždy duplikativní charakter. Jsou retroelementy relikty světa RNA? Podporuje to jejich struktura, konzervativní mechanismus replikace a všudypřítomnost. Reverzní transkripce - nasednutí primeru tRNA a extenze - odstranění RNA oblasti R a U5 - první přeskok a extenze - odstranění většiny RNA RNázouH - zbyde primer a extenze - odstranění zbytku virové RNA a tRNA - druhý přeskok a dosyntetizování U3 U5 R U3 U5 R U5 R U3 R LTR LTR LTR retrotranspozony gag pro rt rnaseH int eORF PBS PPT LTR AAAAAAAA LTR gag, pol, env ....... geny LTR ... dlouhé koncové repetice PBS .... místo vazby primeru PR ...... doména kódující proteázu INT .... doména kódující integrázu RT ...... doména kódující reverzní transkriptázu PPT ..... polypurinový úsek > ......... přímé repetice gag pro int rt rnaseH PBS PPT LTR AAAAAAAA LTR Typ Ty3/gypsy Typ Ty1/copia gag pol - Dominantní skupina transpozonů u rostlin, u živočichů obvykle méně kopií - Desítky až stovky podrodin v rámci každé rodiny (jménem Athila, Ogre, Angela, chromovirus…) - Obvykle jen několik podrodin je u daného druhu extrémně amplifikováno do počtů o tisících až desetitisících kopií a tvoří dohromady až 90 % délky genomu - Ty3/gypsy LTR retrotranspozony jsou předkové retrovirů gag pol gag pro rt rnaseH int env PBS PPT LTR LTR gag pol env Retroviry Endogenní retroviry - Původem retroviry, které kolonizovaly genom a přestaly vytvářet infekční částice - U člověka známé jako Human Endogenous Retroviruses (H-ERVs), tvoří cca 8 % genomu - Opakované infekce během vývoje savců i během evoluce primátů - Env – několikrát „domestikován“ – vznik syncitinů v placentě - Patrně přispívají k imunitě proti retrovirům (například prostřednictvím tvorby siRNA molekul, které v buňce ničí retrovirovou RNA) AAAAAAAA ORF1 ......... protein vážící RNA EN .............. doména kódující endonukleázu RT .............. doména kódující reverzní transkriptázu 5‘UTR ........ netranslatovaná oblast na 5‘ konci 3‘UTR ........ netranslatovaná oblast na 3‘ konci poly(A) ....... polyadeninový úsek > ................. přímé repetice ORF1 EN RT 5’UTR 3‘UTR > > poly(A) LINE (L1): SINE (sekvence Alu): levý monomer > poly(A) poly(A) pravý monomer > ORF2 1 kb 100 bp Non-LTR retrotranspozony (Retropozony) - Velmi rozšířená skupina transpozonů u živočichů, u rostlin obvykle méně kopií - U člověka dominantní typ transpozonů, L1 – 21 % genomu, Alu – 13 % genomu - Mnoho různých podrodin, ale vysokého počtu kopií dosahují jen některé z nich - Hrají roli v kompenzaci dávky genů (Inaktivace X) a vzniku regulačních genových sítí L1 elementy (LINE) - Autonomní LINE elementy savců, dominují lidskému genomu – 21 %, celkem 850 tisíc kopií - Člověk: aktivní L1 (516 tis), neaktivní L2 (315 tis) a L3 (37 tis) - TPRT mechanizmus mobilizace (Target Primed Reverse Transcription) - Hrají roli v kompenzaci dávky genů (Inaktivace X) a vzniku regulačních genových sítí - Průměrný lidský genom obsahuje asi 100 aktivních kopií, vysoká variabilita, někteří jedinci mají daleko vyšší aktivitu L1 – možný vznik chorob inzerční mutagenezí - Zvýšená aktivita v mozku lidí se schizofrenií (příčina nebo důsledek?) - Místa homologie pro genovou konverzi a rekombinaci – evoluce - Inzerce do zlomů chromozomů – reparace DNA Včleňování LINE elementů TPRT (target-primed RT) Twin priming: mechanizmus tvorby inverzí Template switch Alu elementy (SINE) - Odvozeny od 7SL RNA genu kódujícího podjednotku signální rozpoznávací částice (přenos proteinů přes membrány a začleňování do membrán) - délka 300 bp, u člověka 1-1,5 milionu kopií - Vznik před oddělením linie primátů a hlodavců (70 milionů let) - Závislé na mobilizačním aparátu L1 elementů - Trvalá kumulace kopií v genomu pravděpodobně kvůli malé délce Alu – nízká pravděpodobnost delece genovou konverzí - Časté včleňování blízko nebo do genů – ovlivnění exprese přilehlých genů (alu obsahuje vazebná místa pro transkripční faktory) a vznik míst pro alternativní sestřih, předčasné ukončení transkripce… - Hrají roli při vzniku mnoha genetických chorob a rakoviny msDNA (=multicopy single-stranded) - intermediáty extrachromosomálního replikačního cyklu nebo abortivní produkty intermediátů msr msd RT msDNA: retron: Retrony - primitivní retroelementy bakterií msr ... gen kódující RNA složku msd ... gen kódující DNA složku RT ..... gen pro reverzní transkriptázu Prokaryotické retroelementy: 1. Kódují jediný RT protein s jedinou enzymatickou aktivitou (doménu). Ostatní aktivity (proteáza, integráza, endonukleáza) retroelementy v průběhu evoluce získaly od hostitele (jako onkogeny retrovirů) 2. RT prokaryot provádí syntézu nezávislou na primeru podobně jako RNA polymeráza (předchůdce RT) 3. Prokaryotické RT jsou podobné RdRP (RNA-directed RNA polymerase), RT eukaryotických retroelementů jsou méně příbuzné RT LTR INT Retropozony Retrotranspozony Ty1-copia Retrotranspozony Ty3-gypsy Retroviry gen pro RNA replikázu gag env RT gag + INT Caulimoviry Hepadnaviry RNA virus Retrony Introny II. skupiny Mitochondriální plazmidy bakteriální genom intron mitochond. plazmid ? RT RT RNA virus RT Schéma evoluce retroelementů první větev druhá větev Paraziti parazitů: Neautonomní elementy tvoří většinu. Balancovaná rovnováha Vybalancovaná rovnováha mezi autonomními (A) a neautonomními (N) elementy: - přílišná úspěšnost neautonomních vede k záhubě - titrace transpozázy neautonomními vede k omezením aktivity - inhibice nadprodukcí - koevoluce A a N řízena kompeticí o RT - koevoluce endogenních a exogenních retrovirů – rezistence k infekci - další mechanizmy restrikce: metylace a heterochromatinizace