MOLEKULÁRNÍ BIOLOGIE PROKARYOT Jiří Doškař OSNOVA PŘEDNÁŠKY 2015 Úvodní přednáška: obsah přednášky, literatura, význam prokaryot Genom prokaryot a charakteristika jeho složek Struktura prokaryotického genomu, jeho základní charakteristika a informační obsah Složky genomu a jejich a vzájemné interakce Bakteriální chromozom Plazmidy Prokaryotické transponovatelné elementy Využití transpozonů ke studiu prokaryotického genomu, Transpozonová mutageneze Mutace bakterií Principy mutageneze, metody selekce mutant, jaderná segregace, fenotypové zdržení, fluktuační test a jeho využití Reparace mutačních poškození DNA u bakterií Mechanizmy horizontálního přenosu genů u prokaryot Transformace (přirozená a uměle navozená) Transdukce (nespecifická a specifická), kapsdukce Konjugace (konjugativní plazmidy, konjugativní transpozony) Obranné mechanismy bakterií vůči externí DNA, RM-systémy bakterií, antirestrikční mechanismy fágů a plazmidů, systémy CRISPR-Cas Evoluce bakteriálních genomů, podstata změn ve struktuře a obsahu genomů DOPORUČENÁ LITERATURA Rosypal S. a kol.: Obecná bakteriologie, SPN Praha 1981. Joset F.: Guespin-Michel J. Prokaryotic Genetic. Blackwell Science ltd. 1993. Lewin B.: Genes V-VII, Oxford University Press, Oxford, New York Tokyo 1994- 2000. Maloy S.R. et al.: Microbial Genetics, 2. vydání, Jones and Barlett Publ, BostonLondon, 1994. Birge E.A.: Bacterial and bacteriophage genetics. Springer 2000. Snyder L., Peters JE, Henkin TM, Champness W.: Molecular genetics of bacteria, 4nd ed. , ASM Press 2013. Miller R. V., Day M. J.: Microbial evolution – Gene establishment, Survival and Evolution. ASM Press, Washington, D.C., 2004. Funnell B.E., Phillipsm G.J.: Plasmid Biology, ASM Press, Washington, D.C., 2004, 2015 Persing D.H. ed. Molecular Microbiology – Diagnostic Principles and Practice, ASM Press, Washington, 2011 Snustad P., Simmons MJ.: Genetika, český překlad, MU 2009. M.P. Francino: Horizontal gene transfer in Microorganisms. Caister Acad. Press,Nerfolk, UK 2012. Alberts et al.: Molecular biology of the cell. Garland Publ. 2015. VÝZNAM PROKARYOT Z HLEDISKA MOLEKULÁRNÍ BIOLOGIE Modelové organismy pro studium základních biologických procesů Využití bakterií v základním výzkumu (klonování genů, studium jejich exprese, atd) Výhody krátká generační doba, vysoký počet jedinců snadná kultivace na definovaných půdách, znalost metabolických drah existence dobře definovaných mutant dobře přístupné studiu, snadná izolace biol. makromolekul a struktur studium evoluce - možnost sledování genetických změn v krátkých časových intervalech PRAKTICKÝ VÝZNAM PROKARYOTICKÝCH ORGANISMŮ patogenita řady druhů (parazitismus - symbioza) využití v tradičních biotechnologiích (kvasný průmysl, příprava nápojů a potravin) producenti významných látek (antibiotika, enzymy, farmaka, sekundární metabolity) producenti cizorodých látek připravených metodami GI (např. inzulin, hormony, protilátky aj.) příprava probiotických preparátů (úprava mikrobiomu, mikrobiota) příprava vakcín genetickou modifikací („infektomika“) využití extrémofilů a jejich produktů (bakterie a archea) A. poznání struktury genomu a funkce jeho složek - vytváření cílených změn genomu za účelem navození nových vlastností: - - příprava produkčních kmenů v biotechnologiích - - Interakce bakterií s hostitelem (patogenní a potenciálně patogenní druhy) – antigenní struktury x imunitní odpověď - - příprava vakcín - - vyhledání buněčných cílů pro nová terapeutika B. objasnění mechanismů evoluce - charakter (makro)mutačních změn genomů - úloha horizontálního přenosu genů v evoluci genomů (objasnění vzniku kmenů rezistentních k léčivům nebo kmenů se zvýšenou virulencí, vznik nových druhů) Současné trendy v oblasti molekulární biologie prokaryot Více než 5 000 popsaných bakteriálních druhů ~ 1% dosud známých (odhad 5-10 milionů druhů) U prokaryot neplatí paradox hodnoty C SROVNÁNÍ VELIKOSTI GENOMŮ PROKARYOT A EUKARYOT Obsah GC = 22-75 mol% Velikost genomu vybraných druhů bakterií 1,6 Mb Velikost genomů bakterií podle jejich životního stylu Volně žijící Obligátní pariziti Obligátní symbionti Volně žijící Velikost genomu Velmi nízký obsah paralogních genů Symbiont Carsonella ruddii, which consists of a circular chromosome of 159,662 base pairs, 182 ORFs, averaging 16.5% GC content. It is by far the smallest and most AT-rich bacterial genome yet characterized. The genome has a high coding density (97%) with many overlapping genes and reduced gene length. Genes for translation and amino acid biosynthesis are relatively well represented, but numerous genes considered essential for life are missing, suggesting that Carsonella may have achieved organelle-like status. Genome reduction appear to reach limits of about 400 kb and about 20% GC, which are believed to be the minimal limits for cellular organisms Relationship between genome sizes and GC content of 358 complete genomes from Bacteria and Archaea: red indicates Carsonella; blue represents endosymbionts Buchnera, Blochmannia, Wigglesworthia, and Baumannia; yellow, other Bacteria; and green, Archaea Carsonella ruddii (nebo též Candidatus C. ruddii, protože nebyla kultivována) je endosymbiotická proteobakterie s nejmenším genomem ze všech buněčných organismů.[1] Carsonella ruddii žije uvnitř těla určitého druhu mer, drobného hmyzu. Má jen 159 662 párů bází a jejich genom je složen pouze z 182 genů, což je méně, než bylo vydáváno za minimální nutné množství genů k životu.[1] Mnoho důležitých genů patrně chybí, a tak se zdá, že se Carsonella dostává v těle svého hostitele do pozice „organely“.[2] Nanoarchaeum equitans Nanoarchaeum equitans je neobvyklý druh archea, objevený v roce 2002. Většinou je řazen do samostatného kmene Nanoarchaeota, přestože některé studie ho řadí k Euryarchaeota. Dosahuje i na prokaryotické poměry velmi drobných rozměrů. Byl objeven v mořích poblíž Islandu mikrobiologem Karlem Stetterem a jeho kolegy. Popis Nanoarchaeum byl objeven v horké vodě poblíž hydrotermálních průduchů v mořích u Islandu. Jelikož zde voda dosahuje bodu varu, jedná se o hypertermofila. Zajímavou skutečností je fakt, že zde Nanoarchaeum žije v symbiotickém vztahu s jiným archeonem, a to z rodu Ignicoccus. Tento vztah je některými vědci považován za parazitismus a Nanoarchaeum je tedy zatím jediným známým parazitem z domény archea.[6] Nanoarchaeum je extrémně drobný, jeho kokovité buňky mají v průměru asi 400 nm.Také genom je velmi malý a je vůbec nejmenší mezi všemi buněčnými organismy: má jen 490 885 párů bazí. Tato DNA je však velmi efektivní a 95% jsou kódující sekvence (kódují proteiny či některé druhy RNA).[6] Na druhou stranu však nebyly nalezeny geny pro biosyntézu lipidů, kofaktorů, aminokyselin či nukleotidů. Nanoarchaeum equitans Mozaikový charakter Variabilní složka genomu – adaptace na prostředí Vysoká dynamika a plasticita Rozdíly v obsahu VGE u různých druhů Variabilní genetické elementy (VGE) (20 % genomu S. aureus) Chromozomové kazety rezistence k meticilinu (SCCmec) Jedinečné ostrovy patogenity (SaPI) Společné genomické ostrovy Profágy Lokus přídatného genového regulátoru (agr) Integrované plazmidy Repetitivní elementy (STAR) Inzerční sekvence a transpozony Pangenom (supra-genom) Soubor genů u daného druhu bakterií nebo archeií - odpovídá počtu genů zjištěných u kmenů daného druhu – obsah a forma genů u různých kmenů se výrazně liší. „Core“ genom – geny přítomné u všech kmenů Postradatelná část genomu – geny přítomné jen u dvou nebo více kmenů Jedinečné geny – geny vyskytující se pouze u jednoho kmene Pangenom určitého bakteriálního druhu může být řádově vyšší než jsou genomy jednotlivých kmenů Počet kopií chromozomu: 1-40/buňku (haploidie, ~polyploidie) MCLR – multiple chromosome-like replicons – známy u 44 druhů Hlavní chromozom Rhizobium leguminosarum o velikosti 5 Mb a soubor plazmidů o velikostech od 0.87 do 0.15 Mb, které dohromady představují 35% celého genomu Příklady bakteriálních druhů obsahujících více chromozomů PŘÍKLADY PROKARYOT S LINEÁRNÍM CHROMOZOMEM Streptomyces (S. ambofaciens, S. lividans) 10 Mb Borrelia burgdorferi (B. hermsii) 0.95 Mb Coxiella burnetii 2,1 Mb Paracoccus denitrificans - tři molekuly DNA 2 Mb; 1,1 Mb; 0,64 Mb, dvě jsou lineární Agrobacterium tumefaciens - tři molekuly DNA 3,0 Mb; 2,1 Mb; 0,55 Mb; 0,25 Mb dNTP vázající se na TP (telomerový protein) poskytuje 3'-OH Vlásenkové telomery Invertronové telomery Replikace lineárního chromozomu u bakterií r. Borrelia Protein ResT (telomere resolvase protein) vytvoří zlomy v obou řetězcích a znovuspojí je za vzniku vlásenek Bakteriofág N15 – koncová oblast tos jeho lineárního genomu + protein TelN – přenos těchto elementů do E. coli vede k linearizaci jejího chromozomu Velikost genomu a počet genů u bakterií a archeí SEKVENOVANÉ GENOMY PROKARYOT Současný stav: zhruba tisíc kompletně sekvenovaných genomů, u některých druhů více kmenů: značné rozdíly ve velikosti a struktuře SpeciesStrainTypeBase PairsGenes 5,6035,224,283Firmicutes BacilliATCC10987Bacillus cereus 5,2875,228,663Firmicutes BacilliSterneBacillus anthracis 5,3115,227,293Firmicutes BacilliAmesBacillus anthracis 4,1284,296,230Proteobacteria BetaproteobacteriaEbN1Azoarcus sp. 1,5221,551,335Aquificae AquificaeVF5Aquifex aeolicus 1,2641,471,282Proteobacteria AlphaproteobacteriaHZAnaplasma phagocytophilum 9491,197,687Proteobacteria AlphaproteobacteriaStMariesAnaplasma marginale 4,3465,013,479Proteobacteria delta-epsilon2CP-CAnaeromyxobacter dehalogenans 5,0396,365,727Cyanobacteria NostocalesATCC29413Anabaena variabilis 5,3686,413,771Cyanobacteria NostocalesPCC7120Anabaena nostoc 2,7222,841,581Proteobacteria AlphaproteobacteriaC58Agrobacterium tumefaciens 3,3253,598,621Proteobacteria GammaproteobacteriaADP1Acinetobacter sp. 4,7775,650,368AcidobacteriaEllin345Acidobacteria bacterium Species Strain Type bp Genes http://www.sanger.ac.uk/resources/downloads/bacteria/ SEKVENOVANÉ GENOMY: ARCHAEA 1,7221,661,137S2Methanococcus maripaludis 2,2732,575,032DSM6242Methanococcoides burtonii 1,7151,664,970DSM2661Methanocaldococcus jannaschii 1,8691,751,377delta-HMethanobacterium thermoautotrophicum 2,0582,014,239NRC1Halobacterium species DS2Haloferax volcanii 3,1313,131,724ATCC43049Haloarcula marismortui 2,4072,178,400DSM4304Archaeoglobus fulgidus 2,6941,669,695K1Aeropyrum pernix Současný stav: zhruba 30 kompletně sekvenovaných genomů Species Strain bp Genes GENETICKÁ ORGANIZACE PROKARYOTICKÉHO GENOMU velmi kompaktní genom s malými mezerami mezi geny většina genomu je obsazena strukturními geny (převážně jednoduché geny, u ¼ genomů byly nalezeny introny II sk. (mimo ORF, na VGE, např. retroelementech, kódující RT) malá část (10%) je tvořena nekódující DNA operonové uspořádání genů (většinou funkčně příbuzné) pořadí genů není u prokaryot konzervováno 90% 10% TYPY SEKVENCÍ PROKARYOTICKÉHO GENOMU Kódující oblasti Geny (ORF) se známou nebo neznámou funkcí Inzerční sekvence a transpozony Profágy (a defektní profágy) Sekvence přepisované do RNA (rRNA, tRNA) Repetice Polynukleotidové sekvence a tandemové repetice Krátké roztroušené repetitivní sekvence Dlouhé roztroušené repetitivní elementy Mosaikové repetitivní elementy Chi-místa a jim podobné sekvence Rhs elementy Organizmus Hustota genů je zhruba stejná: 1 gen ~ 1 kb POČTY PARALOGNÍCH GENŮ V GENOMECH BAKTERIÁLNÍCH DRUHŮ Se zvětšováním genomu se zvyšuje obsah paralogních genů HGT, genové duplikace TYPY REPETICÍ V PROKARYOTICKÝCH GENOMECH A. Polynukleotidové sekvence a tandemové repetice Trinukleotid TGG – nejčastější trinukleotid E. coli (součást penta nebo oktanukleotidů) Nonamer AAGTGCGGT (uptake signal sequence – USS) H. influenzae - 1465 kopií Tandemově opakované polynukleotidové sekvence (GTG)n nebo (GCC)n - vysoce repetitivní u E. coli, S. typhimurium a Shigella sp. Short tandemly repeated repetitive (STRR) sequences - heptanukleotidová opakování u sinice Calothrix Major polymorphic tandem repeat (MPTR) - polymorfní 10-bp DR u Mycobacterium tuberculosis a dalších mykobakterií (podobnost s místy Chi a roztroušenými REP elementy) TYPY REPETICÍ V PROKARYOTICKÝCH GENOMECH B. Krátké roztroušené repetitivní sekvence (kratší než 50 bp) REP (repetitivní extragenové palindromatické sekvence) 38 bp, 500 REP u E. coli PU (palindromic units) u E. coli a S. typhimurium. Mnohokopiový 26-mer (Ngrep) u Neisseria gonorrhoeae a N. meningitidis Mnohokopiový 24-mer DR element u Mycobacterium bovis (38 kopií) TYPY REPETICÍ V PROKARYOTICKÝCH GENOMECH C. Dlouhé roztroušené repetitivní elementy (větší než 50 bp) intergenic repeat unit (IRU) enterococcal repetitive intergenic consensus (ERIC) 126 bp nebo zkrácené formy. Chromozomová lokalizace se liší u kmenů a druhů ERIC-like sekvence – celá bakteriální říše. RLEP (545 - 1063 bp) u Mycoplasma leprae 28 (0,6% genomu) Mx-rep u Myxococcus xanthus - 87 pb jádrová sekvence Dr-rep (SARK) u Deinocccus radiodurans Element o variabilní délce (150-192 bp) RepMP2, RepMP1, SDC1 (150 bp – 1 kb) u Mycplasma pneumoniae, v genomu 8-10 kopií. RepMP2-like u Staphylococcus TYPY REPETICÍ V PROKARYOTICKÝCH GENOMECH D. Mosaikové repetitivní elementy Bacterial Interspersed Mosaic Elements (BIME) – (kombinace REP a sedmi dalších repetitivních motivů). 500 u E. coli a dalších G- enterobakterií (Klebsiella pneumoniae, S. typhimurium) REP MP 1 300 bp element ohraničený kratšími repetitivními sekvencemi u M. pneumoniae. BOX elementy – rozptýlené repetitivní elementy u G+ (Streptococcus pneumoniae). ZÁVĚRY ZE SROVNÁNÍ SEKVENOVANÝCH GENOMŮ Počet informačních genů je v každém genomu zhruba stejný, i když se jejich velikosti liší až 5x. Počet genů ostatních funkčních kategorií je mnohem variabilnější a má tendenci se zvyšovat Se zvětšováním velikosti genomu přibývá paralogních genů a zvětšuje se též biochemická komplexita organismu. Jedna čtvrtina ORF u každého druhu je jedinečná a nemá významnou sekvenční homologii k žádné známé nukleotidové nebo proteinové sekvenci. HORIZONTÁLNÍ PŘENOS GENŮ Často přenášené: operační geny (metabolismus a regulace, buněčná struktura) Zřídka přenášené: informační geny (transkripce, translace) Horizontální přenos genů je spjat s variabilními genetickými elementy profágy, plazmidy, IS-elementy, transpozony, integrony POČET HORIZONTÁLNĚ PŘENESENÝCH GENŮ U VYBRANÝCH DRUHŮ BAKTERIÍ A ARCHEIÍ 7,3512417651,76Pyrococcus abyssi 5,07717151,66Methanococcus jannaschii 10,317918691,75Methanobacterium therm. 14,037026941,67Aeropyrium pernix Archaea 11,6319818461,86Thermotoga maritima 7,521931693,57Synechocystis sp. 3,929525802,65Deinococcus radiodurans 4,3368941,04Chlamydia trachomatis Chlamydiae 8,37710311,14Treponema pallidum 1,56128500,91Borrelia burgdorferi Spirochaete 5,018739184,41Mycobacterium tuberculosis 5,9396770,82Mycoplasma pneumoniae 14,5674800,58Mycoplasma genitalium 14,553741004,21Bacillus subtilis Gram-pozitivní bakterie 3,6288341,11Rickettsia prowazekii 6,48915531,67Helicobacter pylori 6,296961,83Haemophilus influenzae 9,638142894,64Escherichia coli %početProteobacteria Horizontálně přenesené ORFPočet ORFVelikost genomu (Mbp)Druh Bakterie s umělým genomem Tým čtyřiadvaceti genetiků v čele s Craigen Venterem syntetizoval v laboratořích The J. Craig Venter Institute dědičnou informaci jednoduché bakterie Mycoplasma mycoides složenou z více než milionu písmen (1 Mbp) genetického kódu. Tak dlouhou molekulu nelze vyrobit najednou. Vědci nejprve syntetizovali její kratší části a ty pak skládali do větších celků. Nakonec byly součásti genomu tak velké, že si s nimi už laboratorní technika neporadila. Finální kompletaci bakteriální DNA proto genetici svěřili buňkám kvasinek. V těch pak získali úplný genom bakterie, který přenesli do příbuzné bakterie Mycoplasma capricolum. Gibson DG, et al.: Creation of a bacterial cell controlled by a chemically synthesized genome. Science. 2010 Jul 2;329(5987):52-6. FYZIKÁLNÍ ORGANIZACE BAKTERIÁLNÍHO CHROMOZOMU dsDNA - není obalená jadernou membránou vazba malých proteinů typu HU (histon-like) - 105 molekul, vázajících se sekvenčně nespecificky, ovlivňujících flexibilitu DNA (ohýbání DNA do smyček) („architektura“ nukleoidu). Účast při replikaci, transkripci a rekombinaci Proteiny HN-S vázající se na AT-bohaté oblasti DNA, zvyšuje její teplotní stabilitu a brání transkripci. Možná má podobnou funkci jako histony. Protein Fis – ovlivňuje topologii a superhelicitu DNA Vazba proteinu IHF (integration host factor), vázající se sekvenčně specificky na DNA, zejména na regulační oblasti 50 superhelikálních smyček, bez účasti RNA kontrola stavu superhelicity: topoizomeráza, gyráza – změny vinutí při replikaci, přichycení na membránu Archea: mají rudimentární histony příbuzné histonům eukaryot STRUKTURA CHROMOZOMU E. coli 4,6 Mb, 50% GC, 1 µm Bakteriální nukleoid …molekulární mechanismy udržující nukleotid v buňce jsou neznámé, ale jistě existují specifické systémy, které zajišťují jeho replikaci, transkripci, rekombinaci a další funkce… CHARAKTERISTIKA PLAZMIDŮ dsDNA – kružnicová nebo lineární, velikost: 1-1000 kb Základní typy plazmidů: kryptické - funkce neznámá epizomální - reverzibilní intergace do chromozomu hostitele konjugativní - schopné přenosu konjugací mobilizovatelné – přenositelné za přítomnosti konjugativního plazmidu Příklady plazmidů: F-plazmidy (fertilitní faktor, konjugativní) zodpovědné za konjugaci, příp. mobilizaci jiných plazmidů R-plazmidy (R-faktory) zodpovědné za rezistenci k antibiotikům, řada z nich konjugativní kolicinogenní (Col-plazmidy) tvorba proteinů s antibiotikovým charakterem (Enterobacteriaceae) Ti-plazmidy (tumory indukující) tvorba nádorů u dvouděložných rostlin (Agrobacterium tumefaciens) Plazmidy odbourávající organické sloučeniny (Pseudomonas) Plazmidy podílející se na fixaci vzdušného dusíku (Rhizobium). Plazmidy používané jako vektory pro přenos DNA (pBR322, pUC)