MOLEKULÁRNÍ BIOLOGIE PROKARYOT (PS 2021) Jiří Doškař, Ivana Mašlaňová Sylabus předmětu Molekulární biologie prokaryot 1. Úvodní přednáška (obsah, literatura, význam prokaryot) – Genom prokaryot a charakteristika jeho složek 2. Prokaryotické transponovatelné elementy 3. Využití transpozonů ke studiu prokaryotického genomu, transpozonová mutageneze 4. Plazmidy I 5. Plazmidy II 6. HGT - Transformace 7. HGT - Transdukce 8. HGT - Konjugace 8. Mutace bakterií 9. Reparace mutačních poškození DNA u bakterií 10. Obranné mechanismy bakterií vůči externí DNA (RM systémy) 11. Obranné mechanismy bakterií vůči externí DNA (CRISPR-Cas) 12. Evoluce bakteriálních genomů DOPORUČENÁ LITERATURA  Maloy S.R. et al.: Microbial Genetics, 5. vydání, Jones and Barlett Publ, BostonLondon, 2010.  Birge E.A.: Bacterial and bacteriophage genetics. Springer 2000, 2006.  Snyder L., Peters JE, Henkin TM, Champness W.: Molecular genetics of bacteria, 4nd ed. , ASM Press 2013.  Miller R. V., Day M. J.: Microbial evolution – Gene establishment, Survival and Evolution. ASM Press, Washington, D.C., 2004.  Funnell B.E., Phillipsm G.J.: Plasmid Biology, ASM Press, Washington, D.C., 2004, 2015  Persing D.H. ed. Molecular Microbiology – Diagnostic Principles and Practice, ASM Press, Washington, 2011  Snustad P., Simmons MJ.: Genetika, český překlad, MU 2009, 2017.  M.P. Francino: Horizontal gene transfer in Microorganisms. Caister Acad. Press,Nerfolk, UK 2012.  Alberts et al.: Molecular biology of the cell. Garland Publ. 2015.  Power-pointové prezentace přednášek + doplňující texty (IS) Informace ke zkoušce Zkouška má dvě části: A. Písemná příprava – student si připraví odpovědi na 7 otázek, pokrývajících vybrané tématické okruhy z probírané látky. Příklady otázek: 1. Znározněte schematicky a popište strukturu Ti-plazmidu a funkce jeho genů 2. Znázorněte schematicky, jak byla experimentálně prokázána konzervativní transpozice Tn10 3. Uveďte základní rysy přirozené transformace (charakter přijímané DNA, průběh přenosu, způsob začlenění DNA do genomu recipienta) 4. Vysvětlete princip SOS-mutageneze 5. Shrňte rozdíly v procesu konjugace u G- a G+ bakterií. 6. Znározněte schematicky a popište fungování systému CRISPR/Cas 7. Vysvětlete pojem abortivní transdukce B. Ústní část - student doplňuje informace k jednotlivým odpovědím na základě dotazů zkoušejících. Písemná příprava trvá 60 minut, ústní část 10-30 minut. VÝZNAM PROKARYOT Z HLEDISKA MOLEKULÁRNÍ BIOLOGIE A GENETIKY  Modelové organismy pro studium základních biologických procesů  Využití bakterií v základním výzkumu (klonování genů, studium jejich exprese, atd)  Výhody ◼ krátká generační doba, vysoký počet jedinců ◼ snadná kultivace na definovaných půdách, znalost metabolických drah ◼ existence dobře definovaných mutant ◼ dobře přístupné studiu, snadná izolace biol. makromolekul a struktur ◼ studium evoluce - možnost sledování genetických změn v krátkých časových intervalech PRAKTICKÝ VÝZNAM PROKARYOTICKÝCH ORGANISMŮ  patogenita řady druhů (parazitismus - symbioza)  využití v tradičních biotechnologiích (kvasný průmysl, příprava nápojů a potravin)  producenti významných látek (antibiotika, enzymy, farmaka, sekundární metabolity)  producenti cizorodých látek připravených metodami GI (např. inzulin, hormony, protilátky aj.)  příprava probiotických preparátů (úprava mikrobiomu, mikrobiota)  příprava vakcín genetickou modifikací („infektomika“)  využití extrémofilů a jejich produktů (bakterie a archea) A. poznání struktury genomu a funkce jeho složek - vytváření cílených změn genomu za účelem navození nových vlastností: - - příprava produkčních kmenů v biotechnologiích - - Interakce bakterií s hostitelem (patogenní a potenciálně patogenní druhy) – antigenní struktury x imunitní odpověď - - příprava vakcín – metody genového inženýrství - - vyhledání buněčných cílů (molekul a struktur) pro nová terapeutika B. objasnění mechanismů evoluce - charakter (makro)mutačních změn genomů - úloha horizontálního přenosu genů v evoluci genomů (objasnění vzniku kmenů rezistentních k léčivům nebo kmenů se zvýšenou virulencí, vznik nových druhů) Současné trendy v oblasti molekulární biologie prokaryot Více než desítky tisíc popsaných bakteriálních druhů According to a new estimate, there are about one trillion species of microbes on Earth, and 99.999 percent of them have yet to be discovered. 10,000,000,000,000,000,000 (1019) tj. deset TRILIONŮ U prokaryot neplatí paradox hodnoty C SROVNÁNÍ VELIKOSTI GENOMŮ PROKARYOT A EUKARYOT Obsah GC = 22-75 mol% Velikost genomu vybraných druhů bakterií 1,6 Mb Velikost genomů bakterií podle jejich životního stylu Volně žijící Obligátní paraziti Obligátní symbionti Volně žijící Velikost genomu Velmi nízký obsah paralogních genů Symbiont Carsonella ruddii, obsahuje kružnicový chromozom o velikosti 159,662 bp, má 182 ORFs, obsah GC 16.5%. Její genom je zatím nejmenší z popsaných, má nejvyšší obsah AT. 97% genomu má kódující kapacitu, jeho geny se překrývají a mají redukovanou velikost. Geny pro translaci a biosyntézu aminokyselin jsou početné, ale řada genů považovaných za esenciální chybí. Carsonella se tak podobá organelám. Genome reduction appear to reach limits of about 400 kb and about 20% GC, which are believed to be the minimal limits for cellular organisms Relationship between genome sizes and GC content of 358 complete genomes from Bacteria and Archaea: red indicates Carsonella; blue represents endosymbionts Buchnera, Blochmannia, Wigglesworthia, and Baumannia; yellow, other Bacteria; and green, Archaea Carsonella ruddii (nebo též Candidatus C. ruddii, protože nebyla kultivována) je endosymbiotická proteobakterie s nejmenším genomem ze všech buněčných organismů.[1] Carsonella ruddii žije uvnitř těla určitého druhu mer, drobného hmyzu. Má jen 159 662 párů bází a jejich genom je složen pouze z 182 genů, což je méně, než bylo vydáváno za minimální nutné množství genů k životu.[1] Mnoho důležitých genů patrně chybí, a tak se zdá, že se Carsonella dostává v těle svého hostitele do pozice „organely“.[2] Na hmyzím jedinci jsou patrny žluté skvrny, jsou to místa, kde endosymbiotické bakterie jsou součástí buněk těla svého hostitele. Jeden bez druhého se již nemůže obejít. Jsou to svědci evoluce, kdy se z bakterie stává organela. Útvaru, ve kterém hostitel svého hosta hýčká, se říká bakteriom. mera Nanoarchaeum equitans Nanoarchaeum equitans je neobvyklý druh archea, objevený v roce 2002. Většinou je řazen do samostatného kmene Nanoarchaeota, přestože některé studie ho řadí k Euryarchaeota. Dosahuje i na prokaryotické poměry velmi drobných rozměrů. Byl objeven v mořích poblíž Islandu mikrobiologem Karlem Stetterem a jeho kolegy. Popis Nanoarchaeum byl objeven v horké vodě poblíž hydrotermálních průduchů v mořích u Islandu. Jelikož zde voda dosahuje bodu varu, jedná se o hypertermofila. Zajímavou skutečností je fakt, že zde Nanoarchaeum žije v symbiotickém vztahu s jiným archeonem, a to z rodu Ignicoccus. Tento vztah je některými vědci považován za parazitismus a Nanoarchaeum je tedy zatím jediným známým parazitem z domény archea. Nanoarchaeum je extrémně drobný, jeho kokovité buňky mají v průměru asi 400 nm.Také genom je velmi malý a je vůbec nejmenší mezi všemi buněčnými organismy: má jen 490 885 párů bazí. Tato DNA je však velmi efektivní a 95% jsou kódující sekvence (kódují proteiny či některé druhy RNA). Na druhou stranu však nebyly nalezeny geny pro biosyntézu lipidů, kofaktorů, aminokyselin či nukleotidů. Nanoarchaeum equitans Mozaikový charakter Variabilní složka genomu – adaptace na prostředí Vysoká dynamika a plasticita Rozdíly v obsahu VGE u různých druhů Variabilní genetické elementy (VGE) (20 % genomu S. aureus) Chromozomové kazety rezistence k meticilinu (SCCmec) Jedinečné ostrovy patogenity (SaPI) Společné genomické ostrovy Profágy Lokus přídatného genového regulátoru (agr) Integrované plazmidy Repetitivní elementy (STAR) Inzerční sekvence a transpozony Pangenom (supra-genom) Soubor genů u daného druhu bakterií nebo archeí - odpovídá celkovému počtu genů zjištěných u kmenů daného druhu – obsah a forma genů u různých kmenů se výrazně liší. „Core“ genom – geny přítomné u všech kmenů Postradatelná část genomu – geny přítomné jen u dvou nebo více kmenů, často na mobilních elementech Jedinečné geny – geny vyskytující se pouze u jednoho kmene Pangenom určitého bakteriálního druhu může být až řádově vyšší než jsou genomy jednotlivých kmenů Počet kopií chromozomu: 1-40/buňku (haploidie, ~polyploidie) MCLR – multiple chromosome-like replicons – známy u 44 druhů Příklady organizace bakteriálních genomů Hlavní chromozom Rhizobium leguminosarum o velikosti 5 Mb a soubor plazmidů o velikostech od 0.87 kbp do 0.15 Mb, které dohromady představují 35% celého genomu Příklady bakteriálních druhů obsahujících více replikonů PŘÍKLADY PROKARYOT S LINEÁRNÍM CHROMOZOMEM  Streptomyces (S. ambofaciens, S. lividans) 10 Mb  Borrelia burgdorferi (B. hermsii) 0.95 Mb  Coxiella burnetii 2,1 Mb  Paracoccus denitrificans - tři molekuly DNA ◼ 2 Mb; 1,1 Mb; 0,64 Mb, dvě jsou lineární  Agrobacterium tumefaciens - tři molekuly DNA ◼ 3,0 Mb; 2,1 Mb; 0,55 Mb; 0,25 Mb dNTP vázající se na TP (telomerový protein) poskytuje 3'-OH Vlásenkové telomery Invertronové telomery Replikace lineárního chromozomu u bakterií r. Borrelia Protein ResT (telomere resolvase protein) vytvoří zlomy v obou řetězcích a znovuspojí je za vzniku vlásenek Bakteriofág N15 – koncová oblast tos jeho lineárního genomu + protein TelN – přenos těchto elementů do E. coli vede k linearizaci jejího chromozomu Velikost genomu a počet genů u bakterií a archeí SEKVENOVANÉ GENOMY PROKARYOT Současný stav: několik tisíc kompletně sekvenovaných genomů, u některých druhů více kmenů: značné rozdíly ve velikosti a struktuře SpeciesStrainTypeBase PairsGenes Acidobacteria bacterium Ellin345 Acidobacteria 5,650,368 4,777 Acinetobacter sp. ADP1 Proteobacteria Gammaproteobacteria 3,598,621 3,325 Agrobacterium tumefaciens C58 Proteobacteria Alphaproteobacteria 2,841,581 2,722 Anabaena nostoc PCC7120 Cyanobacteria Nostocales 6,413,771 5,368 Anabaena variabilis ATCC29413 Cyanobacteria Nostocales 6,365,727 5,039 Anaeromyxobacter dehalogenans 2CP-C Proteobacteria delta-epsilon 5,013,479 4,346 Anaplasma marginale StMaries Proteobacteria Alphaproteobacteria 1,197,687 949 Anaplasma phagocytophilum HZ Proteobacteria Alphaproteobacteria 1,471,282 1,264 Aquifex aeolicus VF5 Aquificae Aquificae 1,551,335 1,522 Azoarcus sp. EbN1 Proteobacteria Betaproteobacteria 4,296,230 4,128 Bacillus anthracis Ames Firmicutes Bacilli 5,227,293 5,311 Bacillus anthracis Sterne Firmicutes Bacilli 5,228,663 5,287 Bacillus cereus ATCC10987 Firmicutes Bacilli 5,224,283 5,603 Species Strain Type bp Genes http://www.sanger.ac.uk/resources/downloads/bacteria/ SEKVENOVANÉ GENOMY: ARCHAEA Aeropyrum pernix K1 1,669,695 2,694 Archaeoglobus fulgidus DSM4304 2,178,400 2,407 Haloarcula marismortui ATCC43049 3,131,724 3,131 Haloferax volcanii DS2 Halobacterium species NRC1 2,014,239 2,058 Methanobacterium thermoautotrophicum delta-H 1,751,377 1,869 Methanocaldococcus jannaschii DSM2661 1,664,970 1,715 Methanococcoides burtonii DSM6242 2,575,032 2,273 Methanococcus maripaludis S2 1,661,137 1,722 Současný stav: několik desítek kompletně sekvenovaných genomů Species Strain bp Genes GENETICKÁ ORGANIZACE PROKARYOTICKÉHO GENOMU  velmi kompaktní genom s malými mezerami mezi geny  většina genomu je obsazena strukturními geny (převážně jednoduché geny, u ¼ genomů byly nalezeny introny II sk  malá část (10%) je tvořena nekódující DNA  operonové uspořádání genů (většinou funkčně příbuzných)  pořadí genů není u prokaryot konzervováno 90% 10% TYPY SEKVENCÍ PROKARYOTICKÉHO GENOMU  Kódující oblasti (na chromozomu n. plazmidech) ◼ Geny (ORF) se známou nebo neznámou funkcí ◼ Inzerční sekvence a transpozony ◼ Profágy (a defektní profágy)  Sekvence přepisované do RNA (rRNA, tRNA)  Repetice ◼ Polynukleotidové sekvence a tandemové repetice ◼ Krátké roztroušené repetitivní sekvence ◼ Dlouhé roztroušené repetitivní elementy ◼ Mosaikové repetitivní elementy ◼ Chi-místa a jim podobné sekvence ◼ Rhs elementy Organizmus Hustota genů je zhruba stejná: 1 gen ~ 1 kb POČTY PARALOGNÍCH GENŮ V GENOMECH BAKTERIÁLNÍCH DRUHŮ Se zvětšováním genomu se zvyšuje obsah paralogních genů HGT, genové duplikace Evoluční vztahy mezi ortologními a paralogními geny Jako homologní jsou označovány geny odvozené z jednoho společného (ancestrálního) genu. Již v roce 1970 bylo navrženo dělení homologních genů na dva typy: geny paralogní a geny ortologní. Paralogní geny jsou výsledkem duplikace ancestrálního genu, zatímco ortologní geny jsou výsledkem speciace. TYPY REPETICÍ V PROKARYOTICKÝCH GENOMECH A. Polynukleotidové sekvence a tandemové repetice  Trinukleotid TGG – nejčastější trinukleotid E. coli (součást penta nebo oktanukleotidů)  Nonamer AAGTGCGGT (uptake signal sequence – USS) H. influenzae - 1465 kopií  Tandemově opakované polynukleotidové sekvence (GTG)n nebo (GCC)n - vysoce repetitivní u E. coli, S. typhimurium a Shigella sp.  Short tandemly repeated repetitive (STRR) sequences - heptanukleotidová opakování u sinice Calothrix  Major polymorphic tandem repeat (MPTR) - polymorfní 10-bp DR u Mycobacterium tuberculosis a dalších mykobakterií (podobnost s místy Chi a roztroušenými REP elementy) TYPY REPETICÍ V PROKARYOTICKÝCH GENOMECH B. Krátké roztroušené repetitivní sekvence (kratší než 50 bp)  REP (repetitivní extragenové palindromatické sekvence) 38 bp, 500 REP u E. coli  PU (palindromic units) u E. coli a S. typhimurium.  Mnohokopiový 26-mer (Ngrep) u Neisseria gonorrhoeae a N. meningitidis  Mnohokopiový 24-mer DR element u Mycobacterium bovis (38 kopií) TYPY REPETICÍ V PROKARYOTICKÝCH GENOMECH C. Dlouhé roztroušené repetitivní elementy (delší než 50 bp)  intergenic repeat unit (IRU)  enterococcal repetitive intergenic consensus (ERIC) 126 bp nebo zkrácené formy. Chromozomová lokalizace se liší u kmenů a druhů  ERIC-like sekvence 127 bp – enterobakterie, celá bakteriální říše.  RLEP (545 - 1063 bp) u Mycoplasma leprae 28 (0,6% genomu)  Mx-rep u Myxococcus xanthus - 87 pb jádrová sekvence  Dr-rep (SARK) u Deinocccus radiodurans Element o variabilní délce (150-192 bp)  RepMP2, RepMP1, SDC1 (150 bp – 1 kb) u Mycplasma pneumoniae, v genomu 8-10 kopií.  RepMP2-like u Staphylococcus TYPY REPETICÍ V PROKARYOTICKÝCH GENOMECH D. Mosaikové repetitivní elementy  Bacterial Interspersed Mosaic Elements (BIME) – (kombinace REP a sedmi dalších repetitivních motivů). 500 u E. coli a dalších G- enterobakterií (Klebsiella pneumoniae, S. typhimurium)  REP MP 1 300 bp element ohraničený kratšími repetitivními sekvencemi u M. pneumoniae.  BOX elementy – rozptýlené repetitivní elementy u G+ (Streptococcus pneumoniae). „Genomic signature“ - charakteristika frekvence jednotlivých typů oligonukleotidů v genomech. Genomic signature je u fylogeneticky příbuzných genomů podobná. Signature genomics – vyhledávání mutací zodpovědných za choroby ZÁVĚRY ZE SROVNÁNÍ SEKVENOVANÝCH GENOMŮ  Počet informačních genů je v každém genomu zhruba stejný, i když se jejich velikosti liší až 5x.  Počet genů ostatních funkčních kategorií je mnohem variabilnější a má tendenci se zvyšovat  Se zvětšováním velikosti genomu přibývá paralogních genů a zvětšuje se též biochemická komplexita organismu.  Jedna čtvrtina ORF u každého druhu je jedinečná a nemá významnou sekvenční homologii k žádné známé nukleotidové nebo proteinové sekvenci. HORIZONTÁLNÍ PŘENOS GENŮ  Často přenášené: operační geny (metabolismus a regulace, buněčné struktury)  Zřídka přenášené: informační geny (transkripce, translace)  Horizontálně jsou přenášeny variabilní genetické elementy (a geny na nich lokalizované) ◼ profágy, ◼ plazmidy, ◼ IS-elementy, ◼ transpozony, ◼ Integrony ◼ Genomické ostrovy POČET HORIZONTÁLNĚ PŘENESENÝCH GENŮ U VYBRANÝCH DRUHŮ BAKTERIÍ A ARCHEIÍ Druh Velikost genomu (Mbp) Počet ORF Horizontálně přenesené ORF Proteobacteria počet % Escherichia coli 4,64 4289 381 9,6 Haemophilus influenzae 1,83 96 96 6,2 Helicobacter pylori 1,67 1553 89 6,4 Rickettsia prowazekii 1,11 834 28 3,6 Gram-pozitivní bakterie Bacillus subtilis 4,21 4100 537 14,5 Mycoplasma genitalium 0,58 480 67 14,5 Mycoplasma pneumoniae 0,82 677 39 5,9 Mycobacterium tuberculosis 4,41 3918 187 5,0 Spirochaete Borrelia burgdorferi 0,91 850 12 1,56 Treponema pallidum 1,14 1031 77 8,3 Chlamydiae Chlamydia trachomatis 1,04 894 36 4,3 Deinococcus radiodurans 2,65 2580 95 3,92 Synechocystis sp. 3,57 3169 219 7,5 Thermotoga maritima 1,86 1846 198 11,63 Archaea Aeropyrium pernix 1,67 2694 370 14,0 Methanobacterium therm. 1,75 1869 179 10,3 Methanococcus jannaschii 1,66 1715 77 5,0 Pyrococcus abyssi 1,76 1765 124 7,35 Bakterie s umělým genomem Tým čtyřiadvaceti genetiků v čele s Craigen Venterem syntetizoval v laboratořích The J. Craig Venter Institute dědičnou informaci jednoduché bakterie Mycoplasma mycoides složenou z více než milionu písmen (1 Mbp) genetického kódu. Tak dlouhou molekulu nelze vyrobit najednou. Vědci nejprve syntetizovali její kratší části a ty pak skládali do větších celků. Nakonec byly součásti genomu tak velké, že si s nimi už laboratorní technika neporadila. Finální kompletaci bakteriální DNA proto genetici svěřili buňkám kvasinek. V těch pak získali úplný genom bakterie, který přenesli do příbuzné bakterie Mycoplasma capricolum. Gibson DG, et al.: Creation of a bacterial cell controlled by a chemically synthesized genome. Science. 2010 Jul 2;329(5987):52-6. FYZIKÁLNÍ ORGANIZACE BAKTERIÁLNÍHO CHROMOZOMU  dsDNA - není obalená jadernou membránou  vazba malých proteinů typu HU (histon-like) - 105 molekul, vázajících se sekvenčně nespecificky, ovlivňujících flexibilitu DNA (ohýbání DNA do smyček) („architektura“ nukleoidu). Účast při replikaci, transkripci a rekombinaci  Proteiny HN-S vázající se na AT-bohaté oblasti DNA, zvyšuje její teplotní stabilitu a brání transkripci. Možná mají podobnou funkci jako histony.  Protein Fis – ovlivňuje topologii a superhelicitu DNA  Vazba proteinu IHF (integration host factor), vázající se sekvenčně specificky na DNA, zejména na regulační oblasti  50 superhelikálních smyček u E. coli, bez účasti RNA  kontrola stavu superhelicity: topoizomeráza, gyráza – změny vinutí při replikaci, přichycení na membránu Archea: mají rudimentární histony příbuzné histonům eukaryot STRUKTURA CHROMOZOMU E. coli  4,6 Mb, 50% GC, 1 μm Bakteriální nukleoid …molekulární mechanismy udržující nukleotid v buňce jsou neznámé, ale jistě existují specifické systémy, které zajišťují jeho replikaci, transkripci, rekombinaci a další funkce… Organizace chromozomu u E. coli. Esteban Toro, and Lucy Shapiro Cold Spring Harb Perspect Biol 2010;2:a000349 (A) The Caulobacter chromosome is linearly organized, and anchored to the flagellated pole viaparS/ParB/PopZ. (B) In Vibrio cholerae, the origin region of the larger chromosome (chromosome I) is localized to the cell pole, whereas the origin of the smaller chromosome is localized to the cell center. The organization of the bulk of the chromosomes, as well as their separation or intermingling, are currently unknown. (C) Four loci have been localized in vegetative cells of Bacillus subtilis, and their organization is reminiscent of the linear order seen in Caulobacter. Although the origin region is localized near to one pole, it appears not to be anchored to the cell membrane. (D) Sporulating cells of B. subtilis, however, do anchor the origin region, through RacA/DivIVA, to the negatively curved membrane at the pole. RacA also binds all along the chromosome, compacting it into a long “axial filament” before sporulation. (E) The E. coli origin localizes to mid-cell, and the two replichores are separated into opposite cell halves. The terminus is broadly localized (arrows), and may be found on either side of the cell center Organizace chromozomu u modelových bakterií