MOLEKULÁRNÍ BIOLOGIE PROKARYOT podzim 2018 CRISPR-Cas systémy prokaryot Ivana Mašlaňová iva.maslanova@gmail.com 1 2 CRISPR-Cas – systémy adaptivní odpovědi CRISPR = clustered regularly interspaced short palindromic repeats - Objev krátkých uspořádaných repeticí přerušovaných nerepetitivními krátkými sekvencemi (mezerníky) v r. 1987 u E. coli – Yoshizumi Ishino a kol. v Osace - Genetická struktura těchto lokusů včetně genů Cas popsána v r. 2002 – Jansen a kol. - V r. 2005 popsána podobnost mezi sekvencemi mezerníků v CRISPR-ech a sekvencemi mobilních genetických elementů (fágy a plazmidy) - Představa o funkci CRISPR-ů prokázána experimentálně v r. 2007, kdy buňky Streptococcus thermophilus získaly rezistenci vůči bakteriofágům po začlenění části fágového genomu do genomu těchto bakterií - Dnes popsány u 90% genomů archeí a 40% eubakteriálních genomů VYUŽITÍ PŘI EDITACÍCH GENOMŮ Celkový počet genomů Obsahující CRISPR Procentuální zastoupení Archaea 232 202 87% Bakterie 6782 3059 45% Celkově 7014 3261 47% 3 CRISPR a editace genomů – časová osa nejvýznamnějších objevů 4 CRISPR-Cas systém A. Adaptace B. Exprese C. Interference A. B. C. 5 Struktura CRISPR-Cas systému Struktura CRISPR lokusu Části CRISPR-Cas systému: 1. CRISPR lokus – velmi variabilní, tvořen mezerníky (spacer) a repetitivními oblastmi, ohraničen přímými repeticemi - repetice mají průměrnou délku 28 – 37 bp, počet variabilní, tvoří vlásenkovou strukturu - mezerníky (spacery) – odpovídají sekvencím MGE (fágy, plazmidy), délka 26 – 72 bp (až stovky bp, variabilní) - v CRISPR lokusu cca 50 mezerníků (neplatí ale vždy, např. 588 repetic v případě genomu Haliangium ochraceum) - počet CRISPR lokusů v genomech – variabilní (nejčastěji dva-tři CRISPR lokusy, ale např. rod Methanocaldococcus až 19 CRISPR lokusů v genomu. 2. Cas endonukleázy – geny cas asociované s CRISPR lokusem, lokalizace v těsné blízkosti, různé funkce v procesu adaptivní imunity, celkem cca 45 proteinových rodin – hlavní ukazatel pro klasifikaci CRISPR-Cas systémů 6 Fungování systému CRISPR-Cas a jeho struktura Mechanizmus CRISPR-Cas systému se skládá ze tří fází. V první fázi – adaptaci, dochází k získání mezerníkové sekvence a začlenění do CRISPR lokusu (fialový čtverec) mezi repetice (R). V další fázi dochází k expresi cas genů a transkripci CRISPR lokusu, vzniká pre-crRNA. Ta je následně zpracována na crRNA. V poslední fázi dochází k navedení efektorového komplexu/proteinu pomocí crRNA na cílové místo v genomu. Následuje sestřih a degradace cizí nukleové kyseliny.7 Fáze adaptace – začlenění mezerníku - Vystřižení sekvence prekurzoru mezerníku z cizí molekuly DNA - integrace do CRISPR lokusu jako mezerník - zajištěna imunitní odpověď při opakované infekci - Účastnící se komponenty: proteiny Cas1 a Cas2, vedoucí sekvence a první CRISPR repetice - Cas1 a Cas2 – 1 operon – strukturní komplex tvořen Cas2 dimerem, vázajícím dva Cas1 dimery – komplex s endonukleázovou aktivitou - Komplex Cas1 a Cas2 vkládá mezerníky mezi vedoucí sekvenci ( dlouhý úsek bohatý na A-T, lokalizovaný po směru transkripce vedle repetic s mezerníky) a první repetici - Vedoucí oblast obsahuje – promotor pro transkripci crRNA a rozpoznávací sekvenci - Vkládání mezerníků vždy na 3ꞌ konec vedoucí sekvence - naposledy získaný mezerník vždy nejblíže k vedoucí sekvenci - Prekurzory mezerníků – obsahují 2 – 5 nukleotidové motivy přiléhající k vlastní sekvenci mezerníku – tzv. PAM sekvence – nutná během fáze interference - navázání efektorového systému na mezerníkový prekurzor - RecBCD (exonukleázová aktivita, RM systém, rozpoznávání Chí míst - 8 bp) degraduje lineární dsDNA a tvoří ssDNA fragmenty – substrát pro zisk nových mezerníků - Kompletní spojení řetězců – DNA polymeráza a ligáza 8 9 Cas1 a Cas2 komplex – začlenění mezerníku Fáze exprese Fáze exprese zahrnuje: jak regulaci cas genů, tvorbu efektorového Cas komplexu, transkripci CRISPR lokusu a vznik crRNA - přepisem CRISPR lokusu vzniká dlouhá prekurzorová CRISPR RNA (pre-crRNA), u které dochází ke štěpení v oblasti repetitivních sekvencí - molekula crRNA - jedna mezerníková sekvence obklopená částmi repetic - Zpracování pre-crRNA se liší mezi třídami CRISPR-Cas systémů Třída I. – endonukleázová aktivita Cas6 (typ II a III) Třída II. - proces zahrnuje také expresi malé trans-aktivující CRISPR RNA (tracrRNA). Ta se páruje s repeticemi pre-crRNA transkriptu a duplex je štěpen v repetitivních oblastech hostitelskou RNázou III Type II-A CRISPR-Cas systém 10 Fáze interference – degradace cílové nukleové kyseliny za využití crRNA jako naváděcí molekuly a Cas proteinů Type II-A CRISPR-Cas systém Interference: - Interakce molekuly crRNA s komplementárními úseky nukleových kyselin na invazivních MGE - Efektorové nukleázy Cas cizorodý genetický materiál degradují - CRISPR-Cas I. třídy - multiproteinový komplex Cascade (tvořený Cas proteiny) navázán na dsDNA a štěpení zprostředkovává efektorová nukleáza Cas3, která není součástí komplexu - CRISPR-Cas II. třídy - duplex dvou RNA (crRNA a tracrRNA) doplněn jedinou efektorovou nukleázou Cas9, která identifikuje i degraduje cizorodý genetický element. 11 12 Fáze exprese a interference crRNA – typ IIA – RNaseIII štěpí dsRNA, tvořenou trans-crRNA crRNA – typ I a typ III crRNA – typ IIB – TSS – transcription start site v repetitivních sekvencích 13 Interference CRISPR-Cas sytémů - Rozdíly v závislosti na typy CRISPR-Cas - dsDNA (černě), cílová RNA (šedě), crRNA repetice (modře), spacer (zeleně), tracrRNA (červeně) 2. Prekurzor mezerníku (protospacer) (psn) z fága nebo plazmidu vyznačující se stejnou sekvencí jakou má některý z mezerníků (spacerů) (sn) v CRISPR. V sousedství prekurzoru mezerníku (protospaceru) se nachází sekvence PAM (protospacer-adjacent motif), která identifikuje protospacer jako sekvenci, která má být CRISPRem přijata. B. Fáze adaptace – vyčlenění sekvence prekurzoru mezerníku (protospaceru) – začlenění nového mezerníku do CRISPR lokusu Jeden nebo více Cas proteinů rozpozná sekvenci PAM na vstupující fágové DNA a začlení přilehlou sekvenci psn jako nový mezerník sn do CRISPRové oblasti, na její konec nejblíže vedoucí sekvence. Všechny ostatní CRISPRy se posunou doprava, přičemž ten poslední vpravo je odstraněn. Fungování systému CRISPR-Cas - shrnutí 14 Imunitní fáze: Zacílení vstupující protospacerové sekvence prekurzoru mezerníku na fágové DNA. Sestava mezerníků včetně repetitivních oblastí (CRISPR lokus) je přepsána do jedné dlouhé molekuly RNA (precrRNA), která je štěpena v repetitivních sekvencích za vzniku molekul crRNA, z nichž každá obsahuje sekvenci jednoho mezerníku. Když buňku infikuje stejný typ fága, dojde k párování crRNA obsahujcící sekvencí sn s identickou sekvencí prekurzoru mezerníku (protospaceru) psn ve vstupující fágové DNA a jeden nebo více Cas proteinů v ní štěpí protospacery, čímž fága inaktivují. Šíření CRISPR – transformace, transdukce 15 Fungování systému CRISPR-Cas - shrnutí 16 Klasifikace CRISPR-Cas systémů CRISPR-Cas systémy: I. a II. třídy – na základě struktury efektorového komplexu A. I. Třída – zahrnuje multiproteinový efektorový komplex tvořený několika cas geny a je tvořena subtypy I, III a IV B. II. Třída – efektorový komplex tvoří pouze jeden protein, tvořen sybtypy II, V a VI A: B: 17 18 Fylogenetická analýza Cas1 19 RAMP module - RAMP—repeat-associated mysterious proteins—skupina proteinů obsahující RNA rozpoznávací motiv (RRM doména) - genový komplex asociovaný s CRISPR-Cas systémem, není fylogeneticky příbuzný s Cas1 a Cas2 Organizace efektorového komplexu různých typů CRISPR-Cas systémů 20 a) Mutace ve fágových protospacerech nebo v sekvencích PAM navozují rezistenci k interferenci, neboť není splněn požadavek na komplementaritu mezi crRNA a cílovou DNA. b) systém u lyzogenů Pseudomonas aeruginosa. Fágem kódovaný anti-CRISPR protein ( ) blokuje interferenci zabráněním vytvoření nebo působením komplexů CRISPR-Cas. ? Tento protein může být zabalen do kapsidy a pak koinjikován při následné infekci, nebo může být vytvářen bezprostředně po injekci fágové DNA do buňky. c) Systém CRISPR-Cas u fágů Vibrio cholerae. Po vstupu fágové DNA do buňky jsou exprimovány virové crRNA a cílí na dosud necharakterizovaný antifágový systém V. cholerae. Tento systém je lokalizován v lokusu podobajícímu se fágem indukovatelnému chromozomovému ostrovu (PICI), označovanému jako PICI-like element (PLE). Spacery ve fágovém CRISPR lokusu jsou komplementární k sekvenci PLE, a působení mechanismu CRISPR je schopno specificky zacílit na tento genetický element a inaktivovat ho. Strategie fágů k překonání systémů CRISPR-Cas 21 Evoluce CRISPR-Cas systémů Endonukleáza Cas1 – ne vždy součástí CRISPR lokusu, některé geny podobné transpozonům s terminálně obrácenými repeticemi – caspozony, Cas1 – casponáza – součástí DNA polymeráza B – replikativní transpozony 22 Evoluce CRISPR-Cas systémů 23 Genetic engineering of a temperate phage-based delivery system for CRISPR/Cas9 antimicrobials against Staphylococcus aureus 24