Au' Anvils ^cKicHoüv^ ! ttfefiffitrfZQií i Využití rekombinantní DNA při studiu mikroorganismů doc. RNDr. Milan Bartoš, Ph.D. bartosm@vfu.cz Přírodovědecká fakulta MU, 2012 Obsah přednášky Celogenomové metody sekvenování Sekvenování H. influenzae Sekvenování S. cerevisiae Contigy, jejich zpracování Využití repetitivních sekvencí Studium genové exprese a funkce genů Analýza transkriptů Analýza regulačních míst Techniky mutageneze in vitro 10)Příklad analýzy bakteriálního genu Doporučená literatura Brown (2010): Gene Cloning & DNA Analysis. Wiley-Blackwell, Sixth edition GENE CLONING & DNA ANALYSIS sixth coition ^^^^ T.A.BROWN K procvičování nachystat tabulku genetického kódu Metody sekvenování Základní metody jsme probírali nedávno, tak si je pouze zopakujte Celogenomové sekvenování Využívají automatických systémů, ručně už by to nikdo nedělal Ručního sekvenování se využívá ve výzkumných laboratořích k ověřování identity klonů nebo k analýze konstruktů, sekvenují se relativně malé počty vzorků Dva přístupy k celogenomovému sekvenování Metoda tzv. „shotgun" > Genom je štěpen na nahodilé krátké fragmenty > Fragmenty jsou sekvenovány > Na fragmentech jsou identifikovány překryvy Metoda využívající „contigy" > Nejprve jsou připraveny série překrývajících se klonů = contiq > Pořadí contigů je známo > Jednotlivé contigy jsou sekvenovány Shotgun Klíčovým požadavkem jsou p ŕe kry v y mezi všemi jednotlivě získanými sekvencemi > Identifikace jednotlivých překryvů musí být přesná a bezrozporná > Každá chyba může zničit celý náročný proces > Riziko chyby roste s velikostí genomu i Metoda je vhodná na malé bakteriální genomy Metodou shotgun byl osekvenován genom Haemophilus influenzae Co je to za bakterii ten Haemophilus influenzae? Čeleď Barvení Tvar Kyslík Patogenita Pasteurellaceae Gramnegativní Tyčinka Aerobní, fakultativně anaerobní Oportunní patogen Sekvenování genomu H. influenzae První sekvenovaný buněčný genom, 1995 > Craig Venter, TIGR > Velikost kružnicového genomu je 1 830 140 bp > 1 740 strukturních genů > 58 genů pro tRNA > 18 dalších genů pro RNA Postup sekvenování H. influenzae genomová DNA sonikace ^ fragmenty DNA r r zpracovaní výsledků sekvenování knihovna klonů tfragmenty 1,6-2,0 kbp elektroforéza r Sekvenování genomu H. influenzae Proč sonikace a ne restriktázy? > Po restriktázách by mohly zůstat mezery Kontrola přítomnosti mezer Příprava oligonukleotidových sond Contig I Y 1 Contig II r Contig III r t—d t—= 1 2 5 6 Contig I Contig test sonda 2 genové knihovny sonda 5 sonda 2 a 5 < pokrývají stejný fragment Sekvenování genomu H. influenzae Proč sonikace a ne restriktázy? > Po restriktázách by mohly zůstat mezery Další údaje > 19 687 klonů > 28 643 záznamů o sekvenování > 4 339 záznamů kratších 400 bp - byly odstraněny > analýza zbylých 24 304 záznamů trvala počítači 30 hodin > získáno bylo 140 specifických contigů Metoda shotgun není vhodná pro sekvenování repetitivních sekvencí. Ty se ale u bakterií příliš často nevyskytují Contigy Tvorba série překrývajících se klonů DNA fragmentů > Je pracnější, trvá déle a stojí víc peněz Metoda vhodná i pro dlouhé sekvence s repeticemi Sekvenování chromozómu III S. cerevisiae První eukaryotický chromozóm, 1992 Contigy 29 klonů fragmentů o průměrné délce 10,8 kbp v kosmidech Jak na contigy? 1) Procházení chromozómu (chromosome walking 2) Fingerprinting klonů (clone fingerprinting) 3) PCR repetitive DNA 4) Analýza výskytu míst označené sekvence (sequence tagged site, STS) Procházení chromozómu 1) Z genomové knihovny je vybrán jeden klon 2) Klon je naznačen a použit jako hybridizační sonda dalších klonů v knihovně 3) Klony, které poskytují signál se překrývají s použitou sondou 4) Nové klony jsou naznačeny a použity k dalšímu kolu hybridizace ... Příklad procházení chromozómu Testování knihovny klonem A1 Testování knihovny klonem 14 ABCDEFGHIJ A1 F2 Fingerprinting klonů 1) Nezačíná se z jednoho místa 2) Vyhledávají se dvojice překrývajících klonů Sestavte kontig klonů z následujících překryvů ^H-, HÍHtH H2 PCR repetitivní DNA PCR z roztroušených repetitivních elementu (interspersed repeat element PCR, IRE-PCR) dvě identické repetice ■ r pripojení primem DNA PCR amplikon překrývající oblasti mezi sousedícími repeticemi PCR repetitivní DNA - vyhodnocení klony č. 2 a 3 se pravděpodobně překrývají Mapování génom u mykobakterií s využitím inzertních sekvencí Inzerční sekvence jsou transponovatelné Zopakujme si - IS901 RFLP profily pro studium epizootologie MAA kbp N A B C D E F G \ J K L M 0 P Q] 10.0-► ►— 8.0-► 7.0-► ►— 6.0-► — ► 5.0 -► — — — — — — — —► ► — —--— — — 4.0-► 3.0-► ► — > ► > &E*E §E*= iá 2.0-► _ _ _ _ _ _ _ ► ►— ►— — > ► ► — — — ► ► ► ►— — ► ► ► —► ► — = = = = = = Jaké otázky jsme si položili Do jakých míst se začleňuje \S901? > Identifikovali jsme celkem 16 lokusů Kde jsou fragmenty těchto lokusů umístěny na RFLP mapě po štěpení Pvi/ll? > Mapovali jsme u 25 různých izolátů MAA lokusů Souvisí nějak inzerce \S901 s fyziologickými vlastnostmi příslušných kmenů MAA? > Inzerce \S901 do genu katE - kataláza > Rezistence k izonikotinhydrazidu Jak jsme mapovali pozice IS901 ? > Metoda tzv. inverzní PCR > Metoda tzv. anchor PCR - velmi podobná PCR repetitivní DNA Průběh inverzní PCR pro IS901 \S901 \S901 \S901 | reštrikční štěpení 1 ligace Průběh inverzní PCR pro IS901 IS901 X ligace sekvenování PCR produktů Anchor PCR Anchor primer \S901 PCR Nahodilý primer sekvenování Výsledná fyzikální mapa pozic IS901 kbp N A B C D E F G H I JKLMOPQRSTUVWXY 0a cd cd cd cd □ □ □ cd 0044 b.u — cd 7.0 - 1 b b b 6.0 — CD Rv2750 b = e 1=1 :=) b b b b b s b s 50 — b b C=3— b b b b b b CD Rv3891c = b s =3 ee3 b b b CZ) b b b b b b b b 4.0 - _------- __-- 3.0 - °~- 2.0 - <=> 1.0 - B B C3 R»3167 — — £=3 CD Rv0774c [=1 bi B) 15 =1 [=1 s m Hl H Hl OB Hl H! Hl Hl H H) H (H Hl |oc14 B B S B b3 B B B B B B B B B B B B B B B B CD kalE dnaJ FR300 bbbbbbb sssstBBBBBBBBBB — — — — — — — npt63 a □ □ cd □ □ cd _cd cd cd cd cd cd_cd_cd cd cd_cd_ 09 08 08 08 08 Analýza výskytu míst označené sekvence sequence tagged site, STS > vyhledávání párů klonů, které obsahují sekvenci DNA, která se v daném genomu vyskytuje jen 1x > takové klony se zákonitě musí překrývat > často jde o gen, jehož sekvence už je známa > lze navrhnout specifické primery a získat specifickou sondu > sondou „vyšetříme" genomovou knihovnu Jak to vypadá při STS? klony F2 a C3 se musí překrývat Studium genové exprese a funkce genů Pro lepší pochopení si zopakujte fáze genové exprese ze základní přednášky z molekulární biologie Genová exprese Gen jednoduchý - prokaryota kódující sekvence transkripce ^ mRNA Gen složený - eukaryota intron AílU transkripce I T primární transkript hnRNA sestřih ^ mRNA Vedle transkriptů strukturních strukturních genů existují také transkripty > Genů pro rRNA > Genů pro tRNA > Genů regulačních Detekce transkriptů - Northern blotting Umožňuje stanovit přítomnost a délku transkriptů denaturační elektroforéza M 1 2 3 71 rRNA M 1 2 3 hybridizační signál Dejte si pozor na to, aby gel byl opravdu denaturující, jinak se transkripty pohybují v nativním a jinak v denaturovanom stavu A když už máme konkrétní transkrípt? > Převést zpětnou transkripcí do cDNA > Sekvenovat 1) Zopakujte si metody zpětné transkripce 2) Kterou z metod nemůžeme použít a proč? Nelze použít nahodilé hexanukleotidy, protože sekvence transkriptu by nebyla celá Hybridizace mezi genem a RNA Stanovení exonů a intronů Degradace alkáliemi Mapování S1 nukleázou Určení počátku a konce transkriptů fragment Sau3A, 400bp gen klonování do M13 a příprava ssDNA Sau3A SauGA Mapovaní S1 nukleázou připojení mRNA S1 nukleáza hydroxid / počátek transkripce, 150 bp od začátku translace stanovení velikosti elektroforézou 150 bp DNA Mapování S1 nukleázou Stejnou strategii lze použít k > Mapování 5-konců > Mapování 3-konců > Mapování rozhraní intron-exon Prodloužení primem Slouží jen k mapování 5-konců transkriptů > Musíme znát alespoň část sekvence transkriptů 5' i- 1 RNA transkript ^ připojení primem 3' extenze zpětnou transkriptázou 3' i 5 denaturace, stanovení délky cDNA 239 Prodloužení primem Porovnání délky výsledné cDNA s kódující částí DNA získáme informace o poloze transkriptu > 3'konec nově syntetizované cDNA odpovídá 5-konci transkriptu 5' 3' DNA cDNA počátek transkripce 239 pozice 5-konce primeru Metoda RT-PCR > Standardní procedura RT-PCR kopíruje vnitřní oblast molekuly RNA > Neposkytuje informace o koncích molekuly RNA Metoda RT-PCR > Standardní procedura RT-PCR kopíruje vnitřní oblast molekuly RNA > Neposkytuje informace o koncích molekuly RNA 5' reverse primer 3' Metoda RT-PCR > Standardní procedura RT-PCR kopíruje vnitřní oblast molekuly RNA > Neposkytuje informace o koncích molekuly RNA hexanukleotidy RACE rapid amplification of cDNA ends > umožňuje identifikovat 3'- i 5'- konce RNA molekul > má mnoho variant 5' 5-RACE 3' - RNA ^ připojení primem 3' ,extenze zpětnou transkriptázou 3' 5 denaturace ttttt přidání A ke 3-konci ^—^— terminálni transferázou 3' 5' připojení primem s TTTTT Pokračuje standardní PCR syntéza druhého řetězce Taq polymerázou RACE rapid amplification of cDNA ends > umožňuje identifikovat 3'- i 5'- konce RNA molekul > má mnoho variant Sekvenováním produktu PCR získáme znalost přesného počátku transkripce Studium regulace genové exprese Obecné schéma regulačních míst kontrolní sekvence promotor kontrolní sekvence gen Na regulační místa se váží regulační proteiny Hledání vazebných míst pro proteiny > Gelová retardace komplexů DNA-protein > Footprinting pomocí DNázy I > Test modifikované interference > Deleční analýza Gelová retardace komplexů DNA- protein Protein vázaný na DNA fragment snižuje pohyblivost fragmentu na gelové elektroforéze 1 - pouze DNA fragment 2 - DNA fragment s navázaným proteinem Provedení gelové retardace i—n- R R R t t t H i štěpení restriktázou R I 1 1 H I smíchání s regulačním proteinem stanovení elektroforetické pohyblivosti ... nasleduje > Příslušný fragment DNA je lokalizován na reštrikční mapě > Je stanovena nukleotidová sekvence Protože jsou vazebná místa většinou krátká (kolem 10 bp), není tento způsob mapování dost přesný Footprinting pomocí DNázy I > Umožňuje stanovit umístění řídící oblasti v rámci restrikčního fragmentu identifikovaného gelovou retardací > Využívá skutečnosti, že je sekvence DNA vázající se k proteinu chráněna před účinkem DNázy I Provedení footprintingu I fragmenty DNA koncové značení + regulační protein štěpí se kterákoli vazba, která není chráněna proteinem Provedení footprintingu II Odstranění proteinu, gelová elektroforéza (PAGE) a detekce značených fragmentů délky fragmentů 1 2 místo, kam se váže protein 1 = kontrola, žádný navázaný protein 2 = testovaná DNA + navázaný protein T footprint Test modifikované interference Vazebný protein chrání větší úsek DNA než jenom přesně ty nukleotidy, které jsou regulační oblastí Test modifikované interference i koncově značené reštrikční fragmenty ■_0 H-• modifikace jednoho z mf _I_mm m m m O 1 I nukleotidu I smíchání s regulačním proteinem i—o na modifikovaný nukleotid se neváže Test modifikované interference II Následuje dělení fragmentů na gelové elektroforéze 1 2 purifikace DNA 7 zpomalené -> _| _ komplexy — — protein-DNA DNA bez . proteinu / P'Pendin (rychlejší) _ Určení velikosti na PAGE A tím zjistím, kde přesně v regulační oblasti leží jeden z nukleotidů A to všechno zopakuješ pro každý ze 4 nukleotidů zvlášť a výsledné regulační místo poskládáš ii Jak vypadá regulační místo tryptofanového qperonu Klebsiella aerogenes jestliže jste na PAGE získali fragmenty o následujících velikostech ? Blokace A = 105,106,111,113,116 a 117 bp Blokace G = 107,115 a 118 bp Blokace C = 110 a 112 bp Blokace T = 108,109 a 114 bp AAGTTCACATGAAG Deleční analýza > Umožňuje lokalizovat kontrolní elementy proti směru transkripce genu > Dokáže určit i funkci příslušné sekvence zesilovač uspavač promotor en delece zesilovače F-=1 f==l gen t-J s- snížena exprese Deleční analýza > Umožňuje lokalizovat kontrolní elementy proti směru transkripce genu > Dokáže určit i funkci příslušné sekvence zesilovač uspavač promotor en delece uspavače gen ^-] L zvýšena exprese Reportérové geny Jejich produkty poskytují zřetelný, snadno monitorovatelný signál zesilovač uspavač promotor zesilovač uspavač promotor Příklady reportérových genů lacZ = p-ga laktóz i dáza cat = chloramfenikolacetyltransferáza uidA = p - glukuronidáza GFP = zeleně fluoreskující protein lux= luciferáza Studium produktů translace Provádí se v bezbuněčných extraktech - platí pro analýzu rostlinných a živočišných genů Zopakujte si přednášky z genetiky bakterií Sekvenci genu můžeme změnit in vitro A pak se můžeme zamyslet nad jeho funkcí Existuje celá řada metod mutageneze in vitro > Odstranění restrikčního fragmentu > Odstranění několika nukleotidů Bal31 > Vložení oligonukleotidu > Zavedení bodové mutace do klonovaného genu > ... Smysl cílené mutageneze Změna ve struktuře proteinu > zavedení nových disulfidových můstků > zvýšení počtu vodíkových vazeb > změna terciární struktury > změna stability enzymu > změna dalších vlastností - zvýšení katalytické aktivity a afinity k substrátu - modifikace substrátové specificity - rozšíření pH-optima - zvýšení odolnosti proti oxidačním činidlům a těžkým kovům - zvýšení rezistence vůči proteázám - stabilita v nevodném prostředí Průběh cílené mutageneze 1) Vložení genu do jednořetězcového vektoru, např. M13 2) Vlastní cílená mutageneze 3) Vrácení genu do expresního vektoru Schéma cílené mutageneze téměř komplementární syntetický oligonukleotid ssDNA genu daného enzymu fágový vektor M13 buňky obsahující zmutovanou DNA hybridizace a komplementární doplnění celé molekuly DNA-polymeráza DNA-ligáza transformace do buněk E. coli buňky obsahující původní DNA Schéma cílené mutageneze téměř komplementární syntetický oligonukleotid ssDNA genu daného enzymu fágový vektor M13 buňky obsahující zmutovanou DNA hybridizace a komplementární doplnění celé molekuly DNA-polymeráza DNA-ligáza transformace do buněk E. coli buňky obsahující původní DNA Příklad analýzy bakteriálního genu Trp Operon Klebsiella aerogenes Blumenberg Miroslav a Yanofski Charles (1982): Regulatory Region of the Klebsiella aerogenes Tryptophan Operon, Journal of Bacteriology 152 (1), 49-56. 1) Reštrikční štěpení genomové DNA 2) Klonování fragmentu 3) Sekvenování regulační oblasti 4) Porovnání se Salmonella typhimurium 5) Odvození vlastností transkriptů 6) Konfirmace transkripcí in vitro Zopakujme si regulaci tryptofa nového operonu > Pozitivní regulace > Atenuace Získání fragmentů 1) Restriktázy Hindi II a BamH\ 2) Ligace do vektoru pBR322 3) Transformace E. coli trpE a vyhledání prototrofů 4) V pKA1 a pKA2 je celý trp A 5) Uvnitř trpA je BamH\ místo Analýza fragmentů 1) Sekvenování dle Maxam a Gilbert 2) Porovnání sekvence s S. typhimurium 3) Identifikace promotoru, operátoru a vedoucí sekvence s atenuátorem K.AEROGENES -40 -30 o TCT6CAAACAA6GST T6ACTT TATTCCATTSAACT A T • T A C 5.TYPHIMURIUM A6TmCTAGTAC( AC6C A 10 to MCT ALA MET HIS PNE lit TUP LEU HIS SER TRP TRP AR6 TUR SER END 60 AASTTCACATGAAS 64CTATCACS ATS AAA ATS CAC TTT ATC ACT CTS CAC A6C TSS T6S CSC ACC TCC T6A CGACGGGC6 A lír AA T6 6CA SC6 ACA T T S A T A ST T TA6 MET ALA ALA THR PHE ALA PHE 6LY 90 100 110 ICO 130 140 H 6C6T6ATCGCSTTTTSCATTCASCATACASATACCC6GCCCSCC AAT6AGCG6SCTTTTTATT T ATSAA A6C STA CASC A ■ T6T A T TRPC ISO 160 170 MET SLN THR SER LYS PRO 6CACAAAAATAATACSAACASSCSA6AACAATA ATS CAA ACA TCC AAA CCS ■ HMMBi u cc Transkripce in vitro 1) Produkty transkripce analyzovány chromatograficky (iontoměničová celulóza) 2) Porovnání transkriptů značených jednotlivými dNTP po štěpení RNázou T1 (štěpí ssRNA v GTP) B 9 12 14 10 15 16 17. 20 Dva oligonukleotidy na 3 -konci Sekvenování vedoucí sekvence LEADER PEPTIDE SEQUENCES K.A. I.C. s.o. S.T. C.ř. s.n. LEADER SEQUENCES NET LTS MET HIS PNI XLI TNR LEU MIS SÍR TRP TRP ARC TMR SER END NET LTS ALA XLE PNE VAL LEU LTS 6LT TRP TRP ARG TNR SER END NET LTS ALA ILE PNE VAL LEU ITS 6LT TRP TRP ARC TNR SER END NET ALA ALA TNR PNE ALA LEU HIS 6LT TRP TRP ARC TMR SER END NET LTS ALA TNR PNE VAL LEU HIS 6LT TRP TRP ARG TNR SER END NET ASN THR TTR ILE «R LEU HIS 6LT TRP TRP AR6 THR SER LEU LEU ALA VAL END AAGUUCAC 5UAAAA1 BOGUAUC »ACAAUGAAA AAGUUCAC SUAAAAA JGGUAUC 5 AC A AUG AAA AAGUUCACJAUGAAGI 5GGUAUC JAAAAUGGCA AUA6A AC-GUAUC :GA6AUGAAA kC^C6UGUC66AUGA6A6UUAACAAA8]A£A££L^CAAAU6AAC AA6UUCA