IPTG Induction f. coS mu é mlymsrase T TT gene 1 repressor tac I gene—i £. ců// genome T7 RNA polymerase r « IPTG Induction TT RNA ý polymerase 7~1 Tiffet geie . TT p'onioľŕr np»c í pET J js\- I gene Exprese a purifikace rekombinantnich proteinů Radka Dopitová Rekombinantní proteiny Rekombinantní DNA je arteficiální DNA sekvence, která vznikla novou kombinací různých DNA sekvencí. Rekombinantní proteiny jsou proteiny získané vnesením rekombinantní DNA do heterologního hostitele (např. mikroorganismus, kvasinky), ve kterém dojde k expresi genu. Využití rekombinantních proteinů Nadprodukce a purifikace rekombinantních proteinů jsou nezbytným předpokladem pro: • Biochemickou funkční charakteristiku proteinu (určení přesných kinetických parametrů Km, kcat pro enzymy se substrátem, K{ pro enzymy s inhibitorem, Kd pro protein - proteinové interakce či ligand -proteinové interakce) • Strukturní analýzu (NMR, krystalografie) • Proteinové inženýrství (zlepšení vlastnosti proteinů - aktivita, stabilita) • V průmyslovém měřítku jsou produkovány léky, vakcíny a potravinové doplňky. Cíl: Vysoký výtěžek homogenního proteinu (mg - kg proteinu) Zachování biologické aktivity Proč vyrábět rekombinantní proteiny? Přirozený zdroj: • Obtížně se získává (tkáně, orgány). • Obtížně se kultivuje (bakterie, viry, tkáňové kultury). • Limitovaná exprese • Často obtížná purifikace proteinu TABLE 1.2. Examples of tow-abundance proteins and peptides Isolated from natural biological sources Protein Source Yield (ug) Reference Multipotent íal colony- pokeweed mitogen-stimulatecl 1 Cutler et al. (1985) stimulating factor mouse spleen-cell-conditioned medium (10 liters) Human A33 antigen human colon cancer eel] tines (ID10 cells; 2.5 Catímel et a!. (1996) Platelet-derived growth human serum (200 liters) ISO Heidin et al. (1981) factor (PDGF) Granu] ocyte-colony- mouse lung-conditioned m Nicola et 31.(1983) stimulating growth medium i 5 titers) factor (G-CSF) Granu] ocyte-macrophage mouse lung-conditioned i: Burgess et al. (1986) colony-stimulating growth medium (3 liters) factor (GM-CSF) Coelenterate morphogen sea anemone (200 kg) 20 SchallerandBodenmuller (1951) Peptide YY(PYY) porcine intestine (4000 kg) 600 Tatemoto(1982) Turner n ecrosis factor (TNF) HL60 tissue culture medium (18 liters) 20 Wang and Creasy (1985) Murine transferrin receptor NS-1 myeloma cetls (10l° cells) :r. vanDrieletaL(1984) Fibroblast growth factor (FGF) bovine brain (4 kg) Gospoťtaitíwicz et al. (1984) Transforming growth human placenta (S.8 kg) 47 Froliketal.(1983) factor-p (TGF-ß) Human interferon human leukocyte-conditioned medium (10 liters) 21 Rubinstein et al. (1979) Muscarine acetylcholine porcine cerebrum (600 g) 6 Haga and Haga(1985) receptor ß,-adrenergic receptor rat liver (400 g) Graziano et al. (1985) Adapted, with permission, from Simpson and Nice (1989 j. Technologie rekombinantních proteinů Hostitelský organismus pro expresi rekombinantních proteinů • Bakterie • Kvasinky • Rostliny • Savčí buňky • Hmyzí buňky s bakulo viry • In vitro transkripce a translace Obsah přednášky 1. část: Exprese rekombinantních proteinů v E.coli Exprese proteinů fúzovaných s GFP v E. coli 2. část: Purifikace rekombinantních proteinů Purifikace proteinů fúzovaných s GFP pomocí hydrofóbní matrice Produkce heterologních proteinů v E. Coli VÝHODY: • Vysoká produkce rekombinantních proteinů • Dobře prostudovaný genom a proteom-usnadnění genových manipulací • Design řady vektorů usnadňuje klonování a expresi cizích genů • Rychlý růst v poměrně levném médiu • Přizpůsobivost systému Produkce heterologních proteinů v E. Coli NEVÝHODY: • Potřeba cDNA zkoumaného proteinu • Absence eukaryotických posttranslačních systémů (posttranslační modifikace) • Tvorba nerozpustných inkluzních tělísek • Omezená schopnost tvorby disulfidických vazeb • Chybí sekreční mechanismus pro účinné uvolňování proteinu do kultivačního média Expresní systém pro produkci rekombinantních proteinů v E.coli Podmínky kultivace Expresní vektor = klonovací vektor, který obsahuje nezbytné regulační sekvence k tomu, aby podporoval expresi inzertů cizích genů. pET-32a(+| sequence landmarks T7 promoter 764-780 T7 transcription start 763 Trx'Tag coding sequence 366-692 His'Tag coding sequence 327-344 S*Tag coding sequence 249-293 Multiple cloning sites (Ncol-Xhol) 158-217 His»Tag coding sequence 140-157 T7 terminator 26-72 fad coding sequence 1171-2250 pBR322 origin 3684 bla coding sequence 4445-5302 fl origin 5434-5889 The maps for pET-32b(+) and pET-32c(+) are the same as pET-32a(+) (shown) with the following exceptions: pET-32b(+) is a 5899bp plasmid: subtract lbp from each site beyond Bamft I at 198. pET 32c(+} is a 590 lbp plasmid; add lbp ta each site beyond BanM I at 198 except for EcoR V, which cuts at 209. 1 1(4576) Eam11Q5 1(4: BssH 11(1932] H pa 1(2027) BspLUľl ľ:3622> Sap 1(3506) Bst11D7 T(3393) Tth111 t(3367] BspG l(314&) PshA [(2366) Psp5 11(2628) lac operator Xba\ ľAArACĽACTCACTATALiCĽÍJAArTETGAÍCĽGATAACAATTCCCCTCTAGAAATAATrrrGTTTAACTTTAAGAASGAGA Trx'Tag _AfecJ_ His*Tag tAT AC ata ľ GA . ! ľ.-.--. '".'ľ CĽľ ľCTGGT tc TGGCCA ľ ATGCACC A CATC A. C A! C Aľ ľ CT TCTGGTCTGGT scc ACGCGG T TCI LC..A LiU ySo'-L :. r. • •- vl ^";- .i jjj^j r si sSc-Sc-'G yĽCL-.'ti !■■-sA-gC yZt-- thrombin 1 S'Tag JJspV S-tag primer #69945-3 1 enter ok in ase GO ' A.i GAA.AĽAA.AĽCĽC CC l.-ľ I AAA ' ĽCAACĽCĽAĽ ĽAĽA CCACACĽCĽAĽA Ľ CĽC1 ACCC AĽ CiAC Ľ ACCAC AAC Gl /MeiLysGl u t hrA I aA I aA i al_ ysPheG luArgGl n Hi s Plet AspSerPr oAs pLsuS lyTfo :- ľ-: ■■■ ■■■ pCT-32a(+) Eag\ Ava\ Nco\ FcoRV BasiM i EcdRl Sac i Sat\ Hind\l\ Nôt\ Xho\ his'Tag CCCA: LĽC CA A CCCA C CC í A ' C Ľ AĽ L" Ľ C Ľ CCACAACC CCCCCCCCAC C C ACCACCAC CAC CACCA.CC AC CACA GGCĽCCC'AA AlaMetAIaAsptiaGIySerGIuPheGIuLeuArgArgGIrAIoCyaGIyArgThrArgAIaProProProProProLaLArgSerGtyCysEntl GCCAiCGCCA! A: CGGA" CC GAAT T CGAGC \ CCGTCCAC AAGCTTGCGGCCGC AC T CGAGC ACC ACC ACC AC C ACCAC TGAGAT CC GGC TGC í AA p ET-'■:"!::-: AI ofíst AI al i eSat-AspProAsnSerSerSei-Val AspLysLeuAl aAIaAI aLeuGI uHisHisHlíHieHibHi sEnd GCCATGGGATArClGľGGAlCCGAATTCGAGCtCCGTCGACAAGCTTGCGGCCGCACTCGAGCACCACCACCACCACCAC TGAGATCCGGCTGCTAA pET-32c(+' A ^iŕctC y y-Lc-.. -o. i:ŕ ■ ii. ,.- ŕ ■ -1-^ m;'■ \- ■ ■ U--.. A ■ -i!1 ■ o: iiic--iiť >■ ľ' i--1!----!- p-Ľ ■.. . cA-CiU--..i.c-'. l-■-_ CA.AACC ĽC Ľ AAAG Ľ AAC C ' C AC 1 Ľ Ľ Ľ 1 CĽ ' CCCA.CĽCĽ ' Ľ ACĽ AA' AAC ' AĽ ĽA ' AAĽCĽC ' ' IXC-ĽCĽ Ľ 1 AAAC'íJCC Ľ ĽAĽCĽC L LysProGluArgLysLBLSerrrpLBuLBuProPrDLeuSerAanAsnEnd T7 terminator primer #69337-3 pET-32a-c(+) cloning/expression region Struktura vektoru pro účinnou expresi rekombinantních proteinů v E.coli pET-32a(+) sequence landmarks T7 promoter T7 transcription start Trx'Tag coding sequence His'Tag coding sequence S'Tag coding sequence Multiple cloning sites {Nco\-Xho\) His*Tag coding sequence T7 terminator lucl coding sequence pBR322 origin bla coding sequence fl origin 764-780 763 36G-G92 327-344 249-293 158 217 140-157 26-72 1171-2250 3684 4445-5302 5434-5889 ,Ava 1(158) /Xho 1(158] //, Eag 1(166) 6//NQtl(l66) y,Hind 111(173] V,Sal 1(179) '/, Sac 1(190) XEcoR 1(192) X.BamH 1(198) >§ EcoR V(206) 'J.nco 1(212) The maps for pET 32b(+) and pET-32c(+) are the same as pET-32a(+) (shown) with the following exceptions; pET-32b(+) is a 5899bp plasmid; subtract Ibp from each site beyond BamH I at 198. pET-32c{+) is a 59Qlbp plasmid; add lbp to each site beyond BafriR 1 at 198 except for EcoR Vh which cuts at 209. Klonovací místo ^ Gen pro rezistenci k antibiotiku (ampicilin) GCCATGGCTGATArCGGATCCGAAT ľCGAGC ľCCGÍCGAQAAGC ľ ľGCGGCCGCAC TCGAĽCACCACCACCAC C ACC ACT GAGA AItiHetAloAsptIeGIySerGIuPheGI u LeuArgArgGInAIaCysGIyArglh ľArgAiaProPrcProProProLeuArgSerGIyCysEnd ĽCC ATGGCGAT ATCGGAľCCGAAľ TCGAGC TCCGTCCAC AAGCH GCGGC CGC AC ľCGAGCACCACCACCACC ACCAC ľGAGATCCGGC TGC ľ AA AI aMet AI □ [ I eSarAspP r oAsnSer Son Ser Va I AspLysLeuAl aAlaAl aLeuGI uHisHisHLsHisHlshislirci pET-32b(+) GCC ATGGGATA l"C1 GľGGA ľCCGAAľ ľCGAGCľCCGTCGACAAGCT ľGCGGCC GCAC1 CGAGCACCACCACCACCAC C AC 1 GAS A ľ CCGGCTGCT AA pEľ-32^-l AI afetGi yT/i-LguTr-ůl I sArq I I &Ai-qA I oProSgfTh rSerLouflr nPr nH i ^ňŕfiprí hr T hr ľ ^ caaagcccgaaaggaagct LysProG LuArgLysLe ŠpuilÔľl I GAG ľ ľ ŮGC T GC T GC C AC CfiC TGAGC AAľ AÄTAGČÄr u Ser TrpLeuL euPľaProLeuSer As n A^^^^^^^ T7 terminator aaccccttggggcctc r aaac gggtcttgaggggt ľ tt t T7 terminator primer #69337-3 pET-32a-c(+) cloning/expression region Operátor - vazebné místo pro represor Ribozom-vazebné místo Fúzní/purifikační značky/kotvy -►Transkripční terminátor Struktura vektoru pro účinnou expresi rekombinantních proteinů v E.coli pET-32a(+) sequence landmarks T7 promoter 764-780 T7 transcription start 763 Trx* Tag coding sequence 366-G92 His'Tag coding sequence 327-344 S'Tag coding sequence 249-293 Multiple cloning sites (Ncol-Xhol) 158 217 His*Tag coding sequence 140-157 T7 terminator 26-72 /ac/cading sequence 1171-2250 pBR322 origin 3684 bla coding sequence 4445-5302 fl origin 54 34-5889 The maps for pET-32b(+) and pET-32c(+) are the same as pET-32a(+) (shown) with the following exceptions; pET-32b(+) is a 5899bp plasmid; subtract Ibp from each site beyond BamH I at 198. pET-32c{+) is a 59Qlbp plasmid; add lbp to each site beyond BafriR 1 at 198 except for EcoR Vh which cuts at 209. promotor i T7 promoter g lac operator Trx*Ta(j Bsa 1(4576) Eam1105 1(4357; AlwN 1(4036) Operátor - vazebné místo pro represor PshA 1(2366) Psp5 11(2628) TAIACATArGAGC ľletSaT- 3l5bp lOSaa. LCTCrAGAAATAATTTTGTTTAACTrTAAGAAGGAGA Afecl _His-Tag .CTGGCCGGrTCTGGTTCTGGCCATArGCACCATCATCATCATCAnCTTCTGGTCTGCrGCCACGCGGHCr .LeuA)aG(ySa--GI y Ser GI yHi sMethi sHi sHi sHisHtsHIsSerSerGi /Leu Vol ProArqG ySer J fc- ^ -r----:----^fťůQÍC T -~i-- S*Taq primer #69945-3 GG ľ AT G AAAGAAAC CGC TGC TGC ľ AAA T TC GAAC GC L" AG Ľ AL A' GGApAGCCC AGATCrGGGTACCGACGACGACGACAAG GlyMetLysGluThrAlaAlaAlaLysPheGluArgGInHisMetAspSerPr&AspLeuGly íhrAspAspAspAspLys PET-32a(+) e , Aval enterokinase Nco\ CcoRVSamHI CcoRI Sad Sat\ HinA 111 Nol\ Jtftol His-Tag GCCATGGCrGArATCGGAICCGAAnCGACCrCCGrCGACAAGCrrGCGGLCGCACrCGAGCACCACCACCACCACCACrGAGArCCGGCTGGTAA AI tiľtetAloAsptIeGlySerGIuPheGI u LeuArgArgGInAIaCysGIyArglh ľArgAIaProPrcProProProLeuArgSerGIyCysEnd GCCATGGCGATArCCGATCCGAArrCGAGtTCCGrCCACAAGCrTGCGGCCGCACrCGACCACCACCACCACCACCACrGACATCCGGCľGCIAA AI □ Mat AI □ [ I eSarAspProAsnSerSarSe'-Val AspLysLeuAI ciAL aAI aLeuG uHisHisHisHisHlshisLncí pET-32b(+) GCCATGGGATArClGTGGArCCGAArrCGAGCrcCGTCGACAAGCTrGCGGCCGCACICGAGCACCACCACGACCACCAClGAGAfCCGGCTGCTAA pET~-32c(4 A Ĺiľ-c t {!■'■ y ; yrL&Ľ r-L-n' ii-A-qi BAfgj pPjľčSar 1I* rSar LŕL: A-qiJ- l^- 5 ^ e ■• ^ c ' I* ' I* ■ 'hi : l~" 1 h '•' h '• G l\ c-A-ciLŕLLt>Ľ h ■_ Spu11Q2l T7 terminator CAAAGCCCGAAAGGAAGCTGAGrrGGCTGCTGCCACCGCTGAGCAArAACTAGCArAACCCCTTGGGGCCTCrAAACGGGrCrTGAGGGGTrrTrrG LysProGLuArgLyaLeuSerTrpLeuLeuProPrDLeuSerAsnAsnEnd T7 terminator primer#69 337-3 pET-32a-c(+) cloning/expression region Vlastnosti promotoru: • Silný promotor (ptač, ptrp, XpU pT7) - Protein zájmu by měl tvořit 10-30% a více z celkového bakteriálního proteinu. • Přenositelný do různých kmenů E.coli • Vykazuje minimální hladinu bazálni exprese - Pokud jsou proteiny netoxické dosahuje se vysokých výtěžků proteinů růstem buněk do vysokých hustot s následnou indukcí aktivity promotoru. - U toxických proteinů pro je nutná minimalizace bazálni transkripce před přídavkem indukčního činidla pomocí vhodného represoru. • Jednoduše a levně inducibilní - Teplotní indukce (ApL) - Chemická indukce (ptač, ptrp, pT7): IPTG (isopropyl-P-D-thiogalaktopyranozid) Struktura vektoru pro účinnou expresi rekombinantních proteinů v E.coli pET-32a(+) sequence landmarks T7 promoter 764-780 T7 transcription start 763 Trx* Tag coding sequence 366-692 His*Tag coding sequence 327-344 S» Tag coding sequence 249-293 Multiple cloning sites (JVcoI -Xliol) 158 217 His *Tag coding sequence 140-157 T7 terminator 26-72 lad coding sequence 1171-2250 pBR322 origin 3684 bla coding sequence 4445-5302 fl origin 5434-5889 The maps for pET-32b(+) and pET-32c(+) are the same as pET-32a(+) (shown) with the following exceptions; pET-32b(+) is a 5899bp plasmid: subtract Ibp from each site beyond BSraH I at 198. pET-32c(+) is a 59Qlbp plasmid; add lbp to each site beyond BanM 1 at 198 except for EcoR V, which cuts at 209. Bsa 1(4576) Eam1105 1(4357; Apa 1(1732) BssH 11(1932) Hpa 1(2027) LU11 1(3622) Sap 1(3506) Bst1107 1(3393) Tth 111 1(3367) BspG 1(3148) PshA 1(2366) Psp5 11(2628) T7 promoter lac operator TAATACGACTCACTATAGGGGAATTGTGAGCGGATAACAATTCCCCTCTAGAAATAATTTTGTTTAACTTTA _Trx-Tag_ His-Tag TATAC ATA TGAGC ľletSar- 3l5bp lOScici. .CTGGCCGGTTCTGGTTCTGGCCATATGCACCATCATCATCATC ATICT T CTGGTCT CGTGCCACGCGGTTCT .LeLA!ciGly^e.-Ľ yík--C yl ^sPe1| 51 si si- si si- siicr^ft yLei.'.'ii oA gC S'Tag J&ď "■ S-Tag primár #6994-5-3 GG T AT GAAAGAAAC CGC TGC TGC T AAA T TC GAAC GC CAG CAC A' C-CAC ALCCC AGATC TGGGTACCGACGACGACGACAAG GiyMetLysGluThrAlaAlaAlaLysPheGluArgGInHisMetAspSerPr&AspLeuGly rhrA5pAspAspAsĽ>Lys PET-32a(+) e , Ami euterokinase Nco\ CcoRVSamHI Cccftl Sad Sat\ Hind \ll Not\ Jtftol His-Tag GCCATGGCTGATATCGGATCCGAATrCGAGCTCCGrCGACAAGCTTGCGGCCGCACTCGAGCACCACCACCACCACCACTGAGATCCGGCTGCTAA Al aľletAl □ Asp [ I aG I ySerG I uPheG I u Leu A rgAr gGI nAI uCysGI yAr gT h ľ Ar gA I aProPrcProProPr oLeu At-gSerGi yCysEnd GCCATGGCGATArCCGATCCGAATTCCAGCTCCGTCCACAAGCTTGCGGCCGCACrCCACCACCACCACCACCACCACrGACATCCGGCrGCTAA AI rjMet AI □ [ I eSarAspProAsnSerSarSe'Va AspLysLeuAI oAL aAI aLeuG luHisHisHisHisHlshisErcí pET-32b(+ GCCATGaaATArClGTGGArCCGAArrCGAECrcCGTCG A : ľiiľ&tĽ-; y • yrL&i_ ' c-t- q'. t>A'-qA m I * ■■ c So ' I- rgar L&uflr nPr nH ■ i^prfi.pr T hr T hr ľ ^ CAAAGCGCGAAAGGAAGCT L/sProdlLiArgLysLe Bpu11021 I GAG ľ ľ GGC T GC T GC C AC CŮC TGAGC AAľ AATAGCaT u£er TrpLeuL euProProLBuSer As n A^^^^r^^^ T7 terminator aaccccttggggcctc r aaac gggtcttgaggggt ľ tt t T7 terminator primer#69337-3 pET-32a-c(+) cloning/expression region Ribozom-vazebné místo ^Transkripční terminátor Struktura vektoru pro účinnou expresi rekombinantních proteinů v E.coli ■35 TTGACA (N]-|7 TATAAT START codon AUG (91%) UGA U AG mRNA 5' UAAGGAGG [N)s 16SrRNA 3' HOAUUCCUCC GUG (8%) UUG (1%) Ribozom-vazebné místo: zahrnuje Shine-Dalgarnova (SD) sekvenci a translační iniciační kodon Vzdálenost mezi SD sekvencí a iniciačním kodonem AUG je 4-13 nukleotidů, tato vzdálenost ovlivňuje účinnost iniciace translace (optimální vzdálenost je 4-8 nukleotidů), oblast bohatá na AT páry. Transkripční terminátor t7 term, rmTi,T2 (zabraňuje okluzi promotoru, zvyšuje stabilitu mRNA) Výběr hostitelského kmene E.coli Podmínky kultivace Exprese rekombinantního proteinu v hostitelském kmeni E. coli Inducer (IPTG or lactose) Inducer (IPTG or lactose) * i E. coli genome Toxicita rekombinantního proteinu pro hostitelský kmen • Není omezena na pouhý fakt, že je protein je pro buňku cizí, ale může být způsobena i tím, že je nadprodukován určitý nativní gen. Pro hostitele jsou smrtelné: • Rekombinantní proteiny s hydrofóbními oblastmi mají toxický účinek - asociují s membránou nebo se inkorporují do membránového systému buňky (porušení membránového potenciálu). • Proteiny, které inaktivují ribozomy. Výběr hostitelského kmene E.coli s ohledem na toxicitu proteinu pro hostitele • Nutná přísná regulace expresního systému Komerčně dostupné bakteriální kmeny s různými úrovněmi regulace exprese, zajišťujícími minimalizaci bazálni exprese. BL21(DE3) firma Novagen BL21(DE3)pLysS firma Novagen Různé úrovně minimalizace bazálni exprese ✓BL21(DE3) BL21(DE3)pLysS/E BL21 IPTG Induction £. coli RNA W polymerase T I - T7 gene 1 JI RNA polymerase IPTG Induction T7 RNA polymerase Target gene 0 /ac repressor lacl gene- ŕľ. co// genome Cca 10 % hladina bazálni exprese (před indukcí exprese) klonovaného genu. Různé úrovně minimalizace bazálni exprese BL21(DE3) ✓BL21(DE3)pLysS/E BL21 • Expresní kmen obsahující plazmidy pLysS nebo pLysE umožňující přísnou regulaci expresního systému využívající T7 promotor. Tyto plazmidy kódují lysozym, který se váže na T7 RNA polymerasu a inaktivuje ji a minimalizuje se tak bazálni exprese. Cca 1-3% hladina bazálni (před indukcí exprese) exprese klonovaného genu. Různé úrovně minimalizace bazálni exprese • Indukce exprese infekcí bakteriofágem CEG (gen pro T7 RNA polymerasu) Nej vyšší úroveň represe!! Využívání kodonů E.coli (codon usage) • Geny u prokaryot a eukaryot se vyznačují nenáhodným využíváním synonymních kodonů. • Kodony zřídka využívané u E. Coli se mohou hojně vyskytovat u heterologních genů pocházejících z eukaryot, archebakterií aj. • Frekvence využití synonymních kodonů obvykle odráží zastoupení jejich tRNAv cytoplazmě. Escherichia coli K12 [gbbct]: 14 CDS's (5122 codons) fields: [triplet] [frequency: per thousand] ([number]) UUU 19.7( UUC 15.0( UUA 15.2( UUG 11.9( CUU 11.9( CUC 10.5( CUA 5.3( CUG 46.9( AUU 3 0.5( AUC 18.2( AUA 3.7( AUG 2 4.8( GUU 16.8( GUC 11.7( GUA 11.5( GUG 26.4( 101) 77) 78) 61) 61) 54) 27) 240) 156 ) 93) 19) 127) 86 ) 60) 59) 135) UCU 5.7( UCC 5.5( UCA 7.8( UCG 8.0( CCU 8.4( CCC 6.4( CCA 6.6( CCG 26.7( ACU 8.0( ACC 22.8( ACA 6.4( ACG 11.5( GCU 10.7( GCC 31.6( GCA 21.1( GCG 38.5( 29) 28) 40) 41) 43) 33) 34) 137) 41) 117) 33) 59) 55) 162) 108) 197) UAU 16. 8 ( UAC 14.6( UAA 1.8( UAG 0.0( CAU 15.8( CAC 13.1( CAA 12.1( CAG 2 7.7( AAU 21.9( AAC 2 4.4( AAA 33.2( AAG 12.1( GAU 3 7.9( GAC 2 0.5( GAA 43.7( GAG 18.4( 86 ) 75) 9) 0) 81) 67) 62) 142) 112) 125) 170) 62) 194) 105) 224) 94) UGU 5.9( UGC 8.0( UGA 1.0( UGG 10.7( CGU 21.1( CGC 26.0( CGA 4.3( CGG 4.1( AGU 7.2( AGC 16.6( AGA ftGG 1.4( 1 -6Í GGU 21.3( GGC 33.4( GGA 9.2( GGG 8.6( 30) 41) 5) 55) 108) 133) 22) 21) 37) 85) 7) 8) 109) 171) 47) 44) Arabidopsis thaliana [gbpln]: 80395 CDS's (31098475 codons) fields: [triplet] [frequency: per thousand] ([number]) UUU 21.8(678320) UUC 20.7(6 42 407) UUA 12.7(394867) UUG 20.9(649150) CUU 24.1(750114) CUC 16.1(500524) CUA 9.9(307000) CUG 9.8(305822) AUU 21.5(668227) AUC 18.5(5 76 287) AUA 12.6(391867) AUG 24.5(762852) GUU 27.2(847061) GUC 12.8(397008) GUA 9.9(308605) GUG 17.4(539873) UCU 25.2(782818) UCC 11.2(348173) UCA 18.3(568570) UCG 9.3(290158) CCU 18.7(580962) CCC 5.3(165252) CCA 16.1(502101) CCG 8.6(268115) ACU 17.5(544807) ACC 10.3(321640) ACA 15.7(487161) ACG 7.7(240652) GCU 2 8.31 GCC 10.3(321500) GCA 17.5(5 43180) GCG 9.0(280804) ■ ' Í UAU 14.6(455089) UAC 13.7(427132) UAA 0.9( 29405) UAG 0.5( 16 417) CAU 13.8(428694) CAC 8.7(271155) CAA 19.4(604800) CAG 15.2(473809) AAU 22.3(693344) AAC 20.9(650826) AAA 30.8(957374) AAG 32.7(1016176) GAU 36.6(1139637) GAC 17.2(535668) GAA 34.3(1068012) GAG 32.2(1002594) UGU 10.5(327640) UGC 7.2(222769) UGA 1.2( 36260) UGG 12.5(388049) CGU CGC CGA CGG 9.0(280392) 3.8 (117543) 6.3 (195736) 4.9(151572) AGU 14.0(435738) AGC 11.3(352568) \GA Í9\ 0 (5JÍ9788) AGG 11 ■ 0 ( Í40922) GGU GGC GGA GGG 22.2 (689891) 9 . 2 (284681) 24.2(751489) 10.2 (316620) Coding GC 52.35% 1st letter GC 60.82% 2nd letter GC 40.61% 3rd letter GC 55.62% |Coding GC 44.59% 1st letter GC 50.84% 2nd letter GC 40.54% 3rd letter GC 42.38% http://www.kazusa.or.ip/codon/ Málo preferované kodony u E.coli Codon(s) Amino íicid AGA, AGG.CGA. CGG..............................................................Aig UGU.UGC.....................................................................................Cys GGA.GGG.....................................................................................Gly AUA.................................................................................................Ile" CUA, CUC......................................................................................Leu CCG CCU, CCA............................................................................Pro UCÁ, AGÚ.UCG. UCC..............................................................Set ACA.................................................................................................Thr Makrides, 1996 Exprese heterologní genů obsahujících málo preferované kodony vede k translačním chybách ! • Předčasné ukončení translace (zkrácený produkt) • Posunutí čtecího rámce (posun až o 2 AK v místě kodonu AGA) • Záměna aminokyseliny - často arginin (kodon AGA) za lyzin Výběr hostitelského kmene E.coli • Pro produkci genů obsahující velké množství kodonů, které jsou málo využívané E.coli, je možné použít komerčně dodávané kmeny, které produkují tRNA málo užívaných kodonů. Plasmidy komplementující tRNA. •BL21 (DE3) CodonPlus-RIL •AGG/AGA (arginine,R), AUA (isoleucine, I) and CUA (leucine, L) firma Stratagene •BL21 (DE3) CodonPlus-RP •AGG/AGA (arginine, R) and CCC (proline, P) firma Stratagene •Rosetta or Rosetta (DE3) •AGG/AGA (arginine, R), CGG (arginine, R), AUA (isoleucine, I) CUA (leucine, L)CCC (proline), and GGA (glycine, G) firma Novagen NEBO: Místně řízená mutageneze - záměna málo využívaného kodonu. Optimalizace kodonů - syntéza genů Optimální složení kodonů pro produkci v jednom či více organismech s ohledem na vznik sekundárních struktur a stabilitu mRNA. g raphical lyse r CKilrd sequence derived Írom Ara£>±ciopsis_t.řia liana Ordinate (y-axis): relative adaptiveness <20% <10% www. gcnc.com I S0.39/bp Z 0.30 # tip ■ www.gcua.de created: 18.08.2011 SAAGiTTGCTTCTAJTATiAASGGSGSCÍSCSaCCTGAÍTGÍSCrSGTSÍ MEGKRVLVVDDNF ISRKVATGKLKKMGVS EVEQC DSGKERLRLvrEGLTQ i I i iiiiii 3 ss " ! s s J AGGCGTGGACCTGTATAGTCACGAGGTGGAAGAAAGGAATGGCACAAGGT a a a G T a a T T a a T T a i a T a T a G- A A C C AT ň T A A G A G T G G T ■:: T G AAAATAATATGTGGAGGGGAGAAGTGTAATAGTGAGGATTGGTAATArAT REEQGSVDKLPFDYIFMDCQMPEMDGYEATREIRKVEKSÝgVRTPIIAVS J. J. U _L^U 1JU 1« gcgcgtggg gaagggaggtcgaataccgagacgagaacct g k A g g -ľ A k k T k i T A g T T A A ''J T k A T g A g T g A T k g k g k tttttagaaaactatagccccgacgtaiacgccacacatcg ghdpgseearetiqÄgmdaflekslnqlangireÍeskrh g raphical ►a rtSnyser k www, genc.com H )$0.39/bp Z ' 0.30 € top I I CKIrd optim codon us sequonce derivQd from Ar.jbii:lop;::i rj_t.haliana Codontable: EschGrictiia_coli_K12 Ordinate (y-axis): relative adaptiveness <20% clO% www.gcua.de created: 24.OS.2 011 O o o O O O O O Q O O í O o o O O O O O Q O O c a G G a C S C G G G G a T a T C a 3 '5 s J a T a a k G G k G G G C T G a G A G G T C T G a G G T a í T A G A G T T T T A A A T T ■:: G A T ■:' 'ľ G A T A A T G T G A T A A g A g G A A G T G T T C A G T C I GACGT1GIGCTI CTC C G G G C C G a a G G I a C a C a a 1 C C T a aa G C a a C a T G I J MEGKRVLVVDDN F1 I S R k V a t G kl k eb G V S E V E Q C DSGKEÄlRLVTEGLTÍ o o q o oqoooooqooqoq o o o o o o o o Jl cggcgaggacgtgtatagtcacgaggtggacgaaaggattggaacaaggt g A A A g g t a A t g t a a t t t A g a t g a t A g A A g g g a t a t A a g A g t 'ľ v t t g t 'ľ taagctttggtt gt i cgt cggaagttcacatacaatagtt cgagat ccct reeqgsvdkĹpfdy'fmdcqmpemdgyeatreirkveksygvrtpiiavs O Oo O O Q O O O OOo O O o O O O 0OO0OO O Oo O O Q O O O OOo O Oo O O O oOOoiľ'O J. J. U ±Z95%) • Edmanovo odbourávání (5-10 pmol), přístupy hmotnostní spektroskopie (0,2-1 pmol) Produkce protilátek ug-mg střední-vysoká • Pro imunizaci: ~ 0,1 jag proteinu • Čím větší čistota tím větší a rychlejší šance pro zisk vysoce specifické imunitní odpovědi. Enzymologie 1-5 mg vysoká > 95 % • Množství proteinu závisí na citlivosti analýzy. • Čistota závisí na specificitě analýzy a ovlivnění výsledků analýzy kontaminacemi. Biofyzikálni studie mg-g vysoká (>95%) • CD spektroskopie, rezonance povrchových plasmonů, fluorimetrie, analytická ultracentrifugace, UV spektroskopie 3D struktura (krystalizace, NMR) 10-20 mg vysoká (>95%) • Hledání krystalizačních podmínek -1-2 mg proteinu, zisk krystalu o velikosti dostatečné pro rentgenovou difrakci 5-10 mg proteinu • Pro první 1-D NMR spektra se vyžaduje ~ 0,5 |J,mol proteinu, protein (velikost 5-20kDa) značený 15 N / 13C je nutný pro vyřešení struktury. Farmaceutické účely mg-kg vysoká (99,9%) • Pro klinické účely nesmí proteiny obsahovat pyrogeny a bakteriální toxiny a musí být velmi stabilní kvůli dlouhodobému skladování. Jak??? Jak budeme protein analyzovat? Polyakrylamidová gelová elektroforéza SDS PAGE s následných westernovým přenosem_ 1. Specifická detekce: Detekce proteinu zájmu během purifikace • Pomocí protilátek Sledování biologické aktivity proteinu • U enzymů např. barvení v gelu nebo stanovení specifických konstant v komplexních vzorcích pomocí chromogenních substrátů 2. Nespecifická detekce: Sledování čistoty • Barvení pomocí Coommasie blue, stříbra,... 3. Stanovení koncentrace proteinu • Nejvíce využívané metody: dle Bradfordové, Lowryho metoda,.... nativní PAGE SDS PAGE Co??? Jaké vlastnosti má protein 1 Informace o proteinu zájmu a příbuzných proteinech z databází nebo z pilotních experimentů: • Velikost proteinu (SDS PAGE, gelová filtrace nebo analytická centrifugace) • Izoelektrický bod (izoelektrická fokusace) • Stabilita (pH, teplota, přítomnost solí, proteas, additiv zajišťujících rozpustnost proteinu) 2D a nativní PAGE • Komplexita vzorku, vlastnosti proteinu zájmu a i ostatních kontaminujících proteinů Informace o proteinu zájmu a o příbuzných proteinech z literatury: • Strategie purifikace (metody, pufry, stabilita proteinu,.....) Vlastnosti/purifikační metody Molecular weight (s(ze) Rozpustnost Stabilita Velikost/tvar pí (povrchový náboj) Hydrofobicita Specifická vazba precipitace např. síranem amonným, nízké/vysoké pH teplotní precipitace gelová filtrace (gelová permeační chromatografie) iontově výměnná chromatografie reverzně fázová a hydrofóbní chromatografie afinitní chromatografie Posttranslační modifikace afinitní chromatografie Kolik purifikačních kroků je potřeba? Většina proteinů je purifikována minimálně ve čtyřech krocích. Q DOČISTENÍ nT) Vysoká čistota cílového proteinu-odstranění drobných nečistot, proteinů podobných vlastností ve vzorku již investovaná práce, množství proteinu je menší. • Pokud možno řadit metody za sebou racionálně, bez nutnosti mezikroků, jako je výměna pufru mezi jednotlivými separačními technikami příklad: po precipitaci síranem amonným nebo iontoměničové chromatografii (protein je eluován z kolony za vysokých koncenracích soli) zařadit hydrofóbní chromatografii (vzorek dávkován na kolonu ve vysoké koncentraci soli) • Jednotlivé separační metody pokud možno neopakovat. v • Cím méně kroků, tím větší výtěžnost proteinu. Sledování čistoty proteinů SDS PAGE 28% purity 80% purity r—3 Nativní PAGE Fúzní proteiny Translační fúze sekvencí kódujících rekombinantní protein a a) krátký peptid [př. (His)n, (Asp)n, (Arg)n ... ] - uniformita purifikace b) přirozený Oligopeptid [př. MBP, GST, thioredoxin ...] - pozitivní změny kvality a kvantity exprese (často zvýšení solubility rekombinantního proteinu) (i) - uniformita purifikace • Detekce, sekrece • Fúzního partnera lze obvykle selektivně odštěpit 5' Promoter Tag Gene of interest 3' Terminator Transcribe and translate Tag fused to the N-terminus of the protein of interest (Ü) 5' Promoter Gene of interest CS Tag 3' Terminator Transcribe and translate NC Tag fused to the C-terminus of the protein of interest Fúzní partner Velikost Umístění Využití His-tag 6, 8, or 10 aa N-, C-, internal purifikace thioredoxin 109 aa(11.7kDa) N-,C- purifikace, zvýšení solubility proteinu His-patch thioredoxin 109 aa(11.7kDa) N-,C- purifikace, zvýšení solubility proteinu chloramfenikol acetyltransferasa 24kDa N- sekrece, purifikace, detekce avidin/streptavidin Strep-tag purifikace, sekrece glutathion-5-transferasa-GST 26kDa N- purifikace maltosu vázající protein (MBP) 40kDa N-, C- purifikace, sekrece zeleně fluoreskuj ící protein (GFP) 220 aa N-, C- detekce, purifikace polyasparagová kyselina 5-16 aa C- purifikace ompT /ompA 22 aa/21 aa N- sekrece Fúzní kotvy (tágy) využívající se k purifikaci Kotva (tag) Typ chromatografíe Princip separační techniky poly [His] afinitní vazba na kov IgG vazná doména afinitní vazba na protilátku Poly [Asp] iontoměničová vazba na anion vázající matrici Poly [Phe] hydrofóbní vazba na hydrofóbní matrici Strep-tag afinitní vazba na streptavidin Poly [Arg] iontoměničová vazba na kation vázající matrici Rozlišení Separační techniky charakteristické rovnováhou všech parametrů. Rychlost Kapacita Výtěžek Odstranění fúzní kotvy (tágu) - proteolytické štěpen pRSET B Multiple Cloning Site , Protease site Hisc MBP Target protein 21 T7 promoter RBS -1 I-1 AATACGACTC ACTATAGGGA GACCACAACG GTTTCCCTCT AGAAATAATT TTGTTTAACT TTAAGAAGGA Polyhistidine (6xHis) region I-1 I- 91 GATATACAT ATG CGG GGT TCT CAT CAT CAT CAT CAT CAT GGT ATG GCT AGC ATG ACT Met Arg Gly Ser His His His His His His Gly Met Ala Ser Met Thr 148 205 T7 gene 10 leader r Xpresi GGT GGA CAG CAA ATG GGT CGG GAT CTG TAG GAG Gly Gly Gin Gin Met Gly Arg Asp Leu Tyr Asp Pst I Pvu II Kpn I Nco I EcoR I BsfB I Hind III i i M Epitope BamH I Xbo I S4= I 1 1 ^-= 1 ' GAT GAC GAT AAG GAT qCG AGjC TC Asp Asp Asp Lys^sp Pro Ser Se[; EK recognition site EK c|eavage site BgtW AGA TCT GCA GCT GGT ACC ATG GAA TTC GAA GCT TGA T Arg Ser Ala Ala Gly Thr Met Glu Phe Glu Ala *** 261 T7 reverse priming site GAAAGGAAGC TGAGTTGGCT GCTGCCACCG CTGAGCAATA ACT AGC AT AA Enzyme Cleavage site Enter ok inase DDDDK* Factor Xa IDGR* Thrombin LVPR'CS Pre Scission LEVLFQ'GP TEV protease EQLYFC/C 3C protease ETLFQ*CP Sortase A LPET*G Granzyme B D^X, N*X, M*N, 5>*X Metalochelatační afinitní chromatografie R.1975- uveřejnil Porath a kol. metodu frakcionace sérových proteinů Konstrukce umělých oligohistidinových domén fúzovaných k N- nebo C- konci proteinu metodami mol. biologie Nyní jeden ze základních purifikačních postupů rekombinantních proteinů Protein s kotvou \ L Ligand (Ni2+) „ „oddělovací raménko" M (kDa) 170 ■ 116 -86 ■ 56 " histidinovou^™^^ f / ™ CH—C JI- 27 20 Funkční/reaktivní skupina Podpůrná matrice (agarosa) '(HisifZiti-pe Zn2+ Ni2+ Co2+ Cu2+ Síla vazby: Cu2+ > Ni2+ > Zn2+ ~ Co2 Metalochelatační afinitní chromatografie Purifikace za nativních podmínek Obecně lze navrhnout: Pufry o pH 7-8 pro vazbu rek. proteinu s kovovým iontem. Pufry s vysokou koncentrací solí (např. 0,5-1 mol/l NaCl). Nižší koncentrace imidazolu nebo snížení pH pro odstranění balastních proteinů. Eluce použitím gradientu imidazolu (0-1 mol/l), výrazným snížením pH nebo využitím EDTA. Immobilized metal affinity chromatography His protease cleavage site -A charged metal chelate resin 1 PH í [imidazole] j [EDTA] H protease —4 + + + + Me A H + 31 + l> + Puriflkace proteinu AHP2 (Arabidopsis histidin phosphotransfer protein 2) 4L bakteriální kultury Metalochelatační afinitní chromatografie /Puer: 50 mM Tris pH 7.9, 300 mM NaCI, 10 % glycerol, 20 mM imidazol, 3.9 mM mercaptoethanol Gradientova eluce: 20 -500 mM imidazol Gelová filtrace Anion výměnná chromatografie Pufr: 20 mM Tris pH 7.9, 250 mM NaCI Pufr: 20 mM Tris pH 7.9 Isocratická eluce Gradientova eluce: 0 -1M NaCI 66 kDa 45 kDa 36 kDa 29 kDa 24 kDa 20 kDa 14 kDa 15% SDS PAGE 10% NATIVE PAGE 15 % SDS PAGE ' 10% NATIVE PAGE His-tagged protein and IMAC under native conditions One-step purification of maize ß-glucosidase > Perfusion matrix: POROS MC/M > Functional group: iminodiacetate, metal ion Zn2+ > Removing contaminated proteins: linear gradient of imidazole (0-50 mM) and pH (pH 7-6.1) > Protein elution: 0.1 M EDTA > 80% recovery, 95 fold purification > Common production and isolation of wild type protein and soluble mutant form for enzymatic measurements and crystallization. M (kDa) A B C D (Zouhar et al., 1999) His-tagged protein and IMAC under native conditions Four-step purification of Arabidopsis CKI1RD 1. Affinity purification (MCAC) 2. Tag removal (TEV protease) 3. Affinity purification (MCAC) 4. Size exclusion chromatography Ub^SGSG|lHi?faqtSA]TEVkM ECKI1 3. Affinity purification after TEV cleavege CKI1 RD pETM-60::CKIl 0 rnM imidaz^ 200 mM imidazole UUTmMMU 1,1=1,1 UUUU 1,1.1 JUUUUI.U pETM-60::CKl 4. Size-exclusion chromatography RD pETM-60 1 10-20 mgforTB and M9 Pekařova B. Základní doporučení pro uskladnění proteinu po puriflkaci Doba skladování: pár dnů až více než rok - záleží na přirozených vlastnostech proteinu a podmínkách, ve kterých je protein skladován 1. Teplota Podmínky skladování Podmínky Roztok na 4°C Roztok na -20°C v 25-50% glycerolu -80°C, tekutý dusík Lyofilizovaný vzorek, zamražený Doba skladování 1 měsíc 1 rok roky roky Požadavek sterilního prostředí nebo přídavek antibakteriálního additiva ano Obvykle ano ne ne Kolikrát může být takto skladovaný vzorek použitý? mnohokrát mnohokrát 1 x, opakované zamražování a rozmrazování obecně vede k degradaci proteinu lx, Základní doporučení pro uskladnění proteinu po puriflkaci 2. Koncentrace proteinu - rozředěním proteinu na < 50 |LLg/ml dochází často k jeho inaktivaci nebo ztrátě proteinu - disociují podjednotky multimerních proteinů - ztráta proteinu kvůli signifikantní adsorpci na různé povrchy Protein by měl být skladován při koncentraci nejméně 1 mg/ml nebo se může protein stabilizovat přídavkem jiného proteinu např. BSA nebo přídavkem additiva 3. Přídavek additiv zajišťujících stabilitu proteinu během skladování - 25-50% glycerol nebo etylenglykol - 0,02-0,05 % NaN3 - inhibitor proteas - 1-5 mM EDTA - l-5mM DTT, merkaptoetanol Doporučená literatura Makrides SV (1996) Strategies for Achieving High-Level Expression of Genes in Escherichia coli. Microb.Review 60, (512-538). Simpson RJ; Adams PD; Golemis E Basic methods in protein purification and analysis: a laboratory manual, Cold Spring Harbor, N.Y. : Cold Spring Harbor Laboratory Press, 2009, 436 s., ISBN 978-0-87969-868-3