IPTG Induction f. col R HA é polymeia« T7 gene 1 repressor tac I gene— F. coll genome T7 RNA polymerase I I * IPTG Induction T7RKA w polymerase Target gene Exprese rekombinantních proteinů Rekombinantní proteiny Rekombinantní DNA je umělá DNA sekvence, která vznikla novou kombinací dvou nebo více různých DNA sekvencí. Rekombinantní proteiny jsou proteiny získané vnesením rekombinantní DNA do heterologního hostitele (např. mikroorganismus, kvasinky), ve kterém dojde k expresi genu. Využití rekombinantních proteinů 1. V základním výzkumu: • Biochemická funkční charakteristika proteinu (určení přesných kinetických parametrů Km, kcat pro enzymy se substrátem, K{ pro enzymy s inhibitorem, Kd pro protein - proteinové interakce či ligand -proteinové interakce) • Strukturní analýza (NMR, krystalografie, kryo-EM) • Proteinové inženýrství (zlepšení vlastností proteinů - aktivita, stabilita) 2. V průmyslu: • např. léky, vakcíny, proteiny pro diagnostiku, potravinové doplňky,... Cíl: Vysoký výtěžek homogenního proteinu (mg - kg proteinu) Zachování biologické aktivity Proč vyrábět rekombinantní proteiny? Přirozený zdroj: • Obtížně se získává (tkáně, orgány). • Obtížně se kultivuje (bakterie, viry, tkáňové kultury). • Limitovaná exprese • Často obtížná purifikace proteinu (mnohokroková) • Možná infekční rizika v průběhu izolace nebo ve výsledném produktu TABLE 1.2. Examples of lew-abundance proteins and peptides isolated from natural biological sources Protein Source Yield (Hg) Reference Multipotential colony- pokeweed mitogen-stimulated 1 Cutler et al. (1985) stimulating factor mouse spleen-cell-conditioned medium (10 liters) Human A33 antigen human colon cancer cell lines (lO1* cells) 2.5 Catimeletal. (1996) Platelet-derived growth human serum (200 liters) 180 Heldin et al. (1981) factor (PDGF) Granu] ocyte-colony- mouse lung-conditioned 4ii Nicola et al. (1983) stimulating growth medium (3 liters) factor (G-CSF) G ranul ocyte-macrophage mouse lung-conditioned lj Burgess et al. (1986) colony-stimulating growth medium (3 liters) factor (GM-CSF) Coelenterate morphogen sea anemone (200 kg) 20 Schaller and Bodenmuller (1981) Peptide YY (PYY) porcine intestine (4000 kg) 600 Tatemoto (1982) Tumor necrosis factor (TNF) HL60 tissue culture medium 118 liters) 2t> Wang and Creasy (1985) Murine transferrin receptor NS-1 myeloma cells (10'° cells) 20 vanDriel et al. (1984) Fibroblast growth factor !FGF) bovine brain (4 kg) 33 Gospodarowicz et al. (1984) Transforming growth human placenta in n kg.i 47 Froliketal.(1983) factor-ß (TGF-ß) Human interferon human leukocyte-conditioned medium (10 liters) 21 Rubinstein et al. (1979) Muscarinic acetylcholine porcine cerebrum (600 g) 6 Haga and Haga (1985) receptor |i,-adrenergic receptor rat liver (400 g) 2 Graziano et al. (1985) Technologie rekombinantních proteinů Insert cDNA in an expression system Grow large volumes of protein in culture Hostitelský organismus pro expresi rekombinantních proteinů • Prokaryotní expresní systémy {Escherichia coli, Bacillus subtillis,...) • Kvasinky (Sacharomyces cerevisiae, Pichia pastoris,.....) • Savčí buňky (linie ovariálních buněk křečka čínského- CHO buňky, linie lidských embryonálních ledvinových buněk-HEK,...) • Hmyzí buňky s bakuloviry • Exprese proteinu in vitro (lyzáty z králičích retikulocytů, extrakty z pšeničných klíčků, extrakty z E.coli) Bacteria Yeast Insect Mammalian Expression Expression Expression Expression System System System System Kritéria pro výběr hostitelského organismu pro expresi rekombinantních proteinů Expresní systém Posttranslační modifikace N-glykosylace O-glykosylace Fosforvlace Acetvlace Acvlace T-karboxylace E. coíi chybí - - Kvasinky vysoce manosilované glykany + + + + Hmvzí buňkv jednoduchá, bez sializace + + + + Savčí buňkv komplexní + + - + Post-translační modifikace mají vliv na folding proteinu, rozpustnost, stabilitu, transport, imunogenicitu a funkční aktivitu proteinu. Kritéria pro výběr hostitelského organismu pro expresi rekombinantních proteinů Expresní systém Náklady na kultivaci Rychlost růstu Úroveň exprese Konformace proteinu E. coli nízké vysoká vysoká často nutný refolding Kvasinky nízké vysoká nízká až vysoká někdy nutný refolding Hmyzí buňky vysoké nízká nízká a vysoká většinou správná Savčí buňky vysoké nízká většinou nízká většinou správná Statistika v PDB Q > §• > CD >o O 100% 80% 60% 40% 20% E.coli 1 I ^=^_ ! Mammalian Cell Free Organismus použitý pro expresi Jedná se o přibližné hodnoty z roku 2014 https://www.rcsb.org/stats/distribution-expression-organism-gene Produkce heterologních proteinů v E. Coli VÝHODY: • Vysoká produkce rekombinantních proteinů • Dobře prostudovaný genom a proteom-usnadnění genových manipulací • Design řady vektorů usnadňuje klonování a expresi cizích genů • Rychlý růst v poměrně levném médiu • Přizpůsobivost systému Produkce heterologních proteinů v E. Coli NEVÝHODY: • Potřeba cDNA zkoumaného proteinu • Absence eukaryotických posttranslačních systémů (posttranslačních modifikací) • Tvorba inkluzních tělísek (nerozpustná forma proteinu) • Omezená schopnost tvorby disulfidických vazeb • Preferují jiný genetický kód než vyšší eukaryota • Kontaminace proteinů lipopolysacharidem (endotoxin) • Chybí sekreční mechanismus pro účinné uvolňování proteinu do kultivačního média Expresní systém E. coli Vektor Hostitelský kmen Podmínky kultivace Expresní vektor = klonovací vektor, který obsahuje nezbytné regulační sekvence k tomu, aby podporoval expresi inzertů cizích genů. pET-32a(«) sequence landmarks T7 promoter 764 780 T7 transcription start 763 Trx"Tag coding sequence 366-692 His"Tag coding sequence 327-344 S*7qg coding sequence 249-203 Multiple cloning sites {Nco\ Xho\) 158217 Hls'Tag coding sequence 140-157 T7 terminator 26-72 Air/coding sequence 1171-2250 pBR322 origin 36S4 bh coding sequence 4445-5302 fl origin 5434 5889 Tlie maps for pET32b(+) and pET 32c(+) are the same as pET-32a(+) (shown) with the following exceptions: pET-32b(+) is a 5899bp plasmid; subtract I bp from each site beyond BamH 1 at 198. pET-32c(+) is a 590ibp plasmid; add lbp (o each site beyond BitnM I at 198 except for BrtfU V, which cuts at 209. Bsa 1(4576) Eam1l05 1(4357: BssH 11(1932) Hpa 1(2027} BspLim 1(3622) Sap 1(3506] Bst1107 K3»3) Tth11l 1(3367) BspG l(3tdfl) PshA 1(2366) Psp511(26261 TA*T*CCACTC*C lac ťip-etaíoi * A ' AC A ' ŕ ' GACC Tf>'T,i(| AITCCCCtCTACAAATAATttTCtTTAACt Afecl H is-Tag C'GGCCGGt'ClGG^ K TGGCCAÍATGCACCA rotsor lObuo LeuAloClySftrGlyS«rGlyHian«tHtsHi_____ fi t_. ttTT7-+■ S-Tag pnmet «69945-3 GGTAFCAAAGAAACCGC :CC rGC"AAA T TCGAACGCCAGCACATCGACA-GCCCAGAICTGCGTACCCACGACCACGACAA Gl yBe-tLyaC I uThrAI aft IoA I gLysPheCluArqGInHiatetAspSarProAspLcuG I yThrAspAcpAipAspLy pET-32ariiiWin (Nco\ Xho\) 15S-217 Ills-Tag coding sequence 140-157 T7 trrmlrutor 26-72 /or/r odtng sequence 1171 2250 pBR322 origin 3684 Mi odingseq....... 4445 5302 ri origin 5434 5889 Thr nupi (or pFT 32b(») and pKT 32c<*) are thr same as pKT 32a(») (shown) with the following exceptions prT 32b(«) H a iM'f II.|i pLiMtikl uihtrait Hip ftom earh site beyond Rinii 1 at 198 pKT 32c(<) tea 5901 bp plasm Id add lbp lo each site beyond /U/H»l I at 198except rot /11>\< V. nhk h iul% at 209 promotor i f am11Cftl(. !/ pfomoM CCCA'A'CGCá'CC á o:i«a*'ti(/- Klonovací místo ^ Gen pro rezistenci k antibiotiku (ampicilin) ' la AtcLrtU* L r««>roC luArgLplLauaW'T 'pL »«-1 o/'t>L t».S«»< AI pET-J2a-c(«) cloning/expression rogiofi Operátor - vazebné místo pro represor Ribozom-vazebné místo Fúzní/purifikační značky/kotvy -►Transkripční terminátor Struktura vektoru pro účinnou expresi rekombinantních proteinů v E.coli pET-32a(+) sequence landmarks T7 promoter 764 780 T7 transcription start 763 Trx'Tag coding sequence 366-692 His*Tag coding sequence 327-344 S'Tag coding sequence 249-293 Multiple cloning sites (Nco\-Xho\) 158-217 His*Tag coding sequence 140-157 T7 terminator 26 72 lad coding sequence 1171-2250 pBR322 origin 3684 bis coding sequence 4445-5302 fl origin 5434-5889 The maps for pET-32b(+) and pET-32c(+) are the same as pET-32a(+) (shown) with the following exceptions: pET-32b(+) is a 5899bp plasmid; subtract lbp from each site beyond BamH I at 198. pET-32c(+) is a 5901bp plasmid; add lbp to each site beyond Bamii I at 198 except for EaM V. which cuts at 209. Ava 1(156) Xho Id58) Eag 1)166) Not 1(166) Hind III - : Sal 1(179) Sac In90) E CO R 1(192) BamH 1(198) EcoR V(2Q6> NCO 1(212) promotor i T7 promoter . loc operator TAA TAT Í1AC írAHtATAÍ Bsa 1(45761 J Eam11051(4357« Operátor - vazebné místo pro represor lOSoo S-1„.i CTGGCCGGTTCTCGTlCTGGCCAIATGCACCATCATCAlCATCAr ICT TCTGG TCTGGTCCC ACGCGGHCT - S-Tag ^#69945-3 -Y Bal II Kpn\ GGTATGAAAGAAACCCdGClCCTAAATICGAACGCCAGCACA7GCACAGCCC AGA ľ C r GGCT ACC G ACCAC G ACGAC AAG G t yNet LysGI ulhrA I aA!aAIaLysPheG luArgGI >tH i s Hot AspSerPr oAspLeuG I y ľhr AspAspAapAsp^s pET-32a(+) Eaol Aval Nco\ ŕccRV SamH I ŕcoR I Sx\ Sa/l H:ná III Not\ Xho\__H«'Tag 1 - -1 ■ r - ■ r > i í. GCCATGGCTGATATCGGATCCGAATTCGAGCTCCCTCGACAAGCTTCCGGCCCCACTCGA A í ofetA (iAso; I eC I ySerG I u P he G i uLsuArgArgG I n AI aCy s CI yArgl h r A r g CACCACCACTGAGATCCGGCTGCTAA roProProLeuArgSsrGIyCy*£nd GCCATGGCGATAtCGGATCCGAATTCGAGCrCCGTCGACAAGCTTGCGGCCGCACTCGAGCACCACCACCACCACCACTGAGATCCGGCrGCTAA pET-32b(+; Al aHet Alal I aSerAspProAanSerSerSor Va I AspLyaLou A l aA t aA 1 cLouC I uH i aH i sH i bH i sH i sHi BĽnd GCCATCGGATATCTGTCGArcCGAATTCGAGC!CCGrCGACAAGCTTGCCGCCGCACrCGAGCACCACCACCACCACCACÍGAGATCCGGCTGCIAA pET-32c(+) A i aľ-et S r y TyrLau r rpl 1 eA'-q 1 e A rqŕ ; gPľoSe ľ 'I* ľ Sc-LelA- qlVoH i sSe-rSai- íhrľhrrhrThrlhrrhf&ŕtillaArgLe^LuLlhľ_ ľ/ terminátor CAAAGCCCGAAAGGAAGCIGACTTEGCrGClGCCACCGCICAGCAATAACrAGCATAACCCCl LysProGluArgLysLeuSerTrpLeuLouProPrDLeuSerAsnAirEnd GGGGCC t C TAAACGCGIC TIGACCGGT7 TT T TG 77 terminator primer #69337-3 pET-32a-c{+) cloning/expression region Vlastnosti promotoru: • Silný promotor (ptač, ptrp, XpL, pT7) - Protein zájmu by měl tvořit 10-30% a více z celkového bakteriálního proteinu. • Přenositelný do různých kmenů E.coli • Jednoduše a levně inducibilní - Teplotní indukce (^pL) - Chemická indukce (ptač, ptrp, pT7): IPTG (isopropyl-P-D-thiogalaktopyranosid) • Vykazuje minimální hladinu bazálni exprese - Pokud jsou proteiny netoxické dosahuje se vysokých výtěžků proteinů růstem buněk do vysokých hustot s následnou indukcí aktivity promotoru. - U toxických proteinů je nutná minimalizace bazálni transkripce před přídavkem indukčního činidla pomocí vhodného represoru. Struktura vektoru pro účinnou expresi rekombinantních proteinů v E.coli pET-32a(+) sequence landmarks T7 promoter 764 780 T7 transcription start 763 Trx'Tag coding sequence 366-692 His*Tag coding sequence 327-344 S'Tag coding sequence 249-293 Multiple cloning sites (Ncol-Xho\) 158-217 His'Tag coding sequence 140-157 T7 terminator 26-72 lad coding sequence 1171-2250 pBR322 origin 3684 bict coding sequence 4445-5302 fl origin 5434-5880 The maps for pET-32b(+) and pET-32c(+) are the same as pET-32a(+) (shown) with the following exceptions: pET-32b(+) is a 5899bp plasmid; subtract lbp from each site beyond ftwnH I at 198. pET-32c(+) is a 5901bp plasmid; add lbp to each site beyond BamU I at 198 except for EcoR V. which cuts at 209. Ava 1(156) Xho 1(156) Eag 14166) Not 1(166) Hind III - ; Sal 11179) Sac 1(196) EcoR 1(192) BamH 1(198) EcoR V(206) Nco 1(212) Bsa 1(4576) J Eam11051(4357« AJwN 1(4036) Bst£ 11(1702) Bmg 1(1730) Apa 1(1732) BssH 11(1932) Hpa l(2D27) BspLUII 1(3622) Sap 1(3506) Bst1107 1(3393) TH1111 1(3367) BspG l(314í) PshA 1(2366) Psp5 11(2628) T7 promoter operator XbS\ TAA TAG ĽAC TCACTATAGGCGAAT TATACATATGAGC 315BD MotSor I05aa GtGAGGGGATAACAAt tCCCCTC TAGAAAtAAttTTGTT _ Msz\_ His-fag S'Taq CTGGCCGGT TCTGGTTC tGGCCAIATGCACC LeuAlaGlvSorGlyScrGlyN.sHetHuH _ „—r,-*■ S-Tag pnmer»69945-3 NSPV_ ftj/IL Kpn' ATCATtCTTCEGGTCTGGIGCCACGCGGttCT sH sSerSer-Gi yLe^Voi P-oAľgC I y5e:- thrombin GGTATGAAAGAAACCCCIGC1GCTAAATICGAACGCCAGCACA7GGACAGCCC AGAľC rGGCIACCGACCACGACGACAAG G t yftet LysG uthrA oA!oAIaLysPheG kiArgG rcHi s Hot AspSerProAspLeuC I y t hr- AspA^pAspAsi^s pET-32a(+) e3sl Aral Heel fopRVBamHI faft I Sjel Sail rrtndlll Not I Xha\__Hra-Tag 1 .-ii'. r > iř.■ -— ■ GCCATGGCIGATATCGGAtCCGAAT TCGAGCTCCCTCGACAAGCT TGCGCCCGCAC TCGA A í atlet AI a Asp I I eC I ySerG luPheGluLouArgArgGlnAlaCysCfyArglhrArg CACCACCACTGAGATCCGCCTGCtAA roProProLeuArgSorGIyCyStnd .GCC AT GGGA T A T C TGTGGATCCGAATTCGAGC'CCGrCGACAAGCTTGCCGCCGCACrC GAGCACC ACC ACC ACC AC C AC I GAG A JC CGGC T GC I AA pt I *32c(+] CAAAGCCCGAAAGGAAGCTGAGTTEGCTGCrGCCACCGClGAGCAATAjf TAGCA LysProG111 ArgLy sLeu SerT rpLeuLeuProP roLeu SerAsnAsf1- ! ,' terminal 01 77 terminator primer #69337-3 pET-32a-c{+) cloning/expression region Ribozom-vazebné místo ^Transkripční terminátor Struktura vektoru pro účinnou expresi rekombinantních proteinů v E.coli ■35 -10 TTGACA (N)i 7 TATAAT mRNA 5' 16S rflNA 3' UAAQQAGG (N)8 HOAUUCCUCC START codon AUG (91%) GUG (8%) UUG (1%) STOP codon UAAU UGA UAG Ribozom-vazebné místo: zahrnuje Shine-Dalgarnova (SD) sekvenci a translační iniciační kodon Vzdálenost mezi SD sekvencí a iniciačním kodonem AUG je 4-13 nukleotidů, tato vzdálenost ovlivňuje účinnost iniciace translace (optimální vzdálenost je 4-8 nukleotidů), oblast bohatá na AT páry. Transkripční terminátor T7 term, rrnTi,T2 (zabraňuje okluzi promotoru, zvyšuje stabilitu mRNA) Výběr hostitelského kmene E.coli Podmínky kultivace Indukce exprese rekombinantního proteinu v hostitelském kmeni E. coli (BL21(DE3)) Výběr hostitelského kmene E.coli s ohledem na toxicitu proteinu pro hostitele • Toxicita není omezena na pouhý fakt, že je protein je pro buňku cizí, ale může být způsobena i tím, že je nadprodukován určitý nativní gen. • Nutná přísná regulace expresního systému Komerčně dostupné bakteriální kmeny s různými úrovněmi regulace exprese, zajišťujícími snížení bazálni exprese. BL21(DE3) BL21(DE3)pLysS/E BL21 Různé úrovně minimalizace bazálni exprese >/BL21(DE3) BL21(DE3)pLysS/E BL21 Cca 10 % hladina bazálni exprese (před indukcí exprese) klonovaného genu. Různé úrovně minimalizace bazálni exprese BL21(DE3) ^BL21(DE3)pLysS/E BL21 • Expresní kmen obsahující plazmidy pLysS nebo pLysE umožňující přísnou regulaci expresního systému využívající T7 promotor. Tyto plazmi dy kódují lysozym, který se váže na T7 RNA polymerasu a inaktivuje ji a snižuje tak bazálni expresi. Cca 1-3% hladina bazálni (před indukcí exprese) exprese klonováného genu. Různé úrovně minimalizace bazálni exprese • Indukce exprese infekcí bakteriofágem CEG (gen pro T7 RNA polymerasu) Nejvyšší úroveň represe!! Využívání kodonu E.coli (codon usage) • Geny u prokaryot a eukaryot se vyznačují nenáhodným využíváním synonymních kodonů. • Kodony málo využívané u E. Coli se mohou hojně vyskytovat u heterologních genů pocházejících z eukaryot, archebakterií aj. • Frekvence využití synonymních kodonů obvykle odráží zastoupení jejich tRNA v cytoplazmě. Escherichia coliK12 [gbbct]: 14 CDS's (5122 codons) fields: [triplet] [frequency: per thousand] ([number]) UUU 19.7( UUC 15.0( UUA 15 . 2 ( UUG 11.9( CUU 11.9( CUC 10.5( CUA 5.3( CUG 4 6.9( AUU 3 0.5( AUC 18.2( AUA 3.7( AUG 24.8( GUU 16.8( GUC 11.7( GUA 11.5( GUG 2 6. 4 ( 101) 77) 78) 61) 61) 54) 27) 240) 156) 93) 19) 12 7) 86) 60) 59) 135) ucu ucc UCA UCG 5.7 ( 5.5 ( 7 . 8 ( 8 . 0 ( CCU 8.4( CCC 6.4( CCA 6.6( CCG 2 6.7( ACU 8.0( ACC 22.8( ACA 6.4( ACG 11.5( GCU 10.7( GCC 31.6( GCA 21.1( GCG 38.5( 29) 28) 40) 41) 43) 33) 34) 137) 41) 117) 33) 59) 55) 162) 108) 197) UAU 16.8 UAC 14.6 UAA 1. 8 UAG 0 . 0 CAU 15.8 CAC 13.1 CAA 12 . 1 CAG 27.7 AAU 21.9 AAC 24.4 AAA 33.2 AAG 12.1 GAU 37.9 GAC 2 0.5 GAA 43.7 GAG 18.4 86) 75) 9) 0) 81) 67) 62) 142) 112) 125) 170) 62) UGU 5.9( UGC 8.0( UGA 1.0( UGG 10.7( CGU 21.1( CGC 26. 0 ( CGA 4.3( CGG 4.1( AGU 7.2( AGC 16■6( AGA AGG 1.4 ( 1 -6Í 194) GGU 21.3( 105) GGC 33.4( 224) GGA 9.2( 94) GGG 8.6( 30) 41) 5) 55) 108 ) 133) 22 ) 21) 37 ) 85) 7) 8) 109) 171) 47) 44 ) Coding GC 52.35% 1st letter GC 60.82% 2nd letter GC 40.61% 3rd letter GC 55.62% Arabidopsis thaliana [gbpln]: 80395 CDS's (31098475 codons) fields: [triplet] [frequency: per thousand] ([number]) UUU 21.8(678320) UUC 20.7(642407) UUA 12.7(394867) UUG 2 0.9(649150) CUU 24.1(750114) CUC 16.1(500524) CUA 9.9(307000) CUG 9.8(305822) AUU 21.5(668227) AUC 18.5(576287) AUA 12.6(391867) AUG 24.5(762852) GUU 27.2(847061) GUC 12.8(397008) GUA 9.9(308605) GUG 17.4(539873) UCU 25.2(7 82 818) UCC 11.2(348173) UCA 18.3(568570) UCG 9.3(290158) CCU 18.7(580962) CCC 5.3(165252) CCA 16.1(502101) CCG 8.6(268115) ACU 17.5(544807) ACC 10.3(321640) ACA 15.7(487161) ACG 7.7(240652) GCU 28.3(880808) GCC 10.3(321500) GCA 17.5(543180) GCG 9.0(280804) UAU 14.6(455089) UAC 13.7(427132) UAA 0.9( 29405) UAG 0.5( 16417) CAU 13.8(428694) CAC 8.7(271155) CAA 19.4(604800) CAG 15.2(473809) AAU 22.3(693344) AAC 20.9 (650826) AAA 30.8(957374) AAG 32.7(1016176) GAU 36.6(1139637) GAC 17.2(535668) GAA 34.3(1068012) GAG 32.2(1002594) UGU 10.5(327640) UGC 7.2(222769) UGA 1.2( 36260) UGG 12.5(388049) CGU CGC CGA CGG 9.0(280392) 3.8(117543) 6.3(195736) 4.9(151572) AGU 14.0(435738) AGC 11.3(352568) \GA 19. 0 (51)9788) AGG 11 ■ 0 ( Í40922) GGU 22.2(689891) GGC 9.2(284681) GGA 24.2(751489) GGG 10.2(316620) Coding GC 44.59% 1st letter GC 50.84% 2nd letter GC 40.54% 3rd letter GC 42.38% http://www.kazusa.or.ip/codon/ Málo preferované kodony u E.coli Codon(s) Amino acid AGA, AGG. CGA. CGG..............................................................Are UGU UGC.....................................................................................Cvs GGA.GGG.....................................................................................GÍv AUA.................................................................................................11c CUA, CUC......................................................................................Leu CCC. CCU. CCA............................................................................Pro UCA, AGU.UCG. UCC..............................................................Ser ACA.................................................................................................Thr Makrides, 1996 Exprese heterologní genů obsahujících málo preferované kodony vede k translačním chybách ! • Předčasné ukončení translace (zkrácený produkt) • Posunutí čtecího rámce (posun až o 2 AK v místě kodonu AGA) • Záměna aminokyseliny - často arginin (kodon AGA) za lyzin Výběr hostitelského kmene E.coli • Pro produkci genů obsahující velké množství kodonů, které jsou málo využívané E.coli, je možné použít komerčně dodávané kmeny, které produkují tRNA málo užívaných kodonů. ^lasmidy komplementující tRNA. •BL21 (DE3) CodonPlus-RIL •AGG/AGA (argmme,R), AUA (isoleucine, I) and CUA (leucine, L) •BL21 (DE3) CodonPlus-RP •AGG/AGA (argmme, R) and CCC (proline, P) •Rosetta or Rosetta (DE3) •AGG/AGA (argmme, R), CGG (arginine, R), AUA (isoleucine, I) CUA (leucine, L)CCC (proline), and GGA (glycine, G) NEBO: Místně řízená mutageneze - záměna málo využívaného kodonu nebo syntéza optimalizovaného genu (optimalizace pro produkci v jednom nebo více organismů s ohledem na stabilitu RNA a vznik sekundárních struktur) Degradace proteinu Bakteriální proteolytický systém: - E. coli obsahuje velké množství proteas, nejvíce v cytoplazmě - Selektivně odstraňuje „abnormální" proteiny: • Nekompletní polypeptidy • Proteiny se zaměněnými AK • Nadměrně syntetizované podjednotky multimerních proteinů • Proteiny poškozené oxidací nebo volnými radikály • Cizí, rekombinantní proteiny (problémem jsou proteiny < 8 kDa) Aminokyseliny redukující stabilitu heterologního proteinu 1. N-koncové pravidlo • Stabilita proteinu je ovlivněna aminokyselinou, která následuje první aminokyselinu polypeptidového řetězce (methionin). • Aminokyseliny na této pozici redukují stabilitu proteinu: Arg, Lys, Leu, Phe, Tyr a Trp • Poločas rozpadu proteinu pouze 2 min 2. Lysin ve vnitřní sekvenci poblíž N-konce proteinu • Degradace ubiqutin-dependentními proteasami 3. PEST hypotéza • Oblasti bohaté na Pro (P), Glu (E), Ser (S), Thr (T) • Po fosforylaci PEST degradace proteinu Ca-dependentními proteasami Výběr hostitelského kmene E.coli Kmeny deficientní na proteasy • Mutace, eliminující produkci proteas a tím proteolytickou degradaci rekombinantních proteinů. Expresní kmeny BL21 jsou deficientní na: cytoplazmatickou proteasu Ion periplazmatickou proteasu ompT Cílená exprese proteinu Cytoplazmatická exprese Periplazmatická exprese Extracelulární exprese (do kultivačního média) Cytoplasm Cell wall Cytoplasmic membrane Cytoplazmatická exprese • Preferovaný způsob Výhody • Vysoký výtěžek proteinu • Jednodušší plazmidové konstrukty • Inkluzní tělíska Nevýhody • Inkluzní tělíska • Redukční prostředí • Proteolýza • Více komplexní purifikace Inkluzní tělíska Nerozpustné shluky (cca 2um3) složené z nativních proteinů s nízkou rozpustností, z nesložených nebo z částečně poskládaných proteinů Co způsobuje jejich tvorbu? 1. Prostředí v E.coli se liší od přirozeného prostředí ve smyslu redoxního potenciálu (redukující prostředí v cytoplazmě E.coli), pH, osmolarity, absence chaperonů, kofaktorů, absence post-translačních modifikací 2. Vysoká hladina exprimovaných proteinů - exponované hydrofóbní domény nesbalených polypeptidových řetězců navzájem Rozpustný protein Inkluzní tělíska - nerozpustný protein Inkluzní tělíska Výhody • Snadná izolace ve vysoké čistotě a koncentraci • Ochrana před proteasami • Pro produkci proteinů, jejichž aktivita je pro buňku letální Nevýhody • Proteinová nerozpustnost • Refolding pro opětné získání biologické aktivity • Refolding nemusí vést k zaktivování proteinu • Redukce výtěžku proteinu Možnosti minimalizace tvorby inkluzních tělísek Izolace a následný Inkluzní tělíska Možnosti modifikace expresních podmínek: • Snížení teploty kultivace bakteriální kultury • Koprodukce chaperonů • Použití fúzního partnera zlepšujícího rozpustnost (thioredoxin, GST, MBP, NusA,.....) • Výběr bakteriálního hostitele, např. kmene deficientního na thioredoxin reduktasu • a další.... Možnosti minimalizace tvorby inkluzních tělísek Výběr hostitelského kmene E.coli • Pokud protein obsahuje jeden nebo více disulfidických vazeb, správné poskládání proteinu je stimulováno v hostiteli s více oxidujícím prostředí cytoplazmy. •AD494 • Mutace v genu pro thioredoxinreduktasu (trxB) •Origami • Mutace v genech pro thioredoxin reduktasu (trxB) and glutathionreduktasu (gor) Periplazmatická exprese • Periplazma obsahuje jen 4% všech buněčných proteinů (cca 100 proteinů) • Transmembránový transport je zprostředkován signálním peptidem na N-konci proteinu • Prokaryotické signální peptidy úspěšně použité v E.coli (ompA, ompT z E.coli, protein A z S. Aureus, endoglukanasa z B.subtilis) Výhody • Jednodušší purifikace • Není zde tak rozsáhlá proteolýza • Zlepšení tvorby disulfidických můstků/foldingu Nevýhody • Signální peptid nezajistí vždy transport do periplazmy • Mohou se také tvořit inkluzní tělíska Extracelulární exprese • Sekrece proteinů do kultivačního média • Chybí účinná cesta pro transport skrz vnější membránu (E.coli sekretuje velmi málo proteinů). • Některé proteiny sekretované do periplazmy pasivně difundují do média. • Zatím spíše neúspěšná manipulace s různými transportními cestami, které by usnadňovaly sekreci cizího proteinu. Výhody • Minimální kontaminace ostatními proteiny (jednodušší purifíkace) • Nej menší hladina proteolýzy • Zlepšení foldingu Nevýhody • Často velmi nízká sekrece • Hodně zředěný protein Modifikace růstových podmínek Vektor Hostitelský kmen Podmínky kultivace Podmínky kultivace Možnosti modifikace podmínek kultivace bakteriální kultury E.coli za účelem zvýšení produkce rozpustného proteinu: Experimentálně se testuje: • hodnota hustoty (OD) buněčné kultury • Složení kultivačního média (pH, přídavek specifických substrátů, kofaktorů, složení živin-bohaté či minimální média) • teplota růstu bakterií, zejména teplota při indukci exprese • koncentrace indukčního činidla • délka indukce exprese Experimentální postup pro testování exprese Overnight culture in LB medium, 3 mL Inoculate 800 uL into each flask containing 20 mL of TB medium. AA / pH 6 \ / pH 7 \ Agitate at 37 °C until OD60O = 0.6-0.8. Sample 1 mL of non-induced culture from each flask, spin down, remove the supernatant and store the pellet at -20 °C. Induce protein expression with IPTG (20 uL of 1 M IPTG). pH pH Split the content of each flask into 4 bacterial tubes (4 mL per tube) and grow them at different temperatures/times. pH pH 8 B 6 Q WWW 18 °C overnight w 8 Q w 7 B 8 8 W w 28 °C overnight W W w 37 °C 3h W W 22 °C overnight Sample 1 mL from each tube and place separately in TissueLyser adapter according to the scheme in Table 2. Centrifuge at 3220 x g at 4 °C for 2 minutes, remove supernatant with aspirator. A. Smitkowska et al, 2020 Příklad výsledku testování exprese Strain 1: Rosetta 2: Strain 2: ER2566 Mw strain 1 (kDa) NI6 28 29 30 T29 31 32 33 T32 34 35 36 T35 72 55 . ▲ A Mw Strain 2 (kDa) NI6 28 29 30 T29 31 32 33 T32 34 35 36 T35 95 — 72 55 43 A A Strain 1 Strain 2 28 29 30 28 29 30 E. coli ER2566, TB medium pH 6.0, 3 h induction at 37°C, lysis buffer: MES pH 6.0 (28) or Tris-HCl pH 7.5 (29) A. Smitkowska et al, 2020 Testování exprese AHP proteinů v E. coli -optimalizace teploty kultivace Médium: LB médium, bakteriální kmen BL21(DE3)pLysS Růst (OD600-0.5-0.6) Indukce 0,4 mMIPTG/3hodiny Procenta produkce AHP proteinů v rozpustné formě t(°C) Růst/indukce AHP1 AHP2 AHP3 AHP4 AHP5 AHP6 37°C/28°C 8% 85% 100% 0 76% 0 37°C/22°C 82 % 73% 100% 0 81 % 51 % 22°C/22°C 71 % 78% 100% 30% 81 % 73% Celková produkce I _ . Rozpustná forma Produkce heterologních proteinů v kvasinkách VÝHODY: • snadné genové manipulace • rychlý růst do vysokých hustot (fermentor), nízká cena • schopnost posttranslačně modifikovat tvořený produkt • schopnost extracelulárně sekreto vat tvořený produkt • schopnost tvořit správnou konformaci proteinu • konečný produkt bez kontaminace endotoxiny NEVÝHODY: • používají strukturně odlišný typ N-oligosacharidů než savci • hyperglykozylace Kvasinkový expresní systém - Sacharomyces cerevisiae - Pichia pastoris - Sacharomyces cerevisiae -první kvasinkový systém použitý pro produkci rekombinantních proteinů - R pastoris nej využívanější kvasinkový expresní systém - R pastoris - schopnost kultivace do vysokých hustot (S. cerevisiae produkuje velké množství sekundárních metabolitů, které limitují dosáhnutí vysoké buněčné hustoty) - Od S. cerevisiae se liší typem N- glykosylace: glykany u R pastoris obsahují je 8-17 molekul manózy (spojené vazbou a 1,2), zatímco O-linked glycans W-línked glycans glykany S. cerevisiae obsahují 50-150 molekul manózy (tzv. hyperglykozylace, terminálni B manózy spojené vazbou a 1,3 ) O-linked glycans N-linked glycans Struktura vektoru pro účinnou expresi v R pastoris (7848) Aňtll Alel (76) Fro53kI (2061 Sad (7 n H) Pinel (413) Hlpl (•-»») Nsi] ((,//; Xtinl [706) 11,1111111 (938) (6033) AfIIII Pcil (5917) l)s|i(Jl Sa|]| (5856) PtdfeJ CíBOÍ,) Bsl/ I /I (5780) »'III I I tlil 1 1 I Psil (1144) Aval BsoBI PaeP.71 Brad 1101 (1193) SnaBI (1218) I culil (1777) Avrll (172B) layl Null Acji-1 (1300) lltii/I (1754) ls|iAI (IK7(i) xbal (2032) HŠU36I (2088) lípal (2138) (4783) Sph (4627) SgrAI (462:::) Nael (461S) NqoMlV (4483) BfllAl BspMI (4?<)8) f)sr( Sali (3177) Slul (3262) Dr.iIIl (3t,74j Wiol (3633) lls|il I (3844) - transformace se provádí pomocí integrujících se vektorů (vektory replikující se po integraci do chromozomu) Promotory: Inducibilní Promotor genu pro alkohol oxidázu 1 (AOX1) - silný a striktně regulovaný - je plně potlačen při růstu na glukóze či glycerolu a silně indukován při růstu na methanolu jako samotném zdroji uhlíku -20-30 % celkového intracelulárního proteinu Konstitutivní Promotor genu pro glyceraldehyd-3 - fosfát dehydrogenasu (GAP) - konstitutivně exprimovaný a je nejvíce indukován při růstu na glukose Selekční markery: Auxotrofní HIS4 Komplementace auxotrofní mutace His - selekce v kvasinkách Rezistence vůči antibiotikům Ampicillin - pro selekci v bakteriích Sekreční signály PHOl (acid Phosphatase) z P. pastoris a-mating faktor (a-MF) z S. cerevisiae SUC2 (invertase) z S. cerevisiae Exprese rekombinantních protein v Pichiapasíoris Klonování genu do vektoru, selekce konstruktu v E.coli, izolace DNA konstruktu Linearizace konstruktu Transformace kompetentních buněk P. pastoris Not\ MCS Tadhi Marker \ Not I digestion •XL Transformation of yeast MCS Taiíh Marker arg1+, /?Va3*, ortysl* lysí argl hls3 lysí -í Marker insertion -|MCS|Taphí[ I -*■ Selekce transformantů Exprese rekombinantního proteinu Sekrece proteinů u kvasinek Intracelulární exprese nebo sekrece O Secreted £coo- protein Kluyveromyces lactls Sekreční dráha je velmi podobná dráze vyšších eukaryot N-terminální peptid pro kotranslační translokaci sekreto váného proteinu do ER je odštěpen signální peptidázou. Příklady signálních sekvencí: Pho5, Suc2 a a-mating factor Sekrece pomocí a- mating faktoru Protein je společně se signálním peptidem - a-MF (a-mating factor) doménou exprimován v jádře. 1. Signální peptid v a-MF doméně navede protein do ER, kde je odštěpen signální peptidázou. 2. Fúzní protein je transportován do Golgiho aparátu, kde Kex proteáza štěpí zbytek a-MF domény a protein je sekretován do média. Odlišnost glykosylace v P. pastoris vysoký obsah manózy je imunogenní pro člověka pro produkce terapeutických proteinů byly vytvořeny P. pastoris (např. kmen SuperMan5 a další) s uniformním lidským způsobem N-glykozylace dodatečné enzymy: manosidáza I a II, transferáza galaktózy, N-acetylglukosaminů a kyseliny sialové rozšíření použití P. pastoris např. pro expresi protilátek ER (human, P. pastoris) f er [P, pastoris, Aalg3, Aochl) Golqi (human) Mri; ' - IB and ic Golgi pastoris) m. GkNAcManí Hnili ■ N" "i V* rHAcS U CltNAtMLui} GaíT ■ ■4 J Sd7G.i17akHAi7M.iEi3 QffftfMj MnT (Ocnlp) ■ í ■ 1.2 M ■ . 1.G HfiTi m ... ■ • [V 1 ,N-i iritfr Bakulovirový expresní systém - založený na infekci kultivovaných hmyzích buněk rekombinantním virem AcMNPV (Autographa californica multiple nuclear polyhedrosis virus) nesoucím gen pro tvorbu cílového proteinu. Polyhedron Wild-type AcNPV (Autographs cshtomicé nucleopotytiedrovirus) Polyhedra Budding / Virions y*.-- Polyhedrin ' *1 / \ A ^acnpv' Insect cell (to w| Foreign geneV.^ Transler öt interest Jveclor Homologous recombination AcNPV DNA O O O O O O O Budding Cultured insect cells (SB etc.) Inlection • Recombinant _ ! ■.'i ot recombinant bacĽlovirus Insect cell [in vitro) hostitelské hmyzí buňky - ovariální buňky motýlů druhu Spodoptera frugiperda (Sf9, Sf-21) bakulovirový vektor (tzv. bakmid) - velký, kyvadlový vektor (AcMNPV) - obsahuje všechny geny nezbytné k produkci virových částic • velmi silný promotor polyhedrinového genu (polyh) Bac-to-Bac expresní systém : „from Bacterium to Baculovirus" PFaetBac donor plasmid i Gene of Interest Recombinant Donor Plasmid transformace -► Determine viral titer via plaque assay boooooooooooooa 0-1 Competent DHIOBac E.coli Cells Recombinant virus particles 1f ft místně specifická transpozice Infection of insect ceils looooooooooooood Selekce pomocí antibiotik Transfekce hmyzích buněk pPclh E cali (iac7~) Containing Recombinant Bacmid Izolace rekombinantního bakmidu R a cd m bi n ant Bacmid DNA Expression verification & Virus amplification Virus stock Po úspěšné transfekci, rekombinantní virové částice jsou získány z média (virový zásobní stock) a mohou být amplifikovány do vyšších množství, aby mohly být použity pro infekci dostatečného množství buněk. Bac-to-Bac expresní systém: „from Bacterium to Baculovirus" Expression evaluation - + Amplification sf9 cells Amplification sf9 cells PI P2 P3 Po dvou generacích je dosaženo titru 106 - 108pfu/ml Worst Best