Základy proteomiky 2009 Proč právě proteomika? Jan Hejátk o & Mí 3 í Proteomika 2007 Základy proteomiky 2007 Schéma přednášek ze Základů proteomikv 2007 1. blok, 20. 3. 2009 Proč právě proteomika? (Jan Hejátko) Exprese a purifikace rekombinantních proteinů (Radka Fohlerová) 2. blok, 27. 3. 2009 Funkce proteinů (Lubomír Janda) Určování třírozměrných proteinových struktur metodami proteinové krystalografie Marek) 3. blok, 3. 4. 2009 Metody separace proteinů (Hana Konečná) Hmotnostní spektrometrie proteinů (Zbyněk Zdráhal) (Jaromír ŕ/ m I — Proteomika 2007 ■ Základy proteomiky 2007 Proč právě proteomika? Postgenomová éra a co s informacemi, které neumíme číst Genotyp vs. fenotyp, aneb co všechno se děje při vyjadřování Od genu k proteinu a zpět Přístupy současné proteomiky exprese, purifikace a analýza rekombinantních proteinů analýza vztahu mezi strukturou a funkcí proteinů diferenční proteomika analýza posttranslačních modifikací Proteomika 2007 Základy proteomiky 2007 Proč právě proteomika? PROTEOME = PROTEins expressed by genOME (konference 2-D ELFO, Siena, 1994) DNA: GENOME, HAPLOME, EPIGENOME RNA: TRANSCRIPTOME ORFEOME, PROTEOME, LOCALISOME, INTERACTOME, METABOLOME, PHENOME, ... PHENOME: kombinace různých dat, zahrnujících fenotyp, expresní data různých (ideálně všech) genů daného organismu a proteinová data (interakce, jednotlivé vlastnosti proteinů, ...) Proč vůbec studovat proteiny, když máme tolik genetických dat? (sekvence genomů, expresní profily genů, fenotypy mutantů,...?) Proteomika 2007 Anotace genů a odhad aminokyselinových sekvencí předpokládaných proteinů dnes k dispozici v databázích více než 700 000 záznamů (nr databáze) různých organizmů Získané informace lze zpracovat Proteomika 2007 pomocí bioinformatiky Mammals Birds Insects Flatworms Amphibians Reptiles 19470700 19470500 19470300 19470100 19469900 19469700 19469500 19469300 19469100 19468900 19468700 19468500 19468300 19468100 19467900 19467700 :agataaaat£ gctccgaggaagaagataatatgaaaagagct zttgcaaaacgtgaai ttcagtggt ttgacgagt ittgcagcagct zacaataagttai itccttggaggat igaattgc ägacagaaatc ätcaaatttataagggatcacgagí tcactcaaatgatggtgaaagttc atgattctacatttctactcatct ttcctggtggttgttttcgagtgc . I.gí; L :. caagtctagtttcggagattgaaaacatcggaaaatt caacaacgacactggttttacagagattcaaa tatataacattaactataattttatgttgttg I { \. { \. I iggttgttaaaactaattacataaattcaattattcttagttattatt itgttgttattattgttcttcagatcgcaccattgttgtttgtagctt :aattgtggtcttt1 ätaattattgtgtgl ätttgtggaccgtgatt äaaaegatcgccgttc .1. :.U. :.L. l.:_L. l.:_L.yc;l iggtaattctgctttc :ccattcatgtatattt äaagaggtcgcttcatt icacaagttt igtagggacggtctcatgtt :tggtcgtcttaacgggaac caagtcgtggagactacacttggtacactcaaaccgtggatcagtt tacagattggttccaagcagcacagagtaataactacactacagcc gttagcttgtacagcaagaaaggtcttgtttctttagggtttccggttaagactttaac acatgtggacaaaggacgggacggtgcttgttcgtgaaggttcactgaatgattctttc ctccctctggtctcaatgcatccctgaaaattgcagttccagtggctacgaggtggagŕ gtttcgggcgttcctctggtaaatactgaaacatatttcactttgatgcagtaaaaatc äcgagcttgggaggagaagatŕ tttgccagagatí :tcatgtttcccaacaaaggaggagcaac atttcttggcttcggttggcctgtatggtttgtgtggtttatgatgcaac gcgacacaacaagctgagagaaagagcatgaacaagagtcaagcatttgc igtcgtgatggagtt äcctggctccgacgtagacac aaggagagagŕ äagtgaatgttt ägattaagataccaagctt äcttgttgtttctcagctt jgaaaaggcaaaatatcač :atatgcgtgcaacgc tgagcaaaatcgaaagcgggaagatgcagttagtggaagaagattt gaagaaaggggttgatgtagttttgg^ aatcttgttagcaatgctgtcaagttc catatcctaaaggtgtgtccaagtttí caatgcaaacacgatggagtttgtgtt :cgcacgatggctcggtt LCttgtcgaaacttcttgaagacgtcatcgatttt :aaattctcgaatgtacgaggggatagtggcagac :accgtcgacgggcacattgcggtaagagcttgggctcagaggccaggttccaatac jtaaagagtatgttctgcaagaataaagaagagtcatcaacctacgagacagaaatč itgaagtggatgatactggtaaagggatacctatggagatgcgtaagtcggtatttc agagaaacagctcaaggacaccaaggaactggtttagggctcgggattgtgcagtctttggtaagctactaaaacagaac :tagatggttttcattt :aattcaatgttttatt icctcgggctgactatí zaggtaagattaatgggaggggagatc zccagtgagtgacatgaaagtgagacaggagatcgaagcaggí :tggaggtagc£ ace ge Postqe ch se které TCAAAGGGTTTCGACTTTGCTCCGAGGAAGAAGATAATATGAAAAGAGCTTTTTAGGGTTTATCATTCT^ AGTTTCCCAAAGCTGAAACGAGGiCTCCTTCTTCTATTATACTTTTCTCGAAAAATCCCAAATAGTAAGAGGAACTGAAACGTTTTGCACTTTACATTCCGTGAAACTAGCAACATGAAACAACGAAAAATATGCATAGCGAAGGATGTT RAF.. - uORF-1 -029311b low-1 lípal EcolCRI Pvul TAAGTTAACAATGCTTCCTCGTAGAATTGCAAAACATTTGTGGACCGTGATTTACATGACTGAGCTCTTTTCAGTGGCTTCTTTGCAGCAGCTTCTTCCTTGGAGGACTAATCAAGACAGAAATCTGTTCCTCTAAAAACGATCGCCGT ATTCAATTGTTACGAAGGAGCATCTTAACGTTTTGTAAACACCTGGlCACTAAATGTACTGACTCGAGAAAAGTCACCGAAGlAAACGTCGTCGAAGAAGGAACCTCCTGATTAGTTCTGTCTTTAGACAAGGAGATTTTTGCTAGCGlGCA - exon 3 - Psil ^ss ssSI ^sel pindlll TCTAGGTAATCTTGCCATTCTTGACGAGTCTTGATCTTTAGAATCAAATTTATAAGGGATCACGAGATACACGTATTAATTATTATTTTTTTTTTTTTTGCTTTTTGTGGTTATACAAGTTCACTCAAATGATGGTGAAAGTTACAAAG AGATCCATTAGAACGGTAAGAACTGCTCAGAACTAGAAATCTTAGTTTAAATATTCCCTAGTGCTCT^ . M M V K V T K imgBI Mfel CTTGTGGCTTCACGTCCAATTGTGGTCTTTTGCGTCCTGGTAATTCTGCTTTCTTTCTTCTAAATTATACGATGATTCTACATTTCTACTCATCTCGTTCTTGTTTTTCAAATGATATAATTATTGTGTGTATATCACCCATTCATGTA GAACACCGAAGTGCAGGTTAACACCAGAAAACGCAGGACCATTAAGACGAAAGAAAGAAGATTTAATATGCTACTAAGATGTAAAGATGAGTAGAGCAAGAACAAAAAGTTTACTATATTAATAACACACATATAGTGGGTAAGTACAT Proteomika 2007 ■XckJ A S R P [ V V F C V L Základy proteomiky 2007 Proč právě proteomika? Postgenomová éra a co s informacemi, které neumíme číst Genotyp vs. fenotyp, aneb co všechno se děje při vyjadřování Genotyp vs. fenotyp, aneb co všechno se děje při vyjadřování ■ Genom vs. Proteom Danaus plexippus (monarch) Genotyp vs. fenotyp, aneb co všechno se děje při vyjadřování Možná analoqie s textem a jeho interpretací DNA: Kdyžadoperbtabijsemdfjfwůcsakndůsnínjxldalnxckjcnbychcxmasizdciksrdce Když----------------jsem---------smdal—rí-----dal----------byeh-si-gndfcsB-.----na-----dlaň. RNA: Když jsem s ní, dal bych si srdce na dlaň. Když jsem s ní, daláojp^BSBrtdeanaadfcBäň. Když jsem snídal srdce. PROTEIN: Základy proteomiky 2007 Proč právě proteomika? Postgenomová éra a co s informacemi, které neumíme číst Genotyp vs. fenotyp, aneb co všechno se děje při vyjadřování Od genu k proteinu a zpět Základní mechanismy regulace genové exprese struktura genů ■ struktura genů promotor počátek transkripce 5'UTR JE Bpml ! 1 pti rm1 i ■ i ■ i ■ i pra11 ■ i ■ i mrainas/ PflMI Asel GX30SÄTTÄlAAAGITGirffinG I \A AnATVATVAAir^AIV Psil ■ I.........I' ■ I.........I- +++ ■I.........I' _________w PDR U13/PDR LI GACGCTTAATGTTTI X3GTCCTTCCAATCATCAACAGAGGATTGATCAAAACTAGTTTCAAAATATGGAAGTTCACACGA L F F — m wt pisl 500 bp 400 bp mechanizmů pro asného stopkodc jTflSeTatčrra, Singh - SOU bp - ^-00 bp - 300 bp i i K p G : JCCAGGAAGGTTAGTAGTTG- . =>5Ü-55nt Active NMD complex Y _ I K V L -no splicing — ■ 300 bp ATAAGAAGAACGAC. | — 200 bp TAAAAAAACGACGTCGACACACTTCAAACATGGAAAAG 200 bp 100 bp Pstl J |Pvull IT TT TTT TG CTGCAGCTGT GTGAAGTTTG TAC CT TTT C 100 bp ProteomikWWF Z 14 7 pisl intron 1653 - EXON 4 L TLLLG PPS CG KT ILL KALSGN L E N N LK -PDR exon 4 ORF - PDR_L1 Základní mechanismy regulace genové exprese přeskupování subgenů při produkci protilátek Přeskupování subgenů jako specificky mechanismus při produkci protilátek protilátky variabilní oblast (V) a konstantní oblast (C) a lehký (L) a těžký (H) řetězec každá z V oblastí L řetězce u myší je kódována 2 subgeny (V a J) každá z V oblastí H řetězce u myší je kódována 3 subgeny (V, J a D) v zárodečných liniích myších B-lymfocytů dochází k tzv. kombinatorické diversifikaci (přeskupování) subgenů (místně-specifickou rekombinací) L řetězec (k): cca 300 V sub-genů a 4 J subgeny (300 x 4 = 1200 možností) H řetězec: cca 500 V sub-genů, 4 J subgeny a 12 D subgenů (500 x 4 x 12 = 24000 možností) celkové množství kombinací u myší: ( 24000 = 28 mil. různých V oblastí rozpoznávající různé antigeny) antigen indukuje tzv. mechanismem somatické hypermutace myší: cca 1200 x oblastí (protilátek dozrávání Proteomika 2007 po aktivaci B-lymf. pomocnými T-lymf. dochází ke zvýšenému výskytu mutací ve V oblastech (1 mutace/V oblast/generaci, cca 1 mil. X vyšší než je obvyklé (např. u tzv. „house-keeping" genů) a selekci protilátek se zvýšenou afinitou k antigenu Od genu k proteinu a zpět Základní mechanismy regulace genové exprese regulace transkripce sestřih RNA translační represe Regulace genové exprese mechanismem translační represe • Funkční význam sestřihu v nepřekládaných oblastech - důležitá regulační součást genů B ©KRAF ATGatggtgaaagttaca.... V případě CKI1 pokus prokázat tento způsob regulace genové exprese pomocí transgenních linií nesoucích u id A pod kontrolou dvou verzí promotoru, zatím nepotvrzeno *G M M V K V T... ATGatggtgaaagttaca.... M , M V K V% ... ATGatggtgaaagttaca.... Proteomika 2007 Od genu k proteinu a zpět Základní mechanismy regulace genové exprese regulace transkripce Sestřih RNA translační represe posttranskripční umlčování mechanizmem siRNA m H Ig Foreign DNA (naked! Trigger ! Multigene family or repetitive transgene Foreign dsRNA Developmental or experimental transcription Transgene assembty/ DNA/chromatin modification Intermediate Silencer Target nnririiinnii RfTS RTTS Materachramatin formation and transcriptional silencing pre-miRMA AAAA mRNA destruction or translations! repression SI Proteomika 2007 1431 The Nobel Prize in Physiology or Medicine 2006 "for their discovery of RNA interference - gene silencing by double-stranded RNA" USA USA Stanford University School of Medicine University of MassachusettS^lvledic^ltehool Od genu k proteinu a zpět mskripční umlčování mechanizmem siRNA větu u Arabidoosis prostřednictvím miRNA ednotlivých květních orgánů DX ni geny dochází k tzv. katastrálním genu inhibuje expresi dalšího B3j E Ba aktivní v celém květním meristému, po /AG inhibuje expresi ve vnitřních dvou 53 /AP2 je rel Pi miRNA 172) I líí m in situ lokalizace miRNA172 v 3. a 4. kruhu Od genu k proteinu a zpět Základní mechanismy regulace genové exprese regulace transkripce Sestřih RNA translační represe posttranskripční umlčování mechanizmem siRNA směřování proteinů Od genu k proteinu a zpět směřování (cílování) proteinů ■ Intracelulární lokalizace proteinů v rostlinných buňkách dochází k velice dynamickým procesům, zprostředkovávaným zejména tzv. endomembránovým transportem (viz film, GFP směřované do ER) CV, central vacuole; DV, < GA, Golgi apparatus; LV, accumulating compartmen reticulum; PSV, proteir compartment; SV, secretor Proteomika 2007 Od genu k proteinu a zpět směřování (cílování) proteinů Cyklování auxinových přenašečů u Arabidopsis auxin je rostlinný hormon se silným morfogenním účinkem proteiny podílející se na transportu proteinů jsou tzv. PIN proteiny, polárně lokalizované v bunňkách kořene u Arabidopsis PIN proteiny cyklují v endomembránovém systému rostlinné buňky v přítomnosti en^H^^^^^^^^^^^H^^H^IC těchto proteinů v intr I ... .čímž je zároveň n 2~ l I c V i* Proteomika 2007 Od genu k proteinu a zpět Základní mechanismy requlace qenové exprese regulace transkripce sestřih RNA translační represe posttranskripční umlčování mechanizmem siRNA směřování proteinů posttranslační modifikace proteinů Od genu k proteinu a zpět postranslační modifikace proteinů Význam posttranslačních modifikací proteinů regulace enzymové aktivity regulace interakcí proteinu s dalšími proteiny nebo jinými biomolekulami lokalizace proteinu v buňce změna mechanických vlastností proteinu prenos signálu Od genu k proteinu a zpět postranslační modifikace proteinů váíaMí osttranslačních modifikací proteinů karboxylace prenylac Mí 5\¥ íaPYKUNIVER Proteomika 2007 ictvfm fosforvlace BSHB Proteomika 2007 CYTOKININ AS MA ME MB RAN 0CM5Q ■ (>l4ikinlH l i GPP 1 # • ma a. VVT J^l «S« *55L JfiSS CKI1 CKI1H"05Q CKI1D1050N AHPs CYTOPLASM CKI1/CKI1H406Q /CKI1D1050N CHASE Kinase Receiver GARP domain domain domain domain Current Opin ion in Plant Biology I Od genu k proteinu a zpět postranslační modifikace proteinů Přenos siqnálu a regulace qenové exprese prostřednictvím fosforvlace přenos signálu prostřednictvím TGFß (Transforming Growth Factor) u živočichů Základy proteomiky 2007 Proč právě proteomika? Postgenomová éra a co s informacemi, které neumíme číst Genotyp vs. fenotyp, aneb co všechno se děje při vyjadřování Od genu k proteinu a zpět Přístupy současné proteomiky exprese, purifikace a analýza rekombinantních proteinů 0 Kwiii»]iifg»iiwiB»]i[»iEnii gene 1 0 RBSi r£BP P T7/lacOi. / rMCS Calmodulin 45.0 50.0 55.0 60.0 65.0 70.0 Hi Load 16 60 Superdex75 prep grade 23 10 06001:10_UV@01,PEAK Beg I sgl Ecd57I gtgg " tcagcgtgtccggcgagggcgagggcgatgccacctacggcaagctgaccctgaagttcatctgcaccacgggnagctgcccgtg I........- i.........i.........I.........I.........I.........I.........i.........i..... 705 | Iagtcgcacaggccgctcccgctcccgctacggtggatgccgttcgactgggacttcaagtagacgtggtgcccntcgacgggcac tgvvp I lve _ D g i v n g - k f S v s g e gegda tygkl t l < f [ cttg. -GFP-1 Základy proteomiky 2007 Proč právě proteomika? Postgenomová éra a co s informacemi, které neumíme číst Genotyp vs. fenotyp, aneb co všechno se děje při vyjadřování Od genu k proteinu a zpět Přístupy současné proteomiky exprese, purifikace a analýza rekombinantních proteinů analýza vztahu mezi strukturou a funkcí proteinů Přístupy současné proteomiky analýza vztahu mezi strukturou a funkcí proteinů Analýza vztahu mezi funkcí a strukturou proteinu využívá technologie produkce rekombinantních proteinů a místně řízené mutageneze umožňuje analyzovat strukturu rekombinantního proteinu pomocí rentgenové krystalografie nebo N M R kopmparativní analýzou lze pak analyzovat strukturu a funkci jak u strandardního typu tak i mutantního proteinu 0- Proteomika 2007 Základy proteomiky 2007 Proč právě proteomika? Postgenomová éra a co s informacemi, které neumíme číst Genotyp vs. fenotyp, aneb co všechno se děje při vyjadřování Od genu k proteinu a zpět Přístupy současné proteomiky exprese, purifikace a analýza rekombinantních proteinů analýza vztahu mezi strukturou a funkcí proteinů diferenční proteomika Přístupy současné proteomiky komparativní proteomika Analýza změn proteomu organismu na různé stimul využívá technologií vícerozměrné separace proteinů (nejčastěji ELFO nebo LC) umožňuje analyzovat mnoho proteinů najednou pomocí analýzy obrazu lze odhadnout proteiny se změnou vlastností, příp. kvantity za daných sledovaných podmínek (mutace, vývojové stadium, fyziologická odpověď) Zvýšená hladina endogenních CK ŕ/ Proteomika 2007 wiid-type pOp-iptILhGR pOp-iptILhGR line 11 fine 13 Spot % Vol Relative Abundance Accession No. Protein Name MALDI-MS Score %Cov LC-MSMS Score %Cov MM [kDa] 123 20 28.1 5.0 - - 48.5 5.0 - - 52.9 5.9 130 16 19.7 6.0 92 11 29.1 6.9 393 32 33.3 5.1 40 5 33.4 6.2 86 7 38.7 5.4 217 10 63.3 5.6 388 33 42.8 8.2 236 28 45.8 8.4 59 4 30.5 8.9 90 9 36.2 6.9 142 10 26.5 9.5 213 18 44.7 7.5 1105 2203 2310 2402 2801 4503 5204 7009 7401 7606 7701 8202 8302 8605 8803 3.55 S47970 14-3-3 protein homolog RCI2 < 0.01 BAB01146 AP000373 NID Qasmonate iducible, myrosinase-like) < 0.01 BAA84393 AP000423 NID (RuBisCO large subunit) 3.40 Q8LBJ7 50S ribosomal protein L12-C 2.50 AAG51430 AC008153 NID (2-cys peroxiredoxin BAS1, chloroplast [Precursor]) > 100 Q9SUI9 ATP synthase gamma chain, chloroplast < 0.01 E71425 Hypothetical protein (putative epoxide hydrolase) < 0.01 T05413 cinnamyl-alcohol dehydrogenase (EC 1.1.1.195) F28A23.10 < 0.01 Q9LJE4 GloEL protein, chaperonin, 60 kDa > 100 F86262 F13K23.15 protein (glyceraldehyde-3-phosphate dh) 0.37 AAM20572 AY099721 NID (Cysteine synthase, mitochondrial [Precursor]) > 100 AAL36245 AY063889 NID (50S ribosomal protein L4, chloroplast [Precursor]) 2.69 H84808 probable annexin >100 Q941D3 At5g19940/F28l16_90 (Hypothetical protein) 0.42 T47470 isovaleryl-CoA dehydrogenase 97 116 87 131 81 128 725 26 29 29 23 26 63 11 Proteomika 2007 pi Základy proteomiky 2007 Proč právě proteomika? Postgenomová éra a co s informacemi, které neumíme číst Genotyp vs. fenotyp, aneb co všechno se děje při vyjadřování Od genu k proteinu a zpět Přístupy současné proteomiky exprese, purifikace a analýza rekombinantních proteinů analýza vztahu mezi strukturou a funkcí proteinů ■ diferenční proteomika analýza posttranslačních modifikací Přístupy současné proteomiky analýza posttrranslačních modifikací Analýza posttranslačních modifikací pomocí specifických metod lze identifikovat kotranslační a posttransalční modifikace, buď v gelu nebo po blotování na membránu (barvení spec. barvičkami) identifikace modifikací pomocí MS technik (MALDI TOF, ESI-MS, ...) fosforylace přenos signálu acetylace regulace chromatinových strruktur a transkripční aktivity prostřednictvím regulace vazby histonů glykosylace velice heterogenní (aktivátor plasminogenu 3 místa pro glykosylaci na N-konci, až 11. 520 SYPiR6ERhfrbvi7oforftm^_ Pro-Q Diamond_ mikrohc ruznýcl • makroheteroqenita díky roz^H^^^Hinosti ^^^^^^^^^J^^^^^^^^^^^^^^^^^^^V^ 'X0*e'riU íKUNIVER Proteomika 2007 Základy proteomiky 2007 shrnutí Proč právě proteomika? Postgenomová éra a co s informacemi, které neumíme číst Genotyp vs. fenotyp, aneb co všechno se děje při vyjadřování Od genu k proteinu a zpět Přístupy současné proteomiky exprese, purifikace a analýza rekombinantních proteinů analýza vztahu mezi strukturou a funkcí proteinů diferenční proteomika analýza posttranslačních modifikací Základy proteomiky 2007 zdrojová literatura Zdrojová literatura k první přednášce: Monografie a učebnice Plant Functional Genomics, ed. Erich Grotewold, 2003, Humana Press, Totowa, New Jersey Proteome Research: New Frontiers in Functioonal Genomics, ed. Wilkins, M.R., Wiliams, K.L., Appel, R.D., Hochstrasser, D.F., 1997, Springer-Verlag, Berlin, Heidelberg Dubová J. , Hejátko J., Friml J. (2005) Reproduction of Plants, in Encyclopedia of Molecular Cell Biology and Molecular Medicine (ed, R. A. Meyers), pp. 249 - 295. Wiley-VCH, Weinheim, Germany Publikace v mezinárodních časopisech Wang, L. and Wessler, S.R. (1998) Inefficient reinitiation is responsible for upstream open reading frame-mediated translational repression of the maize R gene. Plant Cell, 10, (1733) Friml, J. and Palme, K. (2002) Polar auxin transport. Old questions and new concepts?. Plant Mol. Biol., 49, 273284 Mello, C.C. and Conte Jr., D. (2004) Revealing the world of RNA interference. Nature, 431, 338-342 Surpin, M. and Raikhel, N. (2004) Traffic jams affect plant development and signal transduction. Nature Reviews/Molecular Cell Biology 5,100-109