Základy proteomiky 2010 Proč právě proteomika? Jan Hejátko Proteomika 2007 """"" Základy proteomiky 2010 Proč právě proteomika? ■ Postgenomová éra a co s informacemi, které neumíme číst ■ Genotyp vs. fenotyp, aneb co všechno se děje při vyjadřování ■ Od genu k proteinu a zpět ■ Přístupy současné proteomiky ■ exprese, purifikace a analýza rekombinantních proteinů ■ analýza vztahu mezi strukturou a funkcí proteinů ■ diferenční proteomika ■ analýza posttranslačních modifikací Základy proteomiky 2010 Proč právě proteomika? ■ PROTEOME = PROTEins expressed by genOME (konference 2-D ELFO, Siena, 1994) ■ DNA: GENOME, HAPLOME, EPIGENOME ■ RNA: TRANSCRIPTOME ■ PROTEIN: ORFEOME, PROTEOME, LOCALISOME, INTERACTOME, METABOLOME, PHENOME, ... • PHENOME: kombinace různých dat, zahrnujících fenotyp, expresní data různých (ideálně všech) genů daného organismu a proteinová data (interakce, jednotlivé vlastnosti proteinů, ...) ■ Proč vůbec studovat proteiny, když máme tolik genetických dat? (sekvence genomů, expresní profily genů, fenotypy mutantů,...?) koncovém výsledku, tedy fenotypu, se vždy projeví regulace na všech úrovních, od genu po protein a jeho modifikaci Na konci je vždy BIOLOGICKY PROBLÉM !!!! Proteomika 2007 Anotace genů a odhad aminokyselinových sekvencí předpokládaných proteinů Postgenomová éra a co s informacemi, které neumíme číst dnes k dispozici v databázích více než 700 000 záznamů (nr databáze) různých organizmů Získané informace lze zpracovat pomocí bioinformatiky Mammals Birds insects Flatworms Amphibians Reptiles Proteomika 2007 19470700 cacacctatatgtatagctcaattctagataaaatatatagaaatggat gctccgaggaagaagataatatgaaaagagctttttagggtttatcatt 19470500 tgttgctttttatacgtatcgcttcctacaataagttaacaatgcttcc ttcagtggcttctttgcagcagcttcttccttggaggactaatcaagac 1947 030 0 ttgacgagtcttgatctttagaatcaaatttataagggatcacgagata tcactcaaatgatggtgaaagttacaaagcttgtggcttcacgtccaat 19470100 atgattctacatttctactcatctcgttcttgtttttcaaatgatataa ttcctggtggttgttttcgagtgcatttggatctcaaattggcgaacaa 19469900 caagtctagtttcggagattgaaaacatcggaaaatttacatatgccaa caacaacgacactggttttacagagattcaaacacaggttgttaaaact 19469700 tatataacattaactataattttatgttgttgttgttgttgttattatt gtctcacaagtttcgtacatcagtagggacggtctcatgttttcttaca 194 69500 caagtcgtggagactacacttggtacactcaaaccgtggatcagttaac tacagattggttccaagcagcacagagtaataactacactacagccttt 194 69300 gttagcttgtacagcaagaaaggtcttgtttctttagggtttccggtta acatgtggacaaaggacgggacggtgcttgttcgtgaaggttcactgaa 19469100 ctccctctggtctcaatgcatccctgaaaattgcagttccagtggctac gtttcgggcgttcctctggtaaatactgaaacatatttcactttgatgc 19468900 tttgccagagatacacactcatgtttcccaacaaaggaggagcaacacg atttcttggcttcggttggcctgtatggtttgtgtggtttatgatgcaa 19468700 gcgacacaacaagctgagagaaagagcatgaacaagagtcaagcatttg ttgatatatgtcgtgatggagttaaacctggctccgacgtagacaccac 19468500 tctttagctttctcttatgcgttttcttcactttctctctaacagaaaa tgagcaaaatcgaaagcgggaagatgcagttagtggaagaagatttcaa 19468300 gaagaaaggggttgatgtagttttggatccgcacgatggctcggttttc aatcttgttagcaatgctgtcaagttcaccgtcgacgggcacattgcgg 19468100 catatcctaaaggtgtgtccaagtttgtaaagagtatgttctgcaagaa caatgcaaacacgatggagtttgtgtttgaagtggatgatactggtaaa 19467900 agagaaacagctcaaggacaccaaggaactggtttagggctcgggattg taaatctagatggttttcatttgtggtctattattataggtaagattaa 19467700 gtttccaattcaatgttttattgacaacattagagtctcctccagtgag gccaaacctcgggctgactataaacacttcacttggaggtagcatgaat ^ttgagaatcattttttttgtattcttttgttat ctccttgactttgcaaaacgtgaaatgtaaggcř tcgtagaattgcaaaacatttgtggaccgtgati agaaatctgttcctctaaaaacgatcgccgttct =acgtattaattattattttttttttttttgct1 tgtggtcttttgcgtcctggtaattctgctttd ttattgtgtgtatatcacccattcatgtatattt caacggagaacctagtcaaagaggtcgcttcati gacaaacttatctacgatcggtttagcgagagti aattacataaattcaattattcttagttattatc gttcttcagatcgcaccattgttgtttgtagctl ttgcagaatcaaacacaagtgtcgctgtttttgt tggtcgtcttaacgggaactcaacgaaatctcac gtaggaacgagcttgggaggagaagataacgag; agactttaaccgaagttttgaacagtttgaatd tgattctttcttcatctccaatggctcgatttgt gaggtggagatcaaaagattaagataccaagctl agtaaaaatgcatcgacttgttgtttctcagcti "atcaagcaccaagcggaaaaggcaaaatatcaŕ gcaacaaggagagagatgcatatgcgtgcaacgc caaatgctagccacgatattagaggtgcccttgt tctcaaccaagtgaatgtttgcgccaaggatttc ttcttcctcatgttgttaaaattacagctctgd cttgtcgaaacttcttgaagacgtcatcgatttl aaattctcgaatgtacgaggggatagtggcagat taagagcttgggctcagaggccaggttccaatac taaagaagagtcatcaacctacgagacagaaatŕ gggatacctatggagatgcgtaagtcggtatttc tgcagtctttggtaagctactaaaacagaacací tgggaggggagataagaatcaccgacaaggccat tgacatgaaagtgagacaggagatcgaagcaggŕ atacgtaacctgagtcctagattcaacaactgtc 3 UTR ATG".ATTCATCAT ATTATCTGATATA .. .ATAAATAAATGCGA n :ace ge Postqe nů a sekvencí : Základy proteomiky 2010 Proč právě proteomika? ■ Postgenomová éra a co s informacemi, které neumíme číst ■ Genotyp vs. fenotyp, aneb co všechno se děje při vyjadřování Proteomika 2007 Genotyp vs. fenotyp, aneb co všechno se děje při vyjadřování ■ Genom vs. Proteom Proteomika 2007 Genotyp vs. fenotyp, aneb co všechno se děje při vyjadřování Možná analogie s textem a jeho interpretací DNA: Kdyžadoperbtabijsemdfjfwůcsaknclůsnínjxldalnxckjcnbychcxmasizdciksrdceasnanazxcnlsdlaň. Když----------------jsem---------s-------ní—dal----------by-si-ssdCe-.------na--------dlaň. RNA: Když jsem s ní, dal bych si srdce na dlaň. Když jsem s ní, dalabyys ss sdceenaadtaňň. Když jsem snídal srdce. Proteomika 2007 Základy proteomiky 2010 Proč právě proteomika? ■ Postgenomová éra a co s informacemi, které neumíme číst ■ Genotyp vs. fenotyp, aneb co všechno se děje při vyjadřování ■ Od genu k proteinu a zpět Proteomika 2007 Základní mechanismy regulace genové exprese struktura genů Základní mechanismy regulace genové exprese regulace transkripce odchylky rozpoznávání míst sestřihu u rostlin v praxi - příklad 32 E M • identifikace mutanta s bodovou mutací (tranzice G^A) přesně v místě sestřihu na 5' konci 4. exonu ^^^^^^^^^^^M BpmI CT GC GAATT ACAAAGTT GTTATTGTCTTGATCCT AAA T T GAATGCTC TT GTGTTTTCTATTTCT CCAGGAAC TGGTGAAGCT CACTGGT GCAAAAAC AC ATGAAGCC AAGAT AAACATT ATT AATGATGTTAAT GGC AT TAT AAAGC CAGGAAI GACGCTT AATGT TT CAACAATAACAGAACTAGGATTTAACTTACGAGAACACAAAAGATAAAGAGGTCCTTGACCACTTCGAGTGACCACGTTTTTGTGTACTTCGGTTCTATTTGTAATAATTACT ACAATTACCGTAATATTTCGGTCCTT( C GAATT ACAAA GACGCTTAATGTTT PDR U1 s/PDR L1 wt pis 1 wt pisl ATAAGAAGAACGAC LFFLL štence podobnýi itantní m RNA se lukaryot, viz dope - 500 bp ■ 400 b;D mechanizmů pro asného stopkodc jTí*iíératnra, Singh - sou bp • 400 bp 300 bp I I K P G : GGT GGT TG C AAT C A TG A A C A G AG GAT TG ATG AAA AG T A G TT T G AAA AT AT G GA AGT TG AGA GGA 300 bp 100 bp I - 200 bp 100 bp PstI ll .T TT TTT TGGTGGAGGTGTGTGAA GTTTG TAG GTTTTG 'AAA AAA AG GAG G T G GAGA GAG TT CAA AC ATG GA AAA G Proteomika PflMI Ase psi 147C _______V ♦ TATTCTTC AT AAGAAG osl intrcn L F F 1C BspMI I TATTCTTCTTGCTG 1653 špici rc eXON 4 L T L L L G P P S C G K T T L L KALSGNLĽNNLK -PĽR exor 4 ORF - PĽR_Ľ Základní mechanismy regulace genové exprese přeskupování subgenů při produkci protilátek Přeskupování subgenů jako specificky mechanismus při produkci protilátek protilátky variabilní oblast (V) a konstantní oblast (C) a lehký (L) a těžký (H) řetězec ■ každá z V oblastí L řetězce u myší je kódována 2 subgeny (V a J) ■ každá z V oblastí H řetězce u myší je kódována 3 subgeny (V, J a D) v zárodečných liniích myších B-lymfocytů dochází k tzv. kombinatorické diversifikaci (přeskupování) subgenů (místně-specifickou rekombinací) ■ L řetězec (k): cca 300 V sub-genů a 4 J subgeny (300 x 4 = 1200 možností) ■ H řetězec: cca 500 V sub-genů, 4 J subgeny a 12 D subgenů (500 x 4 x 12 = 24000 možností) celkové množství kombinací u myší: cca 1200 x 24000 = 28 mil. různých V oblastí (protilátek rozpoznávající různé antigeny) antigen indukuje tzv. afinitní dozrávání mechanismem somatické hypermutace ■ po aktivaci B-lymf. pomocnými T-lymf. dochází ke zvýšenému výskytu mutací ve V oblastech (1 mutace/V oblast/generaci, cca 1 mil. X vyšší než je obvyklé (např. u tzv. „house-keeping" genů) a selekci protilátek se zvýšenou afinitou k antigenu Proteomika 2007 Od genu k proteinu a zpět Základní mechanismy regulace genové exprese ■ regulace transkripce ■ sestřih RNA ■ translační represe Proteomika 2007 Regulace genové exprese mechanismem translační represe • Funkční význam sestřihu v nepřekládaných oblastech - důležitá regulační součást genů GAGGAGGCACAAAATGACGAA -//- TGTATTCTTTTGTTATCAAAGGGTTTCGACTTTGCTCCGAGGAAGAAGMAATATCAQGATCCCCCGGGTAGGTCAGTCCCTTATGTTACGTCCTGTAGAAACCCCAACC ® R I P R L M L MP KE R RÄ R ATGaaaagagcttttTAG GAGGAGGCACAAAATGACGAA -//- GTTATACAAGTTCACTCAAATGATGGTGAAAGTTACMAGCTTGrGGCTTCACGTCGGATCCC>- oGTCAGTCCCTTATGTTACGTCCTGTAGAAACCCCAACC M H V K V T K L V A S R Rl PRVGQSLMLRPVETPT M -KintroR A ATGatggtgaaagttaca.... M M V K V T ... ATGaaaagagcttttTAG ATGatggtgaaagttaca.. V případě CKI1 pokus prokázat tento způsob regulace genové exprese pomocí transgenních linií nesoucích uidA pod kontrolou dvou verzí promotoru, zatím nepotvrzeno M M V K V T „. ATGatggtgaaagttaca.. ATG 1 : UNIVERSU Proteomika 2007 Expression of CKI1 in Diploid Generative Tissue Inflorescence Proteomika 2007 Od genu k proteinu a zpět Základní mechanismy regulace genové exprese ■ regulace transkripce ■ Sestřih RNA ■ translační represe ■ posttranskripční umlčování mechanizmem siRNA Proteomika 2007 3411 The Nobel Prize in Physiology or Medicine 2006 "for their discovery of RNA interference - gene silencing by double-stranded RNA" Od genu k proteinu a zpět mskripční umlčování mechanizmem siRNA větů u Arabidoosis prostřednictvím miRNA ání identity jednotlivých květních orgá aP2 35S::miRNA 172 in situ lokalizace miRNA172 v 3. a 4. kruhu Od genu k proteinu a zpět Základní mechanismy regulace genové exprese ■ regulace transkripce ■ Sestřih RNA ■ translační represe ■ posttranskripční umlčování mechanizmem siRNA ■ směřování proteinů Proteomika 2007 Od genu k proteinu a zpět směřování (cílování) proteinů Intracelulární lokalizace proteinů ■ v rostlinných buňkách dochází k velice dynamickým procesům, zprostředkovávaným zejména tzv. endomembránovým transportem (viz film, GFP směřované do ER) CV, central vacuole; DV, < GA, Golgi apparatus; LV, accumulating compartmen reticulum; PSV, proteir compartment; SV, secretor Proteomika 2007 Od genu k proteinu a zpět směřování (cílování) proteinů Cyklování auxinových přenašečů u Arabidopsis ■ auxin je rostlinný hormon se silným morfogenním účinkem ■ proteiny podílející se na transportu proteinů jsou tzv. PIN proteiny, polárně lokalizované v bunňkách kořene u Arabidopsis ■ PIN proteiny cyklují v endomembránovém systému rostlinné buňky v přítomnosti inhibitorů en^H^^^^^^^^^^^H^^H^^I těchto proteinů v intr _ ~ I ....čímž je zároveň r -T"H I ti Proteomika 2007 ■ Od genu k proteinu a zpět Základní mechanismy regulace genové exprese ■ regulace transkripce ■ sestřih RNA ■ translační represe ■ posttranskripční umlčování mechanizmem siRNA ■ směřování proteinů ■ posttranslační modifikace proteinů Proteomika 2007 Od genu k proteinu a zpět postranslační modifikace proteinů Význam posttranslačních modifikací proteinů ■ regulace enzymové aktivity ■ regulace interakcí proteinu s dalšími proteiny nebo jinými biomolekulami ■ lokalizace proteinu v buňce ■ změna mechanických vlastností proteinu ■ přenos signálu Proteomika 2007 Od genu k proteinu a zpět postranslační modifikace proteinů Od genu k proteinu a zpět postranslační modifikace proteinů Přenos signálu a regulace genové exprese prostřednictvím fosforylace přenos signálu prostřednictvím TGF(3 (Transforming Growth Factor) u živočichů Proteomika 2007 Základy proteomiky 2010 Proč právě proteomika? ■ Postgenomová éra a co s informacemi, které neumíme číst ■ Genotyp vs. fenotyp, aneb co všechno se děje při vyjadřování ■ Od genu k proteinu a zpět ■ Přístupy současné proteomiky ■ exprese, purifikace a analýza rekombinantních proteinů Proteomika 2007 Přístupy současné proteomiky exprese, purifikace a analýza rekombinantních proteinů umožňuje získat velké množství analyzovaného proteinu ve velké čistotě využívá technologie rekombinantní DNA principem je vložení „přívěsku" prostřednictvím přípravy rekombinantní DNA, který usnadní purifikaci (afinitní purifikace) možnost využití „přívěsku" i pro lokalizaci a další Proteomika 200/ Základy proteomiky 2010 Proč právě proteomika? ■ Postgenomová éra a co s informacemi, které neumíme číst ■ Genotyp vs. fenotyp, aneb co všechno se děje při vyjadřování ■ Od genu k proteinu a zpět ■ Přístupy současné proteomiky ■ exprese, purifikace a analýza rekombinantních proteinů ■ analýza vztahu mezi strukturou a funkcí proteinů Proteomika 2007 Přístupy současné proteomiky analýza vztahu mezi strukturou a funkcí proteinů Analýza vztahu mezi funkcí a strukturou proteinu využívá technologie produkce rekombinantních proteinů a místně řízené mutageneze umožňuje analyzovat strukturu rekombinantního proteinu pomocí rentgenové krystalografie nebo NMR kopmparativní analýzou lze pak analyzovat strukturu a funkci jak u strandardního typu tak i mutantního proteinu \A_B Základy proteomiky 2010 Proč právě proteomika? ■ Postgenomová éra a co s informacemi, které neumíme číst ■ Genotyp vs. fenotyp, aneb co všechno se děje při vyjadřování ■ Od genu k proteinu a zpět ■ Přístupy současné proteomiky ■ exprese, purifikace a analýza rekombinantních proteinů ■ analýza vztahu mezi strukturou a funkcí proteinů ■ diferenční proteomika Proteomika 2007 Přístupy současné proteomiky komparativní proteomika Analýza změn proteomu organismu na různé stimuly využívá technologií vícerozměrné separace proteinů (nejčastěji ELFO nebo LC) umožňuje analyzovat mnoho proteinů najednou pomocí analýzy obrazu lze odhadnout proteiny se změnou vlastností, příp. kvantity za daných sledovaných podmínek (mutace, vývojové stadium, fyziologická odpověď) ^Zvýšená hladina endogenních CK Proteomika 2007 Spot Relative Abundance Accession No. Protein Name MALDI-MS LC-MSMS MM [kDa] 1105 2203 2310 2402 2801 4503 5204 7009 7401 7606 7701 8202 8302 8605 8803 3.55 < 0.01 < 0.01 3.40 2.50 > 1 00 < 0.01 < 0.01 < 0.01 > 1 00 0.37 > 1 00 2.69 > 1 00 0.42 S47970 BAB01146 BAA84393 Q8LBJ7 AAG51430 Q9SUI9 E71425 T05413 Q9LJE4 F86262 AAM 20572 AAL36245 H84808 Q941D3 T47470 14-3-3 protein homolog RCI2 - AP000373 NID (jasmonate 97 iducible, myrosinase-like) AP000423 NID (RuBisCO large 116 subunit) 50S ribosomal protein L1 2-C - AC0081 53 NID (2-cys 87 peroxiredoxin BAS1, chloroplast [P recursor]) ATP synthase gamma chain, 131 chloroplast Hypothetical protein (putative -epoxide hydrolase) cinnamyl-alcohol dehydrogenase - (EC 1.1.1.195) F28A23.10 GloEL protein, chaperonin, 60 - kDa F13K23.1 5 protein 81 (glyceraldehyde-3-phosphate dh) AY099721 NID (Cysteine 128 synthase, mitochondrial [P recursor]) AY063889 NID (50S ribosomal - protein L4, chloroplast [P recursor]) probable annexin - At5g19940/F28I16_90 (Hypothetical protein) isovaleryl-CoA dehydrogenase 725 26 23 26 130 92 393 40 86 217 388 236 90 142 213 16 11 32 5 7 10 33 28 9 10 18 28.1 48.5 52.9 19.7 29.1 33.3 33.4 38.7 63.3 42.8 45.8 30.5 36.2 26.5 44.7 5.0 5.9 6.0 6.9 5.1 6.2 5.4 5.6 8.2 8.4 % Vol p Score %Cov Score %Cov 123 20 5.0 29 29 59 4 8.9 6.9 Základy proteomiky 2010 Proč právě proteomika? ■ Postgenomová éra a co s informacemi, které neumíme číst ■ Genotyp vs. fenotyp, aneb co všechno se děje při vyjadřování ■ Od genu k proteinu a zpět ■ Přístupy současné proteomiky ■ exprese, purifikace a analýza rekombinantních proteinů ■ analýza vztahu mezi strukturou a funkcí proteinů ■ diferenční proteomika ■ analýza posttranslačních modifikací Proteomika 2007 Přístupy současné proteomiky analýza posttrranslačních modifikací Analýza posttranslačních modifikací pomocí specifických metod lze identifikovat kotranslační a posttransalční modifikace, buď v gelu nebo po blotování na membránu (barvení spec. barvičkami) identifikace modifikací pomocí MS technik (MALDI TOF, ESI-MS, ...) fosforylace ■ přenos signálu acetylace ■ regulace chromatinových strruktur a transkripční aktivity prostřednictvím regulace vazby histonů glykosylace ■ velice heterogenní (aktivátor plasminogenu 3 místa pro glykosylaci na N-konci, až 11. 520 SYPmožRubyizoforem) Pro-Q Diamond • mikroheterogenita díky velkémuum^^BBí různýc^tkemý^gbytiků, k^^^^^^^^^^^^^^^^^l • makroheterogenita díky rozdílům ^p^Winosti růHých cukrůma různýíct^^^^^^^^^^^^^^^Hho proteinu Proteomika 2007 Základy proteomiky 2010 shrnutí Proč právě proteomika? ■ Postgenomová éra a co s informacemi, které neumíme číst ■ Genotyp vs. fenotyp, aneb co všechno se děje při vyjadřování ■ Od genu k proteinu a zpět ■ Přístupy současné proteomiky ■ exprese, purifikace a analýza rekombinantních proteinů ■ analýza vztahu mezi strukturou a funkcí proteinů ■ diferenční proteomika ■ analýza posttranslačních modifikací Proteomika 2007 Základy proteomiky 2010 zdrojová literatura ■ Zdrojová literatura k první přednášce: Monografie a učebnice ■ Plant Functional Genomics, ed. Erich Grotewold, 2003, Humana Press, Totowa, New Jersey ■ Proteome Research: New Frontiers in Functioonal Genomics, ed. Wilkins, M.R., Wiliams, K.L., Appel, R.D., Hochstrasser, D.F., 1997, Springer-Verlag, Berlin, Heidelberg ■ Dubová J. , Hejátko J., Friml J. (2005) Reproduction of Plants, in Encyclopedia of Molecular Cell Biology and Molecular Medicine (ed, R. A. Meyers), pp. 249 - 295. Wiley-VCH, Weinheim, Germany Publikace v mezinárodních časopisech ■ Wang, L. and Wessler, S.R. (1998) Inefficient reinitiation is responsible for upstream open reading frame-mediated translational repression of the maize R gene. Plant Cell, 10, (1733) ■ Friml, J. and Palme, K. (2002) Polar auxin transport. Old questions and new concepts?. Plant Mol. Biol., 49, 273284 ■ Mello, C.C. and Conte Jr., D. (2004) Revealing the world of RNA interference. Nature, 431, 338-342