Proteomika Proteomické aplikace CG010 Zbyněk Zdráhal CL-Proteomika, CEITEC-MU NCBR, PřF MU zdrahal@sci.muni.cz Oddělení funkční genomiky a proteomiky Národní centrum pro výzkum biomolekul Přírodovědecká fakulta MU CEITEC_logo-text_cz_pos_RGB nfsnf CG010 Metabolomika DNA protein funkční protein mRNA Posttranslační úpravy posttranslační modifikace (fosforylace, glykosylace aj.) Proteinové komplexy transkripce posttranskripční úpravy (alternativní sestřih aj.) translace Proteomika – disciplína zabývající se analýzou proteomu co se může stát co se opravdu děje CG010 Proteomika - Proč? * z každého genu může vzniknout několik proteinů, resp. jejich forem, které nelze indikovat na základě analýzy DNA resp. mRNA * neexistuje přímá korelace mezi obsahem mRNA a výsledným obsahem proteinů * * funkční význam proteinu závisí velmi často na jeho interakci s jinými proteiny či DNA/RNA * * na úrovni proteinů lze zachytit epigenetické faktory regulace exprese genu * Náročnost analýzy proteomu * proteinů je podstatně víc než genů lidský genom obsahuje ~21 000 genů, ale lidský proteom může obsahovat až 1 000 000 proteinů včetně všech forem (izoformy, PTMs) - proteoforms (Nature Methods, 10 (3), 186 (2013)) ~ 10 000 proteinů v buňce v každém okamžiku * široký rozsah koncentrací proteinů (~ 10 řádů) nutnost účinné separace majoritních proteinů od minoritních, chybí obdoba PCR reakce používané pro amplifikaci DNA * široké spektrum fyzikálně-chemických vlastností * analýza komplexů pro úplné pochopení buněčných procesů mnohdy nestačí prostá identifikace jednotlivých proteinů, cca 80% je funkčních jako součást komplexů MM900282753[1] CG010 http://www.genomesonline.org/cgi-bin/GOLD/index.cgi Nárůst znalosti genomů kompletní genomy rozpracované projekty NCBInr 20021126 1243428 sequences ( 395713720 residues) NCBInr 20110131 12852469 sequences ( 4389733743 residues) NCBInr 20120318 17574240 sequences ( 6033299959 residues) NCBInr 20131120 34201960 sequences (12001222213 residues) CG010 Hlavní nástroje pro studium struktury proteinů * Hmotnostní spektrometrie (MS) nejrozšířenější technika pro charakterizaci proteinů a jejich modifikací (na základě primární struktury) * Nukleární magnetická rezonance (NMR) * Rentgenová krystalografie charakterizace vyšších úrovní struktury CG010 * western blotting * proteinové čipy CG010 •kvantifikace proteinů (pomocí „izotopických“ značek , label-free, MRM) •identifikace proteinů (diferenční proteomika, proteinové complexy, de novo sekvenování) •analýza intaktních molekul (MW,kontrola produktů reakce MALDI-MS profilování) •charakterizace proteinových modifikací (fosforylace, acetylace,aj. ) Sphos m/z D m/z = 167 Proteomické aplikace (MS-based) > Snímek11 CG010 Kontrola produktů syntézy >gi|3157976|gb|AAC17470.1| alpha actinin [Homo sapiens] MVDYHAANQSYQYGPSSAAMAWRRGSMGDYMAQEDDWDRDLLLDPAWEKQQRKTFTAWSNSHLRKAGTQI ENIDEDFRDGLKLMLLLEVISGERLPKPERGKMRVHKINNVNKALDFIASKGIKLDFHRAEEIVDGNAKM TLGMIWTIILRFAIQDISVEETSAKEGLLLWCQRKTAPYKNVNVQNFHISWKDGLAFNALIHRHRPELIE YDKLRKDDPVTNLNNAFEVAEKYLDIPKMLDAEDIVNTARPDEKAIMTYVSSFYHAFSGAQKAETETAAN RICKVLAVNQENCSTSMEDYEKLASDLLEWIRRTIPWLEDRVPQKTIQEMQQKLEDFRDYRRVHKPPKVQ EKCQLEINFNSVQTKLRLSNRPAFMPSEGKMVSDINNGWQHLEQAEKGYEEWLLNEIRRLERLDHLAEKF RQKASIHEAWTDGKEAMLKHRDYETATLSDIKALIRKHEAFESDLAAHQDRVEQIAASAQELNELDYYDS HNVNTRCQKICDQWDALGSLTHSRREALEKTEKQLEAIIDQLHLEYAKPAAPFNNWMESAMEDLQDMFIV HTIEEIEGLISAHDQFKSTLPDADREREAILHPQGGQRIAESNHIKLSGSNPYTTVTPQIINSKWEKVQQ LVPKRDHALLEEQSKQQQSNEHLRRQFASQANVVGPWIQTKMEEIAISIEMNGTLEDQLSHLKQYERSIV DYKPNLDLLEQQHQLIQEALIFDNKHTNYTMEHIRVGWEQLLTTIARTINEVENQILTRDAKGISQEQMQ EFRASFNHFDKDHGGALGRGVQGLPHQPGLRRGERPAGEAEFNRIMSLVDPNHSGLVTFQAFIDFMSRET TDTDTADQVITSFKVLAGDKNFITAEELRRELPPDQAEYCIARMAPYQGPDGVRGALDYKSFSTALYGES DL Western Blotting vs Hmotnostní spektrometrie citlivost jistota identifikace instrumentální náročnost CG010 CG010 MW(adukt) = 250 Počet navázaných aduktů N = 12 20000 40000 60000 80000 100000 120000 140000 m/z 0 200 400 600 800 1000 1200 1400 a.i. /D=/Data/Zbynek/020205/BSA/2Lin/pdata/1 Administrator Fri Feb 22 13:59:04 2002 mass diff. cca 3 kDa MW(adukt) = 250 Počet navázaných aduktů N = 12 Kontrola výsledku reakce CG010 vzorek extrakce peptidů/proteinů MALDI MS (3 – 20 kDa) PCA analýza databáze MALDI MS profilů BD18215_ MALDI-MS profilování * identifikace mikroorganizmů * třídění vzorků (kontrola kvality potravin) * diagnostika chorob 5000 7000 9000 11000 m/z 0 500 1000 1500 2000 2500 a.i. 5000 7000 9000 11000 m/z 0 500 1000 1500 2000 2500 a.i. Alcaligenes faecalis Sphingomonas paucimobilis Aeromonas hydrophila Pseudomonas aeruginosa Identifikace mikroorganizmů pomocí MALDI-MS CG010 CG010 0 100 200 300 400 500 600 700 800 900 1000 Acinetobacter nosocomialis NIPH 106 Acinetobacter nosocomialis NIPH 97 Acinetobacter nosocomialis NIPH 2134 Acinetobacter nosocomialis NIPH 2812 Acinetobacter nosocomialis NIPH 386 Acinetobacter nosocomialis NIPH 2265 Acinetobacter nosocomialis NIPH 2120 Acinetobacter nosocomialis NIPH 12 Acinetobacter nosocomialis NIPH 2119T Acinetobacter nosocomialis NIPH 523 Acinetobacter nosocomialis NIPH 2249 Acinetobacter pitii NIPH 14 Acinetobacter pitii NIPH 95 Acinetobacter pitii NIPH 336 Acinetobacter pitii NIPH 2256 Acinetobacter pitii NIPH 519T Acinetobacter pitii NIPH 76 Acinetobacter pitii NIPH 3678 Acinetobacter pitii NIPH 3870 Acinetobacter pitii NIPH 2133 Acinetobacter pitii NIPH 2258 Acinetobacter pitii NIPH 789 Acinetobacter baumannii NIPH 501T II Acinetobacter baumannii NIPH 501T III Acinetobacter baumannii NIPH 146 Acinetobacter baumannii NIPH 601 Acinetobacter baumannii NIPH 80 Acinetobacter baumannii NIPH 190 Acinetobacter baumannii NIPH 67 Acinetobacter baumannii NIPH 1669 Acinetobacter baumannii NIPH 70 Acinetobacter baumannii NIPH 2264 Acinetobacter baumannii NIPH 410 Acinetobacter baumannii NIPH 615 Acinetobacter baumannii NIPH 527 Acinetobacter baumannii NIPH 528 Acinetobacter baumannii NIPH 501T I Acinetobacter baumannii NIPH 1734 Acinetobacter baumannii NIPH 201 Acinetobacter baumannii NIPH 329 Acinetobacter baumannii NIPH 335 Acinetobacter calcoaceticus NIPH 13 Acinetobacter calcoaceticus NIPH 2253 Acinetobacter calcoaceticus NIPH 2254 Acinetobacter calcoaceticus NIPH 2706 Acinetobacter calcoaceticus NIPH 2814 Acinetobacter calcoaceticus NIPH 2262 Acinetobacter calcoaceticus NIPH 3680 Acinetobacter calcoaceticus NIPH 3804 Acinetobacter calcoaceticus NIPH 2155 Acinetobacter calcoaceticus NIPH 2245T Distance Level 0 100 200 300 400 500 600 700 800 900 1000 Acinetobacter nosocomialis NIPH 106 Acinetobacter nosocomialis NIPH 97 Acinetobacter nosocomialis NIPH 2134 Acinetobacter nosocomialis NIPH 2812 Acinetobacter nosocomialis NIPH 386 Acinetobacter nosocomialis NIPH 2265 Acinetobacter nosocomialis NIPH 2120 Acinetobacter nosocomialis NIPH 12 Acinetobacter nosocomialis NIPH 2119T Acinetobacter nosocomialis NIPH 523 Acinetobacter nosocomialis NIPH 2249 Acinetobacter pitii NIPH 14 Acinetobacter pitii NIPH 95 Acinetobacter pitii NIPH 336 Acinetobacter pitii NIPH 2256 Acinetobacter pitii NIPH 519T Acinetobacter pitii NIPH 76 Acinetobacter pitii NIPH 3678 Acinetobacter pitii NIPH 3870 Acinetobacter pitii NIPH 2133 Acinetobacter pitii NIPH 2258 Acinetobacter pitii NIPH 789 Acinetobacter baumannii NIPH 501T II Acinetobacter baumannii NIPH 501T III Acinetobacter baumannii NIPH 146 Acinetobacter baumannii NIPH 601 Acinetobacter baumannii NIPH 80 Acinetobacter baumannii NIPH 190 Acinetobacter baumannii NIPH 67 Acinetobacter baumannii NIPH 1669 Acinetobacter baumannii NIPH 70 Acinetobacter baumannii NIPH 2264 Acinetobacter baumannii NIPH 410 Acinetobacter baumannii NIPH 615 Acinetobacter baumannii NIPH 527 Acinetobacter baumannii NIPH 528 Acinetobacter baumannii NIPH 501T I Acinetobacter baumannii NIPH 1734 Acinetobacter baumannii NIPH 201 Acinetobacter baumannii NIPH 329 Acinetobacter baumannii NIPH 335 Acinetobacter calcoaceticus NIPH 13 Acinetobacter calcoaceticus NIPH 2253 Acinetobacter calcoaceticus NIPH 2254 Acinetobacter calcoaceticus NIPH 2706 Acinetobacter calcoaceticus NIPH 2814 Acinetobacter calcoaceticus NIPH 2262 Acinetobacter calcoaceticus NIPH 3680 Acinetobacter calcoaceticus NIPH 3804 Acinetobacter calcoaceticus NIPH 2155 Acinetobacter calcoaceticus NIPH 2245T Distance Level spolehlivá diferenciace na úrovni druhů (u většiny rodů) Identifikace mikroorganizmů pomocí MALDI-MS identifikace na základě srovnání naměřeného profilu s profilem z databáze * uznaná metoda v klinické praxi spolupráce s PřF MU doc. Pekár CG010 ven MALDI-MS profilování pavoučího jedů (Zodariidae) Mravčík hbitý - Zodarion alacre http://www.pavouci-cz.eu/ CG010 100 200 300 400 500 600 700 800 900 1000 Brewery 1 bottle 3 Brewery 1 bottle 4 Brewery 1 bottle 5 Brewery 1 bottle 1 Brewery 1 bottle 2 Brewery 2 bottle 3 Brewery 2 bottle 4 Brewery 2 bottle 5 Brewery 2 bottle 1 Brewery 2 bottle 2 Brewery 3 bottle 1 Brewery 3 bottle 2 Brewery 3 bottle 3 Brewery 3 bottle 4 Brewery 3 bottle 5 Distance Level MALDI-MS profilování piva MALDI-TOF MS fingerprint containing proteins 0.5 1.0 1.5 2.0 2.5 4 x10 2000 3000 4000 5000 6000 7000 8000 9000 10000 spolupráce s FCH VUT Brno doc. Márová Analýza profilů –včasná detekce chorob (peptide profiling, pattern profiling) BD18215_ MALDI MS, SELDI MS (3 – 20 kDa) klastrová analýza žádná či minimální úprava vzorku (ionex, IMAC, afinitní sorbent) CG010 J. LaBaer et al., J. Proteome Res., 4 (4) 1053-1059 (2005). M. Ehmann et al., Pancreas, 34 (2) 205-214 (2007). CG010 Využití MS pro vyhledávání biomarkerů Pattern profiling přímá MS analýza vzorků (MALDI MS, SELDI MS) srovnávání peptidového (proteinového) složení vzorku „zdravého“ a nemocného (bez identifikace, statistická analýza) včasná diagnostika chorob Identifikace biomarkerů Separace GE. LC srovnávání peptidového (proteinového) složení vzorku „zdravého“ a nemocného (analýza obrazu) MS MS/MS identifikace rozdílových proteinů specifická protilátka Imunodetekce Protein arrays CG010 CG010 > Snímek27 Proteomické aplikace využívající „pouze“ identifikace proteinů CG010 izolace proteinů proteinový extrakt (proteolytické štěpení) vícerozměrná frakcionace/separace gelová elektroforéza, kapalinová chromatografie kombinace separačních principů proteinové (peptidové) frakce MALDI-MS/MS LC-ESI-MS/MS identifikované proteiny Obecné schéma proteomického experimentu Analýza komplexních směsí s cílem identifikovat jednotlivé komponenty CG010 zachování stavu vzorku zjednodušení komplexní směsi před vlastní detekcí CG010 Separace proteinových izolátů na úrovni intaktních proteinů Peptidy HPLC - UV Protein fraction collection 1D (2D) gelová elektroforéza IEF (in-solution, in-gel) Peptidy Peptidy Proteinové frakce in-solution digestion in-gel digestion jednotlivých bendů in-solution/ in-gel digestion Separace proteinových izolátů na úrovni peptidů CG010 Protein mixture In-solution digestion Peptides 1D (2D) HPLC – on-line/off-line IEF frakcionace LC-MALDI vždy MS/MS analýza shotgun proteomics MuDPIT (Multi-Dimensional Protein Identification Technology) CG010 Charakterizace proteomu Eyer L. et al.,Proteomics, 7 (1), 64-72 (2007) proteom stafylokokového fága 812, spolupráce s prof. Doškářem (ÚEB PřF MU) identifikace proteinů ve spotech MS/MS technik fag 812-Ag 2006-08-18 8M slina pH3,9-5,1 13-2-09 CG010 Ověření sekvence a určení izoforem OBP proteinů Obp3A Obp3B Obp2 Myodes glareolus * sliny * 2D gelová elektroforéza * MS/MS vybraných spotů Stopková R., Zdráhal Z., Ryba Š. et al, BMC Genomics 2010, 11:45 spolupráce s PřF UK Praha * není znám genom * nejsou protilátky m/z 3079.4 DAELEGTWYTTAIAADNVDTIEEEGPLR MALDI-MS/MS původní sekvence - QAELEGKWVTTAIAADNIDTIEEEGPMR (OBP3) DAELEGTWYTTAIAADNVDTIEEEGPLR HAELEGTWYTTAIAADNVDTIEEEGPLR Ověření sekvence a určení izoforem OBP proteinů MALDI-MS/MS a LC-MS/MS manuální interpretace spekter CG010 * > 80% proteinů je funkčních až po začlenění do komplexu * ~ 10000 typů interakcí Aloy P., Russell R. B.: Nat. Biotechnol. 22 (10), 1317-1321 (2004) Charakterizace proteinových komplexů funkční proteomika purifikace komplexu vzorek (buněčná kultura) MS/MS analýza validace interakcí * vyhledávání nových interakcí * možnost studia „celého“ komplexu CG010 T. Köcher, G. Superti-Furga: Nat. Methods, 4(10), 807-815 (2007). Purifikace proteinových komplexů in vivo exprese proteinu se značkou vysoký stupeň čistoty komplexu ztráta slabě vázaných členů komplexu CG010 Gavin A.-C. et al.: Nature, 440, 631-636 (2006). • identifikace jednotlivých členů komplexu včetně posttranslačních modifikací • validace interakčních partnerů (odlišení nespecifických interakcí) • určení poměrů jednotlivých členů komplexu (stechiometrie) • určení prostorové struktury komplexu (cross-linking) Možnosti MS v analýze komplexů: CG010 > Snímek13 Charakterizace posttranslačních modifikací příklad ...Post-translational modifications (PTMs) occur on nearly all proteins. Many domains within proteins are modified on multiple amino acid sidechains by diverse enzymes to create a myriad of possible protein species. How these combinations of PTMs lead to distinct biological outcomes is only beginning to be understood... A. P. Lothrop, M. P. Torres, S. M. Fuchs, FEBS Letters. 587 (2013) 1247–1257 počet druhů PTMs > 400 počet PTMs ≈ 90 000 (experimentálne identifikovaných) ≈ 230 000 (predikce) (SwissProt, per ≈ 530 000 proteinů) G. A. Khoury et al., Sci. Rep. 1, 90; (2011); http://selene.princeton.edu/PTMCuration ...PTMs are known to act alone and in combination to regulate nearly all aspects of protein function... Proč? CG010 The panels show the phenotypic phosphoproteome comparison organized by GO biological process for mitotic (left) and S phase (right) cells. Proteins involved in metabolic processes have high-occupancy phosphorylation sites during mitosis, but low-occupancy sites during S phase (color scale: yellow, high overrepresentation; dark blue, high underrepresentation). Olsen J.V. et al., Sci. Signal., 3 (104) ra3 (2010) * * quantified 6027 proteins * quantified 20,443 unique phosphorylation sites Analýza fosfoproteomu změny během buněčného cyklu CG010 - HELA buňky - SILAC značení - TiO2 frakcionace - LC-MS/MS (Orbitrap) 35000 40000 45000 50000 m/z 50 100 150 200 250 300 350 400 450 500 a.i. Daver = 1.2 kDa MALDI-MS celých proteinů CG010 P5_all_zz MALDI-MS tryptických digestů * rozdílový peptid * stejný protein CG010 2900 3100 3300 3500 3700 3900 m/z 100 150 200 250 300 350 400 450 500 a.i. Detail spekter digestů proteinu před a po deglykosylaci PNGase A peptid 3966 zmizel objevil se peptid 2797, vedle peptidu 2795 * N-glykosylace * Daver = 1169 Da CG010 2770 2790 2810 m/z 100 150 200 250 300 350 400 450 500 a.i. Detail spekter digestů proteinu před a po deglykosylaci CG010 tryptický peptid 2796 Da …PHIFDYSGS… , kde D vzniká z N po deglykosylaci PNGasou A původní sekvence je tedy …PHIFNYSGS… (hmotnost 2795 Da) Peptid potvrzen také LCMSMS analýzou (v glykosylovaném vzorku digestu nebyl nalezen) Hmotnost glykanu 1170 Da odpovídá xylose+fucose+3*mannose+2*N-acetylglukosamin Nebyl dále potvrzen MSMS technikami Shrnutí výsledků CG010 > Snímek20 Proteomické aplikace - kvantitativní studie CG010 B Charakterizace změn proteomu diferenční proteomika P. Bouchal et al., Proteomics 2006, 6, 4278–4285. Acidithiobacilus ferrooxidans grown on ferrous iron (A) and elemental sulfur (B) analýza obrazu 2-D gelů LC-MS/MS vybraných spotů s rozdílnou intenzitou CG010 relativní kvantifikace Obecné schéma proteomického experimentu Analýza komplexních směsí s cílem kvantifikovat jednotlivé komponenty pomocí izotopicky odlišných značek Vzorek A Vzorek B extrakt A společné proteolytické štěpení MS or MS/MS analýza izolace proteinů extrakt B SILAC ICAT, iTRAQ, ICPL, ... (separace) (separace) Vzorek A Vzorek B extrakt A proteolytické štěpení MS or MS/MS analýza izolace proteinů extrakt B směs peptidů směs peptidů iTRAQ 16O/18O (separace) kvantifikace bez použití izotopicky odlišných značek „label free“ metody statistické zpracování naměřených MS nebo MS/MS dat počet vzorků bez omezení není třeba žádné derivatizační reakce menší přesnost Charakterizace markerových proteinů u kuřat infikovaných salmonelou relativní kvantifikace CG010 kontrola po infekci vzorky stěny střeva proteinové izoláty digesce trypsinem reduktivní alkylace LC-MS/MS data processing * identifikováno více než 2300 proteinů * kvantifikační údaj pro více než 1900 spolupráce s VÚVel Brno Accession Description Sum(Coverage) 363741657 PREDICTED: syntenin-2-like [Gallus gallus] 41.032 118095649 PREDICTED: beta-1,3-galactosyl-O-glycosyl-glycoprotein beta-1,6-N-acetylglucosaminyltransferase 3 [Gallus gallus] 34.036 4927286 alpha enolase [Bos taurus] 33.575 112491068 Chain A, Crystal Structure Of A M-Loop Deletion Variant Of Ment In The Cleaved Conformation 30.221 56118294 ribonuclease homolog precursor [Gallus gallus] 25.497 363741459 PREDICTED: protein-glutamine gamma-glutamyltransferase E [Gallus gallus] 24.786 infikovaný/ kontrola CG010 ověřění pomocí real-time PCR objasnění molekulárních mechanizmů nalezení markerových proteinů pro časnou diagnostiku Cílená MS/MS analýza vybraných proteinů relativní /absolutní kvantifikace multiple reaction monitoring (MRM) CG010 vysoká citlivost screening – výběr kandidátního proteinu příprava metody (výběr MRM přechodů – peptid + vybraný fragment) Protein mixture In-solution digestion Peptides LC-MS/MS – MRM mode vlastní analýza a zpracování dat http://www.srmatlas.org Kvantifikace enterotoxinů cílená analýza vybraného proteinu MRM * výběr peptidů vhodných pro kvantifikaci * absolutní kvantifikace pomocí AQUA peptidů výsledek - zjištěné množtví/koncentrace daného proteinu ve vzorku CG010 _______7 a to je konec