BIOINFORMATIKA V PRAXI – CVIČENÍ 7 PREDIKCE VLASTNOSTÍ PROTEINŮ ZÁKLADNÍ FYZIKÁLNĚ-CHEMICKÁ CHARAKTERISTIKA PROTEINŮ STUDIJNÍ MATERIÁLY The ExPASy (Expert Protein Analysis System) proteomics server of the Swiss Institute of Bioinformatics (SIB), http://www.expasy.org/. ÚKOL 1 Pomocí programu Compute pI/Mw (http://web.expasy.org/compute_pi/) určete teoretickou molekulovou hmotnost a izoelektrický bod proteinu. RVLMEILFDMTRSPIDIELIFLKVVKVSETALEMAVEFPQRWCHGARQGWSIPNALVAEQIVVLAARVDRPLTISVEAAVKSIFELISPSPVELQSSTG KAAYDFGGKLYSTADADTRNGNIQGLRIHYSLFLFDMHPKEGMLEGIAVFTSVVPTDEDIGNSPSKKTKLSRAPYYDGFHAGTIQATTNYAEKSKQTLM LEGNNVKLHDYQQAKECVLGNHAWPDLRKNRGGLEGRCRDNL ÚKOL 2 Vyhledejte na ExPASy predikční nástroje pro predikci posttranslačních modifikací proteinů. ÚKOL 3 U následujících hypotetických savčích proteinů predikujte možná místa fosforylace a c‑mannosylace. Které aminokyseliny jsou při těchto procesech modifikovány? Protein 1 SCLAETQQMVKAERKLCHMHVKTCCFYTAFAEVRYTDQYPRGMCTDHEKSNEQEQTFRSHHAFMTHEHMANSFGLVTQQCELRSFDTPKFYVLLACNKK FQAAPPQQVGCICLDYMYIFETIGGPVNIVIIKIDHLTDYMSGKSLKPARYGDEMRNPMNCPNERSGVPGSMNNYSGDFMRNFNISDQIALIKHYDVYC HLPVR Protein 2 LFFWVGWKPIKIQQPYWMHNIGMLWNVVILGVPFCNPWEELEMAWVCHHEWERHNVNGCKWLYPFQKVMGKNLGRPNVYQHHQDHAGPNIVRMGMEFYQ NFLHDAIFCYKANGKAGPQWEDYLVCHDKNIFAFWPCYQGRKFDEWCMVQLWDCIEKPAAMCYVRDPNKIEVLRDKGEARKLLPMMICYYNDQIDPWNY IFLHVPMQYEFDRRAKQYWDEMQACRYIVIDDCRHMEMLAFCQMNHRCYFGQAKHREHGRFA ÚKOL 4 Pomocí programu ProtParam (http://web.expasy.org/protparam/) určete základní fyzikálně-chemické parametry následujících proteinů. Protein 1 HLGYKRWRWSDLFDNKSTALVVARCRIAQAPYDHCINPETRYMMRHWMKCHCAWNECGGRHFENMNAICAWCDFGLLSTESMVKSFYIRTQPESCSWPY IHTCPLEHSLVKRNLIPYFEHTKGWYEATAHVACIFDEHIDGRWNQISRQGWWYLPPNMNCWNMFYLIGYIQMGQDIRHCHKDHQGVFLRFFDKQHFLQ VDNMAFKHTNNCVYPWKIRQNPEWLDCPNPPGYVDWVCMYVIPQMVEVTSCSINKETWFEIPEYWEFTTKWPGNTYTLVFKGYGADKTSKRQDTMMGQL DGR PSKAMYSCGMDLSHSAHAQVIPMTNEWSEQLVYFKSIMVDGRMAFRQADQFCQLTHAEKV Protein 2 atggcaacacaaggagtgttcacccttcccgccaacacccggttcggcgtcaccgccttcgccaactcgtccggaacccagacggtgaacgtgctggtc aacaacgagacggccgcgaccttcagcgggcaaagcaccaataacgccgtcatcggcacccaggtgctcaactccggcagcagtggcaaggtacaggtc caggtcagcgtcaacggccgcccctcggatctggtctcggcacaggtaatcctgaccaacgagctgaacttcgccctggtcggctctgaagacggcacc gacaacgactacaacgacgccgtcgtggtgatcaactggccgctcggctag ÚKOL 5 Pomocí programu GPMAW (http://www.alphalyse.com/gpmaw_lite.html) určete základní fyzikálně-chemické parametry následujícího proteinu. KIGEDNTQECMCSPLHSNGGSEYLVAGGKAKPAGKLAQHWGQRILGTQRTSAVESGVLAYARATSAGEKTRQWQRIANSRLIVDKNPNDVAKTKRSYTI LILKVNRDEQYIPDATVLVADGTFILGDNLVIEKLTEFPALNPFSFHRDARGESQEEVEGLVKMMPDPSHGLLNLVTVATSYVIIMFSLEAVSRIMLFA YASPLTLKLDEFKMNGPKEYDIWVQEEPFDFLQVHDSAIHRRRIGPLC ÚKOL 6 Akceptují Compute pI/Mw, ProtParam a GPMAW nestandardní proteinogenní aminokyseliny selenocystein a pyrolysin? ÚKOL 7 Porovnejte teoretickou stabilitu následujících proteinů. Protein 1 LVIVDAVTLLSAYPEASRDPAAPTVIDGRHLYVVSPGDAAQLGHNDSRLFTGLSPGDQLHLRETALALRAEVSVLFIRFALKDAGIVAPIELEVRDAAT AVPDADDLLHPSCRPLKDHYWRSDVLAAGATTCTADFAVCDRDGTVSGYFRWETSIEIAGSQPDTKQPGFKPSSDRNGNFSLPPNTAFKAIFYANAADR QDLKLFIDDAPEPAATFVGNSEDGVRLFTLNSKGGKIRIEASANGRQSATDARLAPLSAGDTVWLGWLGAEDGADADYNDGIVILQWPIT Protein 2 DRNGNFSLPPNTAFKAIFYANAADRQDLKLFIDDAPEPAATFVGNSEDGVRLFTLNSKGGKIRIEASANGRQSATDARLAPLSAGDTVWLGWLGAEDGA DADYNDGIVILQWPIT Protein 3 LVIVDAVTLLSAYPEASRDPAAPTVIDGRHLYVVSPGDAAQLGHNDSRLFTGLSPGDQLHLRETALALRAEVSVLFIRFALKDAGIVAPIELEVRDAAT AVPDADDLLHPSCRPLKDHYWRSDVLAAGATTCTADFAVCDRDGTVSGYFRWETSIEIAGSQPDTKQPGFKPSS ÚKOL 8 Porovnejte teoretický extinkční koeficient následujících proteinů. Protein 1 KTDYWTHMWEMIEHQDWQPCMVIWMFDWDVYACWWLHIKRWGYLNHLKHARSDQIQHVETRSLAMPPTVDRGDCNFNSNVQEAWKAKKKNYCGWEQYWP STCGIAGDFSFNYLWGYACWKQIGPPESWAFSWLTYQFNYTPNTFIFMHRKMLITWLEMSFVWCRHNWVVGSRPECR Protein 2 HHIAINGGLFRRTNNACITCTFTCTGNFQFLDRRLSGQIACRQRFNAQVALRRRFHTFQAFRNTRHEEKCQHGNAMQIIPQCTTHLHAFNREGHATFHA GKKNIHNAKHRNFQNMNLGQKQTAQHTPCHGGQCLFRCEKNCAAGFLSGFCLEFCAKHHEFHHFFLFFNGCKNKGEIIFRKFINPQTGIQGCILLIPSH IGLENFAFNLLGAIDGLTFMCQNHQQLQHNHFNLMCNGRKCLLGRSDCRLGNFNFTGQVGLAGLGRTALGHQTQLFTRRDTGKETRDNLTTAKETAHIA GAL HTIRRQFKINLRQEKENHHQAFTHAENQEHGTIGFTLIGITQQEFNNRGTKQVQHFGFALQNLHLKIRMINFCRNQAHQRNTKLGDFEVCAANDQHANP AILALFQQGIMTRHADLTTTFNCHQNENKHQRRQLRHTGEQLRQICQSDITMGLIRIIEVRIKARAMNEHTMHFHCLELRCARRTIGTGRLCKTGMGHD ANIIHCATMHAAAIIARFTF SAMOSTATNÝ PROJEKT Pomocí programu ProtParam určete u vašeho proteinu základní fyzikálně-chemické parametry. PREDIKCE VLASTNOSTÍ PROTEINŮ LOKALIZACE A FUNKCE PREDIKCE LOKALIZACE PROTEINU V BUŇCE Predikce lokalizace proteinu v buňce může být cenným nástrojem pro určení FUNKCE proteinu. Z výskytu proteinů v buňce (cytoplasmatické, membránové, extracelulární, v buněčné stěně...) můžeme například u patogenních mikroorganismů odhadnout, zda se jedná o protein důležitý pro virulenci. ÚKOL 9 Pomocí programu PSORT (http://www.psort.org/) určete lokalizaci následujícího proteinu v buňce: Protein z bakterie Micrococcus luteus MEINGLTWGLTIALIVGLLAFDYFAHVRKAHTPTIKEAAVWSGVYVGLALVFGLVFFAFGDTQHAVEYYTGYLLEKALSVDNLFVFLVIMASFRVPREY QQKVLLFGITFALISRTLFILLGAAVIAAWSDVFYLFGLFLLIIAGGQLKGEMSGDAEGAQDEADNVMVRLVKRFLPASDQFDGERLFTTVDGKRLMTP MLLVMIAIGATDILFAFDSIPAIFGVTQEAYIVFTATAFSLMGLRQLYFLIDGLLDRLVYLAYGLSALLAFIGVKLILHALHENNLPFINGGENVPVAE IPTNLSLVVVVVILAITVLVSLYSPKGQALRALQNAEKYSYRYSKLAEDADPAERERAAALMDRWTARAEALDQRWRDQLLEHKDAWSAIIRTAHETRF ADPRDDDARGVSEQIVRQDGPTV ÚKOL 10 Pomocí programu PSORT určete lokalizaci následujících proteinů v buňce: Protein 1 z neznámé gramnegativní bakterie MTKYALVGDVGGTNARLALCDIASGEISQAKTYSGLDYPSLEAVVRVYLDEHGVSVEDGCIAIACPITGDWVAMTNHTWAFSIAEMKKNLGFSHLEIIN DFTAVSMAIPMLKKEHLIQFGGGEPVDGKPIAVYGAGTGLGVAHLVHVDKRWISLPGEGGHVDFAPNSEEEAMILEILRAEIGHVSAERVLSGPGLVNL YRAIVKSDNRLPENLRPKDITERALADSCIDCRRALSLFCVIMGRFGGDLALTMGTFGGVYIAGGIVPRFLEFFKASGFRGGFEDKGRFKDYVHGIPVY LIVHDNPGLLGSGAHLRQTLGHIL Protein 2 z neznámé bakterie LVIVDAVTLLSAYPEASRDPAAPTVIDGRHLYVVSPGDAAQLGHNDSRLFTGLSPGDQLHLRETALALRAEVSVLFIRFALKDAGIVAPIELEVRDAAT AVPDADDLLHPSCRPLKDHYWRSDVLAAGATTCTADFAVCDRDGTVSGYFRWETSIEIAGSQPDTKQPGFKPSS Protein 3 z Aspergillus fumigatus MKPQTAAFLLSLLGSTLAAPIQHADKGSDVKPTPTGRGAPGGFFTGFPSGVPSGLPSGFPGGPVPGGFGGDGPNGPIPSGPVPTGAAPSGFPSFGTGPA PSGAPQGEEGSSSFGGQGVQARSPQDFEDSGAAPSGAIPSGAIPTGAVPSGAPNGFGGFGQGGHGGPGGPGEEGSGPSPTGAVPSGAIPSGAAPSGAVG GFDGFGQASENSGNAQFQSSGTSPFGASHSGSASGHQGGRHGGDHRGQHGNGSGAIPSGAAPSGAAPSGAAGGFPGFGQGGEGSGPSPTGAVPSGAAGF GGQGHGQGQGSFPTGVAPSDVPSAQPTA ÚKOL 11 Určete lokalizaci proteinu z Aspergillus fumigatus v buňce rovněž pomocí TargetP (http://www.cbs.dtu.dk/services/TargetP/). Výsledky porovnejte. SEKUNDÁRNÍ DATABÁZE PROTEINŮ Sekundární databáze obsahují informace odvozené z primárních databází ve formě charakteristických vzorů sekvencí, tj. funkčních nebo strukturních motivů získaných srovnáním primárních dat (sekvencí). Sekundární databáze jsou vhodné pro vyhledávání „vzoru“ charakteristického pro určitou skupinu proteinů, tj. pro určení funkce proteinů. Sekundární databáze proteinů (PROSITE, Pfam, PRINTS, ProDom, SMART, TIGRFAMS) jsou v současné době sdruženy do integrované klasifikační databáze proteinů InterPro. ÚKOL 12 Dva z předcházejících proteinů analyzujte pomocí databáze InterPro (http://www.ebi.ac.uk/interpro/). Jaké domény/motivy proteiny obsahují a jaká je předpokládaná funkce proteinů? Popište. SAMOSTATNÝ PROJEKT Predikujte lokalizaci svého proteinu v buňce, dále analyzujte svůj protein pomocí databáze InterPro a určete jeho možnou funkci.