Predikce vlastností proteinů Aplikovaná bioinformatika, Jaro 2016 Základní vlastnosti proteinů Protein RKSTGGKAPRKQLATKAARKSAPATGGVKKPHRYRPGTVALREIRRYQKSTELLIRKLPFQRLVREIAQDFKTDLRFQSSAVMALQEASEAYLVGLFED TNLCAIHAKR ? Sekvenace celých genomů CCTTTATTATCCGCTTCCATTGTTTCCGCTCCTGTTGTTACTTCCGAAACTTATGTTGATATTCCTGGTTTATATTTAGATGTTGCTAAAGCTGGTATT CGCGATGGTAAATTACAAGTTATTTTAAATGTTCCTACTCCTTATGCTACTGGTAATAATTTTCCTGGTATTTATTTTGCTATTGCTACTAATCAAGGT GTTGTTGCTGATGGTTGTTTTACTTATTCCTCCAAAGTTCCTGAATCCACTGGTCGCATGCCTTTTACTTTAGTTGCTACTATTGATGTTGGTTCCGGT GTTACTTTTGTTAAAGGTCAATGGAAATCCGTTCGCGGTTCCGCTATGCATATTGATTCCTATGCTTCCTTATCCGCTATTTGGGGTACTGCTGCTCCT TCCTCCCAAGGTTCCGGTAATCAAGGTGCTGAAACTGGTGGTACTGGTGCTGGTAATATTGGTGGTGGTGGTGAACGCGATGGTACTTTTAATTTACCT CCTCATATTAAATTTGGTGTTACTGCTTTAACTCATGCTGCTAATGATCAAACTATTGATATTTATATTGATGATGATCCTAAACCTGCTGCTACTTTT AAAGGTGCTGGTGCTCAAGATCAAAATTTAGGTACTAAAGTTTTAGATTCCGGTAATGGTCGCGTTCGCGTTATTGTTATGGCTAATGGTCGCCCTTCC CGCTTAGGTTCCCGCCAAGTTGATATTTTTAAAAAATCCTATTTTGGTATTATTGGTTCCGAAGATGGTGCTGATGATGATTATAATGATGGTATTGTT TTTTTAAA PLLSASIVSAPVVTSETYVDIPGLYLDVAKAGIRDGKLQVILNVPTPYATGNNFPGIYFA IATNQGVVADGCFTYSSKVPESTGRMPFTLVATIDVGSGVTFVKGQWKSVRGSAMHIDSY ASLSAIWGTAAPSSQGSGNQGAETGGTGAGNIGGGGERDGTFNLPPHIKFGVTALTHAAN DQTIDIYIDDDPKPAATFKGAGAQDQNLGTKVLDSGNGRVRVIVMANGRPSRLGSRQVDI FKKSYFGIIGSEDGADDDYNDGIVFL Predikce vlastností Nukleotidová a proteinová sekvence hypotetických proteinů Predikce základních vlastností proteinů ze sekvence Predikce základních fyzikálně-chemických parametrů. Predikce lokalizace proteinů v buňce. Predikce základních vlastností proteinů ze sekvence Predikce lokalizace proteinů v buňce. Predikce základních fyzikálně-chemických parametrů. Expert Protein Analysis System http://www.expasy.org ProtParam •Predikce/výpočet základních fyzikálně-chemických parametrů proteinu. • •Vychází pouze z aminokyselinové sekvence proteinu. • ProtParam Úkol 1: určete základní fyzikálně-chemické parametry tohoto proteinu PLLSASIVSAPVVTSETYVDIPGLYLDVAKAGIRDGKLQVILNVPTPYATGNNFPGIYFAIATNQGVVADGCFTYSSKVPESTGRMPFTLVATIDVGSG VTFVKGQWKSVRGSAMHIDSYASLSAIWGTAAPSSQGSGNQGAETGGTGAGNIGGGGERDGTFNLPPHIKFGVTALTHAANDQTIDIYIDDDPKPAATF KGAGAQDQNLGTKVLDSGNGRVRVIVMANGRPSRLGSRQVDIFKKSYFGIIGSEDGADDDYNDGIVFL Molekulová hmotnost - Mw Úkol 2: Molekulová hmotnost zkoumaného proteinu byla pomocí SDS-PAGE stanovena na cca 30 kDa. Ověřte, zda se jedná o Váš protein. Pokuste se vysvětlit případné nesrovnalosti. SKEPLRPRCRPINATLAVEKEGCPVCITVNTTICAGYCPTMTRVLQGVLP ALPQVVCNYRDVRFESIRLPGCPRGVNPVVSYAVALSCQCALCRRSTTDCGGPKDHPLTCDDPRFQDSSSSKAPPPSLPSPSRLPGPSDTPILPQ Molekulová hmotnost - Mw •ProtParam nebere v úvahu možné posttranslační modifikace a oligomerizaci proteinů. • •Pro predikci PTM a oligomerizace existují specializované nástroje. • •Problematika PTM není stále dořešená, především u prokaryot. • •Glykosylace proteinů, dříve považovaná za proces probíhající pouze u eukaryot, byla již prokázána i u prokaryot. • Databáze prokaryotických glykoproteinů: ProGlycProt • Predikce glykosylace u prokaryot: GlycoPP Molekulová hmotnost - Mw Úkol 3: Student s využitím ProtParam vypočítal molekulovou hmotnost svých proteinů na 69,9 a 12,7 kDa. Při gelové chromatografii ale určil molekulovou hmotnost na 33 a 51 kDa! Ověřte jeho výpočet a zkuste najít vysvětlení, když je experimentálně prokázáno, že tyto proteiny nepodléhají PTM. Protein 1: CCGACGGAGTTCCTGTACACGAGCAAGATAGCGGCGATAAGCTGGGCGGCGACGGGGGGGAGGCAGCAGAGGGTGTACTTCCAGGACCTGAACGGGAAG ATAAGGGAGGCGCAGAGGGGGGGGGACAACCCGTGGACGGGGGGGAGCAGCCAGAACGTGATAGGGGAGGCGAAGCTGTTCAGCCCGCTGGCGGCGGTG ACGTGGAAGAGCGCGCAGGGGATACAGATAAGGGTGTACTGCGTGAACAAGGACAACATACTGAGCGAGTTCGTGTACGACGGGAGCAAGTGGATAACG GGGCAGCTGGGGAGCGTGGGGGTGAAGGTGGGGAGCAACAGCAAGCTGGCGGCGCTGCAGTGGGGGGGGAGCGAGAGCGCGCCGCCGAACATAAGGGTG TACTACCAGAAGAGCAACGGGAGCGGGAGCAGCATACACGAGTACGTGTGGAGCGGGAAGTGGACGGCGGGGGCGAGCTTCGGGAGCACGGTGCCGGGG ACGGGGATAGGGGCGACGGCGATAGGGCCGGGGAGGCTGAGGATATACTACCAGGCGACGGACAACAAGATAAGGGAGCACTGCTGGGACAGCAACAGC TGGTACGTGGGGGGGTTCAGCGCGAGCGCGAGCGCGGGGGTGAGCATAGCGGCGATAAGCTGGGGGAGCACGCCGAACATAAGGGTGTACTGGCAGAAG GGGAGGGAGGAGCTGTACGAGGCGGCGTACGGGGGGAGCTGGAACACGCCGGGGCAGATAAAGGACGCGAGCAGGCCGACGCCGAGCCTGCCGGACACG TTCATAGCGGCGAACAGCAGCGGGAACATAGACATAAGCGTGTTCTTCCAGGCGAGCGGGGTGAGCCTGCAGCAGTGGCAGTGGATAAGCGGGAAGGGG TGGAGCATAGGGGCGGTGGTGCCGACGGGGACGCCGGCGGGGTGG Protein 2: AWKGEVLANNEAGQVTSIIYNPGDVITIVAAGWASYGPTQKWGPQGDREHPDQGLICHDAFCGALVMKIGNSGTIPVNTGLFRWVAPNNVQGAITLIYN DVPGTYGNNSGSFSVNIGKDQS Izoelektrický bod - pI •Izoelektrický bod = pH, při kterém má protein nulový sumární náboj. pI pH pH < < pH ? ? Izoelektrický bod - pI •Izoelektrický bod = pH, při kterém má protein nulový sumární náboj. pI pH pH < < pH - OH- OH- OH- OH- OH- H+ + H+ H+ H+ H+ H+ H+ Izoelektrický bod - pI •Izoelektrický bod = pH, při kterém má protein nulový sumární náboj. • • • • •Problémem jsou opět posttranslační modifikace!!! • •Použité hodnoty pK jednotlivých aminokyselin – různí autoři, různé hodnoty… • • Izoelektrický bod - pI •Izoelektrický bod = pH, při kterém má protein nulový sumární náboj. Rozpustnost proteinů je při pH = pI nejmenší! pI pH pH < < pH + + + + - - - - Izoelektrický bod - pI Protein 1: PLLSASIVSAPVVTSETYVDIPGLYLDVAKAGIRDGKLQVILNVPTPYATGNNFPGIYFAIATNQGVVADGCFTYSSKVPESTGRMPFTLVATIDVGSG VTFVKGQWKSVRGSAMHIDSYASLSAIWGTAAPSSQGSGNQGAETGGTGAGNIGGGGERDGTFNLPPHIKFGVTALTHAANDQTIDIYIDDDPKPAATF KGAGAQDQNLGTKVLDSGNGRVRVIVMANGRPSRLGSRQVDIFKKSYFGIIGSEDGADDDYNDGIVFLNWPLG Protein 2: GLSDGACWQLVLNVWGKVEADICPGHGQEVLILLFKGHPETLEKFDKCFKHLKCSEDEMKASEDLKKHGATVLTACLGGILKKKCGHHEAECIKPLAQD SHATKHKISPVCKYLCEFRISECRCIQIVLQCSKHPGDFGCADAQGAMNKALELFRCKDMASNYKELGFQG Protein 3: AWKGEVLANNEAGQVTSIIYNPGDVITIVAAGWASYGPTQKWGPQGDREHPDQGLICHDAFCGALVMKIGNSGTIPVNTGLFRWVAPNNVQGAITLIYN DVPGTYGNNSGSFSVNIGKDQS Úkol 4: Student pracuje se směsí tří proteinů. Ve standardním pufru (20 mM Tris/HCl, 150 mM NaCl, pH 7,5) pozoroval vznik sraženiny! Zkuste ODHADNOUT, jestli dochází ke srážení všech proteinů nebo pouze některého z nich a zoufalému studentovi pomozte najít řešení. Izoelektrický bod - pI Protein 1: PTEFLYTSKIAAISWAATGGRQQRVYFQDLNGKIREAQRGGDNPWTGGSSQNVIGEAKLFSPLAAVTWKSAQGIQIRVYCVNKDNILSEFVYDGSKWIT GQLGSVGVKVGSNSKLAALQWGGSESAPPNIRVYYQKSNGSGSSIHEYVWSGKWTAGASFGSTVPGTGIGATAIGPGRLRIYYQATDNKIREHCWDSNS WYVGGFSASASAGVSIAAISWGSTPNIRVYWQKGREELYEAAYGGSWNTPGQIKDASRPTPSLPDTFIAANSSGNIDISVFFQASGVSLQQWQWISGKG WSIGAVVPTGTPAGW Protein 2: ATQGVFTLPANTFGVTAEFANESSGTQTVNVLVNNETAATFSGQSTNNAVIGTQVENSGSSGKVQVQVSVNGRPSDLVSAQVILTNELNFALVGSEDDG TDNDYNDAVVVINWPLG Protein 3: SSVQTAATSWGTVPSIRVYTANNGKITERCWDGKGWYTGAFNEPGDNVSVTSWLVGSAIHIRVYASTGTTTTEWCWDGNGWTKGAYTATN Úkol 5: Student potřeboval pro následné experimenty imobilizovat 3 proteiny na matrici (karboxymethylovaný dextran). Nechtělo se mu ptát se na radu kolegů a tak proteiny rozpustil v doporučovaném komerčním pufru (10 mM octan sodný, pH 5,0) a provedl imobilizace. U proteinů 1 a 3 byla úspěšná, u proteinu 2 naprosto selhala. „Proč?“, ptá se (opět) zoufalý student. Izoelektrický bod - pI Úkol 5: Student potřeboval pro následné experimenty imobilizovat 3 proteiny na nosič (karboxymethylovaný dextran). Nechtělo se mu ptát se na radu kolegů a tak proteiny rozpustil v doporučovaném komerčním pufru (10 mM octan sodný, pH 5,0) a provedl imobilizace. U proteinů 1 a 3 byla úspěšná, u proteinu 2 naprosto selhala. „Proč?“, ptá se (opět) zoufalý student. Nosič Nosič Nosič 1 3 OK OK KO DSCN3762 Extinkční koeficient Extinkční koeficient •Extinkční koeficienty závisejí na okolí chromoforu! • •ProtParam nebere v úvahu sekundární a terciární strukturu. • •Přesné extinkční koeficinty je nutné získat experimentálně. • • Extinkční koeficient Úkol 6: Student experimentálně určil extinkční koeficienty tří proteinů při 280 nm. A potom si rozházel špatně popsané výsledky a neví, který koeficient patří ke kterému proteinu… Pomozte mu přiřadit jednotlivé koeficienty ke správným proteinům. Předpokládejte, že student už čeká před kanceláří vedoucího a nemůže použít počítač. Protein 1: AQQGVFTLPARINFGVTVLVNSAATQHVEIFVDNEPRAAFSGVGTGDNNLGTKVINSGSGNVRVQITANGRQSDLVSSQLVLANKLNLAVVGSEDGTDM DYNDSIVILNWPLG Protein 2: AWKGEVLANNEAGQVTSIIYNPGDVITIVAAGWASYGPTQKWGPQGDREHPDQGLICHDAFCGALVMKIGNSGTIPVNTGLFRWVAPNNVQGAITLIYN DVPGTYGNNSGSFSVNIGKDQS Protein 3: SSVQTAATSWGTVPSIRVYTANNGKITERCWDGKGWYTGAFNEPGDNVSVTSWLVGSAIHIRVYASTGTTTTEWCWDGNGWTKGAYTATN Určené koeficienty jsou: 45 687, 7105, 27 860 M-1 cm-1. Extinkční koeficient Úkol 7: Stejná situace. Ale nyní předpokládejte, že student má internet v mobilu. (A že je příliš nervózní a nedokáže to odhadnout. Což je rychlejší.) Protein 1: AQQGVFTLPARINFGVTVLVNSAATQHVEIFVDNEPRAAFSGVGTGDNNLGTKVINSGSGNVRVQITANGRQSDLVSSQLVLANKLNLAVVGSEDGTDM DYNDSIVILNWPLG Protein 2: AWKGEVLANNEAGQVTSIIYNPGDVITIVAAGWASYGPTQKWGPQGDREHPDQGLICHDAFCGALVMKIGNSGTIPVNTGLFRWVAPNNVQGAITLIYN DVPGTYGNNSGSFSVNIGKDQS Protein 3: SSVQTAATSWGTVPSIRVYTANNGKITERCWDGKGWYTGAFNEPGDNVSVTSWLVGSAIHIRVYASTGTTTTEWCWDGNGWTKGAYTATN Určené koeficienty jsou: 45 687, 7105, 27 860 M-1 cm-1. Jak stabilní je můj protein? •Stabilita in vivo x in vitro. • •Stabilita v buňce x ve zkumavce. • • • • • • •Degradace proteinu v buňce je aktivní proces. • •In vivo half-life x instability index Jak stabilní je můj protein? •In vivo half-life • Protein 1: MAQQGVFTLPARINFGVTVLVNSAATQHVEIFVDNEPRAAFSGVGTGDNNLGTKVINSGSGNVRVQITANGRQSDLVSSQLVLANKLNLAVVGSEDGTD MDYNDSIVILNWPLG Protein 2: MDRNGNFSLPPNTAFKAIFYANAADRQDLKLFIDDAPEPAATFVGNSEDGVRLFTLNSKGGKIRIEASANGRQSATDARLAPLSAGDTVWLGWLGAEDG ADADYNDGIVILQWPIT Protein 3: MERDGTFNLPPHIKFGVTALTHAANDQTIDIYIDDDPKPAATFKGAGAQDQNLGTKVLDSGNGRVRVIVMANGRPSRLGSRQVDIFKKSYFGIIGSEDG ADDDYNDGIVFLNWPLG Jak stabilní je můj protein? Úkol 8: Predikujte in vivo half-life následujících proteinů: Odštěpuje se iniciační methionin? Protein 1: M AQQGVFTLPARINFGVTVLVNSAATQHVEIFVDNEPRAAFSGVGTGDNNLGTKVINSGSGNVRVQITANGRQSDL VSSQLVLANKLNLAVVGSEDGTDMDYNDSIVILNWPLG Protein 2: M DRNGNFSLPPNTAFKAIFYANAADRQDLKLFIDDAPEPAATFVGNSEDGVRLFTLNSKGGKIRIEASANGRQSATD ARLAPLSAGDTVWLGWLGAEDGADADYNDGIVILQWPIT Protein 3: M ERDGTFNLPPHIKFGVTALTHAANDQTIDIYIDDDPKPAATFKGAGAQDQNLGTKVLDSGNGRVRVIVMANGRPSR LGSRQVDIFKKSYFGIIGSEDGADDDYNDGIVFLNWPLG Jak stabilní je můj protein? •Instability index • Jak stabilní je můj protein? Úkol 9: Student se má rozhodnout, se kterými proteiny bude pracovat příští dva roky v rámci diplomové práce. Poučen předchozími chybami se chce poradit se svými kolegy (s Vámi). Vyberte mu dva proteiny! Protein 1: SDVDIEAQDAGQTLVQVISIPSGETWVAIQLPSQYRYFDFVFENVSPTSSGSVLVAQMAPQSGGVYGSNYSGSGWGNDLGGGGFYGYSEAKWMCLWPAN RSGPSSKTGLYGTCKLMNLNQSSAVPSVTSNLFAPTAYKNEPGYANVGGCCQKIRGLASSIQFAFALAGGNVPQNTDTFNGGTIKVYGWN Protein 2: LVIVDAVTLLSAYPEASRDPAAPTVIDGRHLYVVSPGDAAQLGHNDSRLFTGLSPGDQLHLRETALALRAEVSVLFIRFALKDAGIVAPIELEVRDAAT AVPDADDLLHPSCRPLKDHYWRSDVLAAGATTCTADFAVCDRDGTVSGYFRWETSIEIAGSQPDTKQPGFKPSS Protein 3: PLLSASIVSAPVVTSETYVDIPGLYLDVAKAGIRDGKLQVILNVPTPYATGNNFPGIYFAIATNQGVVADGCFTYSSKVPESTGRMPFTLVATIDVGSG VTFVKGQWKSVRGSAMHIDSYASLSAIWGTAAPSSQGSGNQGAETGGTGAGNIGGGG Protein 4: ADSQTSSNRAGEFSIPPNTDFRAIFFANAAEQQHIKLFIGDSQEPAAYHKLTTRDGPREATLNSGNGKIRFEVSVNGKPSATDARLAPINGKKSDGSPF TVNFGIVVSEDGHDSDYNDGIVVLQWPIG Aliphatic index Grand average of hydropathy Hydrofobní/hydrofilní proteiny? Membránové proteiny? Grand average of hydropathy Protein 1: DPIALTAAVGADLLGDGRPETLWLGIGTLLMLIGTFYFIVKGWGVTDKEAREYYSITILVPGIASAAYLSMFFGIGLTEVQVGSEMLDIYYARYADWLF TTPLLLLDLALLAKVDRVSIGTLVGVDALMIVTGLVGALSHTPLARYTWWLFSTICMIVVLYFLATSLRAAAKERGPEVASTFNTLTALVLVLWTAYPI LWIIGTEGAGVVGLGIETLLFMVLDVTAKVGFGFILLRSRAILGDTEAPEPSAGAEASAAD Protein 2: KLAVYSTKQYDKKYLQQVNESFGFELEFFDFLLTEKTAKTANGCEAVCIFVNDDGSRPVLEELKKHGVKYIALRCAGFNNVDLDAAKELGLKVVRVPAY DPEAVAEHAIGMMMTLNRRIHRAYQRTRDANFSLEGLTGFTMYGKTAGVIGTGKIGVAMLHILKGFGMRLLAFDPYPSAAALELGVEYVDLPTLFSESD VISLHCPLTPENYHLLNEAAFDQMKNGVMIVNTSRGALIDSQAAIEALKNQKIGSLGMDVYENERDLFFEDKSNDVIQDDVFRRLSACHNVLFTGHQAF LTAEALTSISQTTLQNLSNLEKGETCPNELV Úkol 10: Porovnejte typický membránový a cytoplasmatický protein. Grand average of hydropathy PSORT •Predikce lokalizace proteinů v buňce (prokaryotická i eukaryotická). • •Lokalizace proteinů napomáhá určení (ověření) jejich funkce. • •Vypovídá o předpokládaných vlastnostech proteinů (cytoplasmatické x membránové). PSORT PSORT PSORT Cytoplasma Cytoplasmatická membrána Buněčná stěna Periplasmatický prostor Periplasmatický prostor Vnější membrána Gram pozitivní Gram negativní PSORT Cytoplasma Cytoplasmatická membrána Buněčná stěna Periplasmatický prostor Periplasmatický prostor Vnější membrána Gram pozitivní Gram negativní PSORT PSORT Protein 1: DPIALTAAVGADLLGDGRPETLWLGIGTLLMLIGTFYFIVKGWGVTDKEAREYYSITILVPGIASAAYLSMFFGIGLTEVQVGSEMLDIYYARYADWLF TTPLLLLDLALLAKVDRVSIGTLVGVDALMIVTGLVGALSHTPLARYTWWLFSTICMIVVLYFLATSLRAAAKERGPEVASTFNTLTALVLVLWTAYPI LWIIGTEGAGVVGLGIETLLFMVLDVTAKVGFGFILLRSRAILGDTEAPEPSAGAEASAAD Protein 2: KLAVYSTKQYDKKYLQQVNESFGFELEFFDFLLTEKTAKTANGCEAVCIFVNDDGSRPVLEELKKHGVKYIALRCAGFNNVDLDAAKELGLKVVRVPAY DPEAVAEHAIGMMMTLNRRIHRAYQRTRDANFSLEGLTGFTMYGKTAGVIGTGKIGVAMLHILKGFGMRLLAFDPYPSAAALELGVEYVDLPTLFSESD VISLHCPLTPENYHLLNEAAFDQMKNGVMIVNTSRGALIDSQAAIEALKNQKIGSLGMDVYENERDLFFEDKSNDVIQDDVFRRLSACHNVLFTGHQAF LTAEALTSISQTTLQNLSNLEKGETCPNELV Úkol 11: Analyzujte proteiny z Úkolu 10 pomocí nástroje PSORT. Oba proteiny pocházejí z Gram negativních bakterií. PSORT PSORT PSORT Protein 1: MKYKTVKSIPLFLLGSIVFTACSTPQSTFHLPVQTTVSAIKKDISGKTATAVKAASSSSSTTTSNDDNNQ KGYFLETNRSTGTYDPNNSTRLIKLGESGDFHAADQNKPEEALFERLYGGIASLLNFRIIKPALTYWNTV TPSLKAIGKSSNLITFSQDIDETELQRALANNLIVADDGNNNFWFGLKSLSFNSAKLTDNAQTQMAQKTT QAVTLKSQAQMSSTNTKNTNKKIDLRDKITLSSTMNTQGSGDNKNPSSGLIQKLVSVENIEAEFSFVKTG FNGNEIKFGDFVTENSPTTTQLKQVWKKKWGTELKKTNYKLQLNNFSLLLTYTPEVNKVEKGNNGDSNKG TIATPNGFSFLYPANLNETPSSSSSYWTNVTDLTKAATDTENTNLLNDLQKSQEQVNQFVAAITQNHLDV SEAALTKKQFGSLSISDFFKAIFKENGKDTKAKS Úkol 12: Student má za úkol izolovat zajímavý (pro vedoucího) protein z Gram negativní bakterie. Po několikadenním pěstování čtyř litrů kultury se student snažil získat z buněk protein (další týden práce), ale získal pouze mizivé množství… Jeho kolegyně si myslí, že se jedná o membránový protein, který je labilní a nevydrží proces izolace. Ověřte její teorii… PSORT Protein 1: LVIVDAVTLLSAYPEASRDPAAPTVIDGRHLYVVSPGDAAQLGHNDSRLFTGLSPGDQLHLRETALALRAEVSVLFIRFALKDAGIVAPIELEVRDAAT AVPDADDLLHPSCRPLKDHYWRSDVLAAGATTCTADFAVCDRDGTVSGYFRWETSIEIAGSQPDTKQPGFKPSS Úkol 13: Student má za úkol charakterizovat a navrhnout možnou funkci proteinu z Burkholderia cenocepacia. Pomozte mu. WoLF PSORT WoLF PSORT •Predikce lokalizace proteinů v eukaryotických buňkách (živočichové, rostliny, houby). • •Mnohem více možných lokalizací proteinů! WoLF PSORT Protein 1: MKWLLLLGLVALSECIMYKVPLIRKKSLRRTLSERGLLKDFLKKHNLNPARKYFPQWEAPTLVDEQPLENYLDMEYFGTIGIGTPAQDFTVVFDTGSSN LWVPSVYCSSLACTNHNRFNPEDSSTYQSTSETVSITYGTGSMTGILGYDTVQVGGISDTNQIFGLSETEPGSFLYYAPFDGILGLAYPSISSSGATPV FDNIWNQGLVSQDLFSVYLSADDQSGSVVIFGGIDSSYYTGSLNWVPVTVEGYWQITVDSITMNGEAIACAEGCQAIVDTGTSLLTGPTSPIANIQSDI GASENSDGDMVVSCSAISSLPDIVFTINGVQYPVPPSAYILQSEGSCISGFQGMNLPTESGELWILGDVFIRQYFTVFDRANNQVGLAPVA Protein 2: RKSTGGKAPRKQLATKAARKSAPATGGVKKPHRYRPGTVALREIRRYQKSTELLIRKLPFQRLVREIAQD FKTDLRFQSSAVMALQEASEAYLVGLFEDTNLCAIHAKR Úkol 14: Predikujte možnou lokalizaci proteinu z Homo sapiens a zkuste predikovat lokalizaci proteinu z Vampyroteuthis infernalis, i když je k dispozici jen fragment proteinu. Zisk informací o známých proteinech Struktura Funkce Gen Protein Protein je správně sbalený, aktivní, v dostatečném množství a koncentraci Optimální podmínky •Mnoho proteinů již bylo popsáno (sekvence, struktura, funkce). • •Informace o nich jsou sdruženy v databázích. http://www.ncbi.nlm.nih.gov/ EBI Evropský institut pro bioinformatiku http://www.ebi.ac.uk/ Center for Information Biology CIB Centrum pro informační biologii http://www.cib.nig.ac.jp/ National Center for Biotechnology Information NCBI Národní centrum pro biotechnologické informace Bioinformatická centra •Instituce zabývající se shromažďováním, správou a poskytováním dat a informací a vývojem analytických nástrojů. EBI/NCBI/CIB Bioinformatická centra Databáze Vyhledávací systém Vyhledávací systém •Textové vyhledávání může selhat (nedostatečná anotace). • •Vyskytuje se shodná nebo podobná sekvence v databázi? (Identifikace možné funkce na základě homologie.) • •Specializované nástroje (algoritmy) pro „seřazení“ (alignment) sekvencí. • • RKSTGGKAPRKQLATKAARKSAPATGGVKKPHRYRPGTVALREIRRYQKSTELLIRKLPFQRLVREIAQDFKTDLRFQSSAVMALQEASEAYLVGLFED TNLCAIHAKR Podobné sekvence… BLAST Protein 2: RKSTGGKAPRKQLATKAARKSAPATGGVKKPHRYRPGTVALREIRRYQKSTELLIRKLPFQRLVREIAQDFKTDLRFQSSAVMALQEASEAYLVGLFED TNLCAIHAKR BLAST Úkol 15: Použijte BLAST a pokuste se blíže určit funkci proteinu z Vampyroteuthis infernalis. 220px-Vampyroteuthis_infernalis Použitá literatura •Ramadevi Mohan, Subhashree Venugopal. Computational structural and functional analysis of hypothetical proteins of Staphylococcus aureus, Bioinformation 8(15): 722-728, 2012. • •ExPASy server: http://www.expasy.org • •ProtParam dokumnetace: http://web.expasy.org/protparam/protparam-doc.html • •Elisabeth Gasteiger et al. Protein Identification and Analysis Tools on the ExPASy Server, in John M. Walker (ed): The Proteomics Protocols Handbook, Humana Press, 571-607, 2005. • •Kunchur Guruprasad et al. Correlation between stability of a protein and its dipeptide •composition: a novel approach for predicting in vivo stability of a protein from its primary sequence, Protein Engineering 4(2): 155-161, 1990. • •PSORTb dokumentace: http://www.psort.org/documentation/index.html • •WoLF PSORT dokumentace: http://wolfpsort.org/aboutWoLF_PSORT.html.en Doporučená literatura •Panu Artimo et al. ExPASy: SIB bioinformatics resource portal, Nucleic Acids Research 40: W597-W603, 2012. • •Christopher T. Walsh et al. Protein Posttranslational Modifications: The Chemistry •of Proteome Diversifications, Angewandte Chemie (International ed. in English) 44: 7342-7372, 2005. • •Jagat S. Chauhan et al. GlycoPP: A Webserver for Prediction of N- and O- Glycosites •in Prokaryotic Protein Sequences, PLoS ONE 7(7): 1-13, 2012. • •Nancy Y. Yu et al. PSORTb 3.0: improved protein subcellular localization prediction •with refined localization subcategories and predictive capabilities for all prokaryotes, Bioinformatics 26(13): 1608–1615, 2010. • •Paul Horton et al. WoLF PSORT: protein localization predictor, Nucleic Acids Research, 2007. • •Stephen F. Altschul. BLAST Algorithm, in Encyclopedia of Life Sciences (ELS), John Wiley & Sons, Ltd: Chichester, 2005.