C3211 Aplikovaná bioinformatika Blok 3: Funkce proteinů Úloha 1: Vyhledejte homologní proteiny k následující sekvenci pomocí Blastu na serveru UniProt (http://www.uniprot.org/). Pokuste se na základě výsledku určit funkci tohoto proteinu. Sekvence: SHLSQPWPITCFADRPTPRRSSPDASGQTMHSVFVVHVPYPVVFLKPAHLTPQWYRHPIPVNPVVRQPHLPVLYPAPNAGHTPAHSRQGDAALQPLFSV PQTVNPTGPVIHGDVAKQKPDTGQSWALNPYCTENWRRILRISRNSHGQRMPLTTLLQKTSGRNATLITKNSDQNTTTSIVSESSMTISACCHSAILRN N Úloha 2: Vyhledejte pomocí nástroje CD search (NCBI) konzervované domény následujícího proteinu (http://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi). Protein: PEVRSSTQSESGMSQWMGKILSIRGAGLIIGVFGLCALIAATSVTLPPEQQLIVAFVCVVIFFIVGHKPSRRSQIFLEVLSGLVSLRYLTWRLTETLSF DTWLQGLLGTMLLVAELYALMMLFLSYFQTIAPLHRAPLPLPPNPDEWPTVDIFVPTYNEELSIVRLTVLGSLGIDWPPEKVRVHILDDGRRPEFAAFA AECGANYIARPTNEHAKAGNLNYAIGHTDGDYILIFDCDHVPTRAFLQLTMGWMVEDPKIALMQTPHHFYSPDPFQRNLSAGYRTPPEGNLFYGVVQDG NDFWDATFFCGSCAILRRTAIEQIGGFATQTVTEDAHTALKMQRLGWSTAYLRIPLAGGLATERLILHIGQRVRWARGMLQIFRIDNPLFGRGLSWGQR LCYLSAMTSFLFAVPRVIFLSSPLAFLFFGQNIIAASPLALLAYAIPHMFHAVGTASKINKGWRYSFWSEVYETTMALFLVRVTIVTLLSPSRGKFNVT DKGGLLEKGYFDLGAVYPNIILGLIMFGGLARGVYELSFGHLDQIAERAYLLNSAWAMLSLIIILAAIAVGRETQQKRNSHRIPATIPVEVANADGSII VTGVTEDLSMGGAAVKMSWPAKLSGPTPVYIRTVLDGEELILPARIIRAGNGRGIFIWTIDNLQQEFSVIRLVFGRADAWVDWGNYKADRPLLSLMDMV LSVKGLFRSSGDIVHRSSPTKPSAGNALSDDTNNPSRKERVLKGTVKMVSLLALLTFASSAQAASAPRAVAAKAPAHQPEASDLPPLPALLPATSGAAQ AGSGDAGADGPGSPTGQPLAADSADALVENAENTSDTATVHNYTLKDLGAAGSITMRGLAPLQGIEFGIPSDQLVTSARLVLSGSMSPNLRPETNSVTM TLNEQYIGTLRPDPAHPTFGPMSFEINPIFFVSGNRLNFNFASGSKGCSDITNDTLWATISQNSQLQITTIALPPRRLLSRLPQPFYDKNVRQHVTVPM VLAQTYDPQILKSAGILASWFGKQTDFLGVTFPVSSTIPQSGNAILIGVADELPTSFGRPQVNGPAVLELPNPSDANATILVVTGRDRDEVITASKGIA FASAPLPTDSHMDVAPVDIAPRKPNDAPSFIAMDHPVRFGDLVTASKLQGTGFTSGVLSVPFRIPPDLYTWRNRPYKMQVRFRSPAGEAKDVEKSRLDV GINEVYLHSYPLRETHGLIGAVLQGVGLARPASGMQVHDLDVPPWTVFGQDQLNFYFDAMPLARGICQSGAANNAFHLGLDPDSTIDFSRAHHIAQMPN LAYMATVGFPFTTYADLSQTAVVLPEHPNAATVGAYLDLMGFMGAATWYPVAGVDIVSADHVSDVADRNLLVISTLATSGEIAPLLSRSSYEVADGHLR TVSHASALDNAIKAVDDPLTAFRDRDSKPQDVDTPLTGGVGAMIEAESPLTAGRTVLALLSSDGAGLNNLLQMLGERKKQANIQGDLVVAHGEDLSSYR TSPVYTIGTLPLWLWPDWYMHNRPVRVLLVGLLGCILIVSVLARALARHAARRFKQLEDERRKS Úloha 3: V následujícím proteinu byla zjištěna kombinace rhodanasové a ankyrinové domény. Zjistěte, zda je tento případ unikátní a v jakých jiných kombinacích se tyto domény v přírodě vyskytují. Použijte aplikaci CDART (http://www.ncbi.nlm.nih.gov/Structure/lexington/lexington.cgi). Sekvence: MNTRSFHRIDVHKARELLQRPDTVLLDCRHPSDFRAGHIAGASPLGDYNADDHVLNIAKHRPVLIYCYHGNASQMRAQLFADFGFAEVYSLDGGYEAWR KVHTPANSQLTEALQCWLMAQEFPAADIHARTRDGVTPLMRAAGEGDPARVAELLAAGADPHQRNNDGNQALWFACVSENLDTLDLLVAVGAHLNHQND NGATCLMYAASAGKTAVVERLLAFGADRSLLSLDDFTALDMAANLECLNLLRETPRRIKAVT Úloha 4: Pokuste se určit funkci následujícího proteinu pomocí databáze Pfam (http://pfam.sanger.ac.uk). Protein: MRYIRLCIISLLATLPLAVHASPQPLEQIKQSESQLSGRVGMIEMDLASGRTLTAWRADERFPMMSTFKVVLCGAMLARVDAGDKQLERKIHYRQQDLV DYSPVSEKHLADGMTVGELCAAAITMSDNSAANLLLATVGGPAGLTAFLRQIGDNVTRLDRWETELNEALPGDARDTTTPASMAATLRKLLTSQRLSAR SQRQLLQWMVDDRVAGPLIRSVLPAGWFIADKTGASKRGARGIVALLGPNNKAERIVVIYLRDTPASMAERNQQIAGIGAALIEHWQR Odhadněte, které z vyznačených aminokyselin mají vliv na správnou funkci či strukturu proteinu. Úloha 5: Pokuste se určit funkci následujícího proteinu pomocí serveru InterProScan (http://www.ebi.ac.uk/Tools/pfa/iprscan/). Sekvence: MTELKNDRYLRALLRQPVDVTPVWMMRQAGRYLPEYKATRAQAGDFMSLCKNAELACEVTLQPLRRYPLDAAILFSDILTIPDAMGLGLYFEAGEGPRF TAPVTCKADVDKLPIPDPEDELGYVMNAVRTIRRELKGEVPLIGFSGSPWTLATYMVEGGSSKAFTVIKKMMYADPQALHLLLDKLAKSVTLYLNAQIK AGAQSVMIFDTWGGVLTGRDYQQFSLYYMHKIVDGLLRENDGRRVPVTLFTKGGGQWLEAMAETGCDALGLDWTTDIADARRRVGHKVALQGNMDPSML YAPPARIEDEVATILAGFGQGEGHVFNLGHGIHQDVPPEHAGAFVEAVHRLSAQYHN Úloha 6: Následující sekvenci hypotetického proteinu analyzujte pomocí serveru Propsearch (http://abcis.cbs.cnrs.fr/propsearch/) Sekvence: MASPSILKKYGKYFEYCPLEERMIELAKKGEIADAMLLFEKEKPSEFVYKGDAIEKRLRNIYLSTRLGVKAKINFNDYVIPRDLRWMLDIYESYLNMGE NKVFLILGGELRYLIDFFESYLQFKGFYLLVVKEAKDLLRFRNTCHYDAIIFSDSSILEYQNVDELKNLFNSLETTLKVHNRKNSVKVLLSPALPKAIM SSKPYKVLEQFFKEKGIEMEGILPYQLNADDKLLPPHFHNSEMEKSKEYRELESKTKVYIQEFLKKANMNDENEGNDNQKNTN Úloha 7: Pomocí serveru SMART (http://smart.embl-heidelberg.de/) analyzujte domény v následující sekvenci a následně pomocí serveru STRING (http://string-db.org) prozkoumejte pravděpodobné zapojení v metabolismu. Sekvence: MSIEHILIIDDDPHILALLSEILGARNFSVSSAPGVKQAIKQISNCPFDLIISDMNMPDGSGLDIIQYTKQHRPQTPILVITAFGTIQNAVEAMRFGAF NYLTKPFSPDALFTLIAKAEELQALQQDNLFLQSQGSSISHPLIAESPSMKQLLDKARRAANSSANIFVHGESGCGKENLSFFIHKHSPRSTKPYIKVN CAAIPDTLLESEFFGHEKGAFTGATTKKVGRFELAHQGTLLLDEITEIPIHLQAKLLRAIQEQEFEHIGGIKTLPVNIRFLATSNRDLEEAIETKVLRQ DLYYRLSVISLHIPPLRDRKEDILPLAHYYLEKFCKMNNKPPKTLSLEAQRNLLDYSWPGNVR ELSNVLERTVILENDPAITPSMLALL