Blok 3 Funkce proteinů C3211 Aplikovaná bioinformatika Přednášející: Josef Houser • Jako funkci označujeme obvykle činnost, kterou je protein schopen provádět v organismu • Protein může mít jen jednu funkci, ale také více funkcí • Část proteinu, která má vlastní funkci, je obvykle označovaná jako doména Podle hlavních funkcí rozeznáváme mezi proteiny: • Enzymy-7 hlavních tříd ^ Strukturní proteiny - keratin, 4$jb%gen • Transportní proteiny - přenašeče, kanály • Obranné proteiny - protilátky • Regulátory a receptory - hormony, transkripční faktory, rhodopsin ■ • • Klasifikace enzymů Enzymy jsou proteiny, které katalyzují chemickou xy reakci - snižují aktivační energii nutnou pro přeměnu substrátu na produkt Dělíme je podle typu reakce, kterou katalyzují U) o c o o ■o c re <0 initial state Aktivační energie reakce bez enzymu Aktivační energie reakce s enzymem final state Course of reaction Upraveno z http://www1 .lsbu.ac.uk/ Klasifikace enzymů Dle IUBMB: https://www.qmul.ac.uk/sbcs/iubmb/enzyme/ Třída Charakteristika 1 Oxidoreduktasy Katalyzují různé redoxní reakce - přenos vodíku, kyslíku, elektronů (obvykle s využitím koenzymů, např. NADH, NADPH, FADH2 nebo hernu) 2 Tra n sf e rasy Katalyzují přenos skupin: amino-, metyl-, acyl-, glykosyl-, fosforyl- 3 Hydrolasy Katalyzují hydrolytické štěpení vazeb mezi atomem uhlíku a jinými atomy (spotřebování molekuly H20) 4 Lyasy Katalyzují adiční reakci na dvojné vazbě nebo eliminační reakci mezi 2 atomy uhlíku za vzniku dvojné vazby 5 Isomerasy Katalyzují racemizaci optických izomerů nebo vytvoření polohových izomerů 6 Ligasy Katalyzují tvorbu vazeb mezi uhlíkem a jinými atomy spojenou se štěpením ATP 7 Translokasy Membránové enzymy, které zajišťují aktivní transport látek s využitím energie ATP Jejich funkcí je přenos látek přes membránu. Přenášena může být molekula (např. glukosa), iont (např. K+Aj^ebo elektron. Přenos může probíhat pasivně (ve smě^íPkoncentrace) nebo aktivně (proti směru koncentrace). U aktivního transportu je typicky přenášena víc nezjedná částice (přenos jedné částice ve směru koncentračního gradientu umožňuje přenos druhé částice proti směru jejího koncentračního gradientu) nebo je ^ přenos spojený s chemickou reakcí » * Protein channel membrane Intracellular space Dle TCDB (transporter classification database): http://qmul.ac.uk/sbcs/iubmb/mtp/ 1 2 3 4 5 6 7 8 9 Póry a kanály Přenašeče řízené elektrochemickým potenciálem Přenašeče řízené chemickou reakcí Skupinové přenašeče Transmembránové elektronové přenašeče Nepřiřazeno Nepřiřazeno Accessory factors involved in transport Nedostatečně charakterizované transportní systémy Protilátky Protilátky slouží jako obrana organismu proti patogenům U člověka existuje několik typů protilátek, které se liší funkcí, strukturou i relativním zastoupentófcv krevní plazmě • Protilátky jednotlivých typů mají velmi konzervovanou celkovou strukturu, ^ se zejména v sekvenci krátkých variabilních úseků • U jiných živočichů se vyskytují i jiné typy protilátek IgA 2 Monomer/dimer, přítomna ve slinách, slzách (15%) IgD 1 Monomer, funkce neznámá (0,2%) IgE 1 Monomer, obrana proti parazitům, význam pro alergické reakce (0,002%) IgG 4 Monomer, hlavní lidská protilátka v sekundární imunitní odpovědi (75%) IgM 1 Pentamer, hlavní protilátka v primární imunitní odpovědi (10%) Protilátky obratlovců Většinu protilátek máme společnou s dalšími obratlovci Příklady dalších protilátek některých obratlovců: - IgY-ptáci (např. kur domácí) - hdgG-velbloudi, lamy ♦<^P^ - IgNAR-žraloci člověk pták velbloud žralok IgY IgNAR Upraveno dle Kalenik2014 Experimentální — Izolace proteinu s konkrétní funk&j^ k — Stanovení funkce u konkrétního proteinu Predikce - na základě podobnosti — Lokalizace — Multiple sequence alignment (BLAST, Pfam) — Struktura molekuly (ProFunc, Catalytic site atlas) — Textové hledání v publikacích (STRING) íi • Izolace proteinu s konkrétní funkcí - Typický vstupní materiál je lyzát (rozemletá rostlina, k V^lyzované krvinky, rozdrcená tkáň,...)^^ ť — Provede se separační krok (např. filtrace) a určí, ve které části zůstala zachována sledo^ná funkce - Část s funkcí se podrobí dalšímu separačnímu kroku a opět se určí, ve které frakci zůstala aktivita Á - Postupně se odstraní všechny části bez aktivity až zůs^afne čistý aktivní protein - Tento protein je identifikován (např. hmotnostní spektrometrií) 12 Stanovení funkce u konkrétního proteinu -.^čistého proteinu je možno stanovit experimentálně vV^aktivitu v různých testech (tzv. functional assays) - Je nutno mít odhad (např. na základě příbuznosti), o jakou aktivitu se může jednat, jincd^fe její určení otázkou náhody - Existují stovky různých ranných aktivit zahrnující tisíce (ne-li miliony) možných substrátů. J$ Pro mnohé reakce navíc neexistuje vhodný laboratorní test —» náhodné určení proteinové funkce je téměř vyloučeno 13 Situace - Přichází za Vámi méně zkušený kolega, např. mladší student, s roztokem proteinu ve zkumavce a otázkou: Jo kou funkci má tento protein ?< • Nabízí se několik řešení • Nezavrhujte ta jednoduchá ^ Určení funkce proteinu 1. U komerčně dodávaného proteinu bývá funkce uvedena (většinou je známa) 2. Ten kdo protein připravil má často reálnou představu d jeho funkci (většinou ví, proč se jím zabývaJZ Jakou funkci má tento protein? I 3. Nemáme-li jiný zdroj informací, je možno funkc^TV predikovat pomocí SW nástrojů • Někteugzákladní informace o proteinu mohou pomoct: ~ Lokalizace-predikce lokalizace (např. hledání signálních y peptidů) může napovědět KDE se daný protein realizuje - Hydrofobicita - může napovědět, že protein se nachází v membráně nebo uvnit&j^roteinového komplexu - pl - některé proteirníjViají typické hodnoty izoelektrického bodu (např. histony jsou bazické —> pl > 7) *oS Je nutno znát sekvenci • Qgtabáze - pracujeme-li se známým proteinem |V Sekvenace - pracujeme-li s ne^íŽmým proteinem nebo pro ověření identity proteinu Ještě lepší je znát strukturu (2D, 3D) • Databáze - u známých proteinů • Určení 2D struktury (viz. minulá přednáška) • UrčemSD struktury (viz. příští přednáška) Proteinové domény • DoméjaŠr- část proteinu s vlastní aktivitou nebo strukturní funkcí (více v bloku o 3D a AD struktuře N\proteinů) • Domény často obsahují sekvenční motiv, který můžeme nalézt u více^řoteinů se stejnou nebo podobnou funkcí - konzervované domény ■ 18 Mnoho proteinů obsahuje více než jednu funkční doménu V jednom proteinu se mohou zároveň vyskytovat enzymatické, strukturn^friterakční domény Vzájemné uspořádání domén může být charakteristické pro některé proteinové rodiny Proteinové rodiny • Proteiny se na základě své struktury (a funkce) řadí do hierarchických skupin. Většinou rozlišujeme: ^Proteinová nadrodina ^> - Proteinová rodina - Proteinová podrodina • Pro charakterizaci proteinových rodin se často používá Multiple sequence ajtenment (MSA) s aplikací skrytých Markovových mo<í&ki (HMM) Dělení na základě doménového uspořádání a proteinových rodirWSftuže ale nemusí být totožné 20 Databáze strukturních a funkčních motivů st o Neanotované, nerevidované - „slepé" přebírání dat o Anotované, revidované - probíhá kontrola y vkládaných dat .A° • Obsahují různé informace- sekvenční, strukturní, odkazy na experim&BJŕalni data,... • Slouží jako zdroj informací pro nadstavbové programy Často navzájem provázané. Např.: • UniProtKB - kombinovaná proteinová databáze, vč. ř biologických dat .^S° • Pfam - databáze proteinogen rodin odvozená z UniProtKB • KEGG - složená da^roáze obsahující systémové, 22 -^ ^u Nejčastěji využíváme vyhledávání pomocí sekvence fyářb Nedávání pomocí párového alignmentu, např. BLAST) ^ Méně časté je vyhledávání pomocí klíčových slov (např. lokalizace, známé vlastnosti,...) ^> Známe-li konkrétní záznam, je možno hledat rovněž pomocí identifikačního čísla <^ Úloha 1 > Vyhledejte homologní proteiny k následující sekvenci pomocí nástoje BLAST na serveru UniProt (http://www.uniprot.org/). Alze na základě výsledku určit funkci tohoto proteinu? SHLSQPWPITCFADRPTPRRSSPDASGQTMHSVFVVHVPYPWFLKPAH LTPQWYRHPIPVNPWRQPHLPVLYPAPNAGHTPAHSRQGDAALQPLF SVPQTVNPTGPVIHGDVAKQKPDTGQSWALNPYCTENWRRé^lSRNS HGQRMPLTTLLQKTSGRNATLITKNSDQNTTTSIVSESSMTISACCHSAIL RNN K0> 24 (Protein Families) PfCIfYl http://pfam.xfam.org/ • Spravuje ji EBI (Evropský institut pro bioinformatiku) • Databáze proteinových rodin, vytvořená na základě Multiple sequence alignmentů (MSA) a Skrytých Markovových modelů (HMM) ao^ • Na základě výsledků je možné určovat typické oblasti - proteinové domény ^ Pozor funkcionality databáze Pfam byly přemístěny do Interpro 25 ^ Úloha 2 > Pokuste se určit funkci následujícího proteinu pomocí databáze Pfam (https://pfam.xfam.org/). Sekvence: MRYIRLCIISLLATLPLAVHASPQPLEQIKQSESQLSGRVGMIEMDLASGRTLTAWRADERFPMMSTFKV RVDAGDKQLERKIHYRQQDLVDYSPVSEKHLADGMTVGELCAAAITMSDNSAANLLLATVGGPAGLTAFLRQIGDNV TRLDRWETELNEALPGDARDTTTPASMAATLRKLLTSQRLSARSQRQLLQWMVDDRVAGPLIRSVLPAGWFIADKTG ASKRGARGIVALLGPNNKAERIVVIYLRDTPASMAERNQQIAGIGAAL IEHWQR > Odhadněte, kt&ré z vyznačených aminokyseli^Smají vliv na správnou funkci či strukturu proteinu. (Simple Modular Architecture Research Tool) http://smart.embl-heidelberg.de/ Rozpoznává přes 500 rodin proteinových domén Prohledávání dle sekvencí, domén, druhů i vyšších taxonů Umožňuje také vyhledávání podle zvolených kombinací domén - vhodné pro vícedoménové proteiny *c Úloha 3 > Pomíteí Serveru SMART (http://smart.embl-heidelberg.de/) v identifikujte domény v následujícLs^Kvenci. Sekvence: MSIEHILIIDDDPHILALLSEILGARNFSVSSAPGVKQAIKQISNCPFDLIISDMNMPDGSGLDII ' QYTKQHRPQTPILVITAFGTIQNAVEAMRFGAFNYLTKPFSPDALFTLIAKAEELQALQQDNLF LQSQGSSISHPLIAESPSMKQLLDKARRAANSSANIFVHGESGCGKENLSFFIHKHSPRSTKPYI KVNCAAIPDTLLESEFFGHEKGAFTGATTKKVGRFELAHQGTLLLDEITEIPIHLQAKLLRAIQE QEFEHIGGIKTLPVNIRFLATSNRDLEEAIETKVLRQDLYYRLSVISLHIPPLRDRKEDILPLAHYYL EKFCKMNNKPPKTLSLEAQRNLLDYSWPGNVR ELSNVLERTVILENDPAITPSMLALL 28 Databáze konzervovaných domén - conserved domain database ~ http://www.ncbi.nlm.nih.Rov/Structure/cdd/cdd.shtml • Spravovaná Národním centrem pro biotechnologické informace (NCBI) ^sŕ5 • Obsahuje přehlede informace o známých proteinových doménách • Shromažďuje data z různých zdrojů 29 CDD zdroje Abbreviation Database Name Description SMART Simple ModularArchitecture ResearchTool SMART is a web tool for the identification and annotation of orotein domains, and provides a platform for the comparative study of complex domain architectures in genes and proteins. SMART is maintained by Chris Ponting, Peer Bork and colleagues, mainly at the EMBL Heidelberg. CDD contains a large fraction of the SMART collection. Pfam Protein families Pfam is a lame collection of multiple sequence alianments and hidden Markov models covering many common protein domains and families. Pfam is maintained by Alex Bateman and colleagues, mainly at the Wellcome Trust Sanger Institute. CDD contains a large fraction of the Pfam collection. COGs Clusters of OrthologousGroups of proteins COGs is an NCBI-curated protein classification resource. Sequence alignments corresponding to COGs are created automatically from constituent sequences and have not been validated manually when imported into CDD. TIGRFAM The Institute forGenomic Research's database of proteinfamilies TIGRFAM. a research proiect of the J. Craia Venter Institute, is a collection of manually curated protein families from The Institute for Genomic Research and consists of hidden Markov models (HMMs), multiple sequence alignments, Gene Ontology (GO) terminology, cross-references to related models in TIGRFAM and other databases, and pointers to literature. PRK PRotein K(c)lusters Protein Clusters is an NCBI collection of related protein sequences (clusters') consistina of Reference Seauence oroteins encoded bv comolete orokarvotic and chloroplast plasmids and genomes. It includes both curated and non-curated (automatically generated) clusters. 30 Úloha 4 > Vyhledejte pomocí nástroje CD search (NCBI) (https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi) konzervované domény následujícího proteinu. Sekvence: PEVRSSTQSESGMSQWMGKILSIRGAGLIIGVFGLCALIAATSVTLPPEQQLIVAFVCVVIFFIVGHKPSRRSQIFLEVLSGLVSLRYLTWRLT ETLSFDTWLQGLLGTMLLVAELYALMMLFLSYFQTIAPLHRAPLPLPPNPDEWPTVDIFVPTYNEELSIVRLTVLGSLGIDWPPEKVRVHIL DDGRRPEFAAFAAECGANYIARPTNEHAKAGNLNYAIGHTDGDYIUFDCDHVPTRAFLQLTMGWMVEDPKIALMQTPHHFYSPDPF QRNLSAGYRTPPEGNLFYGVVQDGNDFWDATFFCGSCAILRRTAIEQIGGFATQTVTEDAHTALKMQRLGWSTAYLRIPLAGGLATERLI LHIGQRVRWARGMLQIFRIDNPLFGRGLSWGQRLCYLSAMTSFLFAVPRVIFLSSPLAFLFFGQNIIAASPLALLAYAIPHMFHAVGTASKI NKGWRYSFWSEVYETTMALFLVRVTIVTLLSPSRGKFNVTDKGGLLEKGYFDLGAVYPNIILGLIMFGGLARGVYELSFGHLDQIAERAYL LNSAWAMLSLIIILAAIAVGRETQQKRNSHRIPATIPVEVANADGSIIVTGVTEDLSMGGAAVKMSWPAKLSGPTPVYIRTVLDGEELILPA RIIRAGNGRGIFIWTIDNLQQEFSVIRLVFGRADAWVDWGNYKADRPLLSLMDMVLSVKGLFRSSGDIVHRSSPTKPSAGNALSDDTNN PSRKERVLKGTVKMVSLLALLTFASSAQAASAPRAVAAKAPAHQPEASDLPPLPALLPATSGAAQAGSGDAGADGPGSPTGQPLAADSA DALVENAENTSDTATVHNYTLKDLGAAGSITMRGLAPLQGIEFGIPSDQLVTSARLVLSGSMSPNLRPETNSVTMTLNEQYIGTLRPDPA HPTFGPMSFEINPIFFVSGNRLNFNFASGSKGCSDITNDTLWATISQNSQLQITTIALPPRRLLSRLPQPFYDKNVRQHVTVPMVLAQTYD PQILKSAGILASWFGKQTDFLGVTFPVSSTIPQSGNAILIGVADELPTSFGRPQVNGPAVLELPNPSDANATILVVTGRDRDEVITASKGIAF ASAPLPTDSHMDVAPVDIAPRKPNDAPSFIAMDHPVRFGDLVTASKLQGTGFTSGVLSVPFRIPPDLYTWRNRPYKMQVRFRSPAGEA KDVEKSRLDVGINEVYLHSYPLRETHGLIGAVLQGVGLARPASGMQVHDLDVPPWTVFGQDQLNFYFDAMPLARGICQSGAANNAF HLGLDPDSTIDFSRAHHIAQMPNLAYMATVGFPFTTYADLSQTAVVLPEHPNAATVGAYLDLMGFMGAATWYPVAGVDIVSADHVSD VADRNLLVISTLATSGEIAPLLSRSSYEVADGHLRTVSHASALDNAIKAVDDPLTAFRDRDSKPQDVDTPLTGGVGAMIEAESPLTAGRTVL ALLSSDGAGLNNLLQMLGERKKQANIQGDLVVAHGEDLSSYRTSPVYTIGTLPLWLWPDWYMHNRPVRVLLVGLLGCILIVSVLARALA RHAARRFKQLEDERRKS (Conserved domain architecture retrieval tool) http://www.ncbi.nlm.nih.gov/Structure/lexington/lexington • Využívá anotované informace^clatabází Pfam a SMART ^ • Nevyhledává pouze izolované domény, ale zohledňuje jejich kombinace a vzájemná umístění v jednom proteinovém řetězci. Ko^ Úloha 5 r<#? > V nájfédujícím proteinu byla zjištěna kombinace rhodanasové a ankyrinové domény. Zjistěte, zda je ^ tento případ unikátní a v jakých^fnych kombinacích se tyto domény v přírodě vyskytují. Použijte aplikaci CDART ^ (http://www.ncbi.nlm.nih.gov/Structure/lexington/ lexington.cgi). rAN $,dS Sekvence: MNTRSFHRIDVHKARELLQRPDTVLLDCRHPSDFRAGHIAGASPLGDYNADDHVLNIAKHRPVUYCYHG NASQMRAQLFADFGFAEVYSLDGGYEAWRKVHTPANSQLTEALQCWLMAQEFPAADIHARTRDGVTPL MRAAGEGDPARVAELLAAGADPHQRNNDGNQALWFACVSENLDTLDLLVAVGAHLNHQNDNGATCL MYAASA GKTAVVERLLAFGADRSLLSLDDFTALDMAANLECLNLLRETPRRIKAVT 33 PROPSEARCH - Když selželilignmin^ J. Mol. Biol. (1995) 251. 390-399 Proteiny, které nemají blízké homology je těžké predikovat PROPSEARCH neprovádí alignment ,^ Porovnává složení (zastoupení) X^5V aminokyselin, molekulovou hmotnost, izoelektrický bod, atd. > celkem 144 různých parametrů Snaha zařadit protein do funkční rodiny Další studium sekvence nutné ! jmb A Sequence Property Approach to Searching Protein Databases Uwe Hobohm and Chris Sander" EMBL-Europeau Molecular Biology Laboratoři/, D-69012 Heidelberg, Germany *ComSfOttálng author Currently available sequence alignment programs are generally not capable of detecting functional and structural homologs in the twilight zone of sequence similarity, i.e. when the sequence identity falls below about 25%. Here we attempt to detect such weak similarities using an approach based on a notion of protein sequence similarity radically different from that used in sequential alignment. The approach defines protein sequence dissimilarity (or distance) as a weighted sum of differences of compositional properties such as singlet and doublet amino acid composition, molecular weight, isoelectric point (protein property search or PropSearch). With PropSearch, either single sequences can be used for a database query, or multiple sequences can be merged into an "average" sequence reflecting the average composition of a protein family First, we show that members of structural protein families have a low mutual PropSearch distance when the weights are optimized to discriminate maximally between structural families. Second, we demonstrate the results of database searches using the PropSearch method. Such searches are very rapid when scanninga preprocessed database and do not require alignments. In cases in which conventional alignment tools fail to detect similarities, PropSearch can be used to generate hypotheses about possible structural or functional relationships between a new sequence and sequences in the database. i 1995 Academic Press Limited Kiyuvrtls: amino acid composition; database search; structural homologs Introduction After sequencing a novel all cases the researcher is left without functional or structural information (Borkt'M/., 1992). However, in 34 V kombinaci je síla... Máme-li možnost, je vždy lépe kombinovat informace z různých zdrojů ^ • Minimalizujeme tak náhodné chyby a maximalizujeme pravděpodobnost správné predikce http://www.ebi.ac.uk/Tools/pfa/iprscan/ Společné vyhledávací rozhraní, které využívá různé databáze pro > maximalizaci výstupu %oS Slouží pro analýzu proteinové sekvence pomocí 14 různých aplikací v jednom běhubS Spravuje jej EBI (Evropský institut pro bioinformatiku); InterP ro Classification of protein families 36 Úloha 6 > Pokuste se určit funkci následujícího proteinu pomocí serveru InterProScan t^ (http://www.ebi.ac.uk/Tools/pfa/iprscan/). Sekvence: MTELKNDRYLRALLRQPVDVTPVWMMRQAGRYLPEYKATRAQAGDFMSLCKNAELACEV TLQPLRRYPLDAAILFSDILTIPDAMGLGLYFEAGEGPRFTAPVTCKADVDKLPIPDPEDELGYV MNAVRTIRRELKGEVPLIGFSGSPWTLATYMVEGGSSKAFTVIKKMMYADPQALHLLLDKLA KSVTLYLNAQIKAGAQSVMIFDTWGGVLTGRDYQQFSLYYMHKIVDGLLRENDGRRVPVTLF TKGGGQWLEAMAETGCDALGLDWTTDIADARRRVGHKVALQGNMDPSMLYAPPARIEDE VATILAGFGQGEGHVFNLGHGIHQDVPPEHAGAFVEAVHRLSAQYHN 37 http://string-db.org STRING Vyhledává funkční vazby mezi proteiny Po zadání zkoumaného proteinu (sekvence, názvu) vyhledá další proteiny ve vztahu k zadanémiK^ Souvislosti hledá na základě:, databázových informací výskytu v genorrWb^ metabolických drah experimentálních interakcí textového hledání gene neighborhoods in S. cerevisia: in other organisms: none 38 neighborhoods gene fusions » cz> in S. cerevisia: none in other organisms: none gene cooccurrence in S. cerevisiae: in other organisms: co-expression in S. cerevisiae: in other organisms: \ 6 non-random pairs 10 coexpressed pairs support from 14 organisms experiments in S. cerevisiae in other organsims: 562 interaction records 1178 records from 15 orgs. databases in S. cerevisiae: in other organisms: 85 annotated pathways 300 pathways from 26 orgs. textmining in S. cerevisiae: in other organsims: 1817 publications 2436 publications, 52 orgs. *r Úloha 7 ^ > Ponoří serveru STRING (http://string-db.org) prozkoumejte zapojení tohoto lidského proteinu v ^ metabolismu. aoS Sekvence: MQRSPLEKASVVSKLFFSWTRPILRKGYRQRLELSDIYQIPSVDSADNLSEKLEREWDRELASKKNPKLINALRRCFFWRFMFYGIFLYLGE VTKAVQPLLLGRIIASYDPDNKEERSIAIYLGIGLCLLFIVRTLLLHPAIFGLHHIGMQMRIAMFSLIYKKTLKLSSRVLDKISIGQLVSLLSNNL NKFDEGLALAHFVWIAPLQVALLMGLIWELLQASAFCGLGFLIVLALFQAGLGRMMMKYRDQRAGKISERLVITSEMIENIQSVKAYCW EEAMEKMIENLRQTELKLTRKAAYVRYFNSSAFFFSGFFVVFLSVLPYALIKGIILRKIFTTISFCIVLRMAVTRQFPWAVQTWYDSLGAINKI QDFLQKQEYKTLEYNLTTTEVVMENVTAFWEEGFGELFEKAKQNNNNRKTSNGDDSLFFSNFSLLGTPVLKDINFKIERGQLLAVAGSTG AGKTSLLMMIMGELEPSEGKIKHSGRISFCSQFSWIMPGTIKENIIFGVSYDEYRYRSVIKACQLEEDISKFAEKDNIVLGEGGITLSGGQR ARISLARAVYKDADLYLLDSPFGYLDVLTEKEIFESCVCKLMANKTRILVTSKMEHLKKADKILILHEGSSYFYGTFSELQNLQPDFSSKLMGC DSFDQFSAERRNSILTETLHRFSLEGDAPVSWTETKKQSFKQTGEFGEKRKNSILNPINSIRKFSIVQKTPLQMNGIEEDSDEPLERRLSLVP DSEQGEAILPRISVISTGPTLQARRRQSVLNLMTHSVNQGQNIHRKTTASTRKVSLAPQANLTELDIYSRRLSQETGLEISEEINEEDLKECF FDDMESIPAVTTWNTYLRYITVHKSLIFVLIWCLVIFLAEVAASLVVLWLLGNTPLQDKGNSTHSRNNSYAVIITSTSSYYVFYIYVGVADTLL AMGFFRGLPLVHTLITVSKILHHKMLHSVLQAPMSTLNTLKAGGILNRFSKDIAILDDLLPLTIFDFIQLLLIVIGAIAVVAVLQPYIFVATVPVI VAFIMLRAYFLQTSQQLKQLESEGRSPIFTHLVTSLKGLWTLRAFGRQPYFETLFHKALNLHTANWFLYLSTLRWFQMRIEMIFVIFFIAVTF ISILTTGEGEGRVGIILTLAMNIMSTLQWAVNSSIDVDSLMRSVSRVFKFIDMPTEGKPTKSTKPYKNGQLSKVMIIENSHVKKDDIWPSG GQMTVKDLTAKYTEGGNAILENISFSISPGQRVGLLGRTGSGKSTLLSAFLRLLNTEGEIQIDGVSWDSITLQQWRKAFGVIPQKVFIFSGT FRKNLDPYEQWSDQEIWKVADEVGLRSVIEQFPGKLDFVLVDGGCVLSHGHKQLMCLARSVLSKAKILLLDEPSAHLDPVTYQIIRRTLK QAFADCTVILCEHRIEAMLECQQFLVIEENKVRQYDSIQKLLNERSLFRQAISPSDRVKLFPHRNSSKCKSKPQIAALKEETEEEVQDTRL Porovnání predikce a experimentu • Predikci£9x + Rychlá (sekundy-hodiny), levná/dostupná (Freeware) . ^ Spolehlivá pro známé (!) proteiny a pro proteiny y s vysokou homologií ^cf - Pouze kvalitativní t \jr - Málo spolehlivá pro neznámé proteiny - Nepoužitelná pro unikátní případy ^ • Experiment: + Teoreticky použitelný pro libovolný protein ^& - Finančně (i miliony Kč) a časově náročný (minuty-hodiny + příprava vzorku = týdny až roky) ^xy" 40 O daném proteinu získej maximum informací Kombinuj různé predikční programy a přístupy Kriticky kontroluj SW výstuay^ 41