5/21/2012 Předpověď 3D-struktury a topologie bílkovin, strukturní a funkční klasifikace SCOP Structural Classification of Proteins (http://scop.mrc-lmb.cam.ac.uk/scop) ■■i- ;n.H |PSJ| ! 11.: ľ ■ ■! - The SCOP database, created by manual inspection and abetted by a battery of automated methods, aims to provide a detailed and comprehensive description of the structural and evolutionary relationships between all proteins whose structure is known. Family: Clear evolutionarily relationship Proteins clustered together into families are clearly evolutionarily related. Generally, this means that pairwise residue identities between the proteins are 30% and greater. However, in some cases similar functions and structures provide definitive evidence of common descent in the absense of high sequence identity; for example, many globins form a family though some members have sequence identities of only 15%. Superfamily: Probable common evolutionary origin Proteins that have low sequence identities, but whose structural and functional features suggest that a common evolutionary origin is probable are placed together in SUperfamiNes. For example, actin, theATPase domain of the heat shock protein, and hexakinase together form a superfamily. Fold: Major structural similarity Proteins are defined as having a common fold if they have the same major secondary structures in the same arrangement and with the same topological connections. Different proteins with the same fold often have peripheral elements of secondary structure and turn regions that differ in size and conformation. Proteins placed together in the same fold category may not have a common evolutionary origin: the structural similarities could arise just from the physics and chemistry of proteins favoring certain packing arrangements and chain topologies. i Hv»WiT>k4ii^Wn rumy, ^ ei*w*. |4jJl«1 CJfa » líHÍÍ] celý protein European Bioinformatics Institute - http://www.ebi.ac.uk/ Předpověď 3D-struktury/ foldu • Threading -„navlékání" • Homology modeling • Ab inicio metody Threading • „navlékání" = rozpoznání a přiřazení proteinového foldu aminokyselinové sekvenci • sekvence je porovnávána s databází existujících foldů (3D profilů) a na jejich základě jsou konstruovány 3D- modely • 3D profil - každému reziduu v 3D struktuře je přiřazena environmentálni proměnná (obsah polárních atomů v postranním řetězci, skrytá plocha, sekundární elementy, apod.) vycházející z předpokladu, že okolí rezidua je více konzervováno než aminokyselina samotná. • Reziduum může být také popsáno pomocí svých interakcí • Výsledná kvalita modelu shoda je popsána pomocí Z-skóre nebo energie • U multidoménových struktur je potřeba aminokyselinovou sekvenci rozdělit na jednotlivé domény a analyzovat je separátně PHYRE (3D-PSSM) http://www.bmm.icnet.uk/ Threading at 2D level and scoring at 3D level : matching of secondary structure elements, and propensities of the residues in the query sequence to occupy varying levels of solvent accessibility [Kelleyetal. (2000). J. Mol. Biol. 299, 499-520] Pro FIT http://www.proceryon.com/index.html Threading and scoring at 3D level : based on the use of Knowledge-Based Potentials that are derived from the database of existing structures [SippI & Hockner (1996) Structure 4, 15-19] Threading Protein Homology/analogY Recognition Engine (nástupce 3D-PSSM) •sekvenční „alignment" s porovnávanou strukturou •Využívá PSSMs (position-specific scoring matrix) generovanou metodou PSI-Blast jak pro cílovou sekvenci tak sekvencemi ze známých struktur. •Kopírování 3D souřadnica přepis jednotlivých reziduí podle zkoumané sekvence •Následně porovná shodu profilů cílové sekvence a porovnávané struktury společně se shodou jejich sekundárních struktur. •Jediné zásahy do aminokyselinové páteře templátu jsou při modelování inzercí a delecí v sekvenci oproti porovnávané struktuře. 3 5/21/2012 Homology modeling •přiložení cílové sekvence se sekvencí homologního proteinu se známou 3D strukturou • extrakce uhlíkové páteře ze struktury templátu a umístění postranních řetězců •modelování otoček a smyček • minimalizace energie •validace modelované struktury MODELLER Mostly used program in academic environment for serious homology modeling SWISS-MODEL An automated knowledge-based protein modelling server Computation of this workunit has stopped. Please see the following log report for details: Started: Wed May 13 06:59:31 2009 (sms_automode) Reading user input sequence No Templates found. Simple automated template selection could not identify suitable templates. Please use advanced Template Selection under [Tools] to select a template and prepare a workunit using the project mode. Fold Databases SCOP Structural Classification of Proteins (http://scop.mrc-lmb.cam.ac.uk/scop/) Dali/FSSP (http://www.ebi.ac.uk/dali/) CATH Protein Structure Classification (http:// www.cathdb.info ) Structural Alignment Tools Vast (http://www.ncbi.nlm.nih.gov/Structure/VAST/vastsearch.html) CE (http://cl.sdsc.edu/ce.html) DALI (http://www.ebi.ac.uk/dali) Fold Prediction 3D-PSSM and PHYRE Protein Fold Recognition (http://www.sbg.bio.ic.ac.uk/~phyre/) CPHmodels homology modeling (http://www.cbs.dtu.dk/services/CPHmodels/) Geno3D (http://geno3d-pbil.ibcp.fr/cgi-bin/geno3d_automat.pl?page=/GEN03D/geno3d_home.html) 3D-JIGSAW (http://www.bmm.icnet.uk/~3djigsaw/) ESyPred3D (http://www.fundp.ac.be/urbm/bioinfo/esypred/) Fully Automatic Homology Modelling Robetta full-chain protein structure prediction server (http://robetta.bakerlab.org/) Swiss-Mod el (http://www.expasy.org/swissmod/SWISS-MODEL.html) A zpět k doménám - proč potřebujeme jejich predikci? •Prohledávání sekvenčních databází bez predikce domén může být neúspěšné •Automatická predikce struktury se zaměří jen na nejlépe „definovanou" část 4