LOSCHMIDT LABORATORIES Predikce proteinové struktury EVROPSKÁ UNIE HNISTERSTVO ŠKOLSTVÍ. WLÄDEÍE A TĚLOVÝCHOVY OP VídlfllJvJrtl pro rfonhurťiceachu-unrjsi IMJ INVESTICE DO ROZVOJE Vzdělávání □ Predikce sekundární struktury □ Predikce proteinového foldu □ Predikce terciární struktury □ Predikce molekulárních komplexů □ Hodnocení predikčních metod Predikce proteinové struktury □ Predikce sekundární struktury □ Predikce proteinového foldu ■ Navlékání - angl. Threading □ Predikce terciární struktury ■ Homologní modelování - angl. Homology modelling ■ Ab initio predikce - angl. Ab initio prediction □ Predikce molekulárních komplexů ■ Molekulární dokování - angl. Molecular docking o Predikce proteinové struktury □ Přiřazení jednoho konformačního stavu každému aminokyselinovému zbytku v proteinové sekvenci: ■ oc-šroubovice (H, angl. helix) ■ p-řetězec (E, angl. strand) ■ otočka (C, angl. coil) o Predikce proteinové struktury □ Přiřazení jednoho konformačního stavu každému aminokyselinovému zbytku v proteinové sekvenci: o Přesnost >80% Klasifikace proteinů Identifikace proteinových domén a funkčních motivů Zlepšení spolehlivosti sekvenčních přiložení Příprava na predikci terciární struktury Predikce proteinové struktury Flavodoxin nnpredict PredictProtein SSPRED GOR Levin DPM SOPMA CNRS Consensus 10FV Predikce sekundární struktury 1 10 20 30 40 50 60 A KI QLFYGTQTGVTQTI AESI QQEFGGESI VDLNDl ANADASDLNAYDYLI I GCPTWNVG _ E E El H H - - - HHH--HHHHHHHHHHH e_e e_e - - - - eehhhhhhhhh - - t t - - e H.....e h........hh-tt-h imuH.....eDJ-hh-hhhh ;nnnnnnnnn !H- H H HHHHM :ISi- ■ HHTH Beta 1 Alpha 1 Beta 2 Alpha 2 Beta 3 Flavodoxin nnpredict PredictProtein SSPRED GOR Levin DPM SOPMA CNRS Consensus 10FV 70 60 90 100 110 120 ELQSDWEGI YDDLDSVNFGGKKVAYFGAGDQVGYSDNFQDAMGI LEEKI SSLGSÚTVGYW m HHHHHHHHHHH H H H- - E E E HHHH |H - - - E - - ■ - RW!1- EE-- EIÜTlH hhhh - [I: J hh-t I!«I!I!1!M!1!I!1ÍI8I!Ih H H T t - Hi * - HQ- • Gl- - E......E - T - - - he hp T T TfflPW»lT Tkci- E E - t T HHHTT Alpha 3 Alpha 4 H H H H H H H ........H EE.....H H E E E E • T - K H T E - T T T - H H .......T T T ■ - - - H HH Beta 4 Alpha 5 III mm E E E E - - e - - e - - EEEEE- - • e e e - * - e e e e e e pß]e T - E E -• EE- - EE- E - Flavodoxin nnpredict PrediclProtein SSPRED GOR Levin DPM SOPMA CNRS Consensus 10FV 130 140 150 160 PI EGYDFNESKAVRNNQFVGLAI DEDNQPDLTKNRI K T WV SQL KSEFGL PI - e E E E E E E -T E - E - - - T - H H EEE ..........EEEE -HHHHHHHHHHHHH E■ - HHHH- H- T - - E - ■ TH- HHHH- - - EE .....TTEETTEE- • - • H- HHHH- T- EE Betas Alpha 6 Predikce proteinové struktury □ PSI-PRED Kombinuje evoluční informaci s predikcí neuronovou sítí Pred: > > Pred: HHHHHHHHHHHHHHHHHHCCCCCCCCCCCCCCCEEEEEEE AA: QQMNQKAVTSFLSVQDGIYNSDLTPKSDIKNPDVWYEFF 130 140 150 160 Legend: 0 ) = helix Conf: 3a □ D 1 1 E = confíden ce of prediction [ = strand Pred: + predicted secondary structure = coil AA: target sequence Predikce proteinové struktury □ Quick2D ■ Přiřazení sekundárních elementů: a-šroubovic, (3-řetězců, otoček, transmembránových šroubovic a neuspořádaných regionů ■ Metody PSI-PRED, JNET, Prof, Coils, MEMSAT2, HMMTOP, ... £0 I I I I I I I I HSLGAKP F G-EKKFIEIKG-PPHAYID E G-T G-D PIL F QHG-NP T S SYLURNIMPHCAG-LG-RLIACDLIG-HG-D SDKLD P S GP E PY ss PSIPPED EEEEE EEEEEEEE EEEEE HHHHHHHHHHHHH EEEEE ss JNET EEE EEEEEE EEEEEE HHHHHHHHHHH EEEEE ss Prof (Ouali) EEEE EEEEEEE EEEEE HHHHHHHHHHHH EEEEEE CC Coils TH HHHTOP TH MEHSAT-SVM TH PHDEIUS DO DIS0PPED2 DO IUPPED SO JNET DD E E E EEE E E EEEE E EEEEEEEEEEEE EE EE E EEEEEEEEEEEE EE Predikce proteinové struktury □ GeneSilico MetaServer ■ Meta-server pro predikci struktury proteinů, včetně predikce sekundární elementů = konsensus SECONDARY STRUCTURE PREDICTION Secondary Structure sspro4 cdm psipred fdm jnet porter sable prof gor consensus 1........ 10........ 20........ 30........ 40........SO........60_____ MTISADISLHHPAVL GS THAYRE T GRSDAPHVL F LHDNP T S SYIURNIMPLVAPVGHCIAPD LIGT ---------EEEEE —EEEEEEEE-------EEEE------HHHH---HHHH-----EEEE----- ---------EEEEE —EEEEEEEE-----EEEEEE------HHHH---HHHH----EEEEE----- ------EEEEEEEE —EEEEEEE-------EEEEE------HHHHHHHHHHHH—EEEEE----- -----HHEEEEEEE —EEEEEEEE-----EEEEEE------HHHH---HHHH----EEEEE----- -------EEEEEEE —EEEEEEEE------EEEEEE----HHHHHHHHHHHH----EEEEEE---- -EEEEEE---EEEEEE- ---------EEEEEEE- ----------EEEEE-- --EEEEE—EEEEEEE- -EEEEE----HHHHHHHHHHHHHH—EEEEE- -EEEEEE-----HHHHHHHHHHHHH—-EEEE- -EEEEE---------HHHHHHHHH—EEEEE- -EEEEE------HHHHHHHHHHH----EEEEE- Predikce proteinové struktury □ Navlékání Rozpoznávání proteinového foldu Hledá strukturu, která nejlépe odpovídá proteinové sekvenci prohledáváním knihovny známých foldů a hodnocením skóre Používá se pro struktury, pro které není k dispozici vhodný templát pro homologní modelování Neposkytne výsledek, pokud správný fold není v knihovně o Predikce proteinové struktury □ Navlékání MSLGAKPFGE... modelovaná sekvence Predikce proteinové struktury □ Navlékání fold 1 MSLGAKPFGE... modelovaná sekvence fold 2 konstrukce modelu fold n Predikce proteinové struktury □ Navlékání □ Navlékání MSLGAKPFGE... modelovaná sekvence fold 1 fold 2 konstrukce modelu výpočet energie výpočet skóre a klasifikace fold n Predikce proteinové struktury □ Navlékání PHYRE GenTHREADER phyre Protein Homology/analogY Recognition Engine Version 0.2 The Phyre webserver is for Academic use only E-mail Address Optional Job description Amino Acid Sequence Google groups Subscribe to Phyre Email: r Subscribe | Visit this group Q u i ck Phyre S e arch | Predikce proteinové struktury □ Homologní modelování □ Ab initio predikce Predikce proteinové struktury □ Homologní modelování ■ Vytváří atomistický model založený na experimentálně určené struktuře, která je sekvenčně blízce příbuzná ■ Vyžadovaná sekvenční identita >25% ■ Základní princip = struktura je konzervována déle než sekvence o Predikce proteinové struktury □ Homologní modelování MSLGAKPFGE... modelovaná sekvence Predikce proteinové struktury □ Homologní modelování MSLGAKPFGE... modelovaná sekvence prohledání databáze párovým přiložením Predikce proteinové struktury □ Homologní modelování MSLGAKPFGE... modelovaná sekvence prohledání databáze párovým přiložením identifikace templátu Predikce proteinové struktury □ Homologní modelování MSLGAKPFGE... modelovaná sekvence prohledání databáze párovým přiložením identifikace templátu MSLGAKPFGE... MGV-AKTYGE... přiloženi sekvencí Predikce proteinové struktury □ Homologní modelování MSLGAKPFGE... modelovaná sekvence prohledání databáze párovým přiložením identifikace templátu MSLGAKPFGE... MGV-AKTYGE... přiložení sekvencí i extrakce páteře náhrada vedl. řetězců Predikce proteinové struktury □ Homologní modelování MSLGAKPFGE... modelovaná sekvence prohledání databáze párovým přiložením identifikace templátu doplnění smyček MSLGAKPFGE... MGV-AKTYGE... přiložení sekvencí i extrakce páteře náhrada vedl. řetězců Predikce proteinové struktury □ Homologní modelování MSLGAKPFGE... modelovaná sekvence prohledání databáze párovým přiložením optimalizace modelu identifikace templátu doplnění smyček MSLGAKPFGE... MGV-AKTYGE... přiložení sekvencí i extrakce páteře náhrada vedl. řetězců Predikce proteinové struktury □ Homologní modelování MSLGAKPFGE... modelovaná sekvence Residue number hodnocení modelu prohledání databáze párovým přiložením optimalizace modelu identifikace templátu doplnění smyček MSLGAKPFGE... MGV-AKTYGE... přiložení sekvencí i extrakce páteře náhrada vedl. řetězců Predikce proteinové struktury □ Homologní modelování ■ Swiss-Model ■ Modeller SWISS-MODEL Workspace Modelling Tools [ myWorkspace ] SwissModel Automatic Modelling Mode . Email: r Project Title: Repository Document [ lot Provide a protein sequence or a UniProt AC Code 9 Submit Modelling Request) Advanced options: Use a specific template: & PDB-ID: I or Template file: © Chain: [| Procházet... | Predikce proteinové struktury Predikce terciární struktury □ Ab initio predikce ■ Vytváří atomistický model založený na základních fyzikálních principech ■ Hledá geometrii struktury v globálním energetickém minimu ■ Umožňuje navrhovat struktury neexistující v přírodě "Svatý Grál" bioinformatiky o Predikce proteinové struktury Target 77 □ Ab initio predikce ■ Rosetta, Robetta native model 4 □ Meta-servery ■ GeneSilico ■ 3D-Jury TERTIARY STRUCTURE PREDICTION 3dpssm server not updated score identity scop EC ld07 A 0,071 42% c. 69.1.8 3.8.1.5 lbn7 A 49% c. 69.1.8 3.8.1.5 lekl A2 21% c.69.1.11 3.3.2.9 ls8o A 23% c.69.1 3.3.2.9 lcr6 A D.42 21% c.69.1 3.3.2.9 lehy A 0,71 20% c.69.1.11 3.3.2.9 lb6g 0,93 25% 3.8.1.5 ljli A 2 20% c.69.1.10 3.7.1.8 liUD A 2.2 20% c.69.1.10 3.7.1.9 lbrt 2.7 19% 1.11.1.10 1........10........ 20........30. . . HTI SAD IS LHHRAVL GS THAYRE T GESDAPHVL F -GAKPFGEKKFIEIKGEEMAYIDEG—TGDPILF IGTGFPFDPHYVEVLGEEMHYVDVGPPDGTPVLF L PVPND VSHGYVTVKGIRLHFVEHGS - - GPAL C L HCNP SDHSHGYVTVERVRLHFVE LGS--GPAVC L HPVPHD VSHGYVTVKGIELHF VEHGS — GPAL C L -AIPEDFKHYEVQLPDVKIHYVREG—AGPTLLL HLD QTPFS PHYLDYP GL EAHYLD E GHSDAEVF L C -----AYVERFVNAGGVETRYLEAG--KGQPVIL ---NL EIG-KSILAAGVL THYHD VG—EGQPVIL -------PFITVQENSIDLYYEDHG—TGQPWL . . 40........SO........SO........70........ 80........ 90..... LHGNP t S S YIlilRNIHP LVAPVGHCIAPDLIGYGQS GKPDISYRFFD QADYLD AL ID E L GIAS QHGNPTSSYLTilEHIMPHCAGL GRLIACDLIGMGDSDKPPERYAYAEHRDYLDALIiTEALD LDP LHGNPTSSYLTflEHII phvap SHPCIAPDLIGHGESDKPDLDYF fddhveyldaf IEALGLEE CHGF P E SWF SÍJRYQI PALAAGF PVL AIDHKGYGD SSSPPE EYAHE L l ckemvt FLDKLGIPQ CHGFPE SFYSÍJRYQ. IP AL AAGYRVL AHDHEGYGE SSAPPE eychevl ceemvt FLDKLGLSQ CHGF P E SUF SURYQIPALAAGF RVLAIDHKGYGD SSSPPE EYAHE L L CEEHVT FLDKLGIPQ HGWPGFTOEWSKVIGPLAEHYCTIVPDLRGFGDSEKPDSKYSLDKAADDQAALLDALGIEK LHGEPT1JJSYLYRKHIPVFAEGARVIAPDFFGFGKSDKPEEDYTFEFHBHFLLALIERLDLRH IHGGAE S E GHiJPHVI PIl AEHYRVIAHDHL GF GET AKPDIEYTQDRRIEHLHD FIKAHHFDE HGSP GSAYAURL TIP AL SKFYRVIAPDHVGF GFTDRP EYNYSED SWDHIIGIHDALEIEK IHGFPLSGHSUERQSAALDAGYRVITYD RRGF GQ S S Q P T T GYDYD T FAAD LHTVL E T LD L QD TERTIARY STRUCTURE PREDICTION phyre i........i0........zo........30... score identity scop EC HT I SAD IS LHHRAVL GS THAYRE T GESDAPHVL F lbn7A l.Se-43 50% c.69.1.8 3.8.1.5 -----PFDPHYVEVLGEEMHYVDVGPPDGTPV ly37B 5,Se-41 22% c.69.1.11 3.8.1.3 - -HF E GF E ERLVDVGD VT INC WGG- - S GPAL lehy A 2,7e-40 21% c.69.1.11 3.3.2.9 IRRPEDFKHYEVQLPDVKIHYVREG--AGPTLLL 2o2h A 4,2e-40 40% c.69.1.8 3.8.1.5 HTAFPYGQPEYLEIAGERHAYIDEG—EGDAIVF lmjSA 8,Se-40 43% c.69.1.8 3.8.1.5 LGAKPFGEKKFIEIKGRRMAYIDEG—TGDPILF lua4A 2,Se-39 17% c.69.1.12 3.1.1.2 ---------T FVAKD GT QIYFKDWG- -S GKPVL F ljli A 4,le-39 18% c.69.1.10 3.7.1.8 ----EAYVERFVHAGGVETEYLBAG--EGQPVIL 2rllA 4,7e-39 16% c.69.1.12 3.1.1.1 —WPVRCKSFYISTRFGQTHVIASGPEDAPPLVL 2vf2 A 5,4e-39 21% c.69.1.10 3.7.1.8 -TFESTSRFAEVDVDGLKLHYHEAGVGHDQTW1 la8sA 5,Se-39 17% c.69.1.12 1.11.1.10--------TTFTTRDGTQIYYKDWG—SGQPIVF .40........SO........SO........70........ 80........ 90..... LHGNPTSSYIURHIHP LVAP VGHC IAPDLIGYGQS GKPD ISYRFFD QADYLD AL ID E L GIAS LHGNPTSSYLTflEHII PHVAP SHRCIAPDLIGHGESDKPDLDYF FDDHVEYLD AF IEALGLEE LHGFP QNLHHTflARVAP L LANEYTWCAD LEGYGGS SKPHAHYS F EAHASD QEELHETLGFEE LHGWPGFWEttSKVIGPLAEHYDVIVPDLRGFGDSEKPDSKYSLDKAADDQAALLDALGIEK QHGNPTSSYLURHIMPHLEGL GRLVACD LIGHGASDKL SD EYSYGE Q RD F L F ALICD ALD LDH HGNPTSSYLURHIMPHCAGL GRLIACDLIGMGDSDKLDERYAYAEHRDYLDALIiTEALD LDE SHGWL LDADHlflE YQME YL £ S GYRTIAFD REGF GESD Q PWT GNDYD T FADDIAQ LIEHLD LEE IHGGGAS E GNUrPHVI PIL AEHYRVIAHDHL GF GET AKPD IEYTQDREI EHLHD F IKAHHFDE HGALFSS THUYPHIADWS SKYRTYAVD11GDKNKSIP EHS GT RTDYANWL LDVFDHLGIEK LHGGGP GAASIJTNFIAVL AEHFHVL AVD Q F GYGHSDKRAEHQ FHEYAAHALKGL FDQLGLGE SHGITP LHAD SWE S OHI F L AQ GYRVIAHD REGHGES S Q PWS GHDHD T YADD LAQ LIEHLD L ED Predikce proteinové struktury □ Molekulární dokování ■ Umísťování malých organických molekul - ligandů - do vazebných domén receptoru, aktivních center enzymů nebo žlábků DNA ■ Náhodně generované orientace a konformace ligandu v blízkosti biomolekuly jsou hodnoceny energetickým skóre ■ Energetické skóre = interakční energie = van der Waalsova energie + elektrostatická energie + energie vodíkových vazeb + entropie o Predikce proteinové struktury □ Molekulární dokování ■ DOCK ■ AUTODOCK Entť-gy - -Skul kti-al/íťitf FM5D - AftíítrOfTft1 Predikce proteinové struktury □ CASP Critical Assessment of Techniques for Protein Structure Prediction Mezinárodní soutěž spolehlivosti predikčních metod = umožňuje kritické a objektivní hodnocení K hodnocení jsou využívány slepé predikce = soutěžící obdrží proteinové sekvence se známou, avšak dosud nepublikovanou strukturou - organizátoři porovnají predikované a experimentální struktury o Predikce proteinové struktury □ CAS P Predikce terciární struktury Predikce molekulárních komplexů Predikce kontaktů mezi zbytky Predikce neuspořádaných regionů Predikce domén Predikce funkce proteinů Hodnocení kvality modelů Upřesnění modelů Predikce proteinové struktury NT Hodnocení predikčních metod □ CASP # GR ' # * GR Name t Domains Count Cumulative T Z-score (G DT_TS) 1. 426 ! Zhang-Seruer 164 129.070 2. 433 i RAPTOR 164 103.274 3. 425 ! BAKE R - R O B ETTA 164 101.546 4. 409 i pro-sp3-TASSER 164 99.062 5. 132 ! METATASSER 164 96.045 6. 322 i Phyre_de_nouo 164 91.397 7. 012 ! HHpredS 164 39.393 S. 020 i MULTICOM-CLUSTER 164 37.470 9. 122 ! HHpred4 164 36.429 10. 256 i SAM-T08-seruer 164 34.731 11. 013 ! M U LTICOM-REFINE 164 33.332 12. 443 i MUProt 164 31.140 13. 279 ! GS-KudlatyPred 161 73.994 14. 154 i HHpred2 164 77.955 Predikce proteinové struktury Proteinové inženýrství BÍ7410 Období: jaro Rozsah: přednáška 1 hodina/týden Vyučující: Mgr. Radka Chaloupková, Ph.D. Osnova: strukturně-funkční vztahy proteinů metody exprese a purifikace rekombinantních proteinů metody strukturní a funkční analýzy proteinů racionální design, semi-racionální design a řízená evoluce příklady využití proteinového inženýrství Období: podzim Rozsah: přednáška 2 hodiny/týden, cvičení 2 hodiny/týden Vyučující: Mgr. David Bednář, Ph.D. Osnova: struktura, stabilita a dynamika biologických makromolekul makromolekulami interakce a komplexy stanovení a předpověď struktury, identifikace důležitých oblastí stanovení vlivu mutace na strukturu a funkci proteinu aplikace v biologickém výzkumu, návrhu léčiv a biokatalyzátorů Období: podzim Rozsah: přednáška 2 hodiny/týden, cvičení 2 hodiny/týden Přednášky: Prof. Zbyněk Prokop, Ph.D. Cvičení: Dr. Šárka Bidmanová, Dr. Koen Beerens, Dr. Veronika Štěpánková, Mgr. Lukáš Chrást Osnova: proteinové, metabolické a tkáňové inženýrství genetické inženýrství rostlin a živočichů molekulární diagnostika, vakcíny, terapeutika buněčná a genová terapie, regenerativní medicína molekulární biotechnologie v průmyslu a zemědělství ffiflL *«W \) li Ji Uli H M IIII *i « T t • 10 H 11 M II u i: u U U H II u a n 12 y x Predikce proteinové struktury □ Claverie, J-M., & Notredame, C. (2006). Bioinformatics For Dummies (2nd ed.). Wiley Publishing, Hoboken, p. 436. □ Xiong, J. (2006). Essential Bioinformatics. Cambridge University Press, New York, p. 352. □ PSI-PRED: http://bioinf.cs.ucl.ac.uk/psipred/psiform.html □ Quick2D (MPI Toolkit): http://toolkit.tuebingen.mpg.de/quick2 d □ Modeller: http://salilab.org/modeller/ □ Modeller (GeneSilico): https://genesilico.pl/toolkit/unimod?method=Modeller □ Swiss-Model: http://swissmodel.expasy.org/ □ GenTHREADER: http://bioinf.cs.ucl.ac.uk/psipred/psiform.html □ PHYRE: http://www.sbg.bio.ic.ac.uk/~phyre/index.cgi □ GeneSilico MetaServer: https://www.genesilico.pl/meta2/ □ 3D-Jury: http://meta.bioinfo.pl/submit wizard.pl □ Rosetta@home: http://boinc.bakerlab.org/rosetta/ □ CASP: http://predictioncenter.org/index.cgi Predikce proteinové struktury