Blok 4 Terciární struktura a oligomerizace proteinů C3211 Aplikovaná bioinformatika Přednášející: Josef Houser Terciární struktura proteinů •Komplikovaná hiearchie • •Sekundární – (Supersekundární) – Terciární • •Motivy – Foldy – Domény http://towardsbeing.files.wordpress.com/2011/03/steel_puzzle_sphere_1.jpg Strukturní motivy •Způsob řazení úseků sekundární struktury, např: •beta-vlásenka (beta-hairpin) •řecký klíč (Greek key) •beta-alfa-beta •helix-otáčka-helix (helix-turn-helix) http://swift.cmbi.ru.nl/gv/students/mtom/hmotif.jpg http://upload.wikimedia.org/wikipedia/commons/thumb/4/4f/Anthrax_toxin_protein_key_motif.svg/200px- Anthrax_toxin_protein_key_motif.svg.png http://manaslu.aecom.yu.edu/loopred/images/hairpin_link.jpg http://3.bp.blogspot.com/_SuSJZ4Ipeso/SY58SHEWneI/AAAAAAAAAGI/NA9K4bORB34/s320/beta-alpha-beta.png Proteinové foldy •Vznikají kombinací několika motivů, např.: •Helix-bundle •Rossmanův fold •TIM-barrel http://ars.els-cdn.com/content/image/1-s2.0-S0167483898001800-gr6.gif http://www.px.nsls.bnl.gov/x26c/images/1k40x250_neg.jpg http://www.proteinstructures.com/Structure/Structure/protein-fold_files/rossmann-fold.jpg http://www.ebi.ac.uk/pdbe-apps/widgets/QuipStories/Phaser/Pics/rossmann.jpeg http://what-when-how.com/wp-content/uploads/2011/05/tmp10D36_thumb.jpg Proteinové domény •Proteinová doména je prostorově vymezený úsek proteinu, obvykle s vlastní funkcí •Známe proteiny jednodoménové i vícedoménové hemoglobin Pyruvate kinase 3D struktura •Konkrétní umístění jednotlivých atomů polypeptidového řetězce v prostoru • •Absolutní souřadnice – x, y, z • pro N atomů je třeba 3N souřadnic • •Relativní souřadnice – vzdálenost, úhel, torzní úhel • pro N atomů je třeba 3N – 3 souřadnic •Rentgenová difrakce - nejvíce struktur v PDB •NMR •Ostatní metody ~ 1% Metody určení 3D struktury Čas na exkurzi •X-ray http://www.ceitec.cz/uploads/IMG_04881-300x199.jpg NMR http://www.elettra.trieste.it/I3/uploads/Main/europa.gif Cryo-EM Zobrazení 3D struktury •Zobrazovací SW: PyMol, Jmol, RasMol, VMD, Chimera, Cn3D,… spheres, surface sticks/balls and sticks cartoon/ribbon Databáze 3D struktur •wwPDB (http://www.wwpdb.org) –RCSB PDB – Research Collaboratory for Structural Bioinformatics Protein Data Bank (http://www.rcsb.org) –PDBe – Protein Data Bank Europe –PDBj – Protein Data Bank Japan –BMRB – Biological Magnetic Resonance Data Bank •SCOP (http://scop.mrc-lmb.cam.ac.uk/scop/) – strukturní klasifikace proteinů •CATH (http://www.cathdb.info/) – klasifikace proteinových domén z PDB •EMDataBank (http://www.emdatabank.org/) – struktury z elektronové mikroskopie Formáty uložení 3D struktury •PDB (Protein Data Bank) •PDB File Format •mmCIF File Format and PDB Exchange Dictionary •PDBML/XML File Format • • PDB • mmCIF Úloha •Seznamte se s formátem .pdb Otevřete v textovém prohlížeči soubor 1RI6.pdb a uveďte: ØO jaký protein se jedná? ØKdo je autorem struktury? ØJakou technikou byla struktura získána? ØKolik atomů obsahuje kompletní struktura (včetně ligandů a solventu)? ØJaké prvky sekundární struktury obsahuje daný protein? UniPDB www.ebi.ac.uk/pdbe/widgets/unipdb •Propojení databází UniProt (sekvence) a PDB (struktury) http://www.uniprot.org/images/logo_small.gif wwPDB UniPDB www.ebi.ac.uk/pdbe/widgets/unipdb •Vstup – UniProt kód proteinu • •Výstup – přehled struktur se vztahem k tomuto proteinu (komplexy, domény,…), tj. všechny PDB záznamy, které obsahují alespoň část žádaného proteinu • • Úloha ØPomocí aplikace UniPDB (https://www.ebi.ac.uk/pdbe/widgets/unipdb/) zjistěte, zda je známa struktura alfa podjednotky A DNA polymerasy ze Saccharomyces cerevisiae (DPOA_YEAST) samotné nebo v komplexu Ø Kolik dalších struktur obsahuje alespoň některou z domén tohoto enzymu? • Publikace Strukturní techniky Nukleové kyseliny Ligandy PDB soubor • In silico predikce 3D struktury •Ab initio • •Homologní modelování • •Threading („navlékání“) http://www.sosej.cz/thumbnails/Stvoreni-Sveta-Bible.jpg http://www.fa.vutbr.cz/home/uz/model/predlohy/01.jpg http://files.novinky-patenty.cz/system_preview_detail_200000011-221c824108-public/Navl%C3%A9k%C3%A1 n%C3%AD%20potravin%20na%20grilovac%C3%AD%20jehlu.jpg 1) Ab initio - Quark •Nevyžaduje existenci homologního proteinu •Predikuje 2D strukturu, modeluje fragmenty a kombinuje je navzájem •Nízká spolehlivost zejm. pro větší proteiny • •QUARK http://zhanglab.ccmb.med.umich.edu/QUARK/ http://zhanglab.ccmb.med.umich.edu/image/quark_logo2.png • • 2) Homologní modelování •Využívá skutečnosti, že dva proteiny ze stejné rodiny a s podobnou sekvencí mají i podobnou 3D strukturu •Nutno znát strukturu homologního proteinu = templát • •SWISS-MODEL http://swissmodel.expasy.org/ • Úloha ØPokuste se vytvořit model struktury pro zadaný protein pomocí serveru SWISS-MODEL (http://swissmodel.expasy.org/). Použijte automatický mód. •Sekvence: •MYPFFDNPNYTNTYATNEDFVCPYFLDYYNNSQDDYKNFRGENYDFEDTEENIENRNIEETEYEGLFRAWNPWNNLGGNITSGLGASSWAANRIDLFA RGRGGELIHNWFDNGKWNYWENLGGILTSSPKAVSWGFNRIDVVCRGTDNAMYHKWWDGSSWSGFENLGGQLTSAPTICSWAPNRLDCFARGTDNQLHH KWWDGSSWSQWEALGGSLTSGPGAVSWGPNRIDVFARGRNNTLIHKWWNGTSWSQWEDLGGFLTSAPCASSRGQNRIDVFARGRNNRLMYKYWDGSRWS DWTFLQGYLTSEPVSVSRNSSSINVFAKGPRENVIERIYS Swiss-Model Swiss-Model Swiss-Model •Několik modelů • QMEAN http://swissmodel.expasy.org/qmean/cgi/index.cgi •Stanovení kvality strukturního modelu •Automaticky provedeno při použití serveru SWISS-MODEL •Možno analyzovat i vlastní modely • 3) Threading •Modelování při nízké homologii s proteiny se známou strukturou •Porovnává možnost přiložení sekvence na proteiny známých foldů • •Phyre2 http://www.sbg.bio.ic.ac.uk/phyre2/ ARDLVIPMIYCGHGY HMM •PSI-Blast Hidden Markov Model DB of KNOWN STRUCTURES •HMM-HMM •matching ARDL--VIPMIYCGHGY •AFDLCDLIPV--CGMAY •Sequence of known structure •Very powerful – •able to reliably detect extremely •remote homology •Routinely creates accurate models even •when sequence identity is <15% •3D-Model Phyre2 • • • • TASSER •Několikrát označen jako nejlepší predikční server •Nutná registrace •http://cssb.biology.gatech.edu/skolnick/webservice/TASSER/index.html • •Možnost práce online nebo stažení a instalace na lokální počítač (Linux) TASSER online • • •TASSER online •Navíc predikce funkce a vazebných míst – na základě struktury homologních komplexů CASP •http://predictioncenter.org/casp10/index.cgi •Rozsáhlá analýza predikčních programů •Poslední kolo 2012 (CASP10). Mj. zahrnuje: •Predikce terciárních struktur: –Template Based Modeling - je-li dostupný templát –Template free modeling - bez templátu –Contact-assisted structure modeling - při znalosti několika dlouhodosahových interakcí •Další kategorie: –Identifikace neuspořádaných oblastí (disordered regions) –Funkční predikce (predikce vazebných míst) http://predictioncenter.org/casp10/images/casp10_small.gif •Critical Assessment of Techniques for Protein Structure Prediction • Analýza 3D struktur •Určení strukturních prvků (sekundární struktura, motivy, foldy) a zařazení do příslušných nadrodin •Povrchy – přístupnost pro solvent, hydrofobicita, analýza kavit a tunelů •Vazebná místa – predikce funkce •Interakce (protein-protein – 4D, protein-DNA, protein-ligand) – plochy, energie, vazby •Homology – hledání, porovnávání Hledání 3D-homologních proteinů •Hledání na úrovni terciárních struktur může být časově (i výpočetně) náročné. • •PDBeFold – prohledává PDB databázi •Dali – prohledává PDB databázi •FATCAT •BackPhyre – umožňuje prohledání konkrétního genomu proti zadané 3D struktuře • PDBeFold •Porovnání 3D struktur z PDB / SCOP pomocí 2D elementů Úloha ØPomocí serveru PDBeFold (http://www.ebi.ac.uk/msd-srv/ssm/) analyzujte N-terminální doménu proteinu BC2L-C. (PDB kód: 2WQ4). Nalezněte proteiny s nejvyšší strukturní homologií k tomuto proteinu. • DALI http://ekhidna.biocenter.helsinki.fi/dali_server/start •Dali server - Prohledává PDB databázi za účelem nalezení 3D homologů k zadané struktuře •Dali Database – databáze homologů známých struktur •Pairwise Dali Light - Umožňuje porovnat dvě 3D struktury navzájem Hasegawa H, Holm L (2009) Advances and pitfalls of protein structural alignment. Curr. Opin. Struct. Biol. 19, 341-348. • Úloha ØPoužijte server Dali (http://ekhidna.biocenter.helsinki.fi/dali_server/start) a najděte blízké strukturní homology k některému z proteinů v PDB databázi (http://pdb.rcsb.org). Využijte Dali Database. • • • • TOPSAN •http://proteins.burnham.org/ •Kombinace analýzy a kontextového vyhledávání Úloha ØPomocí serveru Topsan (http://proteins.burnham.org/) zjistěte, do jaké strukturní rodiny patří protein z Xanthomonas campestris (PDB ID: 2qjw) a zda jsou známy nějaké jeho strukturní homology. ØPokud možno, porovnejte strukturu 2qjw a nejbližšího homologu. • • BackPhyre • • Kvartérní struktura •Spojování několika řetězců (monomerů) do funkčních jednotek •Homo-oligomery, hetero-oligomery •Komplexy proteinů s dalšími makromolekulami – ribozomy, viry •Nadmolekulární komplexy – buněčná membrána Určení kvartérní struktury •Nativní gelová elektroforéza •Gelová permeační chromatografie (GPC) •Analytická ultracentrifugace (AUC) •Light scattering (MALS) •Analýza 3D struktury http://www.mtpgroup.nl/Data/Sites/1/mtpimages/education/amm-fig02.gif http://biochemistry.utoronto.ca/moraes/image/nativegel_thumb.jpg http://depts.washington.edu/klvtlab/wordpress/wp-content/uploads/2012/05/AUCXL_1.jpg Běžná je kombinace více metod Analýza kvartérní struktury - PDBePISA •http://www.ebi.ac.uk/msd-srv/prot_int/pistart.html •Povrchy, rozhraní, kvarterní struktura, interakce s ligandy Úloha •Analyzujte pomocí serveru PDBePISA (http://www.ebi.ac.uk/msd-srv/prot_int/pistart.html) lidskou glutamátdehydrogenasu: • ØTvoří lidská glutamátdehydrogenasa oligomer? Ø ØS kolika dalšími molekulami tvoří každá molekula dehydrogenasy stabilní vazbu? • • Predikce kvartérní struktury •SW dosud nedokonalý, často nedostupný online •Rosetta •M-tasser •Protein-protein docking • Quaternary structure predictor •Homodimer classifier http://www.mericity.com/ (již delší dobu nefunkční ?!) •Predikoval schopnost proteinu vytvářet homodimery na základě sekvence. •Literatura: Robert Garian: Prediction of quaternary structure from primary structure, Bioinformatics 17 (6) 2001, 551–556 Oligomer nebo repetice? •Homo-oligomer: kratší protein = kratší gen = ušetřené místo • •Repetice: možnost mutací = větší variabilita Analýza repetic - RADAR •Na serveru EBI (http://www.ebi.ac.uk/Tools/pfa/radar/) •Analyzuje proteinovou sekvenci (1D struktura) a hledá v ní možné repetice. Analýza repetic - RADAR Úloha •Detekujte repetice v sekvenci domény ARC4 z lidské Tankyrasy 2. Použijte program RADAR (http://www.ebi.ac.uk/Tools/pfa/radar/) : • •Sekvence ARC4: • GAMGNSEADRQLLEAAKAGDVETVKKLCTVQSVNCRDIEGRQSTPLHFAAGYNRVSVVEYLLQHGADVHAKDKGGLVPLHNACSYGHYEVAELLVKHGA VVNVADLWKFTPLHEAAAKGKYEICKLLLQHGADPTKKNRDGNTPLDLVKDGDTDIQDLLRGDAAL Analýza repetic - RADAR Predikce funkce na základě 3D struktury •Strukturně podobné enzymy •Analýza komplexů homologů s ligandy •Komplexy protein-protein, protein-DNA/RNA •Přítomnost/absence klíčových residuí •Provázanost s dalšími databázemi COFACTOR •Součást serveru Zhanglab (podobně jako I-TASSER) •http://zhanglab.ccmb.med.umich.edu/COFACTOR/ •Homologie se známými enzymy – proteiny se stejnou funkcí mívají stejný fold •Gene ontology (GO) terms – popisují biologické zařazení proteinu (funkci, biologický proces, buněčnou lokalizaci) •Vazebná místa – predikce umístění vazbených míst na základě struktury homologních komplexů IBIS •Analýza 3D struktur – interakce protein-protein a protein-ligand •Vyhledává i podobné interakce u homologních proteinů v databázi • http://www.ncbi.nlm.nih.gov/Structure/ibis/ibis.cgi Úloha ØKterá residua delta-podjednotky DNA polymerasy ze Saccharomyces cerevisiae jsou klíčová pro vazbu DNA? Využijte serveru IBIS (http://www.ncbi.nlm.nih.gov/Structure/ibis/ibis.cgi). Ø • Ø Ø • • • ProFunc http://www.ebi.ac.uk/thornton-srv/databases/ProFunc/ • • •89 Úloha ØSeznamte se se serverem ProFunc (EBI, http://www.ebi.ac.uk/thornton-srv/databases/ProFunc/ ) prostřednictvím modelového příkladu předpokládané glutaminasy z Bacillus subtilis. Je možná jiná funkce tohoto enzymu? Vycházejte z predikce na základě 3D struktury. • Doplňková literatura a další zdroje •http://www.wikipedia.org J • •http://www.proteinstructures.com/ • •http://cssb.biology.gatech.edu/resources#services • •http://www.ebi.ac.uk/services/structures • •Odborné články ve studijních materiálech • Co říci závěrem? •SW nástoje usnadňují analýzu struktur • •Predikce není dokonalá. •Nenahradí experiment, ale může významně usnadnit práci • •Kontroluj, porovnávej, ověřuj,… •93