Malé molekuly C2131 Úvod do bioinformatiky, jaro 2024 Malé molekuly • Malé molekuly - nízkomolekulární látky: látky o relativně nízké molekulové hmotnosti (konkrétní čísla se liší dle zdrojů ©, < 900, < 1000, < 300o). • Farmakologická definice: látky s Mr menší než 900, mohou difundovat přes membrány. • V přírodních vědách nás většinou zajímají biomolekuly a organické nízkomolekulární látky. Malé molekuly: • Podiednotky makromolekul a stavební prvky buňky (aminokyseliny, nukleotidy, sacharidy, lipidy) • Vitaminy, hormony, neurotransmitery • Kofa kto ry, koenzymy • Meta bo lity • Sekundární metabolity Malé molekuly • Malé molekuly - nízkomolekulární látky: látky o relativně nízké molekulové hmotnosti (konkrétní čísla se liší dle zdrojů ©, < 900, < 1000, < 3000). • V přírodních vědách nás většinou zajímají biomolekuly a organické nízkomolekulární látky. "Všechny sloučeniny jsou jedy. Neexistuje sloučenina, která by jedem ■v, , , , , , nebyla. Rozdíl mezi lékem a jedem tvoří dávka." Male molekuly: Paracelsus • Léčiva/toxiny (což je většinou ta samá látka, záleží jen na množství...) Často nás ale zajímají také: • lonty kovů, soli, molekuly rozpouštědla (voda), plyny (C02, NO) a jejich vliv na a interakce s biomakromolekulami. Malé molekuly a chemoinformatika • Chemoinformatika: Vědní odvětví vzniklé z požadavků farmaceutického průmyslu v kombinaci s obrovským nárůstem informací o (nejen) strukturách organických molekul. V současnosti hraje významnou roli také v chemii, biologii a biochemii. • Chemoinformatika je kombinace „of all the information resources that a scientist needs to optimize the properties of a ligand to become a drug". ^ Brown, 1998 • Chemoinformatika: Vědní disciplína, která využívá výpočetní techniku pro shromažďování, uchovávání, analýzu a využití chemických dat. Tato chemická data zahrnují informace o vzorcích, strukturách, vlastnostech, spektrech a aktivitách malých molekul. , Cheminformatics " - severní Amerika ,Chemoinformatics" - všude jinde Introduction to Cheminformatics David S. Wishart' 1 Departments of Computing Science and Biological Sciences, University of Alberta, Edmonton. Alberta, Canada Malé molekuly a chemoinformatika • Chemoinformatika: Vědní odvětví vzniklé z požadavků farmaceutického průmyslu v kombinaci s obrovským nárůstem informací o (nejen) strukturách organických molekul. V současnosti hraje významnou roli také v chemii, biologii a biochemii. • Chemoinformatika: Chcete vědět víc? C2133 Úvod do chemoinformatiky, podzim 2024 ° Cle předmětu Kurs je zaměřen na získání úvodních znalostí v oblasti chemoinformatiky. Základní ideou předmětu Je vysvětlit nejdůležitější chemoinfornnatickě metodiky pro práci s inforrnacem o malých organických molekulách. Na konci tohoto kurzu bude student schopen: Porozumět a reprezentovat 1 D, 2D a 3D struktury malých organických molekul v počítači; Porozumět metodikám pro predikci activity a vlastností molekuly a pro charakterizaci podobnosti molekuly. Porozumět základním přístupům předpovědi vztahu struktura - aktivita - biologická funkce ° Osnova ■ 1, Co je chemoinformatika - popis oboru, jeho historie a využití 2. Databáze malých organických molekul 3, Zápis molekuly pomocí řetězce {SMILES, InChi, InChiKey), probém unikátního zápisu 4. Reprezentace a manipulace s dvoudimenzionálmmi (2D) strukturami molekul 5. Způsoby vyjádření 3D struktury molekuly a molekulárního systém 6. Molekulární deskriptory 7. Rngerprinty - vektory popisující struktury a vlastnosti molekul S. Modely pro studium kvantitativních vztahů mezi strukturou a aktivitou látek - QSAR 9. Modely pro studium kvantitativních vztahů mezi strukturou a vlastnostmi látek - QSPR 10, 3D QSARa 3D QSPR modely 11. Metody pro měření molekulární podobnosti 12, Chemický prostor a metodiky práce s ním Bioinformatika a chemoinformatika • Bioinformatika: • Většina zdrojů volně dostupná • Databáze nevznikly pro farmakologické využití; sekvenční záznamy často nejsou propojeny s informacemi o souvisejících léčivech nebo nemocích. Chemoinformatika: Mnoho zdrojů bylo (je) komerčních a volně nedostupných Databáze nevznikly pro biologické účely; chemická data často nejsou propojena s biologickými daty. ATGCTGGTGATTGTGGATGCCGTTACCCTGCTGAGCGCCTA TCCGGAAGCCAGCCGTGATCCGGCCGCCCCGACCGTGATTG ATGGTCGCCACCTGTATGTTGTTAGCCCGGGCGATGCCGC MLVIVDAVTLLSAYPEASRDPAAPTVIDGRHLYWSPGDA Informace uložené v sekvenci monomerů Vlastnosti podmíněné strukturou Bioinformatika a chemoinformatika • Bioinformatika: • Většina zdrojů volně dostupná • Databáze nevznikly pro farmakologické využití; sekvenční záznamy často nejsou propojeny s informacemi o souvisejících léčivech nebo nemocích. Chemoinformatika: Mnoho zdrojů bylo (je) komerčních a volně nedostupných Databáze nevznikly pro biologické účely; chemická data často nejsou propojena s biologickými daty. Makromolekuly jsou složené z malých molekul (aminokyseliny, nukleotidy). Makromolekuly a malé molekuly souvisejí i funkčně. Léčiva cílí na makromolekuly (proteiny, DNA). Proteiny řídí syntézu a degradaci malých molekul (metabolity). Bioinformatika a chemoinformatika Bioin form at ics Che minformat ics Type Name Type Name Sequence string format ijFASTA [pNIT3.9, Pearson, Chemical string format "TFASTQ (^SMILES, [nChT) Bioinformatika: lineární reprezentace sekvence makromolekul. Chemoinformatika: lineární reprezentace struktur. ATGCTGGTGATTGTGGATGCCGTTACCCTGCTGAGCGCCTA TCCGGAAGCCAGCCGTGATCCGGCCGCCCCGACCGTGATTG ATGGTCGCCACCTGTATGTTGTTAGCCCGGGCGATGCCGC MLVIVDAVTLLSAYPEASRDPAAPTVIDGRHLYWSPGDA FASTA formát >název(_popís dle vlastní volby) J SEKVENCESEKVENCESEKVENCESEKVENCESEKVENCESEKVENCEJ POVINNÉ VOLITELNÉ lnChl=lS/C30H30O8/cl-ll(2)19-15-7-13(5)21(27(35)23( 15)17(9- 31) 25(33)29(19)37)22-14(6)8-16-20(12(3)4)30(38)26(34)18(10- 32) 24(16)28(22)36/h7-12,33-38H,l-6H3 C12C=C(C(C3C(C)=CC4C(C(C)C)=C(C(0)=C(C=0)C=4C=30)0)=C(0)C=1C (C=0)=C(C(0)=C2C(C)C)0)C Bioinformatika a chemoinformatika Bioinforraatics Cheminformatics Type Name Type Name Sequence string format ^ASTA (/Mr 19, Pearson, Chemical string format Fastq ^SMILES, InChľ^) SMILES (Simplified Molecular Input Line Entry System/Specification) Bonds are denoted as shown below: Soma examples: Single bond C c CH3CH3 Ethane Double bond c=c CH:CH- Ethene # Triple bond CEľ CHjBr Elro mo methane Aromatic bond ■:=N C = N Hydrocyanic acid Disconnected structures [Ma .CI NaCl Sodium chloride A branch from a chain is specified by placing the SMILES 5ymbol(s) for the branch between parenthesis. The string in parentheses is placed directly afterthe symbol for the atom to which it is connected, If it is connected by a double or triple bond, the bond symbol immediately follows the left parenthesis. Some examples: cc;o;c CC[=0)C CC(CC)C CC(C)CC(=0) clc(N{=0)=O)ccccl CC(C)(C)CC 1- J-'opsnc 2- Propanone 2-Methylbutane 2-Methylbutanal Nitrobenzene 2,2-Dim ethyl b uta n e 2. SMILES Název formátu SMILES je zkratkou pro Simplified Molecular Input Line Entry Specification* Formát samotný by] navržen pro použili lidmi, zápis sloučeniny se podobá „normálnímu" zápisu chemických struktur. Byl vytvořen v SO. letech 20. století, přesto nejeví žádné známky zastaráváni a je stále velmi populárni a využívaný. Nove je dostupná i aktualizovaná tbrniálni specifikace, dostupná pod svobodnou licenci10. Umožňuje - ale nevyžaduje -Lzv. kanonickou fomiuH. Cheni. listy 111, 710-715 (2017) LINEÁRNÍ REPREZENTACE CHEMICKÝCH STRUKTUR Jiří Jirát"'1' a Daniel Svozil1,11 https://archive.epa.gov/med/med_archive_03/web/html/smiles.html Bioinformatika a chemoinformatika Bioinforraatics Cheminformatics Type Name Type Name Sequence string format V^FASTA (BNIT3.9, Pearson, Chemical string format C SMILES, IrtChI J >Wr-^STQ .---- • InChl (IUPAC International Chemical Identifier) • IUPAC - International Union of Pure and Applied Chemistry) InCh> I S/C I IH15N02/CI -8( 12-2)5-9-3-4-10-11 (ň-9) 14-7-13-10/h3-4,<5,8, 12H,5,7H2,1 -2H3/t8-/m I /s I / I_IL______II_II_I verze sumami vzorec konektivita Obr. 3. Struktura identifikátoru InChl, hlavní vrstvy identifikátoru vodíky ste reoc hernie 3. InChl (a InChIKey) Jedná se o relativně velice mladý formát (vznik koleni r. 2005), je produktem spolupráce organizací IUPAC a NIST (IUPAC International Chemical Identifier)11"13. Jednou z hlavních ideí bylo vytvorení neutrálního standardního identifikátoru chemických struktur založeného na stniktiiie sloučeniny - napr. CAS RN je vázané na přidělení službou Chemical Abstracts Service, a není dostupné pro látky, které jsou napr. jen hypoteticky predpovězené při generování chemického prostora2. Standardy InChl se stále intenzivně vyvíjejí a jsou přidávána nová rozšíření a vlastnosti, např. standard RlnCliI pro zaznamenávání chemickvch reakcí14. Chem. Listy 111, 710-715 (2017) LINEÁRNÍ REPREZENTACE CHEMICKÝCH STRUKTUR Jiří Jirát'1'1' a Daniel Svozil"11 Bioinformatika a chemoinformatika Bioinformaiics Cheminforrnatics Type Name Type Name Archival sequence databases I Curated databases Gen Bank rat (UNIT 1.27, Pundir et al., 2015), RefSeq, FlyBase, SGD (UNIT 1.20, Skrzvpek and Hirschman. 2011), HPRD Archival compound databases Curated databases PubChem ChEBI (UNIT 14.9, Degtyarenko et al,, 2009), KEGG (UNIT 1.12,Janabe; and Kanehisa. 2012), DrugBank, PharmGKB {UNIT 14.7, Gong et al., 200S), HMDB Pub®hem https://pubchem.ncbi.nlm.nih.gov/ PubChem is an open chemistry database at the National Institutes of Health (NIH). "Open" means that you can put your scientific data in PubChem and that others may use it. Since the launch in 2004, PubChem has become a key chemical information resource for scientists, students, and the general public. Each month our website and programmatic services provide data to several million users worldwide. PubChem mostly contains small molecules, but also larger molecules such as nucleotides, carbohydrates, lipids, peptides, and chemically-modified macrornolecules. We collect information on chemical structures, identifiers, chemical and physical properties, biological activities, patents, health, safety, toxicity data, and many others. Where does the data in PubChem come from? PubChem records are contributed by hundreds of data sources. Examples include: government agencies, chemical vendors, journal publishers, and more. Explore Chemistry Quickly find chemical information from authoritative sources Try covid-19 aspirin EGFR C9H804 57-27-2 C1=CC=C(C=C1)C=0 lnChl = 1S/C3H60/d-3(2)4/h1-2H3 I I Use Entrez Draw Structure Upload ID List t: Browse Data Periodic Table Bioinformatika a chemoinformatika Bioinformatics Cheminformatics Type Name Type Name Archival sequence databases I Clirated databases GenBank rot (UNIT 1.27, Pundir et al., 2015)rRefSeq, FlyBase. SGD (UNIT 13D, Skrzvpek and Hirschman. 2011), HPRD Archival compound databases Cli rated databases PubChem ChEBI(tW/7"M.P, Degtyarenko et al, 2009), KEGG (UNITi.J2,Tanabe and Kanehisa. 2012). DnigBank. PharmGKB (HMTM.7, Gong et al., 2008). HMDB Pub®hem https://pubchem.ncbi.nlm.nih.gov/ aspirin; ACETYLSALICYLIC ACID; 50-78-2; 2-Acetoxybenzoic acid; 2-(Acetyloxy)benzoic acid; Acetosal; O-Acetylsalicylic acid; o-Acetoxybenzoic acid; ... Compound CID: 2244 MF:C9H804 MW: 180.16g/mol IUPAC Name: 2-acetyloxybenzoic acid Isomeric SMILES: CC{=0)OC1 =CC = CC = C1C{=0)0 InChlKey: BSYNRYMUTXBXSQ-UHFFFAOYSA-N InChl: lnChl=1S/C9H8O4/d-6{10)13-8-5-3-2-4-7(8)9(11)12/h2-5H,1H3,(H,11,12] Create Date: 2004-09-16 Tagged by PubChem: D002317 - Cardiovascular Agents; C78272 - Agent Affecting Nervous System > C241 - Analgesic Agent > C2198 - Nonnarcotic Analgesic; N - Nervous system > N02 ■ Analgesics > N02B - Other analgesics and antipyretics > N02BA - Salicylic acid and derivatives; D000893 - Anti-Inflammatory Agents > D000894 - Anti-Inflammatory Agents, Non-Steroidal > D012459 - Salicylates; D006401 - Hematologic Agents > D010975 - Platelet Aggregation Inhibitors; D050299 - Fibrin Modulating Agents; D004791 - Enzyme Inhibitors; C471 - Enzyme Inhibitor > C1323 - Cyclooxygenase Inhibitor > C287 - Aspirin;... Explore Chemistry Quickly find chemical information from authoritative sources Try covid-19 aspirin EGFR C9H804 57-27-2 C1=CC=C(C=C1)C=0 lnChl = 1S/C3H60/c1-3(2)4/h1-2H3 I I Use Entrez Draw Structure t: Upload ID List Browse Data Periodic Table aspirin; ACETYLSALICYLIC ACID; 50-78-2; 2-Acetoxybenzoic acid; 2-{Acetyloxy}benzolc acid; Acetosal; O-Acetylsalicylic acid; o-Acetoxybenzoic acid; ... Compound CID: 2244 MF:C9Hfl04 MW: 180.16g/mol IUPAC Name: 2-acetyl oxy benzoic acid Isomeric SMILES: CC{=0)OC1 =CC=CC=Cia=0)0 InChlKey: BSYNRYMUTXBXSQ-UHFFFAGYSA-N InChl: lnChl=1 S/C9HS04/c1-6(10)13-8-5-3-2-4-7(8)9(11)12/h2-5HH1 H3r(Hp11p12) Create Date: 2004-09-16 Summary Similar Structures Search Related Records PubMed (MeSH Keyword)* PubChem CID: Chemical Safety: Molecular Formula: Synonyms: Molecular Weight: Dates: z Cite Share Z Cits-Share Cits Share Safety and complications of continuation of aspirin therapy in patients undergoing robot-assisted laparoscopic simple prostatectomy. Saini S, Thakker PU, Ritts R Jr, G'Rourke TK, Hemal AK. J Robot Surg. 2024 Apr 25;13[1):1S1. doi: 10.1007/sl 1701-024-01946-2. PMID: 33662167 Free PMC article. Limb Outcomes With Ticagrelor Plus Aspirin in Patients With Diabetes Mellitus and Atherosclerosis. Bonaca MP, Ehatt DL. Simon T, Fox KM, Mehta S. Harrington RA, Leiter LA, Capell WH, Held C, Himrnelmann A, Riddersträle W, Chen J, Lee JJ, SongY, Andersson M, Prats J, Kosiborod VI. Fv cGjire 3K. Steg PG. J Am Coll Cardiol. 2024 Apr 30;B3(17): 1627-1636. doi: 10.101&4jacc.2024.03.377. PMID: 3365S101 Clinical Trial. Letter: Bif 195 for aspirin-induced gastric mucosal damage - Wore to do in further research. Authors" reply. Lbti N, Engel S, Damholt A, Wellejus A, Krop FK. Aliment Pharmacol Ther. 2024 May59t10):1306-1307. doi: 110.111 l/apt.18002. PMID: 38652778 No abstract available. C5H804 0rCH^COOC6H4COOH orHCgHyCU aspirin ACETYLSALICYLIC ACID 50-78-2 2-Acetoxybenzoic acid 2-(Acetyl oxyjbenzoic aci:: More... 130.16 g/mol Aspirin Modify: Create: 2020-04-25 2004-09-16 Aspirin is an orally administered non-steroidal antiinflammatory agent. Acetylsalicylic acid binds to and acetylates serine residues in cyclooxygenases, resulting in decreased synthesis of prostaglandin, platelet aggregation, and inflammation. This agent exhibits analgesic, antipyretic, and anticoagulant properties. Methyl Salicylate; Methyl 2-Hydroxybenzoate; 119-36-8; Wintergreen Oil; Gaultheria Oil; Compound CID: 4133 MF: GH0: MW: 152.15g/mo nChlKey: OSWPMRLSEDHDFF-UHFFFAOYSA-N UPAC Name: methyl 2-hydroxybenzoa1e Create Date: 2005-03-25 Similar Structures Search Related Records Salsalate; Sasapyrine; 552-94-3; Salicylsalkylic Acid; Disalicylic Acid; Compound CID: 5161 MF: C14H10O5 MW: 25B.23g/mol nChlKey: WVYADZUPLLSGPU-UHFFFAOYSA-N UPAC Name: 2-(2-hydroxybenzoyl)oxybenzoic acid Create Date: 2005-03-25 Summary Similar Structures Search Related Records Phenyl Salicylate; 118-55-8; PHENYL 2-HYDROXYBENZOATE; Salol; Phenol Salicylate; Compound CID: 8361 MF:C13H10Oä MW: 214.22g/mol In C Ii I Key: ZQB A KB U EJ OM QEX-U H F F FAOYS A-N UPAC Name: phenyl 2-hydroxybenzoate Create Date: 2005-03-25 Bioinformatika a chemoinformatika Bioinfomiaücs Cheminforrnatics Type Name Type Name Archival sequence databases I Ciirated databases Gen Bank rat (UNIT 1.27, Pundir et al., 2015), RefSeq, FIvBase, SGD (UNIT 1.20, Skrzvpek and Hirschman, 2011), HPRD Archival compound databases Ciirated databases PubChem ChEBI (UNIT 14.9, Degtyarenko et al,, 2009), KEGG (UNIT 1.12,Janabe; and Kanehisa, 2012), DrugBank, PharmGKB {UNIT 14.7, Gong et al., 200S), HMDB Pub®hem https://pubchem.ncbi.nlm.nih.gov/ Explore Chemistry Quickly find chemical information from authoritative sources lnChl=lS/C30H30O8/cl-ll(2)19-15-7-13(5)21(27(35)23(15)17(9-31)25(33)29(19)37)22-14(6)8-16-20(12(3)4)30(38)26(34)18(10-32)24(16)28(22)36/h7-12,33-38H,l-6H3 gossypol; 303-45-7; (-)-Gossypol; 90141-22-3; Pogosin;... Compound CID: 3503 MF: C30H3o06 MW: 51S.6g/mol lUPAC Name: 7-[8-formyl-1,6r7-trihydroxy-3-methyl-5-propan-2- yl naphtha len-2-yl] -2,3,8-trihydroxy-6- methyl-4- propan-2-y I naphtha lene-1- ca rbaldehyde Isomeric SMILES: CC1=CC2 = C(C(=C[C(=C2C(C)C)0)0)C = 0)C(=C1C3 = C(C4=C{C = C3C)C[=C(C(=C 4C=0)0]0)C(QC)0)0 I n C h I Key: Q B KS W RV VC F F D OT- U H F F FAO YS A- N InChl: lnChl = 1S/C30H3QO8/c1-11 [2)19-1 5-7-13(5)21 (27(35)23(15)17(9- 31) 25(33)29(19)37)22-14(5)8-16-20(12(3)4)30(38)25(34)18(10- 32) 24(15)28[22]36/h7-12,33-38H,1-6H3 Create Date: 2005-03-25 Try covid-19 aspirin EGFR C9H804 57-27-2 ^Cl =CC=C(C=C1 )C=Q lnChl = 1S/C3H60/c1-3(2)4/h1-2H3 I I Use Entrez Draw Structure Upload ID List t: Browse Data Periodic Table Explore Chemistry Quickly find chemical information from authoritative sources Bioinformatika a chemoinformatika Try covid-19 aspirin EGFR C9H804 57-27-2 C1=CC=C(C=C1)C=0 lnChl=1S/C3H60/c1-3(2)4/h1-2H3 I I Use Entrez (^'< Im Draw Structure XL J^V IQE ;i=cc=c(c=ci)c=o ha Rb 3e l-lcj Sr Cs Ba Export Hydrogen mport A Sc 5c v| Y v| 3a Lu Lu v| Tl Pb Bi Pa 3e 3n =HC COÜH MQ, s03h As S!n Se Te MDL Molfile Keep Asls 3r He Ke A i Ki Xe At Rn Hs!b Choose File No fie chosen Search for This Structure Pub®hem https://pubchem.ncbi.nlm.nih.gov/ benzaldehyde; 100-52-7; Benzoic aldehyde; Phenylmethanal; Benzenecarboxaldehyde; r^J) Compound CID: 240 MF: C7H60 MW: 106.12g/mol IUPAC Name: benzaldehyde Isomeric SMILES: CI =CC=C(C=C1)C=0 InChlKey: HUMNYLRZRPPJDN-UHFFFAOYSA-N InChl: InChl = 1 S/C7H60/c8-6-7-4-2-1 -3-5-7/hl-6H Create Date: 2004-09-16 Summary Similar Structures Search Related Records Bioinformatika a chemoinformatika Malé molekuly - ligandy makromolekul Řešení 3D struktur komplexů - spojuje chemo a bioinformatiku Ligand Expo http://ligand-expo.rcsb.org/ Bioinformatika a chemoinformatika BioinformaLics Cheminformatics Type Name Type Name S true [Lira I databases PDB WpiTl.9, Dutta et aJ., Structural databases 3DBe CSDQ.igand Expo Ligand Expo Ligand Expo (formerly Ligand Depot) provides chemical and structural information about small molecules within the structure entries of the Protein Data Bank. Tools are provided to search the PDB dictionary for chemical components, to identify structure entries containing particular small molecules, and to download the 3D structures of the small molecule components in the PDB entry. A sketch tool is also provided for building new chemical definitions from reported PDB chemical components. Getting Started: The Ligand Expo Tutorial contains a summary of query, report and download features. Select the Search menu to find a chemical component or build a new chemical component, Select the Browse menu to view tabulations of modified amino acids and nucleotides. Select the Download for links to chemical dictionaries and resource files. Go here for a brief tutorial on the content of the Chemical Component Dictionary. PROTEI N DATA BANK https://webchem.ncbr.muni.cz/Platform/ValidatorDb Ugandy - důvěřuj ale prověřuj! Validator06 O Guide User Wild Manual Database of validation results for ligands and non-standard residues in the Protein Data Bank. Database last update\28/4/2024: 218785/ntrie5from PDBe.org, 870824 molecules relevant for validation, 41768 models from wwPDB CCD. The molecules deemed relevanl lor validation are all ligands and non-standard residues wilh reasonable size (more (ban six heavy aloms). Standard amino acids and nucleolides are not covered. The validation is performed againsl models fromwwPDB Chemical Component Dictionary (wv:PDB CCD]. The database is updated weekly. Quick Help Samples Search Overview Details by Molecule Details by PDB Entry This is the Validator06 synopsis page. Access different tabs for overviews and statistical evaluation of the validation results, in graphical or tabular form. Specific results can be examined in deeper detail by accessing the Validator08 specifics page. Different sections of the web page offer interactive guides indicated by which give a quick walk through all the main elements of :ie page. Further help is provided by the info icons 0. Many tool tips are available by hovering over any graphical or textual element in the interface. Refer to the Wiki Manual for any clarif cations (especially Terminology and User Interface). First Time User? Cňecŕí ouŕ frte Fírsť Time User Presentation ValidatorDB: database of up-to-date validation results for ligands and non-standard residues from the Protein Data Bank David Sehnal1'2-34, Radka Svobodová Vařeková' -2-\ Lukáš Pravda'2, Crtna-Marla lonescu', Stanislav Geidl12, Vladimír Horský3, Deeptl Jaiswaľ, Michaela Wimmerová12 and Jaroslav Koča1>2-' ABSTRACT Following the discovery of serious errors in the structure of biomac no molecules, structure validation has become a key topic of research, especially for ligands and non-standard residues. ValidatorDB (freely available at http://ncbr.muni.cz/ValidatorDB) offers a new step in this direction, in the form of a database of validation results for all ligands and non-standard residues from the Protein Data Bank (all molecules with seven or more heavy atoms). Model molecules from the wwPDB Chemical Component Dictionary are used as reference during validation. ValidatorDB covers the main aspects of validation of annotation, and additionally introduces several useful validation analyses. The most significant is the classification of chirality errors, allowing the user to distinguish between serious issues and minor inconsistencies. Other such analyses are able to report, for example, completely erroneous ligands, alternate conformations or complete identity with the model molecules. All results are systematically classified into categories, and statistical evaluations are performed. In addition to detailed validation reports for each molecule, ValidatorDB provides summaries of the validation results for the entire PDB, for sets of molecules sharing the same annotation (three-letter code) or the same PDB entry, and for user-defined selections of annotations or PDB entries. Ugandy-PROVĚŘUJ! PDBe > 3ib0 Structural basis of the prevention of NSAID-induced damage of the gastrointestinal tract by C-terminal half (C-lobe) of bovine colostrum protein lactoferrin: Binding and structural studies of C-lobe complex with diclofenac Source organism: E\-s Hiurus Primary publication: pp The structural basis for the prevention of nonsteroidal antiinflammatory drug-induced gastrointestinal tract damage by trie C-lobe of bovine colostrum lactoferrin. Mir Rr Singh H, Vikrarn Gr Kiumar RP, Sinha M, Bhushan Ar Kaur Pr Srinivasan Ar Sharrna Sr Singh TP Biophys. J. 97 3173-86 (2009) PM1D: 20006955 X-ray diffraction 1.4k resolution Released: 11 Aug 2009 Model geometry Fit model/data Quick links H 3ibG overview • Citations tP Structure analysis tP Function and Biology t? Ligands and Environments Experiments and Validation ra View A Downloads ^ 3D Visualisation Function and Biology Biochemical function: Biological process: Cellular component: * not assigned * not assigned * not assigned Sequence domain: * Transrerrin-like domain 2? Structure analysis 3 Details Ligands and Environments 3 Details Assembly composition: -nonomerk (preferred} Entry contents: L distinct polypeptide molecule Macro molecule: ™ Lac:otransferrin S bound ligands: Fe" 1 x FE 2 x ZN C" 1 x C03 6 x NAG 1 x DIF 7 x MAN V 2 x S04 PDB-REDO Tbe sliders below show the change in model quality between original PDB entry and tbe PDB-REDO entry Model Geometry Fit model/data PDB-RH3Q 1 x EOH Ugandy-PROVĚŘUJ! Modře je znázorněna elektronová hustota , získaná při rentgenostrukturní analýze. Pomocí elektronové hustoty - dosazováním atomů do ní-řešíte strukturu molekuly. Tam, kde autoři tvrdí, že se váže ligand, elektronová hustota zcela chybí. Může se stát, že ligand do elektronové hustoty nesedí - naváže se tam něco jiného než autoři chtějí, rozlišení je špatné, ligand je špatně orientován. Ale tady je přání otcem myšlenky © RSCC = 0.27,1.I.DF = 16 (*) Figure 2 Visualization of two ligands from the PUB together with electron-density maps, flu- LileMiyl viewer (Schnal el at. 2017) on the PDBc website (Mir el at.. 2018) has been used to visualize the ligands with LDS-stylc (Klcywcgt ei at.. 2004) electron-density maps. In each case, the 2mF„ — map is shown as a blue mesh contoured at 039 c A"', whereas the mh„ - DFt difference map is shown by solid green and red surfaces contoured at +0.25 and -0.25 c A , respectively, (a) Model and electron density for the well placed hgand 46N from PDB entry ti/i (He el at.. 2006). (/>) The hgand DIK m PDB entry 3ibO (Mir el at.. 2009). STRUCTURAL Validation of ligands in macromolecular structures biology determined by X-ray crystallography B5N 2re,Jt Radka Svobodová Va rekova",b,t Veronika Bendová,bl,J Gerard J. KleyweKf and Sameer Velankar1* Aby Vaše struktura byla využita jako příklad hned ve dvou článcích o chybách ve strukturách...to doufám nechcete...na své ligandy si dávejte pozor! © Detect, Correct, Retract: How to manage incorrect structural models Alexander Wlodawer3. Zbigniew Dauter*5. Przemyslaw J PorebskF. Wladek Minor-. Rabyn Stanfield3. Mariusz Jaskolski'-Edwin Pozharski^, Christian X. WeichenbergerA and Bern hard Rupphi' Summary. The crystal structures of the C-lobe of bovine colostrum lactoferrin do not support drug binding In this scries of structures, prescnl in the PDB and the scientific literature, no evidence exists from crystallography that the purported [S'SAIDs bind where stated. Significant diseiiepaneics exist between the electron density maps displayed in the original publications versus maps that can be generated by accepted standard procedures Caution must be exercised when maps are constructed in unconventional ways. A possible explanation for the absence of ligands in this entire scries of"models could be the deposition of structure factor amplitudes corresponding to ligand-ffee (apo) structure. In this ease, the authors would need to produce the correct original data. Here and in any similar eases, the journals where the original work was published should be informed of the problem, and an erratum linked lo the new PDB deposit (if any), should be published. Absorption Distribution Metabolism Excretion Bioinformatika a chemoinformatika Bioinforraatics Type Property prediction Property prediction Property prediction Property prediction Name ^{ydrophobicit^ pi Si-Lli h i I Ll> Molecular weight Cheminformatics Type Property prediction Property prediction Property prediction Property prediction Name pKa Solubility MoLvliLli" u ciíhL P - rozdělovači (partition) koeficient, vyjadřuje rozdělení látky mezi vodnou a organickou fází. Např. voda/oktanol. Jak hydrofilní/hydrofobní je daná chemická látka? rwlCOMPUDRUG CompuDrug - Your Expert in Chemical Informatics Welcome CompuDrug iS a niche Software Tirpnratjnnj ^hi.-h hac hnan Cjpeu-ia living in developing and generating^ÄDME and drug discovery software^ focusing on ADME prediction and [7iiyfeii_.' o i al l.v ava i lable small molecules approved in t h e past decade would now be ma re than 600 dallans. he found. The threshold for hydrogen bond acceptors has also increased substantially. These data call i nto q uesti on the hy pothesfs that hdrug - lite" prape rties exist, he concludes. "Repeating the [rule of 5] experiment today, with over twice as many oral drugs approved than were available in 1997, gives different 'rules" than those hypothesized two decades ago ... Ifour past future pred icti ons ha ve not been accurate with the [rule of S] pa rameters. we must call i nto question au r current fu ture predictions." With new modalities coming online — such as targeted protein degradersand constrained peptides —he urges drug developers to reconsider how they use the rule oF 5. "We are in danger of repeating aurpast mistakes if we assume these new modalities are not 'drug like' and cannot be oral drugs because they are not [rule of 5] compliant," writes Shultz. Asricr Mallard Malé molekuly a metabolomika • Metabolismus (látková přeměna): Souhrn všech reakcí v buňce při nichž dochází k přeměně látek. Buňka tak získává energii, stavební a zásobní látky. Reakce jsou uspořádané do sérií -metabolických drah. • Metabolit: Sloučenina zařazená do metabolismu. • Sekundární metabolit: Sloučenina, která není nezbytná pro základní životní funkce. Biosyntéza navazuje na primární metabolismus, její funkce není vždy známá. Chem. Listy 105, 745-751 (2011) METABOLOMIKA - ZÁKLADNÍ POJMY, STRATEGIE A METODOLOGIE Jindra Musilová a Zdeněk Glatz Ústav biochemie, Přírodovědecká fakulta a Středoevropský technologicky' institut, Masarykova univerzita, Kotlářská 2, 611 37 Brno jtmtsihra@jnail.inuf7i.cz • Metabolom: Komplexní sada metabolitů. Soubor všech intra- i extracelulárních nízkomolekulárních látek (Mr < 1000) v živém systému, které se účastní metabolických reakcí, a které jsou nezbytné pro růst a normální funkci buňky (tkáně, organismu). • Metabolomika: Komplexní analýza metabolomu za konkrétního fyziologického nebo vývojového stádia organismu, tkáně či buňky. Malé molekuly a metabolomika Metabolomika: Komplexní analýza metabolomu za konkrétního fyziologického nebo vývojového stádia organismu, tkáně či buňky. Více odráží aktuální stav buňky (ve srovnání s transkriptomikou nebo proteomikou). Analýza tisíců různých sloučenin s extrémně variabilními strukturami a vlastnostmi. Stanovení biomarkerů jako indikátorů chorob. Metabolomika: Mladá věda, definována jako samostatný obor poměrně nedávno (oiivers.,1998; Fiehno., 2002). Ale s hlubokými kořeny. Za první využití metabolomiky bývá považována analýza tělních tekutin pro hodnocení zdravotního stavu. Čína, 2000 př.n.l.: využití mravenců ke stanovení koncentrace glukosy v moči diabetiků. (Lze si tady představit využití jednoduché kalibrační křivky podle počtu přilákaných mravenců). Egypt, Řecko, 300 př.n.l.: testování moči pacientů ochutnáním. Malé molekuly a metabolomika Obrovský nárůst Uroskopie (uromancie) -diagnostika chorob z moči to Si ■ÍM TT "íl I oo o 3 r~- o>o O) O O O O Ot-CJi O OOOOOOOOOO t- N ť4 PJJ cv| NOJ fMfM ÍM fM CM Pre-metabolomics Instrumental and methodological d Chapters Informatics for Mctabolomics kanthida Kusoiimano. Wanwipa Yoiiftsangnak. and Pramotc ('hiiiiinaiipueii Uroscopic rainbow: modern matula medicine C L Foot, J F Fraser „The urine wheel" Uroskopie (uromancie) -diagnostika chorob z moči / f/ 4 Obrovský nárůst metabolomických dat. Vznik databází, zapojení informačních technologií en a o 5 o oóóoooo T- (N (M (N(N (Nj Alanine. «Spartak and glutamatr metobobim ( Gtyoxyhte aid dxaiboxylate W I rukbolitn ( Aigiiunt bi05yMhwu^)- -1—>0 Fumarate _ ÍAxoňmm tad aldltafe Aj- i:i i -.] iinv mtabolsra I _ _ _ _ Alanine, aspartate and ^gloiamafe metabolism ■-----O^D-OlaAD-OloiuMwtw ) 00020677ns (c) Kanahtta LafcoiatoriM Arabidopsis thaliana (thale cress) umius yanui iLLiiiLr.eiiji- Xenopus laevis (African clawed frog] Danio rerio (zebrafish) Oryzias latipes [Japanese medaka) Drosophila melancgaster [fruit fly] Caenorhabditis elegans [nematode) Arabidopsis thaliana (thale cress) Arab í do psi 5 thaliana (thale tress) Go 32% CITRATE CVCLE (TCA CYCLE) I^Fttty^laiiBrBftacy'J------ (jitlytiitltlfliigiliflti in iMiochondttT)<-----■■ ^Faíty«djinwtrfMriiafr)---- fŕ.l.tiirs.aífjailí.teítd'Vj------. í Ol^mjiu-ti ai)d dLCůibaxjiůií W_____. (5).m.tttO- l rI L.I 1.3T|- fo-1 41-■ f lyosuií. V I ■'■312 i V databázích metabolických drah jsou informace o metabolitech a rovněž o enzymech, které metabolity tvoří/přeměňují. be Arabidopsis thaliana (thale cress): AT1G01090 Helfl Ent ry AT1G01996 CDS 100841 Gere name PDH-E1_ALPHA Definition KO (RefSeq) pyruvate dehydrogenase El alpha KG0161 pyruvate dehydrogenase El component alpha subunit [EC:1.2.4.1] Organ ism ath Arabidopsis thaliana (thale cress) Pathway athOSQlO Glycolysis / Gluconeogenesis athOßQ20 Citrate cycle (TCA cycle) athOS620 Pyruvate metabolism athOllOQ Metabolic pathways athOlllQ Biosynthesis of secondary metabolites athO12€0 Carbon metabolism Module ath_M0G3G7 Pyruvate oxidation, pyruvate => acetyl-CoA ____.^J Alanine, aspnrlate and 1 ^[ gjulajnatc metabolism J ^-----t^-Gln^D-GlaawtQbDliääT) 3 LEtOMltürirS COMPOUND: C00311 Exact mass Hoi weight Struetu re Reaction Pathway C32211 Compound Isocitrate; Isocitric acid; 1-Hydroxytricarballylic acid; 1-Hydroxypropane-1,2,3-tricarboxylic acid C6H807 192.027 192.1235 HO OH OH HO ^O Mol file KCFfiie OB search RQ0267 RQ0479 RQ0709 R01324 RQ1899 RQ190O RQ1946 mapO0O20 Citrate cycle (TCA cycle) mapO0630 Glyoxylate and dicarboxylate metabolism mapO072S Carbon fixation pathways in prokaryotes mapQlQ6S Biosynthesis of plant secondary metabolites mapQltffil Biosynthesis of phenylpropanoids mapQlQ62 Biosynthesis of terpenoids and steroids mapQlQ63 Biosynthesis of alkaloids derived from shikimate patiway fee Metabolic pathways - Reference pathway https://www.genome.jp/kegg-bin/show_pathwayPmap01100 Takhle vypadá (skoro) celý metabolismus © Databáze metabolických drah Category title Pathway module I Carbohydrate metaboli Central carbohydrate J M00001 Glycolysis 3 M00002 Glycolysis □ MOOOOS Gluconeoc □ M00307 Pyruvate < ^ M00009 Citrate cyi J M00010 Citrate cyi M00011 Citrate cy< □ M0OOQ4 Pentose p U M00006 Pentose p J M00007 Pentose p J M00580 Pentose p ] M00005 PRPP bios' □ M000Q8 Entner-Dc J M0030S Semi-phoi J M00633 Semi-phoi J M00309 IMon-phos| Other carbohydrate r J M00014 Glucurona J MQ0630 D-Galactu ] M00631 D-Galactu □ M00061 D-Glucuro ] M00081 Pectin dm ^ I____] ■-.I-I-T-- - L rttpirillbjn f VŠ SMPDB Databáze metabolických drah https://smpdb.ca/ Imall olecule Pathway Database O Brought to you by the creators of the u man Msta bo lome Database (HMDB) Drug Ban h SMPDB {The Small Molecule Pathway Database) is an interactive, visual database containing more than 30 000 small molecule pathways found in humans only. The majority of these pathways are not found in any other pathway database. SMPDB is designed specifically to support pathway elucidation and pathway discovery in netabolomics: transcriptomics, proteomics and systems biology. It is able to do so, in part, by providing exquisitely detailed, fully searchable, hyperlinked diagrams of human metabolic pathways, metabolic disease pathways, metabolite signaling pathways and drug-action pathways. All SMPDB pathways include information on the relevant organs, subcellular compartments, p rote in_comp lex cofactors, protein_complex locations, metabolite locations, chemical structures and protein_complex quaternary structures. Each small molecule is riypelinked to detailed descriptions contained in the HMDB or Drug Bank and each protein_complex or enzyme complex is hyperlinked to UniProt. All SMPDB pathways are accompanied with detailed descriptions and references, providing an overview of the pathway, condition or processes depicted in each diagram. The database is easily browsed and supports full text, sequence and chemical structure searching. Users may query SMPDB with lists of metabolite names, drug names, genes/protein_complex names, SwissProt IDs, GenBank IDs, Affymetrix IDs or Agilent microarray IDs. These queries will produce lists of matching pathways and highlight the matching molecules on each of the pathway diagrams. Gene, metabolite and protein_complex concentration data can also be visualized through SMPDB's mapping interface. All of SMPDB's images, image maps, descriptions and tables are downloadable. VŠ SMPDB Databáze metabolických drah https://smpdb.ca/ Aspartate Metabolism Aspartate Is synthesized by transamination of rjxaloacetate by aspartate aminotransferase or amino acid oxidase. Aspartyl-tRNA synthetase can then couple aspartate to aspartyl tRNA for protein synthesis. The aspartate content in human proteins is about 7%. Asparargine synthase can convert aspartate tn the polar amino acid asparaglne. Aspartate Is also a precursor for cellular signaling compounds such as., N-acetyl-aspartate, beta-alanine, adenylsuccinate, arginino-succinate and N-tarbamoylaspartate. Aspartate is also a metabolite In the urea cycle and involved in gluconeogenesls. Additionally, aspartate carries the reducing equivalents in the mitochondriaJ malate-aspartate shuttle, which utilizes the ready intereconversion of aspartate and oxaloacetate. The conjugate base of L-aspartic acid, aspartate, also acts as an excitatory neurotransmitter In the brain which activates NM DA receptors. View Pathway (5MPD0OÜ067) Fumarate hydratase, mitochondrial Components Description Reactions Fumarate hydratase, mitochondrial Details in UniProt (P07954) Homo sapiens Cell https://smpdb Fumaric acid Structu re Description Reactions Details in HMDB (HMDBU000134) Details in DrugBank (DBU4299) Bioinformatika + chemoinformatika • Metabolomika a databáze metabolických drah spojují chemoinformatiku a bioinformatiku a stírají hranice mezi nimi. Spojují chemické vlastnosti sloučenin s jejich biologickým významem. • Bioinformatika a chemoinformatika se postupně sbližují a prolínají, někteří autoři používají výraz „chemická bioinformatika" pro průnik těchto oborů (spojení studia chemických vlastností s molekulárně-biologickými rolemi). Souvisí rovněž s rozšiřujícími se znalostmi o významu malých molekul. • Vzpomeňte na sacharidy a lipidy: jsou to nízkomolekulární látky a metabolity, ale zároveň jsou součástí makromolekul (glykoproteiny, lipoproteiny), mají významné strukturní funkce (polysacharidy, buněčné membrány), mají informační role (antigény, interakce s patogeny). OPEN @ ACCESS Fraelyavaihble online ■©■PLOS BIOLOGY Education Chapter 3: Small Molecules and Disease David S. Wishart1 2 3* 1 Department of Biological Sciences, University of Alberta, Edmonton, Alberta, Canada, 2 Department of Computing Science, University of Alberta, Edmonton, Alberta, Canada, 3 National Research Council, National Institute for Manotechnology (NINT), Edmonton, Alberta, Canada «DRUGBANK Malé molekuly - léčiva The DrugBank database is a unique bioinformatics and chem informatics resource that combines detailed drug data with comprehensive drug target information. https://go.drugbank.com/ Advanced Search Target Sequence Spectra Search Pharmaco-omics Chemical Structure •DRUGBANK Malé molekuly - léčiva https://go.drugbank.com/ Name Cetirizine Accession Number DB00341 (APRD0O63O) Type Groups Description Small Molecule Approved Synonyms Ceti mir s Cetirizina ^ Cetirizine Cetirizinum 1 1 Cetirizine, also commonly known £s Zyrtec, i^an orally active second-generation histamine H1 antagonist proven effective in the tn?dlni?iit of various allergic symptoms, such as sneezing, coughing, nasal congestion, hives, and other symptoms 1, 1. One of the most common uses for this drug is for a condition called allergic rhinitis. The prevalence of allergic rhinitis in the United States is about 15% according to physician diagnoses, and up to 30%, according to self-reported nasal symptoms. Allergic rhinitis is associated with multiple missed or unproductive days at work and school, problems with sleep, and other difhcu ties with day to day activities for many individuals 3. Furthermore, some antihistamine agents that are used to treat this condition cause undesirable, sedating effects 4 . Cetirizine is one of the first second-generation H1 antihistamines (SGAHs)formulated to selectively inhibit the H1 receptor without sedating effects 2. •DRUGBANK Malé molekuly - léčiva https://go.drugbank.com/ Name Cetirizine Carcinogenesis and mutagenesis: In a 2-year carcinogenicity study in rats, cetirizine was not Accession Number DBD0341 (APRD0O63O) shown to be carcinogenic at dietary doses up to 20 mg/kg (approximately 15 times the maximum recommended daily oral dose in adults). In a 2-year carcinogenicity study in mice, cetirizine administration lead to an incidence of benign liver tumors in males at a dietary dose of 16 mg/kg (approximately 6 times the maximum recommended daily oral dose in adults). The clinical significance of these findings during long-term use of cetirizine is unknown at this time Label. Type Small Molecule Groups ^^pproved^^ Cetirizine was not mutagenic in the Ames test, and not clastogenic in the human lymphocyte assay, the mouse lymphoma assay, and in vivo micronucleus test in rats Label. Kind Protein General Function Histamíne receptor activity Organism H L T= IS Specific Function In peripheral tissues, the H1 subclass of histamine Pharmacological action receptors mediates the contraction of smooth muscles, increase in capillary permeability due to Actions Gene Name Uniprot ID Uniprot Name Molecular Weight contraction of terminal venules, and catecholamin.. HRH1 ^^35367^ Histamine H1 receptor 55783.61 Da Pregnancy Category B: In mice, rats, and rabbits, cetirizine was not teratogenic at oral doses up to 96, 225, and 135 mg/kg, respectively (approximately 40, 180 and 220 times the maximum recommended daily oral dose in adults). There are no adequate and well-controlled studies in pregnant women. Because animal studies are not always predictive of human response, cetirizine should be used in pregnancy only if clearly needed Label Use in breastfeeding/nursing Cetirizine has been reported to be excreted in human breast milk. The use of cetirizine in nursing mothers is not recommended Label. Malé molekuly - léčiva «DRUGBANK The DrugBank database is a unique bioinformatics and chem informatics resource that combines detailed drug data with comprehensive drug target information. DiöHT c xůa^p Hi © a '■-ý Score: 0.516 https://go.drugbank.com/ Advanced Search Target Sequence Spectra Search Pharmaco-omics Chemical Structure 1-biphenyl-2-yl met hana mine p-Quaterphenyl 135-70-6 Malé proteiny • Protein vs. peptid - často (historicky) rozdělovány podle velikosti. Jako proteiny jsou označovány polymery s minimální délkou 50-100 aminokyselin, kratší bývají označovány jako peptidy. • Protein vs. peptid - dělení podle struktury a původu. Peptidy vznikají proteolýzou většího prekurzoru nebojsou syntetizovány uměle. Jako peptidy se také někdy označují přirozeně neuspořádané řetězce aminokyselin, které nemají stabilní prostorové uspořádání a mohou flexibilně měnit konformaci. • Malé proteiny - proteiny, které vznikají přímo translací krátkého ORF (kratší než 100 kodonů). Při predikci genů mohou unikat, cut off používaný při predikci vycházející z průměrné délky ORF je často větší (při snížení bychom museli kontrolovat mnohonásobně více ORF). Malé proteiny • Malé proteiny - proteiny, které vznikají přímo translací krátkého ORF (kratší než 100 kodonů). Při predikci genů mohou unikat, cut off používaný při predikci vycházející z průměrné délky ORF je často větší (při snížení bychom navíc museli kontrolovat mnohonásobně více ORF). • Malé proteiny - unikají i při biochemických analýzách, metody „nepočítají" s proteiny menšími než cca 5 kDa. Často objeveny jen shodou okolností. Příklady malých proteinů: • protein SpoVM (26 aminokyselin), podílí se na sporulaci grampozitivních bakterií. Delece genu pro SpoVM způsobuje těžké defekty sporulace, díky tomu byl objeven. Předpokládá se, že při sporulaci plní minimálně čtyři různé funkce (malý, ale šikovný). • Protein SidA (29 aminokyselin), ovlivňuje buněčné dělení u bakterií (Caulobacter crescentus). • Protein MgtR (30 aminokyselin), regulace membránově vázaných enzymů (Salmonella). Malé proteiny Small Proteins Can No Longer Be Ignored Predikce malých proteinů (krátkých ORF): • krátkých ORF se náhodně vyskytuje v genomu mnoho, zároveň se zmenšující se délkou klesá přesnost predikce založené na statistických parametrech. • ORF jsou prostě příliš krátké, aby např. obsahovaly dost hexamerů (pro HMM pátého řádu), problém vyhodnotit i frekvenci výskytu tripletů - využití kodonů. • Problematické odlišení „pravých" krátkých ORF od mnoha náhodných krátkých ORF. • Mnoho zatím charakterizovaných malých proteinů je hydrofobní - cílené vyhledávání v membránových frakcích? GiseJa S torz,1 Yuri I. Wblf,-and Kumaran S. Ramamurthi FJgMTEi 1_ Sites of small protein aerjnn. The cyrosnl ot a composite grarrL-posirive or gram-negative bacterium bounded by the plasma membrane (iigbi gray) is shown. The outer fnresporc membrane during spnrulation is depicted in dark gray. Proteins associated with various cell functions arc colored as follows: kinases, green.; transporters, red; mcmhranc-bound enzymes, blue; eel] division septum, yellow; forcspore during1 sporularion, orange; soluhlc chaperoncs, purple. Small proteins are depicted as rectangles. Transmembrane small proteins are depicted as rectangles chat traverse the plasma membrane, amphiparhit helical -m.ill pniTems thai mil penpheralh intml.ir.iiK- ;i---lf,-and Kumaran S. Ramamurthi* Chem. Listy JOJ. 745-751 (2011) METABOLOMIKA - ZÁKLADNÍ POJMY, STRATEGIE A METODOLOGIE Chapter 5 Informatics for Mctabolomics Kanthida Kusonmano, Wanwipa Vongsangnak, and Pramote Chumnanpucn © Springer Science-eBusiness Media Singapore 2016 B, Shen el al. (eds.), Translationa! Biomedical Informatics, Advances in Experimenlal Medicine and Biology 939, DOI 10.1007/978-981-10-1503-8_5 Peptides/Proteins Encoded by Non-coding RNA: A Novel Resource Bank for Drug Targets and Biomarkers SongZhuvt, Jizhong Wang'-1', Yutian He'*', Nan Meng'" and Guang-Rong Yan"' SOFTWARE MiPepid: MicroPeptide identification tool using machine learning fvlengmeng Zhu1-2 and Michael Gribskov2 ©