C2150 Zpracování informací a vizualizace v chemii a biochemii -1-5. 3D vizualizace I C2150 Zpracování informací a vizualizace v chemii a biochemii Petr Kulhánek kulhanek@chemi.muni.cz Národní centrum pro výzkum biomolekul, Přírodovědecká fakulta, Masarykova univerzita, Kamenice 5, CZ-62500 Brno 5. lekce (3D vizualizace I) Revize 1 C2150 Zpracování informací a vizualizace v chemii a biochemii -2-5. 3D vizualizace I Molekulární struktura C2150 Zpracování informací a vizualizace v chemii a biochemii -3-5. 3D vizualizace I Molekulární struktura kyselina benzoová strukturní vzorec (3D) model struktury Strukturní vzorec zobrazuje propojení jednotlivých atomů pomocí spojovacích čar (jednoduchých, zdvojených či ztrojených úseček, v případě potřeby i zakřivených čar), znázorňující vazby mezi atomy (jednoduché, dvojné nebo trojné vazby). Přitom délka spojovacích úseček a úhly mezi sousedními úsečkami nevyjadřují ani skutečnou délku vazeb v molekule, ani úhly mezi vazbami. (3D) Molekulární struktura popisuje prostorové uspořádání atomů. Struktura (poloha atomů) může být určena experimentálně nebo pomocí molekulového modelování. (3D) Molekulární model je fyzikální model molekuly. Vytvářením modelů se zabývá molekulové modelování a jejich grafických znázorněním pak molekulová grafika (obě disciplíny spolu úzce souvisejí). (3D) molekulární struktura C2150 Zpracování informací a vizualizace v chemii a biochemii -4-5. 3D vizualizace I Geometrie molekuly },,,....,,,,,,{ 222111 NNN zyxzyxzyx=R kartézské souřadnice prvního atomu Jednotlivé hodnoty vektoru R tvoří konfigurační prostor. Každý bod v konfiguračním prostoru pak představuje unikátní strukturu daného systému. Konfigurační prostor: kartézské souřadnice posledního atomu C2150 Zpracování informací a vizualizace v chemii a biochemii -5-5. 3D vizualizace I Počítačová reprezentace struktury Strukturu lze reprezentovat různým způsobem. V chemii se používá více jak 100 formátů, jedná se buď o textové nebo binární soubory. Formát popisuje geometrii systému, jména atomů, skupin atomů, konektivitu mezi atomy (vazby) a další informace. Geometrie systému může být uvedena v: ➢ kartézských souřadnicích ➢ interních souřadnicích ➢ varianty interních souřadnic C2150 Zpracování informací a vizualizace v chemii a biochemii -6-5. 3D vizualizace I Formát XYZ počet atomů komentář značka x y z značka x y z ................... značka x y z 24 chorismate C -1.86100 -0.57700 0.31800 O -2.56800 0.47600 0.32600 O -2.20900 -1.75300 0.64200 C -0.38900 -0.41000 -0.18800 ................................................ H -0.50900 1.67900 -0.44800 Formát xyz je textový soubor s volným formátováním (hodnoty ve sloupcích mohou být odděleny libovolným počtem mezer nebo jiných bílých znaků). Formát popisuje pouze geometrii systému, neobsahuje informace o vazbách v systému. Program, který s formátem pracuje, musí tyto informace dopočítat (např. pomocí atomových poloměrů). polohy jsou v angströmech (Å) C2150 Zpracování informací a vizualizace v chemii a biochemii -7-5. 3D vizualizace I Kartézské vs interní souřadnice O -0.180077 -0.046023 -0.062789 H 0.196208 -0.747659 0.498793 O 0.006537 1.047922 0.877207 H -0.931885 1.299156 0.951390 O H 1 0.974298 O 1 1.454349 2 96.868054 H 3 0.974298 1 96.868054 2 239.552651 Kartézské souřadnice Interní souřadnice (Z-matrix) vazebná délka vazebný úhel torzní úhel 3N 3N-6 3N-5 Počet stupňů volnosti: Počet stupňů volnosti: (lineární dvouatomová molekula) x y z C2150 Zpracování informací a vizualizace v chemii a biochemii -8-5. 3D vizualizace I Interní souřadnice 1 O 2 H 1 0.974298 3 O 1 1.454349 2 96.868054 4 H 3 0.974298 1 96.868054 2 239.552651 2-1 4-3 4-3-1 3-1-2 4-3-1-2 vazebná délka (a) vazebný úhel (b) torzní úhel (c) http://www.ccl.net/cca/documents/molecular-modeling/node4.html C2150 Zpracování informací a vizualizace v chemii a biochemii -9-5. 3D vizualizace I Kde získat strukturu/model? ➢ Experimentální struktury ➢ X-ray nebo neutronová difrakce (poloha jednotlivých atomů) ➢ ostatní techniky poskytují pouze modely (např. NMR, CryoEM, SAXS, …) ➢ In silico modely ➢ malé molekuly ➢ 2D -> 3D konverze (high-throughput modelování, virtuální screening) ➢ ab initio predikce biomolekulárních struktur (alphafold,…) ➢ Modelování vedené experimentálními daty ➢ NMR (NOE kontakty, …) ➢ CryoEM, SAXS (elektronová hustota, tvar, …) ➢ Modely vycházející z experimentálních struktur ➢ in silico změna experimentálních struktur ➢ homologní modelování (biomolekulární struktury) C2150 Zpracování informací a vizualizace v chemii a biochemii -10-5. 3D vizualizace I Zdroje 3D struktur - experiment Obsahuje struktury malých molekul určených pomocí rentgenové a neutronové difrakce. Cambridge Structural Database (CSD) http://www.ccdc.cam.ac.uk/Solutions/CSDSystem/Pages/CSD.aspx Obsahuje struktury biomolekulárních systémů uřčených převážně pomocí rentgenové strukturní analýzy. Protein Data Bank (PDB) http://www.pdb.org Experimentální metoda Proteiny (P) Nucleové kyseliny (NA) P/NA komplexy Jiné Celkově X-ray 77445 1481 4069 3 82998 NMR 8851 1046 193 7 10097 elektronová mikroskopie 469 45 129 0 643 stav v září 2013 C2150 Zpracování informací a vizualizace v chemii a biochemii -11-5. 3D vizualizace I Vizualizace (molekulová grafika) https://en.wikipedia.org/wiki/Molecular_graphics C2150 Zpracování informací a vizualizace v chemii a biochemii -12-5. 3D vizualizace I Vizualizace vstupní geometrie (volitelně konstituce) projekce do 2D (zahrnuje natočení, posunutí, a škálování každého bodu modelu) umístění prvků modelu do 3D (koule, tyčinky, čáry, povrchy) zobrazení v 2D (Z-buffer, double buffer) speciální techniky zobrazování pro zdokonalení vnímání 3D modelu http://qutemol.sourceforge.net C2150 Zpracování informací a vizualizace v chemii a biochemii -13-5. 3D vizualizace I Vizualizace – malé molekuly čárový model tyčinkový model CPK model vdW model stejná struktura jiná vizualizace C2150 Zpracování informací a vizualizace v chemii a biochemii -14-5. 3D vizualizace I Cvičení C2150 Zpracování informací a vizualizace v chemii a biochemii -15WOLF Klastr - GNOME Desktop Nastavení, odhlášení Standardní aplikace Dock (běžící a oblíbené aplikace) Terminal napsat "terminal" C2150 Zpracování informací a vizualizace v chemii a biochemii -16-5. 3D vizualizace I In silico modelování Program Avogadro C2150 Zpracování informací a vizualizace v chemii a biochemii -17-5. 3D vizualizace I ▪ Otevřít terminál, aktivovat modul, a spustit program Spuštění programu Avogadro $ avogadro2 $ module add avogadro $ avogadro ▪ Novější verzi je možné spustit z nabídky standardních aplikaci (nedoporučuji) ▪ nebo z terminálu spuštěním příkazu indikuje zápis do příkazové řádky (znak se nepíše) C2150 Zpracování informací a vizualizace v chemii a biochemii -18-5. 3D vizualizace I Draft modelu • V režimu úprav navrhnete model struktury. • Tento model nemá správné vzdálenosti mezi atomy a valenční úhly. Před dalším použitím je třeba jej optimalizovat. C2150 Zpracování informací a vizualizace v chemii a biochemii -19-5. 3D vizualizace I Optimalizace modelu • Avogadro používá k optimalizaci modelů molekulovou mechaniku (silové pole). • Pro správný výsledek je nutné, aby výchozí model obsahoval správnou topologii (konstituci), tj. správně uvedené vazby včetně jejich vazebného řádu. • Metody silového pole jsou empirické. Proto je nutné zvolit správnou parametrizaci, například MMFF94. C2150 Zpracování informací a vizualizace v chemii a biochemii -20Cvičení 1 1. Vytvořte modely následujících molekul: • methan • ethen, ethyn • benzen • adamantan • kyselina benzoová • trinitrotoluen • kyselina salicylová • volitelně molekula C60 C2150 Zpracování informací a vizualizace v chemii a biochemii -21Cvičení 2 1. Vytvořte model obsahující bázový pár G:C podle níže uvedeného schématu. K nasycení volných valencí použijte atom vodíku. Pro optimalizaci geometrie použijte silové pole MMFF94. https://en.wikipedia.org/wiki/Base_pair C2150 Zpracování informací a vizualizace v chemii a biochemii -22-5. 3D vizualizace I Program Nemesis In silico modelování C2150 Zpracování informací a vizualizace v chemii a biochemii -23-5. 3D vizualizace I Spuštění programu Nemesis $ module add nemesis $ nemesis ▪ Otevřít terminál, aktivovat modul, a spustit program C2150 Zpracování informací a vizualizace v chemii a biochemii -24-5. 3D vizualizace I Nemesis - Build Project vrstvy grafické modely stavba/editace molekuly měření geometrie Nastavení silového pole: menu Geometry-> Optimizer Setup optimalizace modelu pomocí silového pole Myš: • levé tlačítko - selekce • prostřední tlačítko - rotace • pravé tlačítko - posunutí • kolečko - zoom Klávesy: •Shift - XY -> Z •Ctrl - primární/sekundární manipulátor C2150 Zpracování informací a vizualizace v chemii a biochemii -25Exercise 3 1. Vytvořte modely následujících molekul: • methan • ethen, ethyn • benzen • adamantan • kyselina benzoová • trinitrotoluen • kyselina salicylová • volitelně molekula C60