Zpracování dat a vizualizace v chemii C2150 ● Zdeněk Kříž a Martin Prokop ● Co se naučíte – Získávání strukturních dat z databází – Validace získaných dat – Příprava pro molekulové modelování – Extrahování dat z modelování – Vizualizace dat a tvorba prezentací Zpracování dat a vizualizace v chemii C2150 ● Jaký software budeme používat – Web browser – What If – Triton – VMD – Grace – APBS, ... Jak můžu získat strukturní data o molekule ● Pro malé molekuly: – Cambridge Structural Database – Glycan Structural Database – 3Dchem database – Modelování od začátku ● Velké biomolekuly – Protein Structural Database – PDB – Nucleic Acids Database – NDB – Modelování na základě homologie Jak hledat v databázi ● Znám název molekuly, nebo její vzorec ● U malých molekul znám jejich SMILES kód (CCO – ethanol, c1CCCCc1 – cyklohexan a pod). ● CSD umí hledat podle funkčních skupin (umožňuje přes grafické rozhraní nakreslit vzorec) ● NDB databáze – hledání podle sekvence bazí ● PDB umožňuje několikastupňové prohledávání Cambridge structural database ● Co ukládá CSD – Data o organických molekulách – Data o komplexech kovů s organickými molekulami ● Jakými metodami jsou získávána data – RTG krystalografie ● Monokrystalů ● Prášková difrakce ● Co v CSD nenajdeme – Data o polypeptidech, polysacharidech a oligonukleotidech – Data o anorganických molekulách Cambridge structural database Cambridge structural database ICSD databáze ● http://www.fiz-karlsruhe.de/icsd_content.html ● Co najdeme v ICSD – Krystalové struktury prvků – Krystalové struktury binárních sloučenin – Krystalové struktury složitějších anorganických sloučenin ● ICSD obsahuje více než 110000 záznamů Protein Data Bank - PDB ● http://www.pdb.org Protein Data Bank - PDB ● 79400 struktur – 69400 – RTG – 9300 – NMR – 406 – EM ● proteiny/NA/komplexy – 73400 – protein – 2437 – DNA/RNA – 3504 – komplexů PDB – X-ray ● Velmi detailní informace o struktuře molekul ● Pro rigidní systémy nejkvalitnější informace ● U flexibilních systémů někdy špatně rozeznatelné části ● O kvalitě struktury hovoří rozlišení a R-faktor. PDB – NMR ● Struktura v roztoku, ne v pevné fázi. ● Možnost studia flexibilních systémů. ● Výsledkem je set konformací molekuly, který splňuje experimentální kriteria. ● V databázi naleznete jak set 10, 30 , 50 struktur, tak tzv. průměrnou strukturu. PDB – elektronová mikroskopie ● Struktura velkých komplexů. ● Samostatně neumožňuje atomární rozlišení, proto se kombinuje s dalšími metodami. PDB – rozlišení Protein Data Bank - PDB PDB – prohledávání databáze PDB – prohledávání databáze PDB – prohledávání databáze PDB – prohledávání databáze PDB – prohledávání databáze PDB – prohledávání databáze PDB – prohledávání databáze Nucleic Acid Database http://ndbserver.rutgers.edu NDB - prohledávání NDB - prohledávání NDB - prohledávání NDB - prohledávání Glyco3D databáze ● http://www.cermav.cnrs.fr/glyco3d/index.php Glyco3D databáze Glyco3D databáze Glyco3D databáze Practical structural databases ● http://xray.bmc.uu.se/embo/structdb/links.html Úkoly ● Zjistěte kolik struktur je v současné době uloženo v PDB databázi, kolik je určeno pomocí X-ray, NMR a EMS. Kolik struktur bylo v databázi uloženo v letech 2010, 2005 a 2001. ● Nalezněte v PDB databázi struktury amyloidu beta, sestavte tabulku s údaji: pdb kód, způsob určení 3D dat, rozlišení, biologický zdroj amyloidu. Tabulku odešlete na e-mail: zdenek@chemi.muni.cz