Úvod do chemoinformatiky Radka Svobodová 04.10.20242 Proč nahrazovat nebo doplňovat experiment výpočtem? • Vyhneme se práci s toxickými, výbušnými a radioaktivními látkami • Můžeme pracovat i s nestabilními látkami • Ušetříme náklady za chemikálie a za realizaci experimentu • Ušetříme čas experimentálním chemikům :-) • ... 04.10.20243 Chemoinformatika „Chemoinformatika využívá informatických a algoritmických přístupů pro řešení chemických problémů. Převážně se zaměřuje na získání informací z databází malých nebo středně velkých molekul (léků, organických látek, ...).“ Vzniká v devadesátých létech dvacátého století. Rozvoj spojen s dostupností velkého množství dat o molekulách léků apod. a s potřebami farmaceutického průmyslu 04.10.20244 Bioinformatika „Bioinformatika je aplikací statistických a výpočetních metod v oblasti molekulové biologie a genetiky. Převážně se specializuje na zpracování dat z databází biomolekul (sekvence DNA, RNA a proteinů).“ Vzniká v osmdesátých létech dvacátého století. Rozvoj spojen s dostupností nadkritického množství dat o biomolekulách. Specializace: • Strukturní bioinformatika • Sekvenční bioinformatika, NGS . 04.10.20245 Jak zapsat molekulu v počítači? • Zjistit, které informace molekulu popisují • Zapsat je do počítače 04.10.20246 Které informace popisují molekulu? Počty atomů? 04.10.20247 Které informace popisují molekulu? Počty atomů? Málo Počty atomů a umístění vazeb? 04.10.20248 Které informace popisují molekulu? Počty atomů? Málo Počty atomů a umístění vazeb? Lepší Počty atomů, umístění vazeb a poloha atomů v prostoru? Ano 04.10.20249 Model molekuly pro počítačové zpracování Atomy: Body v prostoru U každého uveden chemický symbol prvku Vazby: Dvojice atomů, které jsou vázány Násobnost vazby 04.10.202410 Zápis molekuly v počítači První tři čísla jsou x, y a z souřadnice atomů Počet vazeb První atom je uhlíkPočet atomů První vazba je mezi atomy 1 a 2 a jde o dvojnou vazbu 11 Kvízová otázka: Nakresli tuto molekulu. Jak se daná molekula jmenuje? 04.10.2024 Databáze malých (organických) molekul > 1 miliard struktur malých molekul ▪ Experimentální struktury ▪ Predikované struktury 04.10.2024 DrugBank – ukázka databáze léků 04.10.2024 DrugBank – ukázka databáze léků PubChem – ukázka databáze organických molekul 04.10.2024 PubChem – ukázka databáze organických molekul 04.10.2024 Ligand Expo – ukázka databáze ligandů 04.10.2024 Ligand Expo – ukázka databáze ligandů 04.10.202419 Vizualizace malé molekuly v počítači Drátový model: Kalotový model (CPK): Tyčinkový model: Tyčinky a kuličky: Databáze biomakromolekul (hlavně proteiny) > 200 tisíc experimentálních struktur > 200 millionů predikovaných struktur Protein Data Bank – zdroje dat 21 10% NMR spektroskopie 1% kryo-elektronová mikroskopie 89% Rentgenová krystalografie ... ATOM 46 C GLY A 70 51.536 23.360 40.507 ATOM 47 O GLY A 70 50.947 22.279 40.325 ATOM 48 N ILE A 71 50.965 24.532 40.270 ATOM 49 CA ILE A 71 49.595 24.644 39.786 ... 3D struktura Protein Data Bank 22 > 200 000 biomacromolecular structures 04.10.2024 Protein Data Bank – ukázka databáze proteinů 04.10.2024 Protein Data Bank – ukázka databáze proteinů 04.10.2024 AlphaFold algoritmus Structure prediction challenge 2020: AlphaFold2 wins 04.10.2024 AlphaFold DB > 200 milionů proteinových struktur 04.10.202427 Vizualizace biomolekuly v počítači Cartoon model: Schématický model: 04.10.202428 Chemoinformatika – hlavní oblasti • Podobnostní vyhledávání v databázích • Výpočty a aplikace deskriptorů • QSAR / QSPR • Vytváření a aplikace virtuálních knihoven molekul • Virtuální screening 04.10.202429 Proces návrhu a vývoje léku Uvedení nového léku na trh stojí v průměru 900 milionů dolarů a trvá více než 10 let. Farmaceutické společnosti často zkoumají a testují 10 000 – 30 000 rozličných látek předtím, než je jedna z nich úspěšně uvedena na trh. Látky jsou nejdříve navrženy v základním výzkumu. Poté musí projít předklinickými a klinickými zkouškami. Většina nepostoupí dále, ale ty, které postoupí, mohou nabídnout šanci na kvalitnější život pacientů. 04.10.202430 Proces návrhu a vývoje léků Návrh nových molekul léků a výběr nejvhodnějších Preklinické testy (bakterie, tkáňové kultury, zvířata) Klinické testy (pacienti) > 10 000 molekul ~ 250 molekul ~ 5 mol. 1 nový lék na trhu 5-7let Chemoinformatika je klíčová při výběru nejvhodnějších kandidátů. Umožňuje totiž predikci vlastností nově navržených molekul léků. Nejdražšíčást (miliardydolarů) Čím sofistikovanější je výběr nejvhodnějších kandidátů, tím efektivnější a levnější je celý proces. 04.10.202431 Návrh léku (drug design) Známé léky Nově navržené léky 04.10.202432 Návrh léku (drug design) 04.10.202433 Návrh léku (drug design) Na základě několika známých molekul léků můžeme vytvořit (ručně nebo automaticky) rozsáhlé sady molekul. Tyto sady se nazývají virtuální knihovny a obsahují desetiticíce, staticíce i miliony molekul. Několik z molekul ve virtuální knihovně může být velmi účinnými léky. Ale které to jsou ??? 04.10.202434 Jak zjistit, která z navržených molekul je lékem? Navržené molekuly existují jen na papíře nebo v počítači a nebyly zatím syntetizovány. Nemáme tedy naměřeny jejich fyzikální a chemické vlastnosti ani nevíme nic o jejich aktivitě. Jak tedy určit, která z nich bude vhodným lékem? Máme dvě možnosti: a) Molekuly synetizovat a jejich vlastnosti i aktivitu změřit. b) Vlastnosti i aktivitu molekul odhadnout (predikovat) na základě jejich struktury. Chemoinformatika 04.10.202435 Orgranizace výuky Přednáška + praktická cvičení Prosím, noste si notebooky Občas nepovinné úkoly – možnost získat procenta navíc Ukončení předmětu: Písemka • Teoretické otázky • Příklady a cvičení Povoleny všechny materiály 04.10.202436 Orgranizace výuky 2 Klasifikace: <100%, 90%>: A (90%, 80%>: B (80%, 70%>: C (70%, 60%>: D (60%, 50%>: E (50%, 0%>: F 04.10.202437 Osnova výuky • Struktura molekuly (2D, 3D) • Databáze molekul • Deskriptory • Podobnost molekul • Podobnostní vyhledávání v databázích • QSAR / QSPR • 3D QSAR 04.10.202438 Osnova výuky • Struktura molekuly (2D, 3D) • Databáze molekul • Deskriptory • Podobnost molekul • Podobnostní vyhledávání v databázích • QSAR / QSPR • 3D QSAR Děkuji za pozornost