Mgr. Jan Brezovský, Ph.D. Loschmidtovy laboratoře, Ústav experimentální biologie a RECETOX, MU Využití molekulového modelování k inženýrství proteinů a hledání aktivních látek Osnova Molekulové modelování Inženýrství proteinů Typické přístupy Metody modelování Příklad Hledání aktivních látek Typické přístupy Metody modelování Příklad Shrnutí Osnova Molekulové modelování Inženýrství proteinů Typické přístupy Metody modelování Příklad Hledání aktivních látek Typické přístupy Metody modelování Příklad Shrnutí Molekulové modelování “Teoretická či výpočetní technika, která nám poskytne vhled do chování molekulárního systému.” využití analýza struktury proteinů a předpověď jejich funkce předpověď dynamiky a stability proteinů předpověď interakcí mezi ligandem a proteinem či více proteiny předpověď reakčních bariér a mechanismů enzymů předpověď struktury nových proteinů a enzymů Molekulové modelování popis pomocí výpočetní geometrie molekulové mechaniky kvantové mechaniky typické metody geometrické metody molekulové dokování molekulová dynamika kvantová chemie de novo design … Osnova Molekulové modelování Inženýrství proteinů Typické přístupy Metody modelování Příklad Hledání aktivních látek Typické přístupy Metody modelování Příklad Shrnutí Proteinové inženýrství cíl: úprava struktury proteinu za účelem zlepšení výbraných vlastností tři hlavní přístupy racionální design řízená evoluce semi-racionální design Proteinové inženýrství Proteinové inženýrství Řízená evoluce Semi-racionální design Racionální design Vysokoprostupný screening/selekce zásadní výhodou, ale není třeba není třeba Strukturní anebo funkční informace není třeba kterákoliv postačí obě zásadní Prozkoumání sekvenčního prostoru rozsáhlé a náhodné průměrné a cílené omezené Šance nalézt synergistické mutace nízká vysoká průměrná Semi-racionální design kombinuje výhody racionálního a náhodného přístupu výběr slibných míst “hot-spoty“ k mutagenezi → tvorba tzv. “smart libraries“ založené na znalosti struktury či funkce proteinu ☺ vysokopropustný screening běžně není potřeba ☺ zvýšená šance získat varianty s požadovanými vlastnostmi požaduje jistou znalost strukturně-funkčních vztahu modifikovaného proteinu, ☺ ale ne příliš detailní Racionální design místně-cílené změny ve struktuře cílového proteinu pár aminokyselinových substitucí, pro které je predikováno zlepšení cílových vlastností založeno na detailních znalostech struktury, funkce a mechanismu proteinu ☺ relativně snadná charakterizace navržených variant komplexita strukturně-funkčních vztahu proteinů požadavek na zkušenosti s molekulovým modelováním Osnova Molekulové modelování Inženýrství proteinů Typické přístupy Metody modelování Příklad Hledání aktivních látek Typické přístupy Metody modelování Příklad Shrnutí Modelování pro semi-racionální design identifikace relevantních residuí jako hot-spotů pro vylepšení stability katalytických vlastností Hot-spoty pro vylepšení katalytických vlastností residua účastnící se vazby substrátů, stabilizace tranzitního stavu či transportu substrátů-produktů → mutace pak mohou vylepšit či narušit vazbu, katalýzu či transport residua tvořící interakce s ligandem residua tvořící vazebnou kapsu residua tvořící transportní tunely Analýza protein-ligand interakcí vizualizace struktury protein-ligand komplexu experimentální struktury (wwPDB) molekulové dokování nástroje: Pymol, LigPlot, PDBSum, … vazebná a aktivní místa proteinů se často nachází v kapsách, kavitách či žlábcích struktury. většina residuí v těchto kapsách/kavitách může během katalytického cyklu přijít do kontaktu s ligandem → je možné vybrat residua která pravděpodobně budou interagovat s ligandem i bez znalosti komplexu Analýza funkčních kapes Analýza funkčních kapes vazebná a aktivní místa proteinů se často nachází v kapsách, kavitách či žlábcích struktury. ligandAktivní místo vazebná a aktivní místa proteinů se často nachází v kapsách, kavitách či žlábcích struktury. Analýza funkčních kapes vazebná a aktivní místa proteinů se často nachází v kapsách, kavitách či žlábcích struktury. mutace Analýza funkčních kapes vazebná a aktivní místa proteinů se často nachází v kapsách, kavitách či žlábcích struktury. Analýza funkčních kapes vazebná a aktivní místa proteinů se často nachází v kapsách, kavitách či žlábcích struktury. Analýza funkčních kapes Analýza transportních tunelů zanořená vazebná a aktivní místa jsou spojena se povrchem pomocí transportních tunelů umožňují selektivní transport molekul jejich mutace může urychlit či omezit transport nativních ligandů či umožnit transport nových ligandů zanořená vazebná a aktivní místa jsou spojena se povrchem pomocí transportních tunelů ligand kapsa aktivního místa transportní tunel Analýza transportních tunelů zanořená vazebná a aktivní místa jsou spojena se povrchem pomocí transportních tunelů Analýza transportních tunelů zanořená vazebná a aktivní místa jsou spojena se povrchem pomocí transportních tunelů mutace Analýza transportních tunelů zanořená vazebná a aktivní místa jsou spojena se povrchem pomocí transportních tunelů mutace Analýza transportních tunelů Výpočetní geometrie studium geometrie proteinů netriviální - struktura proteinů je velmi členitá studium geometrie proteinů netriviální - struktura proteinů je velmi členitá Výpočetní geometrie studium geometrie proteinů netriviální - struktura proteinů je velmi členitá Výpočetní geometrie Identifikace kapes a dutin přístupnost prostoru sondám o rozdílné velikosti kavity, kapsy či žlábky nástroje: 3V, HOLLOW, LIGSITE, PASS, SURFNET či fpocket přístupnost prostoru sondám o rozdílné velikosti kavity, kapsy či žlábky nástroje: 3V, HOLLOW, LIGSITE, PASS, SURFNET či fpocket Identifikace kapes a dutin přístupnost prostoru sondám o rozdílné velikosti kavity, kapsy či žlábky nástroje: 3V, HOLLOW, LIGSITE, PASS, SURFNET či fpocket Identifikace kapes a dutin přístupnost prostoru sondám o rozdílné velikosti kavity, kapsy či žlábky nástroje: 3V, HOLLOW, LIGSITE, PASS, SURFNET či fpocket Identifikace kapes a dutin grafové algoritmy transportní cesty nástroje: CAVER, MOLAXIS či MOLE Identifikace tunelů grafové algoritmy transportní cesty nástroje: CAVER, MOLAXIS či MOLE Identifikace tunelů grafové algoritmy transportní cesty nástroje: CAVER, MOLAXIS či MOLE Identifikace tunelů grafové algoritmy transportní cesty nástroje: CAVER, MOLAXIS či MOLE Identifikace tunelů grafové algoritmy transportní cesty nástroje: CAVER, MOLAXIS či MOLE Identifikace tunelů Hot-spoty pro vylepšení stability velmi flexibilní residua – zanesení residuí, která strukturu znehybní residua v transportních tunelech Identifikace flexibilních residuí z krystalografie pomocí termálních B-factors odpovídají úrovni termálního pohybu atomů analýzou ansámblu z NMR či molekulové dynamiky Resiuda v tunelech saturační mutageneze v tunelových residuích s 2× vyšší pravděpodobností povede k signifikantnímu nárůstu stability než mutageneze v jiných oblastech proteinu Modelování pro racionální design základem je predikce struktury modifikovaného proteinu následně je hodnocen vlivu mutace na stabilitu katalytické vlastnosti Predikce struktury mutantního proteinu princip mutované residuum je potřeba vložit do struktury v optimální konformaci vzhledem k jeho okolí a současně upravit konformace okolích residuí v důsledku mutace tak aby struktura měla co nejnižší energii – těžký kombinatorický problém Predikce struktury mutantního proteinu řešení reprezentace reziduí pomocí knihovny rotamerů (konformace běžně pozorované v sade kvalitních X-ray struktur) Predikce struktury mutantního proteinu řešení výběr navzájem kompatibilní sady rotamerů probíhá stochasticky (Monte Carlo či genetické algoritmy) dle energie přiřazené zjednodušeným silovým polem často kombinováno z minimalizací energie Predikce stability mutantního proteinu změna energie divokého typu a mutantu silové pole empirické skórovací funkce strojové učení vhodné nástroje FoldX ERIS Rosetta … Predikce vlivu mutace na funkci proteinu změna vazebné energie ligandu molekulový doking + molekulová dynamika změna reakční bariéry/mechanismu kvantová chemie či QM/MM molekulová dynamika změna rychlosti/mechanizmu transportu grafové algoritmy, molekulová dynamika, … Osnova Molekulové modelování Inženýrství proteinů Typické přístupy Metody modelování Příklad Hledání aktivních látek Typické přístupy Metody modelování Příklad Shrnutí Racionální design stabilnějších enzymů enzymy jako katalyzátory většinou výborná selektivita a aktivita při pokojové teplotě ve vodném roztoku pro mnoho aplikací je třeba přítomnost organických rozpouštědel či vyšších teplot tyto podmínky často vedou k denaturaci enzymů -> potřeba získávat stabilnější enzymy halogenalkandehalogenasa DhaA teplota tání Tm = 49°C poločas aktivity při 60°C τ1/2 ~ 5 min Racionální design stabilnějších enzymů metoda GSSM „Gene Site Stauration Mutagenesis“ firmy Diversa a DOW Chemical stabilizace DhaA 315 pozic, všech 19 mutací pro každou pozici (destička s 384 důlky) testováno více než 120 000 kolonií výstup 10 stabilnějších jednobodovýh mutantů kumulativní mutant Tm = 67°C a τ1/2 = 36 h Racionální design stabilnějších enzymů výpočetní metoda FireProt vyvinuto na MU strukturní a sekvenční analýzy Metoda Fireprot Metoda Fireprot 291 pozicí X 19 možných mutací => 5 529 jednobodových mutantů Metoda Fireprot evoluční analýza příbuzných proteinů Metoda Fireprot evoluční analýza příbuzných proteinů Metoda Fireprot evoluční analýza příbuzných proteinů Metoda Fireprot 190 pozic bez evolučních restrikcí => 3 610 jednobodových mutantů Metoda Fireprot FoldX: 43 pozic; 107 stabilizujících mutací Metoda Fireprot FoldX: 43 pozic; 107 stabilizujících mutací Rosetta: 11 pozic; 22 stabilizujících mutací Metoda Fireprot 1 mutace rušící solný můstek vynechána Metoda Fireprot 5 mutací interferujících s ostatními vynechány Metoda Fireprot 5 mutací interferujících s ostatními vynechány Metoda Fireprot 5 mutací interferujících s ostatními vynechány Metoda Fireprot 5 mutací interferujících s ostatními vynechány Metoda Fireprot Metoda Fireprot Metoda Fireprot 67 Metoda Fireprot 68 M1L N10D .. .. .. .. M28L Metoda Fireprot 69 FoldX: 22 mutací potenciálně destabilizujících Metoda Fireprot 70 7 mutací rušící důležité interakce 2 solné můstky 5 vodíkových vazeb Metoda Fireprot 71 Racionální design stabilnějších enzymů stabilizace DhaA predikováno 5 500 mutantů testováno 5 mutantů výstup 3 stabilnější násobní mutanti kombinovaný mutant Tm = 74°C a τ1/2 = 72 h Racionální design stabilnějších enzymů závěry GSSM Racionální design vybavení (Kč) 20 000 000 500 000 testování výpočetní - 5 500 laboratorní 120 000 5 náklady (Kč) 1 000 000 80 000 čas měsíce týdny výstupy stabilní mutanti 11 4 ΔTm (°C) 18 25 τ1/2 (h) 36 72 Osnova Molekulové modelování Inženýrství proteinů Typické přístupy Metody modelování Příklad Hledání aktivních látek Typické přístupy Metody modelování Příklad Hledání aktivních látek cíl nalezení specifických netoxických inhibitorů farmakologicky relevantních cílů dva alternativní přístupy „high-throughput screening“– HTS „virtual screening“ – VS Hledání aktivních látek High-throughput screening Hledání aktivních látek High-throughput screening falešně pozitivní výsledky –toxicita, reakce s složkami detekční esseje, … falešně negativní výsledky – špatná rozpustnost, … Hledání aktivních látek Virtuální screeningHigh-throughput screening Osnova Molekulové modelování Inženýrství proteinů Typické přístupy Metody modelování Příklad Hledání aktivních látek Typické přístupy Metody modelování Příklad dvousložkový proces hledání hodnocení Molekulové dokování ideální postup vyčerpávající generování všech možných vazebných módů sofistikované ohodnocení vazebné energie výpočetně nemožné nutnost mnoha aproximací: zjednodušená reprezentace receptoru omezená pohyblivost ligandu chytré prohledávací algoritmy rychlé hodnotící funkce Molekulové dokování prohledávána pouze relevantní část receptoru reprezentace pomocí dekriptorů – odvozeny z geometrie či interakčních skupin vazebného místa (donory/acceptory, hydrofóbní residua, …) mřízková reprezentace – vazebné místo pokryto pravidelnou mřízkou nesoucí informaci o interakci zkušebního atomu daném bodě s atomy receptoru Reprezentace receptoru pohyblivost receptoru plnně rigidní „soft“ doking – použítí tolerantní hodnotící funkce, která napodobí plasticitu jinak rigidního receptoru explicitní pohyblivost bočních řetězců – při hledání je umožněna rotace bočních řetězců předem vybraných residuí s využítím knihoven rotamerů doking do ansámblu struktur – několik krystalových struktur, NMR ansábml či trajektorie z MD simulace Reprezentace receptoru běžně použity vsechny atomy nepolární vodíkové atomy mohou být sjednoceny s uhlíkovými atomy, což urychluje výpočty pohyblivost pouze rotace kolem jednoduchých vazeb doking předpřipravené knihovny konformací ligandu – pouze pro relativně rigidní ligandy vzhledem k exponenciálnímu nárustu konformerů s počtem rotovatelných vazeb přímé zahrnutí konformační změny do prohledávání fragmentační metody – ligand je rozsekán na části, které pak jsou rigidně nadokovány do vazebného místa a následně spojeny Reprezentace ligandu geometrické a kombinatorické postupy „matching“ či „fragment-based“algoritmy předpokládají že vazba je řízena tvarovou či fyzikálně-chemickou komplementaritou mezi ligandem a vazebným místem receptoru a že míra komplementarity je proporciální vazebné energii energtické a stochastické postupy Monte Carlo či genetické algoritmy snaží se přímo najít globální minimum volné energie vazby odpovídající experimentální struktuře náhodnostní povaha těchto metod vždy vyžaduje provádět několik nezávislých výpočtů k získání konzistentních výsledků Molekulové dokování - hledání „matching“ algoritmus ligand i vazebné místo reprezentováno pomocí deskriptorů odvozených z jejich geometrie či přítomnosti specifických interakčních míst (funkčních skupin) snaží se přiložit odpovídající části ligandu a vazebného místa, čímž predikuje možný vazebný mód ligandu nástroje DOCK, SLIDE … Geometrické postupy Geometrické postupy „fragment-based“ algoritmus ligand je nejprve rozdělen na jednotlivé rigidní části následně je ligand opět sestaven jedním z následujících postupů inkrementální konstrukce– části jsou ve vzájemné návaznosti dokovány do receptoru až je vytvořen celý ligand umísťování a propojování částí– všechny části ligandu jsou dokovány simultáně a následně propojeny nástroje FlexX, eHITS … Geometrické postupy Geometrické postupy Monte Carlo algoritmus prohledává interakční prostor ligandu s recpetorem pomocí iterativního vnášení náhodných změn v pozici, orientaci či konformaci ligandu a následného ohodnocení nového vazebného módu pomocí přijímacího kritéria nový vazebný mód je přijat vždy pokud je jeho energie nižší než energie původního módu případně je přijat s pravděpodobností odrážejícící rozdíl energií daných módů nástroje ICM, Glide … Stochastické energetické postupy Stochastické energetické postupy genetický algoritmus vazebné módy všech ligandů z náhodně vytvořené počáteční populace jsou zakódovány v jejich „genech“, které jsou vystaveny náhodným genetickým modifikacím (crossover, mutace) jednotlivci (vazebné módy) s lepší životaschopností (odpovídá jejich vazebné energii) mají vyšší šanci přežít a reprodukovat se do další generace, což vede k postupnému nárůstu životaschopnosti každé následující generace a nalezení optimálního vazebného módu nástroje AutoDock , GOLD … Stochastické energetické postupy Stochastické energetické postupy hodnotící funkce hodnocení různých vazebných módů získaných prohledáváním výpočetně efektivní a poskytující přesný popis interakcí využití hodnotících funkcí k řazení několika vazebných módů jednoho ligandu v rámi jednoho receptoru – důležité pro výběr módu blízkého experimentálnímu několika různých ligandů navázaných do jednoho receptoru – stanovení specifity substártů či inhibitorů jednoho ligandu navázaného do více různých receptorů – studium selektivity léčiv (vedlejší účinky) Molekulární dokování - hodnocení kategorie hodnotících funkcí založené na silovém poli využívají nevazebné členy zavedených silových polí relativné přesné energie vysoké výpočetní nároky -> pouze výpočty afinity již vybraných vazebných módů - nevyužívají se během prohledávání Molekulární dokování - hodnocení kategorie hodnotících funkcí empirické odvozeny fitem následující rovnice na sadě experimentálních vazebných afinit známých komplexů protein-ligand rychlé vyhodnocení arbitrární výběr relevantních členů rovnice -> selže v případe, kdy je vazba řízena typem interakce nezahrnuté v rovnici váhy jednotlivých interakcí závisí na volbě sady komplexů k fitování ....... +∆+∆+∆+∆=∆ rotellipohbbind GGGGG δγβα Molekulární dokování - hodnocení kategorie hodnotících funkcí znalostní pomocí statistické analýzy využívá znalost vazby ligandů v proteinech, která je implicitně uložena ve struktuních datech párové atomové potencionály jsou odvozeny ze vzdáleností těchto párů ve strukturních databázích rychlé vyhodnocení popisuje všechny typy interakcí bez potřeby jejich výběru problém nastáva pouze pokud strukturní data nemají dostatek informace o daném páru atomů (e.g. halogenidy, kovy, …) Molekulární dokování - hodnocení Virtuální screening masivní molekulové dokování typicky 100 tis. až 10 mil. ligadnů předpřipravené knihovny ligandů filtrována toxicita, rozpustnost, podobnost ligandů, … Osnova Molekulové modelování Inženýrství proteinů Typické přístupy Metody modelování Příklad Hledání aktivních látek Typické přístupy Metody modelování Příklad Inhibitory endonukleasy MUS81 proteinový cíl strukturně specifická endonukleasa MUS81 účastní reparace DNA zajištuje stabilitu genomu -> představuje potenciální cíl pro vazbu protirakovinných léčiv Inhibitory endonukleasy MUS81 HTS platforma Centra pro chemickou genetiku AVČR, Praha experimentálně testováno cca 23 000 látek výstup identifikovaný inhibitor: IC50 = 50 μM Inhibitory endonukleasy MUS81 softwarová platforma vyvinuta na MU využívající molekulové dokování - Autodock Vina rescoring – výpočty vazebné energie AMBER12 a neuronovou síť NNScore2.0 aplikace výpočetně testováno přes 140 000 rozdílných látek experimentálně testováno 19 látek výstup 6 strukturně odlišných inhibitorů s IC50 ≤ 50 μM nejlepší inhibitor IC50 = 5 μM Inhibitory endonukleasy MUS81 závěr HTS VS vybavení (Kč) 50 000 000 500 000 testování výpočetní - 140 000 laboratorní 23 000 19 náklady (Kč) 2 000 000 40 000 čas týdny dny výstupy počet inhibitorů 1 6 IC50 (μM) 50 5 Shrnutí Molekulové modelování: 1) aplikovatelné na celou řadu zajímavých problémů 2) poskytuje pohled na detaily nedostupné většině experimentů 3) díky své rychlosti umožňuje otestovat mnoho hypotéz 4) poskytuje prakticky orientované postupy 5) přináší významné časové i finanční úspory