Mgr. Jan Brezovský, Ph.D. Loschmidtovy laboratoře, Ústav experimentální biologie a RECETOX, MU Využití molekulového modelování k inženýrství proteinů a hledání aktivních látek Osnova  Molekulové modelování  Inženýrství proteinů  Typické přístupy  Metody modelování  Příklady  Hledání aktivních látek  Typické přístupy  Metody modelování  Příklady  Shrnutí Osnova  Molekulové modelování  Inženýrství proteinů  Typické přístupy  Metody modelování  Příklady  Hledání aktivních látek  Typické přístupy  Metody modelování  Příklady  Shrnutí Molekulové modelování  “Teoretická či výpočetní technika, která nám poskytne vhled do chování molekulárního systému.”  využití  analýza struktury proteinů a předpověď jejich funkce  předpověď dynamiky a stability proteinů  předpověď interakcí mezi ligandem a proteinem či více proteiny  předpověď reakčních bariér a mechanismů enzymů  předpověď struktury nových proteinů a enzymů Molekulové modelování  popis pomocí  výpočetní geometrie  molekulové mechaniky  kvantové mechaniky  typické metody  geometrické metody  molekulové dokování  molekulová dynamika  kvantová chemie  de novo design  … Osnova  Molekulové modelování  Inženýrství proteinů  Typické přístupy  Metody modelování  Příklady  Hledání aktivních látek  Typické přístupy  Metody modelování  Příklady  Shrnutí Proteinové inženýrství  cíl: úprava struktury proteinu za účelem zlepšení výbraných vlastností  tři hlavní přístupy  racionální design  řízená evoluce  semi-racionální design Proteinové inženýrství Proteinové inženýrství Řízená evoluce Semi-racionální design Racionální design Vysokoprostupný screening/selekce zásadní výhodou, ale není třeba není třeba Strukturní anebo funkční informace není třeba kterákoliv postačí obě zásadní Prozkoumání sekvenčního prostoru rozsáhlé a náhodné průměrné a cílené omezené Šance nalézt synergistické mutace nízká vysoká průměrná Semi-racionální design  kombinuje výhody racionálního a náhodného přístupu  výběr slibných míst “hot-spoty“ k mutagenezi → tvorba tzv. “smart libraries“  založené na znalosti struktury či funkce proteinu   vysokopropustný screening běžně není potřeba   zvýšená šance získat varianty s požadovanými vlastnostmi   požaduje jistou znalost strukturně-funkčních vztahu modifikovaného proteinu,  ale ne příliš detailní Racionální design  místně-cílené změny ve struktuře cílového proteinu  pár aminokyselinových substitucí, pro které je predikováno zlepšení cílových vlastností  založeno na detailních znalostech struktury, funkce a mechanismu proteinu   relativně snadná charakterizace navržených variant   komplexita strukturně-funkčních vztahu proteinů   požadavek na zkušenosti s molekulovým modelováním Osnova  Molekulové modelování  Inženýrství proteinů  Typické přístupy  Metody modelování  Příklady  Hledání aktivních látek  Typické přístupy  Metody modelování  Příklady  Shrnutí Modelování pro semi-racionální design  identifikace relevantních residuí jako hot-spotů pro vylepšení  stability  katalytických vlastností Hot-spoty pro vylepšení katalytických vlastností  residua účastnící se vazby substrátů, stabilizace tranzitního stavu či transportu substrátů-produktů → mutace pak mohou vylepšit či narušit vazbu, katalýzu či transport  residua tvořící interakce s ligandem  residua tvořící vazebnou kapsu  residua tvořící transportní tunely Analýza protein-ligand interakcí  vizualizace struktury protein-ligand komplexu  experimentální struktury (wwPDB)  molekulové dokování  nástroje: Pymol, LigPlot, PDBSum, …  vazebná a aktivní místa proteinů se často nachází v kapsách, kavitách či žlábcích struktury.  většina residuí v těchto kapsách/kavitách může během katalytického cyklu přijít do kontaktu s ligandem → je možné vybrat residua která pravděpodobně budou interagovat s ligandem i bez znalosti komplexu Analýza funkčních kapes Analýza funkčních kapes  vazebná a aktivní místa proteinů se často nachází v kapsách, kavitách či žlábcích struktury. ligandAktivní místo  vazebná a aktivní místa proteinů se často nachází v kapsách, kavitách či žlábcích struktury. Analýza funkčních kapes  vazebná a aktivní místa proteinů se často nachází v kapsách, kavitách či žlábcích struktury. mutace Analýza funkčních kapes  vazebná a aktivní místa proteinů se často nachází v kapsách, kavitách či žlábcích struktury. Analýza funkčních kapes  vazebná a aktivní místa proteinů se často nachází v kapsách, kavitách či žlábcích struktury. Analýza funkčních kapes Analýza transportních tunelů  zanořená vazebná a aktivní místa jsou spojena se povrchem pomocí transportních tunelů  umožňují selektivní transport molekul  jejich mutace může urychlit či omezit transport nativních ligandů či umožnit transport nových ligandů  zanořená vazebná a aktivní místa jsou spojena se povrchem pomocí transportních tunelů ligand kapsa aktivního místa transportní tunel Analýza transportních tunelů  zanořená vazebná a aktivní místa jsou spojena se povrchem pomocí transportních tunelů Analýza transportních tunelů  zanořená vazebná a aktivní místa jsou spojena se povrchem pomocí transportních tunelů mutace Analýza transportních tunelů  zanořená vazebná a aktivní místa jsou spojena se povrchem pomocí transportních tunelů mutace Analýza transportních tunelů Výpočetní geometrie  studium geometrie proteinů  netriviální - struktura proteinů je velmi členitá  studium geometrie proteinů  netriviální - struktura proteinů je velmi členitá Výpočetní geometrie  studium geometrie proteinů  netriviální - struktura proteinů je velmi členitá Výpočetní geometrie Identifikace kapes a dutin  přístupnost prostoru sondám o rozdílné velikosti  kavity, kapsy či žlábky  nástroje: 3V, HOLLOW, LIGSITE, PASS, SURFNET či fpocket  přístupnost prostoru sondám o rozdílné velikosti  kavity, kapsy či žlábky  nástroje: 3V, HOLLOW, LIGSITE, PASS, SURFNET či fpocket Identifikace kapes a dutin  přístupnost prostoru sondám o rozdílné velikosti  kavity, kapsy či žlábky  nástroje: 3V, HOLLOW, LIGSITE, PASS, SURFNET či fpocket Identifikace kapes a dutin  přístupnost prostoru sondám o rozdílné velikosti  kavity, kapsy či žlábky  nástroje: 3V, HOLLOW, LIGSITE, PASS, SURFNET či fpocket Identifikace kapes a dutin  grafové algoritmy  transportní cesty  nástroje: CAVER, MOLAXIS či MOLE Identifikace tunelů  grafové algoritmy  transportní cesty  nástroje: CAVER, MOLAXIS či MOLE Identifikace tunelů  grafové algoritmy  transportní cesty  nástroje: CAVER, MOLAXIS či MOLE Identifikace tunelů  grafové algoritmy  transportní cesty  nástroje: CAVER, MOLAXIS či MOLE Identifikace tunelů  grafové algoritmy  transportní cesty  nástroje: CAVER, MOLAXIS či MOLE Identifikace tunelů Hot-spoty pro vylepšení stability  velmi flexibilní residua – zanesení residuí která strukturu znehybní  residua v transportních tunelech Identifikace flexibilních residuí  z krystalografie pomocí termálních B-factors  odpovídají úrovni termálního pohybu atomů  analýzou ansámblu z NMR či molekulové dynamiky Resiuda v tunelech  saturační mutageneze v tunelových residuích s 2× vyšší pravděpodobností povede k signifikantnímu nárůstu stability než mutageneze v jiných oblastech proteinu Modelování pro racionální design  základem je predikce struktury modifikovaného proteinu  následně je hodnocen vlivu mutace na  stabilitu  katalytické vlastnosti Predikce struktury mutantního proteinu  princip  mutované residuum je potřeba vložit do struktury v optimální konformaci vzhledem k jeho okolí a současně upravit konformace okolích residuí v důsledku mutace tak aby struktura měla co nejnižší energii – těžký kombinatorický problém Predikce struktury mutantního proteinu  řešení  reprezentace reziduí pomocí knihovny rotamerů (konformace běžně pozorované v sade kvalitních X-ray struktur) Predikce struktury mutantního proteinu  řešení  výběr navzájem kompatibilní sady rotamerů probíhá stochasticky (Monte Carlo či genetické algoritmy) dle energie přiřazené zjednodušeným silovým polem  často kombinováno z minimalizací energie Predikce stability mutantního proteinu  změna energie divokého typu a mutantu  silové pole  empirické skórovací funkce  strojové učení  vhodné nástroje  FoldX  ERIS  Rosetta  … Predikce vlivu mutace na funkci proteinu  změna vazebné energie ligandu  molekulový doking + molekulová dynamika  změna reakční bariéry/mechanismu  kvantová chemie či QM/MM molekulová dynamika  změna rychlosti/mechanizmu transportu  grafové algoritmy, molekulová dynamika, … De novo design enzymů  cíl: predikovat strukturu stabilizující transitní stav reakce  definice theozymu – substrát v TS a nezbytné funkční skupiny De novo design enzymů  cíl: predikovat strukturu stabilizující transitní stav reakce  výběr všech potenciálních katalytických residuí a jejich rotamerů odpovídající theozymu De novo design enzymů  cíl: predikovat strukturu stabilizující transitní stav reakce  nalezení vhodného proteinového foldu kompatibilního s vybranými katalytickými residui De novo design enzymů  cíl: predikovat strukturu stabilizující transitní stav reakce  transplantace katalytických aminokyselin do vybraného foldu De novo design enzymů  cíl: predikovat strukturu stabilizující transitní stav reakce  nalezení optimální kombinace okolních aminokyselin stabilizujících aktivní místo Osnova  Molekulové modelování  Inženýrství proteinů  Typické přístupy  Metody modelování  Příklady  Hledání aktivních látek  Typické přístupy  Metody modelování  Příklady  Shrnutí Semi-racionální design aktivnějších enzymů  TCP – persistentení organický polutant  toxický, karcinogení  vedlejší produkt chemického průmyslu  kontaminuje podzemní vody Semi-racionální design aktivnějších enzymů  TCP – persistentení organický polutant  toxický, karcinogení  vedlejší produkt chemického průmyslu  kontaminuje podzemní vody  enzym DhaA je schopen konverze  kcat = 0.08 s-1  aktivita nedostatečná pro aplikace  mutanti na pozici 176  C176Y: kcat = 0.28 s-1  C176F: kcat = 0.32 s-1 Semi-racionální design aktivnějších enzymů  mutanti na pozici 176  C176Y: kcat = 0.28 s-1  C176F: kcat = 0.32 s-1  mechanismus -> modifikace tunelu Semi-racionální design aktivnějších enzymů  mutanti na pozici 176  C176Y: kcat = 0.28 s-1  C176F: kcat = 0.32 s-1  mechanismus -> modifikace tunelu Semi-racionální design aktivnějších enzymů  design dalších mutantů  identifikace všech relevantních tunelů a jejich modifikace Semi-racionální design aktivnějších enzymů  design dalších mutantů  identifikace všech relevantních tunelů a jejich modifikace Semi-racionální design aktivnějších enzymů  výsledný enzym DhaA31  5 bodový mutant  kcat = 1.26 s-1  přístupové tunely uzavřené Semi-racionální design aktivnějších enzymů  výsledný enzym DhaA31  5 bodový mutant  kcat = 1.26 s-1  přístupové tunely uzavřené Co je příčinou zlepšení aktivity? Semi-racionální design aktivnějších enzymů DhaA DhaA 31 Semi-racionální design aktivnějších enzymů DhaA DhaA 31 Semi-racionální design aktivnějších enzymů DhaA DhaA 31 desolvatace aktivního místa Semi-racionální design aktivnějších enzymů DhaA DhaA 31 Semi-racionální design aktivnějších enzymů Proteinové inženýrství – design aktivnějších enzymů DhaA DhaA 31 aktivace reaktivního komplexu Semi-racionální design aktivnějších enzymů  závěry  DhaA31 s 16-krát zvýšenou katalytickou rychlostí vůči TCP  mutace semi-racionálně navrženy ve dvou přístupových tunelech  zlepšení aktivity způsobeno desolvatací aktivního místa Semi-racionální design aktivnějších enzymů Racionální design stabilnějších enzymů  enzymy jako katalyzátory  většinou výborná selektivita a aktivita při pokojové teplotě ve vodném roztoku  pro mnoho aplikací je třeba přítomnost organických rozpouštědel či vyšších teplot  tyto podmínky často vedou k denaturaci enzymů -> potřeba získávat stabilnější enzymy  halogenalkandehalogenasa DhaA  teplota tání Tm = 49°C  poločas aktivity při 60°C τ1/2 ~ 5 min Racionální design stabilnějších enzymů  výpočetní metoda FireProt  vyvinuto na MU  strukturní a sekvenční analýzy  stabilizace DhaA  predikováno 5 500 mutantů  testováno 5 mutantů  výstup  3 stabilnější násobní mutanti  kombinovaný mutant Tm = 74°C a τ1/2 = 72 h Racionální design stabilnějších enzymů  metoda GSSM  „Gene Site Stauration Mutagenesis“  firmy Diversa a DOW Chemical  stabilizace DhaA  315 pozic, všech 19 mutací pro každou pozici (destička s 384 důlky)  testováno více než 120 000 kolonií  výstup  10 stabilnějších jednobodovýh mutantů  kumulativní mutant Tm = 67°C a τ1/2 = 36 h Racionální design stabilnějších enzymů  závěry GSSM Racionální design vybavení (Kč) 20 000 000 500 000 testování výpočetní - 5 500 laboratorní 120 000 5 náklady (Kč) 1 000 000 80 000 čas měsíce týdny výstupy stabilní mutanti 11 4 ΔTm (°C) 18 25 τ1/2 (h) 36 72 Osnova  Molekulové modelování  Inženýrství proteinů  Typické přístupy  Metody modelování  Příklady  Hledání aktivních látek  Typické přístupy  Metody modelování  Příklady Hledání aktivních látek  cíl  nalezení specifických netoxických inhibitorů farmakologicky relevantních cílů  dva alternativní přístupy  „high-throughput screening“– HTS  „virtual screening“ – VS Hledání aktivních látek High-throughput screening Hledání aktivních látek High-throughput screening  falešně pozitivní výsledky –toxicita, reakce s složkami detekční esseje, …  falešně negativní výsledky – špatná rozpustnost, … Hledání aktivních látek Virtuální screeningHigh-throughput screening Osnova  Molekulové modelování  Inženýrství proteinů  Typické přístupy  Metody modelování  Příklady  Hledání aktivních látek  Typické přístupy  Metody modelování  Příklady  dvousložkový proces  hledání  hodnocení Molekulové dokování  ideální postup  vyčerpávající generování všech možných vazebných módů  sofistikované ohodnocení vazebné energie  výpočetně nemožné  nutnost mnoha aproximací:  zjednodušená reprezentace receptoru  omezená pohyblivost ligandu  chytré prohledávací algoritmy  rychlé hodnotící funkce Molekulové dokování  prohledávána pouze relevantní část receptoru  reprezentace pomocí dekriptorů – odvozeny z geometrie či interakčních skupin vazebného místa (donory/acceptory, hydrofóbní residua, …)  mřízková reprezentace – vazebné místo pokryto pravidelnou mřízkou nesoucí informaci o interakci zkušebního atomu daném bodě s atomy receptoru Reprezentace receptoru  pohyblivost receptoru  plnně rigidní  „soft“ doking – použítí tolerantní hodnotící funkce, která napodobí plasticitu jinak rigidního receptoru  explicitní pohyblivost bočních řetězců – při hledání je umožněna rotace bočních řetězců předem vybraných residuí s využítím knihoven rotamerů  doking do ansámblu struktur – několik krystalových struktur, NMR ansábml či trajektorie z MD simulace Reprezentace receptoru  běžně použity vsechny atomy  nepolární vodíkové atomy mohou být sjednoceny s jejich příslušnými těžkými atomy (N, C, O), což zjednodušuje výpočty  pohyblivost  pouze rotace kolem jednoduchých vazeb  doking předpřipravené knihovny konformací ligandu – pouze pro relativně rigidní ligandy vzhledem k exponenciálnímu nárustu konformerů s počtem rotovatelných vazeb  přímé zahrnutí konformační změny do prohledávání  fragmentační metody – ligand je rozsekán na části, které pak jsou rigidně nadokovány do vazebného místa a následně spojeny Reprezentace ligandu  geometrické a kombinatorické postupy  předpokládají že vazba je řízena tvarovou či fyzikálně-chemickou komplementaritou mezi ligandem a vazebným místem receptoru  a že míra komplementarity je proporciální vazebné energii  energtické a stochastické postupy  snaží se přímo najít globální minimum volné energie vazby odpovídající experimentální struktuře  náhodnostní povaha těchto metod vždy vyžaduje provádět několik nezávislých výpočtů k získání konzistentních výsledků Molekulové dokování - hledání  „matching“ algoritmus  ligand i vazebné místo reprezentováno pomocí deskriptorů odvozených z jejich geometrie či přítomnosti specifických interakčních míst (funkčních skupin)  snaží se přiložit odpovídající části ligandu a vazebného místa, čímž predikuje možný vazebný mód ligandu  nástroje  DOCK, SLIDE … Geometrické postupy Geometrické postupy  „fragment-based“ algoritmus  ligand je nejprve rozdělen na jednotlivé rigidní části  následně je ligand opět sestaven jedním z následujících postupů  inkrementální konstrukce– části jsou ve vzájemné návaznosti dokovány do receptoru až je vytvořen celý ligand  umísťování a propojování částí– všechný části ligandu jsou dokovány simultáně a následně propojeny  nástroje  FlexX, eHITS … Geometrické postupy Geometrické postupy  Monte Carlo algoritmus  prohledává interakční prostor ligandu s recpetorem pomocí iterativního vnášení náhodných změn v pozici, orientaci či konformaci ligandu a následného ohodnocení nového vazebného módu pomocí přijímacího kritéria  nový vazebný mód je přijat vždy pokud je jeho energie nižší než energie původního módu případně je přijat s pravděpodobností odrážejícící rozdíl energií daných módů  nástroje  ICM, Glide … Stochastické energetické postupy Stochastické energetické postupy  genetický algoritmus  vazebné módy všech ligandů of all ligands from náhodně vytvořené počáteční populace jsou zakódovány v jejich „genech“, které jsou vystaveny náhodným genetickým modifikacím (crossover, mutace)  jednotlivci (vazebné módy) s lepší životaschopností (odpovídá jejich vazebné energii) mají vyšší šanci přežít a reprodukovat se do další generace, což vede k postupnému nárůstu životaschopnosti každé následující generace a nalezení optimálního vazebného módu  nástroje  AutoDock , GOLD … Stochastické energetické postupy Stochastické energetické postupy  hodnotící funkce  evaluation various binding modes provided by searching algorithms  computationally efficient and provide accurate description of protein-ligand interactions  využití hodnotících funkcí k řazení  několika vazebných módů jednoho ligandu v rámi jednoho receptoru – důležité pro výběr módu blízkého experimentálnímu  několika různých ligandů navázaných do jednoho receptoru – stanovení specifity substártů či inhibitorů  jednoho ligandu navázaného do více různých receptorů – anotace možné funkce proteinů a studium selektivity léčiv (vedlejší účinky) Molekulární dokování - hodnocení  kategorie hodnotících funkcí  založené na silovém poli  využívají nevazebné členy zavedených silových polí  relativné přesné energie  vysoké výpočetní nároky -> pouze výpočty afinity již vybraných vazebných módů - nevyužívají se během prohledávání Molekulární dokování - hodnocení  kategorie hodnotících funkcí  empirické  odvozeny fitem následující rovnice to na sadě experimentálních vazebných afinit známých komplexů protein-ligand  rychlé vyhodnocení  arbitrární výběr relevantních členů rovnice -> selže v případe, kdy je vazba řízena typem interakce nezahrnuté v rovnici  váhy jednotlivých interakcí závisí na volbě sady komplexů k fitování .......  rotellipohbbind GGGGG  Molekulární dokování - hodnocení  kategorie hodnotících funkcí  znalostní  pomocí statistické analýzy využívá znalost vazby ligandů v proteinech, která je implicitně uložena ve struktuních datech  párové atomové potencionály jsou odvozeny ze vzdáleností těchto párů ve strukturních databázích  rychlé vyhodnocení  popisuje všechny typy interackí bez potřeby jejich výběru  problém nastáva pouze pokud strukturní data nemají dostatek informace o daném páru atomů (e.g. halogenidy, kovy, …) Molekulární dokování - hodnocení Virtuální screening  masivní molekulové dokování  typicky 100 tis. až 10 mil. ligadnů  předpřipravené knihovny ligandů  filtrována toxicita, rozpustnost, podobnost ligandů, … Osnova  Molekulové modelování  Inženýrství proteinů  Typické přístupy  Metody modelování  Příklady  Hledání aktivních látek  Typické přístupy  Metody modelování  Příklady Nové substráty dehalogenas  proteinové cíle  halogenalkandehalogenasy DhaA, DbjA, LinB, DhlA, DmbA a DmmA  potenciál využití při biodegradacích a biokatalýze  substrátová specifita -> zajímavé nové substráty Nové substráty dehalogenas  použitý protokol  databáze 56 000 halogenovaných látek  dokováno s pomocí AutoDock 4.0  hodnocení geometrie nalezeného komplexu z hlediska reaktivity Nové substráty dehalogenas  identifikováno 8 nových typů substrátu enzymu DmmA  mezi nimi i fluorescenční substrát a analoga herbicidů Nové substráty dehalogenas  závěry  nalezeny nové substráty u všech studovaných dehalogenas  úspěšnost virtuálního screeningu se pohybovala kolem 50%  pro DmmA bylo nalezeno 8 zcela nových typů substrátů Inhibitory endonukleasy MUS81  proteinový cíl  strukturně specifická endonukleasa MUS81  účastní reparace DNA  zajištuje stabilitu genomu -> představuje potenciální cíl pro vazbu protirakovinných léčiv Inhibitory endonukleasy MUS81  HTS  platforma Centra pro chemickou genetiku AVČR, Praha  experimentálně testováno cca 23 000 látek  výstup  identifikovaný inhibitor: IC50 = 50 μM Inhibitory endonukleasy MUS81  softwarová platforma vyvinuta na MU využívající  molekulové dokování - Autodock Vina  rescoring – výpočty vazebné energie AMBER12 a neuronovou síť NNScore2.0  aplikace  výpočetně testováno přes 140 000 rozdílných látek  experimentálně testováno 19 látek  výstup  6 strukturně odlišných inhibitorů s IC50 ≤ 50 μM  nejlepší inhibitor IC50 = 5 μM Inhibitory endonukleasy MUS81  závěr HTS VS vybavení (Kč) 50 000 000 500 000 testování výpočetní - 140 000 laboratorní 23 000 19 náklady (Kč) 2 000 000 40 000 čas týdny dny výstupy počet inhibitorů 1 6 IC50 (μM) 50 5 Shrnutí Molekulové modelování: 1) aplikovatelné na celou řadu zajímavých problémů 2) poskytuje pohled na detaily nedostupné většině experimentů 3) díky své rychlosti umožňuje otestovat mnoho hypotéz 4) poskytuje prakticky orientované postupy 5) přináší významné časové i finanční úspory