Algebraický přístup k modelování biochemických reakcí PA054-' Formální modely v systémové biologii David Šafránek 2.5.2012 Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky, NVESTICE DO ROZVOJE VZDĚLÁVÁNÍ Algebraický přístup k modelování biochemických reakcí Obsah Algebraický přístup k modelování biochemických reakcí Algebraický přístup k modelování biochemických reakcí Princip modelování Substráty - molekuly populace interagujících molekul každou molekulu (proteinu) lze popsat stavově • stav zachycuje konfiguraci vazebných míst • volná vazebná místa • vazebná místa obsazena jinou molekulou (dimenzující stavy) ľ 1 n » 1 .-i k 1 HEK L_n mek: 1 mek formalizace prostřednictvím sekvenčního procesu: Algebraický přístup k modelování biochemických reakcí Princip modelování Substráty - molekuly populace interagujících molekul každou molekulu (proteinu) lze popsat stavově • stav zachycuje konfiguraci vazebných míst • volná vazebná místa • vazebná místa obsazena jinou molekulou (dimenzující stavy) f 1 -i k' i .-. p. 1 mek L_i HEK formalizace prostřednictvím sekvenčního procesu: | MEKp _MEKpp ?d2 Algebraický přístup k modelování biochemických reakcí Princip modelování Substráty - molekuly populace interagujících molekul každou molekulu (proteinu) lze popsat stavově • stav zachycuje konfiguraci vazebných míst • volná vazebná místa • vazebná místa obsazena jinou molekulou (dimenzující stavy) f 1 -i k' i .-. p. 1 mek L_i HEK formalizace prostřednictvím sekvenčního procesu: ŕ" > requires phosporylating enzyme V. J Algebraický přístup k modelování biochemických reakcí Princip modelování Interakce procE Ef Eb MEKpj^^^fMEKpp ?d2 procPP PPf PPb paralelní chování procesů (molekul) binární synchronizace roztok lze modelovat jako populaci procesů: proč mek | proč mek | proč e | proč e | proč e \ procpp \ proč p p Algebraický přístup k modelování biochemických reakcí Princip modelování Interakce procE procMEK procPP 1 -) J mek] [ PPf ] ( \ ?Pi ; * Eb MEKpj^^^^MEKpp ?d2 PPb paralelní chování procesů (molekul) binární synchronizace roztok lze modelovat jako populaci procesů: proč mek | proč mek | proč e | proč e | proč e \ procpp \ proč p p Algebraický přístup k modelování biochemických reakcí individuální přechody a synchronizace lze modelovat stochasticky (provedení přechodu v čase t ~ Exp(r,-)) Algebraický přístup k modelování biochemických reakcí Molekuly jako komunikující automaty Algebraický přístup k modelování biochemických reakcí Elementární reakce jako komunikující automaty 0..?.r...>0 A^A A+B ->TA'+B' A+A -^A'+A" Algebraický přístup k modelování biochemických reakcí Elementární kalkulus pro popis (bio) chemických systémů Syntax E ::= 0 : X=M/E Reagents M ::= 0 : 7i;P © M Molecule P ::= 0 i X I P Solution 71 ::= T(r) : ?n(r) : !n(r) Interaction prefix CGF ::= E,P Chemical Ground Form Andrew Phillips, Luca Cardelli, and Giuseppe Castagna, A Graphical Representation for Biological Processes in the Stochastic Pi-calculus, in Transactions in Computational Systems Biology, vol. 4230, pp. 123-152, Springer, November 2006 X = !a(r);X 0 ?b(s);Y Y = !b(s);Y©?a(r);X X I X I X I Y I Y Algebraický přístup k modelování biochemických reakcí Elementární kalkulus pro popis (bio) chemických systémů Sémantika => \x.P + M P Ix.P + M P ^Tr.P -U P p _^ p< Q Q' P\Q P'\Q' MP' =>7t.P + M-^P' P^ ^P\Q^P'\Q x = p p -?u p' =>x p' SOS pravidla definují fragment stochastického 7r-kalkulu Algebraický přístup k modelování biochemických reakcí Rozšíření o předávání hodnot Syntax E ::= 0 : X(p)=M, E Reagents M ::= 0 : Jt;P©M Molecule P ::= 0 i X(p) I P Solution 7i ::= T(r) : ?n(p) : !n(p) Interaction prefix CPF ::= E,P Chemical Parametric Form Andrew Phillips, Luca Cardelli, and Giuseppe Castagna, A Graphical Representation for Biological Processes in the Stochastic Pi-calculus, in Transactions in Computational Systems Biology, vol. 4230, pp. 123-152, Springer, November 2006 Algebraický přístup k modelování biochemických reakcí Rozšíření o předávání hodnot Sémantika p!x(n)p/ Q^Qf M^UP' P^U X(m) = P P{n/m}- P' \x(n).P + M^ P ?x(m).P + M7^) I rr.P -Ĺ+ P P\Q JU P'\Q> 7T.P + M JJ P' P\Q P'\Q X(n) JU P' {n/m} SOS pravidla definují fragment stochastického 7r-kalkulu Algebraický přístup k modelování biochemických reakcí Příklad modelování genetické regulační sítě ir Gene(a, b) = Tt.(Gene(a, b)\Protein(b))+?a.Blocked(a, b) Blocked(a, b) = ru.Gene(a, b) Protein(b) =\b.Protein(b) + rd.O Ralf Blossey, Luca Cardelli, and Andrew Phillips, A Compositional Approach to the Stochastic Dynamics of Gene Networks, in Transactions in Computational Systems Biology, vol. 3939, no. 3939, pp. 99-122, Springer, January 2006 Algebraický přístup k modelování biochemických reakcí Příklad modelování genetické regulační sítě a c lni Gene(c, a)\ Gene(a, b)\Gene(b, c) Algebraický přístup k modelování biochemických reakcí High-level modelování Proximal gonad IntroFIgl Algebraický přístup k modelování biochemických reakcí High-level modelování Algebraický přístup k modelování biochemických reakcí High-level modelování C. elegance: vývoj vulvy prístup k modelovaní biochemických reakci High-level modelování C. elegance: možné varianty signálních drah UN 3 J I_J L LIN-3 J l_J L LIN-i J l_J L LIN3 ... signál od řídící buňky (anchor cell, AC) LIN12 ... laterální mezibuněčný signál Algebraický přístup k modelování biochemických reakcí High-level modelování - interagující buňky Vývoj vulvy C. elegána Andrew Phillips, A Visual Process Calculus for Biology, in Symbolic Systems Biology: Theory and Methods, Jones and Bartlett Publishers, 2010. Algebraický přístup k modelování biochemických reakcí High-level modelování - interagující buňky AC - W-AC V(v,l,r, k) = qc- k.Vl(x,l,r) + LV2(x) + r.V2(x) + w.V3(x) Vl(x,l,r) = I.Vl(x,l,r) +ř.Vl(x,l,r) x ... č. buňky, /, r ... kanály laterálního signálu, k ... vzdálenost od AC (frekvence interakce s AC) Andrew Phillips, A Visual Process Calculus for Biology, in Symbolic Systems Biology: Theory and Methods, Jones and Bartlett Publishers, 2010. Vývoj vulvy C. elegans Algebraický přístup k modelování biochemických reakcí High-level modelování - interagující buňky Vývoj vulvy C. elegána AC I V(3, s3, «4, tow) I V(4,s4,s5,iotu) | V(5, s5, s6, msti) V(6, s6, s7, Í1Í3Í1) I V(7,s7,sS,m&J) | V(S,sS,s9,!ow) Andrew Phillips, A Visual Process Calculus for Biology, in Symbolic Systems Biology: Theory and Methods, Jones and Bartlett Publishers, 2010. Algebraický přístup k modelování biochemických reakcí High-level modelování - interagující buňky Vývoj vulvy C. elegána - podrobný model Andrew Phillips, A Visual Process Calculus for Biology, in Symbolic Systems Biology: Theory and Methods, Jones and Bartlett Publishers, 2010. Algebraický přístup k modelování biochemických reakcí High-level modelování - interagující buňky Vývoj vulvy C. elegána - podrobný model V(x,l,r, k) — (íjííÍ,w1,w3,^3,2**112, tmi*) ( gVul{x, !,r, uul,jnutK k) | gLin\2{x ,Un\2,v \ ,vZ,l ,r) gVl(z,vl,v2,vtd) | gV2(x,v2Jinl2) \ gV3{x,v3,vul) | M-iív(x,mw)) gVul{xJ,r,viil,muv,k) — oc- k,{gVul(xíl,rívul,miíVík) \ Vtil(x,2,r,-uííí,mííw)) gLinl2(x,lml2,vl,v3,l,r) = l(gLinl2(x,Íínl2,til,ti3,í,r) | Linl2(i,liiil2,ul,-u3) + z..(gLinl2(3S,Unl2,vl,v3,l,r) | Linl2(i,Íinl2,ul,u3) gVl(x,vl,v2,vul) = md.(gVl(x,vl,v2,wl) | Vl(x,vl,v2)) gV2(x,v2,linl2) = Unl2.(gV2(x,f2,imi2) | V2(x,v2)) gV3(x,ví,vid) = in.(gV3(x,v3,vul) | V3(x,v3,vtd)) Vvl(x,l, r, vul,muv) — l.Viil{x,l,r,vul,mui}) + r.Vrwi(í!í,r)^tíí,fttw) + vtA + mni} Linl2{x,Unl2, vl,v3) - iinl2.Lml2(a;,íml2,Dl,u3) + v& + ííl Muv(x,muv) = muU.Muv(x,muv) Vl(x,vl,v2) = íT.Vl(i,ul,«2) +«2 +dVl V2{x,v2) = v2.V2(x1v2) +dV2 V3(x, v3, vul) = v3.V3(x,v3,vnt) + vul + dV3 Andrew Phillips, A Visual Process Calculus for Biology, in Symbolic Systems Biology: Theory and Methods, Jones and Bartlett Publishers, 2010. Algebraický přístup k modelování biochemických reakcí High-level modelování - simulace Vývoj vulvy C. elegána Algebraický přístup k modelování biochemických reakcí Kalkuly pro biologické systémy • Stochastic 7r-calculus (SPÍM, BioSPI) • BioPEPA • K-calculus • Brane-Calculus, BetaBinders, BlenX Algebraický přístup k modelování biochemických reakcí BioPEPA • na rozdíl od 7r-based kalkulů je BioPEPA orientovaný blíže SBML • rozlišení není až na úroveň molekul, ale na úroveň substrátů a reakcí => proces není molekula, ale substrát • výhodou je kompatibilita sémantik s SBML (srovnej s Petriho sítěmi) • možnost plného modelování netriviální kinetiky (např. regulace, enzymová kinetika) Algebraický přístup k modelování biochemických reakcí BioPEPA - příklad 2S -> P; E S = (a,2)iS E = (a, 1) © E P = (a,l)í P (S(/So) xa (E(/£o)) na P(/Po)) Sémantika dynamiky je definována pravidlem fa = Algebraický přístup k modelování biochemických reakcí Bio PEPA - syntax Algebra modelových komponent S ::= (a, k) op S | S + S | C op =11TI © I e I© P :;= P kc P | S(/) • £ je množina reakcí • / je iniciální podmínka Algebraický přístup k modelování biochemických reakcí Bio PEPA - syntax Definice elementárních komponent - substráty Každá komponenta C je charakterizována 5-ticí (H, N, Mq, M, V), kde: • H g m+ je rozlišení kvantity (velikost jedné "úrovně" koncentrace), • N g n je maximální hodnota kvantity, • Mq g m+ u {_} je iniciální koncentrace, • Mg m+ u {_} je maximální koncentrace, • V označuje kompartment do něhož je komponenta přiřazena. Pozn. (1): _ značí "nedefinovanou hodnotu" Pozn. (2): M, Mq jsou uvedeny pro kalibraci se spojitým modelem. Algebraický přístup k modelování biochemických reakcí BioPEPA - syntax Definice elementárních komponent - substráty • diskretizace koncentrace pomocí úrovní stejné délky (v počtu molekul) • diskrétní sémantika tedy umožňuje kalibraci se spojitou (aproximace) • počet úrovní pro komponentu C; je N-, + 1, kde N; je max. úroveň platí: N; = \f] • pro aktuální úroveň 0 < // < N-, je koncentrace definována vztahem x; = I, • h Algebraický přístup k modelování biochemických reakcí BioPEPA - definice biologického procesu BioPEPA systém je šestice (V, M, K., Tr, Comp, P) kde: • V ... množina kompartmentů, • M ... množina kvantit popisujících substráty, • K, ... množina definic parametrů, • Tr ... množina definic dynamiky, • Comp ...definice komponent, • P ... komponenta popisující systém. Algebraický přístup k modelování biochemických reakcí BioPEPA - sémantika • každá akce a má přiřazenu kinetickou funkci fa nad kvantitami substrátů • kvantity substrátů jsou určeny z kontextu akce a • kinetické funkce mohou obsahovat kinetické parametry, které musí být asociovány v K, • příklady typů kinetických funkcí: • fMA(k) — k ■ n"=i(^-')K' nj Je počet reaktantů reakce aj a n; je příslušný stechiometrický koeficient reaktantů C; • fH(v, K,n) = v- C"/{K + C") je Hillova kinetika Algebraický přístup k modelování biochemických reakcí BioPEPA - operační sémantika Předpokládáme C spočetná množinu zahrnující všechny možné modelové komponenty. BioPEPA systém má asociovánu stochastickou sémantiku, která je definována prostřednictvím odvozující relace -^CC C x Q. x C, kde 9 G Q. vyjadřuje kvantitativní informaci potřebnou k vyhodnocení kinetické funkce, 6 := (a, w) kde w := [S : op(/, re)] | w@w, S G C, I hodnota kvantity komponenty S, re stechiometrický koeficient komponenty S v a. Relace ^c je definována jako minimální relace splňující pravidla na násl. slidu. Algebraický přístup k modelování biochemických reakcí BioPEPA - odvozující relace prefixReac prefixProd prefixMod (a,[S:lft*)]) (a,[S:í(U)D (a,[S ;op(W]) ((a,K)opS)(l)-»c5(0 with op = ©,©,© and 0<1, twp, i_4t. />, wp; tp; päp; - with a e .£ Algebraický přístup k modelování biochemických reakcí BioPEPA - stochastická sémantika Stochastická sémantika BioPEPA systému je určena relací: -^SC V x ľ x V kde 7 £ ľ, 7 := (a, ra), ra G m+ určuje parametr exponenciální distribuce události v čase (rate). Relace —>s je definována pomocí pravidla: Finál - (•V, N, K, T, Comp, P)—->a(V, N, 3Z. Kinetika je definována funkcí v = k ■ X2 ■ Y. Definujeme komponenty BioPEPA: X = (a,2)iX Y=(a,\)iY Z=(a,3)U Reakční systém je definován: X{'xo) *M yVy0) *{<*} Z{lzo) kde IxqJyoJzo značí iniciální úrovně koncentrace, kin. funkce je definována fa = fMA(k). Pro reakci bude odvozením stochastické sémantiky vypočítán rate _ k • (/x • hf{lY • h) h Reakce bude provedena pouze v situaci: Nx je nejméně 3, Nz je nejméně 4. Algebraický přístup k modelování biochemických reakcí Laneve, C. and Tarissan, F. 2007. A Simple Calculus for Proteins and Cells. Electron. Notes Theor. Comput. Sci. 171, 2 (Jul. 2007), 139-154.