Algebraický přístup k modelování biochemických reakcí
PA054-' Formální modely v systémové biologii
David Šafránek
2.5.2012
Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky, NVESTICE DO ROZVOJE VZDĚLÁVÁNÍ
Algebraický přístup k modelování biochemických reakcí
Obsah
Algebraický přístup k modelování biochemických reakcí
Algebraický přístup k modelování biochemických reakcí
Princip modelování
Substráty - molekuly
populace interagujících molekul
každou molekulu (proteinu) lze popsat stavově
• stav zachycuje konfiguraci vazebných míst
• volná vazebná místa
• vazebná místa obsazena jinou molekulou (dimenzující stavy)
ľ 1 n » 1 .-i k 1
HEK L_n mek: 1 mek
formalizace prostřednictvím sekvenčního procesu:
Algebraický přístup k modelování biochemických reakcí
Princip modelování
Substráty - molekuly
populace interagujících molekul
každou molekulu (proteinu) lze popsat stavově
• stav zachycuje konfiguraci vazebných míst
• volná vazebná místa
• vazebná místa obsazena jinou molekulou (dimenzující stavy)
f 1 -i k' i .-. p. 1
mek L_i HEK
formalizace prostřednictvím sekvenčního procesu:
| MEKp _MEKpp
?d2
Algebraický přístup k modelování biochemických reakcí
Princip modelování
Substráty - molekuly
populace interagujících molekul
každou molekulu (proteinu) lze popsat stavově
• stav zachycuje konfiguraci vazebných míst
• volná vazebná místa
• vazebná místa obsazena jinou molekulou (dimenzující stavy)
f 1 -i k' i .-. p. 1
mek L_i HEK
formalizace prostřednictvím sekvenčního procesu:
ŕ" >
requires
phosporylating
enzyme V. J
Algebraický přístup k modelování biochemických reakcí
Princip modelování
Interakce
procE Ef
Eb
MEKpj^^^fMEKpp
?d2
procPP PPf
PPb
paralelní chování procesů (molekul) binární synchronizace
roztok lze modelovat jako populaci procesů:
proč mek | proč mek | proč e | proč e | proč e \ procpp \ proč p p
Algebraický přístup k modelování biochemických reakcí
Princip modelování
Interakce
procE procMEK procPP
1 -) J mek] [ PPf ]
( \ ?Pi
; *
Eb
MEKpj^^^^MEKpp
?d2
PPb
paralelní chování procesů (molekul) binární synchronizace
roztok lze modelovat jako populaci procesů:
proč mek | proč mek | proč e | proč e | proč e \ procpp \ proč p p
Algebraický přístup k modelování biochemických reakcí
individuální přechody a synchronizace lze modelovat stochasticky (provedení přechodu v čase t ~ Exp(r,-))
Algebraický přístup k modelování biochemických reakcí
Molekuly jako komunikující automaty
Algebraický přístup k modelování biochemických reakcí
Elementární reakce jako komunikující automaty 0..?.r...>0 A^A
A+B ->TA'+B'
A+A -^A'+A"
Algebraický přístup k modelování biochemických reakcí
Elementární kalkulus pro popis (bio) chemických systémů
Syntax
E ::= 0 : X=M/E Reagents
M ::= 0 : 7i;P © M Molecule
P ::= 0 i X I P Solution
71 ::= T(r) : ?n(r) : !n(r) Interaction prefix
CGF ::= E,P Chemical Ground Form
Andrew Phillips, Luca Cardelli, and Giuseppe Castagna, A Graphical Representation for Biological Processes in the Stochastic Pi-calculus, in Transactions in Computational Systems Biology, vol. 4230, pp. 123-152, Springer, November 2006
X = !a(r);X 0 ?b(s);Y Y = !b(s);Y©?a(r);X X I X I X I Y I Y
Algebraický přístup k modelování biochemických reakcí
Elementární kalkulus pro popis (bio) chemických systémů
Sémantika
=> \x.P + M P Ix.P + M P
^Tr.P -U P
p _^ p< Q Q' P\Q P'\Q'
MP' =>7t.P + M-^P'
P^ ^P\Q^P'\Q
x = p p -?u p' =>x p'
SOS pravidla definují fragment stochastického 7r-kalkulu
Algebraický přístup k modelování biochemických reakcí
Rozšíření o předávání hodnot
Syntax
E ::= 0 : X(p)=M, E Reagents
M ::= 0 : Jt;P©M Molecule
P ::= 0 i X(p) I P Solution
7i ::= T(r) : ?n(p) : !n(p) Interaction prefix
CPF ::= E,P Chemical Parametric Form
Andrew Phillips, Luca Cardelli, and Giuseppe Castagna, A Graphical Representation for Biological Processes in the Stochastic Pi-calculus, in Transactions in Computational Systems Biology, vol. 4230, pp. 123-152, Springer, November 2006
Algebraický přístup k modelování biochemických reakcí
Rozšíření o předávání hodnot
Sémantika
p!x(n)p/ Q^Qf
M^UP' P^U
X(m) = P P{n/m}-
P'
\x(n).P + M^ P
?x(m).P + M7^) I rr.P -Ĺ+ P
P\Q JU P'\Q>
7T.P + M JJ P'
P\Q P'\Q X(n) JU P'
{n/m}
SOS pravidla definují fragment stochastického 7r-kalkulu
Algebraický přístup k modelování biochemických reakcí
Příklad modelování genetické regulační sítě
ir
Gene(a, b) = Tt.(Gene(a, b)\Protein(b))+?a.Blocked(a, b) Blocked(a, b) = ru.Gene(a, b) Protein(b) =\b.Protein(b) + rd.O
Ralf Blossey, Luca Cardelli, and Andrew Phillips, A Compositional Approach to the Stochastic Dynamics of Gene Networks, in Transactions in Computational Systems Biology, vol. 3939, no. 3939, pp. 99-122, Springer, January 2006
Algebraický přístup k modelování biochemických reakcí
Příklad modelování genetické regulační sítě
a c
lni
Gene(c, a)\ Gene(a, b)\Gene(b, c)
Algebraický přístup k modelování biochemických reakcí
High-level modelování
Proximal gonad
IntroFIgl
Algebraický přístup k modelování biochemických reakcí
High-level modelování
Algebraický přístup k modelování biochemických reakcí
High-level modelování
C. elegance: vývoj vulvy
prístup k modelovaní biochemických reakci
High-level modelování
C. elegance: možné varianty signálních drah
UN 3
J I_J L
LIN-3
J l_J L
LIN-i
J l_J L
LIN3 ... signál od řídící buňky (anchor cell, AC) LIN12 ... laterální mezibuněčný signál
Algebraický přístup k modelování biochemických reakcí
High-level modelování - interagující buňky
Vývoj vulvy C. elegána
Andrew Phillips, A Visual Process Calculus for Biology, in Symbolic Systems Biology: Theory and Methods, Jones and Bartlett Publishers, 2010.
Algebraický přístup k modelování biochemických reakcí
High-level modelování - interagující buňky
AC - W-AC
V(v,l,r, k) = qc- k.Vl(x,l,r) + LV2(x) + r.V2(x) + w.V3(x) Vl(x,l,r) = I.Vl(x,l,r) +ř.Vl(x,l,r)
x ... č. buňky, /, r ... kanály laterálního signálu, k ... vzdálenost od AC (frekvence interakce s AC)
Andrew Phillips, A Visual Process Calculus for Biology, in Symbolic Systems Biology: Theory and Methods, Jones and Bartlett Publishers, 2010.
Vývoj vulvy C. elegans
Algebraický přístup k modelování biochemických reakcí
High-level modelování - interagující buňky
Vývoj vulvy C. elegána
AC I V(3, s3, «4, tow) I V(4,s4,s5,iotu) | V(5, s5, s6, msti) V(6, s6, s7, Í1Í3Í1) I V(7,s7,sS,m&J) | V(S,sS,s9,!ow)
Andrew Phillips, A Visual Process Calculus for Biology, in Symbolic Systems Biology: Theory and Methods, Jones and Bartlett Publishers, 2010.
Algebraický přístup k modelování biochemických reakcí
High-level modelování - interagující buňky
Vývoj vulvy C. elegána - podrobný model
Andrew Phillips, A Visual Process Calculus for Biology, in Symbolic Systems Biology: Theory and Methods, Jones and Bartlett Publishers, 2010.
Algebraický přístup k modelování biochemických reakcí
High-level modelování - interagující buňky
Vývoj vulvy C. elegána - podrobný model V(x,l,r, k) — (íjííÍ,w1,w3,^3,2**112, tmi*)
( gVul{x, !,r, uul,jnutK k) | gLin\2{x ,Un\2,v \ ,vZ,l ,r) gVl(z,vl,v2,vtd) | gV2(x,v2Jinl2) \ gV3{x,v3,vul) | M-iív(x,mw)) gVul{xJ,r,viil,muv,k) — oc- k,{gVul(xíl,rívul,miíVík) \ Vtil(x,2,r,-uííí,mííw)) gLinl2(x,lml2,vl,v3,l,r) = l(gLinl2(x,Íínl2,til,ti3,í,r) | Linl2(i,liiil2,ul,-u3) + z..(gLinl2(3S,Unl2,vl,v3,l,r) | Linl2(i,Íinl2,ul,u3) gVl(x,vl,v2,vul) = md.(gVl(x,vl,v2,wl) | Vl(x,vl,v2)) gV2(x,v2,linl2) = Unl2.(gV2(x,f2,imi2) | V2(x,v2)) gV3(x,ví,vid) = in.(gV3(x,v3,vul) | V3(x,v3,vtd)) Vvl(x,l, r, vul,muv) — l.Viil{x,l,r,vul,mui}) + r.Vrwi(í!í,r)^tíí,fttw) + vtA + mni} Linl2{x,Unl2, vl,v3) - iinl2.Lml2(a;,íml2,Dl,u3) + v& + ííl Muv(x,muv) = muU.Muv(x,muv) Vl(x,vl,v2) = íT.Vl(i,ul,«2) +«2 +dVl
V2{x,v2) = v2.V2(x1v2) +dV2 V3(x, v3, vul) = v3.V3(x,v3,vnt) + vul + dV3
Andrew Phillips, A Visual Process Calculus for Biology, in Symbolic Systems Biology: Theory and Methods, Jones and Bartlett Publishers, 2010.
Algebraický přístup k modelování biochemických reakcí
High-level modelování - simulace
Vývoj vulvy C. elegána
Algebraický přístup k modelování biochemických reakcí
Kalkuly pro biologické systémy
• Stochastic 7r-calculus (SPÍM, BioSPI)
• BioPEPA
• K-calculus
• Brane-Calculus, BetaBinders, BlenX
Algebraický přístup k modelování biochemických reakcí
BioPEPA
• na rozdíl od 7r-based kalkulů je BioPEPA orientovaný blíže SBML
• rozlišení není až na úroveň molekul, ale na úroveň substrátů a reakcí
=> proces není molekula, ale substrát
• výhodou je kompatibilita sémantik s SBML (srovnej s Petriho sítěmi)
• možnost plného modelování netriviální kinetiky (např. regulace, enzymová kinetika)
Algebraický přístup k modelování biochemických reakcí
BioPEPA - příklad
2S -> P; E
S = (a,2)iS E = (a, 1) © E P = (a,l)í P
(S(/So) xa (E(/£o)) na P(/Po)) Sémantika dynamiky je definována pravidlem fa =
Algebraický přístup k modelování biochemických reakcí
Bio PEPA - syntax
Algebra modelových komponent S ::= (a, k) op S | S + S | C
op =11TI © I e I©
P :;= P kc P | S(/)
• £ je množina reakcí
• / je iniciální podmínka
Algebraický přístup k modelování biochemických reakcí
Bio PEPA - syntax
Definice elementárních komponent - substráty
Každá komponenta C je charakterizována 5-ticí (H, N, Mq, M, V), kde:
• H g m+ je rozlišení kvantity (velikost jedné "úrovně" koncentrace),
• N g n je maximální hodnota kvantity,
• Mq g m+ u {_} je iniciální koncentrace,
• Mg m+ u {_} je maximální koncentrace,
• V označuje kompartment do něhož je komponenta přiřazena.
Pozn. (1): _ značí "nedefinovanou hodnotu"
Pozn. (2): M, Mq jsou uvedeny pro kalibraci se spojitým modelem.
Algebraický přístup k modelování biochemických reakcí
BioPEPA - syntax
Definice elementárních komponent - substráty
• diskretizace koncentrace pomocí úrovní stejné délky (v počtu molekul)
• diskrétní sémantika tedy umožňuje kalibraci se spojitou (aproximace)
• počet úrovní pro komponentu C; je N-, + 1, kde N; je max. úroveň
platí: N; = \f]
• pro aktuální úroveň 0 < // < N-, je koncentrace definována vztahem x; = I, • h
Algebraický přístup k modelování biochemických reakcí
BioPEPA - definice biologického procesu
BioPEPA systém je šestice (V, M, K., Tr, Comp, P) kde:
• V ... množina kompartmentů,
• M ... množina kvantit popisujících substráty,
• K, ... množina definic parametrů,
• Tr ... množina definic dynamiky,
• Comp ...definice komponent,
• P ... komponenta popisující systém.
Algebraický přístup k modelování biochemických reakcí
BioPEPA - sémantika
• každá akce a má přiřazenu kinetickou funkci fa nad kvantitami substrátů
• kvantity substrátů jsou určeny z kontextu akce a
• kinetické funkce mohou obsahovat kinetické parametry, které musí být asociovány v K,
• příklady typů kinetických funkcí:
• fMA(k) — k ■ n"=i(^-')K' nj Je počet reaktantů reakce aj a n; je příslušný stechiometrický koeficient reaktantů C;
• fH(v, K,n) = v- C"/{K + C") je Hillova kinetika
Algebraický přístup k modelování biochemických reakcí
BioPEPA - operační sémantika
Předpokládáme C spočetná množinu zahrnující všechny možné modelové komponenty.
BioPEPA systém má asociovánu stochastickou sémantiku, která je definována prostřednictvím odvozující relace -^CC C x Q. x C, kde 9 G Q. vyjadřuje kvantitativní informaci potřebnou k vyhodnocení kinetické funkce,
6 := (a, w)
kde w := [S : op(/, re)] | w@w, S G C, I hodnota kvantity komponenty S, re stechiometrický koeficient komponenty S v a.
Relace ^c je definována jako minimální relace splňující pravidla na násl. slidu.
Algebraický přístup k modelování biochemických reakcí
BioPEPA - odvozující relace
prefixReac prefixProd prefixMod
(a,[S:lft*)])
(a,[S:í(U)D
(a,[S ;op(W])
((a,K)opS)(l)-»c5(0 with op = ©,©,© and 0<1, twp, i_4t. />, wp;
tp; päp;
- with a e .£
Algebraický přístup k modelování biochemických reakcí
BioPEPA - stochastická sémantika
Stochastická sémantika BioPEPA systému je určena relací:
-^SC V x ľ x V
kde 7 £ ľ, 7 := (a, ra), ra G m+ určuje parametr exponenciální
distribuce události v čase (rate).
Relace —>s je definována pomocí pravidla:
Finál -
(•V, N, K, T, Comp, P)—->a(V, N, 3Z. Kinetika je definována funkcí v = k ■ X2 ■ Y. Definujeme komponenty BioPEPA:
X = (a,2)iX Y=(a,\)iY Z=(a,3)U Reakční systém je definován:
X{'xo) *M yVy0) *{<*} Z{lzo)
kde IxqJyoJzo značí iniciální úrovně koncentrace, kin. funkce je definována fa = fMA(k).
Pro reakci bude odvozením stochastické sémantiky vypočítán rate
_ k • (/x • hf{lY • h) h
Reakce bude provedena pouze v situaci: Nx je nejméně 3, Nz je nejméně 4.
Algebraický přístup k modelování biochemických reakcí
Laneve, C. and Tarissan, F. 2007. A Simple Calculus for Proteins and Cells. Electron. Notes Theor. Comput. Sci. 171, 2 (Jul. 2007), 139-154.