PA054: Formální modely v systémové biologii David Šafránek 19.3.2010 Stochastická sémantika modelu Uvažujme model M = S, R, reanet, , map . Označme n = |S|. * SVal = N ... množství (počet molekul) * RVal = 0, 1 ... pravděpodobnost provedení reakce v časovém intervalu (0, t , t R+ Vektor s M SValn reprezentuje stav modelu (ohodnocení proměnných) v daném okamžiku. Ohodnocení vektoru proměnných s lze samplovat prostřednictvím vektorové náhodné proměnné XM, XM = X1, ..., Xn , kde Xi : SValn N charakterizuje počet molekul substance si S v daném okamžiku. Stochastickou (pravděpodobnostní) sémantiku modelu M definujeme jako stochastický proces M = {XM(t)|t R+ 0 }. Pravděpodobnostní funkce označkování (2,0) (0,1) (1,1) (0,2) T0 T1 T1 s M XM s1 s2 X1 X2 2 0 2 0 1 1 1 1 0 2 0 2 0 1 0 1 * Pr{XM = (2, 0)} = Pr{XM = (1, 1)} = Pr{XM = (0, 2)} = Pr{XM = (0, 1)} = 1 4 * Pr{X1 = 1} = Pr{X1 = 2} = Pr{X2 = 0} = Pr{X2 = 2} = 1 4 * Pr{X1 = 0} = Pr{X2 = 1} = 2 4 = 1 2 * pravděpodobnostní funkce: p((x1, x2)) = Pr{XM = (x1, x2)} = Pr{X1 = x1 X2 = x2} = = Pr{X1 = x1} Pr{X2 = x2|X1 = x1} Diskrétní Markovův řetězec a Markovův proces (2,0) (0,1) (1,1) (0,2) T0 T1 T1 .3 .5 .2 1 1.3 .7 * sledujeme časovou progresi náhodné proměnné XM(t) * čas uvažujeme jako spočetnou veličinu * vývoj XM v čase lze popsat grafem MC = V , E, p : * stavy V reprezentují prvky jevového pole * přechody E jsou ohodnoceny pravděpodobností p : E (0, 1 t.ž. v V . v V p( v, v ) = 1 Diskrétní Markovův řetězec a Markovův proces (2,0) 1 (0,1) (1,1) (0,2) T0 T1 T1 .3 .5 .2 1 1.3 .7 4 2 3 * sledujeme časovou progresi náhodné proměnné XM(t) * čas uvažujeme jako spočetnou veličinu * vývoj XM v čase lze popsat grafem MC = V , E, p : * stavy V reprezentují prvky jevového pole * přechody E jsou ohodnoceny pravděpodobností p : E (0, 1 t.ž. v V . v V p( v, v ) = 1 * ekvivalentně lze reprezentovat přechodovou maticí: P = .2 .3 0 .5 0 .7 .3 0 0 0 1 0 0 0 0 1 , Pij = Pr{XM(t+1) = j|XM(t) = i} Diskrétní Markovův řetězec a Markovův proces (2,0) 1 (0,1) (1,1) (0,2) T0 T1 T1 .3 .5 .2 1 1.3 .7 4 2 3 Pravděpodobnostní rozložení náhodné proměnné ve stavu i v čase t budeme značit pi (t) = Pr{XM(t) = i}. Pro okamžik t máme vektorové rozložení p(t) = p1(t), p2(t), p3(t), p4(t) . Iniciálně předpokládejme p1(0) = p2(0) = p3(0) = p4(0) = 1 4 . Vývoj pravděpodobnostního rozložení proměnné XM v čase: p(1) = p(0)P p(2) = p(1)P ... p(k) = p(0)Pk Diskrétní Markovův řetězec a Markovův proces (2,0) 1 (0,1) (1,1) (0,2) T0 T1 T1 .3 .5 .2 1 1.3 .7 4 2 3 Stochastický proces {XM(t)|t N} rozvíjený dle Markovova řetězce z předchozího slidu se nazývá Markovův proces. Klíčovou vlastností Markovova procesu je nezávislost na historii (tzv. "memoryless"): Pravděpodobnostní rozložení proměnné XM(t + 1) závisí pouze na bezprostředně (v čase) předchozím rozložení XM(t). pj (t + 1) = k i=1 Pij pi (t) Diskrétní Markovův řetězec a Markovův proces Příklad (2,0) 1 (0,1) (1,1) (0,2) T0 T1 T1 .3 .5 .2 1 1.3 .7 4 2 3 1 2 3 4 p(0) : 1 4 1 4 1 4 1 4 p(1) : 0.0500 0.2500 0.3250 0.3750 p(2) : 0.0100 0.1900 0.4000 0.4000 p(3) : 0.0020 0.1360 0.4570 0.4050 p(4) : 0.0004 0.0958 0.4978 0.4060 p(5) : 0.0001 0.0672 0.5265 0.4062 p(6) : 0.0000 0.0470 0.5467 0.4062 p(7) : 0.0000 0.0329 0.5608 0.4062 p(8) : 0.0000 0.0231 0.5707 0.4062 .. . p(26) : 0.0000 0.0000 0.5937 0.4062 p(27) : 0.0000 0.0000 0.5937 0.4062 Diskrétní Markovův řetězec a Markovův proces Příklad Sémantikou Markovova procesu je (nekonečná) množina všech trajektorií samplujících stavový prostor v (diskrétním) čase. Každá trajektorie poskytuje možnou dynamiku systému (s ohledem na pravděpodobnostní rozložení). (2,0) (1,1) (0,2) (0,1) t 0 Markovův proces a stabilita Mějme markovův proces charakterizovaný přechodovou maticí P. Rozložení p je stabilní, pokud platí p = pP. Stabilní rozložení je pevným bodem lineárního zobrazení určeného maticí P. Lze získat řešením homogení lineární soustavy: p = pP p - pP = 0 p(E - P) = 0 kde E je jednotková matice příslušného rozměru. Markovův proces a biologické modely * interpretace modelu * vycházíme z daného stavu (označkování) * v diskrétním časové kroku se projeví právě jedna (uschopněná) reakce ri (s danou pravděpodobností) nebo stav zůstane nezměněn * každý přechod je vážen pravděpodobnostním rozložením závislým na konstantních pravděpodobnostech ­ při jeho respektování lze provádět Monte Carlo simulaci * analyzační techniky * transientní analýza * výpočet distribuce p(t) pro libovolné t * p(t) = p(0)Pt * stacionární analýza * analýza distribuce ve stabilním stavu Stochastická sémantika modelu * nedostatky Markovova procesu pro biologický model * pravděpodobnosti provedení reakcí zcela nezávislé na ohodnocení reaktantů * diskrétní samplování času neumožňuje dostatečně přesně vyjádřit rychlost reakce (četnost projevu reakce v čase) * co chceme modelovat? * dynamika biologického systému při nízkých koncentracích * projev náhodných vlivů ovlivňujících provedení reakce * respektovat časo-prostorové jevy uvnitř buňky Poissonův proces Uvažujme experiment představující četnost výskytu diskrétních událostí v časovém intervalu t. Pro zachycení tohoto měření zavedeme náhodnou proměnnou X. Pak platí: X Po(t) Jinými slovy, pravděpodobnostní funkce určující pravděpodobnost jevu, že za dobu t nastane právě k událostí, má následující tvar: Pr{X = k} = e-t (t)k k! kde je odpovídající parametr Poissonova rozložení. Poissonovo rozložení X Po() Poissonův proces Nyní uvažujme náhodnou proměnnou X z předchozího slidu v závislosti na čase, tzv. stochastický proces určený množinou náhodných proměnných {X(t)|t R+ 0 }. Uvažujme časové intervaly délky . Předpokládejme následující podmínky: * výskyty událostí ve dvou libovolných vzájemně disjunktních časových intervalech jsou nezávislé jevy * pravděpodobnostní rozložení četnosti výskytu událostí v daném časovém intervalu závisí pouze na délce intervalu * žádné dvě události nemohou nastat současně (,,interleaving ) Pak pro libovolný interval (t, t + platí: X(t + ) - X(t) Po() Exponenciální rozložení Problém Uvažujme experiment, v němž budeme měřit dobu mezi bezprostředně následujícími událostmi Poissonova procesu. Měření zachytíme náhodnou proměnnou X. Jaké rozložení má X? * doménou X je nyní R * X je spojitá náhodná proměnná * nutno uvažovat hustotu pravděpodobnosti: fX (x) = lim x0 Pr{x X x + x} x FX (x) = Pr{X x} = x fX (z)dz Exponenciální rozložení X Exp() pokud: fX (x) = e-x , x 0, 0, jinak. Pro distribuční funkci dostáváme: FX (x) = 0, x < 0, 1 - e-x , x 0. Střední hodnota: E(X) = 1 Exponenciální rozložení Exponenciální rozložení Vlastnosti minima exponenciálních distribucí Uvažme X1, ..., Xn nezávislé náhodné proměnné t.ž. i. Xi Exp(i ). Pro minimální exponenciální rozložení min{X1, ..., Xn} platí: Pr{min{X1, ..., Xn} > x} = Pr{X1 > x X2 > x ... Xn > x} = n i=1 Pr{Xi > x} = n i=1 e-x = e-x Pn i=1 i Pro parametr minimálního rozložení platí: Pr{Xk = min{X1, ..., Xn}} = k 1 + + n Exponenciální rozložení Uvažujme Poissonův proces {X(t)|t 0} t.ž. X Po(). Zavedeme náhodnou proměnnou T zachycující dobu do první nejbližší události (od počátečního okamžiku). Pro t > 0 uvažujme náhodnou proměnnou Nt zachycující počet událostí v intervalu (0, t . Z definice platí Nt Po(t). FT (t) = Pr{T t} = 1 - Pr{T > t} = 1 - Pr{Nt = 0} = 1 - (e-t )(t)0 0! = 1 - e-t Tedy platí: T Exp() Motivace pro spojitý Markovův řetězec * uvažujme spojitý čas pobytu ve stavu, t R+ * lze zachytit rozložením W samplujícím ,,čekací dobu mezi změnami stavů * požadujeme markovskou vlastnost nezávislosti na historii: Pr{U > t + |U > } = Pr{U > t} * tuto vlastnost má exponenciálně distribuovaná proměnná Motivace pro spojitý Markovův řetězec * uvažujme spojitý čas pobytu ve stavu, t R+ * lze zachytit rozložením W samplujícím ,,čekací dobu mezi změnami stavů * požadujeme markovskou vlastnost nezávislosti na historii: Pr{U > t + |U > } = Pr{U > t} * tuto vlastnost má exponenciálně distribuovaná proměnná Spojitý Markovův řetězec Spojitý Markovův řetězec lze definovat jako přechodový graf MC = V , E, p : * stavy V reprezentují prvky jevového pole * přechody E jsou ohodnoceny pravděpodobností p : E (0, 1 t.ž. v V . v V p( v, v ) = 1 * v V . v, v = E * pro každý stav v V je přiřazen parametr čekací doby v R+ Spojitý Markovův řetězec Příklad * průměrná čekací doba ve stavu Surf je 3 minuty, což je 3 60 = 1 20 hod S = 20 * W = 7.5 * E = 15 Simulace spojitého Markovova řetězce // inicializace počáteční distribuce X(0) t := 0 u := X(0) while ( true ) wait time := Exp(u) for each s, t