Parametrizace modelů a estimace parametrů PA054-' Formální modely v systémové biologii David Šafránek 17.5.2013 Parametrizace modelů a estimace parametrů Obsah Parametrizace modelů a estimace parametrů Parametrizace modelů a estimace parametrů Obsah Parametrizace modelů a estimace parametrů Parametrizace modelů a estimace parametrů Estimace parametrů • co je cílem? • najít takovou valuaci parametrů, která nejlépe odpovídá experimentálně zjištěným time-course datům • chceme tedy co nejvíce přiblížit simulaci experimentálním datům (tzv. fitting) • tradiční pojetí pro spojitou sémantiku • lineární regrese požaduje normální rozložení chyb měření • transformací se nepřesnosti kumulují • model je inherentně nelineární • nelineární jsou i naměřená data • problém fittingu chápán jako optimalizační problém • mnoho heuristických metod pro aproximativní řešení Parametrizace modelů a estimace parametrů Problém reverzního inženýrství • tzv. inverzní problémy • cílem je získat model z pozorování systému • obecně řešeno v teorii systémů (identifikace systémů) • pro nelineární systémy obecně neřešitelné • viz. IV120 • obecné schéma řešení inverzního problému: 1. identifikace vztahů mezi proměnnými 2. identifikace funkcí popisujících sémantiku jednotlivých vztahů (např. zákon zachování hmoty, Michaelis-Menten, Hill, . ..) 3. estimace hodnot parametrů ve funkcích získaných v předch. bodě Parametrizace modelů a estimace parametrů Estimace parametrů optimalizaci • obecný postup: 1. srovnej experimentální time-course se simulovaným time-course 2. pokud rozdíl menší než nastavená tolerance —>• DONE jinak modifikuj parametry modelu 3. proved time-course simulaci modelu 4- iteruj (1) Parametrizace modelů a estimace parametrů Estimace parametrů optimalizaci • mějme model daný systémem ^ = f(x,p) kde x je stavový vektor a p je vektor hodnot parametrů uvažujme T = (ti,tm) rostoucí posloupnost časových bodů (tzv. časovou řadu) • předpokládejme posloupnost (x(ti), ...,x(tm)) je aproximace řešení x(t) zachycená v časové řadě 7" (simulace) • zdůrazněme fakt, že simulace byla získána při nastavení hodnot parametrů p, označením x(t)p • mějme experiment jako posloupnost vektorů naměřených veličin (y(ři), ...,y(tm)) v časové řadě 7" • pro jednoduchost uvažujme dim(x) = dim(y) = 1 (obecně dim(x) > dim(y) libovolné, ale složitější formulace) Parametrizace modelů a estimace parametrů Estimace parametrů optimalizaci • definujeme odchylku experimentu od simulace v časovém bodě ryjakotzv. reziduaI: r(tí,p)=y(tí)-x(tí)p • reziduál chápeme jako funkci závislou na nastavení parametrů simulovaného modelu • srovnání experimentu a simulace je vyjádřeno jako součet čtverců reziduálů přes vš. časové body T: m 5(p) = Br(t;,p))2 Parametrizace modelů a estimace parametrů Estimace parametrů optimalizaci • funkce 5(p) se nazývá užitková funkce • vystihuje průměrnou odchylku simulace od experimentu přes danou časovou řadu • minimální hodnota 5(p) určuje optimální vektor hodnot parametrů p, který globálně minimalizuje rozdíl mezi experimentem a modelem • jedná se o nelineární funkci • počet neurčitých parametrů určuje její dimenzi Parametrizace modelů a estimace parametrů Parametrizace modelů a estimace parametrů Procházky po optimalizační krajině... • CIL: najít globální minimum • nej používanější jsou stochastické black-box přístupy: • náhodné procházení (random search) • evoluční strategie (evolution strategy) • • black-box znamená absolutní nezávislost na tvaru užitkové funkce • existují i metody, které využívají znalosti užitkové funkce (např. simulované žíhání, Truncated Newton, ...) Parametrizace modelů a estimace parametrů Procházky po optimalizační krajině... Random Search 1. inicializuj náhodně výchozí hodnotu p • typicky z rovnoměrného rozložení 2. dokud není překročen povolený počet iterací, prováděj: 2.1 sampluj novou pozici p' —>• uniformní náhodný výběr z hyperkoule o daném poloměru 2.2 spočítej S{p') 2.3 pokud S(p') < S(p), nastav novou pozici p :— p' 3. p nastaveno na nejvýhodnější pozici (z pohledu běhu algoritmu) Pozn. Existují varianty s fixním i adaptivním poloměrem. Parametrizace modelů a estimace parametrů Procházky po optimalizační krajině... Evoluční strategie • inherentně adaptivní metoda, redukuje počet • staví na výběrech z (vícerozměrného) normálního rozložení • rozměr daný dimenzí vektoru parametrů • značeno CMA-ES (Covariance Matrix Evolution Strategy) • postup: 1. vytvoř generaci —>• sampluj rozložení pozic hodnot P dle normálního rozložení 2. pro každé p E P spočítej S(p) 3. adaptace: uprav parametry normálního rozložení pro další iteraci —>• různé varianty, mohou být velice komplexní adaptace citlivé na charakter evoluční krajiny - adaptace kovarianční matice • metoda se ukazuje výhodná pro biologické modely (vysoká míra neznalosti parametrů) Parametrizace modelů a estimace parametrů Parametrizace modelů a estimace parametrů Tuning dynamických modelů Estimace parametrů vzhledem k hypotézám • estimaci parametrů lze rozšířit pro temporální specifikace (hypotézy) • každý experiment lze zakódovat jako LTL formuli • typické abstraktnější vlastnosti dávají větší stupeň volnost • mějme specifikaci chování reprezentovanou LTL formulí ip uvažme parametrizovaný systém ^ = f(x,p) • uvažme časovou řadu T • xpj značí simulovanou posloupnost v časové řadě T s nastavením parametrů p • definujme užitkovou funkci