Biologické sítě a dráhy PA052: Uvod do systémové biologie David Šafránek 27.09.2012 Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky, EVROPSKÁ UNIE ■ I INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ Biologické sítě a dráhy Obsah Biologické sítě a dráhy Pojem modelu a simulace Biologické sítě a dráhy Biologická sít jako způsob reprezentace modelu • biologická sít - komplexní systémový popis organismu • neexistuje jednoznačná definice • orientovaný nebo neorientovaný graf • uzly představují typicky proměnné • hrany představují typicky (funkční) relace mezi proměnnými • k uzlům a relacím jsou přiřazeny kvalitativní i kvantitativní informace potřebné k simulaci (dynamická analýza) • biologické sítě lze strukturně zkoumat - statická analýza • srovnávání sítí různých organismů • vyhledávání alternativních cest • zkoumání měřitelných vlastností sítí • zkoumání změn v sítích při evoluční selekci Pojem modelu a simulace Biologické sítě a dráhy Dráhy vs. sítě • dráhy jsou podsítě lineárního tvaru • sekvence metabolických reakcí • specifické zaměření na určité proměnné • analyzované problémy: délka dráhy existence alternativních drah • sítě reprezentují komplexní data (zohledňují širokou množinu proměnných a všech relevantních interakcí) • sítě interakcí určitého charakteru (transkripce, metabolismus, protein-protein, ...) • analyzované jevy: stupeň větvení, délka nej kratší dráhy, modularita, motivy, ... • příklady zdrojů: • KEGG (http://www.genome.jp/kegg/) • RegulonDB (http://regulondb.ccg.unam.mx/) Pojem modelu a simulace Biologické sítě a dráhy Vyhledávání alternativních drah - E. coli METHIONINE METABOLISM o-swccinyl-l-homoserine 2.5.1.48 homoserine \ 2.3.1.461- { glycine, serins em | 1 thre onirie melabohsm i 2.5.1. 2.5.1.48 ( cystsins me tabolism J l-cysteins 2.5.1.48 2-0 xobutanoate 4.4.1.1 2.3.1.31 r cystathionine -PO*- ' 4.2.1.22 l-serine O—J 2.5.1.48h t o-ac stylit l-homoserine 4.4.1.8 2.5.1.48 l.B.4.1 r *3 ^l-homocysteine - 2.5.1.49 4.4.1.21 homocystine l-methioruns í 0+- f sulfur ^ { metabolism j 2.1.1.5 2.1.1.10 2.1.1.13 2.1.1.14 1.8.4.13 1.8.4.14 n-fonnyl-l-mstmorüns 3.3.1.1 s-adsnosyl-l-homocystsins 3.2.2.9 3.4.13.12 amiridacyl-l-methionme s-d-ribosyl-l-homocys tains 2.1.1.37 3.5.1.31 l-msthioruns l-msthionyl-trna 2.5.1.6 s-adsnosyl l-ms1moiiinei' -**Q- 2.6.1.5 \A. 1.1.50h -O 2.5.1.16 4.4.1.14 s-adsnosyl l-msmoniraamiris s-methyl-5'-thioadenosine 3.2.2.9 O 3-m ethyl tluo-propionate 3.2.2.16 i l-aminocyclopropane- s-msthyl-5-thio-q 1-carboxylate d-ribose i 2.4.2.28 1.14.17.4 2.6.1.57 1.4.3.2 1.13.1153 mtne 4-m ethylthio- Q 2-oxobutaiioate I 2.7.1.100 ethylene s-methyl-5-thid-d -riboss-1 -phosphate OM- 5.3.1.23 il.l3.1154r jIÍIŤŤI-O-i-[UÍ^7V^>i-[^HoT]-O s-meftyl-5-thio- 1,2-dihydioxy- 2-hydroxy-3-l!sto- 2 ß-L iketo-5-methyl-3-tato-5-methyl- 5-methylthiopentenyl- thiopentyl-1 -phosphate thiopenteiie 1-phosphate -ribulDse-1-phosphate 00271 3/14/08 Pojem modelu a simulace Biologické sítě a dráhy Vyhledávání alternativních drah - S. cerevisiae METHIONINE METABOLISM o-swccinyl-l-foomoserine 2.5.1.48 homoserine \ 2.3.1.461-»~0<1—- { glycine, serine em | 1 thre omne mela holism i 2.5.1. 2.5.1.48 ( cysteine me tabolism J l-cysteine 2.5.1.48 2-0 xobutanoate 4.4.1.1 2.3.1.31 r cystathionine -PO*- ' 4.2.1.22 l-serine O—J 2.5.1.48h t o-ac etyl-O l-hoinoserine 4.4.1.8 2.5.1.48 l.B.4.1 r *3 äl-homocysteine - 2.5.1.49 4.4.1.21 homocystine l-metmomne s-oxide í 0+- f sulfur ^| { metabolism J 2.1.1.5 2.1.1.10 2.1.1.13 2.1.1.14 1.8.4.13 1.8.4.14 n-foimyl-l-metmoruns 3.3.1.1 s-adenosyl-l-homocysteine 3.2.2.9 3.4.13.12 aminoacyl-l-metmonine s-d-ribosyl-l-homocysteins 2.1.1.37 3.5.1.31 l-metmordne l-methionyl-trna 2.5.1.6 s-adenosyl l-meftdoninei' -**Q- 2.6.1.5 Hl.l.soh -O 2.5.1.16 4.4.1.14 s-adenosyl l-memoriimamine s-methyl-5'-thioadenosine 3.2.2.9 O 3-memylthio-propionate 3.2.2.16 i l-aminocyclopropans- s-memyl-5-thio-q 1-carboxylate d-ribose i 2.4.2.28 1.14.17.4 2.6.1.57 1.4.3.2 1.13.1153 mtne 4-m ethyl thio- q1 2-oxobutanoate I 2.7.1.100 ethylene s-methyl-5-thio-d -ribose-1 -phosphate OM- 5.3.1.23 11.13.1154r jIÍIŤŤI-O-i-[UÍ^7V^>i-[^HoT]-O s-meftyl-5-thiD- 1,2-dihydioxy- 2-hydroxy-3-l!jeto- 2,3-d iketo-5-methyl-3-tsto-5-methyl- 5-methylthiopentenyl- thiopental-1 -phosphate thiopenteiie 1-phosphate -ribulose-l-phosphate 00271 3/14/08 Pojem modelu a simulace Biologické sítě a dráhy Alternativní dráhy S.cerevisiae 2.7.2.4 E.coli ad L-aspartyl~1-F 1,2.1,11 L-as pa nic sem la I d eh yd e 1.1.1.3 L-HOľrfcŕe r s I 2.3.1.31 2.3.1.46 Q-nccty ■ homoacrinc AI pha -su c c I nyl-L-tjomoserine| 4.2.99.9 4.2.99.10 1 htat^le I 4.4.1.6 Homo I ne 2.1-1.14 i_-Meii lomné 2.5.1,e S-Acteno&yl-L-Meth lonlne Pojem modelu a simulace Biologické sítě a dráhy Alternativní dráhy • význam v genetice a genomice • modifikace drah souvisí přímo s vývojem genomu (evoluce) • identifikace neznámých genů • význam v biotechnologii • identifikace a implementace alternativních variant • význam ve farmakologii • laterální náhrada genu • metabolicky-specifické medikamenty Pojem modelu a simulace Biologické sítě a dráhy Biologické sitě • různé typy sítí: • regulatorní sítě (popis transkripční regulace) • proteinové sítě (popis interakce proteinů) • metabolické sítě (popis metabolismu) • signální sítě (popis aktivačních/deaktivačních kaskád) • další typy (např. neuronové sítě) Pojem modelu a simulace Biologické sítě a dráhy Biologická sít jako graf Definition Necht V je konečná množina uzlů a E C V x V relace. Biologickou sítí nazveme graf G reprezentovaný uspořádanou dvojicí G = (V, E). • Pokud V(a, b) G E. (a, b) G E (b, a) G E, G nazýváme r?eor/er?ŕo\/ar?ý. • V ostatních případech hovoříme o orientovaném grafu. typ sítě V E G genová regulační geny (resp. proteiny) regulace exprese or. proteinová proteiny proteinové interakce neor. metabolická metabolity, enzymy enzymové reakce or. signální molekuly aktivace/deaktivace or. Pojem modelu a simulace Biologické sítě a dráhy Cesty a kružnice • cesta v grafu je libovolná sekvence uzlů [ai, a2,an] t.ž. V/ £ {1,r? — l}.(a/, a,-+i) G E, číslo n — 1 nazýváme délkou cesty (počet hran) • cestu nazveme elementární pokud se na ní každý vrchol vyskytuje právě jednou • kružnice v grafu je libovolná elementární cesta [ai, a2,an] t.ž. ai = an • smyčkou nazýváme libovolnou kružnici délky 1 Pojem modelu a simulace Biologické sítě a dráhy Cesty a kružnice • kolik kružnic ... 4 • kolik cest z a do d ... 2 • délka nejkratší cesty z d do c ... Pojem modelu a simulace Biologické sítě a dráhy Cesty a kružnice • kolik kružnic ... 4 • kolik cest z a do d ... 2 • délka nejkratší cesty z d do c ... c/(c/, c) = 2 Pojem modelu a simulace Biologické sítě a dráhy Vlastnosti grafu Charakteristická délka cesty • délku nejkratší cesty z a do b značíme c/(a, b) • neexistuje-li cesta z a do b, uvažujeme c/(a, b) = 0 • charakteristickou délku cesty (orientovaného) grafu G = (\/, E) značíme a definujeme: G \V\{\V\-\) • průměrná délka cesty (přes všechny dvojice uzlů) Pojem modelu a simulace Biologické sítě a dráhy Cesty a kružnice Pojem modelu a simulace Biologické sítě a dráhy Vlastnosti grafu Stupeň uzlu a koeficient seskupeni množinu sousedních uzlů uzlu a značíme A/a a definujeme A/a = {be V\(a,b) G EV (b, a) G E} stupeň uzlu a značíme /ca a definujeme jako počet všech sousedních uzlů uzlu a, tedy ka = |A/a koeficient seskupení uzlu (clustering coefficient [Watts, Strogatz]) a značíme Ca a definujeme: C = \{(c,d)eE\ceNaAdeNa}\ ka{ka -1) Pojem modelu a simulace biologické sítě a dráhy Vlastnosti grafu Stupeň uzlu a koeficient seskupení • koeficient seskupení grafu G je značen Cq a definován jako průměr koeficientů seskupení všech uzlů: Pojem modelu a simulace Biologické sítě a dráhy Vlastnosti grafu Stupeň uzlu a koeficient seskupeni CG = J • (2 + §) = 0.65 Pojem modelu a simulace Biologické sítě a dráhy Náhodný graf náhodný graf je definován pevným počtem uzlů a pravděpodobností p existence hrany mezi libovolnými dvěma uzly alternativní definice: zvolíme množinu vrcholů V a počet hran n, z množiny všech možných hran (!Q vybereme náhodně n hran pravděpodobnost, že v náhodném grafu má daný uzel stupeň k, je charakterizována Poissonovým rozložením (s konst. A): e~xXk f«A>=— [Erdós, Rényi, "On the evolution of random graphs"] Pojem modelu a simulace Biologické sítě a dráhy Poissonovo rozložení Biologické síté a dráhy Poissonovo rozložení stupne uzlu brdos-Henyi random graph Number of edges (degree) Pojem modelu a simulace Biologické sítě a dráhy Vlastnosti náhodných grafů Regular Small-world p.o — Increasing randomness Random typ grafu CG LG svaz vysoké dlouhé náhodný graf nízké krátké small-world vysoké krátké Pojem modelu a simulace Biologické sítě a dráhy Small-world sítě • zavedeny Wattsem a Strogatzem, "Collective dynamics of 'small-world' networks", Nature 393, 1998 • klíčem jsou lokální a globální metriky seskupení uzlů a metrika charakteristické délky cesty • identifikovány jako grafy s vysokým koeficientem seskupení ale krátkou charakteristickou délkou cesty • bylo prokázáno, že mnoho reálných sítí má tento charakter • např. graf filmových herců propojených dle společného účinkování • neuronové sítě v C. elegans • výrazný posun v porozumění chování rozsáhlých dynamických systémů • zavedení pojmu "real-world graphs" modelu a simulace Biologické sítě a dráhy Scale-free sítě (a) Random network (b) Scale-free network • zavedl Barabási a Albert, "Emergence of Scaling in Random Networks", Science 286, 1999 Pojem modelu a simulace Biologické sítě a dráhy Scale-free sítě • reálné sítě nejsou statické (nemají pevný počet uzlů), ale vyvíjejí se dynamicky v čase, tzv. "rostou" • nové uzly se napojují nejvíce k těm uzlům, které jsou se zbytkem sítě již dobře propojeny • např. metabolické sítě E. coli jsou scale-free [Wagner, Fell, 2001] • označíme-li P(k) pravděpodobnost, že libovolný uzel má stupeň k, pak pro scale-free sítě platí následující úměra (Mocninný zákon pro konst. A): P{k) ~ k~x Pojem modelu a simulace Biologické sítě a dráhy Scale-free site trdos-Henyi random graph Barabasi-Albert scale-free graph • 10000 vertices □ 20000 vertices § A B S A L N I 8 - o - T-200 1 400 600 I "5 8 h— *~ qj o _ 1000 □ • □ K1* • 10000 vertices □ 20000 vertices in □ 2 T 5 -r-10 1— 20 50 □ •c am —I-1-r 100 200 500 Number of edges (degree) Number of edges (degree) Pojem modelu a simulace Biologické sítě a dráhy Motivy ve scale-free sítích • ve scale-free sítích se vyskytují specifické uzly, tzv. huby -uzly s vysokým stupněm propojení na kostru sítové struktury • ostatní uzly jsou lokálně napojeny k hubům • objeveno např. při studiu proteinové sítě kvasinky pivovarské (Saccharomyces cerevisiae) [Jeong, Mason, 2001] • díky hubům jsou sítě robustní proti náhodnému vyjmutí uzlu, ale naopak vyjmutí hubu znamená výrazné porušení sítě • tato struktura vede k hierarchičnosti a modulárnímu charakteru • jako moduly jsou identifikovány často opakující se výrazné podsítě (motivy) [Alon et.al., "Network Motifs: Simple Building Blocks of Complex Networks", 2002] http: //www.weizmann.ac.il/mcb/UriAlon/coliData.html Pojem modelu a simulace Biologické sítě a dráhy Motivy 1— * fíi] inra i cl V Loop íitnt rr^nljiriijn ; transe rlpríoa J E, colt 424 l!i-l:m 519 i,osa 4-iJ 7±3 11*4 M "4 z w 203 47 ± 12 13 1R12 100 s 40 41 Nľľiuíis Ľ. fJÍŕeawsl ľurll l i ťeeil-lonp 2S5 :2U 400 .4ľ 221 K Y líi-lmi v z W 1040 1 í 1 1200 1739 6i2 Kilu 2404 1 ± 1 2550 754 1±1 1050 444í 1 • 1 4950 X Y Iíi fan 7 W 4 1±1 3 .M 10 1 »1 IC 22 1 ± 1 2f: 711 531 :(!■; 2i i 'í ■ í 2+2 ] ± 1 ?. * ■ DL- Í20 J40 2Í1M 2(10 KIľľIiijiiíľ cĹľĽuil^ (tll]!Llul LrjĽimnaL mulliplleií) ,2* 122 189 10 ' ± 1 s420 252 20 1 ± 1 SS3SÍ 512 310 (0 1 + 1 ThlTĽ- bedtnck linjp 18 ÍR X- 7