CG020 Genomika Přednáška 11 Systémová biologie Jan Hejátko Funkční genomika a proteomika rostlin, Středoevropský technologický institut (CEITEC) a Národní centrum pro výzkum biomolekul, Přírodovědecká fakulta, Masarykova univerzita, Brno hejatko@sci.muni.cz, www.ceitec.eu 2  Literární zdroje ke kapitole 11:  Wilt, F.H., and Hake, S. (2004). Principles of Developmental Biology. (New York ; London: W. W. Norton)  Eden, E., Navon, R., Steinfeld, I., Lipson, D., and Yakhini, Z. (2009). GOrilla: a tool for discovery and visualization of enriched GO terms in ranked gene lists. BMC Bioinformatics 10, 48.  The Arabidopsis Genome Initiative. (2000). Analysis of the genome sequence of the flowering plant Arabidopsis thaliana. Nature 408, 796-815.  Benitez, M. and Hejatko, J. Dynamics of cell-fate determination and patterning in the vascular bundles of Arabidopsis thaliana (submitted)  de Luis Balaguer MA, Fisher AP, Clark NM, Fernandez-Espinosa MG, Moller BK, Weijers D, Lohmann JU, Williams C, Lorenzo O, Sozzani R. 2017. Predicting gene regulatory networks by combining spatial and temporal gene expression data in Arabidopsis root stem cells. Proc Natl Acad Sci U S A 114(36): E7632-E7640. Literatura 3  Definice Systémové biologie  Nástroje  Genová ontologie  Bayesovské sítě  Modelování molekulárních/genových regulačních sítí  Odvození genových regulačních sítí z velkých omických datových sad Osnova 4 Systémová biologie je vědecký směr v biologii využívající přístupy dalších věd, především biochemie, chemie, informatiky a matematiky. Zabývá se studiem biologických funkcí a mechanizmů vzniklých následkem komplexních interakcí v biologických systémech. Základní myšlenkou je komplexní pohled, opak redukcionismu (který je převládajícím paradigmatem například v molekulární biologii), tedy předpoklad, že systém je víc než součet jeho částí. Systémová biologie často pracuje s modely, které jsou vytvářeny matematickými a informatickými přístupy na základě biologických dat, jejichž vlastnosti jsou posléze porovnávány s vlastnostmi živých systémů (Wikipedia). Definice 5 Systémová biologie se zabývá studiem biologických systémů, jejichž chování nelze redukovat na lineární součet funkcí jejich částí. Systémová biologie nemusí nutně zahrnovat velké množství komponent nebo rozsáhlých datových souborů, jako je tomu v genomice nebo konektomice, ale často vyžaduje metody kvantitativního modelování vypůjčené z fyziky (Nature). Definice 6 Názorně vysvětluje video Dr. Nathana Price, zástupce ředitele Ústavu pro systémovou biologii na https://www.youtube.com/watch?v=OrXRl_8UFHU. Definice 7  Definition of Systems Biology  Tools  Gene Ontology analysis Osnova 8 Výsledky –omických studií vs. biologicky relevantní závěry □ Výsledky –omických studií reprezentují enormní množství dat, např. geny s rozdílnou expresí. Ale jak z nich získat biologicky relevantní závěry? gene locus sample_1 sample_2 status value_1 value_2 log2(fold_change) test_stat p_value q_value significant AT1G07795 1:2414285-2414967 WT MT OK 0 1,1804 1.79769e+308 1.79769e+3 08 6.88885e-05 0,00039180 1 yes HRS1 1:4556891-4558708 WT MT OK 0 0,696583 1.79769e+308 1.79769e+3 08 6.61994e-06 4.67708e- 05 yes ATMLO14 1:9227472-9232296 WT MT OK 0 0,514609 1.79769e+308 1.79769e+3 08 9.74219e-05 0,00053505 5 yes NRT1.6 1:9400663-9403789 WT MT OK 0 0,877865 1.79769e+308 1.79769e+3 08 3.2692e-08 3.50131e- 07 yes AT1G27570 1:9575425-9582376 WT MT OK 0 2,0829 1.79769e+308 1.79769e+3 08 9.76039e-06 6.647e-05 yes AT1G60095 1:22159735-22162419 WT MT OK 0 0,688588 1.79769e+308 1.79769e+3 08 9.95901e-08 9.84992e- 07 yes AT1G03020 1:698206-698515 WT MT OK 0 1,78859 1.79769e+308 1.79769e+3 08 0,00913915 0,0277958 yes AT1G13609 1:4662720-4663471 WT MT OK 0 3,55814 1.79769e+308 1.79769e+3 08 0,00021683 0,00108079 yes AT1G21550 1:7553100-7553876 WT MT OK 0 0,562868 1.79769e+308 1.79769e+3 08 0,00115582 0,00471497 yes AT1G22120 1:7806308-7809632 WT MT OK 0 0,617354 1.79769e+308 1.79769e+3 08 2.48392e-06 1.91089e- 05 yes AT1G31370 1:11238297-11239363 WT MT OK 0 1,46254 1.79769e+308 1.79769e+3 08 4.83523e-05 0,00028514 3 yes APUM10 1:13253397-13255570 WT MT OK 0 0,581031 1.79769e+308 1.79769e+3 08 7.87855e-06 5.46603e- 05 yes AT1G48700 1:18010728-18012871 WT MT OK 0 0,556525 1.79769e+308 1.79769e+3 08 6.53917e-05 0,00037473 6 yes AT1G59077 1:21746209-21833195 WT MT OK 0 138,886 1.79769e+308 1.79769e+3 08 0,00122789 0,00496816 yes AT1G60050 1:22121549-22123702 WT MT OK 0 0,370087 1.79769e+308 1.79769e+3 08 0,00117953 0,0048001 yes Ddii et al., unpublished AT4G15242 4:8705786-8706997 WT MT OK 0,00930712 17,9056 10,9098 -4,40523 1.05673e-05 7.13983e-05 yes AT5G33251 5:12499071-12500433 WT MT OK 0,0498375 52,2837 10,0349 -9,8119 0 0 yes AT4G12520 4:7421055-7421738 WT MT OK 0,0195111 15,8516 9,66612 -3,90043 9.60217e-05 0,000528904 yes AT1G60020 1:22100651-22105276 WT MT OK 0,0118377 7,18823 9,24611 -7,50382 6.19504e-14 1.4988e-12 yes AT5G15360 5:4987235-4989182 WT MT OK 0,0988273 56,4834 9,1587 -10,4392 0 0 yes 9 Vývoj rostlinných vodivých pletiv □ Vodivé pletivo jako vývojový model pro GO analýzu a MRN modelování Lehesranta etal., Trends in Plant Sci (2010) 10 WT hormonal mutant Hormonální regulace vývoje rostlinných vodivých pletiv □ Rostlinné hormony regulují ukládání ligninu v buněčných stěnách a transport vody xylemem WT mutant lignified cell walls Water Conductivity WT hormonal mutants 11 WT hormonal mutant Hormonální regulace vývoje rostlinných vodivých pletiv □ Transkripční profilování pomocí sekvenování RNA mRNA Sekvenování společností Illumina a určení počtu transkriptů mRNA cDNA cDNA 12 Výsledky –omických studií vs. biologicky relevantní závěry □ Transkripční profilování identifikovalo víc než 9K odlišně regulovaných genů… gene locus sample_1 sample_2 status value_1 value_2 log2(fold_change) test_stat p_value q_value significant AT1G07795 1:2414285-2414967 WT MT OK 0 1,1804 1.79769e+308 1.79769e+3 08 6.88885e-05 0,00039180 1 yes HRS1 1:4556891-4558708 WT MT OK 0 0,696583 1.79769e+308 1.79769e+3 08 6.61994e-06 4.67708e- 05 yes ATMLO14 1:9227472-9232296 WT MT OK 0 0,514609 1.79769e+308 1.79769e+3 08 9.74219e-05 0,00053505 5 yes NRT1.6 1:9400663-9403789 WT MT OK 0 0,877865 1.79769e+308 1.79769e+3 08 3.2692e-08 3.50131e- 07 yes AT1G27570 1:9575425-9582376 WT MT OK 0 2,0829 1.79769e+308 1.79769e+3 08 9.76039e-06 6.647e-05 yes AT1G60095 1:22159735-22162419 WT MT OK 0 0,688588 1.79769e+308 1.79769e+3 08 9.95901e-08 9.84992e- 07 yes AT1G03020 1:698206-698515 WT MT OK 0 1,78859 1.79769e+308 1.79769e+3 08 0,00913915 0,0277958 yes AT1G13609 1:4662720-4663471 WT MT OK 0 3,55814 1.79769e+308 1.79769e+3 08 0,00021683 0,00108079 yes AT1G21550 1:7553100-7553876 WT MT OK 0 0,562868 1.79769e+308 1.79769e+3 08 0,00115582 0,00471497 yes AT1G22120 1:7806308-7809632 WT MT OK 0 0,617354 1.79769e+308 1.79769e+3 08 2.48392e-06 1.91089e- 05 yes AT1G31370 1:11238297-11239363 WT MT OK 0 1,46254 1.79769e+308 1.79769e+3 08 4.83523e-05 0,00028514 3 yes APUM10 1:13253397-13255570 WT MT OK 0 0,581031 1.79769e+308 1.79769e+3 08 7.87855e-06 5.46603e- 05 yes AT1G48700 1:18010728-18012871 WT MT OK 0 0,556525 1.79769e+308 1.79769e+3 08 6.53917e-05 0,00037473 6 yes AT1G59077 1:21746209-21833195 WT MT OK 0 138,886 1.79769e+308 1.79769e+3 08 0,00122789 0,00496816 yes AT1G60050 1:22121549-22123702 WT MT OK 0 0,370087 1.79769e+308 1.79769e+3 08 0,00117953 0,0048001 yes Ddii et al., unpublished AT4G15242 4:8705786-8706997 WT MT OK 0,00930712 17,9056 10,9098 -4,40523 1.05673e-05 7.13983e-05 yes AT5G33251 5:12499071-12500433 WT MT OK 0,0498375 52,2837 10,0349 -9,8119 0 0 yes AT4G12520 4:7421055-7421738 WT MT OK 0,0195111 15,8516 9,66612 -3,90043 9.60217e-05 0,000528904 yes AT1G60020 1:22100651-22105276 WT MT OK 0,0118377 7,18823 9,24611 -7,50382 6.19504e-14 1.4988e-12 yes AT5G15360 5:4987235-4989182 WT MT OK 0,0988273 56,4834 9,1587 -10,4392 0 0 yes 13 Genová ontologie □ Jedním z možných přístupů je studium genové ontologie, tj. dříve prokázané spojitosti mezi geny a biologickými procesy Ddii et al., unpublished 14 □ Několik nástrojů umožňuje statisticky vyhodnotit obohacení o geny spojené se specifickými procesy Eden et al., BMC Biinformatics (2009) Genová ontologie 15 □ Několik nástrojů umožňuje statisticky vyhodnotit obohacení o geny spojené se specifickými procesy Genová ontologie 16 □ Několik nástrojů umožňuje statisticky vyhodnotit obohacení o geny spojené se specifickými procesy Genová ontologie 17 □ Několik nástrojů umožňuje statisticky vyhodnotit obohacení o geny spojené se specifickými procesy Genová ontologie 18 □ Několik nástrojů umožňuje statisticky vyhodnotit obohacení o geny spojené se specifickými procesy Genová ontologie 19 □ Několik nástrojů umožňuje statisticky vyhodnotit obohacení o geny spojené se specifickými procesy Genová ontologie 20  Definice Systémové biologie  Nástroje  Genová ontologie  Bayesovské sítě Osnova 21 Bayesovské sítě Co je Bayesovská sít´?  Pravděpodobný grafický model, který se používá k vytváření modelů z dat a/nebo názoru odborníka 22 Bayesovské sítě https://www.youtube.com/watch?v=4fcqyzVJwHM 23 Bayesovské sítě  Co je Bayesovská síť?  Pravděpodobný grafický model, který se používá k vytváření modelů z dat a/nebo názoru odborníka  může být využit v široké škále úkolů včetně predikce, detekce anomálie, diagnostiky, automatického pohledu na věc, uvažování, predikce časové řady a rozhodování za nejistoty  UZLY  každý uzel představuje proměnnou, jako je výška, věk nebo pohlaví. Proměnná může být diskrétní, jako například pohlaví = {samičí, samčí}, nebo spojitá, jako např. věk  SPOJE  přidány mezi uzly, aby ukazovaly, že jeden uzel má přímý vliv na druhý 24 Bayesovské sítě UZLY SPOJE/OKRAJE 25 Asijská Bayesovská síť https://www.bayesserver.com/ 26  Definice Systémové biologie  Nástroje  Genová ontologie  Bayesovské sítě  Modelování molekulárních/genových regulačních sítí Osnova 27 □ Vodivé pletivo jako vývojový model pro MRN modelování Benitez and Hejatko, PLoS One, 2013 Modelování molekulárních regulačních sítí 28 Modelování molekulárních regulačních sítí □ Vyhledávání publikovaných dat a vytvoření malé databáze Interaction Evidence References A-ARRs –| CK signaling Double and higher order type-A ARR mutants show increased sensitivity to CK. Spatial patterns of A-type ARR gene expression and CK response are consistent with partially redundant function of these genes in CK signaling. A-type ARRs decreases B-type ARR6-LUC. Note: In certain contexts, however, some A-ARRs appear to have effects antagonistic to other A- ARRs. [27] [27] [13] [27] AHP6 –| AHP ahp6 partially recovers the mutant phenotype of the CK receptor WOL. Using an in vitro phosphotransfer system, it was shown that, unlike the AHPs, native AHP6 was unable to accept a phosphoryl group. Nevertheless, AHP6 is able to inhibit phosphotransfer from other AHPs to ARRs. [9] [9] Benitez and Hejatko, PLoS One, 2013 29 Modelování molekulárních regulačních sítí □ Formulace logických pravidel definujících dynamiku modelu Network node Dynamical rule CK 2 If ipt=1 and ckx=0 1 If ipt=1 and ckx=1 0 else CKX 1 If barr>0 or arf=2 0 else AHKs ahk=ck AHPs 2 If ahk=2 and ahp6=0 and aarr=0 1 If ahk=2 and (ahp6+aarr<2) 1 If ahk=1 and ahp6<1 0 else B-Type ARRs 1 If ahp>0 0 else A-Type ARRs 1 If arf<2 and ahp>0 0 else Benitez and Hejatko, PLoS One, 2013 30 Modelování molekulárních regulačních sítí □ Specifikace mobilních prvků a jejich chování v modelu 31 Modelování molekulárních regulačních sítí □ Příprava první verze modelu a její testování 32 Modelování molekulárních regulačních sítí □ Specifikace chybějících interakcí ze známých predikcí Interaction Evidence References A-ARRs –| CK signaling Double and higher order type-A ARR mutants show increased sensitivity to CK. Spatial patterns of A-type ARR gene expression and CK response are consistent with partially redundant function of these genes in CK signaling. A-type ARRs decreases B-type ARR6-LUC. Note: In certain contexts, however, some A-ARRs appear to have effects antagonistic to other A-ARRs. [27] [27] [13] [27] AHP6 –| AHP ahp6 partially recovers the mutant phenotype of the CK receptor WOL. Using an in vitro phosphotransfer system, it was shown that, unlike the AHPs, native AHP6 was unable to accept a phosphoryl group. Nevertheless, AHP6 is able to inhibit phosphotransfer from other AHPs to ARRs. [9] [9] CK → PIN7 radial localization Predicted interaction (could be direct or indirect) Informed by the following data: During the specification of root vascular cells in Arabidopsis thaliana, CK regulates the radial localization of PIN7. Expression of PIN7:GFP and PIN7::GUS is upregulated by CK with no significant influence of ethylene. In the root, CK signaling is required for the CK regulation of PIN1, PIN3, and PIN7. Their expression is altered in wol, cre1, ahk3 and ahp6 mutants. [18] [18,20] [19] CK→ APL Predicted interaction (could be direct or indirect) Consistent with the fact that APL overexpression prevents or delays xylem cell differentiation, as does CKs. Partially supported by microarray data and phloem-specific expression patterns of CK response factors. [21] (TAIR, ExpressionSet: 1005823559, [22]) 33 Modelování molekulárních regulačních sítí □ Příprava další verze modelu a její testování Benitez and Hejatko, PLoS One, 2013 34 □ Dobrý model by měl být schopen simulovat realitu Benitez and Hejatko, PLoS One, 2013 Modelování molekulárních regulačních sítí 35 □ Formulace rovnic popisujících vzájemné vztahy v modelu Modelování molekulárních regulačních sítí Static nodes: gn(t+1)=Fn(gn1(t),gn2(t),..., gnk(t)) Mobile nodes: g(t+1)T [i]= H(g(t) [i]+ D (g(t) [i+1]+g(t) [i-1] – N(g(t) [i]))-b) state in the time t+1 state in the time tlogical rule function state in the time t+1 Amount if TDIF or MIR165 in cell i proportion of movable element constant corresponding to a degradation term 36 □ Dobrý model by měl být schopen simulovat realitu Benitez and Hejatko, PLoS One, 2013 Modelování molekulárních regulačních sítí Static nodes: gn(t+1)=Fn(gn1(t),gn2(t),..., gnk(t)) Mobile nodes: g(t+1)T [i]= H(g(t) [i]+ D (g(t) [i+1]+g(t) [i-1] – N(g(t) [i]))-b) 37 Modelování molekulárních regulačních sítí Benitez and Hejatko, submitted □ Dobrý model by měl být schopen simulovat realitu 38 Modelování molekulárních regulačních sítí Benitez and Hejatko, submitted □ Simulace mutantů 39  Definice Systémové biologie  Nástroje  Genová ontologie  Bayesovské sítě  Modelování molekulárních/genových regulačních sítí  Odvození genových regulačních sítí z velkých omických datových sad Osnova 40 Systémová biologie ve výzkumu rakoviny 41 miRNA/mRNA profilování Guo et al., Mol Med Reports, 2017 42 Benkova and Hejatko,Plant Mol Biol (2008) proximalroot meristem distalroot meristem Odvození genových regulačních sítí 43 Klidové centrum Quiescent centre Kolumela Columella cell files Iniciály kolumely Columella initials Epiderims Epidermis Kortex Cortex Endodermis Endodermis Iniciály stéle Stele initials proximalroot meristem distalroot meristem Postranní kořenová čepička Lateral root cap Iniciály epidermis Epidermis initials Iniciála endodermis a kortexu Endodermis and cortex initial Genové regulační sítě 44 Birnbaum et al., Science, 2003 Genové regulační sítě - GENIST de Luis Balaguer et al., PNAS, 2017  Odvození GR sítí přes GENIST  GEne regulatory Network Inference from SpatioTemporal data algorithm  Kombinace prostorových- a časově- specifických profilů exprese genů 45 Kombinace velkých omických datových sad GENY PLETIVO/ČAS 46 Genové regulační sítě - GENIST  Odvození GR sítí přes GENIST  shlukování (klastrování) genů  Expresní podobnost za různých podmínek/genetické pozadí, časové body, …  Odvození spojení uvnitř klastru  Selekce potenciálních regulátorů a ko- regulátorů  Na základě časové korelace ve změně exprese a/nebo specifikace uživatele  Modelování dynamické Bayesovské sítě Haeseleer, Computational Biology, 2005 47  Odvození GR sítí přes GENIST  shlukování (klastrování) genů  Expresní podobnost za různých podmínek/genetické pozadí, časové body, …  Odvození spojení uvnitř klastru  Selekce potencionálních regulátorů a ko- regulátorů  Na základě časové korelace ve změně exprese a/nebo specifikace uživatele  Modelování dynamické Bayesovské sítě de Luis Balaguer et al., PNAS, 2017 Genové regulační sítě - GENIST 48 Genové regulační sítě - GENIST de Luis Balaguer et al., PNAS, 2017 49 de Luis Balaguer et al., PNAS, 2017 Genové regulační sítě - GENIST 50 Indirect PAN targets feed-back loops Genové regulační sítě GENIST MODEL PREDICTION EXPERIMENTAL VERIFICATION 51  Systémová biologie se pokouší identifikovat nové vlastnosti/chování skupin funkčních podjednotek (regulátorů/molekul), které nejsou prostým součtem vlastností jednotlivých podjednotek, ale jsou novou vlastností závislou na způsobu jejich vzájemné interakce  Využívá matematické modely, často Bayesovské sítě  Genové regulační sítě lze identifikovat i pomocí (semi)automatických nástrojů z velkých datových sad (např. genové exprese na úrovni celého genomu)  Využití metod strojového účení („umělá inteligence“) Klíčové koncepty 52 Diskuse