CG920 Genomika Lekce 10 Systémová biologie Jan Hejátko Funkční genomika a proteomika rostlin, Mendlovo centrum genomiky a proteomiky rostlin, Středoevropský technologický institut (CEITEC), Masarykova univerzita, Brno hejatko@sci.muni.cz, www.ceitec.muni.cz  Literární zdroje ke kapitole 12:  Wilt, F.H., and Hake, S. (2004). Principles of Developmental Biology. (New York ; London: W. W. Norton)  Eden, E., Navon, R., Steinfeld, I., Lipson, D., and Yakhini, Z. (2009). GOrilla: a tool for discovery and visualization of enriched GO terms in ranked gene lists. BMC Bioinformatics 10, 48.  The Arabidopsis Genome Initiative. (2000). Analysis of the genome sequence of the flowering plant Arabidopsis thaliana. Nature 408, 796-815.  Benitez, M. and Hejatko, J. Dynamics of cell-fate determination and patterning in the vascular bundles of Arabidopsis thaliana (submitted)  de Luis Balaguer MA, Fisher AP, Clark NM, Fernandez-Espinosa MG, Moller BK, Weijers D, Lohmann JU, Williams C, Lorenzo O, Sozzani R. 2017. Predicting gene regulatory networks by combining spatial and temporal gene expression data in Arabidopsis root stem cells. Proc Natl Acad Sci U S A 114(36): E7632-E7640. Literatura  Definice systémové biologie  Nástroje  Analýza genové ontologie  Bayesovské sítě  Modelování molekulárních/genových regulačních sítí  Odvození genových regulačních sítí z velkých -omických dat Osnova Systémová biologie je vědecký směr v biologii využívající přístupy dalších věd, především biochemie, chemie, informatiky a matematiky. Zabývá se studiem biologických funkcí a mechanizmů vyskytujících se v biologických systémech jako důsledek komplexních interakcí. Základní myšlenkou je komplexní pohled, opak redukcionismu (který je převládajícím paradigmatem například v molekulární biologii), tedy předpoklad, že systém je víc než pouhý součet jeho částí. Systémová biologie často pracuje s modely, které jsou vytvářeny matematickými a informatickými přístupy na základě biologických dat, jejichž vlastnosti jsou posléze porovnávány s vlastnostmi živých systémů (Wikipedia). Definice Systémová biologie se zabývá studiem biologických systémů, jejichž chování nelze redukovat na lineární součet funkcí jejich částí. Systémová biologie nemusí nutně zahrnovat velké množství komponent nebo rozsáhlých datových souborů, jako je tomu v genomice nebo konektomice, ale často vyžaduje metody kvantitativního modelování původně vyvinuté fyziky (Nature). Definice Názorně vysvětluje na videu Dr. Nathan Price, zástupce ředitele Ústavu pro systémovou biologii na https://www.youtube.com/watch?v=OrXRl_8UFHU. Definice  Definice systémové biologie  Nástroje  Analýza genové ontologie Osnova Výsledky –omických studií vs. biologicky relevantní závěry □ Výsledky –omických studií reprezentují enormní množství dat, např. geny s rozdílnou expresí. Ale jak z nich získat biologicky relevantní závěry? gene locus sample_1 sample_2 status value_1 value_2 log2(fold_change) test_stat p_value q_value significant AT1G07795 1:2414285-2414967 WT MT OK 0 1,1804 1.79769e+308 1.79769e+ 308 6.88885e-05 0,00039180 1 yes HRS1 1:4556891-4558708 WT MT OK 0 0,696583 1.79769e+308 1.79769e+ 308 6.61994e-06 4.67708e- 05 yes ATMLO14 1:9227472-9232296 WT MT OK 0 0,514609 1.79769e+308 1.79769e+ 308 9.74219e-05 0,00053505 5 yes NRT1.6 1:9400663-9403789 WT MT OK 0 0,877865 1.79769e+308 1.79769e+ 308 3.2692e-08 3.50131e- 07 yes AT1G27570 1:9575425-9582376 WT MT OK 0 2,0829 1.79769e+308 1.79769e+ 308 9.76039e-06 6.647e-05 yes AT1G60095 1:22159735- 22162419 WT MT OK 0 0,688588 1.79769e+308 1.79769e+ 308 9.95901e-08 9.84992e- 07 yes AT1G03020 1:698206-698515 WT MT OK 0 1,78859 1.79769e+308 1.79769e+ 308 0,00913915 0,0277958 yes AT1G13609 1:4662720-4663471 WT MT OK 0 3,55814 1.79769e+308 1.79769e+ 308 0,00021683 0,00108079 yes AT1G21550 1:7553100-7553876 WT MT OK 0 0,562868 1.79769e+308 1.79769e+ 308 0,00115582 0,00471497 yes AT1G22120 1:7806308-7809632 WT MT OK 0 0,617354 1.79769e+308 1.79769e+ 308 2.48392e-06 1.91089e- 05 yes AT1G31370 1:11238297- 11239363 WT MT OK 0 1,46254 1.79769e+308 1.79769e+ 308 4.83523e-05 0,00028514 3 yes APUM10 1:13253397- 13255570 WT MT OK 0 0,581031 1.79769e+308 1.79769e+ 308 7.87855e-06 5.46603e- 05 yes AT1G48700 1:18010728- 18012871 WT MT OK 0 0,556525 1.79769e+308 1.79769e+ 308 6.53917e-05 0,00037473 6 yes AT1G59077 1:21746209- 21833195 WT MT OK 0 138,886 1.79769e+308 1.79769e+ 308 0,00122789 0,00496816 yes AT1G60050 1:22121549- 22123702 WT MT OK 0 0,370087 1.79769e+308 1.79769e+ 308 0,00117953 0,0048001 yes Ddii et al., unpublished AT4G15242 4:8705786-8706997 WT MT OK 0,00930712 17,9056 10,9098 -4,40523 1.05673e-05 7.13983e-05 yes AT5G33251 5:12499071- 12500433 WT MT OK 0,0498375 52,2837 10,0349 -9,8119 0 0 yes AT4G12520 4:7421055-7421738 WT MT OK 0,0195111 15,8516 9,66612 -3,90043 9.60217e-05 0,000528904 yes AT1G60020 1:22100651- 22105276 WT MT OK 0,0118377 7,18823 9,24611 -7,50382 6.19504e-14 1.4988e-12 yes AT5G15360 5:4987235-4989182 WT MT OK 0,0988273 56,4834 9,1587 -10,4392 0 0 yes Vývoj rostlinných vodivých pletiv □ Vodivé pletivo jako vývojový model pro GO analýzu a MRN modelování Lehesranta etal., Trends in Plant Sci (2010) WT hormonal mutant Hormonální regulace vývoje rostlinných vodivých pletiv □ Rostlinné hormony regulují ukládání ligninu v buněčných stěnách a transport vody xylémem WT mutant lignified cell walls Water Conductivity WT hormonal mutants WT hormonal mutant Hormonální regulace vývoje rostlinných vodivých pletiv □ Transkripční profilování pomocí sekvenování RNA mRNA Sekvenování společností Illumina a určení počtu transkriptů mRNA cDNA cDNA Výsledky –omických studií vs. biologicky relevantní závěry □ Transkripční profilování identifikovalo víc než 9K odlišně regulovaných genů… gene locus sample_1 sample_2 status value_1 value_2 log2(fold_change) test_stat p_value q_value significant AT1G07795 1:2414285-2414967 WT MT OK 0 1,1804 1.79769e+308 1.79769e+ 308 6.88885e-05 0,00039180 1 yes HRS1 1:4556891-4558708 WT MT OK 0 0,696583 1.79769e+308 1.79769e+ 308 6.61994e-06 4.67708e- 05 yes ATMLO14 1:9227472-9232296 WT MT OK 0 0,514609 1.79769e+308 1.79769e+ 308 9.74219e-05 0,00053505 5 yes NRT1.6 1:9400663-9403789 WT MT OK 0 0,877865 1.79769e+308 1.79769e+ 308 3.2692e-08 3.50131e- 07 yes AT1G27570 1:9575425-9582376 WT MT OK 0 2,0829 1.79769e+308 1.79769e+ 308 9.76039e-06 6.647e-05 yes AT1G60095 1:22159735- 22162419 WT MT OK 0 0,688588 1.79769e+308 1.79769e+ 308 9.95901e-08 9.84992e- 07 yes AT1G03020 1:698206-698515 WT MT OK 0 1,78859 1.79769e+308 1.79769e+ 308 0,00913915 0,0277958 yes AT1G13609 1:4662720-4663471 WT MT OK 0 3,55814 1.79769e+308 1.79769e+ 308 0,00021683 0,00108079 yes AT1G21550 1:7553100-7553876 WT MT OK 0 0,562868 1.79769e+308 1.79769e+ 308 0,00115582 0,00471497 yes AT1G22120 1:7806308-7809632 WT MT OK 0 0,617354 1.79769e+308 1.79769e+ 308 2.48392e-06 1.91089e- 05 yes AT1G31370 1:11238297- 11239363 WT MT OK 0 1,46254 1.79769e+308 1.79769e+ 308 4.83523e-05 0,00028514 3 yes APUM10 1:13253397- 13255570 WT MT OK 0 0,581031 1.79769e+308 1.79769e+ 308 7.87855e-06 5.46603e- 05 yes AT1G48700 1:18010728- 18012871 WT MT OK 0 0,556525 1.79769e+308 1.79769e+ 308 6.53917e-05 0,00037473 6 yes AT1G59077 1:21746209- 21833195 WT MT OK 0 138,886 1.79769e+308 1.79769e+ 308 0,00122789 0,00496816 yes AT1G60050 1:22121549- 22123702 WT MT OK 0 0,370087 1.79769e+308 1.79769e+ 308 0,00117953 0,0048001 yes Ddii et al., unpublished AT4G15242 4:8705786-8706997 WT MT OK 0,00930712 17,9056 10,9098 -4,40523 1.05673e-05 7.13983e-05 yes AT5G33251 5:12499071- 12500433 WT MT OK 0,0498375 52,2837 10,0349 -9,8119 0 0 yes AT4G12520 4:7421055-7421738 WT MT OK 0,0195111 15,8516 9,66612 -3,90043 9.60217e-05 0,000528904 yes AT1G60020 1:22100651- 22105276 WT MT OK 0,0118377 7,18823 9,24611 -7,50382 6.19504e-14 1.4988e-12 yes AT5G15360 5:4987235-4989182 WT MT OK 0,0988273 56,4834 9,1587 -10,4392 0 0 yes Analýza genové ontologie □ Jedním z možných přístupů je studium genové ontologie, tj. klasifikace genů podle kontrolovaných biologických procesů Ddii et al., unpublished Analýza genové ontologie □ Nástroje umožňující statisticky vyhodnotit obohacení seznamu diferenciálně regulovaných genů o geny asociované se specifickými procesy Eden et al., BMC Biinformatics (2009) Analýza genové ontologie □ Nástroje umožňující statisticky vyhodnotit obohacení seznamu diferenciálně regulovaných genů o geny asociované se specifickými procesy Analýza genové ontologie □ Nástroje umožňující statisticky vyhodnotit obohacení seznamu diferenciálně regulovaných genů o geny asociované se specifickými procesy Analýza genové ontologie □ Nástroje umožňující statisticky vyhodnotit obohacení seznamu diferenciálně regulovaných genů o geny asociované se specifickými procesy Analýza genové ontologie □ Nástroje umožňující statisticky vyhodnotit obohacení seznamu diferenciálně regulovaných genů o geny asociované se specifickými procesy Analýza genové ontologie □ Nástroje umožňující statisticky vyhodnotit obohacení seznamu diferenciálně regulovaných genů o geny asociované se specifickými procesy  Definice systémové biologie  Nástroje  Analýza genové ontologie  Bayesovské sítě Osnova Bayesovské sítě  Co je Bayesovská sít´?  Pravděpodobnostní grafický model, který se používá k vytváření modelů z dat a/nebo názorů odborníků https://www.youtube.com/watch?v=4fcqyzVJwHM  Co je Bayesovská síť?  Pravděpodobnostní grafický model, který se používá k vytváření modelů z dat a/nebo názoru odborníka  může být využit v široké škále úkolů včetně predikcí, detekcí anomálií, diagnostiky, automatického objasňování, zdůvodňování, predikce vývoje v čase a rozhodování za nejistoty  UZLY  každý uzel představuje proměnnou, jako je výška, věk nebo pohlaví. Proměnná může být diskrétní, jako například Pohlaví = {samičí, samčí}, nebo spojitá, jako např. věk  HRANY  spojnice popisující závislosti mezi uzly Bayesovské sítě Bayesovské sítě UZLY HRANY Asijská Bayesovská síť https://www.bayesserver.com/  Definice systémové biologie  Nástroje  Analýza genové ontologie  Bayesovské sítě  Modelování molekulárních/genových regulačních sítí Osnova □ Vodivé pletivo jako vývojový model pro Molecular Regulatory Network (MRN) modelování Benitez and Hejatko, PLoS One, 2013 Modelování molekulárních regulačních sítí Modelování molekulárních regulačních sítí □ Vyhledávání publikovaných dat a vytvoření malé databáze Interaction Evidence References A-ARRs –| CK signaling Double and higher order type-A ARR mutants show increased sensitivity to CK. Spatial patterns of A-type ARR gene expression and CK response are consistent with partially redundant function of these genes in CK signaling. A-type ARRs decreases B-type ARR6-LUC. Note: In certain contexts, however, some A-ARRs appear to have effects antagonistic to other A-ARRs. [27] [27] [13] [27] AHP6 –| AHP ahp6 partially recovers the mutant phenotype of the CK receptor WOL. Using an in vitro phosphotransfer system, it was shown that, unlike the AHPs, native AHP6 was unable to accept a phosphoryl group. Nevertheless, AHP6 is able to inhibit phosphotransfer from other AHPs to ARRs. [9] [9] Benitez and Hejatko, PLoS One, 2013 Modelování molekulárních regulačních sítí □ Formulování logických pravidel definujících dynamiku modelu Network node Dynamical rule CK 2 If ipt=1 and ckx=0 1 If ipt=1 and ckx=1 0 else CKX 1 If barr>0 or arf=2 0 else AHKs ahk=ck AHPs 2 If ahk=2 and ahp6=0 and aarr=0 1 If ahk=2 and (ahp6+aarr<2) 1 If ahk=1 and ahp6<1 0 else B-Type ARRs 1 If ahp>0 0 else A-Type ARRs 1 If arf<2 and ahp>0 0 else Benitez and Hejatko, PLoS One, 2013 Modelování molekulárních regulačních sítí □ Specifikace mobilních prvků a jejich chování v modelu Modelování molekulárních regulačních sítí □ Příprava první verze modelu a její testování Modelování molekulárních regulačních sítí □ Specifikace chybějících interakcí ze známých predikcí Interaction Evidence References A-ARRs –| CK signaling Double and higher order type-A ARR mutants show increased sensitivity to CK. Spatial patterns of A-type ARR gene expression and CK response are consistent with partially redundant function of these genes in CK signaling. A-type ARRs decreases B-type ARR6-LUC. Note: In certain contexts, however, some A-ARRs appear to have effects antagonistic to other A-ARRs. [27] [27] [13] [27] AHP6 –| AHP ahp6 partially recovers the mutant phenotype of the CK receptor WOL. Using an in vitro phosphotransfer system, it was shown that, unlike the AHPs, native AHP6 was unable to accept a phosphoryl group. Nevertheless, AHP6 is able to inhibit phosphotransfer from other AHPs to ARRs. [9] [9] CK → PIN7 radial localization Predicted interaction (could be direct or indirect) Informed by the following data: During the specification of root vascular cells in Arabidopsis thaliana, CK regulates the radial localization of PIN7. Expression of PIN7:GFP and PIN7::GUS is upregulated by CK with no significant influence of ethylene. In the root, CK signaling is required for the CK regulation of PIN1, PIN3, and PIN7. Their expression is altered in wol, cre1, ahk3 and ahp6 mutants. [18] [18,20] [19] CK→ APL Predicted interaction (could be direct or indirect) Consistent with the fact that APL overexpression prevents or delays xylem cell differentiation, as does CKs. Partially supported by microarray data and phloem-specific expression patterns of CK response factors. [21] (TAIR, ExpressionSet:1 005823559, [22]) Modelování molekulárních regulačních sítí □ Příprava další verze modelu a její testování Benitez and Hejatko, PLoS One, 2013 □ Dobrý model by měl být schopen napodobit realitu Benitez and Hejatko, PLoS One, 2013 Modelování molekulárních regulačních sítí □ Specifikace rovnic popisujících vzájemné vztahy v modelu Modelování molekulárních regulačních sítí Static nodes: gn(t+1)=Fn(gn1(t),gn2(t),..., gnk(t)) Mobile nodes: g(t+1)T [i]= H(g(t) [i]+ D (g(t) [i+1]+g(t) [i-1] – N(g(t) [i]))-b) stav v čase t+1 stav v čase tfunkce popisující logická pravidla stav v čase t+1 množství TDIF nebo MIR165 v buňce i podíl mobilních elementů konstatnta popisující dobu degradace □ Dobrý model by měl být schopen simulovat realitu Benitez and Hejatko, submitted Modelování molekulárních regulačních sítí Statické uzly: gn(t+1)=Fn(gn1(t),gn2(t),..., gnk(t)) Mobilní uzly: g(t+1)T [i]= H(g(t) [i]+ D (g(t) [i+1]+g(t) [i-1] – N(g(t) [i]))-b) Modelování molekulárních regulačních sítí Benitez and Hejatko, submitted □ Dobrý model by měl být schopen simulovat realitu Modelování molekulárních regulačních sítí Benitez and Hejatko, submitted □ Simulace mutantů  Definice systémové biologie  Nástroje  Analýza genové ontologie  Bayesovské sítě  Modelování molekulárních/genových regulačních sítí  Odvození genových regulačních sítí z velkých -omických dat Osnova Systémová biologie ve výzkumu rakoviny miRNA/mRNA profilování Guo et al., Mol Med Reports, 2017 Benkova and Hejatko,Plant Mol Biol (2008) proximalroot meristem distalroot meristem Odvození genových regulačních sítí Klidové centrum Quiescent centre Kolumela Columella cell files Iniciály kolumely Columella initials Epiderims Epidermis Kortex Cortex Endodermis Endodermis Iniciály stéle Stele initials proximalroot meristem distalroot meristem Postranní kořenová čepička Lateral root cap Iniciály epidermis Epidermis initials Iniciála endodermis a kortexu Endodermis and cortex initial Genové regulační sítě Birnbaum et al., Science, 2003 Genové regulační sítě - GENIST de Luis Balaguer et al., PNAS, 2017  Odvození GR sítí přes GENIST  GEne regulatory Network Inference from SpatioTemporal data algorithm  Kombinace prostorové a vývojové specifity genové exprese Kombinace velkých omických datových sad GENY PLETIVO/ VÝVOJOVÉ STADIUM Genové regulační sítě - GENIST  Odvození GR sítí přes GENIST  shlukování (klastrování) genů  Expresní podobnost za různých podmínek/genetické pozadí, časové body, …  Identifikace spojení uvnitř klastru  Selekce potenciálních regulátorů a ko- regulátorů  Na základě časové korelace ve změně exprese a/nebo manuální specifikace uživatelem  Modelování dynamické Bayesovské sítě Haeseleer, Computational Biology, 2005  Odvození GR sítí přes GENIST  shlukování (klastrování) genů  Expresní podobnost za různých podmínek/genetické pozadí, časové body, …  Identifikace spojení uvnitř klastru  Selekce potenciálních regulátorů a ko- regulátorů  Na základě časové korelace ve změně exprese a/nebo manuální specifikace uživatelem  Modelování dynamické Bayesovské sítě de Luis Balaguer et al., PNAS, 2017 Genové regulační sítě - GENIST Genové regulační sítě - GENIST de Luis Balaguer et al., PNAS, 2017 de Luis Balaguer et al., PNAS, 2017 Genové regulační sítě - GENIST Nepřímé cíle PAN Zpětnovazebné regulace Genové regulační sítě GENIST PŘEDPOVÉĎ MODELU EXPERIMENTÁLNÍ OVĚŘENÍ  Definice systémové biologie  Nástroje  Analýza genové ontologie  Bayesovské sítě  Modelování molekulárních/genových regulačních sítí  Odvození genových regulačních sítí z velkých -omických dat Souhrn Diskuse