Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí PA052: Úvod do systémové biologie David Šafránek 13.10.2011 INVESTICE DŮ ROZVOJE VZDĚLÁVANÍ Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí Obsah Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí Biologické sítě Obsah Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí Rekonstrukce biologických sítí v kontextu SB Metabolomika Rekonstrukce síti biochemických reakcí Struktura Vymezení Dynamika Citlivost infinitní prostor hypotéz a interpretací Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí Biologické sítě a dráhy • biochemická interakce molekul popsaná grafem • uzly • molekuly/komplexy biochemických látek • biochemické reakce • hrany • regulace (aktivace, represe, katalýza) • příslušnost k reakci (produkt, zdroj) • dráhy — zaměřené na určitá specifika (látky, reakce) • typicky signální dráhy • sítě — komplexní interakce • různé úrovně abstrakce, různé notace, např. Kohn's diagrams http://www.náture.com/msb/j ournal/v2/nl/full/ msb4100044.html Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí Příklad komponenty biologické sítě -O AT" -f1 ■yartakbtDB)i*L| ^--1 upnaiH-*0— I - O L-rípanate-d-P |-rfaiic:» wawm T L-Aspartale b bhi laIda hyd a O-----1*!*3 lyfce MoayTTLfi | C L-a danoa y H.-Metri i on i ne Biologické sítě Biologické sítě a dráhy • komplexy vzájemně interagujících chemických reakcí klíčem ke studiu fyziologie organismu představují základní informaci pro tvorbu in silico modelu v průběhu evoluce může docházet k přidávání/ubírání hran Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí Metabolická sít - ad hoc diagram Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí Rekonstrukce biologických sítí Obsah Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí Původ biologických dat • tradiční biochemie a genetika • výsledky redukcionistického období biologie • forma: vědecké články • získání dat: dolováním znalostí z textů (text mining) • low-troughput technologie • separace proteinů prostřednictvím antigénu • genové reportéry • high-troughput technologie • sekvenování genomu • měření exprese genů na DNA mikročipu • hmotnostní spektrometrie • proteomika a metabolomika Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí Rekonstrukce v kontextu centrálního dogmatu replikace genové sekvence regulační oblasti exprese mRNA interakce protein-DNA DNA i transkripce -;:> f > RNA translace -r--^ Protein 1-^1 -.................. GENOME TRANSCRIPTOME PROTEOME exprese proteinu struktura proteinu INTERACTOME interakce proteinu proteinové komplexy METABOLOME koncentrace metabolitu metabolicke drahý informace prenos realizace Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí Data na úrovni RNA • exprese m RNA • DNA microarray: high-throughput data (genome-scale expresní profily), typicky na populační úrovni • individuální informace pomocí genových reportérů (lze i na úrovni buňky) • srovnání s knock-out/knock-in mutacemi • dolování hypotéz o regulačních interakcích (shlukováním profilů) • transkriptom poskytuje hrubý odhad o expresi proteinů, nemusí být vypovídající (post-transkripční modifikace, regulace degradace mRNA, splicing) • interakce protein-DNA • ChlP-chip (chromatin immunoprecipitation + microarray): přímá detekce vazeb transkripčních faktorů na DNA K rekonstrukci regulační sítě je nezbytné integrovat data z úrovně genomu a transkriptomu. Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí Měření mRNA exprese nej používanějším nástrojem je technologie DNA microarray • v daném okamžiku je paralelně nasamplována exprese všech genů v genomu příslušného organismu • postaveno na relativním srovnání minimálně dvou různých vzorků • exprese v přítomnosti vs. nepřítomnosti O2 • exprese při knock-outu určitého genu vs. normální stav Prepare Microarray Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí Postup při DNA microarray experimentu 1. konstrukce čipu z cDNA knihovny (amplifikace a rozmístění sekvencí) 2. odběr celkové mRNA z experimentálních vzorků (typicky 2) 3. reverzní transkripce do cDNA asociované s fluorescenčním barvivem 4- hybridizace odebrané cDNA s cDNA na čipu 5. omytí čipu a oskenování výsledku 6. analýza dat 7. komerční čipy používají místo cDNA knihovny skupinu oligonukleotidů pro každý gen => pouze jeden vzorek mRNA je analyzován na jednom čipu (porovnání více identicky připravených čipů) http://www.bio.davidson.edu/courses/genomics/chip/chip.html Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí Reverzní transkripce cDNA a amplifikace fsolate and collet \ mRMA Reverse transcriptase RNA DNA Insert into bacterial p losmi ds a^_0 o Insert plasrnids \^^/ ^^^J) into bacteria Isolate plosmid and purify DNA A _ CGT C T G 6 C T S A C T T T A TCCT A T ^ G Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí Využití Polymerase Chain Reaction (PCR) • umožňuje replikaci určité části DNA (forma amplifikace) • DNA je zahřátím rozdělena • úsek DNA je označen párem oligonukleotidů (15-25 bazí) • při snížení teploty hybridizace oligonukleotidů s řetězcem DNA • doplnění zbývající sekvence DNA prostřednictvím RNA polymerázy • http://www.dnalc.org/resources/animat ions/pcr.html • lze využít i pro mRNA: RT-PCR (reverse transcription PCR) • reverzní transkripce mRNA do cDNA • amplifikace cDNA (PCR) Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí Databáze microarray dat • Stanford Microarray Database - různé pohledy na data, filtrace http://smd.Stanford.edu/cgi-bin/cluster/drpGetData.pl • ArrayExpress - statisticky zpracovaná data http://www.ebi.ac.uk/gxa/ Gene Expression Omnibus (GEO) http://www.nebi.nih.gov/geo/ • MUSC DNA Microarray Database http://proteogenomics.musc.edu/ma/ • GenExpDB (E. Coli specifická data) http://genexpdb.on.edu/ Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí GenExpDB Welcome to the E. coli Community's Gene Expression Database (GenExpDB] Hosted by the University of □klahome Instructions; Search t. toli GenExpDB using either gene, b-number or location (multiple entries separate by comma or space). Example: edd ■ b3517 ■ lata.laev.latz ■ 415365 (location] ■ reset 5earth by: O Operon Q Regulon Sigma Text Experiment ■iii ■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■ ii i iiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiii iiiiiiiiiiiiiiiiiiiiiiiiiiiiii nm i n iiiiiiiiiiiiiiiii im Iiiiiiiii ■■■■■■■■■ ■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■ mi nimm nm m mi mm 11 m iiiiiiiiiiiiiiiii iiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiii iiiiiiiiiiiiiiiiiiiiiiiiiiiiiiii i minimi nm i m i mm inn iiiniiiiiniiiiiiiiiiii iiiiiiniiiiin Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí Měření mRNA exprese pomoci genových reportérů • genovým reportérem se rozumí umělá subsekvence DNA zavedená do buňky • formou persistentního syntetického plasmidu (externí molekula DNA zavedená do buňky) • modifikací chromozomu (prostřednictvím plasmidu) Bacterial DNA Plasmids Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí Schema aplikace genového reportéru • genový reporter převádí aktivitu na určitém promotoru na měřitelný jev (nejčastěji fluorescence - GFP, luciferase) • měření reportovaného jevu probíhá na populační úrovni, lze i single-cell (digital microfluidics) Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí Schema aplikace genového reportéru • genový reporter převádí aktivitu na určitém promotoru na měřitelný jev (nejčastěji fluorescence - GFP, luciferase) • měření reportovaného jevu probíhá na populační úrovni, lze i single-cell (digital microfluidics) Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí Mikrofluidická soustava pro genové reportéry Baret, Jean-Christophe; Beck, Yannick; Billas-Massobrio, Isabel le; Moras, Di no; Griffiths, Andrew D. Quantitative Cell-Based Reporter Gene Assays Using Droplet-Based Microfluidics. Chemistry &i biology doi:10.1016/j.chembiol.2010.04.010 (volume 17 issue 5 pp.528 - 536) Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí Detekce vazeb protein-DNA Szalkowski, A.M, and Schmid, CD.(2010). Rapid innovation in ChlP-seq peak-calling algorithms is outdistancing banchmarking efforts. Briefings in Bioinfomatics. Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí Data rekonstruovaných regulačních sítí E. coli S. cerevisiae S. cerevisiae (ChlP-chip) regulující geny 123 109 203 regulované geny 451 418 1296 regulační inerakce 1468 945 3353 • E. coli - RegulonDB (http://regulondb.ccg.unam.mx/) • S. cerevisiae - http://web.wi.mit.edu/young/regulator_network/ Christopher T. Harbison, et al. Transcriptional regulatory code of a eukaryotic genome. Nature 431, 99-104 (2 September 2004). doi:10.1038/nature02800. S Shen-Orr, R Milo, S Mangan &i U Alon. Network motifs in the transcriptional regulation network of Escherichia coli. Nature Genetics, 31:64-68 (2002). iologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí koexpresní sít uzly: geny hrany: podobný expresní profil genová regulační sít uzly: geny a TF hrany: regulace Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí Problémy rekonstrukce • uvažme E. coli => 4500 genů, z toho 300 kódujících známý TF • máme 4500 x 300 možností interakcí . .. navíc dochází ke kombinatorickým regulacím • nutno uplatnit optimalizační strategie: • shlukování expresních profilů (clustering) • integrace dat • metody řízené dotazy (query-driven reconstruction pomocí bayesovských závislostí) Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí Problémy rekonstrukce Srovnání integračních a expresních metod 0.14-, 014-, Riet De Smet & Kathleen Marchal. Advantages and limitations of current network inference methods. Nature Reviews Microbiology 8, 717-729 (October 2010). doi:10.1038/nrmicro2419 • DISTILLER - nástroj postavený na integrační metodě (integrace expresních a interakčních dat) • CLR - nástroj postavený na výpočtu korelace expresních dat Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí Problémy rekonstrukce Divergence metod Riet De Smet & Kathleen Marchal. Advantages and limitations of current network inference methods. Nature Reviews Microbiology 8, 717-729 (October 2010). doi:10.1038/nrmicro2419 • LeMoNe - nástroj postavený na strojovém učení z expresních profilů (shlukování) • SI RENE - řízené strojové učení • SEREND - částečně řízené strojové učení + integrace dat Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí Data na úrovni proteomu a interaktomu • exprese proteinů • proteinové chipy (problémové - např. proteinové interakce závislé na termodynamických podmínkách) • hmotnostní spektrometrie (separace chromatografií, ionizace a měření rychlosti pohybu mezi elektrodami) • detekce interakcí protein-protein • proteinové chipy (univerzální použití) • Y2H (yeast two-hybrid system) ■GAL4-bäíding site Reporter gene Rekonstrukce biologických sítí Data na úrovni proteomu a interaktomu Sítě proteinových interakcí interakce proteinů člověka zdroj: http://www.estradalab.org/research/index.html Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí Data na úrovni proteomu a interaktomu Interakce proteinů S. cerevisiae Yeast Interactome Database -http://interactome.dfci.harvard.edu/S_cerevisiae/ ilOLOGICKÉ sítě Ontológie biologických znalostí Rekonstrukce biologických sítí Data na úrovni proteomu a interaktomu Interakce proteinů E. coli Bacteriome - http: //www. compsysbio. org/bacteriome/ Rekonstrukce biologických sítí Data na úrovni proteomu a interaktomu Další zdroje C. elegans - http://interactome.dfci.harvard.edu/C_elegans/ Drosophila - http: //www. droidb. org/ Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí Proteinová databanka PDB • databáze 3D strukturálních dat proteinů a nukleových kyselin • založena 1971 • veřejný přístup • http://www.rcsb.org/pdb/ • PDB formát souborů - http://www.wwpdb.org/documentation/format30 • primární struktura (sekvence aminokyselin) - FASTA formát vyhledávání proteinů dle sekvencí - BLAST -http://www.ebi.ac.uk/Tools/blast2/ Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí Data na úrovni metabolomu • interakce mezi metabolity determinovány chemicky (proteiny ve funkci enzymů) • měření metabolitů pomocí hmotnostní spektrometrie • měření aktivity enzymů na úrovni proteomu/transkriptomu • integrace s daty na nižších úrovních • data získaná z literatury a genoých sekvencí (pro daný organismus) • data dostupná ve veřejných databázích problémy mohou vznikat díky chybné identifikaci sekvencí BlOLOGICKE SITE REKONSTi;i!K<:ľ; BIOLOGICKÝCH SÍTÍ Ontológie biologických znalostí Data na úrovni metabolomu Organismus # enz. genů # metabolitů # reakcí E. coli 904 625 931 5. cerevisiae 750 646 1149 Staphylococcus aureus 619 571 640 Haemophilus influenzae 362 343 488 Helicobacter pylori 268 340 444 Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí zdroj: http://www.di.unipi.it/~braccia/ToolCode/ Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí KEGG - Kyoto Encyclopedia of Genes and Genomes • integrative databáze genových produktů • genový prostor GENES, GENOME, ORTHOLOGY, Organisms • chemický prostor COMPOUND, GLYCAN, REACTION, ENZYME, LIGAND • systémový prostor PATHWAY, BRITE, DISEASE, DRUG • každý pojem má jednoznačné ID • zachycena ortologie (podobnost) genů • genový prostor čerpá aktuálně z několika zdrojů Rekonstrukce biologických sítí KEGG - ORGANISMS GENOME: Escherichia coli K-12 MG1655 Entry TQQ007 Complete Genome Name SCO, E.coli, ECQLI, 511145 Definition Escherichia coli K-12 MG1655 Annotation manual vShow organismj Taxonomy Lineage TAX:511145 Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacteriales; Enterobacteriaceae; Escherichia Data source RefSeq (Project:225) Original DB Wisconsin Pasteur RegulonDB EcoGene ECOCYC Chromosome Sequence Length Circular RS:NC 000913 4639675 Statistics Number of nucleotides: 4639675 Number of protein genes: 4144 Number of RNA genes: 175 Reference Authors Title Journal PMID:927B5Q3 Blattner FR, et al. The complete genome sequence of Escherichia coli K-12. Science 277:1453-74 (1997) http://www.genome.jp/dbget-bin/www_bget?gn:T00007 Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí KEGG - ORGANISMS K^££ KEGG Organisms [Britemenu] | http://www.genome.jp/kegg-bin/get_htext?htext=br08601.keg&option=-a&query=eco Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí KEGG - GENES Escherichia coli K-12 MG1655: b1891 Entry blBSl CDS E.coli Gene name flhC, ECK1892, fTal, JW1880 Definition DNA-binding transcriptional dual regulator with FlhD Orthology K024Q2 flagellar transcriptional activator FlhC Pathway ecoQ2G20 Two-component system ecoQ204Q Flagellar assembly Class Environmental Information Processingj Signal Transduction; Two-component system [PATH:ecoQ2Q2u] Cellular Processes; Cell Motility; Flagellar assembly [PATH:ecoG2Q4G] BKI 1 - h erarehy SSDB ..Ortholog) Paralog ) ^Gene cluster) GFIT ) notif Pfam: FlhC I Motif ) Other DBs NCBI-GI: 16129843 NCBI-CenelD: 94728G RegulonDB: B1891 EcoGene: EG1Q319 ECOCYC: EG10319 UniProt: PGABY7 Structu re PDB: 2AVU Thumbnails) . ■-"JtSftyr # http://www.genome.jp/dbget-bin/www_bget?eco:b1891 Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí KEGG - ORTHOLOGY ORTHOLOGY: K02402 ^ Help , Entry K02402 KO Name flhC Definition flagellar transcriptional activator FlhC Pathway koQ2020 Two-component system koQ204Q Flagellar assembly Class Environmental Information Processing; Signal Transduction; Two component system [PATH:ko0202Q] Cellular Processes; Cell Motility; Bacterial motility proteins [BR:koQ2Q35] Cellular Processes; Cell Motility; Flagellar assembly [PATH:koQ204Q] ^SRITE hierarchy Genes ECO b 1891 [find ECJ JWlSSO(flhC) EBW EWG 17CÖ[flhC) ECE Z2S45lflhC) ECS ECS2G01 ECF ECH74115 2630[flhC) ETW ECSP 24651 fIhC) EOJ ECCI26 2743(flhC) EOI ECG111 2477(fine] EOH ECQ103 21S3(flhCJ ECC E234SC 20141 fIhC! EOK G25B3 2344(flhC] ECC c230G[flhC) ECP ECP 1835 ECI UTIB9 C2094(flhC] http://www.genome.jp/dbget-bin/www_bget?ko:K02402 Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí KE G G - PATHWAYS http://www.genome.jp/kegg-bin/show_pathway?eco02040+bl891 Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí Data (bio) chemických reakcí • vstupy reakce - substráty (reaktanty) • výstupy reakce - produkty A+B^C+D • řídící látky (specifické proteiny — enzymy, koenzymy) • katalýza - urychlení/zpomalení reakce (aktivátory/inhibitory) • zesilování katalytických účinků enzymů koenzymy • např. kalalytické urychlení rozpadu: AB + E ^ ABE -> A + B + E • pilířem je komplex katalytických reakcí - metabolismus • metabolismus umožňuje zpracování a přeměnu energie Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí Složitost metabolismu • v e.coli je více než 1000 reakcí • opakující se motivy • zpracování ATP (adenozintrifosfát) - zisk energie • omezené množství aktivních meziproduktů • jen cca 100 molekul má zásadní funkci • omezené množství typů reakcí • individuální reakce jsou typicky jednoduché (omezené množství substrátů/produktů) Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí Klasifikace reakcí • každá reakce identifikována EC číslem • definováno dle názvosloví enzymů http://www.chem.qmw.ac.uk/iubmb/enzyme EC 3.2.1.23 typ reakce druh substrátu popis akceptoru subidentifikace Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí Klasifikace reakcí • celkem 8 typů reakcí (enzymů) • oxydoreduktázy, transferázy, hydrolázy, ... • EC 3.2.1.23 - /3-galaktocidáza • hydrolýza inhibující tvorbu laktózy, součást galaktózové metabolické dráhy • http://www.ebi.ac.uk/thornton-srv/databases/ cgi-bin/enzymes/GetPage.pl?ec_number=3.2.1.23 Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí Databáze enzymů, metabolických drah • BRENDA — http://www.brenda-enzymes.org/ => zahrnuje kvantitativní data • IntEnz — http://www.ebi.ac.uk/intenz/ => zaměřeno na názvosloví • KEGG — http://www.genome.jp/kegg/ => schémata metabolických drah http://www.genome.j p/kegg/pathway.html • MetaCyc — http: //metacyc. org/ Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí KE G G - PATHWAYS http: //www.genome.jp/kegg-bin/show_pathway?org_name=ecj &mapno=00010&mapscale=&show_description=hide Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí Cvičení Uvažujme sekvenci aminokyselin (FASTA formát): SVVEEHGQLSISNGELVNERGEQVQLKGMSSHGLQWYGQ FVNYESMKWLRDDWGINVFRAAMYTSSGGYIDDPS VKEKVKEAVEAAIDLDIYVIIDWHILSDNDPNIYK EEAKDFFDEMSELYGDYPNVIYEIANEPNGSDVTW GNQIKPYAEEVIPIIRNNDPNNIIIVGTGTWSQDV HHAADNQLADPNVMYAFHFYAGTHGQNLRDQVDYA LDQGAAIFVSEWGTSAATGDGGVFLDEAQVWIDFM DERNLSWANWSLTHKDESSAALMPGANPTGGWTEA ELSPSGTFVREKIRES • najděte na http://www.ebi.ac.uk/intenz/ • prozkumejte relevantní dráhy na http://www.genome.jp/kegg/ Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí Reactome Reactome - a curated knowledgebase of biological pathways I Escherichia coli * • in* i-i/1' Reaction Etperi-ncnlnlly enrf rme:J reaction M a-nr. I y niericd icid on Elcctronicjil y in:errcd reaction | Linkso1 r* Cell Cycle Checkpoi respiratory electron transport, ATP synthesis by ch e m i o s m otic coupling, and neat production by uncoupling proteins. äupertamily [IgSF) it Integration of energy metabol surface inleractior 'vlembrane Traffickinc Metabolism ot carbohydrates ti oľ lipids and lipoproteir Metabolism ot vitamins and cotactors Pyruvate metabolism and Citric Acid [TCA] Muscle contractioi regulation ot beta-cell dei> 71RNA Processing ^ e (| iilatory PI 1^ pathways ,lyu genesis Signaling by BMF signaling by EGFR Signaling in Immure system signaling by FGFR -signaling lay Insulin retep signaling byGPCP Signalling by I IGF signaling by PDGF Signaling by Notch http://www.reactome.org/ Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí Specificky zaměřené zdroje dat • EcoCyc — http://ecocyc.org- E. coli K12 • SGD —http://www.yeastgenome.org/ WORMBASE - http: //www.sanger.ac.uk/Projects/C_elegans/WDRMBASE/ • FlyBase — http: //f lybase. org/ Ontológie biologických znalostí Obsah Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí Databáze odborných článků • PubMed Entrez - vyhledávání v odborných biologických/lékařských článcích http://www.nebi.nlm.nih.gov/sites/entrez • Maintained by U.S. National Library of Medicine • obsahuje okolo 15 mil. referencí • zahrnuje články více než 4000 časopisů • slovník pojmů MeSH Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí Ontológie genů a genových produktů • nutnost systematicky uchopit genom, genové produkty a funkce (interaktom) • akumulace biologických dat • decentralizovaný proces • paralelní proces • problém: nejednoznačné popisy téhož objektu, procesu • např. proteolýza vs. (řízená degradace proteinů) • od roku 1998 vývoj Gene Ontology =>• http://geneontology.org Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí Gene Ontology • cílem je ucelený systematický popis genových produktů a jejich funkcí • ontológie představuje systematický slovník pojmů hierarchický pohled na data včetně vazeb mezi nimi (DAG) • zachycení synonym • GO obsahuje 3 kategorie (DAGy): • biological process • cellular component • molecular function Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí Gene Ontology • respektuje standard OBO a OWL (W3C) pro strukturu a reprezentaci ontológií • http://obofoundry.org/ • http://www.w3.org/TR/owl-features/ • každý uzel představuje jednoznačný pojem (množinu synonym) =4> jednoznačně reprezentován ID (tzv. GO termem) • různé typy relací mezi uzly: • part_of, is_a, locatedJn, derived_from, .. . • viz http://obofoundry.org/ro/ rekonstrukce biologických sítí Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí Nástroje pro Gene Ontology • on-line i off-line vyhledávače v GO • statistické testy na overreprezentaci dané množiny genů v pojmech GO • GOstat - http://gostat.wehi.edu.au/cgi-bin/goStat.pl • DAVID - http://david.abcc.ncifcrf.gov/ • BiNGO- http://www.psb.ugent.be/cbd/papers/BiNGO/Home.html • mapování microarray dat na ontologický strom • eGOn - http://www.genetools.no/ • High-Throughput GoMiner - http://discover.nci.nih.gov/gominer/htgm.jsp • Meta Gene Profiler (MetaGP) -http://metagp.ism.ac.jp/ Biologické sítě Rekonstrukce biologických sítí Ontológie biologických znalostí Literatura 0 Kitano, H. Foundations of Systems Biology. MIT Press, 2001. Q Palsson, B. Systems Biology: Properties of Reconstructed Networks. Cambridge University Press, 2006. Q Rigoutsos, I. and Stephanopoulos, G. Systems Biology Volume II: Networks, Models, and Applications. Oxford University Press, 2004. Q Klipp, E. et al. Systems Biology in Practise: Concepts, Implementation and Application. Wiley-VCH, 2005.