LOSCHMIDT LABORATORIES Úvod do bioinformatiky a bioinformatické databáze 1/ EVROPSKÁ UNIE WLÄDhlh. I ÉLUVÝCIIC'VY pro honkjHfflcoachopnrnal INVESTICE DO ROZVOJE VZDĚLÁVÁNf Osnova □ Organizační informace □ Studijní literatura □ Historie bioinformatiky □ Bioinformatické instituce □ Bioinformatické databáze □ Prohledávání databází Úvod do bioinformatiky, bioinformatické databáze Organizační informace □ Kolokvium ■ Písemný test ■ Celkem 25 otázek s jednou i více správnými odpověďmi ■ Minimálně 17 správných odpovědí □ BÍ5000 Bioinformatika I - nukleové kyseliny □ BÍ9060 Bioinformatika II - proteiny □ BÍ9061 Bioinformatika - cvičení Úvod do bioinformatiky, bioinformatické databáze Studijní literatura □ Xiong, J. Essential Bioinformatics. Cambridge University Press, New York, 2006. □ Claverie, J., and Notredame, C. Bioinformatics for Dummies2 ed. Wiley Publishing, Hoboken, 2006 □ Cvrčkova, F. Úvod do praktické bioinformatiky. Academia, Praha 2006. □ Misener, S., Krawetz S.A. Bioinformatics: methods and protocols. Humana Press, Totowa, New Jersey 2000. □ Attwood, T.K., Parry-Smith, D.J. Introduction to bioinformatics. Longman, Essex, 1999. □ Baxevanis, A.D., Ouellette, F.B.F. Bioinformatics: a practical guide to the analysis of genes and proteins. Wiley-lnterscience, New York 1998. Úvod do bioinformatiky, bioinformatické databáze Bioinformatika □ Informační technologie sloužící k získávání, uchovávání, analýze a distribuci informací týkajících se biomakromolekul LRHLGITG—PVTLAVHDWGGMIGFGWALSHHAQVKRLVITNTAAAGTKFDKLTWLDVG—PVD LWHDWGTI LRHVGIDDVTPLTLAVHDWGGMIGFGWALAHAVQVRRLVMTOTAGTIKLERLTWLDVG---PVD LWHDWGTI LTWLDVG—PVD LWHDWGGAIGMGWAVRHPD LVRRI WLNTAA.GT -KLDRLTWLDVG---PVD LWHDWGTL Úvod do bioinformatiky, bioinformatické databáze Bioinformatika □ Informační technologie sloužící k získávání, uchovávání, analýze a distribuci informací týkajících se biomakromolekul Vývoj nástrojů a databází Úvod do bioinformatiky, bioinformatické databáze Bioinformatika □ Informační technologie sloužící k získávání, uchovávání, analýze a distribuci informací týkajících se biomakromolekul Strukturní analýzy Sekvenční analýzy predikce struktury \ nukleových kyselin predikce struktury proteinů klasifikace proteinových struktur porovnávání proteinových struktur porovnaní genomu fylogeneze predikce genů a promotorů identifikace motivů prohledávání sekvenčních databází sekvenční přiložení Funkční analýzy ............................ modelování metabolických drah analýza profilů genové exprese predikce proteinových interakcí predikce vnitrobuněčné lokalizace proteinů Vývoj nástrojů a databází Úvod do bioinformatiky bioinformatické databáze Bioinformatika □ Informační technologie sloužící k získávání, uchovávání, analýze a distribuci informací týkajících se biomakromolekul Strukturní analýzy Sekvenční analýzy predikce struktury \ nukleových kyselin predikce struktury proteinů klasifikace proteinových struktur porovnávání proteinových struktur porovnaní genomu fylogeneze predikce genů a promotorů identifikace motivů prohledávání sekvenčních databází sekvenční přiložení Funkční analýzy ............................ modelování metabolických drah analýza profilů genové exprese predikce proteinových interakcí predikce vnitrobuněčné lokalizace proteinů Vývoj nástrojů a databází Úvod do bioinformatiky bioinformatické databáze Nukleové kyseliny Úvod do bioinformatiky, bioinformatické databáze Nukleové kyseliny Úvod do bioinformatiky, bioinformatické databáze Nukleové kyseliny Nukleové kyseliny Nukleové kyseliny Nukleové kyseliny Nukleové kyseliny Nukleové kyseliny Nukleové kyseliny Nukleové kyseliny Nukleové kyseliny Nukleové kyseliny Nukleové kyseliny 5'-NCG-AAA-TTT-GCG-3' N-Lys-Phe-Ala Proteiny MSLGAKPFGEKKFIEIKGRRMAYIDEGTGDPILFQHGNPTSSYLWRNIMPHCA GLGRLIACDLIGMGDSDKLDPSGPERYAYAEHRDYLDALWEALDLGDRVVLVV HDWGSALGFDWARRHRERVQGIAYMEAIAMPIEWADFPEQDRDLFQAFRS QAGEELVLQD funkce Úvod do bioinformatiky, bioinformatické databáze Historie bioinformatiky □ Revoluce Úvod do bioinformatiky, bioinformatické databáze Historie bioinformatiky Üvod do bioinformatiky, bioinformaticke databäze Historie bioinformatiky Üvod do bioinformatiky, bioinformaticke databäze Historie bioinformatiky Üvod do bioinformatiky, bioinformaticke databäze Historie bioinformatiky Historie bioinformatiky Üvod do bioinformatiky bioinformaticke databäze ~4- Bioinformatické instituce □ National Center for Biotechnology Information (NCBI) □ European Bioinformatics Institute (EBI) Bioinformatické instituce -v A. □ National Center for Biotechnology Information (NCBI) ■ oddělení National Library of Medicine při National Institutes of Health v USA ■ Poskytuje Databáze GenBank, PubMed, OMIM, Genome dbSNP,... ■ Informace dostupné přes vyhledávací systém Entrez Úvod do bioinformatiky, bioinformatické databáze Bioinformatické instituce □ National Center for Biotechnology Information (NCBI) Entrez, The Life Sciences Search Engine Human Genome | GenBank | Map Viewer | BLAsT Search across databases | ] | go 11 clear | Help Welcome to the Entrez cross-database search page (JJ PubMed: biomedical literature citations and abstracts tr' PubMed Central: free, full text journal articles 1^1 (jjj Site Search: NCBI web and FTP sites tr' Books: online books ij OMIM: online Mendelian Inheritance in Man *j OMIA: online Mendelian Inheritance in Animals ij Nucleotide: Core subset of nucleotide sequence records t/ EST: Expressed Sequence Tag records 11^ EQ* GSS: Genome Survey Sequence records 11^ •*•*• Protein: sequence database ii^ ||| Genome: whole genome sequences ii^ Structure: three-dimensional macromolecular structures 11^ Taxonomy: organisms in GenBank 11^ llTll SNP: single nucleotide polymorphism ^ dbGaP: genotype and phenotype tj £^ UniGene: gene-oriented clusters of transcript sequences a CDD: conserved protein domain database igjg 3D Domains: domains from Entrez Structure UniSTS: markers and mapping data l£) Dfl PopSet: population study data sets -j ?JH GEO Profiles: expression and molecular abundance profiles ij^ GEO DataSets: experimental sets of GEO data -j Úvod do bioinformatiky, bioinformatické databáze Bioinformatické instituce □ European Bioinformatics Institute (EBI) ■ Součást European Molecular Biology Laboratory (EMBL), Wellcome Trust Genome Campus ve Velké Británii ■ Poskytuje databáze EMBL-Bank, UniProt, Ensembl, InterPro, ■ Informace dostupné přes vyhledávací systém SRS Úvod do bioinformatiky, bioinformatické databáze Bioinformatické instituce □ European Bioinformatics Institute (EBI) Úvod do bioinformatiky bioinformatické databáze Bioinformatické databáze □ Bibliografie □ Nukleotidové sekvence □ Proteinové sekvence □ Proteinové struktury □ Genomy LRHLGITGPVTLAVHDWGGMIGFGWALSHHAQVKRLVI TNTAAAGTKFDKLTWLDVGPVDLWHDWGTISRMEEGT WYLKLIRTTVWHQAIVLAEIGTWCKTQENPA i "3 NCB1 □—j Entrez, The Life Sciences Search En gin e PubMed All Databases | Human Genome _GenBank Map Viewer Search across databases |linb | J^^J Help edjcal literature citations and 79 PubMed Central: free, full text jo Site Search: NCBI web and FTP sites \B none Books: online books \H \H none OMIM: online Mendelian Inheritance in Nan [D \2\ none i=plg ONIA: Online Mendelian Inheritance in Animals O GenBank) 39 Protein: sequence datab [Í] )j| Genome: whole genome 12 -Í Structure: three-dirnens 1-1 structures |none| j|' CDD 12 |none| r*f- Un anted clusters of transcript 3D Donu STS: d protein domain database domains from Entrez Structure arkers and mapping data Úvod do bioinformatiky, bioinformatické databáze Bibliografické databáze □ PubMed □ Web of Science *3 NCB1 I Search | PubMed I A seivice of the U .5. National Libiaiy of Medicine ^^tr| fu^^tSj^^^d ™i the National Institutes of Health www.pvbmeii.gov I for r About Entrez Text Version Entrez PubMed Overview Help | FAQ Tutorials New/Noteworthy fft E-Utilities PubMed Services Journals Database MeSH Database Single Citation Matcher Batch Citation Matcher Clinical Queries Special Queries LinkOut I f Limits J Preview/Index J History Y~Clipboard ^ Details ] Go I Clear | Advanced S e To get started with PubMed, enter one or more search terms. Search terms may be topics, authors or journals. ■ Set up an automated PubMed update in fewer than ^^NCBll five minutes. 1. Create a My NCEI account. 2. Save your search. 3. Your PubMed updates can be e-mailed directly to you. Read the My NCBI Help material to explore other options, such as automated updates of other databases, setting search filters, and highlighting search terms. PubMed is a service of the U.S. National Library ofMedicine that includes over 17 million citations Web of Science Search i Cited Reference Search ! Advanced Search i Search History ! Marked List (0) Web of Science® in I Top Example: oil spill* AND "North Sea" I AND in I Author 1 a Example: O'Bnan C* OR QBnan C* Need help finding papers by an author? Use Author Finder. I AND in I Publication Name -~í ^ Example: Cancer* OR Journal of Cancer Research and Clinical Oncology Add Another Field » Z Search ) ( Clear ) Úvod do bioinformatiky, bioinformatické databáze Bibliografické databáze □ PubMed ■ Provozováno National Library of Medicíne ■ Obsahuje více než 22 milionů citací biomedicínské literatury ■ Integruje MEDLINE, časopisy z oblasti živých věd a online knihy ■ Prohledávání možné přes Entrez nebo DBGET ■ Obsahuje kromě abstraktů odkazy na plné texty dostupné přes PubMed Central nebo stránky nakladatelství PubMed U.S. National Library of Medicine National Institutes of Health NCBI Úvod do bioinformatiky, bioinformatické databáze Bibliografické databáze □ PubMed PublGjed.gov U.S. National Library of Medicine National Institutes of Health Search' PubMed ^^^B I Limits Advanced search Help Search 1 Clear Display Settings: fvl Abstract Send to: fvl Nat Chem Biol. 2009 Oct;5(10):727-33. Epub 2009 Aug 23. Redesigning dehalogenase access tunnels as a strategy for degrading an anthropogenic substrate. Pavlova M, Klvana M, Prokop Z, Chaloupkova R, Banas P, Otyepka M, Wade RC, Tsuda M, Nagata Y, Damborsky J. Loschmidt Laboratories, Institute of Experimental Biology and National Centre for Biomolecular Research, Faculty of Science, Masaryk University, Brno, Czech Republic. Abstract Engineering enzymes to degrade anthropogenic compounds efficiently is challenging. We obtained Rhodococcus rhodochrous haloalkane dehalogenase mutants with up to 32-fold higher activity than wild type toward the toxic, recalcitrant anthropogenic compound 1,2,3-trichloropropane (TCP) using a new strategy. We identified key residues in access tunnels connecting the buried active site with bulk solvent by rational design and randomized them by directed evolution. The most active mutant has large aromatic residues at two out of three randomized positions and two positions modified by site-directed mutagenesis. These changes apparently enhance activity with TCP by decreasing accessibility of the active site for water molecules, thereby promoting activated complex formation. Kinetic analyses confirmed that the mutations improved carbon-halogen bond cleavage and shifted the rate-limiting step to the release of products. Engineering access tunnels by combining computer-assisted protein design with directed evolution may be a valuable strategy for refining catalytic properties of enzymes with buried active sites. PMID: 19701 186 [PubMed - indexed for MEDLINE] S Publication Types, MeSH Terms, Substances, Secondary Source ID Q LinkOut- more resources Full Text Sources: Nature Publishing Group Related citations Biodegradation of 1,2,3-trichloropropane through directed evolution an [Appl Environ Microbiol. 2002] Pathways and mechanisms for product release in the engineered haloalkane dehak [J Mol Biol. 2009] Mechanism of enhanced conversion of 1,2,3-trichloropropane b [J Comput Aided Mol Des. 2006] Evolving haloalkane dehaloqenases [Curr Opin Chem Biol. 2004] I Alpha/Beta-hydrolase fold enzymes structures, functions [Curr Protein Pept Sci. 2000] See reviews.. See all.. All links from this record Related Citations Compound (MeSH Keyword) Compound (Publisher) Substance (MeSH Keyword) Substance (Publisher) Úvod do bioinformatiky, bioinformatické databáze Bibliografické databáze □ Web of Science ■ Komerční databáze ■ Součást ISI Web of Knowledge ■ Používá se pro zjištění citovanosti a impaktního faktoru časopisů Úvod do bioinformatiky, bioinformatické databáze Bibliografické databáze □ Web of Science ISI Web of Knowledge Web of Science Additional Resources Search ; Cited Reference Search ; Structure Search ; Advanced Search ; Search History ; Marked List (0) Web Of Science® - with Conference Proceedings << Back to results list ■* \ Record 1 of 1 I ► Record from Web of Science® Redesigning dehalogenase access tunnels as a strategy for degrading an anthropogenic substrate If NCBI ") Print ) f E-mail 1 'Add to Marked List '■ 'Save to IniKXEWeb ' f Save to , RefMan, ProGlfi ) more options Author(s): Pavlova M (Pavlova, Martina) ■ , Klvana M [Klvana, Martin) ^, Prokop Z [Prokop, Zbynek) ■ , Chaloupkova R [Chaloupkova, Radka) ^, Banas P [Banas, Pavel)3,4, rjtyepka M [Otyepka, Michal)3,4, Wade RC (Wade, Rebecca C.)E', Tsuda M [Tsuda, Masatakaf, Nagata Y [Nagata, Yuji)6, Damborsky J [Damborsky, Jiri)1,2 Source: NATURE CHEMICAL BIOLOGY Volume: 5 Issue: 10 Pages: 727-733 Published: OCT2009 Times Cited: 6 References: 50 HH] Citation Map Abstract: Engineering enzymes to degrade anthropogenic compounds efficiently is challenging. We obtained Rhodococcus rhodochrous haloalkane dehalogenase mutants with up to 32-fold higher activity than wild type toward the toxic, recalcitrant anthropogenic compound 1,2,3-trichloropropane [TOP) using a new strategy. We identified key residues in access tunnels connecting the buried active site with bulk solvent by rational design and randomized them by directed evolution. The most active mutant has large aromatic residues at two out of three randomized positions and two positions modified by site-directed mutagenesis. These changes apparently enhance activity with TCP by decreasing accessibility of the active site forwater molecules, thereby promoting activated complex formation. Kinetic analyses confirmed that the mutations improved carbon-halogen bond cleavage and shifted the rate-limiting step to the release of products. Engineering access tunnels by combining computer-assisted protein design with directed evolution may be a valuable strategy for refining catalytic properties of enzymes with buried active sites. Document Type: Article Language: English Keywords Plus: SPHINGOMONAS-PAUCIMOBILIS UT26; HALOALKANE DEHALOGENASE; DIRECTED EVOLUTION; CYTOCHROME P450S; HETEROLOGOUS EXPRESSION; XENOBIOTIC COMPOUNDS; CATALYTIC MECHANISM; ESCHERICHIA-COLI; ENZYME; SPECIFICITY Reprint Address: Damborsky, J (reprint author), Masaryk Univ, Fac Sci, Loschmidt Labs, Inst Eapt Biol, CS-61137 Brno, Czech Republic_ Cited by: 6 This article has been cited 6 times [from Web of Science}. Kourist R, Jochens H, Bartsch S, et al. The alpha/beta-Hydrolase Fold 3DM Database (ABHDB)as a Tool for Protein Engineering CHEMBIOCHEM 11 12 1635-164-3 AUG 162010 Stsiapanava A, Dohnalek J, Gavira JA, et al. Atomic resolution studies of haloalkane dehalogenases DhaA04, DhaA14 and DhaA15 with engineered access tunnels ACTA CRYSTALLOGRAPHICA SECTION D-BIOLOGICAL CRYSTALLOGRAPHY 66 962-969 Part 9 SEP 2010 Brouk M, Derry NL, Shainsky J, et al. The influence of key residues in the tunnel entrance and the active site on activity and selectivity oftoluene-4-monooxygenase JOURNAL OF MOLECULAR CATALYSIS B-ENZYMATIC 66 1-2 72-80 SEP 2010 [ view all 6 citing articles ] ( Create Citation Alert ) Related Records: Úvod do bioinformatiky, bioinformatické databáze Databáze nukleotidových sekvencí □ GenBank □ EMBL-Bank o □ DDBJ □ Anotované kolekce veřejně dostupných nukleotidových sekvencí □ Data získaná z genomových center a odborných pracovišť □ Každodenní vzájemná synchronizace nových a aktualizovaných dat □ "Accession number" - jedinečný identifikátor záznamu, ve všech třech databázích Úvod do bioinformatiky, bioinformatické databáze Databáze nukleotidových sekvencí -v A. □ GenBank ■ Založena v roce 1982, provozována NCBI ■ Přístupná prostřednictvím vyhledávacího systému Entrez nebo systému DBGET ■ Obsahuje více než 187.000.000 sekvencí (2015) ■ Nové sekvence možné vložit pomocí Banklt nebo Sequin Databáze nukleotidových sekvencí □ EMBL-Bank Založena v roce 1980, Provozována EBI Přístupná prostřednictvím vyhledávacího systému SRS či DBGET Obsahuje více než 608.000.000 sekvencí (2015) Nové sekvence možné vložit pomocí Webin nebo Sequin NUCLEOTIDE SEQUENCE DATABASE Úvod do bioinformatiky, bioinformatické databáze Databáze nukleotidových sekvencí □ DNA Data Bank of Japan (DDBJ) ■ Založena v roce 1984, provozována National Institute of Genetics ■ Obsahuje více než 253.000.000 sekvencí (2015) ■ Nové sekvence možné vložit pomocí Sakura nebo Sequin (S5 DDBJ DNA Dat* Bank ofjdpin Úvod do bioinformatiky, bioinformatické databáze Ukázka záznamu v GenBank □ Hlavička ■ Základní informace o záznamu ■ Lokus, definice, přístupový kód, klíčová slova, organizmus, reference,.. X.autotrophicus haloalkane dehalogenase (dhlA) gene, complete cds Comment Features Sequence LOCUS XAADHLA 3041 tap DNA linear BCT 15-FEB-1996 DEFINITION X.autotrophicus haloalkane dehalogenase (dhlA) gene, complete cds. ACCESSION M26950 VERSION M26950.1 GI:155347 KEYWORDS haloalkane dehalogenase. SOURCE Xanthotaacter autotrophicus ORGANISM Xanthobacter autotrophicus Bacteria; Proteobacteria; Alphaproteobacteria; Rhizobiales; Xanthobacteraceae; Xanthobacter. REFERENCE 1 (bases 1 to 3041) AUTHORS Janssen,D.B., Pries,F., van der Ploeg,J., Kazemier,B., Terpstra,P. and Witholt,B. TITLE Cloning of 1,2-dichloroethane degradation genes of Xanthobacter autotrophicus GJ10 and expression and sequencing of the dhlA gene JOURNAL J. Bacterid. 171 (12), 6791-6799 (1989) PUBMED 2687254 COMMENT Draft entry and computer readable copy of sequence [1] kindly provided by D.B.Janssen, ll-AUG-1989. Úvod do bioinformatiky, bioinformatické databáze 45/83 Ukázka záznamu v GenBank □ Charakteristiky ■ Popis jednotlivých oblastí genu ■ Promotor, RBS (ribozóm vazebné místo), CDS (kódující sekvence), qene 918..1931 /gene="dhlA" promoter 918..946 /gene="dhlA" /note="putative" promoter 945..974 /gene="dhlA" /note="putative" RBS 986..998 /gene="dhlA" CDS 999 . .1931 /gene="dhlA" /codon start=l /transl table=ll /product="haloalk:ane dehalogenase" /protein id=nAAA88691.1" /db_xref="GI:155348" /translation="MINAIRTPDQRFSNLDQYPFSPNYLDDLPGYPGLRAHYLDEGNS DAEDVFLCLHGEPTWSYLYRKMIPVFAESGARVIAPDFFGFGKSDKPVDEEDYTFEFH RNFLLALIERLDLRWITLVVQDWGGFLGLTLPMADPSRFKRLIIMNACLMTDPVTQPA FSAFVTQPÄDGFTAWKYDLVTPSDLRLDQFMKRWAPTLTEÄEÄSAYAAPFPDTSYQAG Úvod do bioinformatiky, bioinformatické databáze Ukázka záznamu v GenBank □ Charakteristiky FEATURES source gene promoter promoter RES CDS Location/Qualifier5 1. .3041 /organism="Xanthobacter autotrophicus" /mol_type="genomic DNA" /strain="GJ10" /db_xre f="taxon:280" complement(316..924) /note="ORF 1; putative" /codon_start=l /transl table=ll /product="unknown protein" /protein id="AAA88690■1" /db_xref="GI:119 7 0 26" /translation="MSTFFEPEWGMKQNAKTERILDVALELLETEGEFGLTMRQVATQ ADMSLSMVQYYFKSEDLLLVAMADRYFQRCLTTMAEHPPLSAGRDQHAQLRALLRELL GHGLEISEMCRIFREYWAIATRHETVHGYLKSYYRDLAEVMAEKLAPLAS SEKALAVA VS LVIPYVEGYS VTAIAMPESIDTISETLTWWLEQLRISŤJS" 918..1931 /gene="dhlA" 918..946 /gene="dhlA" /note="putative" 945. .974 /gene="dhlA" /note="putative" 986..998 /gene="dhlA" 999..1931 /gene="dhlA" /codon_start=l /transl table=ll /product="haloalkane dehalogenase" /protein id="AAA88691■1" /db_xref="GI:155348" /translation="MINAIRTPDQRFSNLDQYPFSPNYLDDLPGYPGLRAHYLDEGMS DAEDVFLCLHGEPTWSYLYRKMIPVFAESGARVIAPDFFGFGKSDKPVDEEDYTFEFH RNFLLALIERLDLRMITLVVQDWGGFLGLTLPMADPSRFKRLIIMNACLMTDPVTQPA FSAFVTQPADGFTAWKYDLVTPSDLRLDQFMKRWAPTLTEAEASAYAAPFPDTSYQAG VRKFPKMVAQRDQACIDISTEAISEWQNDWMGQTFMAIGMKDKLLGPDVMYPMKALIM GCPEPLEIADAGHFVQEFGEQVAREALKHFAETE"_ Úvod do bioinformatiky, bioinformatické databáze Ukázka záznamu v GenBank □ Sekvence ORIGIN 1 bp upst 1 atgataaatg 61 agccccaact 121 gagggcaatt 181 tacctgtatc 241 gacttttttg 301 tttcaccgca 361 gtcgttcagg 421 ttcaagcgcc 481 tttagcgcct 541 acgccatcag 601 gctgaggcct 661 aagtttccca 721 atttcgttct 781 aaattgctgg 841 cccctcgaaa 901 gaggccctga // ream of BamHI site. caattcgcac acctggacga ctgacgctga gcaagatgat gattcggaaa acttcctgct actggggcgg tgatcatcat ttgtcaccca acctgcgcct ccgcgtatgc agatggtcgc ggcagaacga gaccggacgt tagcggacgc aacactttgc cccggaccaa cctccccggc agacgttttt cccggtattt atccgacaag tgcactaatc atttttgggg gaacgcctgc gcctgcggat tgaccagttc tgcgcctttc gcaacgcgac ctggaatggc catgtatcct tggccatttc cgagacagaa cgcttcagca tacccgggat ctctgccttc gctgaatcag ccagtagacg gaacggcttg ctgaccttac ttgatgaccg ggctttaccg atgaagcgtt cctgacactt caggcctgca cagaccttca atgaaggcgc gtacaggagt tag atctcgatca tgcgggcaca atggcgagcc gcgcacgagt aagaagacta acttgcgcaa cgatggccga acccggtcac cctggaaata gggcgcccac cctatcaggc tcgacatttc tggccattgg tcattaatgg ttggcgagca gtatccgttc ctacctcgac cacctggagt tattgcgcca caccttcgaa cattacgctg cccttcccgc ccagcctgcg cgatctggtt actgaccgaa tggtgtacgc aaccgaagcg catgaaagac ctgcccggaa agtggctcgc Úvod do bioinformatiky, bioinformatické databáze Databáze proteinových sekvencí □ UniProtKB □ nr Protein Database NCBI Úvod do bioinformatiky bioinformatické databáze Databáze proteinových sekvencí □ UniProtKB Spolupráce EBI, Swiss Institute of Bioinformatics a Protein Information Resource Centrální úložiště proteinových sekvencí a funkčních informací Kvalitní anotace - informace o funkci proteinu a jednotlivých aminokyselin, experimentální informace, biologické ontologie, klasifikace, odkazy do dalších databází Indikace kvality anotace (manuální vs. automatická) Úvod do bioinformatiky, bioinformatické databáze Databáze proteinových sekvencí □ UniProtKB/Swiss-Prot ■ Vysoká kvalita manuálních anotací ■ © Manuální anotace - spolehlivé informace ■ © 549.000 sekvencí (2015) UniProtKB Protein knowledgebase UniProtKB/Swiss-Prot Reviewed Manual annotation UniProtKB/TrEMBL U n reviewed . Automatic amotati on □ UniProtKB/TrEMBL ■ Sekvence konceptuálni translací kódujících sekvencí EMBL-Bank © Automatická anotace - nižší kvalita, možnosti chyb © 50.825.000 sekvencí (2015) Úvod do bioinformatiky, bioinformatické databáze Ukázka záznamu v UniProtKB □ Názvy a zdroj proteinu □ Vlastnosti proteinu I Names and origin Hide | Top J Protein names Recommended name: Haloalkane dehalogenase EC=3.8.1.5 Alternative name(s): 1,3,4,6-tetrachloro-l ,4-cyclohexadiene hydrolase 1,4-TCDN chlorohydrolase Gene names Name: linB Organism Pseudomonas paucimobilis (Sphingomonas paucimobilis) Taxonomie identifier 13689 [NCBI] Taxonomie lineage Bacteria > Proteobacteria > Alphaproteobacteria > Sphingomonadales > Sphingomonadaceae > Sphingomonas ■ Protein attributes Hide | Top J Sequence length 296 AA. Sequence status Complete. Sequence processing The displayed sequence is further processed into a mature form. Protein existence Evidence at protein level. Úvod do bioinformatiky, bioinformatické databáze Ukázka záznamu v UniProtKB □ Obecná anotace [ General annotation (Comments) Hide | Top 1 Function Catalyzes hydrolytic cleavage of carbon-halogen bonds in halogenated aliphatic compounds, leading to the formation of the corresponding primary alcohols, halide ions and protons. Has a broad substrate specificity since not only monochloroalkanes (C3 to C10) but also dichloroalkanes (> C3), bromoalkanes, and chlorinated aliphatic alcohols were good substrates. Shows almost no activity with 1,2-dichloroethane, but very high activity with the brominated analog. Is involved in the degradation of the important environmental pollutant gamma-hexachlorocyclohexane (lindane) as it also catalyzes conversion of 1,3,4,6-tetrachloro-1,4-cyclohexadiene (1,4-TCDN) to 2,5-dichloro-2,5-cyclohexadiene-1,4-diol (2,5-DDOL) via the intermediate 2,4,5-trichloro-2,5-cyclohexadiene-1-ol (2,4,5-DNOL). [ hamap mfj31231 ) Catalytic activity 1-haloalkane + H20 - a primary alcohol + halide. C hamap mf_ci23q 1,4-TCDN + 2 H2O " ^,5-DDOL + 2 chloride. Chamap MFJ1231 ) Enzyme regulation Competitively inhibited by the key pollutants 1,2-dichloroethane (1,2-DCE) and 1,2-dichloropropane (1 1 O^PJ [hamap mf_01231 ) Pathway Xenobiotic degradation: gamma-hexachlorocyclohexane degradation. (HAMAF MFJ1231 j Subunit structure M"n"m°r (hamap mf_oi23i ) Subcellular location Periplasm. Q^D Induction Constitutively expressed. tHAMAP mf_oi23ij Miscellaneous Is not N-terminally processed during export, so it may be secreted into the periplasmic space via a hitherto unknown mechanism. (HAMAP MF-°1231) Sequence similarities Belongs to the haloalkane dehalogenase family. Type 2 subfamily. Biophysicochernical properties pH dependence: Optimum pH is 8.2. Chamap mf_qi23i j Úvod do bioinformatiky bioinformatické databáze Ukázka záznamu v UniProtKB □ Ontológie ■ Ontologies Keywords Biological process Detoxification Cellular component Periplasm Molecular function Hydrolase Technical term Gene Ontology (GO) Biological process 3D-sr.ru cture Direct protein sequencing response to toxin Inferred from electronic annotation. Source: UniProtKB-KW Cellular component periplasms space Inferred from electronic annotation. Source: UniProtKEI-SubCell Molecular function Complete GO annotation... haloalkane dehalogenase activity Inferred from electronic annotation. Source: HAMAP Úvod do bioinformatiky, bioinformatické databáze Ukázka záznamu v UniProtKB □ Anotace sekvence Sequence annotation (Features) Feature key Molecule processing r Initiator methionine Position(s) 1 Length 1 Description Removed Graphical view i- Feature identifier r Sites r Chain Active site 2-296 108 295 1 Haloalkane dehalogenase Ni|r|pnnhi|p(HAMAPMF-°1230 PRO_0000216778 ■ Active site 132 1 Prnfnn r|nnnr(.hamapmf_oi23iJ -- ■ Active site 272 1 Pmtnn arreptnrchamapmf_oi23i] -- ■ Binding site 38 1 |-|q|jr|p ( hamap mf_01231 ) -- ■ Natu r Binding site uil variations Natural variant 109 81 1 1 |-|q|jr|p C hamap mf_01231 ) A T in strain: B90. -- ■ Natural variant 112 1 A — V in strain: B90. -- ■ Natural variant 134-135 2 IA - VTin strain: B90. -- ■ ■ Natural variant 138 1 I - L in strain: B90. -- Natural variant 247 1 A — H in strain: B90. -- ■ Natural variant 253 1 M — I in strain: B90. -- Úvod do bioinformatiky, bioinformatické databáze □ Anotace sekvence Natural variations r Natural variant 81 1 A - Tin strain: B90. -- ■ Natural variant 112 _1 A - V in strain: B90. ■ Natural variant 134-135 2 IA - VTin strain: B90. ■ Natural variant 138 1 I - L in strain: B90. ■ Natural variant 247 1 A — H in strain: B90. ■ Natural variant 253 1 M — I in strain: B90. Experimental info r Mutagenesis 38 1 N — D, E, F orQ: Loss of activity.1 1 Mutagenesis 108 1 D - A: Loss of activity. dBB ■ Mutagenesis 108 1 D - N: 58% of wild-type activity. CETJD ■ Mutagenesis 109 1 W — L: Loss of activity. (MD ■ Mutagenesis 132 1 E - Q: Loss of activity. Ofe) ■ Mutagenesis 151 1 F -> L, W or Y: Increase in activity.1 Ref7 ■ Mutagenesis 169 1 F -L: 31% of wild-type activity.1^1 ■ Mutagenesis 244 1 E — Q: 38% of wild-type activity. tRefe) r Mutagenesis 272 1 H - A: Loss of activity.1 ^1 Úvod do bioinformatiky, bioinformatické databáze 56/83 Ukázka záznamu v UniProtKB □ Sekvence Sequences Sequence Length Mass (Da) Tools □ P51698-1 [UniParc]. Last modified January 23, 2007. Version 4. Checksum: 6EEE011B157DBAE1 FASTA 296 33,108 [bÍÍTT 10 20 30 40 50 60 MSLGAKPFGE KKFIEIKGRR HAYIDEGTGD PILFQHGNPT S S YL WRIT I HP HCAGLGRLIA 70 80 90 100 110 120 CDLIGHGDSD KLDPSGPERY AYAEHRDYLD ALWEALDLGD RWLWHDÜG SALGFDWARR 130 140 150 160 170 180 HRERVQGIAY HEAIAHPIEW ADFPEQDRDL FCjAFRSQAGE ELVLQDNVFV ECjVLPGLILR 190 200 2 10 220 230 240 PLSEAEMAAY REPFLAAGEA RRPTLSIJPRQ IPIAGTPADV VAIARDYAGII L5E5PIPELF 250 2 60 270 280 290 INAEPGALTT GRMRDFCRT1J PNQTEITVAG AHFIQEDSPD EIGAAIAAFV RRLRPA Hide go Úvod do bioinformatiky bioinformatické databáze Ukázka záznamu v UniProtKB □ Reference References [1] "Cloning and sequencing of a dehalogenase gene encoding an enzyme with hydrolase activity involved in the degradation of gamma-hexachlorocyclohexane in Pseudomonas paucimobilis." Nagata Y., Nariya T., Ohtomo R., Fukucia M., Yano K., Takagi M J. Bacteriol. 175:6403-6410(1993) [PubMed: 7691794] [Abstract] Cited for: NUCLEOTIDE SEQUENCE [GENOMIC DNA]. PROTEIN SEQUENCE OF 2-16. Strain: UT26. [2] Nagata Y., Nariya T., Ohtomo R., Fukuda M., Yano K., Takagi M Submitted (MAR-1999) to the EMBL/GenBanWDDBJ databases Cited for SEQUENCE REVISION. [3] "Cloning and characterization of lin genes responsible for the degradation of hexachlorocyclohexane isomers by Sphingomonas paucimobilis strain B90." Kumari R., Subudhi S., Suar M., Dhingra G., Raina V., Dogra C, Lai S., van der Meer J.R., Holliger C, Lai R Appl. Environ. Microbiol. 68:6021-6028(2002) [PubMed: 12450824] [Abstract] Cited for NUCLEOTIDE SEQUENCE [GENOMIC DNA]. Strain: B90. [4] "Two different types of dehalogenases, LinA and LinB, involved in gamma-hexachlorocyclohexane degradation in Sphingomonas paucimobilis UT26 are localized in the periplasmic space without molecular processing." Nagata Y., Futamura A., Miyauchi K., Takagi M J. Bacteriol. 181:5409-5413(1999) [PubMed: 10464214] [Abstract] Cited for PROTEIN SEQUENCE OF 2-10. SUBCELLULAR LOCATION. [5] "Purification and characterization of a haloalkane dehalogenase of a new substrate class from a gamma-hexachlorocyclohexane-degrading bacterium, Sphingomonas paucimobilis UT26." Nagata Y., Miyauchi K., Damborsky J., Manova K., Ansorgova A., Takagi M Appl. Environ. Microbiol. 63:3707-3710(1997) [PubMed: 9293022] [Abstract] Cited for CHARACTERIZATION. Strain: UT26. Úvod do bioinformatiky, bioinformatické databáze Databáze proteinových sekvencí □ nr Protein Database ■ Databáze proteinových sekvencí NCBI ■ Kolekce sekvencí získaných konceptuálni translací kódujících oblastí GenBank/EMBL-Bank/DDBJ a dále sekvencí z UniProtKB, PRFa RCSB PDB ■ © většinou automatická anotace - nižší kvalita, možnost chyb ■ © chybí indikace původu anotace ■ © více než 25.000.000 sekvencí (2015) Úvod do bioinformatiky, bioinformatické databáze Formáty sekvencí □ Prostá sekvence DQLTEEQIAEFKEAFS LFDK Úvod do bioinformatiky, bioinformatické databáze Formáty sekvencí □ Prostá sekvence □ GenBank LOCUS DEFINITION AAU03518 237 bp DNA PLN 04-FEB-1995 Aspergillus awarnori internal transcribed spacer 1 (ITS1) and 18S rRNA and 5.8S rRNA genes, partial sequence. U03518 41 a 77 c 67 g 52 t ACCESSION BASE COUNT ORIGIN 1 aacctgcgga aggatcatta ccgagtgcgg gtcctttggg cccaacctcc catccgtgtc 61 tattgtaccc tgttgcttcg gcgggcccgc cgcttgtcgg ccgccggggg ggcgcctctg 121 ccccccgggc ccgtgcccgc cggagacccc aacacgaaca ctgtctgaaa gcgtgcagtc 181 tgagttgatt gaatgcaatc agttaaaact ttcaacaatg gatctcttgg ttccggc // Úvod do bioinformatiky, bioinformatické databáze Formáty sekvencí □ Prostá sekvence □ GenBank □ EMBL ID XX AC XX DE DE XX SQ AÄÜ3518 U03518; standard; DNA; FUN; 237 BP Aspergillus awarnori internal transcribed spacer 1 (ITS1) and 18S rRNA and 5.8S rRNA genes, partial sequence. Sequence 237 BP; 41 A; 77 C; 67 G; 52 T; 0 other; aacctgcgga aggatcatta ccgagtgcgg gtcctttggg cccaacctcc catccgtgtc tattgtaccc tgttgcttcg gcgggcccgc cgcttgtcgg ccgccggggg ggcgcctctg ccccccgggc ccgtgcccgc cggagacccc aacacgaaca ctgtctgaaa gcgtgcagtc tgagttgatt gaatgcaatc agttaaaact ttcaacaatg gatctcttgg ttccggc 60 120 180 237 Úvod do bioinformatiky, bioinformatické databáze Formáty sekvencí □ Prostá sekvence □ GenBank o □ EMBL □ FASTA >giI155348|gb|AAA88691.1| haloalkane dehalogenase i-iINAIRTPDQRFSNLDQYPFSPNYLDDLPGYPGLRÄHYLDEGNSDAEDVF AESGARVIAPDFFGFGKSDKPVDEEDYTFEFHRNFLLALIERLDLRNITL" FKRLIIMNAC LMTD PVTQ PAF SAFVTQ PADGFTAWKYD LVT P S D LRLDQ F PDT S YQAGVRKF PKMVAQRDQACIDISTEAIS FWQNDWNGQT FMAIGMKD: P LEIADAGHFVQE FGE QVAREALKHFAE TE Nejčastěji používaný formát Úvod do bioinformatiky bioinformatické databáze Databáze proteinových struktur -v A. □ Worldwide Protein Data Bank (wwPDB) Světový depositář proteinových struktur, obsahuje rovněž struktury nukleových kyselin a biomolekulárních komplexů ■ Research Collaboratory for Structural Bioinformatics (RCSB PDB), Protein Data Bank Europe (PDBe), Protein Data Bank Japan (PDBj), Biological Magnetic Resonance Data Bank (BioMagResBank) ■ Obsahuje více než 84.000 struktur (2012) ■ Struktury získané rentgenovou krystalografií (88%) a nukleární magnetickou rezonancí (11 %) WORLDWIDE SPDB PROTEIN DATA BANK Databáze genomů □ Entrez Genome □ Ensembl □ Genomes OnLine Database GOLD □ Informace o zdrojovém organizmu □ Nukleotidové a proteinové sekvence □ Geny v kontextu genomu □ Anotace a analýza genomů Úvod do bioinformatiky, bioinformatické databáze Ukázka záznamu v Entrez Genome □ Přehled prokaryotických genomů | Overview [8348] Eukaryotes [2215] | Prokaryotes [14202] j Viruses [3212] Organism/Name BioProject Group SubGroup Size GC% Chromosomes WGS Scaffolds Gene Protein Release Modify Date Status Actinobacte T | — All Actim -r I (Mb) RefSeq INSDC Date [an_ Acaricomes phytoseiuli DSM 14247 PRJNA174970 Actinobacteria Actinobacteria No data Acidimicrobium ferrooxidans DSM 10331 PRJNA59215 PRJNA29525 Actinobacteria Actinobacteria 2.16 68.30 NC_013124.1 CP001631.1 2089 1964 2009/08/18 2012/01/30 Complete Acidothermus cellulolyticus 11 B PRJNA58501 PRJNA16097 Actinobacteria Actinobacteria 2.44 66.90 NC_008578.1 CP000481.1 - - 2217 2157 2006/11/09 2012/01/24 Complete Actinoalloteichus spitiensis RMV-1378 PRJNA76807 Actinobacteria Actinobacteria 5.71 72.40 AG VXD 1 2011/12/20 2012/05/31 Scaffolds or contigs Actinobaculurn sp. oral taxon 183 str. F0552 PRJNA173932 Actinobacteria Actinobacteria No data Actinobaculurn massiliae ACS-171-V-Col2 PRJNA52091 Actinobacteria Actinobacteria SRA or Traces Actinobaculurn schaalii PRJNA52093 Actinobacteria Actinobacteria - - - - - - - - - No data Úvod do bioinformatiky, bioinformatické databáze Ukázka záznamu v Entrez Genome □ Přehled prokaryotických genomů | Overview [8348] Eukaryotes [2215] | Prokaryotes [14202] j Viruses [3212] Organism/Name BioProject Group SubGroup Size GC% Chromosomes WGS Scaffolds Gene Protein Release Modify Date Status Actinobacte T | — All Actim -r I (Mb) RefSeq INSDC Date [an_ Acaricomes phytoseiuli DSM 14247 PRJNA174970 Actinobacteria Actinobacteria No data Acidimicrobium ferrooxidans DSM PRJNA59215 PRJNA29525 Actinobacteria Actinobacteria 2.16 68.30 NC_013124.1 CP001631.1 2089 1964 2009/08/18 2012/01/30 Complete Acidothermus cellulolyticus 11 B PRJNA58501 PRJNA16D97 Actinobacteria Actinobacteria 2.44 66.90 NC_008578.1 CP000481.1 - - 2217 2157 2006/11/09 2012/01/24 Complete Actinoalloteichus spitiensis RMV-1378 PRJNA76807 Actinobacteria Actinobacteria 5.71 72.40 AG VXD 1 2011/12/20 2012/05/31 Scaffolds or contigs Actinobaculurn sp. oral taxon 183 str. F0552 PRJNA173932 Actinobacteria Actinobacteria No data Actinobaculurn massiliae ACS-171-V-Col2 PRJNA52091 Actinobacteria Actinobacteria SRA or Traces Actinobaculurn schaalii PRJNA52093 Actinobacteria Actinobacteria - - - - - - - - - No data Úvod do bioinformatiky, bioinformatické databáze Ukázka záznamu v Entrez Genome □ Informace o genomu Organism Overview; Genome Project Report; Genome Annotation Report Acidothermus cellulolyticus 11B Thermotolerant cellulolytic organism Lineage: Bacteria[3351]; Actinobacteria|547|; Actinobacteria|547]; Actinobacteridae[502]; Actinomycetales[485]; Frankineae[11]; Acidothermaceae[1]; Acidothermus[1]; Acidothermus cellulolyticus[1]; Acidothermus cellulolyticus 11 B[0] Acidothermus cetiuiotyticus strain 11B. This strain (11B; ATCC 43068) is the type strain for the species. The genome sequence from this organism will provide information on the regulation and production of potentially useful enzymes. B Genome Sequencing Projects ♦ Chromosomes [1] * /" Scaffolds or contigs [0] ♦ SRA or Traces [Of] ^ Ho data [1 Organism BioProject Assembly Status Chrs Size (Mb) GC% Gene Protein Acidothermus cellulolyticus 11B PRJNA58501, PRJNA1 6097 ASM1 502V1 o 1 2.44 66.9 2,217 2,157 \±\ Genome Region 1 . aw* +00 K 600 K 300 K j 1 M 1,200 K 1 1,400 K 1 1,600 K 1,800 K |2 M f..... • li 1 1 * * 1 1 ■ ; v i i li i * 4 1** íl ■ 4 4 II 114 t ■ 1 iM*ii lil ni in 14 4 111111*1 1 Go to nucleotide Graphics FASTA GenBank Úvod do bioinformatiky, bioinformatické databáze Ukázka záznamu v Entrez Genome □ Informace o genomu Organism Overview; Genome Project Report; Genome Annotation Report Acidothermus cellulolyticus 11B Thermotolerant cellulolytic organism Lineage: Bacteria[3351]; Actinobacteria[547]; Actinobacteria[547]; Actinobacteridae[502]; Actinomycetales[485]; Frankineae[11]; Acidothermaceae[1]; Acidothermus[1]; Acidothermus cellulolyticus[1]; Acidothermus cellulolyticus 11 B[0] Acidothermus cetiuiotyticus strain 11B. This strain (11B; ATCC 43068) is the type strain for the species. The genome sequence from this organism will provide information on the regulation and production of potentially useful enzymes. B Genome Sequencing Projects ♦ Chromosomes [1] * /" Scaffolds or contigs [0] ♦ SRA or Traces [0] ^ Ho data [1 Organism BioProject Assembly Status Chrs Size (Mb) GC% Gene Protein Acidothermus cellulolyticus 11B PRJNA58501, PRJNA1 6097 ASM1 502v1 o 1 2.44 66.9 2,217 2,157 \±\ Genome Region 1 . aw* +00 K 600 K 300 K [IM 1,200 K I 1,400 K 1 1,600 K 1,800 K 2 M f..... • li 1 1 * * 1 1 ■ ; v i * i íl ■ * 4 1** 4 4 II M M II III Ml IM Ml 4 lllllltlll*! 1 1 1 1 J 1 : = ' \ ■ i Iii * ■* i * li i i •i Go to nucleotide Graphics FASTA GenBank Úvod do bioinformatiky, bioinformatické databáze Ukázka záznamu v Entrez Genome □ Grafické znázornění genomu NC_013209.1 [2,907,495 bases) t I JJš£ Sequence | Q Set Origin | ^ Views & Tools » f Markers loo ■; -r í00 k 300 K 400 k i00 K 500 k 700 K 400 k * • i i : 1,100 k 1,200 k 1,300 k 1,+O0 « 1,300 k 1/00 k 1,700 k 1,(00 k 1,900 k :-,:oo k ■■■■■J1: "■[■■■■■ ■■J." "Ji:i.,.',.,.:ii f.■:l■ ■■ :■:J.1.■. 353,480 : 944,630 [36,151 bases shown, positive strand) LI " 1 ino Sequence __ Flip Strands 1 S_ <=l I© | a* ^ Tools » 860 K SES K 370 K 375 K 380 K 835 K 39C K 8S5 K S00 K 905 K 910 1í 915 K 920 K 925 K i ' 1.........i.........i.........i '...... i.........i.........i' i ' i ' i ' i' .......i '........j.........i.........g.........j.........i < i c rr p lete genome - Sequence NC_013ZD9 1: Acetobacter fTt-i.rn/ - Genps AFA01_08330 Z! YP_pD3187361.lfi __AFA0I_0826C B VP 1003167354.1 IAFA01J38340 AFA01JB53C | |YF C031873E2.1 VF 003167361 t j AFAD1_0839C| YF_0C3167367.il Znie |YF_0C3167373.1 APA01_08540| YF_0031e73e2.il |APA01_0855C jtňMA-Tyr __■ APAČ 1 _C3620 E_BVP_003I873S9.1 AFAO1_O8690 ■ YFJ03167336,1_| APA01 03320 ___■ K! YP_003137409.1 ___■ m APÍD1. .03800 ■_■ APAC1_C8S70_i ^ AFACI1_0B32C1 ___APA01_0835D VP_003137360.I| __|VP_O03167363.1 PA0l_C8250 APA0l_O63GO__| __APA01_034C0 P_0031873531 VP 003137364.1_i __YP_0(J3187368.1 |AFAO1_O8570 IVP_«I3167364.1 _HAFA01_OS650 ___YF_QC3187392.1 |APA0l_03G30 K |VP_003137330.1 K VP 003137407.MJ 1APA01_08750 I VP 003137402. VP_003187414.1__| AFA01_0838C1 YP 003137415.11 fUjA I YP_003137359.1I APA01_OB3701 YP_0031373S5.11 APAC1_C8520| YP_0031S73B0.1I I APA01_08610 IYF0C3187388.1 APATII _n=P71 ■ 003187355.il |AFA01_0630O |YP_003187358.1 APAOl_0645O I ■■T-r'-i VP_003187373.11 VP_D03187383.1| [APAQ1_0B59Q [VP 003187386.1 1APA01 03660 |YF_003187333.1 [APA01_08740 APA0l_C83S0| IYP_0O3187401 1 YP_0CI3187412.11 APAG1_OB810 ___ VF_003187403.1 Q BpurľJ ■ YP 003187404.1 APA YP_O0 APATJ YP 003 Úvod do bioinformatiky, bioinformatické databáze Ukázka záznamu v Ensembl Úvod do bioinformatiky, bioinformatické databáze 15^5246494949^^2838939195857^845454^759^86895^ Ukázka záznamu v GOLD □ Seznam dokončených a probíhajících genomových projektů Complete Published Genome Projects: 1375 Bacterial: 1148 << first < prev 1 2 3 4 5 next > last » 100 - INFORMATION SIZE CHROM # PLASM # GC % SEQUENCING CENTER GENOME DATABASE PUBLICATION Saccharomyces i-srívisiaí 5265: Ferrimonas balearica PAT, DSM 9799 Vulcanisaeta distributa IC-017, DSM 14429 Halomonas elongata DSM 2581 Methanoplanus GC01372 petrolearius SEBR 4347, DSM 11571 Sulfurimonas Gc01373 autotrophica OK10: DSM 16294 Spirochaeta thermophila DSM 6192 Gc01377 Dickeya dadantii 3937 FUNGI-ASCOMYCOTA Taxonomy Entrez PROTEaBACTERIA-GAMMA Taxonomy Entrez GEBA CRENARCHAEQTA-THERMOPROTEI Taxonomy Entrez Isülatiün GEBA PROTEOBACTERIA-GAMMA Taxonomy Entrez EURYARCHAEOTA-M ETHAN 0 MICRO BIA Taxonomy Entrez Isülatiün GEBA P ROTE OB ACTE RIAEPSILON Taxonomy Entrez Isolation SPIROCHAETES Taxonomy Entrez PROTEOBACTERIA-GAMMA Taxonomy Entrez Plant Pathogen Article 4279 Kb 3947 orfs 2374 Kb 2Ž-92 ■jrfs Nip 4061 Kb 3556 orfs MAP 2843 Kb 2651 oris HAP 2153 Kb 2220 orfs NC 014532 NC 014507 Saccharomvces Genome Database DOE Joint Genome Institute DSMZ DOE Joint Genome Institute D5MZ Max-Planck Institute DOE Joint Genome Institute DSMZ DOE Joint Genome Institute DSMZ Goettinqen Genomics Laboratory J. Craig Venter Institute Univ of Wisconsin Univ of Wisconsin Unpublished 2010-09-24 Unpublished 2010-09-22 Environmental Microbiology in press 2010-09-17 Unpublished 2010-09-17 2010-09-15 Unpublished 2010-09-10 LitiLI --■ PROJECT TYPE DISTRIBUTION SEQUENCING STATUS DISTRIBUTION PHYLOGENETIC DISTRIBUTION Úvod do bioinformatiky, bioinformatické databáze Problémy bioinformatických databází □ Vysoká redundance dat □ Chyby v sekvencích □ Chyby a nepřesnosti v anotacích □ Propagace chyb během automatických anotací o Úvod do bioinformatiky bioinformatické databáze Prohledávání databází □ Textové prohledávání □ Sekvenční prohledávání vložení dat NCBI , Entrez, The Life Sciences Search Engine^ PubMed All Databases Human Genome GenBank Map Viewer Search across databases linb J^^^^ Help * Vii4 PubMed: biomedical literature citations and ^ M W abstracts 0 79 PubMed Central: free, full text journal articles 0 none Site Search: NCBI web and FTP sites (?) |none Books: online books none OMIM: online Mendelian Inheritanci none ^Ftl OMIA: Online Mendelian Inheritanc & Nucleotide: sequence database (includes ^ l^J fi GenBank) U |39| W Protein: sequence database (D [4] |J| Genome: whole genome sequences (?) j2 Structure: three-dimensional macromolecular m 1—1 ^ structures fX UniGene: gene-oriented clusters of none * —1 ' seguences |none| ^ CDD: conserved protein domain date |l2| 3D Domains: domains from Entrez |none| UniSTS: markers and mapping data CO) prohledání databáze D 1: ABI93216. Rspore LinE [XüithortiDiii;...Ggi:l 15231795] >gi 1115131755 I 9blABISJil6.il LirE [XjTithav.CT.ij jp. ICHli] MILI^J^HHH-IEIX&IimiIirctTH^ jmFPEQ&TKIOTQMTiS^HmSiI,qi](HirT™ IPIA&TPMWiTrimjyAG^SESPIPKIJIHM^ EICAAIAAFTÍEE Dl: AAR05973. Rspore LinB ßpkiiigomtmi...[gi:37963E83] >gi I 37363683 | gb|AAE05373 .1| LinB [Sphingoíianij piucimobilir] KLĽP3 &pin!VTVAiMiiřmi5iML^^ IPIA&TPilIWAIAIlltfAG^SESPIP]^ EI CAÄIÄÄTUTÜELEPÄ 0 Úvod do bioinformatiky, bioinformatické databáze Textové prohledávání databází □ Entrez □ SRS □ DBGET □ Integrují data z různých databází □ Umožňují prohledání mnoha databází současně □ Umožňují formulaci dotazů pomocí logických operátorů Úvod do bioinformatiky bioinformatické databáze Textové prohledávání databází □ Entrez Vyhledávací systém pro databáze NCBI Integruje data ze 40 různých databází, pouze NCBI o "5 NCBI Entrez, The Life Sciences Search Engine PubMed All Databases r Human Genome GenBank Map Viewer BLAST Search across databases linb Jh^^^j Help 44 PubMec abstracts 79 ^) PubMed Central: free, full text journal articles one ftl Site Search: NCBI web and FTP sites Books: online books (Tl none| OMIM: online Mendelian Inheritance in Man 2) none 4$Fh OMIA: Online Mendelian Inheritance in Animals (Zl Nucleotide: sequence database (includes li^l GenBank) 39 Protein: sequence database [4] ||| Genome: whole genome sequences_ EH UniGene: gene-oriented clusters of transcript sequences CDD: conserved protein domain database 3D Domains: domains from Entrez Structure m m Úvod do bioinformatiky, bioinformatické databáze Textové prohledávání databází □ SRS Vyhledávací systém pro databáze EBI Umožňuje prohledávat i databáze jiných institucí, databáze uživatelů či databáze výsledků vybraných výpočetních nástrojů EMQĽEBI ;j* ;íj j All Databases Enter Text Here rjn Reset © G'Ve us Advanced 3aarcti ^erföffc* Databases Tools EBI Groups Training Industry AboutUs Help Quick Search Library Page Query Form Tools Results Projects Views Sil-: IrdL-í jři Mf Databanks SRS Start a Permanent Project Quick Text Search Search Tips Find : j Nucleotides T| matching : JEnterText Here Úvod do bioinformatiky, bioinformatické databáze Textové prohledávání databází □ DBGET ■ Vyhledávací systém pro databáze LinkDB ■ Umožňuje mj. prohledávat databázi metabolických drah KEGG DBGET Database Links Glycan , UGAND Compound Reaction BRITE SSDB UGAND ■ PMD CnrbBanfc Prosíte MolilDk -\ Pfem Blocks ProDom PRINTS Úvod do bioinformatiky, bioinformatické databáze Ukázka textového prohledávání □ Vyhledávání na základě klíčových slov 1258 152 96 Search across databases rnouse[ORGN] AND kinase AND (exons OR introns] GO Clear Help Result counts displayed in gray indicate one or more terms not found and abstracts 312 PubMed Central: free, full text journal articles S (jjjj Site Search: NCBI web and FTP sites ® ® ® none Books: online books OMIM: online Mendelian Inheritance in Man □ NIA: online Mendelian Inheritance in Animals 152 Nucleotide: Core subset of nucleotide sequence records |~n EST: Expressed Sequence Tag records ^< 1121 \{\* GSS: Genome Survey Sequence records ® w 961 Protein: sequence database none dbGaP: genotype and phenotype ® ® ® ® rrn £^ UniGene: gene-oriented clusters of ^ '—' ' transcript sequences ^ CDD: conserved protein domain database ® g^i 3D Domains: domains from Entrez "V Structure none none Úvod do bioinformatiky bioinformatické databáze Ukázka sekvenčního prohledávání □ Vyhledávání na základě sekvenční podobnosti Sequences producing significant alignments: >pgb|AAT70109.1| CurN [Lyngbya majuscula] Length=341 Score = 303 bits (777), Expect = 8e-81, Method: Composition-based stats. Identities = 148/297 (49%), Positives = 188/297 (63%), Gaps = 8/297 (2%) SEIGTGFPFDPHYVEVLGERMHYVDVGPRDGTPVLFLHGNPTSSYLWRNIIPHV-APSHR 60 I + FPF VEV G + YVD G G PVLFLHGNPTSSYLWRNIIP+V A +R LPISSEFPFAKRTVEVEGATIAYVDEG—SGQPVLFLHGNPTSSYLWRNIIPYVVAAGYR 98 CIAPDLIGMGKSDKPDLDYFFDDHVRYLDAFIEALGLEEVVLVIHDWGSALGFHWAKRNP 120 +APDLIGMG S KPD++Y DHV Y+D FI+ALGL+++VLVIHDWGS +G A+ NP AVAPDLIGMGDSAKPDIEYRLQDHVAYMDGFIDALGLDDMVLVIHDWGSVIGMRHARLNP 158 Query 2 Sbjct 41 Query 61 Sbjct 99 Query 121 Sbjct 159 Query 176 Sbjct 219 Query 236 Sbjct 279 E RVKGIACME FIR PI -+RV +A ME + P -PTWDEWPEFARETFQAFRTADVGRELIIDQWAFIEGVLPK-P+++ F+ RTADVG ++++D N F+E +LP+ 175 VVR L+E EM YR PF R P ++P E+PI GEPA A V WL SP+P KLLFWGTPGVLIPPAEAARLAESLPNCKTVDIGPGLHYLQEDNPDLIGSEIARWLPG 292 KLLF PG L P L+E++PN + +G G H+LQED+P LIG IA WL KLLFHAEPGALAPKPVVDYLSENVPNLEVRFVGAGTHFLQEDHPHLIGQGIADWLRR 335 <>íš •>W -> 17 'P ■>w ->w ->w -T -\} 'P -•p -\} 'P -\} jp 'P 'V 'F 'P 'P splP59336IDHAA RHOSD Haloalkane dehalogenase >pdbllBH6IA Chai. spIP0A3G2IEHAA RHORH Haloalkane dehalogenase >spIP0A3G3IDHAA_. pdhllCQWIA Chain A, Nai Cocrystallised With Haloalkane Dehalo. spIQ9ZERDIDHAA MYC5X Haloalkane dehalogenase >emh ICAA10076.11. crblAAV70825.ll HT2 [Expression vector phT2] reflYP 001675Q30.il alpha/beta hydrolase fold [Shewanella hal. reflYP 734675.11 alpha/beta hydrolase fold [Shewanella sp. HE. reflYP 001473250.il alpha/beta hydrolase fold [Shewanella sed. refISP 01736514.11 alpha/beta hydrolase [Harinohacter sp. ELE. reflYP 738656.11 alpha/beta hydrolase fold [Shewanella sp. HE. reflYP 001502590.il alpha/beta hydrolase fold [Shewanella pea. reflNP 717353.11 hydrolase, alpha/beta hydrolase fold family . reflYP 750057.11 alpha/beta hydrolase fold [Shewanella frigid. reflYP 26SS79.1I hydrolase, alpha/beta hydrolase fold family . reflYP 001761524.il alpha/beta hydrolase fold [Shewanella woo. reflZP 01341154.11 alpha/beta hydrolase fold [Shewanella bait. reflYP S70347.ll alpha/beta hydrolase fold [Shewanella sp. AH. reflYP 129676.11 putative haloalkane dehalogenase [Photobacte. refISP 01221358.11 putative haloalkane dehalogenase [Photohac. reflYP 001365757.11 alpha/beta hydrolase fold [Shewanella hal. reflYP 562379.11 alpha/beta hydrolase fold [Shewanella denier. reflZP 01897865.11 putative haloalkane dehalogenase [Horitell. reflYP 001049934.il alpha/beta hydrolase fold [Shewanella hal. reflYP 943362.11 alpha/beta hydrolase fold [Psychromonas ingrr. reflYP 001182970.il alpha/beta hydrolase fold [Shewanella put. reflYP 001554014.il alpha/beta hydrolase fold [Shewanella hal. reflZP 01706252.11 alpha/beta hydrolase fold [Shewanella putr. reflYP 964030.11 alpha/beta hydrolase fold [Shewanella sp. ¥3. reflYP 510562.11 haloalkane dehalogenase [Jannaschia sp. CCS1. reflZP 01216824.11 hydrolase, alpha/beta hydrolase fold famil. reflYP 001093S40.1I alpha/beta hydrolase fold [Shewanella loi. reflNP 106032.1 haloalkane dehalogenase [Hesorhisobium loti . oh IAAT70109.11 CurH [Lyngbya majuscula] refISP 01055470.11 haloalkane dehalogenase [Eoseobacter sp. H. reflZP 01617455.11 haloalkane dehalogenase [marine gamma prot. refISP 01592200.11 alpha/beta hydrolase fold [Geobacter lovle. refISP 01911259.11 alpha/beta hydrolase [Plesiocystis pacific. reflYP 001230772.11 alpha/beta hydrolase fold rGeobaccer uran. Score ;Eits E Value 429 le-118 424 3e-117 424 4e-117 E 422 le-116 415 le-114 ■_' 3e-86 E 318 3e-85 E 317 5e-85 E 317 Se-85 316 9e-85 E 316 9e-85 E 315 2e-84 E 315 2e-84 E 315 2e-84 E 315 3e-84 E 315 3e-84 314 4e-84 E 314 7e-84 E 313 3e-84 313 9e-84 E 313 9e-84 E 313 le-83 313 le-83 E 313 le-83 E 312 2e-83 E 312 2e-83 E 310 7e-83 310 9e-83 E 308 3e-82 E 307 Se-S2 306 le-81 E 303 8e-81 E 303 8e-81 303 le-80 302 2e-80 300 7e-80 300 9e-80 300 9e-80 E Úvod do bioinformatiky, bioinformatické databáze Problémy prohledávání databází □ Textové vyhledávání ■ © chybné, nepřesné či obecné anotace ■ © synonyma ■ © velký počet falešně pozitivních a falešně negativních výsledků □ Sekvenční vyhledávání ■ © podmínka evoluční příbuznosti ■ © větší nároky na uživatele ■ © potenciálně falešně pozitivní i falešně negativní výsledky □ Vhodné je oba přístupy kombinovat Úvod do bioinformatiky, bioinformatické databáze Reference □ Claverie, J-M., & Notredame, C. (2006) Bioinformatics for Dummies (2nd ed.) Wiley Publishing, Hoboken, p. 436. □ Xiong, J. (2006) Essential Bioinformatics, Cambridge University Press, New York, p. 352. □ ENTREZ tutorial: http://www.ncbi.nlm.nih.gov/Entrez/tutor.html □ SRS documentation: http://srs.ebi.ac.uk/srs/doc/index.html □ NCBI handbook: http://www.ncbi.nlm.nih.gov/books/NBK21101/ □ UniProtKB manual: http://www.uniprot.org/manual/ □ NCBI: http://www.ncbi.nlm.nih.gov/ □ EBI: http://www.ebi.ac.uk/ □ Pubmed: http://www.ncbi.nlm.nih.gov/pubmed □ Web of Science: http://apps.isiknowledge.com Üvod do bioinformatiky, bioinformaticke databäze Reference □ GenBank: http://www.ncbi.nlm.nih.gov/genbank/ □ EMBL-EBI: http://www.ebi.ac.uk/embl/ □ DDBJ: http://www.ddbj.nig.ac.jp/ □ UniProt: http://www.uniprot.org/ □ nrdb: http://www.ncbi.nlm.nih.gov/protein/ □ wwPDB: http://www.wwpdb.org/ □ Entrez Genome: http://www.ncbi.nlm.nih.gov/genome □ Ensembl: http://www.ensembl.org □ GOLD: http://www.genomesonline.org/ □ Entrez: http://www.ncbi.nIm.nih.gov/sites/gquery □ SRS: http://srs.ebi.ac.uk □ DBGET: http://www.genome.ip/dbget/ Strukturní biologie Bi9410+9410c ■ Období: podzim ■ Rozsah: přednáška 2 hodiny/týden, cvičení 2 hodiny/týden ■ Vyučující: Mgr. Jan Brezovský, Ph.D. ■ Osnova: ■ struktura, stabilita a dynamika biologických makromolekul ■ makromolekulami interakce a komplexy ■ stanovení a předpověď struktury, identifikace důležitých oblastí ■ stanovení vlivu mutace na strukturu a funkci proteinu ■ aplikace v biologickém výzkumu, návrhu léčiv a biokatalyzátorů Úvod do bioinformatiky, bioinformatické databáze Proteinové inženýrství BÍ7410 Období: jaro Rozsah: přednáška 1 hodina/týden Vyučující: Mgr. Radka Chaloupková, Ph.D. Osnova: strukturně-funkční vztahy proteinů metody exprese a purifikace rekombinantních proteinů metody strukturní a funkční analýzy proteinů racionální design, semi-racionální design a řízená evoluce příklady využití proteinového inženýrství Úvod do bioinformatiky, bioinformatické databáze Molekulární biotechnologie Bi7 Období: podzim (každoročně) Rozsah: přednáška 2 hodiny/týden, cvičení 2 hodiny/týden Přednášky: Doc. Prokop, Dr. Dvořák, Dr. Bidmanová Cvičení: Dr. Bidmanová, Dr. Beerens, Dr. Štěpánková, Mgr. Buryška, Mgr. Chrást Osnova: ■ proteinové a metabolické inženýrství ■ molekulární diagnostika a moderní vakcíny ■ buněčná a genová terapie a regenerativní medicína ■ molekulární biotechnologie v průmyslu a zemědělství m •) i t )) 1» íl 11 íi:; uiiii • T • • 10 11 12 li II II Ulili Úvod do bioinformatiky, bioinformatické databáze logické exkurze BÍ616 ■ Období: jaro ■ Rozsah: 4 dvou až pětihodinové exkurze ■ Vyučující: Mgr. Šárka Bidmanová, Ph.D. ■ Exkurze: - Pivovar Starobrno - http://www.starobrno.cz/ - Erba Lachema - https://www.erbalachema.com/ - Čistírna odpadních vod - http://www.vodarenska.cz/ - Kompostárna - http://www.kompostarna-blansko.cz/ Biotechnologické exkurze BÍ717] ■ Období: podzim ■ Rozsah: 4 jednodenní exkurze (8.2.-11.2.2015) ■ Vyučující: Mgr. Šárka Bidmanová, Ph.D. ■ Exkurze: - Biotechnologické centrum INBIT - www.jic.cz/inbit - Bioveta - www.bioveta.cz - BioVendor-www.biovendor.cz - Contipro Group - www.contipro.com