Predikce genů „Syrové“ sekvence DNA Identifikace a anotace genů a proteinů Gen ATG STOP 5´ 3´ Gen 5´ ATG STOP Met DNA RNA Protein Gen 5´ ATG STOP Met DNA RNA Protein Predikce genů kódujících proteiny •Prokaryotické geny • Nepřerušované úseky DNA mezi startovním kodonem (ATG, GTG, TTG, CTG) a stop kodonem (TAA, TGA, TAG). • •Úsek kóduje protein, který je podobný již dříve popsanému proteinu (prohledávání DATABÁZÍ pomocí ALIGNMENTU). • Překlad DNA sekvence •ExPASy http://www.expasy.org/tools/dna.html • •ORF Finder (NCBI) • http://www.ncbi.nlm.nih.gov/gorf/gorf.html Překlad DNA sekvence Překlad DNA sekvence ATG STOP ATG TCG CAT GCC STOP Met Ser His Ala Met N-konec C-konec NH2 COOH ATG TCG CAT GCC Met Ser His Ala ATGTCGCATGCC A TGT CGC ATG CC Cys Arg Met AT GTC GCA TGC C Val Ala Cys Čtení tripletů závisí na tom, u kterého nukleotidu stanovíme počátek čtení. ATGCGCAGGAATGCATAG Met Arg Arg Asn Ala Stop ATGCGCAGGAATGCATAG sekvence DNA Protein 1 Met His ? Protein 2 Překlad DNA sekvence – reverzní čtecí rámce 5´ ATGCGCAGGAATGCATAG 3´ 3´ TACGCGTCCTTACGTATC 5´ A-T G-C Překlad DNA sekvence – od 5´konce 5´ ATGCGCAGGAATGCATAG 3´ 5´ CTATGCATTCCTGCGCAT 3´ Opravdu ORF kóduje protein? •ORF kóduje protein, který je podobný již dříve popsanému proteinu (prohledávání DATABÁZÍ pomocí ALIGNMENTU) = nejspolehlivější ověření. • •Nástroje pro překlad DNA jsou propojeny s prohledáváním databází. •