BIOINFORMATIKA V PRAXI – ZÁVĚREČNÝ TEST JARO 2011 Jméno a příjmení: Datum: UČO: Varianta: D Studijní obor: MATERIÁLY A POMŮCKY Při vypracování testu jsou povoleny jakékoliv vlastní materiály a pomůcky, zejména dříve vypracované protokoly a internetové stránky. Zakázána je komunikace s dalšími osobami (osobní, telefonem, elektronická,...), vyjma zkoušejících a dozoru při testu. OTÁZKA 1 Analyzujte část genomu Listeria monocytogenes. Identifikujte potenciální geny (uveďte čtecí rámec a délku potenciálního genu) a určete, které proteiny mohou být těmito geny kódovány. Sekvence TGCCAGGAATGAACGCTAAAAGATGGGTTGCACTAGGGATTGTTTTTGCACTTTTGATAGTTAGTGCGTTAGCAAAGTTTACTTCAAGTCAAATCGCTT CAACGGAAGAGAGTAGTCCGACATTTGTCGAAAGTCTATTCGCGGATACCGGCGAACTAACCGAAACAGTAATTGAAGAAGGTGGGGATGATACAATTG CTGTATTATCTGTAGATGGTACTATTCAAGATACGGGAGATTCTGGTTCTTTACTTGGAGGCGGGGGCTATGATCATTCATTTTTCATGCAACAATTAG AACAAGTGAGAAATGATGACTATATCCAAGGTGTGCTGCTGTATGTTAATTCACCAGGTGGCGGTGTTATGGAGTCCGCGCAAATTCGTGATAAAATTC TACAAATTCAAAAAGAACGCAATATTCCATTCTATGTTTCCATGGGGAGTATGGCAGCATCAGGTGGATATTATATTTCCGCACCAGCCGACAAAATTT TTGCAAGTAAAGAAACATTGACTGGTTCACTTGGGGTTATTATGCAAGGGTATGACTATAGTGAACTCATGAAAAAATTAGGTGTTTCAGATAATACCA TTAAAAGCGGCGAATATAAAGACATTATGAGCGGGACAAGACCAATGACGGAAGACGAGAAGAAAATTATGCAGTCAATGATTGATGATTCTTACAATG AGTTCGTTAAAGTCGTTGCAAAAGGCCGTGGAATGTCCGCAGAAAAAGTACGTAAAATTGCAGATGGACGCATATACGACGGCCGCCAAGCAAAAGAGA ACGGGTTGATTGATGAGTTTGGTTATCAAGAAGATGCCCTAGAAGCTTTGAAAAAAGAACAGGGGTTAGCTGATGCGACAGTCATTCAATATGATGCAC CAGAAGACTTTAGCTCGTTATTCTCTGTAGCTGCACAAAAAATCTCTGGTCAAAATGCAGATATTTCCCAACTAATCAAATTAACTGGCACACTTAAAG CGCCAAGAATGATGTATTTATATGGAGAATAATTTGCGACGTGCATGCGTC OTÁZKA 2 Proveďte multiple alignment následujících sekvencí a přiložte jeho výstup. Určete 2 navzájem nejpodobnější sekvence. Sekvence 1 mespvrlsllyvvlaslllpgrsvfinrerannvlqrirransffeeikkgnlerecveeicsfeearevfednekttefwnkyedgdqcesspcqnqg ecrdglgsytctctegfegkncelfvrklcsldngdcdqfcreeqnsvvcscakgyflgndgksclstapfpcgktnkgrakrsvalntsnsepdpedl mpdadilyptespsellnlnktepeansddvirivggqeckrgecpwqallfsdeetdgfcggtilnefyiltaahclhqakrfkvrvgdlnteqedgg emvhevdmiikhnkfqrdtydfdiamlrlktpitfrenvapaclpqkdwaeatlmtqktgivsgfgrthekgrqskvlkmmevpyvdrntcrlstsfsi tqnmfcagydakqedacqgdsggphvtrfkdtyfvtgivswgegcarkgkygiytkvtaflkwidrsmkarvgptsetprlthppy Sekvence 2 mahvrglqlpgclalaalcslvhsqhvflapqqarsllqrvrrantfleevrkgnlerecveetcsyeeafealesstatdvfwakytacetartprdk laaclegncaeglgtnyrghvnitrsgiecqlwrsryphkpeinstthpgadlqenfcrnpdssttgpwcyttdptvrrqecsipvcgqdqvtvamtpr segssvnlsppleqcvpdrgqqyqgrlavtthglpclawasaqakalskhqdfnsavqlvenfcrnpdgdeegvwcyvagkpgdfgycdlnyceeavee etgdgldedsdraiegrtatseyqtffnprtfgsgeadcglrplfekksledkterellesyidgrivegsdaeigmspwqvmlfrkspqellcgasli sdrwvltaahcllyppwdknftendllvrigkhsrtryerniekismlekiyihprynwrenldrdialmklkkpvafsdyihpvclpdretaasllqa gykgrvtgwgnlketwtanvgkgqpsvlqvvnlpiverpvckdstriritdnmfcagklqa Sekvence 3 ivggkdcpkgecpwqvlllvngaqlcggtlintiwvvsaahcfdkiknwrnliavlgehdlsehdgdeqsrrvaqviipstyvpgttnhdiallrlhqp vvltdhvvplclpertfsertlafvrfslvsgwgqlldrgatalvlqvlnvprlmtqdclqqsrkvgdspniteymfcagysdgskdsckgdsggphat hyrgtwyltgivswgqgcatvghfgvytrvsqyiewlqklmrseprpgvllrapfp Sekvence 4 mtassttlaqaaealeahrleeahglvraalaahphdaeawrllgcvaraggkaeeaeqafrraiqlaprhalahadlcgllsdldrageaialldraa ashnqpaqnppvwtlslkaatwmaerrphdalpalealvrqaphapvpwinlaealqalghldravgayrhalaidpycapawlglanlrvirlepadv aviktalgratsdlarvqlgyalgkalgdqaayeesfrhferanalrgaltphdpqaldhfaqameriapapsresgrdgpifivgmprsgstlveqil achpqvealgelfelqatakriesapealpaaisrltaeesarfgdhylrsiqryrrtgrpfftdkmpanwqlvplirqilpnarivdvrrdpapccls afmtyfnrrtpfpanlpdltryydtcrglmdamrrahpahvhllryealiaqpkgevrrlldflrldfdpaclrphdsarpiftpsaqqvrkpmgnkgf egwrnyerwfrhanga OTÁZKA 3 Určete teoretický isoelektrický bod a extinční koeficient následujícího proteinu (předpokládejte, že všechny cysteiny tvoří disulfidické můstky). Nezapomeňte uvést jednotky!: Protein MHPGLWLLLVTLCLTEELAAAGEKSYGKPCGGQDCSGSCQCFPEKGARGRPGPIGIQGPTGPQGFTGSTG LSGLKGERGFPGLLGPYGPKGDKGPMGVPGFLGINGIPGHPGQPGPRGPPGLDGCNGTQGAVGFPGPDGY PGLLGPPGLPGQKGSKGDPVLAPGSFKGMKGDPGLPGLDGITGPQGAPGFPGAVGPAGPPGLQGPPGPPG PLGPDGNMGLGFQGEKGVKGDVGLPGPAGPPPSTGELEFMGFPKGKKGSKGEPGPKGFPGISGPPGFPGL GTTGEKGEKGEKGIPGLPGPRGPMGSEGVQGPPGQQGKKGTLGFPGLNGFQGIEGQKGDIGLPGPDVFID IDGAVISGNPGDPGVPGLPGLKGDEGIQGLRGPSGVPGLPALSGVPGALGPQGFPGLKGDQGNPGRTTIG AAGLPGRDGLPGPPGPPGPPSPEFETETLHNKESGFPGLRGEQGPKGNLGLKGIKGDSGFCACDGGVPNT GPPGEPGPPGPWGLIGLPGLKGARGDRGSGGAQGPAGAPGLVGPLGPSGPKGKKGEPILSTIQGMPGDRG DSGSQGFRGVIGEPGKDGVPGLPGLPGLPGDGGQGFPGEKGLPGLPGEKGHPGPPGLPGNGLPGLPGPRG LPGDKGKDGLPGQQGLPGSKGITLPCIIPGSYGPSGFPGTPGFPGPKGSRGLPGTPGQPGSSGSKGEPGS PGLVHLPELPGFPGPRGEKGLPGFPGLPGKDGLPGMIGSPGLPGSKGATGDIFGAENGAPGEQGLQGLTG HKGFLGDSGLPGLKGVHGKPGLLGPKGERGSPGTPGQVGQPGTPGSSGPYGIKGKSGLPGAPGFPGISGH PGKKGTRGKKGPPGSIVKKGLPGLKGLPGNPGLVGLKGSPGSPGVAGLPALSGPKGEKGSVGFVGFPGIP GLPGISGTRGLKGIPGSTGKMGPSGRAGTPGEKGDRGNPGPVGIPSPRRPMSNLWLKGDKGSQGSAGSNG FPGPRGDKGEAGRPGPPGLPGAPGLPGIIKGVSGKPGPPGFMGIRGLPGLKGSSGITGFPGMPGESGSQG IRGSPGLPGASGLPGLKGDNGQTVEISGSPGPKGQPGESGFKGTKGRDGLIGNIGFPGNKGEDGKVGVSG DVGLPGAPGFPGVAGMRGEPGLPGSSGHQGAIGPLGSPGLIGPKGFPGFPGLHGLNGLPGTKGTHGTPGP SITGVPGPAGLPGPKGEKGYPGIGIGAPGKPGLRGQKGDRGFPGLQGPAGLPGAPGISLPSLIAGQPGDP GRPGLDGERGRPGPAGPPGPPGPSSNQGDTGDPGFPGIPGFSGLPGELGLKGMRGEPGFMGTPGKVGPPG DPGFPGMKGKAGARGSSGLQGDPGQTPTAEAVQVPPGPLGLPGIDGIPGLTGDPGAQGPVGLQGSKGLPG IPGKDGPSGLPGPPGALGDPGLPGLQGPPGFEGAPGQQGPFGMPGMPGQSMRVGYTLVKHSQSEQVPPCP IGMSQLWVGYSLLFVEGQEKAHNQDLGFAGSCLPRFSTMPFIYCNINEVCHYARRNDKSYWLSTTAPIPM MPVSQTQIPQYISRCSVCEAPSQAIAVHSQDITIPQCPLGWRSLWIGYSFLMHTAAGAEGGGQSLVSPGS CLEDFRATPFIECSGARGTCHYFANKYSFWLTTVEERQQFGELPVSETLKAGQLHTRVSRCQVCMKSL Nepovinná otázka za bonusové body: Mohli byste protein z předcházející úlohy beze strachu ochutnat? (Předpokládá se, že máte pud sebez áchovy...) Odpověď zdůvodněte. OTÁZKA 4 Identifikujte v následující sekvenci štěpící místo pro daný restrikční enzym a navrhněte jiný enzym, který toto místo rovněž rozpoznává. Enzym: Eag I Sekvence: atggcctacaggacggccatcgactcagtattgtcagcaacatcctcaattcaccatcacacaaacgcagctacagccgtcgtgtataacaagcttgca agaacagccatgcacttcaactccgtctttagcgtccttttgtcctgtggcctcgcagcagcacacatgcagatgagctggccttatcccatacgcagt ccacttgaccctcagaacagaggatccgacaaggactatgacatggccaaccccctcagcccgtctggctccgactttccttgcaagggctaccacaag aacactccctggcgcgcaacggcggaatacaacgGcCgggcgagtcatataacatgacggtggccggtgctgcaacacacagtggaggatcatgccagc tgtctctgagttacgacgatgggaaaaccttcaaagtcatcaagtccaaggtgggagggtgcccgcttgatttcaagtacgacttcacgatgccgagcg atgtggtcaacggccatgctctgtttgcttggtcctggtttaatctagtgggcaatcgtgagatgtacatgaactgcgcaaacgttgaggtgagcggag ggagcggcagcaagcaatcgtttgaaaacaattacccggatatgttcgtggccaatgttggaaatggctgttctacggtggaagggaagcatacggtgt ttgcccatccgggaaagcaggttacctatgccggtgggcttgatgcgtcctcacctccattccccaactgctcttgaaatcacaaccaatgaatgttac acacttttgtacgtgatacacattgtgagtatcggcaaggcagggccatactgaactctggctgttgagtgaaataaggatcagttgatcgggatatac atagtacaaatcggttcacatatggcctacaggacggccatcgactcagtattgtcagcaacatcctcaattcaccatcacacaaacgcagctacagcc gtcgtgtataacaagcttgcaagaacagccatgcacttcaactccgtctttagcgtccttttgtcctgtggcctcgcagcagcacacatgcagatgagc tggccttatcccatacgcagtccacttgaccctcagaacagaggatccgacaaggactatgacatggccaaccccctcagcccgtctggctccgacttt ccttgcaagggctaccacaagaacactccctggcgcgcaacggcggaatacaacgcgggcgagtcatataacatgacggtggccggtgctgcaacacac agtggaggatcatgccagctgtctctgagttacgacgatgggaaaaccttcaaagtcatcaagtccaaggtgggagggtgcccgcttgatttcaagtac gacttcacgatgccgagcgatgtggtcaacggccatgctctgtttgcttggtcctggtttaatctagtgggcaatcgtgagatgtacatgaactgcgca aacgttgaggtgagcggagggagcggcagcaagcaatcgtttgaaaacaattacccggatatgttcgtggccaatgttggaaatggctgttctacggtg gaagggaagcatacggtgtttgcccatccgggaaagcaggttacctatgccggtgggcttgatgcgtcctcacctccattccccaactgctcttgaaat cacaaccaatgaatgttacacacttttgtacgtgatacacattgtgagtatcggcaaggcagggccatactgaactctggctgttgagtgaaataagga tcagttgatcgggatatacatagtacaaatcggttcacat Enzym rozpoznávající stejné místo: OTÁZKA 5 Uveďte základní charakteristiku následujících primerů. Primer L R Sekvence cagtggaggatcatgccagc aggccatcagttgatcgggatata Délka T[m] GC [%] Dimer (obr.) Vlásenka (obr.) OTÁZKA 6 Predikujte lokalizaci následujících proteinů z Candida albicans v buňce. Ke každému proteinu uveďte pouze jednu (NEJPRAVDĚPODOBNĚJŠÍ) možnost. Protein 1 MRQFQIILISLVVSIIRCVVADVDITSPKSGETFSGSSGSASIKITWDDSDDSDSPKSLDNAKGYTISLC TGPTSDGDIQCLDPLVKNEAIAGKSKTVSIPQNSVPNGYYYFQIYVTFTNGGTTIHYSPRFKLTGMSGPT ATLDVTETGSVPADQASGFDTATTADSKSFTVPYTLQTGKTRYAPMQMQPGTKVTATTWSMKFPTSAVTY YSTKAGTPNVASTITPGWSYTAESAVNYASVAPYPTYWYPASERVSKATISAATKRRRWLD Protein 2 MAIKIGINGFGRIGRLVLRVALGRKDIEVVAVNDPFIAPDYAAYMFKYDSTHGRYKGEVTASGDDLVIDG HKIKVFQERDPANIPWGKSGVDYVIESTGVFTKLEGAQKHIDAGAKKVIITAPSADAPMFVVGVNEDKYT PDLKIISNASCTTNCLAPLAKVVNDTFGIEEGLMTTVHSITATQKTVDGPSHKDWRGGRTASGNIIPSST GAAKAVGKVIPELNGKLTGMSLRVPTTDVSVVDLTVRLKKAASYEEIAQAIKKASEGPLKGVLGYTEDAV VSTDFLGSSYSSIFDEKAGILLSPTFVKLISWYDNEYGYSTRVVDLLEHVAKASA