BIOINFORMATIKA V PRAXI – ZÁVĚREČNÝ TEST JARO 2014 Jméno a příjmení: Datum: UČO: Varianta: A Studijní obor: MATERIÁLY A POMŮCKY Při vypracování testu jsou povoleny jakékoliv vlastní materiály a pomůcky, zejména dříve vypracované protokoly a internetové stránky. Zakázána je komunikace s dalšími osobami (osobní, telefonem, elektronická,...), vyjma zkoušejících a dozoru při testu. OTÁZKA 1 Analyzujte část genomu Pseudomonas aeruginosa. Identifikujte potenciální geny (uveďte ty nejpravděpodobnější, rovněž uveďte čtecí rámec a délku potenciálního genu) a určete, které proteiny mohou být těmito geny kódovány. CGTGCATGGGACATTCTGTTGCAGGCGTCTGCCTGGAAGAACCCGCGGTACTGACCGCCTTTCCGTCGCTGCTGCACCCGCAGGACCCGCCGCAACAGA GGGACCGAATACTCTTCGTCACCGCCGAGCTCAGCGACTTCGTCAAGGTCGGCGGGCTCGGCGACTTTTCCGCCGCCCTGCCCCGGGTGCTCAGGCGCC AGCATGCGGTACGGGTCCTGCTGCCCGGCTACCGCCAGGTGCTGGAGCGCTGCAGTGACCTGCGAATCCTCGGCAGCCTGCCGGGCCGCGCGGCGATCC CGCCGTGCGAGATCGGCCTGGTGACCCTCGACGACGGCCTGGAGGTGATGCTGGTGCTCTGCCCGTTGCTCTACGAGCGCGAGGGCACCCCCTACATGG ACGACCAGGGCAACGACTGGGCTGACAACCACCTGCGCTTCGCCCGCCTCTGCCTGGCCGCCGCCGAGATCGCCGGCGGTCACGGCGCCCAGGGCTGGC AGCCGGGCCTGGTGCACGCCAACGACTGGCCGTCGGCGCTGACCCCGGCCTACATGGCCTGGAACGGTGTGCGCACGCCGAGCCTGTTCACCATCCACA ACCTCGCCTACCAGGGCCTCTGCGACCTGCAGTGCAGCGCCGAACTGGGCCTGCCCGACGAAGCGCTCAGCCCCGAGAGCATGGAGTTCCACGGGCGCC TGTCGTTCCTCAAGGCGGGCATCGCCCATGCCCATCACATCACCACGGTGAGCGAGACCTACGCGCAGGAGATCACCACCCCGGAATACGGCTGCGGCC TGCACGGCATCCTCAAGTGCAAGGTCGAGAAGCGCCAGCTCAGCGGCATCGTCAACGGTATCGATGACAGCTGGCAGCCGCATTGCGATCCGCACCTGG TGGCCGGCTTCAGCGCCCGCCAATGGGCCGGCAAGCGCGCCAACACACGCTATGTCGAGGAGCGTTTCGGCCTCGAGCCGGGCAAGGGGCCGCTGTTCG CGGTGGTCTCGCGGCTGGTGCAGCAAAAGGGTATCGACCTGACCCTGGAGATCAGCGACGCCCTGCTCCAGGCCGGTGGCCGGCTGGTCAGCATCGGGC GCGGTGAACCGTCGCTGGAGAAGGCCATGCTCGATCTCTCGCGGCGTCATCCGGGCCAGGTCGGCGTGCACATCGGCTTCGACGAGACCGACGCGCGGC GCATCTATGCCGGCAGCGACTTCCTGCTCATGCCATCGCGCTACGAGCCTTGCGGCCTGAGCCAGCTCTACGCGCAATGCTTCGGCTCGCTGCCGATCG CCCGTTGCACCGGCGGGCTCGCCGACACCATCGTCGACGGCGTCACCGGCTTCCTGTTCCGCGAGGAAACCGCGCAGAGCTATCTGGATGCGGTGCTGC GCGCGATCAACGTCTACCATTGCCCCGCTCTGCTCAATGCCATGCGCTGCAAGGCGATGGCCGCGCCGATGTTCTGGCGCGACTCGGTGGAACCCTACA ACCGCCTCTACCGGCGCCTGCTGAGGAATACCGCGCCGGCCTGGCGCGGGGTGCGCCCGTGA OTÁZKA 2 Pomocí programu ClustalW2 proveďte multiple alignment následujících sekvencí a přiložte jeho výstup. Určete 2 navzájem nejpodobnější sekvence. Sekvence 1 KCRIIREFPDIVFKGLTLVQVSQKFGKAGFEDVKKVTEEIVHLNEDCCKGDAVECMMERMEATDHICEAK DKLSSKLADCCAKSILERTPCLLALPNDESDLSKELKNYYEDERVCENYKKDKLLFLAHFTHDYARSHQE SSPQSCLRVSKGFEGLLEKCCASENHAECLKQAPILLEAALKEIEELRKQNCGALQLLGFRDYNIQLLFR YFFKMPQVTAPTLVELAGRMTKVAVYCCGLAENKQQTCAEEKLDILLGEMCEKEKHTFVNDNVRHCCVDS YANRRKCFTDLQRYPNYVAPKWDESKLHFNEDLCKGSEDDQIKKKLEVLVEYMKMKPDCGPEKLKEVVEA FRKIDIKCCAAEDHQKCFDDEKAGLLQIIEAH Sekvence 2 MMSSKIQPAVPKKSKKSSKQEELICKTKIKGDGQDERVKEKAVQSRLFTNNDTVRAKFTFIDLFAGIGGF RIAMQNLGGECVFSSEWDEKAKQTYEANFGEVPFGDITLEETKQCIPEQFDVLCAGFPCQAFSIAGRRGG FEDTRGTLFFDVAEIIRRHRPKAFFLENVKGLTNHDRGRTLQTILNTLREDLGYFVPEPEIVNAKDFGVP QNRERIFIVGFRGDTDIKYFEYPEPTGIQTAFRDIREKDTVPTKYYLSTQYIDTLRKHKQRHEEKGNGFG YEIISDDGIANAIVVGGMGRERNLVIDKRITDFTPTTNIKGEVNREGIRKMTPREWARLQGFPETFKIPV ADASAYKQFGNSVAVPAVQAVAGQVLIRLGWRDA Sekvence 3 MEDAKNIKKGPAPFYPLEDGTAGEQLHKAMKRYALVPGTIAFTDAHIEVNITYAEYFEMSVRLAEAMKRY GLNTNHRIVVCSENSLQFFMPVLGALFIGVAVAPANDIYNERELLNSMNISQPTVVFVSKKGLQKILNVQ KKLPIIQKIIIMDSKTDYQGFQSMYTFVTSHLPPGFNEYDFVPESFDRDKTIALIMNSSGSTGLPKGVAL PHRTACVRFSHARDPIFGNQIIPDTAILSVVPFHHGFGMFTTLGYLICGFRVVLMYRFEEELFLRSLQDY KIQSALLVPTLFSFFAKSTLIDKYDLSNLHEIASGGAPLSKEVGEAVAKRFHLPGIRQGYGLTETTSAIL ITPEGDDKPGAVGKVVPFFEAKVVDLDTGKTLGVNQRGELCVRGPMIMSGYVNNPEATNALIDKDGWLHS GDIAYWDEDEHFFIVDRLKSLIKYKGYQVAPAELESILLQHPNIFDAGVAGLPDDDAGELPAAVVVLEHG KTMTEKEIVDYVASQVTTAKKLRGGVVFVDEVPKGLTGKLDARKIREILIKAKKGGKSKL Sekvence 4 KWEKHSCGFLKSFGERAFQANKLVQLSQKFPKAPFEEIHKVVLTATKLQKECCHGDMIECLDDRVEVMAY ICSKQAVFSSKIKDCCEKPIVDREVCILQADLDEKPADLPSIAGQYIESTEVCKHYEEGKDVFLAHFVYE YSRRHPEFSSQMLLRTGKGYQDTLDKCCKTENPPECYGKAGEELARHIQESQEILKTHCSFYTSQGKDPF QKMVLVRYTKKMPQLPAEELIEISKKLTGVGVKCCPLSEDKRLSCSEKHLSMVLFEICRQHEASPVNNHV THCCTDSYSEMRPCFTKLGVDDSYVPPEFCPSTFLFDEQLCTAPEEARLKKQLTFLVKLIQLKPQIEDEQ LKKLVTDYHAMEEKCCQAENKQECFSTEGEKLTQEGKALLGVQLNVPGLQ OTÁZKA 3 Určete teoretický isoelektrický bod a extinční koeficient následujícího proteinu (předpokládejte, že žádný cystein netvoří disulfidické můstky). Nezapomeňte uvést jednotky!: MVHLTPEEKSAVTALWGKVNVDEVGGEALGRLLVVYPWTQRFFESFGDLSTPDAVMGNPKVKAHGKKVLGAFSDGLAHLDNLKGTFATLSELHCDKLHV DPENFRLLGNVLVCVLAHHFGKEFTPPVQAAYQKVVAGVANALAHKYH Nepovinná otázka za bonusové body (uplatitelné u kolokvia): Mohli byste protein z předcházející úlohy beze strachu ochutnat? (Předpokládá se, že máte pud sebez áchovy...) Odpověď zdůvodněte. OTÁZKA 4 Identifikujte a vyznačte v následující sekvenci štěpící místo pro daný restrikční enzym a navrhněte jiný enzym, který toto místo rovněž rozpoznává a štěpí stejným způsobem. Enzym: Xma I Sekvence: GCCGCCGCCCATCAGCTGAGACCGGCTGCGCCAGGCAGTGGGCCCCAGGGTGACAGCGGCTGGAGGTGGC CGAGGAAGCCGGCGAGGTCAGGGTAAGAGGAGACTGCAGAGGCGGGGGAGAGGGGGGCGGGAGGGACACC TCAGAACTGCAGCTCGCTAGTGGTTGCTTTGGGGTGCGCAGAGCGGGGCTCCCCAGGGCGCAGGGCCGGC GCCTCCCTCTCGGGCTCCCACGCCCCGCTCCGGACTCCGGGACGCGACGTGCGAGCACCGGGGCGCGCGG CAATGGAGCCTTGGGGACCGGATACTACCGCCAGATCCTGGCAGGCTACGACCGTGTTCCCATTCTCTGT CAACTTCTCCTCCGAAGAACAGAAAGGGAAACGCGATGGGCCCTGGTCATCTGGCCACAGGTGACTCCTA GAAATCCACATAGCCTACCTGCATCTGATGAAATCAGCCAGCCAGCCAACCAGCCATGTCTTACACTCCG GGGATTGGTGGGGACTCTGCGCAGCTAGCACAACGCATCTCCTCTAACATCCAAAAGATCACACAATGCT CCGTGGAAATACAAAGGACTCTGAATCAACTTGGAACACCTCAAGACTCACCGGAACTGAGGCAACAGCT GCAGCAGAAGCAGCAGTATACTAACCAACTTGCGAAAGAAACCGATAAGTACATTAAAGAGTTTGGCTCT CTGCCCACCACCCCCAGTGAGCAGCGTCAGAGAAAGATACAGAAAGACCGATTAGTGGCAGAGTTCACCA CATCGCTGACAAACTTCCAGAAGGCCCAGAGGCAGGCTGCTGAGAGAGAGAAAGAGTTCGTTGCTCGAGT GCGAGCCAGCTCCAGGGTATCGGGTGGTTTTCCTGAAGACAGCTCAAAAGAAAAGAATCTTGTATCCTGG GAAAGCCAAACACAGCCTCAAGTGCAGGTCCAAGATGAAGAAATCACAGAGGATGACCTCCGACTCATTC ATGAGAGAGAGTCTTCAATCAGGCAGCTGGAAGCTGATATTATGGACATTAATGAAATATTTAAAGACTT GGGGATGATGATTCATGAACAAGGCGATATGATTGACAGCATAGAAGCCAATGTAGAAAGTGCGGAAGTT CACGTTCAACAGGCAAACCAGCAGCTGTCAAGAGCGGCAGACTATCAGCGCAAATCCAGGAAAACTCTCT GCATTATCATTTTTATCCTCGTGGTCGGAATCGTGATCATCTGTCTCATCGTATGGGGACTGAAAGGCTG AGCCCCGAGGGCGTGGACGACTGCATGATGCTGTCTGAGCGATGCAGGCAGATTCTTGCGATCACTTTCT CTTATCGTTATCTTGAGGCTGTTGTGTAAAATGATGGTTCCATACTTTGCCATTTTTACTAGGGTGGGGG GATTCTTTTTGGATTCAGTCTGATATTTTCTAATACCCAAGGCTTTTCTAAACACCCGGGCTGGCACAGC TTCCCTGCTTTTTAGTTCAACAACTGTTAGGTTTTGCTCACGTTGTATATGCCTTTCATTTGTAATTTAT TTATTGTAACTTTTTGACTGAGTTTTGGGAATTATTTGATTGGCGTGTATACTCTGCCTGCACCTCTGTA ACTGTGTAACATGTGTAACATGATTGCATTATCTTATTTAAAAAGAAAGCCCAAGTTTAAATTTCATTTG TCCAGTAAATGTTCTCAATAGGAAACCCTTAACATAACTGTTTGTGGGATGTTTTATCCGCTGTGGTCCA CAGCAGTGCAGATCGTTATTGCTCTTTCATTATTGGATTGTTGTTTTCGTCTCTGAATAAAATCAGTGAA TCTTTTCCTGATGTGTATGTATATATGCATTTGCTGTGGATTACCTAGTAAAGACAGTAAGGATAGGTTG TTTTTAACATTATGGACTGTTTAATCCAATGCATACTAAAGAAAGCTTAGTTACTGTATTGTTCAGTGAA AGTTGGAGGAAGTGGCTGAAAGGTCCATACCTGCATCTATTCTGTTCAGATGCTAAAGATTCCAGTCTCT TACTGCACTGAACCACTTTCACCATATGGTCTGGCTTTGTGGCCATTATACCTTCCCTCGTGCGCCATGG AACACTTCTTAGGCCTGTATCTTTGGGTCCTGTCTTCACAAAGTAATGTTCCCATAGTTACAGATTTGGG ATTTCATTTTATATTTAGTTTTTGACACTTAAGTTTTAGAGTTTATTTAGATGCCATTTTTTTATTATTC TTCATTCAAATAGGAATCAGACGTCTGCCAATGAACACACTTGTCTTTTTTGAATCAATGTTTTAATGCA CTAATATGAATGCTGTAAGAGGGGTTATCTTAGTTTATCATTTGTGTTTTATAATGTTCTTACACAGCAG TTTGCTAATGATGGCACTGTTTAATGTGGCTCTGAAACCTTTAAATGGGAACAAGTGAAATATTAACAAA ATAATTGTATCTTTGCAAGCAGAATAAAGATGATTCTGGAGATGTCTGCT Enzym rozpoznávající stejné místo: OTÁZKA 5 Uveďte základní charakteristiku následujících primerů. Nezapomeňte uvést jednotky. Na základě parametrů označte primer vhodnější pro další práci. Primer A B Sekvence GACTGGTATACCCTAGGCGTA CTCAGACCAATCATTCGGTTAC Délka T[m] GC [%] Dimer (obr. a volná energie) Vlásenka (obr. a volná energie) Vhodnější primer: OTÁZKA 6 Predikujte lokalizaci následujících proteinů ze Staphylococcus aureus v buňce. Ke každému proteinu uveďte pouze jednu (NEJPRAVDĚPODOBNĚJŠÍ) možnost. Protein 1 MKALLLKTSVWLVLLFSVMGLWQVSNAAEQYTPIKAHVVTTIDKATTDKQQVTPTKEAAHQFGEEAATNVSASAQGTADEINNKVTSNAFSNKPSTAVS TKVNETHDVDTQQASTQKPTQSATFTLSNAKTASLSPRMFAANVPQTTTHKILHTNDIHGRLAEEKGRVIGMAKLKTIKEQEKPDLMLDAGDAFQGLPL SNQSKGEEMAKAMNAVGYDAMAVGNHEFDFGYDQLKKLEGMLDFPMLSTNVYKDGKRAFKPSTIVTKNGIRYGIIGVTTPETKTKTRPEGIKGVEFRDP LQSVTAEMMRIYKDVDTFVVISHLGIDPSTQETWRGDYLVKQLSQNPQLKKRITVIDGHSHTVLQNGQIYNNDALAQTGTALANIGKVTFNYRNGEVSN IKPSLINVKDVENVTPNKALAEQINQADQTFRAQTAEVIIPNNTIDFKGERDDVRTRETNLGNAIADAMEAYGVKNFSKKTDFAVTNGGGIRASIAKGK VTRYDLISVLPFGNTIAQIDVKGSDVWTAFEHSLGAPTTQKDGKTVLTANGGLLHISDSIRVYYDMNKPSGKRINAIQILNKETGKFENIDLKRVYHVT MNDFTASGGDGYSMFGGPREEGISLDQVLASYLKTANIAKYDTTEPQRMLLGKPAVSEQPAKGQQGSKGSESGKDVQPIGDDKAMNPAKQPATGKVVLL PTHRGTVSSGTEGSGRTLEGATVSSKSGNQLVRMSVPKGSAHEKQLPKTGTNQSSSPAAMFVLVAGIGLIATVRRRKAS Protein 2 MKCLIRFILVLGLLISSAMVYINPAAYAEQDQKWEKIKERGELRVGLSADYAPMEFEHTVNGKTEYAGVDIDLAKKIAKDNNLKLKIVNMSFDSLLGAL KTGKIDIIISGMTSTPERKKQVDFSDSYMMTKNIMLVKKDKVNDYKDIKDFNNKKVGAQKGTEQEKIAQTEIENASITSLSRLPDVILALKSGKVEGVV VEKPVAEAYLKQNPKLGISNVKFNEEEKDTVIAVPKDSPKLLSQINKTIKEVKDKGLIDKYMTNAANAMNDDSGFISKYGSFFLKGIKITILISLIGVA LGSILGAFVALMKLSKIKIISWIASIYIEILRGTPMLVQVFIVFFGITAALGLDISALVCGTIALVINSSAYIAEIIRAGINAVDKGQMEAARSLGLNY RQTMKSVIMPQAIKNILPALGNEFVTLIKESSIVSTIGVGEIMFNAQVVQGISFDPFTPLLVAAALYFVLTFVLTRIMNMIEGRLNASD