BIOINFORMATIKA V PRAXI – CVIČENÍ 3 IDENTIFIKACE GENŮ, PROTEINŮ A JEJICH FUNKCE STUDIJNÍ MATERIÁLY Studijní materiály předmětu C2130 Úvod do chemoinformatiky a bioinformatiky, přednáška Predikce genu, Sequence-evolution-function: Computational Approaches in Comparative Genomics. PRODUKCE BIOINFORMATICKÝCH DAT Automatické sekvencování produkuje obrovské množství biologických dat (dlouhé sekvence DNA až celé genomy). Produkce „syrových“ biologických dat, nutná identifikace a anotace genů a proteinů. „Alignment“ na úrovni proteinů je pro určení funkce genů užitečnější než „alignment“ na úrovni DNA. Určení čtecího rámce, překlad DNA Þ protein, identifikace genu a jeho funkce = základní úkony v bioinformatice i molekulární biologii. GENETICKÝ KÓD ÚKOL 1 Přeložte následující DNA sekvenci do aminokyselinové sekvence s využitím tří čtecích rámců: atgttagaaatgcgttattga ÚKOL 2 Přeložte následující DNA sekvenci do aminokyselinové sekvence s využitím šesti čtecích rámců: agcccgaaccggct PREDIKCE GENŮ A PROTEINŮ U PROKARYOT Prokaryotické geny jsou nepřerušované úseky DNA mezi startovním kodonem a stop kodonem. Nejčastěji je genem nejdelší ORF (open reading frame) odpovídající danému úseku DNA. Nejspolehlivějším ověřením, zda ORF skutečně kóduje protein, je jeho podobnost k již dříve popsanému proteinu („alignment“). ÚKOL 3 Přeložte následující DNA sekvence neznámého organismu do sekvencí aminokyselin pomocí programu Translate – server ExPassy (http://www.expasy.ch/tools/dna.html). Určete, které geny/proteiny mohou být těmito sekvencemi kódovány (aplikace BLAST - http://blast.ncbi.nlm.nih.gov/Blast.cgi). Sekvence 1 ATGGCTCAATCAGAATTTAACCAAAATCTACGGGAGCAAGGGCAATCACGTGCAAGAGTTATTATTCTACGTGTGAATAATCCGGGATACAACACTAAT ACTTTAGACATCGCAGACATAGAAGATATCATTCATTTACCTCAAGCTATAGAGTTAGCTAATGCATTTCAATCTGCACTAGTACCTACTACATCCAAC TTCGGGGAGGACACATTAAGATTTGATGTAGAAAGGGGATTAGGAATAGCTACTCACGTTTATCCTAGAGCTATAAATGTGAATTATGTAACACGTACT TTATCACAAACTAATAATCAAGTACAGTCCATGATAAATAAGGTGATAGAAGAGCTTAAATCTTTATTAGGAATTAATCTGGCTAATTCAGTGCTACAA CAATTAACCACTGTAATTACAGAAACTTTTACAAACCTCTACGTACAACAGCAATCTGCTTGGCTTTTTTGGGGACGCCAAACATCATCACAAACCAAT TATACTTATAATATCGTATTTGCAATCCAAAATGCCCAAACAGGTAGTTTTATGAAAGCTATTCCTATAGGGTTTGAGATATCTGCATATATTGCAAGG GAACGCTTATTATTTTTTAATATTCAAGATTATGCAAGCTATAGTGTCAAAATACACGCAATTCAAGTTATGCAGCCATTGATTCATGAGAGTTTTCAA CCCCTAAGAGGCATATTTAATATCATAACTTCCGTAAATAATAGAAGTGCTATTCAAATTACTGAATATTATGACGAAAATACACATGATTATCCTGTT AAGTTATGGGACTATAATAATATTATTAATCAAAAATGGATTTTAGTTTTTAATCAAACTACCCGTGCTTACAGTATTCAAAACCTAATAGCTCGCTAT TTAGTACTAACATGGGATTCTACTCCTGGATCAAATAAAGTTTTTGCTTCTACTAATCGTTGGAACGATTCACAATTCTGGATTCTTGAAAGTACAGCA GATGGTTCCATTTTTTTAACAAATATGAAAGACACTCAATTTGTATTAGAGATAGAAAACTCTAGTACTACTAATGGGACAAATGTTATAGTCAATAGA AAAAATAATAATGCACAGCAAAAATTTTACTTAAATAAAGTAAACCAAGAGTTTCAGGATGGTGTATATAAGATTAAGACTGCCCTAAACAATAGTAGC GTTCTGCAGATGTCTGAAGATTATTTTGGTTATACGTCAGATTACTTTGTGAAATTATGGACCAACAATAATAATGATATTAACCAAAAATGGATTTTT GAATTTGATAGCACTAAATCTGCGTATCAAATTAAAAGTCAAAGGGATCCTTCCTTAGTACTAGCATGGACTTGGAGTGTACCTACTGTTAAACTCCCT ATTCCAAATAACGATGATCATCTCTGGTTTCTTCAAAATGCTGGGTCGGGTACCTATTATTTTGTAAATATGACAGACACCCGATATGTTTTAGAAGTG GCTAGTTCTAGTACCACTAATGGAACGATACTTACAATCAATAAACGAAACGGAAATTTAAATCAAAAATTTTTGTTGGACATGATTAATTAA Sekvence 2 TAGTATGAATAACAACACCACGGCACCGACCTATACGCTGCGTGGCTTACAGTTGATTGGTTGGCGTGATATGCAGCACGCCCTCGATTATCTGTTTGC TGACGGGCATCTTAAGCAGGGAACGCTGGTTGCCATTAATGCCGAAAAAATGCTGACCATTGAAGATAATGCTGAGGTCAGGGAGCTAATTAACGCTGC CGAATTTAAATATGCGGATGGCATCAGCGTTGTACGTTCAGTACGTAAAAAGTACCCGCAGGCGCAGGTTTCCCGCGTTGCCGGTGCCGATCTCTGGGA AGAGCTGATGGCGCGCGCAGGCAAAGAAGGGACGCCGGTATTTCTTGTGGGCGGTAAACCTGAAGTGCTGGCGCAAACTGAAGCTAAACTGCGCAACCA ATGGAATGTGAATATCGTTGGCAGTCAGGATGGTTATTTTAAACCCGAGCAGCGTCAGGCGCTGTTTGAACGCATTCATGCCAGCGGAGCGCAAATCGT CACCGTTGCGATGGGATCGCCAAAGCAGGAGATCTTCATGCGCGACTGCCGTCTGGTGCATCCAGATGCGCTGTATATGGGCGTTGGCGGGACTTACGA TGTTTTCACCGGTCACGTAAAACGCGCACCGAAAATCTGGCAAACGCTGGGACTGGAGTGGCTCTACCGCCTGCTTTCGCAGCCGAGCCGCATTAAGCG TCAGCTTCGTTTGCTGCGTTATTTACGCTGGCATTACACCGGCAACCTCTGAATGGTTGCGAAAAACATTAACCTTCAAGATATTGACCCTGTCGAAAC CCAGGAATGGAAGGAAGCGCTTGATTCCGTTGTTGAATACGAAAACGTGGACCGTGCTGAATTCATTTTAGAAAAGTTGTTAGCACATGCCCGAAACGT TGGTGTTTCAGTCCCGACTGGCATTCACACTCCTTATTTAAATACCATTCCTGCCGAGACAGAAGCTCAACTAGCGGATGATGAAATTAAAGTAATGCA ACGCTTAACGAATTACCTGCGTTGGAATGCCTTGGCAATGGTGATGCGAGTGGGGCGTAAAAAAGCGGGGTTGGGGGGGCATCTTTCCAGTTACGCGTC GATGGCGACTTTATTTGAAGTCGGCTTAAATTATTTCTTTCGGGCGGATGATTTAGTCTTTTTCCAGGGACATTCGGCAGAGGGTATTTATGCGCGCGC TTTCTTGGAAGGGCGCCTTAGCGAACGAGATTTAATCCATTTTCGTCAAGAAGCGTTGACAAAGGGGATTTCTTCTTATCCTCACCCCTTTTTAATGCC TGATTTTTGGCAATTCCCGACGGTTTCGATGGGCCTTGGACCCTTGATGGCGATTTATCAGGCCCAACTATTGAAATATTTACACCATCGAAAGCTGGT AGATACCGCAGGGCGAAAAGTATGGGCTTTTTGCGGCGATGGTGAGACGGGAGAACCCGAGACGTTAGGCGGTCTATTAGTAGCGAGCCGCGAGAAATT AGATAATCTCATTTTTATCGTTAATTGCAATTTACAGCGTCTCGATGGTCCGGTATCCGGTAACGGTAAAATTATCCAAGAATTAGAGGGCCTTTTTCG GGGCGCCGGATGGCGAGTGATTAAAGTTATTTGGGGTCAAGATTGGGAGCGATTGTTTAAGAAAGATAAATCCGGCTTGTTGTTAAAGCGCGTTTCGGA AATGGTAGACGGTGAATACCAAGCGTGTTTTTCCAAAGACGGCGCTCATTTGCGCGAGCATTTCTTTGGAAAATACCCCGAATTATTAGAGCTCGTTTC TGATATGAGCGACGATGAACTAAAACAATTGACTGACGGCGGCCATGATCCACAAAAAGTTTACGCGGCTTATACGGAAGCGATGAAAGATTGCGGAAA ACCCACGGTAATCCTTACTAAAACGGTGAAAGGCTATGGTTATGGGAAAGAAGGCGAATCCCAAAACATCGCTCATAATTTAGAGGAAATTAGCGAGGA GGGATTAAAAATCTTTCGCCAACGGTTTGATTTACCCTTATCCGATAAACAATTAAGGGATCTTGAATTTTATAAACCTGATGACAATAGTCCAGAATT AAATTATTTACGCAAGCAACGTGAAAAATTAGGCGGACCTTTGCCCGCACGAGACGGAAAATTTGAATCGATAAAAGTCCCAGATTTAAGTTTATTTGA ACCTGTATTGAAAGGCACCGAGGAGCGCTCTGTGTCAACGGGCGCGGCATTTTCGCGAATTATGGGGTTGATGCTGAAAGATAAAAATATTCGGGATCG TATCGTCCCTATTGTGGCGGATGAAGCTCGGACATTGGGTTTAGAAGGCTTGTTTCGACAAACAGGCATTTATGCTGTGGAGGGCCAAAAATATACGCC GGAAGATCAGAGTAAATTAATATTTTATCGCGAAGACAAGACAGGACAACTTTTACAGCAAGGAATTTCAGAAGCGGGGGCAATGGCCAGTTGGATAGC GGCAGCTACTTCCTTTGCGAATAATAATTATCCTTTAATTCCTGTGTATACTTATTATGCCATGTTTGGCTATCAACGCGTCGGTGATTTGGTATGGGC CGCTGCCGACATGCACGCTCGCGGTTTTATCTTAGGTGGATTGGCAGGTAGAACCACTTTGCCGGGCGAAGGATTACAGCATCAGGATTCTCATAACTT ATTAATGTTTAGCATGGTACCGACGTGTCGTTCCTATGACCCTGCTTTTGGGTACGAATTGGCCGTAATTATTCAAGACGGTTTACGTCGCATGTACCA AGATAAGGAAAATGTTTTTTATTACCTTACCCTGATGAATGAAAGTTATCAGCATCCCCCCATGCCCAAAGGGGTGGAAGAAAGCATAGTCAAAGGGAT GTATTTATTTAAAAAGGGTAATGGAAAATTATCTAAACGCGTTCAACTGTTAGGTGCAGGTGCTATTTTACGTGAAGTCATTGCCGCGTCCGAAATTTT AGAAGAACAATTTAAAGTCGCCGCGGATGTGTGGAGCGTGCCAAGCTTTAATTTGTTACGCCATGACATTGAATCAGTAGATCGTTATAATCGCTTGCA TCCCGATACTGCGCCAAAACAAAATTATGTCCAAAAATGTTTGGATAACCAAAAAGGCCCGGTGATCGCCGCGACGGATTACATGAAATTGCTGGCTAA TCAAATCCGCGAAGCGGTTAAACAACCGTATTACGTATTAA ÚKOL 4 Charakterizujte část genomu neznámého organismu. Přeložte DNA sekvenci do aminokyselinové sekvence pomocí programu ORF Finder (http://www.ncbi.nlm.nih.gov/gorf/gorf.html). Určete, které geny/proteiny mohou být touto sekvencí kódovány. ACTAAATAGTATATTTTGATTTTTGATTTTTGATTTCAAATAATACAAATTTATTTACTTATTTAATTGTTTTGATCAATTATTTTTTTCTGTTAAACA AAGGGAGCATTATATGGTAAAGATAATATTTGTGTTTTTTATTTTCTTATCATCATTTTCATATGCAAATGATGATAAGTTATATCGGGCAGATTCTAG ACCTCCTGATGAAATAAAGCAGTCAGGTGGTCTTATGCCAAGAGGACAGAATGAGTACTTTGACCGAGGTACTCAAATGAATATCAACCTTTATGATCA TGCAAGAGGAACTCAGACGGGATTTGTTAGGCACGATGATGGATATGTTTCCACCTCAATTAGTTTGAGAAGTGCCCACTTAGTGGGTCAAACTATATT GTCTGGTCATTCTACTTATTATATATATGTTATAGCCACTGCACCCAACATGTTTAACGTTAATGATGTATTAGGGGCATACAGTCCTCATCCAGATGA ACAAGAAGTTTCTGCTTTAGGTGGGATTCCATACTCCCAAATATATGGATGGTATCGAGTTCATTTTGGGGTGCTTGATGAACAATTACATCGTAATAG GGGCTACAGAGATAGATATTACAGTAACTTAGATATTGCTCCAGCAGCAGATGGTTATGGATTGGCAGGTTTCCCTCCGGAGCATAGAGCTTGGAGGGA AGAGCCGTGGATTCATCATGCACCGCCGGGTTGTGGGAATGCTCCAAGATCATCGATGAGTAATACTTGCGATGAAAAAACCCAAAGTCTAGGTGTAAA ATTCCTTGACGAATACCAATCTAAAGTTAAAAGACAAATATTTTCAGGCTATCAATCTGATATTGATACACATAATAGAATTAAGGATGAATTATGATT AAATTAAAATTTGGTGTTTTTTTTACAGTTTTACTATCTTCAGCATATGCACATGGAACACCTCAAAATATTACTGATTTGTGTGCAGAATACCACAAC ACACAAATACATACGCTAAATGATAAGATATTGTCGTATACAGAATCTCTAGCTGGAAACAGAGAGATGGCTATCATTACTTTTAAGAATGGTGCAACT TTTCAAGTAGAAGTACCAGGTAGTCAACATATAGATTCACAAAAAAAAGCGATTGAAAGGATGAAGGATACCCTGAGGATTGCATATCTTACTGAAGCT AAAGTCGAAAAGTTATGTGTATGGAATAATAAAACGCCTCATGCGATTGCCGCAATTAGTATGGCAAATTAAGATATAAAAAAGCCCACCTCAGTGGGC TTTTTTGTGGTTCGATGATGAGAAGCAACCGTTTTGCCCAAACATGTATTACTGCAAGTATGATGTTTTTATTCCACATCCTTAG PREDIKČNÍ PROGRAMY Jak predikovat geny, které nemají sekvenční homology? Predikční programy využívají ab initio metody – predikce na základě statistických parametrů DNA sekvence. ÚKOL 5 Charakterizujte část genomu pomocí predikčního programu GeneMark (http://exon.gatech.edu/GeneMark). Určete možnou funkci predikovaných genů/proteinů pomocí aplikace BLAST. ATCTGGCCGGTTTTATTCACGCCTGTTACTCGCGGCAGCCGCAGCTTGCCGCCGCGCTGATGAAAGATGTTATTGCCGAACCATACCGCGCGCGTTTAC TGCCGGGCTTTAGCCAGGCGCGGCAGGCGGTGTCGGAGATCGGCGCGCTGGCGAGCGGGATTTCCGGGTCGGGGCCGACGCTGTTTGCGCTATGCGATA AACCGGAGACGGCGCAGCGCGTCGCGGACTGGCTGAGCAAACATTATCTGCAAAATCAGGAAGGCTTCGTTCATATTTGCCGGCTGGATACGGCGGGCG CACGAGTAGTGGGATAATCAATGAAACTCTATAATCTGAAAGACCATAATGAGCAGGTCAGCTTTGCGCAGGCCGTCACGCAAGGACTGGGCAAACAGC AGGGACTTTTTTTTCCGCACGATCTGCCGGAGTTTAGCCTGACGGAAATTGATGAGATGCTCAACCAGGACTTTGTCAGCCGTAGCGCAAAGATCCTCT CGGCATTTATTGGCGATGAAATACCGCAGCAAATTCTGGAAGAGCGCGTCCGCGCGGCGTTTGCGTTCCCGGCACCGGTAGCGCAGGTAGAAAGCGATG TCGGCTGCCTGGAGCTGTTCCATGGTCCGACGCTGGCCTTTAAAGACTTCGGCGGGCGTTTTATGGCGCAAATGCTGACGCATATCAGCGGCGACAAAC CGGTGACGATTCTGACTGCAACGTCAGGCGATACCGGCGCGGCGGTGGCTCACGCGTTCTATGGCCTGGAAAATGTGCGGGTCGTCATTCTCTACCCGC GCGGTAAGATCAGTCCGTTGCAGGAAAAACTGTTCTGTACGCTGGGCGGCAACATTGAAACCGTGGCGATCGACGGCGATTTCGACGCGTGCCAGGCGC TGGTGAAACAGGCATTTGATGACGAAGAACTGAAAACGGCGCTGGGGCTGAATTCGGCTAATTCGATTAATATCAGCCGCCTGTTGGCGCAAATTTGCT ACTACTTTGAAGCCGTGGCGCAACTGCCGCAGGGGGCGCGTAACCAACTGGTGATCTCCGTCCCCAGCGGCAACTTTGGCGATTTGACGGCAGGGCTGC TGGCGAAGTCGTTAGGCCTACCGGTGAAACGTTTTATCGCCGCCACCAACGTCAACGACACGGTGCCGCGTTTTCTGCATGACGGAAAGTGGGCGCCGA AAGCGACGCAGGCGACCCTGTCGAATGCGATGGATGTCAGCCAGCCGAATAACTGGCCGCGCGTGGAGGAGCTATTCCGCCGTAAAATCTGGCGCCTGA CTGAGCTGGGCTATGCGGCGGTGGATGATACTACGACACAGCAGACGATGCGCGAGCTGAAAGCGAAAGGTTATATCTCGGAACCTCATGCGGCGGTAG CGTATCGGGCATTACGCGACCAGTTAAACCCTGGCGAGTATGGCTTGTTTCTCGGAACGGCGCATCCGGCGAAGTTTAAAGAGAGCGTGGAGTCCATTC TGGGAGAAACGCTGGCCTTGCCTGAAGCGCTCGCCGAACGCGCCGACCTGCCGCTGCTTTCACATCATCTGCCTGCGGATTTTGCCGCCCTGCGTAAGC TGATGATGACCCGCCAATAACCATTGCGCCCGGTGGCGCTGTCGCTTACCGGGCCTATGGGGTGGTGTCGATTTGTAGGCCGGATAAGGCGTAACCGCC ATCCGGCGATGCCGTTACTGCTCGTAGCGCTTAAAGACCAGCTCGTCTTGTGTGGAGGTTTCTTCATCAAAGAAATACCCTTCACGGTCAAACGCGGTA AGCTGTTCCGGCTTCGTTAAGCGGTTTTCAATAATAAAACGGCTCATCAGTCCGCGCGCTTTTTTGGCGTAGAAGCTTACCACCTTAAACTTGCCGTTT TTCTCATCAAGGAACACGGGCTTAATCAGTTCGGCATTCAGTTTCTTCGGCTTCACCGATTTAAAATATTCCTCGGAGGCCAGATTCACCACCACCCGA TCGCCCTGCGCCTCAAGCGCTTCGTTGAGCTTATCGGTAATGATATCGCCCCAGAATTGATAAAGATCTTTGCCGCGCGGATTCTCCAGGCGAATCCCC ATCTCCAGACGATAAGGCTGCATTAAATCCAGCGGGCGCAATACGCCATACAAGCCAGAGAGCATACGCAGATGTTGTTGAGCAAAATCAAAATCCGCG TCGTTGAACGTTTCCGCCTGTAGGCCGGTATAAACATCGCCTTTGAACGCCAGAATCGCCTGGCGTGCATTATCCGGCGTAAAATGAGGCTGCCAGTCA TGAAAACGCGTGGCGTTGAGATCCGCCAGTTTGTCGCTAATTCCCATCAGCCTGGAAATTTGCGGCGCCGAAAGCTGGCGGGCCTGTTGAATAAGCTGC TGGCTGTGATCCAACAGCTCCGGCTGGGTATAGCGGGTCGTGGCCAGCGGGCTTTGATAATCAAGCGTTTTTGCAGGTGAAATCAGAATCAGCATATTC AGTCCTTGCAGGGAATTTTCTGCGACTTTAGCAAAAAAACGCCGCAGAGTTGACCGATGGTTGCGATTGTCGGCTTAATCGCGCGATGCCGCCTCCCAG GTATCTGGCGCCAGTTGTGGTTCGATATCCGGGAAGCGCCGCGGATCGAACTGCGGTCTTACGCCCAGTTTCCGTTGTCGCAGATAATCGCTGGCGAGG GTATACACCACCGGTGAGAGCAACAAAATCGCCGTCAGATTGGTAATGGCCATACAGGCCATGATCATGTCAGCGAGCTGCCATATCAGCGGAAAACTG ATAAGCGTACCGGCGATAACCATGCCAAGCGTCGCAAGGCGTAATAGCCAGATAGCCTTTGCGTTATGTAACCGCAGAAAAAACAGATTGTTTTCGGCG TAAATATAGTTGGCGACGATAGAACTGAACGCGAACAGAATGACGATAAGCGCGACAAAACTGGCGCCCCATTCACCGGTCAACGAAACCATTGCATGT TGGAGAAGCTGAATGCCTTCTGTTGACGAGTGGGACGCGTGATTCCCCGCCAGCAGGATAATCATCGCGCTGGCGGTACAGATGATAATGGTGTCGCTG AATACGCCAATCATTTGCACAATCCCCTGCGCGACAGGGTGAGGGGGATACGACGTTGCCGCTGCGGCCGCATTAGGCGTTGACCCCATTCCCGCTTCA TTAGAGAACATCCCACGCTGAAAACCGCTGGTAATAGCCTGGGTGAGCGTATATCCGGCTGCGCCTGCCGCGGCTTCCTGCCAGCCAAATGCGCTTTTG ACTATCGAGGCGATAACGCCAGGCATTTGCTCAATATGCCAGAGGCAAATGAATACGCTGCCGGCGACCCACAATAACGCGATGAGGGGAATCAGCCAT TGCATCAGACGGGCGACGCCTTTGATGCCGCGAATGATAATTAACAGGGCACAGAACGCCAGAGCAATGCCGGAGATAAGCGGCGGAATGTTGAAGGCG AAATGGAGCGCGCGTGAGACGGCATTCGCCTGCACGCTATTAAAAATCAACCCGTAGGCGACGAGCAGAAAGAGGGCGAAAACCACGCCCATCCAGCGC ATTCCCAGCCCACGCGCCATATACCACGCCGGGCCGCCGCGGAACTGGCCTGTCGGGTCACGTTCTTTATAAAGCTGGGCAAGCGAACACTCGGCGAAG GAGGTCGCCATGCCAATGATGGCCGAGACCCACATCCAGAATACCGCGCCGGGACCGCCTGCGGCGATAGCCAGCGCCACGCCGGCCAGGTTACCGCTG CCAATCCGCGCCGCGAGGCTGGTACACAGAGCCTGAAATGACGTCAGGCCGCCTGGCTGCGGGCTAAGGCTGCCTTTCAGACTGCGGCTAAATTGGCGA ATATAACGAAACTGAATGAATCCGGTACGCCAGGTAAACCAACATCCTGCGCCGAGCAGCAGGTAAATCATTACCGAGCCCCAGAGTATTTCGTTAATA AAACTGAAAAACTCAGGCATTAACGTCCCTCTTGTTGATGCCGGCACGCTTTGATAATCCTGTATAAGCGTGACCCATGATGTAGATGACCTTGTCAGA CTAATATTAACGGCAGTTTACCATAAATACGGTGGTATCCTTTAATTGCGCATCAACCGTCGGCAGATACGCAAACAGTGCACAAGGGCAGCCAGGTGC ATGTAGGCGGTTGCGCTGTGAGTGCGTCGTGTTATCATCAGGGTAGACCGGTTACATCCCCTAACAAGCTGTTTAAAGAGAAACTCTATCATGACGGAC AAATTGACCTCCCTTCGTCAGTTCACCACCGTAGTGGCTGATACCGGAGATATCGCGGCAATGAAACTGTATCAGCCGCAGGATGCTACAACTAACCCT TCTCTCATTCTTAACGCAGCGCAAATCCCGGAATATCGTAAGCTGATTGACGATGCTGTCGCCTGGGCGAAACAGCAGAGCAGCGACCGCGCGCAGCAG GTTGTTGACGCGACCGATAAGCTGGCGGTGAATATTGGCCTGGAGATCCTGAAGCTGGTGCCGGGGCGTATTTCTACCGAAGTTGACGCGCGTCTGTCT TATGACACTGAAGCGTCTATCGCCAAAGCAAAACGTATCATTAAACTCTACAATGATGCGGGTATCAGCAACGATCGTATCCTGATCAAGCTGGCGTCC ACCTGGCAGGGCATTCGTGCAGCCGAACAGCTGGAAAAAGAAGGCATCAACTGTAACCTGACGCTGCTGTTCTCCTTCGCGCAGGCGCGTGCGTGCGCC GAAGCGGGCGTCTACCTGATCTCGCCGTTCGTAGGTCGTATTCTTGACTGGTATAAAGCCAATACCGACAAGAAAGACTATGCGCCAGCTGAAGATCCG GGCGTGGTTTCCGTAACGGAAATCTACGAGTACTACAAACAGCATGGTTACGAAACCGTCGTTATGGGCGCAAGCTTCCGTAACGTAGGCGAAATTCTG GAGCTGGCGGGCTGCGACCGTCTGACTATCGCGCCGGCATTGCTGAAAGAACTGGCGGAAAGCGAAGGGGCGATTGAGCGTAAGCTCTCTTTCTCCGGC GAAGTCAAAGCGCGCCCGGAACGCATTACCGAAGCCGAGTTCCTGTGGCAGCATCACCAGGACCCCATGGCGGTTGACAAACTGGCGGATGGTATCCGT AAGTTTGCGGTAGACCAGGAAAAACTGGAAAAAATGATCGGCGATCTGCTGTAATCATTAACGCGTGGCCCTGATATGGGTCACGCTACCTCTTCTGAA ACCTGTCTGTCCTTCCCTTCGCAGTGTATCATTCTGTTTAACGAGACTGTTTAAACGGAATAATCATGGATACCTTACGTATTGGCTTAGTTTCTATCT CCGACCGCGCTTCAAGCGGCGTTTACCAGGATAAAGGCATTCCTGCGCTTGAGGAGTGGCTCGCTTCTGCGCTGACCACGCCTTTCGAGGTCCAACGGC GCTTAATTCCTGATGAACAGGAAATTATCGAGCAAACGTTGTGTGAACTGGTCGATGAGATGAGCTGTCATCTGGTGCTGACCACTGGCGGTACCGGTC CGGCGCGTCGCGACGTCACGCCGGACGCGACCCTTGCCATCGCCGACCGTGAAATGCCAGGTTTTGGCGAGCAGATGCGCCAGATCAGCCTGCGCTTTG TGCCGACCGCCATTCTTTCCCGCCAGGTGGGCGTTATCCGTAAACAGGCGTTAATTCTTAATCTGCCTGGACAGCCAAAATCGATCAAAGAAACGCTGG AAGGCGTAAAAGCGGACGATGGCAGCGTTAGCGTGCCGGGCATTTTTGCGAGCGTGCCGTATTGCATACAGCTGCTTGACGGGCCGTATGTCGAAACCG CGCCGGAAGTGGTTGCCGCTTTCCGTCCAAAGAGCGCCAGACGTGAGAATATGTCGGACTGACCGGAAAATACTGATAGTAGGGTTATTCCTCCCGGTG CGGGAGGAATAAAAGAGATTTAGTGCGCCTCGCCGATTGGCAGAATAGTGCGGCCAAATTGCTCGTTTAGCACTTCACCCATCGCCAGATAAATAGCGC TGGCGCCGCAAACCAGACCAACCCAGCCTGCGATATGGATAGTTGCTTCGTTACCGGTGATATTGCCGACCGCCAGCAGAGCGAACAGTACGGTCAGGC TCAGGAAAACAAATTGCAGCGCGCGGGCGGCTTTCAGCGTACCGAAGAACATAAACAGCGTGAACACGCCCCACAGACCTAAATAAGCGCCGAGTAGCT GAGCGTC