BIOINFORMATIKA V PRAXI – CVIČENÍ 4 DESIGN PRIMERŮ PRIMERY A JEJICH VÝZNAM V MOLEKULÁRNÍ BIOLOGII Krátké oligonukleotidové řetězce, které slouží pro provedení polymerázové řetěžové reakce (PCR) označujeme jako primery. PCR má široké využití pro namnožení vybraných úseků DNA, detekci genů a dalších sekvencí, úpravu sekvencí (mutace) a řadu dalších aplikací. Návrh primerů tak musí zohledňovat účel, ke kterému budou použity. SEZNÁMENÍ SE S PROGRAMEM PRO ANALÝZU PRIMERŮ Krátké oligonukleotidy pro amplifikaci DNA in vitro (primery) lze v zásadě navrhovat ručně, s výhodou však můžeme používat počítačové programy. Ty mají svou nezastupitelnou roli zejména při analýze navržené sekvence primeru. Existuje řada programů pro tento účel a to včetně volně použitelných. V tomto cvičení budete používat program OligoAnalyzer na serveru firmy IDT: (http://eu.idtdna.com/analyzer/Applications/OligoAnalyzer/) ÚKOL 1 Seznamte se s aplikací OligoAnalyzer. Se kterými typy sekvencí umí aplikace pracovat? DNA RNA PNA protein Jaká je základní (default) uvažovaná koncentrace Mg^2+ iontů a s jakými hodnotami umí program zacházet? Jaké písmeno je užito pro označení následujících bazí (mixed base)? A/T A/C/G A/C/G/T VÝZNAM DÉLKY PRIMERŮ A ZASTOUPENÍ BAZÍ (A+T/G+C) – T[m] Jednou z charakteristik primerů je jejich délka, která v kombinaci s konkrétním zastoupení bazí určuje tzv. teplotu tání (T[m], melting temperature). Ta se zvyšuje s délkou primeru a se zvyšujícím se zastoupením G+C bazí. Vyšší T[m] zvyšuje specifitu primeru, pokud je však hodnota T[m]příliš vysoká, nebude PCR probíhat správně. Syntéza dlouhých primerů je rovněž technicky a tudíž i finančně náročnější. Pro typickou PCR, kde míra shodnosti sekvence primeru a cílové DNA sekvence je vysoká (100 – 90%) se jako optimální délka primerů uvádí cca 17 – 28 bází. Optimální T[m] se obvykle pohybuje v rozmezí 55 – 80°C. T[m] dvojice primerů by se neměla lišit o více než ±2°C. OTÁZKA Jaký základní vzorec je použit programem OligoAnalyzer pro výpočet T[m] (melting temperature, teplota tání) primeru? ÚKOL 2 Zjistěte T[m] následujících primerů (nastavení: default). Uvědomte si změnu T[m] danou prodloužením sekvence a změnu danou složením (zastoupením G+C resp. A+T bazí). # Sekvence Délka G+C [%] T[m] 1 GAATGCTCACTCAAGGATTAC 2 GAATGCTCACTCAAGGATTACAAT 3 CACGGAATGCTCACTCAAGGATTAC 4 GAGGGCTCACTCAAGGAGGAC 5 GCCTGCTCACTCAAGGAG ÚKOL 3 Z následujících primerů vyberte vhodnou dvojici na základě jejich T[m]. # Sekvence T[m] Vhodná dvojice s # 1 tccagtaatgacctcagaacAA 2 AAACGACTTACTTTACTTTG 3 TTCATCATGTGCTACGCTTACGCGTC 4 atgaatgctcatccggaatt 5 gctgaattccggcaacggca ANALÝZA SEKVENCE PRIMERŮ – DIMERY, VLÁSENKY I primery s vhodně zvolenou T[m] mohou být nevhodné pro PCR, pokud by vytvářely nevhodné sekundární struktury. Pro správné nasednutí na cílovou DNA je třeba, aby primery existovaly jako monomerní molekuly a žádná z bazí nebyla blokována. K tomu však dochází, pokud primery tvoří dimery (ať již samy se sebou – homodimery, nebo s druhým primerem ve dvojici – heterodimery): Podobně není žádoucí ani interakce uvnitř primeru, která vede ke tvorbě vlásenky: Hairpin V obou případech je důležité sledovat i konkrétní místo, kde by k těmto nežádoucím interakcím mohlo docházet. Obzvláště nevhodná je tvorba sekundárních struktur na 3’ konci primeru. ÚKOL 4 Odhalte možnou tvorbu dimerů u následujících dvojic primerů a označte zda se jedná o homodimer nebo heterodimer. Zároveň uveďte sílu dané interakce, tj. volnou Gibbsovu energii dané vazby (DG). Pokud může vznikat více různých dimerů, uvádějte jen nejstabilnější z nich. Primer 1a GATTCCACCTAAAAGCTC Primer 1b TagaTgGTTCACTAACAgG Dimer Typ DG Primer 2a acctttATTtcatcgctctg Primer 2b GTGGACTAATCATGTTCACGC Dimer Typ DG ÚKOL 5 U následujících primerů detekujte tvorbu vlásenek a seřaďte tyto primery podle tendence k tvorbě vlásenek od nejvyšší k nejnižší. Primer Vlásenka (ANO – NE) DG Pořadí tccagtaatgacctcagaac TTACCTTCCCCTCTCTTCACTT ATCATGTGCTACGCTTACGCGTC gatattacggcctttttaaag ACACTTAGAACGGTAGCAACT ANALÝZA MOŽNÉHO ŠPATNÉHO NASEDNUTÍ PRIMERŮ – FALSE PRIMING SITES (FPS) I primery, které splňují všechny výše probírané parametry, se mohou ukázat jako nevhodné pro konkrétní účel, pokud nenasedají dostatečně specificky. Přítomnost více míst, která jsou rozpoznávána primery (false priming sites) vede k tvorbě více různých PCR produktů. Význam této analýzy se liší v závislosti na účelu PCR. Pro následné klonování a tvorbu rekombinantního proteinu je žádoucí tvorba jednoho PCR produktu, akceptovatelná je tvorba několika málo PCR produktů o různé délce. Na rozdíl od předchozích úkolů je v tomto případě klíčová nejen znalost sekvence primerů a samotného cílového úseku (genu) ale kompletní DNA přítomné v PCR směsi. Komerční programy běžně nabízejí možnost detekce míst špatného nasednutí. U volně dostupných programů je tato funkce bohužel často opomíjena. Program Primer-BLAST na serveru NCBI (http://www.ncbi.nlm.nih.gov/tools/primer-blast/) využívá propojení s databázemi a umožňuje tuto detekci provést. ÚKOL 7 Pro následující geny navrhněte primery tak, aby ve výsledku byl amplifikován celý gen. Ověřte možnost tvorby nežádoucích produktů při použití DNA mateřského organismu jako templátu v PCR směsi. Ke každému genu doplňte navrženou dvojici primerů, délku PCR produktu a délku dvou velikostně nejbližších možných nežádoucích produktů. Gen 1 Organismus: Homo sapiens Sekvence: TTTACCTTCACGCTGGAGCCAAGATCGCTGCGGGGAGTCCCGTGAAGCACCACTGCCCTCTAAGACCTTGGAAGGGGAAACACCAGAAGGTGTGGGTGC TGAGCTCCGCTGCGTCAGACTGCCAGGACCTGAGTGGAACTCAGTGCTGAAACCTGGGTTCTCACTGCAGCTGGATAGCAGGTGGTTACAAAATTATAT GTATTTTTAGGGTTATTTCTAATTTTTCTTTAATAGTTATTGGCAATTTTCAAAGTCCTTTAAGAAACACTGAAAACTGCTCAAGAAAATGGCAGTTCT GCAGGGCTCAGGTAGCAGGGCAGGCTGTTGGGACAGGTTTGACAGACTGTCCTAATACAAGGAGCGCCTTTTCCCAGATCAGCAGCTCTAGAGGGTGGC GGCCTTGCCTGGAACCTCCGCAACCTCCGCGCCCACCACACAAGGGCTGAGAACAGTAAGGTATGGGCTGTGCTGGGCTCAGGAGCAGGGGTAGTTGCT CACCTGGACAGGGTGTGTCTGGGAGGGCCATACTAGGGCCTGGACAGGGCGTCTTCTGGCCTTGAGCTGCTACGATGGGGGTAGGAGTTGGGAAGGGTG GAAGGCTGGTGCCCTCAGGGAGTCGGGGAGGCTGCGCAGTCAGCAGGTCAGGACTGTGTTCCTCAGAGAAGGGTGGCCTGTGCAGGCGAGGCAGGGCTG CCCCTGCAGGGCTGAGGAACATTAGTCCATCCAGGTGGTGTGGGGAGGCTGAGGGCACGGTCCTCCTGCCCAGAACGCAGGTGTCCTGTCTGCTACAGA CACATCAAGGAAGTCACCAATGTGTGCCCCTTTCTCTAGCCTAGGGACTGGCAAACCCAAAAACACCATGCCCACAGGTTAGAGCCGACCTGGTGCCCG TTTGTGAACAGCCCACAAGCTAGGAATGGCTTTCACATGTTTAAATGGCCGAAAGTCAAAATATCTCATGATGTGTGAAAACTGTAGGTCATTCTCATC TGCGTCGGTAAGTAACGCCTTATCTGAGCACAGCCAGGCGCATTCAGGTGGTGCGGCCCCAGTGGAGGCTCTGTGGGCCGGGAGCCACGTCCCAGGTGC AGACACAGAGCTCCCACTGCGGGCTGACCTGTGACTTCCCCTCTCCCTGCAGCTCTGCCCGGATGGCCCTAGTCTTCGTGTACGGCACCCTGAAGCGGG GTCAGCCCAACCACAGGGTCCTGCGGGACGGCGCCCACGGCTCCGCAGCCTTTCGGGCGCGCGGCCGCACGCTGGAGCCCTACCCGTTGGTGATCGCGG GGGAGCACAACATCCCGTGGCTGCTGCACCTGCCCGGCTCGGGGCGCCTCGTGGAGGGCGAGGTCTACGCGGTAGACGAGCGGATGCTGCGCTTTCTGG ATGACTTCGAGAGTTGCCCGGCCCTGTACCAGCGCACGGTGCTGCGGGTACAGCTGCTGGAGGACCGGGCCCCGGGCGCAGAGGAGCCGCCAGCGCCCA CCGCGGTGCAGTGCTTCGTGTACAGCAGGGCCACCTTCCCGCCGGAGTGGGCCCAGCTCCCGCACCATGACAGCTACGACTCCGAGGGGCCGCACGGGC TGCGCTACAACCCCCGGGAGAACAGATAAGGGGGACGGGCAGGGTGGGCCTAGGTTTGAGAGCCCTGGGGCTCCAAGATGCGCCCAGCCCATGCTGGGT GAAGGCGGAAGCCGAACAGGGCCCTTTCCAATGAATCTGCCGGAAAGGAACCAATCTTTCAGTGGCAGCTGATTTTACAAATAATGTTGAGATACGAAT AGCAAGGTGCTTCCCTCCCATCTTTCTACCTGGTAAGAAAAATTTAGGATTTTAACTCCCCTAAATGACATTTAGAGAACTCGTGTTATGCCTAATTCT TCTTCCTCCTCGTGTTGTTTCTGCTGTTGGCTCTGCTTTGAGCTCAAGATAATAATAAATATTTAGGATCAGTGTAAAGACTTGGTGTTGCCGCTAGAT TTTAGCAGCCCTACTATACTGATTCTGGCCTGTAACCCCTGAGAAAGCCGATTTTACACGGCTGGGTAGAATTTGTAGAAAAGATCCACAGGGCAAGCA TGCTGTATATCAGAGTGCGTATAGCACCATTCTTCCTAATTTTCAGATCAAGCTTCACAGCAAATATTAAAGATTATTTAAATTTGAAGTCGATGTTTT GGGAAATCAG Gen 2 Organismus: Saccharomyces cerevisiae Sekvence: ATGATGAATAACAACGGCAACCAAGTGTCGAATCTCTCCAATGCGCTCCGTCAAGTAAACATAGGAAACAGGAACAGTAATACAACCACCGATCAAAGT AATATAAATTTTGAATTTTCAACAGGTGTAAATAATAATAATAATAACAATAGCAGTAGTAATAACAATAATGTTCAAAACAATAACAGCGGCCGCAAT GGTAGCCAAAATAATGATAACGAGAATAATATCAAGAATACCTTAGAACAACATCGACAACAACAACAGGCATTTTCGGATATGAGTCACGTGGAGTAT TCCAGAATTACAAAATTTTTTCAAGAACAACCACTGGAGGGATATACCCTTTTCTCTCACAGGTCTGCGCCTAATGGATTCAAAGTTGCTATAGTACTA AGTGAACTTGGATTTCATTATAACACAATCTTCCTAGATTTCAATCTTGGCGAACATAGGGCCCCCGAATTTGTGTCTGTGAACCCTAATGCAAGAGTT CCAGCTTTAATCGATCATGGTATGGACAACTTGTCTATTTGGGAATCAGGGGCGATTTTATTACATTTGGTAAATAAATATTACAAAGAGACTGGTAAT CCATTACTCTGGTCCGATGATTTAGCTGACCAATCACAAATCAACGCATGGTTGTTCTTCCAAACGTCAGGGCATGCGCCAATGATTGGACAAGCTTTA CATTTCAGATACTTCCATTCACAAAAGATAGCAAGTGCTGTAGAAAGATATACGGATGAGGTTAGAAGAGTTTACGGTGTAGTGGAGATGGCCTTGGCT GAACGTAGAGAAGCGCTGGTGATGGAATTAGACACGGAAAATGCGGCTGCATACTCAGCTGGTACAACACCAATGTCACAAAGTCGTTTCTTTGATTAT CCCGTATGGCTTGTAGGAGATAAATTAACTATAGCAGATTTGGCCTTTGTCCCATGGAATAATGTCGTGGATAGAATTGGCATTAATATCAAAATTGAA TTTCCAGAAGTTTACAAATGGACGAAGCATATGATGAGAAGACCCGCGGTCATCAAGGCA TTGCGTGGTGAATGA Gen 3 Organismus: Escherichia coli Sekvence: ATGAGTGAAGATTGTTTGAAAATGTTTACAGGTGTTGTTCTGTTAATATTTGTCATTATTGCCGGTTATTTCTTTTCTGAGCGTAATGACAGGAAAATG TTTCTCCTGAGCTCACTGGTTTTCCTTGTTATTAATATCGCGTGTTTATATGTGCTGACTGCCAGATTCTGGTTTCTGTGTGGTGCAATTATGAATCAG GGCGCAGCAATGGTTGTTCCAATGGTTATTGGCTCATTACCGAACGTTACGAGCTTCGACGGGTTCAGAAGAATATTTATCTGTATTATGTTGTCATCA GTATGGTCCGGAGTGATGTGGTTTTTTATAAGGGGGCTTATGACAGGCTAA VLASTNÍ DESIGN PRIMERŮ ÚKOL 8 Primer navrhujeme vždy s ohledem na smysl jeho použití. Je-li cílem detekce přítomnosti/nepřítomnosti genu, nemusíme primery navrhovat tak, aby PCR produkt obsahoval celý gen, nebo naopak může zahrnovat i část okolní DNA. Pro tuto aplikaci lze s výhodou využít on-line programy, které v rámci zadané sekvence navrhují optimalizované primery. Úkolem vědce je mezi nabízenými alternativami vybrat tu nejvhodnější. Pomocí programu Primer3 (http://frodo.wi.mit.edu/primer3) navrhněte pro následující sekvenci vhodné primery tak, aby výsledný PCR produkt měl délku mezi 350 a 500 bp. Pro nastavení ostatních parametrů využijte znalostí z předchozích úkolů. Sekvence: ctcgagaaatcataaaaaatttatttgctttgtgagcggataacaattataatagattcaattgtgagcggataacaatttcacacagaattcattaaa gaggagaaattaactatgagaggatcgcatcaccatcaccatcacggatcccacgtgatatcctcaatcgcttctagaagcgattgaggagatctgagc tcggtacccgggtcgacaggcctctgcagccaagcttaattagctgagcttggactcctgttgatagatccagtaatgacctcagaactccatctggat ttgttcagaacgctcggttgccgccgggcgttttttattggtgagaatccaagctagcttggcgagattttcaggagctaaggaagctaaaatggagaa aaaaatcactggatataccaccgttgatatatcccaatggcatcgtaaagaacattttgaggcatttcagtcagttgctcaatgtacctataaccagac cgttcagctggatattacggcctttttaaagaccgtaaagaaaaataagcacaagttttatccggcctttattcacattcttgcccgcctgatgaatgc tcatccggaatttcgtatggcaatgaaagacggtgagctggtgatatgggatagtgttcacccttgttacaccgttttccatgagcaaactgaaacgtt ttcatcgctctggagtgaataccacga Primer Sekvence Délka Pozice T[m] GC [%] Dimer 3’ dimer Vlásenka Left Right Délka PCR produktu: ÚKOL 9 Na základě výše získaných znalostí navrhněte vhodnou dvojici primerů ke genu, s nímž budete pracovat v následujícím cvičení: Genová sekvence: ggccaataacgagccatgggcggccgc atggctgattctcaaacgtcatccaaccgcgccggcgaattctcgattccgccgaataccgatttccgcgcgattttcttcgcgaatgccgccgagcaa cagcacatcaaattgttcatcggcgacagccaggaacccgccgcgtatcacaagctgacgacgcgcgacggcccgcgcgaagccacgctgaattccggc aacggcaagatccgtttcgaggtgtcggtgaacggcaagccgtcggcgaccgacgcgcgtctcgcgccgatcaacggcaagaagtcggacggctcgccg ttcacggtcaacttcgggatcgtcgtgtcggaagacggccacgacagcgactacaacgacggcatcgtcgtgctccagtggccgatcggctga ctcgagggctcttccacccgaatttcg Primery by měly zahrnovat počátek a konec genu tak, aby výsledný PCR produkt obsahoval celý gen. Zkontrolujte T[m] obou primerů, možnou tvorbu dimerů a vlásenek, primery by měly mít délku mezi 20 a 28 bp a obsah G+C bazí by měl být mezi 40 a 60 %. Primer Sekvence Délka Pozice T[m] GC [%] Dimer 3’ dimer Vlásenka Left Right SAMOSTATNÝ PROJEKT Vaším úkolem je navrhnout vhodnou dvojici primerů ke genu, který jste identifikovali v sekvenci zadané v předchozím cvičení. Opět platí, že primery by měly zahrnovat počátek a konec genu tak, aby výsledný PCR produkt obsahoval celý gen. Zkontrolujte T[m] obou primerů, možnou tvorbu dimerů a vlásenek, primery by měly mít délku mezi 20 a 28 bp a obsah G+C bazí by měl být mezi 40 a 60 %.