Palindromy, reštrikční enzymy, primery C2131 Úvod do bioinformatiky Jaro 2024 Mgr. Josef Houser, Ph.D. Nukleové kyseliny • Dlouhý, nerozvětvený polymer tvořený čtyřmi typy monomerů. Informace je uložena v pořadí (sekvenci) monomerů. • DNA-deoxyribonukleová kyselina-vlastní nosič genetické informace (skoro vždy) • RNA-ribonukleová kyselina • Sekvence je vždy zapisována od 5' ke 3' konci Interakce nukleová kyselina - protein Přenos genetické informace je vícekrokový proces Všechny kroky probíhají za účasti proteinů Translace Interakce nukleová kyselina - protein Modifikace NK Regulace exprese Proteiny se podílí i na dalších interakcích y Transport s nukleovými kyselinami Degradace Translace Replikace Transkripce DNA DNA RNA '-> r J Interakce nukleová kyselina - protein Interakce protein - nukleová kyselina může být: • Nespecifická - vazba na cukr-fosfátovou kostru • Specifická - zahrnující rozpoznávání bází = sekvence Nukleosom - nespecifická interakce histonu s DNA TATA-vázající protein - specifická interakce Palindromy Palindrom • Specifický případ sekvence, která je z obou stran stejná Matematika Jazyk Hudba 0 11 121 12321 123321 95135753159 *■—*v ; A OKO KAJAK RADAR Kobyla má malý bok. Jelenovi pivo nelej. fgpATAl^ Joseph Haydn Symfonie 47 v G dur Palindrom • V biologii (biochemii) se palindromy vyskytují v sekvencích DNA • Aby mohla být sekvence palindrom, MUSÍ se číst zepředu a zezadu stejně - POZOR, sekvence biopolymerů (proteiny, DNA, RNA) jsou orientované!!! A proto: DNA: TCATGA Protein: MELEM Sŕ RNA/ssDNA: AGCCGA Sŕ W 5'-T-C-A-T-G-A-3' 3'-A-G-T-A-C-T-5' /V-Met-Glu-Leu-Glu-Met-C 5'-A-G-C-C-G-A-3' = 3'-A-G-T-A-C-T-5' # # 5'-T-C-A-T-G-A-3' C-Met-Glu-Leu-Glu-Met-A/ 3'-A-G-C-C-G-A-5' ~ 5'-T-C-A-T-G-A-3' 3'-A-G-T-A-C-T-5' Palindromatické sekvence v DNA Sekvence, která je totožná s KOMPLEMENTÁRNÍ sekvencí (vždy sudý počet nukleotidů) Dvoupísmenné (celkem 4, bez zvláštního významu) Čtyřpísmenné (celkem 16) Šestipísmenné (celkem 64) Delší AATT TATA GATC CATG ATAT TTAA GTAC CTAG AT TA AGCT ACGT TGCA TCGA GGCC GCGC CGCG CCGG CG GC AAATTT AATATT ATATAT ATTAAT TAATTA TATATA TTATAA TTTAAA AAGCTT Výskyt palindromů v DNA • Náhodný - čistě statisticky se mohou palindromy vyskytovat často: • Dvoupísmenný - průměrně každá 4. dvojice • Čtyřpísmenný- průměrně každá 16. čtveřice • Šestipísmenný- průměrně každá 64. šestice • Cílený-využívaný buňkou pro rozpoznávání/manipulaci DNA • V reálné DNA je náhodný výskyt palindromů potlačen (je jich méně, než by se dalo čekat na základě náhodného výskytu) Struktura DNA palindromů Standardní -a-g-g-a-c-t-a-g-a-t-a-t-c-c-t-a-g-t-a-g-párování .................... -t-c-c-t-g-a-t-c-t-a-t-a-g-g-a-t-c-a-t-c- t — a i i a — t Tvorba vlásenek g — c i i -a-g-g-a-c-t-a c-t-a-g-t-a-g- t-c-c-t-g-a-t g-a-t-c-a-t-c- i i c — g i i t — a i i a — t Palindromy a interakce s proteiny • Díky palindromu se opakovaná sekvence vyskytuje dvakrát naproti sobě • Protein může rozpoznat DNA na dvou blízkých místech • Dimer proteinu může vázat obě místa ^^^^ • Výrazně silnější vazba J | • Vyšší specifita _A_G_G_A_C_T_A_G_A_ _A_T_C_C_T_A_G_T_A_G_ I I I I I I I I I I I I I I I I I I I I -t-c-c-t-g-a-t-c-t-a-t-a-g-g-a-t-c-a-t-c- Reštrikční endonukleasy Reštrikční endonukleasy • Nukleasy - proteiny štěpící DNA • Exonukleasy - štěpí DNA od konce • Endonukleasy - štěpí DNA uvnitř řetězce • Reštrikční endonukleasy - štěpí DNA po vazbě na určité místo sekvence (často jde právě o palindrom) Restrikční endonukleasy (RE) • RE jsou enzymy bakteriálního původu • Typicky existují v komplexu s methylasou, která methyluje vlastní DNA • Slouží pro ochranu před bakteriofágy - i\p štěpí fágovou DNA (nemethylovanou) Název restrikčních endonukleas • První písmeno rodového jména • První dvě písmena druhového jména • Další rozlišení (kmen, typ...) • Pořadové číslo v daném organismu Napf.: EcoRI - Escherichia coli RY13 Bam HI - Bacillus amyloliquefaciens H Sad - Streptomyces achromogenes Hindlll - Haemophilus influenzae Rd Sail - Streptomyces albus G \E^cherichia(cdjli kmen0ŕl3 (^rvm)popsaná restriktasa z této E. coli Roberts RJ et ol.: Nucleic Acids Research, 2003 Klasifikace RE • Klasifikace podle místa štepenia kofaktorů • Typ I - proteinový komplex, náhodné místo štěpení • Typ II - štěpí v definovaném místě v blízkosti rozpoznávané sekvence, Mg2+ ionty jako kofaktor • Typ III - hydrolyzují ATP, specifické místo štěpení • Typ IV-štěpí modifikovanou DNA (např. methylovanou) Table I. Subtypes of Type II REases Subtype* Defining feature Examples Recognition sequence • Existuje větší množství podtypů ? E F G H M P s T Note that not all suhtvpes are mutuatlv exclusive E.g 14*11 is of subtvpc P and T The ahhrcvialion indicates double strand cleavage as shown below: 5'CCÍTNA OC 3'GG ANTtCG Asymmetric recognition sequence Cleaves both sides of target on both strands Symmetric or asymmetric target. R and M functions in one polypeptide Two targets: one cleaved, one an effector Two targets, both cleaved coordinate!) Symmetric or asymmetric target. Affected by Ado Met Symmetric or asymmetric target. Similar to Type I gene structure Subtype IIP or IIA Require methylated target Symmetric target and cleavage sites Asymmetric target and cleavage sites Symmetric or asymmetric target. R genes are heterodimers Fold GGATG (9/131 Acil CCGC (-3/-II Bcgl (10/121 CGANNNNNNTGC 112/10) Gail CTCGAG (16/141 HaelV (7/131 GAYNNNNNRTC 114/9) Bcgl (10/12) CGANNNfMNTGC (12/10) EcoRH ICCWGG Nael GCClCCC Sfil ggccnnnnInggcc SgrAI crIccggyg Bsgl GTGCAG (16/141 Eco57l CTGAAG 116/141 Bcgl 110/12) CGANNNNNNTGC (12/10) Ahdl GACNNNÍMNGTC Dpnl Gm6 A4-TC EcoRI gIaATTC PpuMI rg-lCWCCY ílu ccnnnnnInngg Foil GGATG (9/13) Mmel TCCRAC (20/18) BpulOI CCTNAGC (-5/-2I* Štěpení-tvorba konců na DNA RE typicky štěpí obě vlákna DNA ve stejném místě sekvence V závislosti na pozici štěpení mohou vznikat: • 5' převislé konce (5' overhangs) • 3' převislé konce (3' overhangs) • Tupé konce (blunt ends) BsiWI 5' C |g t a C G 3' 3' G C a t GlC 5' 5' 3' Sphl g c a t g c g t a c g 3' 5' 5' |g t a c g 3' c 5' 3' 3' 5' 3' g c a t g c 5' 3' c a t g 5' _5jc 3' Ig t a c g 3' 5' Dral 5' 3' Schizomery • Isoschizomery-dvě RE, které mají stejnou specifitu (rozpoznávají stejnou sekvenci a štěpí ji stejně) Hpall: GkGG Mspl: GkGG • Neoschizomery - rozpoznávají stejnou sekvenci, avšak štěpí ji různě Aatll: GACGT^C Zral: GAGIgTC Využití restrikčních endonukleas Charakterizace fágové DNA Tvorba velikostních standardů DNA Analýza DNA - mutace, množství kopií genů Příprava DNA pro sekvenaci a další analýzy Modifikace DNA (klonování) - tvorba GMO Lambda Lambda DNA/EcoRI DNA/Hindlll Marker. 1 Marker, 2 bp ■ 21226* Lambda pBR322 DNA/EcoRI* DNA/BsuRI Hindlll IHaellll Marker, 3 Marker, 5 - 23130- - 9416 ■ 6557 - 436!" 0.7%agarose 1%agarose 1%agarose 2.5%agarose 'Cohesive ends Ithe 12 nt cos site of lambda ONAI may anneal and form additional bands. DNA/BsuRI IHaellll Murker. 9 bp |- 1353 ■ 1078 I- 872 ThermoFisher Scientific Naštěpená fágová DNA sloužící jako velikostní standardy pro DNA elektroforézu Databáze restrikčních endonukleas Typicky spravované výrobci restrikčních endonukleas • Pozor: Mohou obsahovat jen enzymy daného výrobce ! Obsahují název, rozpoznávané místo, způsob štěpení a další informace Často včetně nástrojů pro analýzu a vyhledávání Příklady: • New England Biolabs (NEB) • REBASE (spravováno NEB) • ThermoFisher Scientific • a další MGRCk PROD U CTS - SE RVICES - I NOU STRI 6 S" Conned Your Lab Stgn In • Quick Order ^"J Restriction Enz 1 in "Wire 5-SHTy iymrnt ■ O En gl m «lid Call L nii(|o-. ft IjPCB Pri-h.-. F VI-Ml ;.„..:>■.-., :-. Thermo Fisher Scieniific is actively responding 10 the current Coronavirus SARS-CoV-2 outbreak. Learn rr RnBicbon En/ymrs—Ttwima St FastDigest Enzyme Selection Tool Enter product nam* iioschiiomer mmi recognition sequence or SKU tiuml OpUnwl reaction Tneimal Catalog! Product lioiehliomtn Cut alt* md teo.ua nc* Overhang temperature Inactlvatlon Melhylatlon Effecte FD0703 fawfJigeM 8sal Bso3ll G6TCTCN"2ni IC03II BipTNI CCAGiGHNWtfjJ FD0Í94 FasrD^st Bsal Bso31l MfCTWflH EC031I BipTNl MKKMMM F DM54 MBa)Ml flsmft CGTCTeN-JEE E*p3l BUGZ53I «AGMNNMNr*3 (liStlissi Eiplfll Eap23J 85"C. b mm Dam no effect EcoKI noelfecl 85"C 5 rran Dam no effect EcoKI 1,-1 f'ilf-i-r 5 protruding 37" C REBASE Nejobsáhlejší („kompletní") databáze restrikčních enzymů http://rebase.neb. com/ REBASE8 The Restriction Enzyme Database Use this tool as a guide to the ever-changing landscape of restriction enzymes. REBASE is a dynamic, curated database of restriction enzymes and related proteins. RESOURCES O Data files Sequence data PacBio data Crystal Data Methylation Sensitivity SEARCH O use quotes around phrases Lists and compilations Tools Enzymes Genomes Suppliers Publications Related websites FTP Advanced Search 1 Clear by enzyme name or number WHAT'S NEW? cjja SUBMIT DATA SUBSCRIBE ><] CONTACT US ABOUT REBASE f=\ CITING REBASE HELP {"'Classic REBASE Enzymy podle typů, podle rozpoznávaných sekvencí, ... REBASE Lists Citing REBASE- Enzyme Navigation Tables: • AU Acronyms... • Enzymen Grouped tav Tvpe • Prototypes neoschizomers... ■ Newest Enzymes REBASE Genomes: • Genome List... • Genomes with |hotgnii_ • Archaea --.luiimaiy ■ Bacteria summary Sequence Collections: DoAvnload DNA Protein sequences... CollecT cngtocnized FagtA files Type II specificities... Sequenced Type II R genes... Methvltrarisferases... Mediv-iimiifeia^es with protein seqs..-M::hv.'iT.:idf::-:.-:tJ "m-.:h rtii . Cloned Sequenced enzymes... COG table ?D table... RM ?ene coordinates in sequenced genomes... Genbaiik Cross Reference... Protein Id Cross Reference. . Ur.i?n'"7 Tools & Resources > Selection Charts > Alphabetized List of Recognition Specificities Alphabetized List of Recognition Specificities All restriction endonuelease recognition spec ficities available from New England Biolabs are listed below. For enzymes that recognize non-palindromic sequences, the complementary sequence of each strand is listed. For example, CCTGfTVS) and (6/7)GAGG both represent an Mnll (NEB #R0163) site. All recognition sequences are written 5' to 3' using the single letter code nomenclature with the point of cleavage indicated by a 7". Numbers in parentheses indicate point of cleaveage for non-palindromic enzymes. For example, GGTCTC(1/5) indicates cleavage at: 5' . GGTCTCN/. .3' 3' ...CCAGAGNNNNN/...5' Recognition Sequence AA/CGTT A/AGCTT ®p xi-:\v r;x(j.A\D ;i:;;: : BwLabs,, uj Genuine Applications & Products Tools & Resources Support About Home > Tools & Resources > Interactive Tools Interactive Tools NEB Tools AAT/ATT ;aatt ACATST A/CCGGT Competitor Cross-Reference Tools Use this tool to select another company's product and find out which NEB product is compatible. Choose either the competitor's product name or catalog number from the available selections, and this tool will identify the recommended NEB product. Double Digest Finder Use this tool to guide your reaction buffer selection when setting up double-digests, a common timesaving procedure. Choosing the right buffers will help you to avoid star activity and loss of product Exo Selector Use this tool to simplify the process of selecting the appropriate exonucleases for use in your nucleic acid digestion workflows. The tool guides you to product recommendations based on your answers to a few simple questions. NEB Golden Gate Assembly Tool Use this tool to assist with in silico DNA construct design for Golden Gate DNA assembly. It enables the accurate design of primers with appropriate type IIS restriction sites and overlaps, quick import of sequences in many formats and export of the final assembly, primers and settings. (Search NEB DNA Sequences and Maps Tool Use this tool to find the nucleotide sequence files for commonly used molecular biology tools, including plasmid, viral and bacteriophage vectors. Enzyme Finder Use this tool to select restriction enzymes by name, sequence, overhang or type. Enter your sequence using single letter code nomenclature, and Enzyme Finder will identify the right enzyme for the job. Glycan Analyzer Use this tool to interpret Ultra or High Pressure liquid chromatography (UPLCyHPLC) N-glycan profiles following exoglycosidase digestions. NEBaseChanger NEBaseChanger can be used to design primers specific to the mutagenesis experiment you are performing using the Q5 Site-Directed Mutagenesis Kit. This tool will also calculate a recommended custom annealing temperature based on the sequence of the primers by taking into account any mismatches New England Biolabs - NEBcutter Tvorba restrikčních map Detailní analýza restrikčních míst *ňspl03I N EBcuttef version 3.0.15 Open Recent Project Projects will be automatically deleted 7 day(s) after they were last accessed. Disable cookies© WELCOME GUEST 5 i3\ Enter a DNA sequence, or select from other options, to identify cut sites. Once you submit a sequence, you may choose to customize your digest. 1. Input or choose sequence. © File Text GenBank Plasmid Vector Viral & Phage Type or paste sequence 2. Set preferences. © |_ Circular Additional Preferences (enzymes, oligos, etc) 3. Name project (optional). © Enter project name *FspfiI ttMsd Willi nOrdll *MspSC27II tl1ll.ll WARNING: Not all enzymes shown See linear display PflFI Tthllll U>aF13I BstZ17I mfl *Baul417V ScoDS2II *Lsp48III , ,.,,„, NhaXI *UbaF12I' — CFrMHieVI r.-.-.;",' *AloI Pcr308II *Rsp531II Reštrikční mapa plazmidu Primery Replikace DNA • Aby se mohla buňka dělit, je nutné vytvořit kopii její DNA • Podobně je nutné zkopírovat i DNA případných organel (mitochondrie, plastidy) • Celý proces je komplexní, vyžaduje přísun stavebního materiálu, energie a podílí se na něm řada enzymů https://www. healthcanal. com/ Replikace DNA • DNA je dvouvláknová - je nutno ji „rozplést" • Na základě párování bází je ke každému vláknu doplněno vlákno komplementární • Syntéza nového vlákna probíhá VŽDY ve směru 5'—»3'. To znamená, že: • Jedno vlákno je syntetizováno nepřetržitě • Druhé vlákno je syntetizováno „v protisměru" po krátkých úsecích (tzv. Okazakiho fragmenty) • Syntéza každého úseku DNA začíná krátkým oligonukleotidem zvaným PRIMER Replikace DNA-Schéma Počátek replikac (ori) Směr prodlužování vlákna Směr replikace 3' 5 I f I I > I ľ I I I I I 3 Směr prodlužování vlákna Chromozom/Plazmid I I I I I Původní vlákno DNA I I I I I Nové vlákno DNA 5' 3' Nukleotid Primer Na procesu se podílí řada proteinů: • DNA polymerasa • Primasa • Ligasa • Topoisomerasa • „Svorky' • Replikační faktory r" Replikace DNA DNA replication Pre-replicative complex formation and transition to replication Purine Metabolism Pyrimidine Metabolism Genes coding for enzymes/proteins involved in DNA replication Overall direction of replication % "Winged helix" DNA-binding domain p 31 13-6.4.121 Helicase Topoisomerase I 15.99.1.2 | 29 Topoisomerase Topoisomerase III ,29 Topoisomerase IV 15.99.1.3 f*39 Model for translesior DNA synthesis ,24 DNA primase men domain- 4? ^plication factor-C containing protein ■ Sliding clamp 30 12.7.7.71 DNA polymerase (Polot) 7.7.71 DNA polymerase (Pol5) 8 15.5.1.11 DNAIigase Laggingstrand with Okazaki fragments 45 l A model for UbpX function in the regulation of PCNA deubiquitylation Single-stranded binding proteins 26 p Proliferating cell nuclear antigen 35 2.7.7.7 | DNA polymerase (Pole) Sliding clamp *gf Base excision repair of AP sites Nucleotide excision repair Double strand break repair and homologous recombination ^1 Replication termination factor Leadingstrand http://mpmp. huji. ac. il/maps/dnareplication. html Polymerázová řetězová reakce (PCR) Replikace DNA in vitro (ve zkumavce) • Využívá DNA polymerasu z termofilních organismů - je stabilní a aktivní při vysoké teplotě • Je založena na vícenásobném opakování cyklu: • Rozvolnění DNA (denaturing) • Nasednutí primerů (annealing) • Syntéza komplementárního vlákna (extending) Po lym e rázová řetězová reakce 11 11 i i i i 111 i i i 1111 i i i i Vstupní (templátová) DNA denľturace I I I I I I I I I I I m Nasednutí Ě7z I I I I I I I I I I I ^\(annX) 45-60°C ^ \ I I I I I I I I 72°C ITT ........... Syntéza DNA (extending) Po lym e rázová řetězová reakce Počet molekul DNA vzrůstá (teoreticky) s druhou mocninou Po prvním cyklu - 2 molekuly Po druhém cyklu - 4 molekuly Po třetím cyklu - 8 molekul 4lh cycle AA/VVVW\A ✓W\ target ÄÄSÄÄÄ?^ 2"° cycle Í^ÄÄÄr^Ä 3* cycle ÄÄ^ÄÄÄ^ÄÄ y cycle 1« cycle template DNA Po 25. cyklu - 33,5 mil. molekul Po n-tém cyklu - 2n molekul / ÄÄ^ÄÄŕ^ÄÄ 3" cycle 2^ cycle W^ÄÄ^ÄÄ, »■ cycle 2* = ? = 2' = 4 copies 8 copies 16 copies 32 copies ► 40 cycles 1 bilion copies Rodriguez-Lazaro D. 2013 Komponenty PCR • Templátová DNA • Termostabilní DNA polymerasa • Primery - krátké DNA nebo RNA oligonukleotidy • Deoxynukleosidtrifosfáty (dNTP) - stavební materiál a zároveň zdroj energie NH. NH2 • Mg2+ ionty - kofa ktorý pro enzymy • Vhodné prostředí - pH, iontová síla t í S hAo OH ÓH 0 0 0 II II II OH N I OH Tvorba primem v organismu Organismy používají RNA primery Syntetizovány DNA-dependentní-RNA-polymerasou (primasou) Pozice primerů (a tedy jejich sekvence) není striktně dána Během replikace jsou následně odbourány a nahrazeny DNA Lidská primasa (PDB ID 4RR2) Umělá syntéza primerů • Syntetické primery je možno vytvořit jako RNA i DNA primery • DNA primery jsou stabilnější a používají se častěji • Syntetické primery lze použít k: • Replikaci DNA in vitro • Vložení mutace do DNA - substituce, delece, inzerce • Vložení nestandardní báze - např. značené (fluorescenčně, izotopově) Design primeru • Syntetické primery mají definovanou sekvenci • Konkrétní sekvence primeru je závislá na účelu použití • Nejjednodušší aplikace - tvorba kopií žádaného úseku DNA • Primery jsou zcela komplementární k začátku a konci sekvence • Tzn. primery mají stejnou sekvenci jako vlákno v orientaci 5'—»3' • Pro speciální aplikace se může sekvence primeru a DNA lišit ! Parametry primeru • U každého primeru (resp. každého oligonukleotidu) lze definovat několik parametrů • Parametry jsou dané zejména sekvencí primeru (a částečně podmínkami) • Délka primeru (počet bazí/nukleotidů) • Obsah guaninu a cytosinu (G+C) v sekvenci primeru • Teplota „tání" (Tm) • Tendence k tvorbě sekundárních struktur • Specifita nasednutí Délka primeru • Běžné primery mají délku 17-28 bp (base pairs = párů bazí) • Délka primeru má vliv na ostatní parametry (Tm, specifita) • Krátké primery mají nižší specifitu (viz dále), jsou „univerzálnější" • Dlouhé primery (až 40+ bp) se používají zejména pro cílené modifikace DNA Obsah G+C bází v primeru • Typické primery jsou tvořeny čtyřmi základními bázemi (A, C, G, T pro DNA, příp. A, C, G, U pro RNA) • Vzhledem k tomu, že při kanonickém párování se guanin vždy páruje s cytosinem, obsah G+C v primeru (jednom vláknu DNA) odpovídá i obsahu G+C ve dvouvláknové DNA • Logicky pak platí, že: (obsah G+C [%]) = 100 - (obsah A+T [%]) • Vyšší obsah G+C znamená vyšší stabilitu při párování bází Teplota tání primeru • Každý oligonukleotid (tedy i primer) je schopen se párovat se svým komplementárním vláknem (tvoří tzv. duplex) • Stabilita duplexu je závislá na délce primeru, sekvenci (obsahu G+C), teplotě a iontové síle prostředí • Stabilita klesá s rostoucí teplotou - duplex se snáze rozpadá • Teplota tání primeru (Tm) je teplota, při níž je právě polovina molekul primeru volná a polovina vázaná v duplexu 50 75 100 Temperature °C Upraveno z www.khanacademy.org Teplota tání primeru Tm lze stanovit experimentálně, častěji je však odhadována výpočtem Pro určení Tm se používají různé vzorce. Např. Tm [°C] = AH° AS° + R x In c, -273,15 kde AH°je entalpie tání, AS0 je entropie tání, R je molární plynová konstanta, cpje koncentrace primeru Výpočet může zahrnovat také efekt iontové síly roztoku. Např. Tm (corrected) -1 m (4.29 - - 3.95) * ln(m) + 0.94 * (ln(m)); 10 -5 kde Tm je teplota tání dle předchozího vztahu, f je zastoupení G+C bází, m je koncentrace monovalentních iontů Teplota tání primeru • V rámci PCR je nutné aby primery opakovaně nasedaly na templátovou DNA • Typická Tm používaných primerů se pohybuje v rozmezí 50 - 65°C • Zároveň je potřeba, aby se oba použité primery chovaly podobně -fungují zároveň v jedné reakční směsi • Rozdíl T obou primerů by měl být ideálně menší než 2°C Sekundární struktury primeru • Jako každá nukleová kyselina, i primery mohou tvořit sekundární struktury • V případě primeru jsme schopni rozlišit: * Vlásenky • Dimery • Pro účely PCR je tvorba sekundárních struktur u primeru nežádoucí • Při analýze sekundárních struktur nás obvykle zajímá ta nejstabilnější Sekundární struktury - dimerizace Pokud se v rámci primerů nachází vzájemně komplementární sekvence (v podstatě obsahují palindrom), mohou molekuly tvořit tzv. homodimer 5' CCGATCAAATCACAGGT 3' I I I I . TGGACACTAAACTAGCC 5 5' CCGATTAAATCTCGGAT 3' II II INI , 3 T AGGC T C T AAAT T AGC C b Stabilita dimeru je dána teplotou tání komplementárního úseku V extrémním případě může dimer tvořit celý primer Úseky kratší než 4 nukleotidy jsou málo stabilní Sekundární struktury -dimerizace Při PCR používáme typicky dvojici primeru. Pokud jsou navzájem komplementární části v jednom a druhém z nich, mohou tvořit tzv. heterodimer PrimerA PrimerA 5' CCGATCAAATCACAGGT 3' 5' CCGATCAAATCACAGGT 3' lili MM 3' T AGGC T C T AAAT T AGC A 5' 3' TAGGC TC TAAAT TAGCA 5' PrimerB Primer B Pro stabilitu heterodimeru platí totéž, co pro homodimer. Někdy může vznikat několik různých dimerů Sekundární struktury - vlásenky • Pokud se vzájemně komplementární sekvence v rámci primeru nachází ve vhodné orientaci (nepřekrývají se), mohou molekuly tvořit vlásenky _k 5'cCGATTA 5 CCGATTAAATCTCGGAT 3' ^—y> I I I I A 3' TAGGCTCTA • Stabilita vlásenek je dána teplotou tání komplementárního úseku a velikostí vlásenky • Příliš malé (< 3 nt) a příliš velké vlásenky nejsou příliš stabilní Sekundární struktury • Tvorba sekundárních struktur DNA je vratná - systém se nachází v rovnováze, zastoupení sekundární struktury závisí na podmínkách • Sekundární struktury brání nasedání primeru na templátovou DNA • Obzvláště nevhodná je tvorba sekundárních struktur na 3' konci primeru - blokují prodlužování primeru = syntéza DNA neprobíhá I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I možná ? STOP* Specifita primeru • Primer většinou cílíme na konkrétní místo na DNA • Templátová DNA je většinou výrazně delší než cílová sekvence • Sekvence je volena tak, aby možnost nasednutí na jiné než požadované místo byla co nejmenší • Prodloužení primeru zvyšuje specifitu • Posun cílové sekvence primeru vpřed/vzad, je-li to možné • Snaha nezařazovat na 3 konec G+C bohatou sekvenci • Pokud je známa sekvence vstupní DNA (plazmid, genom), je vhodné otestovat možná místa „falešného nasedání primeru" (falše priming sites) Specifita primem - false priming sites • Nasednutí na nežádoucí místa snižuje množství primerů pro požadovanou reakci • V případě nežádoucího nasednutí dvou primerů v blízké oblasti může dojít k tvorbě nežádoucích produktů Možný nežádoucí produkt PCR _ Primery Cílová místa \/ Místa chybného nasednutí Templátová DNA Chtěný produkt PCR Design primeru - obecné parametry Optimální parametry pro namnožení kopií požadovaného úseku DNA • Délka primeru: 17 - 28 bp • Obsah G+C: 40-60% • Teplota tání Tm jednotlivých primeru: 50 - 65°C • Rozdíl Tm levého a pravého primeru: < 2°C • Sekundární struktury na 3' konci: žádné • Sekundární struktury: žádné nebo nestabilní • Možná místa chybného nasedání: žádná Design primeru - namnožení úseku Potřebujeme-li namnožit konkrétní úsek DNA (např. gen): • Začátek a konec sekvence je striktně daný - pozici primeru lze měnit jen omezeně Možný rozsah pozic levého primeru ■..........■—:...........: Cílový úsek ...TTCCCCCGCGGATGCCTACCGCTCGGGGAACATCGACATCTCTGTGTTCTTCCAAGCTAGCGGCGTCTCCTTGCAGCAGTTGGTCCATCACGGTTGGATGAATGGATCTCCGGCAC. ...AAGGGGGCGCCTACGGATGGCGAGCCCCTTGTAGCTGTAGAGACACAAGAAGGTTCGATCGCCGCAGAGGAACGTCGTCAACCAGGTAGTGCCAACCTACTTACCTAGAGGCCGTG. Možný rozsah pozic pravého primeru Špatné nasednutí primeru není žádoucí ale nemusí být kritické - případné nežádoucí produkty lze často odseparovat Nežádoucí produkty Žádaný produkt Design primeru - detekce genu Je-li cílem určit, zda je či není přítomen gen (varianta genu): • Primery mohou nasedat jak uvnitř genu tak vně - velká variabilita Možný rozsah pozic levého primeru .......:<_>■...............: Detekovaný gen ...TTCCCCCGCGGATGCCTACCGCTCGGGGAACATCGACATCTCTGTGTTCTTCCAAGCTAGCGGCGTCTCCTTGCAGCAGTTGGTCCATCACGGTTGGATGAATGGATCTCCGGCAC... . . .AAGGGGGCGCCTACGGATGGCGAGCCCCTTGTAGCTGTAGAGACACAAGAAGGTTCGATCGCCGCAGAGGAACGTCGTCAACCAGGTAGTGCCAACCTACTTACCTAGAGGCCGTG. . . ■!!!"!!!!!!!!!!: <-> -li!!!!!!!!!!" li Možný rozsah pozic pravého primeru Možné nežádoucí produkty jsou rizikové- , , n Zadaný produkt ? možnost falešně pozitivních výsledků — Nežádoucí produkt ? Žádaný produkt Možnosti modifikace primeru-aplikace Velké množství různých aplikací. Např.: • Sekvenace DNA-použití jediného primeru • Mutageneze - použití primeru se změněnou sekvencí • Modifikace množené DNA - primery z několika částí z nichž jedna je komplementární k templátové DNA, zatímco zbytek má jinou funkci (např. usnadňuje vložení namnoženého genu do cílové molekuly DNA nebo ukotvení na povrch) Sekvenace nukleových kyselin 0-(p)-(p)-OCH2 .O Base H H Sangerova sekvenace • Zavedena 1977 • PCR syntéza řetězce DNA s náhodným vložením značených dideoxynukleotidů • Separace produktů pomocí gelové elektroforézy -..................- Template ,— ddNTPs 5'-5'-5' s T ST 5't 5'T 5't 5' T r ddTTP ■ ddCTP-ddATP ■ ddGTP ■ f 3' t 3' T* 3' TT*3' V 3 TT^3' H H Didcoxynuclcotidc (ddNTP) A Laser e\ejc^pV->o 3'): Reverse complement [51 -> 3'): Reverse sequence (5' -> 3'): Complement sequence (5r -> 3') Base composition: GC content [%]: Melting temperature [°C] Extinction coefficient: CCG ATC AAA T CA CAG GTC A TGA CCT GTG ATT TGA TCGJŕ ACT GGA CAC TAA ACT \GC C GGC TAG TTT AG""" GTC CAG T a v7 i y.;( y>*^ob:: •1/1 % 54.5 °C 213.500.00 Lxmoľ' x cm Velikost G+C obsah Homodimer OLIGO ANALYSIS TOOL [ Specify name and sequence of the oligo you would like to analyse Oligo Information ~ype Name: Sequence: DNA primerjeft Length: 19 mer MW: 5765.79 [g/mol] Properties OD Calc Dilution Calc Self-Dimer Check PCR Check ICheck if a self-dimer can be formed using this primer sequence in your PGR. Self-dimers are formed by intermolecular interactions between same sense primers, where the primer is homologous to itself. Analyse Check Setf-Dimer (opt. <= 14): 10 Maximum stack size: 4 CCGATCAAATCACAGGTCA I I I I ACTGGACACTAAACTAGCC Order as Primer 3 http://bioinfo. ut. ee/primer3/ Velké množství nastavitelných parametrů pro návrh primerů Primer3web version 4.1.0 - Pick primers from a DNA sequence. disclaimer code Select the Task for primer selection | generic Template niaskins before primer desisti (available species! Select species [Example: Mus musculus | Nucleotides to mask in 5' direction |1 Primer failure rate cutoff < |0.1 Nucleotides to mask in 3' direction 0 _ Mit V Stiďl. |mi J Paste source sequence below (5'->3r, string of ACGTNacgtn — other letters treated as N — numbers and blanks ignored). FASTA format ok. Please N-out undesirable sequence {vei Mhp riming Library (repeat library) | NONE t| _____■■ 'D huh--We^r. far Printer J&'i "L,i,Si II L ".iijLr. k _ * Pick left primer, or use left primer below Pick hybridization probe (internal oiigol. or use oligo below * Pick right primer, or use right primer below {5' to 3' on opposite ___±ji.UJ : I luiirua' O'-i: y.-:b 01".: C-(-;: e.g. ...A]! J forbids primers in the central CCCC. See manual for help. ---:--: E.g. 20,400; only pick primers in the 400 base region starting at position 20. Or use { and } hi the source sequence to mark the beginning and end of the included region: J e.g. in ATC {TTC...TCTJAT the included region is TTC...TCT. 3E3 Primer 3 • Automatický návrh primerů • Možnost zadat vlastní primer a dohledat k němu druhý • Jednoduchý výstup Primei'3 Output PRIMER PICKING RESULTS FOR Template masking not selected No mispriming library specified Using 1-based sequence positions OLIGO start len _tm _gc% any th 3' th hairpin sea, LEFT PRIMER 1 23 58.44 43.48 0.60 0.00 0.0B atgtctgatgtggatatcgaagc RIGHT PRIMER 212 20 5S.81 55.00 0.00 0.00 0.00 tagttgcttccgtagacccc SEQUENCE SIZE: 573 INCLUDED REGION SIZE: 573 PRODUCT SIZE: 212, PAIR ANY_TH COMPL: 0.00j PAIR 3' TH COMPL: 0.00 1 atgtctgatgtggatatcgaagcacaagatgctggccaaactctggttcaggtcatcagc >>>>>>>>>>>>>>>>>>>>>>> 61 attccgagcggcgagacgtgggttgcaatccaactgccatctcaatatcgttacttcgat 121 ttcgtattcgagaatgtcagcccaaccagttcgggctccgtgttggtggcacagatggct 181 ccgcagtccggcggggtctacggaagcaactactccggctcgggctgggggaatgatctt ««<<<<<<««««« 241 ggcggcggcggattttacggatactcggaggccaaatggatgtgtctctggccggcaaac 301 cgtagcggccccagcagcaagaccggcctctacggaacctgcaagctcatgaacctcaac 361 cagagcagtgcagttccctctgtgacttccaaccttttcgccccaaccgcgtacaagaat 421 gaacccggctatgccaacgttgggggatgctgtcaaaagatccgtgggttggcatcasgc 4SI atccagttcgctttcgctcttgccggcggaaatgtccctcaaaatacggacacatttaac 541 ggtggcaccatcaaggtctacggctggaactga Primer-BLAST Jednoduché rozhraní https://www.ncbi.nlm.nih. qov/tools/primer-blast/in dex. cpi Lze využít pro návrh primerů (využívá postupy Primerů 3), ale též pro kontrolu špatného nasedání vlastních primerů > HCBI National Center for Biotechnology Information SignintoNCBI Primer-BLAST A tool for finding specific primers Finding primers specific to your PCR template (using Primer3 and BLAST). Reset paae Save search parameters Retrieve recent results Publication Tips for finding specific primers PCR Template Enter accession, gi, or FASTA sequence (A refseq record is preferred) Range Vložení sekvence From To Forward primer Reverse primer ľ y Clear Or, upload FASTA file Primer Parameters Use my own forward primer (5'->3' on plus strand} Use my own reverse primer (S'->3' on minus strand) PCR product size # of primers to return Primer melting temperatures (Tm) Vybrat soubor Soubor nevybrán Clear Clear Min Max 70 1000 10 Min 57.0 Opt Max Max Tm difference 6C.0 63.0 3 Pri me r-B LAST: Specifita primeru Výběr databáze pro kontrolu falešného nasedání Specifikace organismu Exon/intron selection Exon junction span Exon junction match Intron inclusion Intron length range A refseq mRNA sequence as PCR template input is required for options in the section y No preference Exon at 5' side Exon at 3' side Minimal number of bases that must anneal to exons at the 5' or 3' side of the junction B Primer pair must be separated by at least one intron on the corresponding genomic DNA y Min Max 1030 1000000 Primer Pair Specificity Checking Parameters Specificity check | B Enable search for primer pairs specif c to the intended PCR template {£• Search mode_Automatic t | ,q,_ Database Refseq mRNA cxciumuri Exclude predicted Refseq transcripts (accession with XM, XR prefix) Exclude uncultured/environmental sample sequences ,y Organism Homo sapiens a iw aw Lnjjint.ni luiiiy (u\ uiyjniyii ymuLi nan e srrr miitjujujuyiijlhju. iitudi Acid more organisms s) taxonomy id or select from the suggestion list as you type y Entrez query (optional) Primer specificity stringency prjmer must have at least | 2 t | total mismatches to unintended targets, including at least | 2 *~\ mismatches within the last | 5 t | bps at the 3' end. y Ignore targets that have | 6 t | or more mismatches to the primer. & Max target size |4u00 Allow splice variants □ Allow primer to amplify mRNA splice variants (requires rerseq mRNA sequence as PCR template input) ^ Get Primers Show results in a new window Use new graphic view j^' ► Advanced parameters Primer-BLAST: Specifita primeru Piríliiei"-BLAST» JOB ID:WlCFVGzxWlGZ2RiaQJAUBMZUWI-CI(p_Pw Primer-BLAST Results Input PCR template none Specificity of primers Target templates were found in selected database: Refseq mRNA (Organism limited to Homo sapiens) Other reports >Search Summary QDetailed primer reports primer pair i Základní charakterizace navržených (nebo vložených) primerů Sequence (5'->3') Length Tm GC% Self complementarity Self 3'complementarity Forward primer CCGATCAAATCACAGGT 17 51 05 47 06 4 00 2 DC Reverse primer CCGATTAAATCTCGGAT 17 47.72 41.18 7.00 4.00 Products on target templates >XM 024446112 1 PREDICTED: Homo sapiens phosphodiesterase 4D (PDE4D), transcript variant X7; mRNA duct length - 2106 Forward primer 1 CCGATCAAATCACAGGT 17 Template 292 G.A.GT........... 398 Program detekuie i nedokonale nasednuti Forward primer 1 CCGATCAAATCACAGGT 17 Template 2397 GAA.G............ 2381 >XM 02444611U.1 pklzPCTHfflómo sapiens phosphodiesterase 4D (PDE4D), transcript variant X4; mRNA product length = 2106 Forward primer 1 CCGATCAAATCACAGGT 17 Template 292 G.A.GT........... 308 Forward primer 1 CCGATCAAATCACAGGT 17 Template 2397 GAA.G............ 2381 SW nástroje - plusy a mínusy • Výhody: • Usnadnění návrhu primerů • Často minimální nároky na znalost uživatele • U některých propojení s komerční firmou - možnost objednat syntézu • Nevýhody: • Pro některé cíle automatický design selhává • Použití bez znalostí parametrů může vést k chybám / v Hledání restrikčních míst i design primerů je možný manuálně, ale SW nástroje práci významně usnadňují Využití těchto postupů je velmi široké a nové aplikace se objevují každý rok Pochopení principů těchto technik je vysoce žádoucí pro každého pracovníka v oblasti biochemie a molekulární biologie