Sekvencování DNA • stanovení pořadí nukleotidů v molekule DNA (primární struktury) Sekvencovänl / Sekvenoväni ■ ■ Sequencing / die Sequenzierung / Techniky sekvencování • 2 klasické metody: - Chemická (Maxamova-Gilbertova) • Již se nepoužívá - Enzymová (Sangerova) • V současnosti se používá automatická varianta - společný rys obou metod: příprava a separace fragmentů DNA, jejichž velikost se liší o 1 nukleotid • Několik nových vysoce účinných metod nové generace (Pyrosekvencování, SOUD, Solexa, aj.) Základní požadavky pro úspěšné stanovení sekvence: ♦> Příprava knihovny pro sekvencování - DNA s přesně definovanými konci • s místem pro vazbu primem • s koncovou značkou ❖ Příprava souboru všech fragmentů ssDNA lišících se svou délkou o jeden nukleotid ♦♦♦ Přesné elektroforetické rozdělení těchto fragmentů na základě jejich délky Postup enzymatického sekvencování DNA 1. Příprava ssDNA jejíž sekvence má být stanovena 2. Rozdělení do 4 vzorků 3. Reakce s DNA polymerázou při níž se začlení do syntetizované DNA místo normálního deoxyribonukleosidtrifosfátu jeho analog, který působí jako koncový inhibitor syntézy DNA - dideoxvnukleosidtrifosfát (ddNTP). V každém ze 4 vzorků vzniknou fragmenty, které jsou zakončeny příslušným ddNTP (ddCTP, ddGTP, ddATP a ddTTP). Reakce obsahuje: •molekulu DNA •značený primer při pojující se k části molekuly DNA (místo odkud začínáme stanovovat sekvenci) •směs obsahující 4 normální nukleotidy •jeden ddNTP (v každém ze 4 vzorků je jiný) •DNA polymerázu 4. Denaturace produktů 5. Elektroforetická separace umožňující oddělení fragmentů lišících se délkou o jednu bázi 6. Detekce fragmentů, které nesou označený konec Dideoxynukleotidy nemají hydroxy 1 na 3'-konci Ribose Deoxyribose Dideoxyribose HO-CH2 HO-CH2 HO-CH2 23.4 DEOXYNUCLEOSIDE TRIPHOSPHATE 23.7 dideoxyribose blocks elongation Pokudje dideoxynukleotid inkorporován do syntetizujícího se řetězce, působí jako terminátor reakce HO H Nucleotide will join on here at 3' position Replikace DNA s normálními deoxynukleotidy Původní sekvence AGCCTGG CGACCATCGT TCGGACCGCTGGTAGCA Denaturovaný tem plátový řetězec 3' AGCCTGG CGACCATCGT 5' Prfektní kopie AGCCTGGCGACCATCGT TCGGACCGCTGGTAGCA Co se stane pokud při reakci použijete směs dGTP a ddGTP? AGCCTGG CGACCATCGT TCGGACCGCTGGTAGCA AGCCTGGCGACCATCGT A T C G T T A G C A T CG T C GG TCGGACCG TCGGACCGCTG TCGGACCGCTGG TCGGACCGCTGGTAG Enzymová metoda sekvencování DNA (Sanger) (A) deoxyribonukleosidtrifosfát dideoxyribonukleosidtrifosfát base base QQQ-o-ch2 o PlPleHO-CH2 n 3' OH / / je možno prodloužit řetězec na 3" -konci není možno prodloužit řetězec na 3' -konci (B) normální prekursory deoxy ri bon u kleosidtri-fosfátů (dATP, dCTP, dGTP, dTTP) ^_4GC.?A Gr£CA malé množství jednoho dideoxyribonukleosidtrifosfátu (ddATP) oligonukleotidový primer pro DNA-polymerázu j GCTACCTGCATGGA C GAT GGAC GT AC CXTG AAGCG vzácná inkorporace dideoxyribonukleosidtrifosfátu DNA-polymerázou zastaví další růst molekuly DNA 5' jednořetězcová DNA, která bude sekvenována nNA.9pniiPnr.inn mnw .—. V 3= 'V* " ;-~ «-* • ~ i ATGC ATGC ATGC ATGC Automatické sekvencování DNA • Je variantou enzymatického sekvencování DNA. • Syntéza DNA probíhá v jedné reakci • Ke značení produktů se používaj í čtyřmi různými fluorescenčními značkami označené • primery • dideoxyribonukleotidy Asymetrická PCR pro sekvencování Reakční směs Enzym, dNTR ddNTP, pufr Primer Pripojení primeru (50-55 jC) Prodloužení primeru (60-70 j C) Denaturace (95-96 i C) PRODUKTY Strategie barevných primem DENATURACE O c c PŘIPOJENÍ SYNTÉZA PRIMERU Enzyme, dNTPs, reaction-specilic ddNTP i O G*0 [Gl PRODUKTY A C C G T [A] O A E] O A C i A C CG O O A C C Gffl A C C G T A[T] Strategie barevných terminátorů DENATURACE PŘIPOJENÍ PRIMERU SYNTÉZA Enzyme, dNTPs, dye-labeled terminators PRODUKTY * o ♦ o * AO co A A A A CO CO GJO mm c c c C C G GO TO A C C G T\Ä\0 A C C G T A [Ť]< Princip detekce produktů • Detekce produktů probíhá během elektroforézy pomocí laserového detektoru (laserem indukovaná fluorescence, LIF) napojeného na počítač, který vyhodnocuje sekvenci. CACCGCATCGAAATTAACTTCCAAAGTTAAGCTTGG Fragmenty BARVY: - AMIDITOVÉ filtr žebříček HEX (černá) 6-FAM (modrá) TET (zelená) - ESTEROVÉ TAMRA (černá) JOE (zelená) 5-FAM (modrá) C TAMRA A ROX 520 540 560 580 600 620 640 WAVELENGTH (nm) 6-FAM - - - TET HEX TAMRA I | Fitter 1 Q Filter 2 Q Filter 3 Filter 4 Příklad fluorescenčního znační primem IRD70Q O-- C— tJ'-CŕVK^-TGľrtŕ^CGŕC-l1 I ú M Ti Forwarťf Rimw o - f—-o— aacaatticacacaůg — j 0 Eevarsa Přiměř Vícenásobné detekce u různě značených primem í i 1 H i 3 ■ • <■ ■ .i:i:".til- , Příprava gelu Laserový detektor Rezervoár pufru Automatické nanášení vzorku Soustava kapilár Genetický analyzátor ABI 3100 Vyhřívaná deska Příklad výstupu ....." F? B fa B TTQMT GCC-T OH 99 CQACTCT AQAQ94TCECC QQQTAOBA hSE-T CQA AT TCQTAA TCA T QQTeATAQCT QTT TCCT QT QTQA A AT T QTT A T CCQCTC A CA A T TCCA CACAA.C AT A.CQAQC CO 11 2£ » 40 ■ Éfl íí JO H 1M 110 US naccAJic««c«eaA4U4ca«T ttqcqtat la aacaccAQQqt aariTTier titcaccautua aAeaaQCAACA acTQATTQeccr 7CACCBCC7aůccc7ů*ůA.&AůTT&CAůCAAů :m aú m w m wa md iíq sai m mú :>-(■ QCQQT CCAďaCTQ QT T T QCCCCA Q CA.QQ CQA.A A A TC CTQTT T Q ATS QTQQT TCCQA AA.T CQQCA A A AT fE Cl TA T A A A T C AU A AQA AT AQCC fB AQA.T AQQQ TTQAQT QT TQT TCCA QTTTi wů tm 2íň 4W 41D- 4SÚ 1» 4*4 4BI- 4flD 4704« atCQT^A A.QCA.CTJUI A.TCQ UJLCCCT JlH AQQQ AQCCCCC Q AT T TA QAOC TTQA CQ QQQ A A A QCCQQ CQA A GQTQ QCQA QA A AQQAA Q QQAAQAA A3G-QAA AQQ AQCQQQC- Q T A Q99 ma iiň tsa ěta im- m ita im- ;od ;io ran 1 dráha na gelu Sekvencování genomů V praxi je velice často potreba stanovit sekvenci fragmentu DNA, který je delší než průměrná délka 500 - 1 000 bází dosahovaná v jedné reakci. K tomuto účelu sekvencování genomů mohou být zvoleny dvě zcela odlišné strategie: - náhodné sekvencování - uspořádané sekvencování sousedních úseků Příprava knihovny pro náhodné sekvencování genomů • Při náhodném sekvencování genomu jsou nejdříve připraveny mechanickým stříháním genomové DNA fragmenty s optimální velikostí (1 300 - 2 000 bp) a po úpravě jejich konců jsou nahodile nakloňovány do vhodného vektoru za vzniku velkého počtu klonů. • Ke štěpení DNA se využívá sonikace nebo pankreatická DNáza I za přítomnosti Mn2+. • Předpokládá se, že celková informace o sekvenci obsažená v připravených malých klonech odpovídá původní DNA a sekvence fragmentů jednotlivých klonů se vzájemně překrývají. • Pomocí univerzálních sekvenačních primem připojujících se k vektoru poblíž klonovacího místa jsou stanoveny sekvence krátkých úseků na koncích klonovaných fragmentů (minimálně 500 bází). • Stanovené sekvence jsou pak použity k uspořádání klonovaných fragmentů z jednotlivých vektorů do souvislých sekvencí genomové DNA - kontigů. Vektor Fragmentace C D Úprava konců a klonování ö°ö,P B C ÖÖ o I Sestavení překrývajících se klonů AB C J-J_L DE F G H I j_i_i_i_i_i Náhodné sekvencování o Nepokryté konce OBJASNENÍ Pouze 1 řetězec NESHOD USPOŘÁDANÉ SEKVENCOVÁNÍ - Pro doplnění sekvence mezer zbývajících po náhodném sekvencování - Pro sekvencování malých fragmentů DNA • Dva odlišné přístupy: - procházení primerem • vyžaduje znalost sekvence, ke které se připojuje primer, který umožní prodloužení řetězce DNA-polymerázou. • získaná sekvence z první reakce je použita pro návrh primem pro další reakci a tento krok se opakuje, dokud není dosaženo kompletního stanovení sekvence. • Tento proces nevyžaduje další klonování a minimalizuje stanovení nadbytečných sekvencí, ale správnost stanovené sekvence by měla být ověřena sekvencováním obou řetězců. - postupné zkracování fragmentu exonukleázou a tvorba sousedících delecí Metody uspořádaného sekvencování Procházení primerem \ I - » < * „ . , * DOKONČENÍ PROJEKTU Sestavení kontigů I O AMop •IM> 10 Kb foo Anotace (bioinformatika): ORF, repetice, regulační oblasti, -> geny, -> funkce Sekvencování Ity^A -► Kompletace Transkriptom • Čipy Hledání ORF -► Anotace Proteom * 2D-Eelektroforéza • MALDI-TOF-MS Nové přístupy pro stanovení sekvence DNA • Pyrosekvencování (454 sekvencování) • SOUD • Solexa • Komparativní genomové sekvencování prostřednictvím hybridizace Pyrosekvencování Sekvencování se syntézou DNA v reálném čase nevyžadující elektroforézu ani separaci fragmentů Je založené na uvolnění pyrofosfátu (PPi) při enzamatické syntéze DNA (Nyren et a ., 1987) 1. krok: Sekvenační primer hybridizuje k jed no řetězcové mu templátu a je inkubován s: • DNA polymerázou • ATP sulfurylázou ÍDNAV*nP-"-W™ • Luciferázou • Apyrázou • substrátem, adenozin 5'-fosfosulfátem (APS) • luciferinem 2. krok: První ze 4 dNTP - dATP je přidán k reakci - Pokud je na matrici komplementární báze, DNA polymeráza katalyzuje připojení nukleotidu k primeru - Pokud na matrici není komplementární báze nukleotid bude degradován apyrázou - Postupně budou přidány jeden po druhém všechny čtyři dNTP - Každé připojení nukleotidu je provázeno uvolněním pyrofosfátu (PPi) v množství ekvimolárním množství přidaného nukleotidu 3. krok: ATP sulfuryláza kvantitativně přeměňuje PPi na ATP za přítomnosti APS Sul(i ňlaie - Vzniklý ATP umožní luciferázou zprostředkovanou konverzi luciferinu MfltPH AIP na oxyluciferin, který vytvoří světelný záblesk zaznamenaný detektorem ^J^, -tirwii fotonů a zobrazený jako pík na pyrogramu nudaotidainwrporationginaratMiight sain m a [tak In lha pvmiram 4. krok: Apyráza degraduje nepřipojené dNTP a nespotřebované ATP dWTP- -frdHDF + dNMP + ptnpMa ATP-ApVraSC^ADP + MAP + phaphrtai - Až je degradace kompletní je přidán další dNTP, který je v pořadí Proces se znovu opakuje a sekvence je odečítána z pyrogramu Namísto standardního dATP je používán a-thiosubstituovaný dATP, který je přijímán DNA polymerázou, ale nikoli luciferázou Metoda je ve vývoji a je používána pro identifikaci jednonukleotidových polymorfizmu (SNPs) primer templátová DNA je degradován je degradován "o + dTTP - + dATP — + dGTP ^chemiluminiscence — + dCTP ^chemiluminiscence = + dTTP- je degradován + dATP ^chemiluminiscence: + | chemiluminiscence dGTP + dCTP ^chemiluminiscence | chemiluminiscence ^chemiluminiscence 1 1 ! ! 1......... -j-rGC I '......■ ■ 1 1111199ft...... ■ liji Cj CAGG I i ' I I......... T-n-r-rGCAGGCC dTTP ^chemiluminiscence = M + dATp — je degradován + , ■ , , ,GCAGGCCT Princip py ro se kve n cová n í pyrogram odečtená nukleotidová sekvence H B ■ K ofl cc t T rt Ů T A í C Ť A Ů přidaný nukleotid Pyrosekvencování (GS20 firmy 454 Life Sciences, rok 2005) Výhody Nevýhody • Vysoká přesnost • Flexibilita a možnost paralelního zpracování velkého množství vzorků • Snadná automatizace • Nevyžaduje elektroforézu a značené primery • Rychlost pyrosekvencování je cca 1 odečtená báze/min. • Maximální délka stanovené sekvence je cca 100 bp • 0,3 Gbp za týden Současná technologie pyrosekvencování Příprava jednořetězcové DNA knihovny - Umožňuje zpracovat různé typy vzorků • genomové DNA • produkty PCR • BACs • cDNA - Frakcionace dlouhých úseků na 300- to 800-bp fragmenty - Vazba dvou adaptorů A a B - specifických pro 3'- a 5'-konce na každý fragment • Adaptor A obsahuje vazebné místo pro primer • Adaptor B B obsahuje 5'-biotinovou značku, která slouží k imobilizaci DNA knihovny na mikrosféry (DNA Capture Beads) pokryté streptavidinem Současná technologie pyrosekvencování - Separace kuliček a výběr pouze těch, které obsahují navázaný jediný fragment ssDNA Klonální amplifikace knihovny v emulzi - emulzní PCR, amplifikační reagencie ve směsi voda-olej -> mikroreaktory obsahující jedinou kuličku s unikátním fragmentem DNA z knihovny - (107) kopií Pyrosekvencování Analýza dat s využitím bioinformatických nástrojů Sekvenátor FLX firmy Roche Pyrosekvencování (One Bead = One Read) Kuličky se z emulze extrahují a jsou umístěny pomocí centrifugace do PicoTiterPIate, čipu z optických vláken o rozměrech 70 x 75 mm MAS 3 »V 2£ínm«50 Průměr jamek PicoTiterPIate dovoluje umístění pouze jedné kuličky průměru 28 ^ (im • Na jednom čipu je 1 600 000 jamek Převrstvení směsí obsahující reagencie pro pyrosekvencování, enzymy jsou rovněž imobilizovány na malých mikrosférách • Spodní část čipu je v optickém kontaktu s dalšími optickými vlákny napojenými na CCD senzor - zachycení až 10000 emitovaných fotonů na 1 nukleotid I I I I I I I I i I I I I I I J a A. JBdC QCCATGCT A A A G T C A* am liic:if5' exonukleázová aktivita DNA polymerázy • homopolymerní úseky - Pozitivní posuny čtecího rámce • Nedostatečná enzymatická aktivita apyrázy - Přesnost 99,5 % na prvních 250 bp i Současné možnosti pyrosekvencování • Paralelní analýza více vzorků - Adaptory obsahující sekvence MID (Multiplex Identifiers) • Až 12 různých unikátních sekvencí • Přidány během přípravy knihovny • Koamplifikovány s fragmenty DNA - Rozdělení mikrodestičky do 2, 4, 8 nebo 16 menších oblastí • Zabránění vzájemné kontaminace vzorků - Možnost sekvenovat současně až 192 různých vzorků DNA Práce se sekvenčními daty • Sekvence - zápis posloupnosti jednoznačných znaků odpovídajících jednotlivým zbytkům (monomerům), které se nacházejí v odpovídající posloupnosti v dané makromolekule - DNA nebo RNA od 5'-konce k 3'-konci - protein od N-konce k C-konci • používají se jednopísmenové kódy dle pravidel IUPAC (tabulka) Příklady formátů sekvencí • surová data - elektroforetogramy ve formátu *.abi, *.ab1 nebo *.scf - prohlížeče Chromas, ABIView • formát FASTA *.nt, *.aa nebo *.fa • formát GenBank • software pro převod formátů sekvencí, formátování a manipulaci s daty