Sekvenování DNA • stanovení pořadí nukleotidů v molekule DNA (primární struktury) Sekvencovänl / Sekvenoväni ■ ■ Sequencing / die Sequenzierung / Klasické techniky sekvenování • 2 metody: - Chemická (Maxamova-Gilbertova) • Již se nepoužívá - Enzymová (Sangerova) • V současnosti se používá automatická varianta - společný rys obou metod: příprava a separace fragmentů DNA, jejichž velikost se liší o 1 nukleotid • Metody sekvenování nové generace (NGS) • Metody sekvenování třetí generace (z jedné molekuly) Základní požadavky pro úspěšné stanovení sekvence klasickou technikou: Příprava knihovny pro sekvenování - DNA s přesně definovanými konci • s místem pro vazbu primem • s koncovou značkou Příprava souboru všech fragmentů ssDNA lišících se svou délkou o jeden nukleotid Přesné rozdělení těchto fragmentů na základě jejich délky a detekce koncové báze Chemická metoda (Maxam-Gilbert) Sekvence je odvozena z molekuly DNA, která se chemicky degraduje v místech, kde se vyskytuje báze určitého typu na fragmenty. Ty se následně oddělují elektroforézou. Enzymatická metoda (Sanger) 1. Příprava ssDNA jejíž sekvence má být stanovena 2. Rozdělení do 4 vzorků 3. Reakce s DNA polymerázou při níž se začlení do syntetizované DNA místo normálního deoxyribonukleosidtrifosfátu jeho analog, který působí jako koncový inhibitor syntézy DNA - dideoxvnukleosidtrifosfát (ddNTP). V každém ze 4 vzorků vzniknou fragmenty, které jsou zakončeny příslušným ddNTP (ddCTP, ddGTP, ddATP a ddTTP). Reakce obsahuje: •molekulu DNA •značený primer při pojující se k části molekuly DNA (místo odkud začínáme stanovovat sekvenci) •směs obsahující 4 normální nukleotidy •jeden ddNTP (v každém ze 4 vzorků je jiný) •DNA polymerázu 4. Denaturace produktů 5. Elektroforetická separace umožňující oddělení fragmentů lišících se délkou o jednu bázi 6. Detekce fragmentů, které nesou označený konec Dideoxynukleotidy nemají hydroxy 1 na 3'-konci Ribose Deoxyribose Dideoxyribose HO-CH2 HO-CH2 HO-CH2 23.4 DEOXYNUCLEOSIDE TRIPHOSPHATE 23.7 dideoxyribose blocks elongation Pokudje dideoxynukleotid inkorporován do syntetizujícího se řetězce, působí jako terminátor reakce HO H Nucleotide will join on here at 3' position Replikace DNA s normálními deoxynukleotidy Původní sekvence AGCCTGG CGACCATCGT TCGGACCGCTGGTAGCA Denaturovaný templátový řetězec 3' AGCCTGG CGACCATCGT 5' Prfektní kopie AGCCTGGCGACCATCGT TCGGACCGCTGGTAGCA Co se stane pokud při reakci použijete směs dGTP a ddGTP? AGCCTGG CGACCATCGT TCGGACCGCTGGTAGCA AGCCTGGCGACCATCGT A T C G T T A G C A T CG T C GG TCGGACCG TCGGACCGCTG TCGGACCGCTGG TCGGACCGCTGGTAG -(■ QCQQT CCAďaCTQ QT T T QCCCCA Q CA.QQ CQA.A A A TC CTQTT T Q ATS QTQQT TCCQA AA.T CQQCA A A AT fE Cl TA T A A A T C AU A AQA AT AQCC fB AQA.T AQQQ TTQAQT QT TQT TCCA QTTTi wů tm 2íň 4W 410 4H 1» 4*4 4M +m 4fll +u atCQT^A A.QCA.CTJUI A.TCQ UJLCCCT JlH AQQQ AQCCCCC Q AT T TA QAOC TTQA CQ QQQ A A A QCCQQ CQA A GQTQ QCQA QA A AQQAA Q QQAAQAA A3G-QAA AQQ AQCQQQC- Q T A Q99 ma iiň tsa ěta im- m ita im- ;od ;io ran 1 dráha na gelu Sekvenování genomů V praxi je velice často potřeba stanovit sekvenci fragmentu DNA, který je delší než průměrná délka 500 - 1 000 bází dosahovaná v jedné reakci. K tomuto účelu sekvenování genomů mohou být zvoleny dvě zcela odlišné strategie: - náhodné sekvenování - uspořádané sekvenování sousedních úseků Příprava knihovny pro náhodné sekvenování genomů • Při náhodném sekvenování genomu jsou nejdříve připraveny mechanickým stříháním genomové DNA fragmenty s optimální velikostí (1 300 - 2 000 bp) a po úpravě jejich konců jsou nahodile nakloňovány do vhodného vektoru za vzniku velkého počtu klonů. • Ke štěpení DNA se využívá sonikace nebo pankreatická DNáza I za přítomnosti Mn2+. • Předpokládá se, že celková informace o sekvenci obsažená v připravených malých klonech odpovídá původní DNA a sekvence fragmentů jednotlivých klonů se vzájemně překrývají. • Pomocí univerzálních sekvenačních primem připojujících se k vektoru poblíž klonovacího místa jsou stanoveny sekvence krátkých úseků na koncích klonovaných fragmentů (minimálně 500 bází). • Stanovené sekvence jsou pak použity k uspořádání klonovaných fragmentů z jednotlivých vektorů do souvislých sekvencí genomové DNA - kontigů. Vektor Fragmentace C D Úprava konců a klonování ö°ö,P B C ÖÖ o I Sestavení překrývajících se klonů AB C J-J_L DE F G H I j_i_i_i_i_i Uspořádané sekvenování - Pro doplnění sekvence mezer zbývajících po náhodném sekvenování - Pro sekvenování malých fragmentů DNA • Dva odlišné přístupy: - procházení primerem • vyžaduje znalost sekvence, ke které se připojuje primer, který umožní prodloužení řetězce DNA-polymerázou. • získaná sekvence z první reakce je použita pro návrh primem pro další reakci a tento krok se opakuje, dokud není dosaženo kompletního stanovení sekvence. • Tento proces nevyžaduje další klonování a minimalizuje stanovení nadbytečných sekvencí, ale správnost stanovené sekvence by měla být ověřena sekvenováním obou řetězců. - postupné zkracování fragmentu exonukleázou a tvorba sousedících delecí Metody uspořádaného sekvenování Procházení primerem \ i - » < * , . , * Metody sekvenování nové generace (next generation sequencing) Liší se v provedení a chemii V základu se podobají v sekvenování tisíců až miliónů klonálně amplifikovaných molekul (masivní paralelní sekvenování) Probíhá vývoj technik - Více čtení - Delší čtení - Rychlejší sekvenování - Nižší cena Nové aplikace v klinické oblasti, vývoj kitů cílených na určité části genomů (dědičná onemocnění nádorová onemocnění, metagenomika, 16S rRNA) Clonal Reaction Amplification Output Pyrosequencing Roche/454 Sequencing by Ligation Life Tech/SOLiD H+ Ion Generation Life Tech/Ion Torrent ePCR ePCR ePCR Luminescence Fluorescence pH Change > Reversible Dye Terminators lllumina Signal/Noise Conversion Sequence Cluster -Fluorescence Third Generation Sequencing • Pacific Biosciences • Helicos Biosciences • NABsys • VisiGen Biotechnologies • Oxford Nanophore Technologies Vývoj ceny sekvenování na příkladu HGP $2.7 Billion $1.5 Million Human Genome Project \ • Inovace Chemie reakcí Optika Fluidika Hardware Bioinformatika $100,000 Sanger Transformační krok Next Gen Seq * í $ <10,000 < $5,000 1990 2003 2008 2010 2015 Typy uspořádání NGS sekvenování Single Read Paired-end read Mate-pair read Metody přípravy knihovny Library preparation Emulsion PCR "Polony" PCR on a slide Pyrosequencing Sequencing by ligation (454) (SOLiD) Pyrosekvenování Sekvenování se syntézou DNA v reálném čase nevyžadující elektroforézu ani separaci fragmentů Je založené na uvolnění pyrofosfátu (PPi) při enzamatické syntéze DNA (Nyren et a ., 1987) 1. krok: Sekvenační primer hybridizuje k jed no řetězcové mu templátu a je inkubován s: • DNA polymerázou • ATP sulfurylázou ÍDNAV*nP-"-W™ • Luciferázou • Apyrázou • substrátem, adenozin 5'-fosfosulfátem (APS) • luciferinem 2. krok: První ze 4 dNTP - dATP je přidán k reakci - Pokud je na matrici komplementární báze, DNA polymeráza katalyzuje připojení nukleotidu k primem - Pokud na matrici není komplementární báze nukleotid bude degradován apyrázou - Postupně budou přidány jeden po druhém všechny čtyři dNTP - Každé připojení nukleotidu je provázeno uvolněním pyrofosfátu (PPi) v množství ekvimolárním množství přidaného nukleotidu 3. krok: ATP sulfuryláza kvantitativně přeměňuje PPi na ATP za přítomnosti APS Sul(i ňlaie - Vzniklý ATP umožní luciferázou zprostředkovanou konverzi luciferinu MfltPH AIP na oxyluciferin, který vytvoří světelný záblesk zaznamenaný detektorem ^J^, -tirwii fotonů a zobrazený jako pík na pyrogramu nudaotidainwrporationginaratMiight sain m a [tak In lha pvmiram 4. krok: Apyráza degraduje nepřipojené dNTP a nespotřebované ATP dWTP- -frdHDF + dNMP + ptnpMa ATP-ApVraSe^ADP + MAP + phaphrtai - Až je degradace kompletní je přidán další dNTP, který je v pořadí Proces se znovu opakuje a sekvence je odečítána z pyrogramu Namísto standardního dATP je používán a-thiosubstituovaný dATP, který je přijímán DNA polymerázou, ale nikoli luciferázou Metoda je ve vývoji a je používána pro identifikaci jednonukleotidových polymorfizmu (SNPs) primer templátová DNA je degradován je degradován "O + dTTP - + dATP — + dGTP ^chemiluminiscence — + dCTP ^chemiluminiscence = + dTTP- je degradován + dATP ^chemiluminiscence: + | chemiluminiscence dGTP + dCTP ^chemiluminiscence | chemiluminiscence ^chemiluminiscence 1 1 ! ! 1......... -j-rGC I '......■ ■ 1 1111199ft...... ■ liji Cj cagg I i ' I I......... T-n-r-rGCAGGCC dTTP ^chemiluminiscence = M + dATp — je degradován + , ■ , , ,GCAGGCCT Princip pyrosekvenování pyrogram odečtená nukleotidová sekvence H B ■ K ofl cc t T rt Ů ta í c Ť A Ů přidaný nukleotid Klonální amplifikace knihovny emulzní PCR Příprava jednořetězcové DNA knihovny - Umožňuje zpracovat různé typy vzorků • genomové DNA • produkty PCR • BACs • cDNA - Frakcionace dlouhých úseků na 300- to 800-bp fragmenty - Vazba dvou adaptorů A a B - specifických pro 3'- a 5'-konce na každý fragment • Adaptor A obsahuje vazebné místo pro primer • Adaptor B B obsahuje 5'-biotinovou značku, která slouží k imobilizaci DNA knihovny na mikrosféry (DNA Capture Beads) pokryté streptavidinem Klonální amplifikace knihovny emulzní PCR - Separace kuliček a výběr pouze těch, které obsahují navázaný jediný fragment ssDNA Klonální amplifikace knihovny v emulzi - emulzní PCR, amplifikační reagencie ve směsi voda-olej -» mikroreaktory obsahující jedinou kuličku s unikátním fragmentem DNA z knihovny - (107) kopií Pyrosekvenování Analýza dat s využitím bioinformatických nástrojů Sekvenátor FLX firmy Roche Pyrosekvenování (One Bead = One Read) Kuličky se z emulze extrahují a jsou umístěny pomocí centrifugace do PicoTiterPIate, čipu z optických vláken o rozměrech 70 x 75 mm MAS 3 »V 2£ínm«50 Průměr jamek PicoTiterPIate dovoluje umístění pouze jedné kuličky průměru 28 ^ (im • Na jednom čipu je 1 600 000 jamek Převrstvení směsí obsahující reagencie pro pyrosekvenování, enzymy jsou rovněž imobilizovány na malých mikrosférách • Spodní část čipu je v optickém kontaktu s dalšími optickými vlákny napojenými na CCD senzor - zachycení až 10000 emitovaných fotonů na 1 nukleotid I I I I I I I I i I I I I I I J a A. JBdC GCCATGCT h A A G T C Aa am liic:if5' exonukleázová aktivita DNA polymerázy • homopolymerní úseky - Pozitivní posuny čtecího rámce • Nedostatečná enzymatická aktivita apyrázy - Přesnost 99,5 % na prvních 250 bp i Sekvenátor FLX firmy Roche • Paralelní analýza více vzorků - Adaptory obsahující sekvence MID (Multiplex Identifiers) • Až 12 různých unikátních sekvencí • Přidány během přípravy knihovny • Koamplifikovány s fragmenty DNA - Rozdělení mikrodestičky do 2, 4, 8 nebo 16 menších oblastí • Zabránění vzájemné kontaminace vzorků - Možnost sekvenovat současně až 192 různých vzorků DNA GS Run Browser _ □ a 0 GS Run Processor data set: D_2012_03_22_16_33_14_JRG91GG374_fullProcessing GS Run Browser 0 GS Run Processor data set: □_2012_03_22_16_33_14_JRQ91QQ374_fullPro(:essing Overview Wells Signals Reads Control DNA Filters Read Attributes -® Read Length O Base Quality Well Categories - ® GACT (Library) O CATG (Control-Type I) O ATGC (Control-Type II) Number Of Library Reads 1 200 l ooo 800 eoo 400 200 250 300 350 400 450 Read Length, Region Total 550 600 650 GACT (Library) Raw Wells Key Pass Wells Region 1 175 313 15S 132 Total 175 313 158 132 Fl Ö Aplikace Místa Systém GS De novo Assembler Čt, 24. květen, 15:47 LMDM B Project: Staral [Genomic] Location: /home/LMDM/Plocria/analyza/5tafal Ready for analysis base: read: val: Project Overview Contig a contigOOOOl 20 149 Parameters Result files Alignment results Flowgrams Bases contigGOGG2 18 049 contig00003 14 160 contig00004 11 926 contigOOOQS 8 637 contigOOOOe 7 994 contig00007 6 816 contigQQQQS 6 697 contigOOOOg 4 476 contigOOOlO 3 326 contigOOOll 3 095 contig00012 3 014 contig00013 2 722 contig00014 2 690 contigQQQ15 2 383 contigOOOie 2 329 contigOOOlľ 2 191 contig00018 2 036 contig00019 1 499 contig0002Q 1 352 contig00021 1 166 contig00022 1 050 contigQOQ23 1 016 contig00024 948 77(1 -1 Cünt i g: contigOOOOl - 20 149 bp. Base left 2 032 selected conti liOOOOI HK6IEBF01BN89B HK5IEBF01ARRSN HK6IEBF01A3MAV HK6IEBF01BHKX2 HK5IEBF01A5THI HK6IEBF01AHUA1 HK5IEBF01A9E9P HK6IEBF01BKM7X HK6IEBF01AV175 HK5IEBF01BJYSL HK6IEBF01BBYUP HK6IEBF01AI6AC HK5IEBF01AW7YC HK6IEBF01B1IE6 HK6IEBF01AYV3H HK5IEBF01BN288 HK6IEBF01BG5IC HK6IEBF01BJFDR HK5IEBFO1B04U2 HK6IEBF01A39J2 HK6IEBF01BSDDB HK5IEBF01BPQRL HK6IEBF01BBCE9 HK5IEBF01B1K98 HK6IEBF01AXRBZ HK6IEBF01ACSI1 HK5IEBF01BWH8V HK6IEBF01AVZR6 right 2 132 TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTC TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGGGTTTTTTACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGGGTTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACAT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACAT TCTTCTCCTAAAAACCCCTAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT AAAA-CCC-TAA-GTATCAAGG-TTTTT-ACAAACCTCTACATT AAAA-CCC-TAA-GTATCAAGG-TTTTT-ACAAACCTCTACATT ■AGGTAAGT-AACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT T T T - -ACAAACCTCTACATT- AG AGGTAAGT AGGTAAGT-AACCGAAAGGTTCTATACTAGAATC AGGTAAGT-AACCGAAAGGTTCTATACTAGAATCTGTA AGGTAAGT- AACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT AGGTAAGT- AACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT AGGTAAGT-AACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT AGGTAAGT-AACCGAAAGGTTCTATACTAGAATCTGTATAT AGGTAAGT-AACCGAAAGGTTCTATACTAGAATCTGTATATAAACT AGGTAAGT-AACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT AGGTAAGT-AACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT AGGTAAGT-AACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT AGGTAAGT-AACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT AGGTAAGT-AACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT AGGTAAGT-AACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT AGGTAAGT-AACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT CAGGTAAGT-AACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT CAGGTAAGT-AACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT AGGTAAGT-AACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT AGGTAAGT-AACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT AGGTAAGT-AAGCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT AGGTAAGT- AACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT AGGTAAGT-AACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT AGGTAAGT- AAGCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT AGG-AAGTTAACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT AGGTAAGT-AACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT _CTAGAATCTGTATATAAACTATTTGT CD □ New Open © Start (D Info 5Jafal: Opened Assembler project: /home/LMDM/Plocha/analyza/5tafal : Analysis messages [GS De novo Assembl... || g| LMDM [Untitled 1 - QperiQffi... || ™ GS De novo Assembler Aplikace Mfsta System fy) [2 Project: Stafal [Genomic] Location: /home/LMDM/Plocha/analyza/Stafal d}>) j^j Ct, 24. kveten, 15:47 LMDM GS De novo Assembler Ready for analysis Overview | Project_Parameters_Result files | Alignment results_Flowgrams Read Name HK6IEBF01BN89B I I [> Next I Ö comiaOQQOl vs. HK6IEBF01BN89B Number of Bases - Consensus u ü u Number of Bases - Read (reverse complement) -Wl.rtl.rHl.j u ljJj,T[ij[ij,[iji[i,i,ti,|,,[i,,[i[lT|Ttij,TL[i,,ti[l[i,,l 1,,[i[i,,[il[i,,i[ljT[l,i,[ij, Number of Bases - Difference T AC CT AC CT AC GT AC CT AC CT AC CT AC CT AC CT AC CT AC GT AC CT AC CT AC CT AC GT AC CT AC CT AC GT AC CT AC CT AC CT AC GT AC CT AC CT AC CT AC CT AC CT AC CT AC GT AC CT AC C 1310C 1000 miliónů Ion PGM™ System na i-' V ' y Sequencing Run Time Output* 200-base reads 400-base reads 200-base reads 400-base reads Reads Chipv2 2.3 hrs 3.7 hrs 30-50 Mb 60-100 Mb 400-550 thousand Ion 316™HH| Chip v2 ; IKS 3.0 hrs 4.9 hrs 300-600 Mb 600 Mb -1 Gb 2-3 million Ion 318™|E5r| Chipv2 IfcjJ 4.4 hrs 7.3 hrs 600 Mb -1 Gb 1.2-2 Gb 4-5.5 million lonTorrent čip lonTorrent - detekce Rothberg J.M. et al Nature doi:10.1038/naturel0242 • Přímá detekce iontů vodíku a konverze na elektrický signál zpracovaný čipem Ion Torrent polovodičové sekvenování • Technologie Ion Torrentu je otevřená pro sekvenování DNA de-novo i cílené sekvenování vybraných oblastí genomu • Minimální délka sekvenačního čtení - V jedno směru: 400bp - Obousměrné (Paired end) - Počet vzorků analyzovaných v jednom běhu - až 96 vzorků - pomocí označení tzv. barkodem • Doba sekvenační analýzy - 2 - 3,5 hodiny - podle použitého čipu SOLiD (Sequencing by Oligonucleotide Ligation and Detection) • Nová generace vysoce účinného sekvenování, dostupná od 2008 (Applied Biosystems) • Založená na kombinaci metod - MPSS (Massively Parallel Signature Sequencing) [Brenner et al., 2000] - Multiplex Polony Sequencing [Shendure et al., 2005] • Sekvenčně specifická ligace oktamerních oligonukleotidových sond označených fluorescenčními barvivy • Průměrná délka sekvenovaného úseku je 30 až 40 bp • Přesnost vyšší než 99,95 % na prvních 25 bp SOUD Příprava jednoho ze dvou typů knihovny DNA - Fragmentová knihovna (fragment library) - Párová knihovna (mate-paired library) Fragment m/á knihovna adaptoi PI adaptor p2 sekvencovaná DNA Párová knihovna adaptoi Pí vnitrní adaptor adaptor P2 sekvencovaná DNA sekvencovaná DNA SOUD • Amplifikace knihovny • PCR v emulzi - DNA knihovny - Primery P1 a P2 - magnetické kuličky o velikosti 1 |jm vázající DNA - DNA polymeráza a nukleotidy SOUD Amplifikované templáty vázané na kuličkách - Denaturace templátů vázaných na kuličkách a odseparovaní nepoužitých kuliček SOUD Modifikace 3'-konců pro kovalentní vazbu na sklíčko pro sekvenování Nanesení kuliček - Sklíčko je rozděleno na pole umožňující oddělení vzorků do jedné, čtyř nebo osmi oblastí. - Klíčovou výhodou systému je možnost přípravy sklíček s velmi vysokou hustotou kuliček SOLiD Sekvenovani prostrednictvim ligace < Primer 3'- 3J i i i i i i i i i p5' C-A-rm-n-z-M _+ C-T-IWHH-Z-Z + *77- 3- _ T G-G-n-n-ri-z-z-z J" Bead -5'- Adapter Sequence Template Sequence 3'- Bead "-5'- Prirner + C-A-n-fwi-i-z-z GT Adapter Sequence Template Sequence UJ 3- Bead ■-5'- Cleavage _ Primer y z-i-i + C-A-rwHi p5' Gl Adapter Sequence Template Sequence G-C-n-n-iw-z-z 3' 3' Opakuje se několik cyklů (ligace, detekce, štěpení); počet cyklů určuje délku stanovené sekvence Po několika cyklech (7) je prodloužený produkt odstraněn a templát je resetován s primerem komplementárním k pozici n-1, - celkem je použito 5 primerů (n, n-1, n-2, n-3 a n-4) - Každá báze je integrována ve dvou nezávislých ligacích s použitím dvou primerů 1. Navázání přiměni, ligace sondy " p o ŕ TI PRIMER I iimii Univerzálni primer in) Jat Adaptor P1 2. Zachyceni ohrazu TA .................... ľ Templátová sekvence Excitace Fluorescence V III I mill....../ ;',.......■.......*................ ta 3. Odštěpení fluorescenční části sondy HO AT 11lllllll1111P .....■■■■■■■■■■■ 5. Reset primerů Univerzální primer ín-11 ' lllllllllllllllll 2. Reset primerů mi _■' 1. Rozštěpení prodloužené sekvence ....................: 6. Opakování kroku 1 až 6 s novým přiměřeni ^bázový posui) PRIMER 2 Univerzální primer ín-1 ................. CA CG TC AA TA CC miniím ■■■■ ■■■■■■■ ■■■■■■■ ................................r T gt GC ag TT AT GG 7. Opakování celého cyklu s priniery n - 2, n - 3 a n - 4 ta 4. Opakování kroku 1 až 4 Vazelíny cyklus 1 2 3 4 E 6 7 ... (n cyklů) SOLiD - čtení sekvence 2nd Base SOLiD - Pravidla a dešifrování barevného kódu Read Position 0 2 3 7 8 9 to 11 12 13 14 15 16 17 IS 19 20 21 22 23 25 26 27 28 25 30 31 32 33 34 1 Universal seq primer In) , Universal seq primer (n-1) • • • i t • • • • • • • « • • <= , Universal seq primer (n-j >> t£ . Universal seq primer (n-3| • * • • • • • • • • • • • • 6 Universal seq primer (n-4) - • • • • • • • • • • • • _ • Indicates positions of interrogation Ligation Cycle | 2 3 i 5 B | • Systém pracuje se 4 základními bázemi - A, C, G, T. • Základní barvy jsou označeny 0, 1, 2 a 3 (modrá, zelená, žlutá a červená) • Dvě odlišné dvojice bází, které mají stejnou počáteční bázi, se barví odlišnou barvou: barva (AC) f barva (AG) • Dvojice bází, které jsou reverzní, se barví stejnou barvou: barva (AC) = barva (CA) • Dvojice stejných bází se barví stejnou barvou: barva (AA) = barva (CC) • Dvojice bází, které jsou odlišné, ale mají stejnou druhou bázi, se barví odlišně: barva (AC) ŕ barva (GC) SOLiD - paralelní analýza více vzorků • SOLiD využívá šestnáct různých „kódů" (barcoding) pro odlišení vzorků. - Vázány na 3'-konec sekvence pomocí modifikovaného adaptoru P2 - Podobná teplota Tm - Nízké procento chyb - Unikátní v barevném kódu - Možnost současně analyzovat až 256 vzorků (při využití dvou sekvenačních destiček rozdělených na osm polí). - Metoda SOLiD poskytuje 9000 Mbp během 5 dnů Fragment Mate Pair Barcode P1 Tag 1 Barcode P1_* Tag1 2 separate ligation-based sequencing reactions Internal Adaptor 3 separate ligation-based sequencing reactions AGGTTCCGATACGGATTACCATGTG — Barcode 1 AGGTTCCGATACGGATGACCATGTG Barcode 2 Technologie firmy Illumina/Solexa • Uvedena na trh 2006 • Masivní paralelní sekvenování milionů fragmentů DNA („polony" sequencing) • Sekvenacování syntézou na čipu (flow cell), které využívá strategii reverzi bil nich terminátorů • Nevyžaduje klonování ani přípravu knihovny na mikrosférách • Dosahuje 99,9 % přesnosti na/Solexa Příprava knihovny - Náhodná fragmentace DNA na krátké úseky 200 - 500 bp - Zatupení konců a vytvoření 1 nt A-přesahu na 3'-konci (T4 DNA polymeráza, Klenow a polynukleotid-kináza T4) - Navázání adaptorů umožňujících kovalentní vazbu na opticky transparentní povrch pro sekvenování - Každý fragment je na povrchu uchycen pouze jedním koncem, po přidání enzymů pro amplifikaci dochází k ohnutí fragmentu do „mostu". - Výsledkem amplifikace jsou dva řetězce, každý s jedním volným a jedním pevným koncem - Po denaturaci jsou fragmenty narovnány a uspořádány do shluků, ve kterých je dosažena značná hustota, až 1000 kopií fragmentu na um2 povrchu - Na celém povrchu je dosaženo hustoty deseti milionů shluků na cm2 A i i 42 875868 Bridge amplification: initiation OH P7 E5 Grafted flowrell ill Ii Ii M II ll Template hybridization Initial extension Dona tn rat ion On the surface: complementary oligos Illumina/Solexa • Průběh sekvenační reakce • Přidání primem ve směsi s DNA polymerázou a fluorescenčně značenými dNTP • Nukleotidy jsou na 3'-konci modifikovány tak, že umožňují reverzibilní ukončení prodlužujícího se řetězce DNA • Je tak zajištěno, že se řetězec v každém cyklu prodlouží právě o jednu bázi. • Po zachycení obrazu připojené báze následuje odblokování 3'-konce Illumina (Solexa) sequencing Mate-pair sequencing Fragment DNA Perform End Repair Biotin Label Size-Select DNA Circularize DNA Digest Linear DNA B Biotin Labelled Fragment Circularized Fragment Fragment Circularized DNA Purify Biotinylated DNA Perform End Repair A-tail Adapter Ligation Fragmented Circles Purified Mate Pair Library Fragments, Bound to Streptavidin Beads Mate Pair Library Fragments with Cluster and Sequencing Sites Attached PCR Enrichment Size-Select Library Mate Pair Library Fragments with Cluster and Sequencing Sites Attached Illumina/Solexa Délka čtených úseků: - HiSeq : 100 ntor 150 nt - MiSeq : 250 nt Mnohonásobné pokrytí sekvence (30 x - 100 x) Možnost mnohonásobného sekvenování - Povrch sklíčka rozdělen do částí - Vzorky označeny pomocí dvanácti různých oligonukleotidů - Současně lze analyzovat až 96 různých vzorků. Produkuje desítky až stovky Gb za 1 běh (2 - 8 dnů) Aplikace - Resekvenování - Sekvenování RNA - Stanovení metylací Mi Sekvenování třetí generace • Analýza jedné molekuly • Potřeba malého množství vzorku • Bez rizika kontaminace • Analýza jakékoli NK (DNA/RNA) • Analýza poškozených NK (archaické, muzejní, forenzní) • Analýza DNA z nekultivovatelných organismů • Absolutní kvantifikace Sekvenovanl tretl generace - Helicos Incorporate single, dye-labelled nucleotides Wash, one-colour imaging Cleave dye and inhibiting groups, cap. -vash Each cycle add a different dye-labelled dNTP Repeat cycles * Top: CTAGTG Bottom: CAGCTA Nucleotides flown sequentially (Dark nucleotides : incorporation not detected) PoefliDn |»;] : . i- 1 c Cycle 3 A Cycle i Cycle S C CyoloX a Sekvenování třetí generace - PacBio RS Pacific Biosciences Single molecule real-time sequencing 4 nucleotides with different fluorescent dye simultaneous present 2-3 nucleotides/sec 2-3 Kb (up to 50) read length 6 TB data in 30 minutes laser damages polymerase Emission Illumination 400 8 3j 300 £ £200 ü c 100 C T C G A TO AfiC T A C A .A tnJLkí 104 5 105 0 105 5 106 0 106 5 107 0 107 5 106 0 108 5 Time (s)