Technologie sekvenovänf • stanovenl poradi nukleotidü v molekule DNA (primärni struktura) Důvody řešení genomových projektů ♦ Genomika modelových organismů (de novo sekvenování) ♦ Analýza mutací a SNP, výzkum genetických onemocnění (resekvenovánígenomů, varianty sekvencí) ♦ Identifikace mikroorganismů (de novo sekvenování a resekvenování) ♦ Analýza transkriptomu (RNAseq) ♦ Metagenomika (16S rRNA, celé metagenomy) ♦ DNA metylační studie (medip-seq, bisulfite treated DNA) ♦ Studie transkripčních faktorů, proteinů vázajících se na DNA (ChIPseq) ♦ miRNAs, siRNA, piRNA, tRF, aj... (small RNA seq) Techniky sekvenování • Klasické techniky: - Chemická (Maxamova-Gilbertova) Již se nepoužívá - Enzymová (Sangerova) • V současnosti se používá automatická varianta • Metody sekvenování nové generace (next generation sequencing, NGS) -454, lonTorrent, lllumina, SoLiD • Metody sekvenování třetí generace - PacBio, NanoPore, Helicos, etc. Princip sekvenačních metod • Klasické sekvenování kapilární elektroforézou - Vyžaduje velký počet kopií vstupního materiálu DNA jako templátu pro přípravu jednořeťězců • Sekvenování nové generace - Jako templát slouží jediná molekula, která je amplifikována pro získání dostatečného signálu, produkuje krátká čtení, možnost kvantitativní analýzy (SNP) • Sekvenování třetí generace - Jako templát slouží jediná molekula. Nevyužívá amplifikace za účelem zvýšení signálu, produkuje dlouhá čtení Projekt Výběr platformy Příprava knihovny Sekvenování Kontrola kvality Vizualizace a analýza Normalizace, srovnání knihoven Hledání genů, variant, vazebných míst, ... Diferenciální analýza, exprese, metabolomika, Bioinformatické zpracování Basecalling Trimming, selection Pipeline (automated processing) Polishing Validation Graphic visualization Annotation ATGTTCCGATTA AACn~iTTTCATTCAGTAAAAfi6AG<"iAAAWAA Cloned gencm« Multiple 9tneifl«jn*i1>r*F*d Inn variable sued segment! Unordered sequenced ■-egrrcnti CompuuiJMul juitKiuied Rrvutting ovi-rLipping vrquenir iKjmmlt (Thp highpr Ihp coverage Ihc teller tte quality at the seq ucneintj. OireriíBjJ'ng SCtLUSrncp segment! f riT h n cd to t í)n Hrud tru; gmonw canitniu*. / b) ATC.TTCCGATTA ľTTCATTCAGTAAAAGGACGAAATAľAA Cloned geronnen Gr name divided i nla ľ jr tjr legmenls of known order. Odered genome Mylliplr. gtnqmt iir.M im', ,1 ihrarri inta viriiWe »lad segments Unijrdcrrd sequenced! segments CompuLiüanil luionut«] assembly RoLilting overlapping sequenced segments.ilhe lny tin Ihe Coverige Wie betler the rjutil icy of the vequeneing. Overlapping sequences segment! combined tů conn r ní t lhr> genome uinmiuv .■ Celogenomové shotgun (náhodné) sekvenování versus postupné shot-gun sekvenování Technické požadavky pro úspěšné stanovení sekvence Příprava knihovny pro sekvenování - DNA s přesně definovanými konci • s místem pro vazbu primem • s koncovou značkou •Zajistit dostatečné pokrytí při čtení genomu Příprava variant fragmentů ssDNA lišících se svou délkou o jeden nukleotid • Syntéza • Degradace Detekce těchto variant fragmentů • Přesná separace na základě jejich délky • Detekce připojené koncové báze • Kontinuální čtení Postup enzymatického sekvenování DNA 1. Příprava ssDNA jejíž sekvence má být stanovena 2. Rozdělení do 4 vzorků 3. Reakce s DNA polymerázou při níž se začlení do syntetizované DNA místo normálního deoxyribonukleosidtrifosfátu jeho analog, který působí jako koncový inhibitor syntézy DNA - dideoxvnukleosidtrifosfát (ddNTP). V každém ze 4 vzorků vzniknou fragmenty, které jsou zakončeny příslušným ddNTP (ddCTP, ddGTP, ddATP a ddTTP). Reakce obsahuje: •molekulu DNA •značený primer při pojující se k části molekuly DNA (místo odkud začínáme stanovovat sekvenci) •směs obsahující 4 normální nukleotidy •jeden ddNTP (v každém ze 4 vzorků je jiný) •DNA polymerázu 4. Denaturace produktů 5. Elektroforetická separace umožňující oddělení fragmentů lišících se délkou o jednu bázi 6. Detekce fragmentů, které nesou označený konec Dideoxynukleotidy nemají hydroxy 1 na 3'-konci Ribose Deoxyribose Dideoxyribose HO-CH2 HO-CH2 HO-CH2 23.4 DEOXYNUCLEOSIDE TRIPHOSPHATE 23.7 dideoxyribose blocks elongation Pokudje dideoxynukleotid inkorporován do syntetizujícího se řetězce, působí jako terminátor reakce Replikace DNA s normálními deoxynukleotidy Původní sekvence AGCCTGG CGACCATCGT TCGGACCGCTGGTAGCA Denaturovaný templátový řetězec 3' AGCCTGG CGACCATCGT 5' Prfektní kopie AGCCTGGCGACCATCGT TCGGACCGCTGGTAGCA Co se stane pokud při reakci použijete směs dGTP a ddGTP? AGCCTGGCGACCATCGT TCGGACCGCTGGTAGCA AGCCTGGCGACCATCGT A T C G T T A G C A pri použiti směsi dGTP a ddGT T CG T C G G TCGGACCG TCGGACCGCTG TCGGACCGCTGG TCGGACCGCTGGTAG Enzymová metoda sekvenování DNA (Sanger) (A) deoxyribonukleosidtrifosfát dideoxyribonukleosidtrifosfát (B) 3' normální prekursory deoxyribonukleosidtri-fosfátů (dATP, dCTP, dGTP, dTTP) malé množství jednoho dideoxyribonukleosidtrifosfátu (ddATP) oligonukleotidový primer pro DNA-polymerázu 5' J GCTACCTGCATGGA' C GAT GGAC GTACCTCTGAAGCG vzácná inkorporace dideoxyribonukleosidtrifosfátu DNA-polymerázou zastaví další růst molekuly DNA 5' jednořetězcová DNA, která bude sekvenována nNA.9pmiPnr.inn mnu (C) 5" GCATATGTCAGTCCAG 3' 3' CGTATACAGTCAGGTC 5' dvou řetězcová DNA označený primer 1 5' GCAT 3' . . , , jednoretezcova 3* CGTATACAGTCAGGTC 5' DNA + nadbytek dATP dTTP dCTP dGTP + ddATP \+ DNA-polymeráza + ddTTP + ddCTP + DNA-polymeráza \ + DNA-polymeráza + ddGTP ■ + DNA-polymeráza seq4.mov Obraz autoradiogramu ze sekvenačního gelu GCAT A GCAT AT GCAT ATGTC GCAT ATG GCAT ATGTCA GCAT ATGT GCAT ATGTCAGTC GCAT ATGTCAG GCAT ATGTCAGTCCA GCAT ATGTCAGT GCAT ATGTCAGTCC GCAT ATGTCAGTCCAG 53 Mil ATGC ATGC ATGC ATGC Automatické sekvenování DNA • Je variantou enzymatického sekvenování DNA. • Syntéza DNA probíhá v jedné reakci • Ke značení produktů se používaj í čtyřmi různými fluorescenčními značkami označené • primery • dideoxyribonukleotidy Strategie barevných terminátorů asymetrická PCR DENATURACE PŘIPOJENÍ PRIMERU SYNTÉZA Enzyme, dNTPs, dye-labeled terminators * o * o * AJO \č\o PRODUKTY 4 A CO A CO A A A A C CG C G GO C C c c _ C C G T A[T]i □J O Trao Princip detekce produktů • Detekce produktů probíhá během elektroforézy pomocí laserového detektoru (laserem indukovaná fluorescence, LIF) napojeného na počítač, který vyhodnocuje sekvenci. C A C CG C AT C G A A A T T A A C T TC C A A A.GTT A AGC T TG G Fragmenty í lil 1 J , - m ■ Příprava gelu Laserový detektor Rezervoár pufru Automatické nanášení vzorku Soustava kapilár Genetický analyzátor ABI 3100 Vyhřívaná deska Příprava knihovny pro náhodné sekvenování genomů • Při náhodném sekvenování genomu jsou nejdříve připraveny mechanickým stříháním genomové DNA fragmenty s optimální velikostí (1 300 - 2 000 bp) a po úpravě jejich konců jsou nahodile nakloňovány do vhodného vektoru za vzniku velkého počtu klonů. • Ke štěpení DNA se využívá sonikace nebo pankreatická DNáza I za přítomnosti Mn2+. Izolace DNA Vektor Příprava knihovny pro Sangerovo sekvenování Fragmentace 1300 - 2000 bp C D Úprava konců a klonování Ö°ÖP B C O ÖÖ Sestavení překrývajících se klonů AB C DE F G H I ......... Metody sekvenování nové generace (next generation sequencing, NGS) Liší se v provedení a chemii V základu se podobají v sekvenování tisíců až miliónů klonálně amplifikovaných molekul (masivní paralelní sekvenování) Probíhá vývoj technik - Více čtení - Delší čtení - Rychlejší sekvenování - Nižší cena Nové aplikace v klinické oblasti, vývoj kitů cílených na určité části genomů (dědičná onemocnění nádorová onemocnění, metagenomika, 16S rRNA) Clonal Reaction Amplification Output Pyrosequencing Roche/454 Sequencing by Ligation Life Tech/SOLiD H+ Ion Generation Life Tech/Ion Torrent ePCR ePCR ePCR Luminescence Fluorescence pH Change > Reversible Dye Terminators lllumina Signal/Noise Conversion Sequence Cluster -*■ Fluorescence • Sekvenování tretí generace • Pacific Biosciences • Helicos Biosciences • NABsys • VisiGen Biotechnologies • Oxford Nanophore Technologies Metody přípravy knihovny Fragmentace • Enzymatická • Fyzikální (sonikace, nebulizace, Hydroshear) Připojení adaptorů Amplifikace Library preparation Emulsion PCR "Polony" PCR on a slide Semiconductor sequencing (Ion Torrent) Reversable terminator umina) Pyrosequencing (454) Sequencing by ligation (SOLiD) Typy uspořádání NGS sekvenování Single Read Paired-end read (PE) Mate-pair read (MP) výsledkem jsou miliony krátkých čtení sekvencí z náhodných částí genomu Orientace párových čtení Paired end (PE) reads <- -> Mate pair (MP) reads Hloubka sekvenování (pokrytí) • Coverage (pokrytí) = (počet získaných čtení * průměrná délka čteníj/velikost genomu • Příklad 1: Získali jsme 106 čtení s technologií lontorrent, velikost genomu je 3 Mb. Jaké je pokrytí? • Příklad 2: Technologie lllumina poskytuje 200 milionů čtení. Kolik genomů o velikosti 5 Mb mohu sekvenovat, abych získal pokrytí 50*? Ion Torrent polovodičové sekvenování • prvním sekvenátor DNA, který nepoužívá pro detekci sekvenovaných bází DNA světelný signál, který by byl uvolňovaný při enzymatických reakcích s fluorescenčními nebo chemiluminscenčními substráty. • Sekvenování Ion Torrent je založené na elektrochemické detekci vodíkových iontů (pH) které jsou uvolněny při replikaci sekvenovaného templátu na speciálním polovodičovém čipu. Uvolnění vodíku v nepufrujících podmínkách Knihovna • Příprava jednořetězcové DNA knihovny - Umožňuje zpracovat různé typy vzorků • genomové DNA • produkty PCR • BACs • cDNA - Frakcionace dlouhých úseků na 200- až 400-bp dlouhé fragmenty - Vazba dvou adaptorů specifických pro 3'- a 5'-konce na každý fragment • Adaptor A obsahuje vazebné místo pro primer • Adaptor B B obsahuje 5'-biotinovou značku, která slouží k imobilizaci DNA knihovny na mikrosféry pokryté streptavidinem Klonální amplifikace knihovny emulzní PCR • Klonální amplifikace knihovny - emulzní PCR, amplifikační reagencie ve směsi voda-olej -> mikroreaktory obsahující jedinou kuličku s unikátním fragmentem DNA z knihovny - (107) kopií • Separace kuliček a výběr pouze těch, které obsahují amplifikovanou DNA (enrichment) • Sekvenační reakce • Analýza dat a assembly lonTorrent polovodičové sekvenování • Na čipu se nachází milióny jednotlivých reakčních cell (reaktorů), ve kterých probíhá sekvenační analýza individuálních kopií DNA na základě kontinuálního střídání reakčních složek (jednotlivých typů nukleotidů) v mikrofluidním systému. • DNA imobilizovaná na mikrosférách (po emulzní PCR) • Kapacita závisí na typu použitého polovodičového chipu - 10-65 miliónů - 100-600 miliónů - > 1000 miliónů lonTorrent čip Ion Torrent polovodičové sekvenování • Technologie Ion Torrentu je otevřená pro sekvenování DNA de-novo i cílené sekvenování vybraných oblastí genomu • Minimální délka sekvenačního čtení - V jedno směru: 400bp - Obousměrné (Paired end) - Počet vzorků analyzovaných v jednom běhu - až 96 vzorků - pomocí označení tzv. barkodem • Doba sekvenační analýzy - 2 - 3,5 hodiny - podle použitého čipu Výstup z Torrent server Read Summary: Unaligned Aligned to E. coli DH10B 1.04 G TohluigniB EBia Count 3.162.233 3.1ÍÍ.661 „II „ÄS., ISP Summai y 80% Loading 100% Enrichment 5,079,661 20% Emptv Weils 0% No Template 33% Polyclonal 5,077,468 67% Clonal 3,385,229 2% Test Fragments 0% Adapter Dimer 5% Low Quality 0 100 200 300 400 500 600 Basitfun 0 100 200 300 400 500 60C 1.03 G Alignment Quality AQ17 AQ20 P rfect Total Number of Bases [bp] 1.03 G 1 G 7f LI M Mean Length [bp] 332 325 2i 9 Longest Alignment [bp] 499 499 4" 2 n Coverage Depth [x] •b8. Aplikace Místa Systém ^ EJ 11 •l* SI ßn) Ů-' 24, květen' 15:47 LMDM GS De novo Assembler Project: Stafal [Genomic] Location: /home/LMDM/Plocha/aralyza/Stafal Ready for analysis Oven/iew Contig a Project Parameters Alignment results Flowgrams Bases contigOOOOl 20 149 contig00002 18 049 contigQQOQ3 14 160 contig00004 11 926 contig00005 8 637 contigOOOOe 7 994 contig00007 6 81S contigOOOOS 6 S97 contig00009 4 476 contigOOOlO 3 326 contigOOOll 3 095 contigQQ012 3 014 contigOQQ13 2 722 contig00014 2 690 contig00015 2 383 contigOOOlS 2 329 contigOOOlľ 2 191 contigOOOlS 2 036 contigQQ019 1 499 contigQQ02Q 1 352 contigOQQ21 1 166 contigO0Q22 1 050 contigO0Q23 1 016 contig00024 948 rnntinnnn"? ^ 7?n_ ■w Contig: contigOOOOl - 20 149 bp. Base left 2 032 selected contigOOOOl HK6IEBF01BNS9B HK6IEBF01ARRSN HK6IEBF01A3MAV HK6IEBF01BHKX2 HK6IEBF01A5THI HK6IEBF01AHUA1 HK6IEBF01A9E9P HK6IEBF01BKM7X HK6IEBF01AV175 HK6IEBF01B1YSL HK6IEBF01BBYUP HK6IEBF01AI6AC HK6IEBF01AW7YC HK6IEBF01B1IE6 HK6IEBF01AYV3H HK6IEBF01BN2S8 HK6IEBF01BG5W HK6IEBF01BJFDR HK6IEBF01B04U2 HK6IEBF01A39J2 HK6IEBF01B5DDB HK6IEBF01BPQRL HK6IEBF01BBCE9 HK6IEBF01B1K98 HK6IEBF01AXRBZ HK6IEBF01AC8I1 HK6IEBF01BWH8V HK6IEBF01AVZR6 tcttctcctaaaaaccc-taaagtatcaagg-ttttt-acaaacctctacatt tcttctc tcttctcctaaaaaccc-taaagtatcaagg-ttttt-acaaacctctacatt tcttctcctaaaaaccc-taaagtatcaagg-ttttt-acaaacctctacatt tl"ttl"tcctaaaaaccc-taaagtatcaagggttttttacaaacctctacatt tcttctcctaaaaaccc-taaagtatcaagg-ttttt-acaaacctctacatt tcttctcgtaaaaagcg-taaagtatcaagg-ttttt-agaaacctgtacatt tl"ttl"tcctaaaaaccc-taaagtatcaagg-ttttt-acaaacctctacatt tcttctcctaaaaaccc-taaagtatcaagg-ttttt-acaaacctctacatt tcttctcctaaaaaccc-taaagtatcaagg-ttttt-acaaacctctacatt tl"ttl"tcctaaaaaccc-taaagtatcaagggttttt-acaaacctctacatt tcttctcctaaaaaccc-taaagtatcaagg-ttttt-acaaacctctacatt tcttctcctaaaaaccc-taaagtatcaagg-ttttt-acaaacctctacatt tcttctcctaaaaaccc-taaagtatcaagg-ttttt-acaaacctctacatt tcttctcctaaaaaccc-taaagtatcaagg-ttttt-acaaacctctacatt tcttctcctaaaaaccc-taaagtatcaagg-ttttt-acaaacctctacatt tcttctcctaaaaaccc-taaagtatcaagg-ttttt-acaaacctctacatt tcttctcctaaaaaccc-taaagtatcaagg-ttttt-acaaacctctacatt tcttctcctaaaaaccc-taaagtatcaagg-ttttt-acaaacctctacat tcttctcctaaaaaccc-taaagtatcaagg-ttttt-acaaacctctacat tcttctcctaaaaacccctaaagtatcaagg-ttttt-acaaacctctacatt tcttctcctaaaaaccc-taaagtatcaagg-ttttt-acaaacctctacatt tcttctcctaaaaaccc-taaagtatcaagg-ttttt-acaaacctctacatt tcttctcctaaaaaccc-taaagtatcaagg-ttttt-acaaacctctacatt tcttctcctaaaaaccc-taaagtatcaagg-ttttt-acaaacctctacatt aaaa-ccc-taa-gtatcaagg-ttttt-acaaacctctacatt aaaa-ccc-taa-gtatcaagg-ttttt-acaaacctctacatt t t t - -acaaacctctacatt- ■aggtaagt-aaccgaaaggttctatactagaatctgtatataaactatttgt ag ■aggtaagt ■aggtaagt-aaccgaaaggttctatactagaatc aaccgaaaggttctatactagaatctgta aaccgaaaggttctatagtagaatgtgtatataaactatttgt aggtaagt-aaccgaaaggttctatactagaatctgtatataaactatttgtI aggtaagt- aaccgaaaggttctatactagaatctgtatataaactatttgt aggtaagt-aaccgaaaggttctatactagaatctgtatat aggtaagt-aaccgaaaggttctatagtagaatgtgtatataaact aggtaagt- aaccgaaaggttctatactagaatctgtatataaactatttgt aaccgaaaggttctatactagaatctgtatataaactatttgt aaccgaaaggttctatactagaatctgtatataaactatttgt aaccgaaaggttctatactagaatctgtatataaactatttgt aaccgaaaggttctatactagaatctgtatataaactatttgt aaccgaaaggttctatactagaatctgtatataaactatttgt aaccgaaaggttctatactagaatctgtatataaactatttgt aaccgaaaggttctatactagaatctgtatataaactatttgt aaccgaaaggttctatactagaatctgtatataaactatttgt aaccgaaaggttctatactagaatctgtatataaactatttgt aaccgaaaggttctatactagaatctgtatataaactatttgt aaccgaaaggttctatactagaatctgtatataaactatttgt aaccgaaaggttctatactagaatctgtatataaactatttgt aaccgaaaggttctatactagaatctgtatataaactatttgt aaccgaaaggttctatactagaatctgtatataaactatttgtI agg-aagttaaccgaaaggttctatagtagaatgtgtatataaactatttgt aggtaagt-aaccgaaaggttctatactagaatctgtatataaactatttgt ctagaatctgtatataaactatttgt ■ aggtaagt -■aggtaagt - aggtaagt aggtaagt aggtaagt aggtaagt aggtaagt aggtaagt caggtaagt caggtaagt aggtaagt aggtaagt aggtaagt aggtaagt aggtaagt aggtaagt cd Info Srafai: Opened Assembler project: /home/LMDM/Plocha/analyza/Stafal [GS De novo Assembl... || S LMDM .Analysis messages Q Exit □ New Open 0 Start ® Stop Help [Untitled 1 - OpenOffi... || GS De novo Assembler Variant Calling & Annotation Mismatches are potential variants ^GTTGAGGCTTGCGTTTTTGGTACGCTGGACTTTGT GTACTCGTCGCTGCGTTGAGGCTTGCGTTTTTGGT* ATGGTACGCTGGACTTTCTAGGATACCCTCGCTTT "> TTGCGTTTATGGTACGCTGGACTTTGTAGGATACC* CTTGCGTTTATGGTACGCTGGACTTTGTAGGATAC TTGCGTTTATGGTACGCTGGGCTTTGTAGGATACC* GCGTTTATGGTACGCTGGACTTTGTAGGATACCCT-> GAGGCTTGCGTTTATGGTACGCTGGACTTTGTAGG^ 4- GCGTTGTGGCTTGCGTTTATGGTACGCTGGATTTT CGTTTATGGTACGCTGGACTTTGTAGGATACCCTC-> ATGGTACGC TGGAC TTTGTAGGATACCCTCGCTTT ■* *GTTTTTGGTACGCTGGACTTTGTAGGATACCCTCG TCTCGTGCTCGTCGC TGCGTTGAGGCTTGCGTTTA* ^TGACTGTCGCTGCGTTGAGGCTTGCGTTTATGGTA 4- GC TCGTCGC TGC GTTGAGGCT TGC GTTTATGGTAC TATGGTACGCTGGACTTTGTAGGATAGCCTCGCTT* TCGTGC TCGTCGCTGCGTTGAGGCTTGCGTTTTTG* ^CGTCGCTGCGTTGAGGCTTGCGTTTATGGTACGCT ^GTTGAGGCTTGCGTTTATGGTACGCTGGGCTTTTT ^TTGCGTTTATGGTACGCTGGACTTTGTAGGATACC RefI CTCTCGTGC TCGTCGCTGCGTTGAGGCTTGCGTTTATGGTACGCTGGACTTTGTAGGATACCCTC Formát dat • SAM = Sequence Alignment Map • BAM = Binary SAM = compressed SAM • contains information about how sequence reads map to a reference genome • Supports paired-end reads • Is produced by bowtie, BWA and other mapping tools (software) Technologie firmy Illumina/Solexa • Uvedena na trh 2006 • Prošla řadou inovací, zejména délky čtení • Masivní paralelní sekvenování milionů fragmentů DNA („polony" sequencing) • Sekvenacování syntézou na čipu (flow cell), které využívá strategii reverzi bil nich terminátorů • Nevyžaduje klonování ani přípravu knihovny na mikrosférách • Dosahuje 99,9 % přesnosti Příprava knihovny PCR - Náhodná fragmentace DNA na krátké úseky 200 - 500 bp - Zatupení konců a vytvoření 1 nt A-přesahu na 3'-konci (T4 DNA polymeráza, Klenow a polynukleotid-kináza T4) - Navázání adaptorů umožňujících kovalentní vazbu na opticky transparentní povrch pro sekvenování - Každý fragment je na povrchu uchycen pouze jedním koncem, po přidání enzymů pro amplifikaci dochází k ohnutí fragmentu do „mostu". - Výsledkem amplifikace jsou dva řetězce, každý s jedním volným a jedním pevným koncem - Po denaturaci jsou fragmenty narovnány a uspořádány do shluků, ve kterých je dosažena značná hustota, až 1000 kopií fragmentu na pm2 povrchu - Na celém povrchu je dosaženo hustoty deseti milionů shluků na cm2 polony Bridge amplification: initiation OH P7 P5 Grafted flowcell Ml ll Li II II II Template hybridization Initial extension Dena Una I: ion On the surface: complementary oligos diel dial J_L 1st cycle dťiia t uiation U dial diel J_L 1st cycle annealing Vyoral/ I i diol dioJ J_L 1st cycle extension 11 i_i_I 2nd cycle extension G* "Core u diol d.íJ J_L_ 2nd cycle clenatnration i i diel j 1 f j 2nd cycle annealing Illumina • Průběh sekvenační reakce • Přidání primem ve směsi s DNA polymerázou a fluorescenčně značenými dNTP • Nukleotidy jsou na 3'-konci modifikovány tak, že umožňují reverzibilní ukončení prodlužujícího se řetězce DNA • Je tak zajištěno, že se řetězec v každém cyklu prodlouží právě o jednu bázi. • Po zachycení obrazu připojené báze následuje odblokování 3'-konce Sequencing (lllumina technology) DNA SEQUENCING To initiate the first sequencing cycle and determine the first base, all four labeled reversible terminators and DNA polymerase enzyme are first added. Only one base can incorporate at a time. J SEQUENCING-BY-SYNTHESIS :: O O oo 8? « g Laser GO , OO * oo oo oo o » In the first cycle, the first base is incorporated. Its identity is determined by the signal given off and then recorded. In subsequent cycles, the process of adding sequencing reagents, removing unincorporated bases and capturing the signal of the next base to identify is repeated. BASE CALLING Lasers excite the fluorescent tags and the images are captured via CCD camera. The identity of the first base in each cluster is recorded, and then the fluorescent tag is removed. DUAL FLOW CELLS Once the top surface of the flow cell channel has been scanned, the imaging step is repeated on the bottom surface. Illumina Délka čtených úseků: - HiSeq : 100 ntor 150 nt - MiSeq : 250 nt Mnohonásobné pokrytí sekvence (30 x - 100 x) Možnost mnohonásobného sekvenování - Povrch sklíčka rozdělen do částí - Vzorky označeny pomocí dvanácti různých oligonukleotidů - Současně lze analyzovat až 96 různých vzorků. Produkuje desítky až stovky Gb za 1 běh (2 - 8 dnů) Aplikace ■ - Resekvenování k 1 Si - Sekvenování RNA - Stanovení metylací Mi Sekvenování třetí generace • Analýza jedné molekuly • Potřeba malého množství vzorku • Bez rizika kontaminace • Přesné čtení homopolymerních úseků • Analýza jakékoli NK (DNA/RNA) • Analýza poškozených NK (archaické, muzejní, forenzní) • Analýza DNA z nekultivovatelných organismů • Absolutní kvantifikace PacBio • Kružnicové kontinuální sekvenování (Single Molecule Real Time Sequencing - SMRT) • Templát obsahuje dvouřetězcovou oblast (inzert) na obou koncích uzavřenou jednořetězcovými vlásenkovými smyčkami • Vlásenkové smyčky představují jednořetězcovou oblast, na kterou se muže vázat sekvenační primer. • Polymeráza prodlužuje primer z jedné vlásenkové struktury využívá jedno vlákno DNA jako templát a druhé vytěsňuje • Když se polymeráza dostane zpět k 5'konci primem, začne vytlačovat již nasyntetizovaný řetězec a pokračuje v syntéze DNA • Výsledná sekvence je odvozená z obou vláken Příprava knihovny pro PacBio Template Preparation \ Polymerase^ * Instrument ^ y Primary ^ ^Secondary ^ Tertiary ^ f Design ^ Binding ^ ? Run ^ * Analysis , Analysis ^ " Analysis ^ DNA Sample Fragment DNA __- ^ Damage Repair/End Repair Ligate adapters X__________ Purify DNA SMRTbell™ Template preparation can be used to create libraries of various insert sizes from 250 bp to 20,000 bp depending on the needs of the application. http://www.pacb.com/wp-content/uploads/2015/09/PacBioWorkflow.pdf Sekvenování třetí generace - PacBio RS Pacific Biosciences Emission Illumination =1 tea fr» 400 If »J Ü £ 100 C T C G 1. LLhMAL uJ 4 nucleotides with different fluorescent dye simultaneous present 2-3 nucleotides/sec 2-3 Kb (up to 50) read length 6 TB data in 30 minutes laser damages polymerase A TC AAST A C A .A -J 104 5 105 0 1065 106 0 106 5 1 07 0 107.5 106 0 1 08 5 Time (s) PacBio High-throughput sequencing 0 facific Library preparation BIOSCIENCES SMRTBell'template' o-o I_L c—o Smal Insert Siies Standard'Sequenci ng' O-O Large Insert Sizes Single pass Circular'Consensus'Seqjencing1 ) Continued generations of reads Multiple passes NanoPore (1995) • Využívá měření elektrického potenciálu přes membránu • Elektricky odolná polymerní membrána (sysntetická lipidová dvouvrstva) s transmembránovým porózním proteinem • Modifikovaný a hemolysin (aHL) nebo porin A (MspA) Mycobacterium smegmatis • Nanopore je ponořený ve vodivém roztoku • Průchod bází na sekvenovaném řetězci přerušuje proud, který je specifický podle procházející báze G-tube sense/antisense DNA sample constriction \ L I I high molecular weight genomic DNA 2-minute centrifugation End-repair and dA-tailing Adapter ligation Příprava knihovny MinlON DMA can be sequenced by threading it through a microscopic pore in a membrane. Bases are identified by the way they affect ions flowing through the pore from one side of the membrane to the other. DNADOUBLE HELIX O One protein unzips the DMA helix into two strands. 0 A second protein creates a pore in the membrane and holds an "adapter" molecule. » • 0 A flow of ions through the pore creates a current Each base blocks the flow to a different degree, altering the current O The adapter molecule keeps bases in place long enoug h for tti em to be identified electronically. MEMBRANE — — _ *w m «. 3 C -O EP< ESP ^ ff] © I _u_u_ * Srovnání sekvenačních metod Srovnání metod pro sekvenování Metoda Příprava knihovny Klasické Maxam-Gilbert (chemická) Radioaktivně značené ssDNA Sanger (enzymová) Inzerty v plazmidových vektorech / produkty PCR NGS 454 (py rose kve n ování) Emulzní PCR Polovodičové (lonTorrent) Emulzní PCR lllumina Polony PCR Solid Emulzní PCR + imobilizace Třetí generace PacBio Ligace adaptorů se smyčkou Nanopore Ligace adaptorů + molekulární motor Helicos Ligace adaptorů Srovnání metod pro sekvenování Metoda Princip reakce Klasické Maxam-Gilbert (chemická) Degradace chemickými činidly Sanger (enzymová) Syntéza DNA polymerázou s terminátory NGS 454 (py rose kve n ování) Syntéza DNA polymerázou, detekce PP Polovodičové (lonTorrent) Syntéza DNA polymerázou, detekce H+ lllumina Syntéza DNA polymerázou s reverzibilními terminátory Solid Série ligací sond + posun rámce Třetí generace PacBio Syntéza DNA polymerázou Nanopore Měření změn el. potenciálu při průchodu inertní membránou Helicos Syntéza DNA polymerázou s reverzibilními terminátory Srovnání metod pro sekvenování Metoda Délka čtení Klasické Maxam-Gilbert (chemická) 150-300 nt Sanger (enzymová) 600- 1000 nt NGS 454 (py rose kve n ování) 500 nt Polovodičové (lonTorrent) 400 nt lllumina 200 nt Solid 30 - 40 nt Třetí generace PacBio 10-15 kb Nanopore > 10 kb Helicos 200 nt Srovnání metod pro sekvenování Metoda Uspořádání Klasické Maxam-Gilbert (chemická) Single read Sanger (enzymová) Pair-end read NGS 454 (py rose kve n ování) Single read, Pair-end read Polovodičové (lonTorrent) Single read, Pair-end read lllumina Single read, Mate-pair read Solid Mate-pair read Třetí generace PacBio Single read Nanopore Single read Helicos Single read