UNI SCI masaryk university faculty of science department of experimental biology laboratory of microbial molecular diagnostics Technologie sekvenoväni • Sekvenoväni (sequencing) stanovenl poradl nukleotidü v molekule DNA-primärni struktura Důvody řešení genomových projektů ♦ Genomika modelových organismů (de novo sekvenování) ♦ Analýza mutací a SNP, výzkum genetických onemocnění (resekvenování genomů, varianty sekvencí) ♦ Diagnostika a identifikace (de novo sekvenování a resekvenování) ♦ Analýza transkriptomu (RNAseq) ♦ Analýza malých RNA: miRNAs, siRNA, piRNA, (small RNA seq) ♦ Metagenomika (16S rRNA, celé metagenomy) ♦ DNA metylační studie (medip-seq, bisulfite treated DNA) ♦ Studie interakcí protein - DNA (ChIPseq) Techniky sekvenování • Klasické techniky: - Chemická (Maxamova-Gilbertova) Již se nepoužívá - Enzymová (Sangerova) * V současnosti se používá automatická varianta • Metody sekvenování nové generace (next generation sequencing, NGS) - Illumina, lonTorrent, (454, SoLiD) • Metody sekvenování třetí generace - PacBio, NanoPore, (Helicos) Princip sekvenačních metod • Klasické Sangerovo sekvenování kapilární elektroforézou - Vyžaduje velký počet kopií vstupního materiálu DNA jako templátu pro přípravu jednořeťězců • Sekvenování nové generace - Jako templát slouží jediná molekula, která je amplifikována pro získání dostatečného signálu, produkuje krátká čtení, možnost kvantitativní analýzy (SNP) • Sekvenování třetí generace - Jako templát slouží jediná molekula. Nevyužívá amplifikace za účelem zvýšení signálu, produkuje dlouhá čtení Projekt Výběr platformy Příprava knihovny Sekvenování Kontrola kvality Alignment i Assembly Vizualizace a analýza Normalizace, srovnání knihoven Hledání genů, variant, vazebných míst,... Diferenciální analýza, exprese, metabolomika, a) ATCl TCCG ATTA: .<. A A A' AA C ľ< ,TTTCATTCACTAAAACCAÍjC>AAATATAA J Ctorwd genomes Multiple gencm« j« ibeared into variable í tied segment* tegmenta ClíMipuMlitlil.il JLiUľUMLľll Rrvulting overLipping M-qurncr VřgmeiULfTne ľifcjher the coverage (he better the-quAlřly g( ihe Kqutncing. Chn(fl>ppi icq u price leqmcnts combi rwd lo comtrutt the qmtim-dinirnnh Cloned genomes egmenli. of kn own ardrr. □Ordered 9 frmnif vrgnvtrnl-. AT(j TTCCCi ATTA TTTCATTCAGTAAA«-,[-,a<,C,AAATATAA Multiple gpnomr pprfipni ;jrr-%hi?«ri?dintpviiialjlc lined Compuuitond I juiamated assembly Ht-iulTing nwrkipping q u f n: <>d leg mvntv | Thŕ higher the coverage the better ■he quality of the sequencing. Overlapping i*queri«j legmentiCůmtinfcJ to con it mi t ThĽ rjiinume Cuíisľm iui. , Celogenomové shotgun (náhodné) sekvenování versus postupné shot-gun sekvenování Technické požadavky pro úspěšné stanovení sekvence Příprava knihovny pro sekvenování molekuly s přesně definovanými konci • s místem pro vazbu primem • s koncovou značkou • Zajistit dostatečné pokrytí při čtení genomu Příprava variant fragmentů ssDNA lišících se svou délkou o jeden nukleotid • Syntéza • Degradace Detekce těchto variant fragmentů • Přesná separace na základě jejich délky • Detekce připojené koncové báze Kontinuální čtení Postup enzymatického sekvenování DNA 1. Příprava ssDNA jejíž sekvence má být stanovena 2. Rozdělení do 4 vzorků 3. Reakce s DNA polymerázou při níž se začlení do syntetizované DNA místo normálního deoxyribonukleosidtrifosfátu jeho analog, který působí jako koncový inhibitor syntézy DNA - dideoxynukleosidtrifosfát (ddNTP). V každém ze 4 vzorků vzniknou fragmenty, které jsou zakončeny příslušným ddNTP (ddCTP, ddGTP, ddATP a ddTTP). Reakce obsahuje: •molekulu DNA •značený primer při pojující se k části molekuly DNA (místo odkud začínáme stanovovat sekvenci) •směs obsahující 4 normální nukleotidy •jeden ddNTP (v každém ze 4 vzorků je jiný) •DNA polymerázu 4. Denaturace produktů 5. Elektroforetická separace umožňující oddělení fragmentů lišících se délkou o jednu bázi 6. Detekce fragmentů, které nesou označený konec Dideoxynukleotidy nemají hydroxy 1 na 3'-konci 23.4 DEOXYNUCLEOSIDE TRIPHOSPHATE 237 dideoxyhibose blocks elongation Pokudje dideoxynukleotid inkorporován do syntetizujícího se řetězce, působí jako terminátor reakce CH2 J BASE I Nucleotide will join on here at 3' position €K£>

break this bond HO Replikace DNA s normálními deoxynukleotidy AGCCTGG CGACCATCGT TCGGACCGCTGGTAGCA 3' AGCCTGG CGACCATCGT AGCCTGG CGACCATCGT TCGGACCGCTGGTAGCA Co se stane pokud při reakci použijete směs dGTP a ddGTP? AGCCTGGCGACCATCGT TCGGACCGCTGGTAGCA AGCCTGGCGACCATCGT A T C G T T AG C A V v 4 v O T CG T C GG TCGGACCG TCGGACCGCTG TCGGACCGCTGG TCGGACCGCTGGTAG Enzymová metoda sekvenování DNA (Sanger) (A) deoxyribonukleosidtrifosfát dideoxyribonukleosidtrifosfát 5' G®0-O-CH2 O pY pI ň-o- 5' CH2 n base 31 OH / / je možno prodloužit řetězec na 3' -konci není možno prodloužit řetězec na 3' -konci (B) normální prekursory „ malé množství jednoho deoxyribonukleosidtri- ^ 4GCGA dideoxyribonukleosidtrifosfátu fosfátů (dATP, dCTP, TA rGTCT (ddATP) dGTP, dTTP) IfficÍT Jvzácná inkorporace dideoxyribonukleosidtrifosfátu DNA-polymerázou zastaví další růst molekuly DNA I ~ C GAT GGAC GT AC CXTGAAGCG 3' / 5' jednořetězcová DNA, která bude sekvenována ~K. A ^ (C) 5' GCATATGTCAGTCCAG 3' dvou řetězcová 3' CGTATACAGTCAGGTC 5' DNA označený primer 5' GCAT 3' jednoretezcova 3' CGTATACAGTCAGGTC 5' DNA + nadbytek dATP dTTP dCTP dGTP + ddATP \+ DNA-polymeráza + ddTTP + ddCTP + DNA-polymeráza \ + DNA-polymeráza 1: ddGTP DNA-polymeráza GCAT A GCAT AT GCAT ATGTC GCAT ATG GCAT ATGTCA GCAT ATGT GCAT ATGTCAGTC GCAT ATGTCAG GCAT ATGTCAGTCCA GCAT ATGTCAGT GCAT ATGTCAGTCC GCAT ATGTCAGTCCAG Obraz autoradiogramu ze sekvenačního gelu A T C G seq4.mov ti * ATGC ATGC ATGC ATGC Automatické sekvenování DNA • Je variantou enzymatického sekvenování DNA. • Syntéza DNA probíhá v j edné reakci • Ke značení produktů se používají čtyřmi různými fluorescenčními značkami označené dideoxyribonukleotidy Strategie barevných terminátorů asymetrická PCR DENATURACE PŘIPOJENI PRIMERU SYNTÉZA Enzyme, dNTPs, dye-labeled terminators ♦ o ♦ o • AJO 0\O G]0 PRODUKTY AO A CO A CO A A A A GO C C C C C G\Tj9 C C G T\K\0 C C G T A[T]i Princip detekce produktů • Detekce produktů probíhá během elektroforézy pomocí laserového detektoru (laserem indukovaná fluorescence, LIF) napojeného na počítač, který vyhodnocuje sekvenci. CACCGCATCGAA.ATTAACTTCCAAAGTTAAGCTTGG ^ LASER DETEKTOR Fragmenty Príprava gelu Laserový detektor Rezervoár pufru Automatické nanášení vzorku Genetický analyzátor ABI 3100 Soustava kapilár Vyhřívaná deska Příprava knihovny pro náhodné sekvenování genomů • Při náhodném sekvenování genomu jsou nejdříve připraveny mechanickým stříháním genomové DNA fragmenty s optimální velikostí (1 300 - 2 000 bp) a po úpravě jejich konců jsou nahodile nakloňovány do vhodného vektoru za vzniku velkého počtu klonů. • Ke štěpení DNA se využívá sonikace nebo pankreatická DNáza I za přítomnosti Mn2+. Příprava knihovny pro Sangerovo sekvenování Izolace DNA Fragmentace 1300 - 2000 bp u+ Vektor C D Úprava konců a klonování ö°ö.P B C O Sestavení překrývajících se klonů AB C DE F G H I ......r ■ ■ Metody sekvenování nové generace (next generation sequencing, NGS) Krátká čtení - liší se v provedení a chemii V základu se podobají v sekvenování tisíců až miliónů klonálně amplifikovanych molekul (masivní paralelní sekvenování) Probíhá vývoj technik - Více čtení - Delší čtení - Rychlejší sekvenování - Nižší cena Možnost kvantifikace Možnost multiplexování Pyrosequencing Roche/454 Sequencing by Ligation Life Tech/SOLiD H+ Ion Generation Life Tech/Ion Torrent Reversible Dye Terminators lllumina Clonal Amplification ePCR — ePCR ePCR Reaction Output Luminescence Fluorescence pH Change Signal/Noise Conversion y i Cluster Fluorescence J Sequence Sekvenování třetí generace * Pacific Biosciences (PacBio) * Oxford Nanophore Technologies * Helicos Biosciences Metody přípravy knihovny Fragmentace • Enzymatická • Fyzikální (sonikace, nebulizace, Hydroshear) Připojení adaptorů Amplifikace Library preparation Emulsion PCR "Polony" PCR on a slide Semiconductor sequencing (Ion Torrent) Reversable terminator sequencing umina) Pyrosequencing (454) Sequencing by ligation (SOLiD) Selekce fragmentů podle velikosti • E-gel System 'Select Typy uspořádání NGS sekvenování Single Read Paired-end read (PE) Mate-pair read (MP) výsledkem jsou miliony krátkých čtení sekvencí z náhodných částí genomu Analýza velikostí fragmentů knihovny na Agilent bioanalyzátoru Post Shear ŕgilent Bioanalyzer image of Sheared DNA X axis = base pairs Orientace párových čtení <— —> —► <— < —> <--► 4--> —► 4- < » 4- > 4- ->• Paired end (PE) reads » < pe, MP Mate pair (MP) reads ^- ->- mp Hloubka sekvenování (pokrytí) • Coverage (pokrytí) = (počet získaných čtení * průměrná délka čteníývelikost genomu • Fragment 2000 bází sestavíme z 8 čtení o délce 500 bp -> 8x500/2000 = 2 • Příklad 1: Získali jsme 106 čtení s technologií lontorrent, velikost genomu je 3 Mb. Jaké je pokrytí? • Příklad 2: Technologie lllumina poskytuje 200 milionů čtení. Kolik genomů o velikosti 5 Mb mohu sekvenovat, abych získal pokrytí 50*? Ion Torrent polovodičové sekvenování • Nástupce pyrosekvenocání (454-sekvenování) • prvním platforma, která nepoužívá pro detekci sekvenovaných bází DNA světelný signál, který by byl uvolňovaný při enzymatických reakcích s fluorescenčními nebo chemiluminscenčními substráty • Sekvenování Ion Torrent je založené na elektrochemické detekci vodíkových iontů (pH) které jsou uvolněny při replikaci sekvenovaného templátu na speciálním polovodičovém čipu. Uvolnění vodíku v nepufrujících podmínkách Příprava knihovny při emulzní PCR Příprava jednořetězcové DNA knihovny - Umožňuje zpracovat různé typy vzorků • genomové DNA • produkty PCR • klonované DNA • metagenom - Frakcionace dlouhých úseků na 200- až 400-bp dlouhé fragmenty - Vazba dvou adaptorů specifických pro 3'- a 5'-konce na každý fragment • Adaptor A obsahuje vazebné místo pro primer • Adaptor B obsahuje 5'-biotinovou značku, která slouží k imobilizaci DNA knihovny na mikrosféry pokryté streptavidinem • Klonální amplifikace knihovny - emulzní PCR, amplifikační reagencie ve směsi voda-olej ->• mikroreaktory obsahující jedinou kuličku s unikátním fragmentem DNA z knihovny - (107) kopií • Separace kuliček a výběr pouze těch, které obsahují amplifikovanou DNA (enrichment) • Sekvenační reakce • Analýza dat a assembly lonTorrent polovodičové sekvenování • Na čipu se nachází milióny jednotlivých reakčních cell (reaktorů), ve kterých probíhá sekvenační analýza individuálních kopií DNA na základě kontinuálního střídání reakčních složek (jednotlivých typů nukleotidů) v mikrofluidním systému. • DNA imobilizovaná na mikrosférách (po emulzní PCR) • Kapacita závisí na typu použitého polovodičového chipu - 10-65 miliónů - 100-600 miliónů - > 1000 miliónů lonTorrent čip Výstup z Torrent server Fteail Summary: Unaligned 1.05 G Total ESiei ■III 80 % isp Loaamg ISP Density 40 Kay Signal 3,162,233 Total Raadi ml ISP Summai y 80% Loading 93% Final Library 33% Polyclonal 2% Test Fragments 0% Adapter Dimer 5% Low Quality 332 bp 330 bp 392 bp ■idlin Hadi Re.nl LeiHjtli I 100 200 300 400 500 Re^d Length Ali% GS De novo Assembler Technologie firmy Illumina/Solexa • Uvedena na trh 2006 • Prošla řadou inovací, zejména délky čtení • Masivní paralelní sekvenování („polony" sequencing) • Sekvenacování syntézou na čipu (flow cell), které využívá strategii reverzi bil nich terminátorů • Nevyžaduje klonování ani přípravu knihovny na mikrosférách • Dosahuje 99,9 % přesnosti Příprava knihovny PC R - Náhodná fragmentace DNA na krátké úseky 200 - 500 bp - Zatupení konců a vytvoření 1 nt A-přesahu na 3'-konci (T4 DNA polymeráza, Klenow a polynukleotid-kináza T4) - Navázání adaptorů umožňujících kovalentní vazbu na opticky transparentní povrch pro sekvenování - Každý fragment je na povrchu uchycen _ pouze jedním koncem, po přidání enzymů pro amplifikaci dochází k ohnutí fragmentu do „mostu". - Výsledkem amplifikace jsou dva řetězce, každý s jedním volným a jedním pevným koncem - Po denaturaci jsou fragmenty narovnány a uspořádány do shluků, ve kterých je dosažena značná hustota, až 1000 kopií fragmentu na um2 povrchu - Na celém povrchu je dosaženo hustoty deseti milionů shluků na cm2 polony I i I Bridge amplification: initiation P7 P5 Grafted flowrell Template hybridization JjiitiaJ extension Delia titration On the surface: complementary oligos 1st cycle clena titration 1st cycle annealing 1st cycle extension II did d.c I__1_I_L 2nd cycle (Lena titration J_I I I 2nd cvcle extension Gefl Core 2nd cvcle annealing Illumina • Průběh sekvenační reakce • Přidání primerů ve směsi s DNA polymerázou a fluorescenčně značenými dNTP • Nukleotidy jsou na 3'-konci modifikovány tak, že umožňují reverzibilní ukončení prodlužujícího se řetězce DNA • Je tak zajištěno, že se řetězec v každém cyklu prodlouží právě o jednu bázi. • Po zachycení obrazu připojené báze následuje odblokování 3'-konce Illumina • Délka čtených úseků: - HiSeq : 75 nt or 150nt - MiSeq : 300 nt - NovaSeq: 2x 250 nt • Mnohonásobné pokrytí sekvence (30 x - 100 x) • Možnost mnohonásobného sekvenování - Povrch sklíčka rozdělen do částí - Vzorky označeny pomocí dvanácti různých oligonukleotidů - Současně lze analyzovat až 96 různých vzorků. • Produkuje desítky až stovky Gb za 1 běh (2-8 dnů) • Aplikace - Resekvenování - Sekvenování RNA - Stanovení metylací Sekvenování třetí generace • Analýza jedné molekuly • Potřeba malého množství vzorku • Bez rizika kontaminace • Přesné čtení homopolymerních úseků • Analýza jakékoli NK (DNA/RNA) • Analýza poškozených NK (archaické, muzejní, forenzní) • Analýza DNA z nekultivovatelných organismů • Absolutní kvantifikace PacBio • Kružnicové kontinuální sekvenování (Single Molecule Real Time Sequencing - SMRT) • Templát obsahuje dvou řetězcovou oblast (inzert) na obou koncích uzavřenou jednořetězcovými vlásenkovými smyčkami • Vlásenkové smyčky představují jed n o řetězcovou oblast, na kterou se muže vázat sekvenační primer. • Polymeráza prodlužuje primer z jedné vlásenkové struktury využívá jedno vlákno DNA jako templát a druhé vytěsňuje • Když se polymeráza dostane zpět k 5'konci primem, začne vytlačovat již nasyntetizovaný řetězec a pokračuje v syntéze DNA • Výsledná sekvence je odvozená z obou vláken Příprava knihovny pro PacBio Template Preparation z Template Run Polymerase^! Instrument Primary Preparation Design /(? Binding A? Run Analysis r DNA Sample Fragment DNA Damage Repair/End Repair 1 __„,...........*/~\ Purify DNA SMRTbell™ Template preparation can be used to create libraries of various insert sizes from 250 bp to 20,000 bp depending on the needs of the application. http://www.pacb.com/wp-content/uploads/2015/09/PacBioWorkflow Sekvenoväni tretf generace - PacBio RS Pacific Biosciences I ISu mi nation 400 « B Ü 300- jf 200^ □ 09 IL c 100 Emission T C G A T -A 4 nucleotides with different fluorescent dye simultaneous present 2-3 nucleotides/sec 2-3 Kb (up to 50) read length 6 TB data in 30 minutes laser damages polymerase A AG t A : A 104 5 105 0 105 5 106 0 106 5 107 0 Time {s) 107 5 108 0 108 5 Technologie NanoPore • Využívá měření elektrického potenciálu při průchodu DNA přes membránu (1995) • Elektricky odolná polymerní membrána (sysntetická lipidová dvouvrstva) s transmembránovým porézním proteinem • Modifikovaný a hemolysin (aHL) nebo porin A (MspA) Mycobacterium smegmatis • Nanopore je ponořený ve vodivém roztoku • Průchod bází na sekvenovaném řetězci přerušuje proud, který je specifický podle procházející báze G-tube sen se/a nti sense DNA sample constriction \ high molecular weight genomic DNA 2-minute centrifugation End-repair and dA-tailing Motor attachment Příprava knihovny MinlON DNA can be sequenced by threading it through a microscopic pore in a membrane. Bases are identified by the way they affect ions flowing through the pore from one side of the membrane to the other. DNA DOUBLE HELIX 0 One protein unzips the DNA helix into two strands. O A second protein creates a pore in the membrane and holds an 'adapter" molecule. i4 *%t 0 A flow of ions through the pore creates a current Each base blocks the flow to a different degree, altering the current 30.4 30.6 30.8 Time (s) 31,0 31.2 Flowcell -MinlON .1 Ji! > la í SpotON h mm 2048 jamek s póry (záruka na min. 800 funkčních nanopórů) 512 kanálů (ASIC obsahuje 1 zesilovač signálu na 4 jamky) čtení vždy jen z jedné jamky, po nastavených intervalech se střídají (tzv. remux) senzor odpadové porty priming port port pro nanášení nanášení vzorku vzorku Čip senzoru musí být neustále zaplaven pufrem vnesení bubliny nebo odsátí pufru vede k nevratnému poškození Srovnání sekvenačních metod Srovnání metod pro sekvenování Metoda Příprava knihovny Klasické Maxam-Gilbert (chemická) Radioaktivně značené ssDNA Sanger (enzymová) Inzerty v plazmidových vektorech / produkty PCR NGS 454 (pyrosekvenování) Emulzní PCR Polovodičové (lonTorrent) Emulzní PCR lllumina Polony PCR Solid Emulzní PCR + imobilizace Třetí generace PacBio Ligace adaptorů se smyčkou Nanopore Ligace adaptorů + molekulární motor Helicos Ligace adaptorů Srovnání metod pro sekvenování Metoda Princip reakce Klasické Maxam-Gilbert (chemická) Degradace chemickými činidly Sanger (enzymová) Syntéza DNA polymerázou s terminátory, elektroforéza NGS 454 (py rose kve n ování) Syntéza DNA polymerázou, detekce pyrofosfátu (PP) Polovodičové (lonTorrent) Syntéza DNA polymerázou, detekce H+ lllumina Syntéza DNA polymerázou s reverzibilními terminátory Solid Série ligací sond + posun rámce Třetí generace PacBio Syntéza DNA polymerázou Nanopore Měření změn el. potenciálu při průchodu inertní membránou Helicos Syntéza DNA polymerázou s reverzibilními terminátory Srovnání metod pro sekvenování Metoda Délka čtení Klasické Maxam-Gilbert (chemická) 150-300 nt Sanger (enzymová) 600- 1200 nt NGS 454 (py rose kve n ování) 500 nt Polovodičové (lonTorrent) 400 nt lllumina 1x 300 nt, 2x 150 nt, 2x 75 nt Solid 30 - 40 nt Třetí generace PacBio 10-15 kb Nanopore > 10 kb Helicos 200 nt Srovnání metod pro sekvenování Metoda Uspořádání Klasické Maxam-Gilbert (chemická) Single read Sanger (enzymová) Single read, Pair-end read NGS 454 (pyrosekvenování) Single read, Pair-end read Polovodičové (lonTorrent) Single read, Pair-end read lilu mina Single read, Mate-pair read Solid Mate-pair read Třetí generace PacBio Single read Nanopore Single read Helicos Single read