Technologie sekvenování •stanovení pořadí nukleotidů v molekule DNA (primární struktura) Důvody řešení genomových projektů uGenomika modelových organismů (de novo sekvenování) uAnalýza mutací a SNP, výzkum genetických onemocnění (resekvenování genomů) uIdentifikace mikroorganismů (de novo sekvenování a resekvenování) uAnalýza transkriptomu (RNAseq) uDNA metylační studie (medip-seq, bisulfite treated DNA) uStudie transkripčních faktorů, proteinů vázajících se na DNA (ChIPseq) uMalé RNA (miRNAs, siRNA, piRNA, aj.) (small RNAseq) uMetagenomika (16S rRNA, celé metagenomy) Techniky sekvenování •Klasické techniky: –Chemická (Maxamova-Gilbertova) •Již se nepoužívá –Enzymová (Sangerova) •V současnosti se používá automatická varianta •Metody sekvenování nové generace (next generation sequencing, NGS) –454, IonTorrent, Illumina, SoLiD •Metody sekvenování třetí generace –PacBio, NanoPore, Helicos, etc. • – • Vývoj sekvenačních metod •Klasické sekvenování kapilární elektroforézou –Vyžaduje velký počet kopií vstupního materiálu DNA jako templátu pro přípravu jednořeťězců •Sekvenování nové generace –Jako templát slouží jediná molekula, která je amplifikována pro získání dostatečného signálu, produkuje krátká čtení, možnost kvantitativní analýzy (SNP) •Sekvenování třetí generace –Jako templát slouží jediná molekula. Nevyužívá amplifikace za účelem zvýšení signálu, produkuje dlouhá čtení Projekt • Výběr platformy Fragmentace genomu a příprava knihovny Sekvenování Kontrola kvality Přiložení sekvencí Assembly Vizualizace a analýza • Normalizace, srovnání knihoven • Hledání genů, variant, vazebných míst, … • Diferenciální analýza, exprese, metabolomika, …. v Příprava knihovny pro sekvenování - DNA s přesně definovanými konci – Každá metoda sekvenování vyžaduje fragmentaci DNA a přípravu knihovny • s místem pro vazbu primeru • s koncovou značkou Náhodná fragmentace a překryvy fragmentů umožňují zajistit dostatečné pokrytí při čtení genomu v Příprava variant fragmentů ssDNA lišících se svou délkou o jeden nukleotid v Přesná separace těchto fragmentů na základě jejich délky, detekce připojené koncové báze, kontinuální čtení a detekce značených bází Základní požadavky pro úspěšné stanovení sekvence Sangerovým sekvenováním: Celogenomové shotgun (náhodné) sekvenování versus postupné shot-gun sekvenování Fragmentace Izolace DNA + Úprava konců a klonování Vektor Sestavení překrývajících se klonů Příprava knihovny pro Sangerovo sekvenování 1300 – 2000 bp Příprava knihovny pro náhodné sekvenování genomů •Při náhodném sekvenování genomu jsou nejdříve připraveny mechanickým stříháním genomové DNA fragmenty s optimální velikostí (1 300 – 2 000 bp) a po úpravě jejich konců jsou nahodile naklonovány do vhodného vektoru za vzniku velkého počtu klonů. •Ke štěpení DNA se využívá sonikace nebo pankreatická DNáza I za přítomnosti Mn2+. •Předpokládá se, že celková informace o sekvenci obsažená v připravených malých klonech odpovídá původní DNA a sekvence fragmentů jednotlivých klonů se vzájemně překrývají. •Pomocí univerzálních sekvenačních primerů připojujících se k vektoru poblíž klonovacího místa jsou stanoveny sekvence krátkých úseků na koncích klonovaných fragmentů (minimálně 500 bází). •Stanovené sekvence jsou pak použity k uspořádání klonovaných fragmentů z jednotlivých vektorů do souvislých sekvencí genomové DNA - kontigů. Postup enzymatického sekvenování DNA 1. Příprava ssDNA jejíž sekvence má být stanovena 2. Rozdělení do 4 vzorků 3. Reakce s DNA polymerázou při níž se začlení do syntetizované DNA místo normálního deoxyribonukleosidtrifosfátu jeho analog, který působí jako koncový inhibitor syntézy DNA - dideoxynukleosidtrifosfát (ddNTP). V každém ze 4 vzorků vzniknou fragmenty, které jsou zakončeny příslušným ddNTP (ddCTP, ddGTP, ddATP a ddTTP). Reakce obsahuje: •molekulu DNA •značený primer při pojující se k části molekuly DNA (místo odkud začínáme stanovovat sekvenci) •směs obsahující 4 normální nukleotidy •jeden ddNTP (v každém ze 4 vzorků je jiný) •DNA polymerázu 4. Denaturace produktů 5. Elektroforetická separace umožňující oddělení fragmentů lišících se délkou o jednu bázi 6. Detekce fragmentů, které nesou označený konec Dideoxynukleotidy nemají hydroxyl na 3’-konci Pokud je dideoxynukleotid inkorporován do syntetizujícího se řetězce, působí jako terminátor reakce Původní sekvence Denaturovaný templátový řetězec Prfektní kopie 3’ 5’ Replikace DNA s normálními deoxynukleotidy Co se stane pokud při reakci použijete směs dGTP a ddGTP? Původní sekvence Templátový řetězec Perfektní kopie 3’ 5’ Směs řetězců ukončených GUANINEM při použití směsi dGTP a ddGTP 10_05 seq seq4.mov Automatické sekvenování DNA •Je variantou enzymatického sekvenování DNA. • •Syntéza DNA probíhá v jedné reakci • •Ke značení produktů se používají čtyřmi různými fluorescenčními značkami označené •primery •dideoxyribonukleotidy Strategie barevných terminátorů Bez názvu 1 asymetrická PCR GEL + _ LASER DETEKTOR Princip detekce produktů Fragmenty • Detekce produktů probíhá během elektroforézy pomocí laserového detektoru (laserem indukovaná fluorescence, LIF) napojeného na počítač, který vyhodnocuje sekvenci. Assembly Čtení Překrývající se čtení •Kontig – kontinuální sekvence vzniklá spojením více překrývajících se čtení •Konsenzní sekvence = kontigy -> genom •Pokrytí na bázi •Hloubka sekvenování = celkové pokrytí (počet získaných čtení × průměrná délka čtení)/velikost genomu Pokrytí 2x 5x Assembly Uspořádané sekvenování –Pro doplnění sekvence mezer zbývajících po náhodném sekvenování –Pro sekvenování malých fragmentů DNA • • Dva odlišné přístupy: –procházení primerem •vyžaduje znalost sekvence, ke které se připojuje primer, který umožní prodloužení řetězce DNA-polymerázou. •získaná sekvence z první reakce je použita pro návrh primeru pro další reakci a tento krok se opakuje, dokud není dosaženo kompletního stanovení sekvence. •Tento proces nevyžaduje další klonování a minimalizuje stanovení nadbytečných sekvencí, ale správnost stanovené sekvence by měla být ověřena sekvenováním obou řetězců. – –postupné zkracování fragmentu exonukleázou a tvorba sousedících delecí • Metody sekvenování nové generace (next generation sequencing, NGS) •Liší se v provedení a chemii •V základu se podobají v sekvenování tisíců až miliónů klonálně amplifikovaných molekul (masivní paralelní sekvenování) •Probíhá vývoj technik –Více čtení –Delší čtení –Rychlejší sekvenování –Nižší cena •Nové aplikace v klinické oblasti, vývoj kitů cílených na určité části genomů (dědičná onemocnění nádorová onemocnění, metagenomika, 16S rRNA) Pyrosequencing Roche/454 utilizes ePCR for clonal amplification and luminescence for reaction output. Sequencing by Ligation Life Tech/SOLiD utilizes ePCR for clonal amplification and fluorescence for reaction output. H+ Ion Generation Life Tech/Ion Torrent utilizes ePCR for clonal amplification and pH Change for reaction output. Reversible Dye Terminators Illumina utilizes Cluster for clonal amplification and Fluroescence for reaction output. Following these processes, signal/noise conversion leads to sequence. •Sekvenování třetí generace •Pacific Biosciences •Helicos Biosciences •NABsys •VisiGen Biotechnologies •Oxford Nanophore Technologies Metody přípravy knihovny •Fragmentace •Enzymatická •Fyzikální (sonikace, nebulizace, Hydroshear) •Připojení adaptorů •Amplifikace Typy uspořádání NGS sekvenování Single Read Paired-end read (PE) Mate-pair read (MP) výsledkem jsou miliony krátkých čtení sekvencí z náhodných částí genomu Orientace párových čtení • Paired end (PE) reads Mate pair (MP) reads Vývoj ceny sekvenování na příkladu HGP Cost of NGS over time. (Years on x-axis, cost on y-axis.) From 1990-2003, Human Genome Project and Sanger (cost $2.7 billion). From 2003-2008, transformative step next gen seq. Costs from 2008 to 2010 decreased from $1.5 million to $10,000 or less. Costs are projected to decrease to $5,000 or less by 2015 with innovations in chemistry, optics, fluidics, computational hardware, and bioinformatics solutions. Transformační krok •Inovace •Chemie reakcí •Optika •Fluidika •Hardware •Bioinformatika TempFile1080829893 Genetický analyzátor ABI 3100 TempFile1080829870 Laserový detektor Příprava gelu Rezervoár pufru Automatické nanášení vzorku Soustava kapilár Vyhřívaná deska Sekvenátory Miseq a IonPGM 9300_pgmcorrect system-carousel-miseq-right Ion Torrent polovodičové sekvenování •prvním sekvenátor DNA, který nepoužívá pro detekci sekvenovaných bází DNA světelný signál, který by byl uvolňovaný při enzymatických reakcích s fluorescenčními nebo chemiluminscenčními substráty. •Sekvenování Ion Torrent je založené na elektrochemické detekci vodíkových iontů (pH) které jsou uvolněny při replikaci sekvenovaného templátu na speciálním polovodičovém čipu. Uvolnění vodíku v nepufrujících podmínkách Eliminate source of sequencing errors: Modified bases Fluorescent bases Laser detection Enzymatic amplification cascades Eliminate source of read length limitations: Unnatural bases Faulty synthesis Slow cycle time Delivers highly uniform genome coverage PGM functions by delivering natural unmodified nucleotides one at a time over the surface of the chip Because nucleotides are unmodified and detection does not require any additional enzyme cascades it eliminates many sources of error delivering long accurate reads with highly uniform genome coverage Knihovna •Příprava jednořetězcové DNA knihovny –Umožňuje zpracovat různé typy vzorků •genomové DNA •produkty PCR •BACs •cDNA –Frakcionace dlouhých úseků na 200- až 400-bp dlouhé fragmenty –Vazba dvou adaptorů specifických pro 3’- a 5’-konce na každý fragment •Adaptor A obsahuje vazebné místo pro primer •Adaptor B B obsahuje 5'-biotinovou značku, která slouží k imobilizaci DNA knihovny na mikrosféry pokryté streptavidinem Klonální amplifikace knihovny emulzní PCR •Klonální amplifikace knihovny –emulzní PCR, amplifikační reagencie ve směsi voda-olej ® mikroreaktory obsahující jedinou kuličku s unikátním fragmentem DNA z knihovny - (107) kopií •Separace kuliček a výběr pouze těch, které obsahují amplifikovanou DNA (enrichment) •Sekvenační reakce •Analýza dat a assembly • • IonTorrent polovodičové sekvenování •Na čipu se nachází milióny jednotlivých reakčních cell (reaktorů), ve kterých probíhá sekvenační analýza individuálních kopií DNA na základě kontinuálního střídání reakčních složek (jednotlivých typů nukleotidů) v mikrofluidním systému. •DNA imobilizovaná na mikrosférách (po emulzní PCR) •Kapacita závisí na typu použitého polovodičového chipu –10 – 65 miliónů –100 – 600 miliónů –> 1000 miliónů Ion Torrent polovodičové sekvenování •Technologie Ion Torrentu je otevřená pro sekvenování DNA de-novo i cílené sekvenování vybraných oblastí genomu •Minimální délka sekvenačního čtení –V jedno směru: 400bp –Obousměrné (Paired end) –Počet vzorků analyzovaných v jednom běhu –až 96 vzorků – pomocí označení tzv. barkodem •Doba sekvenační analýzy –2 - 3,5 hodiny – podle použitého čipu IonTorrent čip Ion-Torrent_Par_79124_Image_660_400_1_gif_Step_2_gif Výstup z Torrent server • Příklad sekvenčního přiložení a assembly • Stafal Technologie firmy Illumina •Uvedena na trh 2006 •Prošla řadou inovací, zejména délky čtení •Masivní paralelní sekvenování milionů fragmentů DNA („polony“ sequencing) •Sekvenacování syntézou na čipu (flow cell), které využívá strategii reverzibilních terminátorů •Nevyžaduje klonování ani přípravu knihovny na mikrosférách •Dosahuje 99,9 % přesnosti Příprava knihovny – polony PCR –Náhodná fragmentace DNA na krátké úseky 200 – 500 bp –Zatupení konců a vytvoření 1 nt A-přesahu na 3’-konci (T4 DNA polymeráza, Klenow a polynukleotid-kináza T4) –Navázání adaptorů umožňujících kovalentní vazbu na opticky transparentní povrch pro sekvenování –Každý fragment je na povrchu uchycen pouze jedním koncem, po přidání enzymů pro amplifikaci dochází k ohnutí fragmentu do „mostu“. –Výsledkem amplifikace jsou dva řetězce, každý s jedním volným a jedním pevným koncem –Po denaturaci jsou fragmenty narovnány a uspořádány do shluků, ve kterých je dosažena značná hustota, až 1000 kopií fragmentu na μm2 povrchu –Na celém povrchu je dosaženo hustoty deseti milionů shluků na cm2 Bridge amplification: initiation On the surface: complementary oligos Itt meg nem szekvenalasi cellal szintetizalunk. Az uj szal kovalensen kapcsolodik az uveghez, az eredeti elvesz new-4 Itt meg mindig nem syekvenalunk, csak soxorositunk, linearisan Illumina •Průběh sekvenační reakce •Přidání primerů ve směsi s DNA polymerázou a fluorescenčně značenými dNTP •Nukleotidy jsou na 3'-konci modifikovány tak, že umožňují reverzibilní ukončení prodlužujícího se řetězce DNA •Je tak zajištěno, že se řetězec v každém cyklu prodlouží právě o jednu bázi. •Po zachycení obrazu připojené báze následuje odblokování 3'-konce Illumina •Délka čtených úseků: –HiSeq : 100 nt or 150 nt –MiSeq : 250 nt •Mnohonásobné pokrytí sekvence (30 x – 100 x) •Možnost mnohonásobného sekvenování –Povrch sklíčka rozdělen do částí –Vzorky označeny pomocí dvanácti různých oligonukleotidů –Současně lze analyzovat až 96 různých vzorků. •Produkuje desítky až stovky Gb za 1 běh (2 - 8 dnů) •Aplikace –Resekvenování –Sekvenování RNA –Stanovení metylací – miseq.png MiSeq Sekvenování třetí generace •Analýza jedné molekuly •Potřeba malého množství vzorku •Bez rizika kontaminace •Přesné čtení homopolymerních úseků •Analýza jakékoli NK (DNA/RNA) •Analýza poškozených NK (archaické, muzejní, forenzní) •Analýza DNA z nekultivovatelných organismů •Absolutní kvantifikace PacBio •Kružnicové kontinuální sekvenování •SMRT (Single Molecule Real-Time) sequencing - templát obsahuje dvouřetězcovou oblast (inzert) na obou koncích uzavřenou jednořetězcovými vlásenkovými smyčkami •Vlásenkové smyčky představují jednořetězcovou oblast, na kterou se může vázat sekvenační primer. •Polymeráza prodlužuje primer z jedné vlásenkové struktury využívá jedno vlákno DNA jako templát a druhé vytěsňuje •Když se polymeráza dostane zpět k 5´konci primeru, začne vytlačovat již nasyntetizovaný řetězec a pokračuje v syntéze DNA •Výsledná sekvence je odvozená z obou vláken Příprava knihovny pro PacBio PacBio Workflow - PacBioWorkflow.pdf - Mozilla Firefox http://www.pacb.com/wp-content/uploads/2015/09/PacBioWorkflow.pdf Sekvenování třetí generace – PacBio RS PacBio Day1-IntroductionNGS.pdf - Mozilla Firefox NanoPore (1995) •Využívá měření elektrického potenciálu přes membránu •Elektricky odolná polymerní membrána (sysntetická lipidová dvouvrstva) s transmembránovým porózním proteinem •Modifikovaný α hemolysin (αHL) nebo porin A (MspA)Mycobacterium smegmatis •Nanopore je ponořený ve vodivém roztoku •Průchod bází na sekvenovaném řetězci přerušuje proud, který je specifický podle procházející báze http://www.technologyreview.com/sites/default/files/legacy/nanopore_x616%5b1%5d.jpg http://scienceblogs.com/geneticfuture/wp-content/blogs.dir/274/files/2012/04/i-aa9e3e7df9224020fb7a e2fa5c3b2e9b-nanopore_1.jpg Příprava knihovny MinION KL14.pptx - Brown.pdf - Mozilla Firefox the MinION device http://www.nanoporetech.com/uploads/Technology_New/MinION/MinION_117.jpg the MinION device http://www.nanoporetech.com/uploads/Technology_New/MinION/MinION_66.jpg