UNI SCI masaryk university faculty of science department of experimental biology laboratory of microbial molecular diagnostics Technologie sekvenoväni • Sekvenoväni (sequencing) stanovenl poradl nukleotidü v molekule DNA-primärni struktura Důvody řešení genomových projektů ♦ Genomika modelových organismů (de novo sekvenování) ♦ Analýza mutací a SNP, výzkum genetických onemocnění (resekvenování genomů, varianty sekvencí) ♦ Diagnostika a identifikace (de novo sekvenování a resekvenování) ♦ Analýza transkriptomu (RNAseq) ♦ Analýza malých RNA: miRNAs, siRNA, piRNA, (small RNA seq) ♦ Metagenomika (16S rRNA, celé metagenomy) ♦ DNA metylační studie (medip-seq, bisulfite treated DNA) ♦ Studie interakcí protein - DNA (ChIPseq) Techniky sekvenování • Klasické techniky: - Chemická (Maxamova-Gilbertova) Již se nepoužívá - Enzymová (Sangerova) * V současnosti se používá automatická varianta • Metody sekvenování nové generace (next generation sequencing, NGS) - Illumina, lonTorrent, (454, SoLiD) • Metody sekvenování třetí generace - PacBio, NanoPore, (Helicos) Princip sekvenačních metod • Klasické Sangerovo sekvenování kapilární elektroforézou - Vyžaduje velký počet kopií vstupního materiálu DNA jako templátu pro přípravu jednořeťězců • Sekvenování nové generace - Jako templát slouží jediná molekula, která je amplifikována pro získání dostatečného signálu, produkuje krátká čtení, možnost kvantitativní analýzy (SNP) • Sekvenování třetí generace - Jako templát slouží jediná molekula. Nevyužívá amplifikace za účelem zvýšení signálu, produkuje dlouhá čtení Projekt Výběr platformy Příprava knihovny Sekvenování Kontrola kvality Alignment i Assembly Vizualizace a analýza Normalizace, srovnání knihoven Hledání genů, variant, vazebných míst,... Diferenciální analýza, exprese, metabolomika, a) ATCl TCCG ATTA: .<. A A A' AA C ľ< ,TTTCATTCACTAAAACCAÍjC>AAATATAA J Ctorwd genomes Multiple gencm« j« ibeared into variable í tied segment* tegmenta ClíMipuMlitlil.il JLiUľUMLľll Rrvulting overLipping M-qurncr VřgmeiULfTne ľifcjher the coverage (he better the-quAlřly g( ihe Kqutncing. Chn(fl>ppi icq u price leqmcnts combi rwd lo comtrutt the qmtim-dinirnnh Cloned genomes egmenli. of kn own ardrr. □Ordered 9 frmnif vrgnvtrnl-. AT(j TTCCCi ATTA TTTCATTCAGTAAA«-,[-,a<,C,AAATATAA Multiple gpnomr pprfipni ;jrr-%hi?«ri?dintpviiialjlc lined Compuuitond I juiamated assembly Ht-iulTing nwrkipping q u f n: <>d leg mvntv | Thŕ higher the coverage the better ■he quality of the sequencing. Overlapping i*queri«j legmentiCůmtinfcJ to con it mi t ThĽ rjiinume Cuíisľm iui. , Celogenomové shotgun (náhodné) sekvenování versus postupné shot-gun sekvenování Technické požadavky pro úspěšné stanovení sekvence Příprava knihovny pro sekvenování molekuly s přesně definovanými konci • s místem pro vazbu primem • s koncovou značkou • Zajistit dostatečné pokrytí při čtení genomu Příprava variant fragmentů ssDNA lišících se svou délkou o jeden nukleotid • Syntéza • Degradace Detekce těchto variant fragmentů • Přesná separace na základě jejich délky • Detekce připojené koncové báze Kontinuální čtení Postup enzymatického sekvenování DNA 1. Příprava ssDNA jejíž sekvence má být stanovena 2. Rozdělení do 4 vzorků 3. Reakce s DNA polymerázou při níž se začlení do syntetizované DNA místo normálního deoxyribonukleosidtrifosfátu jeho analog, který působí jako koncový inhibitor syntézy DNA - dideoxynukleosidtrifosfát (ddNTP). V každém ze 4 vzorků vzniknou fragmenty, které jsou zakončeny příslušným ddNTP (ddCTP, ddGTP, ddATP a ddTTP). Reakce obsahuje: •molekulu DNA •značený primer při pojující se k části molekuly DNA (místo odkud začínáme stanovovat sekvenci) •směs obsahující 4 normální nukleotidy •jeden ddNTP (v každém ze 4 vzorků je jiný) •DNA polymerázu 4. Denaturace produktů 5. Elektroforetická separace umožňující oddělení fragmentů lišících se délkou o jednu bázi 6. Detekce fragmentů, které nesou označený konec Dideoxynukleotidy nemají hydroxy 1 na 3'-konci 23.4 DEOXYNUCLEOSIDE TRIPHOSPHATE 237 dideoxyhibose blocks elongation Pokudje dideoxynukleotid inkorporován do syntetizujícího se řetězce, působí jako terminátor reakce CH2 J BASE I Nucleotide will join on here at 3' position €K£>
break this bond
HO
Replikace DNA s normálními deoxynukleotidy
AGCCTGG CGACCATCGT TCGGACCGCTGGTAGCA
3' AGCCTGG CGACCATCGT
AGCCTGG CGACCATCGT
TCGGACCGCTGGTAGCA
Co se stane pokud při reakci použijete směs dGTP a ddGTP?
AGCCTGGCGACCATCGT TCGGACCGCTGGTAGCA
AGCCTGGCGACCATCGT
A T C G T
T AG C A
V v 4 v O
T CG T C GG
TCGGACCG TCGGACCGCTG TCGGACCGCTGG TCGGACCGCTGGTAG
Enzymová metoda sekvenování DNA (Sanger)
(A)
deoxyribonukleosidtrifosfát dideoxyribonukleosidtrifosfát
5'
G®0-O-CH2 O
pY pI ň-o-
5'
CH2 n
base
31 OH
/ /
je možno prodloužit řetězec na 3' -konci není možno prodloužit řetězec na 3' -konci
(B) normální prekursory „ malé množství jednoho
deoxyribonukleosidtri- ^ 4GCGA dideoxyribonukleosidtrifosfátu
fosfátů (dATP, dCTP, TA rGTCT (ddATP)
dGTP, dTTP) IfficÍT
Jvzácná inkorporace dideoxyribonukleosidtrifosfátu DNA-polymerázou zastaví další růst molekuly DNA
I ~ C GAT GGAC GT AC CXTGAAGCG
3' / 5' jednořetězcová DNA,
která bude sekvenována ~K. A ^
(C)
5' GCATATGTCAGTCCAG 3' dvou řetězcová 3' CGTATACAGTCAGGTC 5' DNA
označený primer 5' GCAT 3'
jednoretezcova 3' CGTATACAGTCAGGTC 5' DNA
+ nadbytek dATP dTTP dCTP dGTP
+ ddATP
\+ DNA-polymeráza
+ ddTTP + ddCTP
+ DNA-polymeráza \ + DNA-polymeráza
1:
ddGTP
DNA-polymeráza
GCAT A GCAT AT GCAT ATGTC GCAT ATG
GCAT ATGTCA GCAT ATGT GCAT ATGTCAGTC GCAT ATGTCAG
GCAT ATGTCAGTCCA GCAT ATGTCAGT GCAT ATGTCAGTCC GCAT ATGTCAGTCCAG
Obraz autoradiogramu ze sekvenačního gelu
A T C G
seq4.mov
ti *
ATGC ATGC ATGC ATGC
Automatické sekvenování DNA
• Je variantou enzymatického sekvenování DNA.
• Syntéza DNA probíhá v j edné reakci
• Ke značení produktů se používají čtyřmi různými fluorescenčními značkami označené dideoxyribonukleotidy
Strategie barevných terminátorů
asymetrická PCR
DENATURACE
PŘIPOJENI PRIMERU
SYNTÉZA
Enzyme, dNTPs, dye-labeled terminators
♦ o ♦ o •
AJO
0\O G]0
PRODUKTY
AO
A CO A
CO
A A A A
GO
C
C C C C G\Tj9 C C G T\K\0
C C G T A[T]i
Princip detekce produktů
• Detekce produktů probíhá během elektroforézy pomocí laserového detektoru (laserem indukovaná fluorescence, LIF) napojeného na počítač, který vyhodnocuje sekvenci.
CACCGCATCGAA.ATTAACTTCCAAAGTTAAGCTTGG
^ LASER
DETEKTOR
Fragmenty
Príprava gelu
Laserový detektor Rezervoár pufru
Automatické nanášení vzorku
Genetický analyzátor ABI 3100
Soustava kapilár
Vyhřívaná deska
Příprava knihovny pro náhodné sekvenování genomů
• Při náhodném sekvenování genomu jsou nejdříve připraveny mechanickým stříháním genomové DNA fragmenty
s optimální velikostí (1 300 - 2 000 bp) a po úpravě jejich konců jsou nahodile nakloňovány do vhodného vektoru za vzniku velkého počtu klonů.
• Ke štěpení DNA se využívá sonikace nebo pankreatická DNáza I za přítomnosti Mn2+.
Příprava knihovny pro Sangerovo sekvenování
Izolace DNA
Fragmentace 1300 - 2000 bp
u+
Vektor
C D
Úprava konců a klonování
ö°ö.P
B C
O
Sestavení překrývajících se klonů
AB C DE F G H I ......r ■ ■
Metody sekvenování nové generace
(next generation sequencing, NGS)
Krátká čtení - liší se v provedení a chemii
V základu se podobají v sekvenování tisíců až miliónů klonálně amplifikovanych molekul (masivní paralelní sekvenování)
Probíhá vývoj technik
- Více čtení
- Delší čtení
- Rychlejší sekvenování
- Nižší cena
Možnost kvantifikace Možnost multiplexování
Pyrosequencing Roche/454
Sequencing by Ligation Life Tech/SOLiD
H+ Ion Generation Life Tech/Ion Torrent
Reversible Dye Terminators lllumina
Clonal Amplification
ePCR —
ePCR
ePCR
Reaction Output
Luminescence
Fluorescence
pH Change
Signal/Noise Conversion
y i
Cluster
Fluorescence
J
Sequence
Sekvenování třetí generace
* Pacific Biosciences (PacBio)
* Oxford Nanophore Technologies
* Helicos Biosciences
Metody přípravy knihovny
Fragmentace
• Enzymatická
• Fyzikální (sonikace, nebulizace, Hydroshear)
Připojení adaptorů Amplifikace
Library preparation
Emulsion PCR
"Polony" PCR on a slide
Semiconductor sequencing (Ion Torrent)
Reversable terminator sequencing umina)
Pyrosequencing (454)
Sequencing by ligation (SOLiD)
Selekce fragmentů podle velikosti
• E-gel System
'Select
Typy uspořádání NGS sekvenování
Single Read
Paired-end read (PE)
Mate-pair read (MP)
výsledkem jsou miliony krátkých čtení sekvencí z náhodných částí genomu
Analýza velikostí fragmentů
knihovny na Agilent bioanalyzátoru
Post Shear
ŕgilent Bioanalyzer image of Sheared DNA X axis = base pairs
Orientace párových čtení
<— —>
—► <— < —>
<--► 4-->
—► 4- < » 4- >
4- ->•
Paired end (PE) reads » < pe, MP
Mate pair (MP) reads ^- ->- mp
Hloubka sekvenování (pokrytí)
• Coverage (pokrytí) = (počet získaných čtení * průměrná délka čteníývelikost genomu
• Fragment 2000 bází sestavíme z 8 čtení o délce 500 bp -> 8x500/2000 = 2
• Příklad 1: Získali jsme 106 čtení s technologií lontorrent, velikost genomu je 3 Mb. Jaké je pokrytí?
• Příklad 2: Technologie lllumina poskytuje 200 milionů čtení. Kolik genomů o velikosti 5 Mb mohu sekvenovat, abych získal pokrytí 50*?
Ion Torrent polovodičové
sekvenování
• Nástupce pyrosekvenocání (454-sekvenování)
• prvním platforma, která nepoužívá pro detekci sekvenovaných bází DNA světelný signál, který by byl uvolňovaný při enzymatických reakcích s fluorescenčními nebo chemiluminscenčními substráty
• Sekvenování Ion Torrent je založené na elektrochemické detekci vodíkových iontů (pH) které jsou uvolněny při replikaci sekvenovaného templátu na speciálním polovodičovém čipu.
Uvolnění vodíku v nepufrujících podmínkách
Příprava knihovny při emulzní PCR
Příprava jednořetězcové DNA knihovny
- Umožňuje zpracovat různé typy vzorků
• genomové DNA
• produkty PCR
• klonované DNA
• metagenom
- Frakcionace dlouhých úseků na 200- až 400-bp dlouhé fragmenty
- Vazba dvou adaptorů specifických pro 3'- a 5'-konce na každý fragment
• Adaptor A obsahuje vazebné místo pro primer
• Adaptor B obsahuje 5'-biotinovou značku, která slouží k imobilizaci DNA knihovny na mikrosféry pokryté streptavidinem
• Klonální amplifikace knihovny
- emulzní PCR, amplifikační reagencie ve směsi voda-olej ->• mikroreaktory obsahující jedinou kuličku s unikátním fragmentem DNA z knihovny - (107) kopií
• Separace kuliček a výběr pouze těch, které obsahují amplifikovanou DNA (enrichment)
• Sekvenační reakce
• Analýza dat a assembly
lonTorrent polovodičové sekvenování
• Na čipu se nachází milióny jednotlivých reakčních cell (reaktorů), ve kterých probíhá sekvenační analýza individuálních kopií DNA na základě kontinuálního střídání reakčních složek (jednotlivých typů nukleotidů) v mikrofluidním systému.
• DNA imobilizovaná na mikrosférách (po emulzní PCR)
• Kapacita závisí na typu použitého polovodičového chipu
- 10-65 miliónů
- 100-600 miliónů
- > 1000 miliónů
lonTorrent čip
Výstup z Torrent server
Fteail Summary: Unaligned
1.05 G
Total ESiei
■III
80 %
isp Loaamg
ISP Density
40
Kay Signal
3,162,233 Total Raadi
ml
ISP Summai y
80%
Loading
93%
Final Library
33%
Polyclonal
2% Test Fragments 0% Adapter Dimer 5% Low Quality
332 bp 330 bp 392 bp
■idlin Hadi
Re.nl LeiHjtli I
100 200 300 400 500 Re^d Length
Ali