UNI SCI masaryk university faculty of science department of experimental biology laboratory of microbial molecular diagnostics Bi5000 - Bioinformatika Technologie sekvenovani • Sekvenovani (sequencing) stanovenl poradl nukleotidu v molekule DNA-primarni struktura Důvody řešení genomových projektů Genomika modelových organismů {de novo sekvenování) ♦ Analýza mutací a SNP, výzkum genetických onemocnění (resekvenování genomů, varianty sekvencí, sequence capture) ♦ Diagnostika a identifikace (de novo sekvenování a resekvenování) ♦ Metagenomika (16S rRNA, celé metagenomy) ♦ DNA metylační studie (medip-seq, bisulfite treated DNA, ONT) ♦ Analýza transkriptomu (RNAseq), diferenciální exprese ♦ Analýza malých RNA: miRNAs, siRNA, piRNA, (small RNA seq) ♦ CHIP-seq (Chromatin imunoprecipitation sequencing) Techniky sekvenování • Klasické techniky: - Chemická (Maxamova-Gilbertova) Již se nepoužívá - Enzymová (Sangerova) * V současnosti se používá automatická varianta • Metody sekvenování nové generace (next generation sequencing, NGS) - 454 (pyrosekvenování), lonTorrent, lllumina, SoLiD • Metody sekvenování třetí generace - PacBio, NanoPore Princip sekvenačních metod ® Klasické sekvenování kapilární elektroforézou - Vyžaduje velký počet kopií vstupního materiálu DNA jako templátu ve formě jednořeťězců, abychom zachytili signál Sekvenování nové generace - Jako templát slouží jediná molekula, která je amplifikována pro získání dostatečného signálu, produkuje krátká čtení, možnost kvantitativní analýzy (SNP) Sekvenování třetí generace - Jako templát slouží jediná molekula. Nevyužívá amplifikace za účelem zvýšení signálu, produkuje dlouhá čtení Projekt Výběr platformy Příprava knihovny Sekvenování Kontrola kvality Alignment i Assembly Vizualizace a analýza Normalizace, srovnání knihoven Hledání genů, variant, vazebných míst,... Diferenciální analýza, exprese, metabolomika, Bioinformatické zpracování o Trimming, selection Pipeline (automated processing) Graphic visualization Polishing Annotation a) ATCl TCCG ATTA: .<. A A A' AA C N ,TTTCATTCACTAAAA06AC6 A A ÄTATAA j Ctorwd gentunes into variable í tied segment* Unordered wqucrtccd segment CumipuMlitiii.il jLiUľUMLľil Rrvulting nvrrLipping M-qurncr VrgmefULfrhe higher the coverage (he better tKe-quAlrly g( ihe ■-.--:■=■■=■-. ■■ is Chn(fl>ppi ntj sequence icq merits combi rwd lo construct the qmtim-dinirnnh ť) Cloned genomes Gřrwmí divided into l.irgr egmenli. of kr own arder. □Ordered 9 frmnif AT(j ľTCCCi ATTA rrTCATTCAGTAAA«-,[-,a<,C,AAATATAA Multiple gpnamr pprtipni 3re sheared intpviiiatHc vm3 vrgmenti iegrnints Compuuftanal juianuted assembly Ht-iulTing nwrkipping q u f nr. i-ti :eq mentv | The higher the coverage 1h* better ■he quality of the sequencing. Overlapping i*quert«J segment; combi net) to con si mel ThĽ rjĽncune CuíisĽn iui. , Celogenomové shotgun (náhodné) sekvenování versus postupné shot-gun sekvenování Technické požadavky pro úspěšné stanovení sekvence Fragmentace DNA zajistit dostatečné pokrytí při čtení genomu Příprava knihovny pro sekvenování molekuly s přesně definovanými konci • s místem pro vazbu primeru • s koncovou značkou Příprava variant fragmentů (ssDNA) lišících se svou délkou o jeden nukleotid • Syntéza • Degradace Detekce variant fragmentů • Přesná separace na základě jejich délky • Detekce koncové báze po jejím připojení • Kontinuální čtení Postup enzymatického sekvenování DNA 1. Příprava ssDNA jejíž sekvence má být stanovena 2. Rozdělení do 4 vzorků 3. Reakce s DNA polymerázou při níž se začlení do syntetizované DNA místo normálního deoxyribonukleosidtrifosfátu jeho analog, který působí jako koncový inhibitor syntézy DNA - dideoxynukleosidtrifosfát (ddNTP). V každém ze 4 vzorků vzniknou fragmenty, které jsou zakončeny příslušným ddNTP (ddCTP, ddGTP, ddATP a ddTTP). Reakce obsahuje: •molekulu DNA •značený primer při pojující se k části molekuly DNA (místo odkud začínáme stanovovat sekvenci) •směs obsahující 4 normální nukleotidy •jeden ddNTP (v každém ze 4 vzorků je jiný) •DNA polymerázu 4. Denaturace produktů 5. Elektroforetická separace umožňující oddělení fragmentů lišících se délkou o jednu bázi 6. Detekce fragmentů, které nesou označený konec Dideoxynukleotidy nemají hydroxy 1 na 3'-konci 23.4 DEOXYNUCLEOSIDE TRIPHOSPHATE 237 dideoxyhibose blocks elongation Pokudje dideoxynukleotid inkorporován do syntetizujícího se řetězce, působí jako terminátor reakce CH2 J BASE I Nucleotide will join on here at 3' position €K£>
break this bond
HO
Replikace DNA s normálními deoxynukleotidy
AGCCTGG CGACCATCGT TCGGACCGCTGGTAGCA
3' AGCCTGG CGACCATCGT
AGCCTGG CGACCATCGT
TCGGACCGCTGGTAGCA
Co se stane pokud při reakci použijete směs dGTP a ddGTP?
AGCCTGGCGACCATCGT TCGGACCGCTGGTAGCA
AGCCTGGCGACCATCGT
A G C
T C G G.
G CG
ta
T C G T T A G C A
T CG T C GG
TCGGACCG TCGGACCGCTG TCGGACCGCTGG TCGGACCGCTGGTAG
Enzymová metoda sekvenování DNA (Sanger)
(A)
deoxyribonukleosidtrifosfát dideoxyribonukleosidtrifosfát
5'
G®0-O-CH2 O
pY pI ň-o-
5'
CH2 n
base
31 OH
/ /
je možno prodloužit řetězec na 3' -konci není možno prodloužit řetězec na 3' -konci
(B) normální prekursory „ malé množství jednoho
deoxyribonukleosidtri- ^ 4GCGA dideoxyribonukleosidtrifosfátu
fosfátů (dATP, dCTP, TA TG^Cj (ddATP)
dGTP, dTTP) IfficÍT
Jvzácná inkorporace dideoxyribonukleosidtrifosfátu DNA-polymerázou zastaví další růst molekuly DNA
I ~ C GAT GGAC GT AC CXTGAAGCG
3' / 5' jednořetězcová DNA,
která bude sekvenována ~K. A ^
(C)
5' GCATATGTCAGTCCAG 3' dvou řetězcová 3' CGTATACAGTCAGGTC 5' DNA
označený primer 5' GCAT 3'
jednoretezcova 3' CGTATACAGTCAGGTC 5' DNA
+ nadbytek dATP dTTP dCTP dGTP
+ ddATP
\+ DNA-polymeráza
+ ddTTP + ddCTP
+ DNA-polymeráza \ + DNA-polymeráza
1:
ddGTP
DNA-polymeráza
GCAT A GCAT AT GCAT ATGTC GCAT ATG
GCAT ATGTCA GCAT ATGT GCAT ATGTCAGTC GCAT ATGTCAG
GCAT ATGTCAGTCCA GCAT ATGTCAGT GCAT ATGTCAGTCC GCAT ATGTCAGTCCAG
Obraz autoradiogramu ze sekvenačního gelu
A T C G
seq4.mov
ti *
ATGC ATGC ATGC ATGC
Automatické sekvenování DNA
Je variantou Sangerova enzymového sekvenování DNA Knihovnu tvoří
• Klonované fragmenty v plazmidových vektorech
• Produkty PCR
Syntéza DNA probíhá v jedné reakci Ke značení produktů se používají čtyřmi různými fluorescenčními značkami označené
• primery
• dideoxyribonukleotidy
Strategie barevných terminátorů
asymetrická PCR
DENATURACE
PŘIPOJENI PRIMERU
SYNTÉZA
Enzyme, dNTPs, dye-labeled terminators
♦ o • o ♦
AJO
0\O G]0
PRODUKTY
AO
A CO A
CO
A A A A
GO
C
C C C C G\Tj9 C C G T\K\0
C C G T A[T]i
Princip detekce produktů
• Detekce produktů probíhá během elektroforézy pomocí laserového detektoru (laserem indukovaná fluorescence, LIF) napojeného na počítač, který vyhodnocuje sekvenci.
CACCGCATCGaAATTAACTTCCAAAGTTAAGCTTGG
^ LASER
DETEKTOR
Fragmenty
■ 3161A_R40rj-ARP0D22130 - C hro m a s File Edit Options. Help
□ X
a? y V -+N A4
—^J— -|Sample: 3161A_R400-ARP0022130
Open Save Export Print Next Find Reverse Enhance
I
lli
20
4'j
5'j
17'j
G T CGI C TI I I CT T CT G G T A C T T CA GC T T CCTACACG TAG A A A G G T T T A T T C C C A G ATAAAAGCA GT TTA.C.
■ 3161AJW0D-ARP0D2213D-Chromas File Edit Options Help
□ X
a. V S -+N
Open Export Print Next Find Reverse Enhance
f J |Sample: 3161A_R40Q-ARP0Q22130
E C G T G C G C C A C TT TCTTAAGGAGCAAGCCCC T T A A T A T C GTT C G A C T T G C A T G T A T T A G G C CTGCC G C T
I
4'j'j
4 lij
42 j
4 i'j
4 4'j
4 5'j
Príprava gelu
Laserový detektor Rezervoár pufru
Automatické nanášení vzorku
Genetický analyzátor ABI 3100
Soustava kapilár
Vyhřívaná deska
Příprava knihovny pro náhodné sekvenování genomů
• Při náhodném sekvenování genomu jsou nejdříve připraveny mechanickým stříháním genomové DNA fragmenty
s optimální velikostí (1 300 - 2 000 bp) a po úpravě jejich konců jsou nahodile nakloňovány do vhodného vektoru za vzniku velkého počtu klonů.
• Ke štěpení DNA se využívá sonikace nebo pankreatická DNáza I za přítomnosti Mn2+.
Příprava knihovny pro Sangerovo sekvenování
Izolace DNA
Fragmentace 1300 - 2000 bp
u+
Vektor
C D
Úprava konců a klonování
ö°ö.P
B C
O
Sestavení překrývajících se klonů
AB C DE F G H I ......r ■ ■
Metody sekvenování nové generace
(next generation sequencing, NGS)
Liší se v provedení a chemii
V základu se podobají v sekvenování tisíců až miliónů klonálně amplifikovanvch molekul (masivní paralelní sekvenování)
Probíhá vývoj technik
- Více čtení
- Delší čtení
- Rychlejší sekvenování
- Nižší cena
Nové aplikace v klinické oblasti, vývoj kitů cílených na určité části genomů (dědičná onemocnění nádorová onemocnění, metagenomika, 16S rRNA)
Clonal Reaction Amplification Output
Pyrosequencing Roche/454
Sequencing by Ligation Life Tech/SOLiD
H+ Ion Generation Life Tech/Ion Torrent
Reversible Dye Terminators lllumina
ePCR
ePCR
ePCR
Cluster
Luminescence
Fluorescence
pH Change
>
Signal/Noise Conversion
Sequence
Fluorescence
J
• Sekvenování tretí generace Pacific Biosciences Oxford Nanophore Technologies
Helicos Biosciences NABsys
VisiGen Biotechnologies
Vývoj technik sekvenování q
Sanger sequencing
1977
I
-•A "tT »pG
Maxa m-Gilbert sequencing
lllumlna GA
Ion torrent PGM
Nanopore sequencing family
2005 2006 2007 2010
2011 2014
454 Pyrosequencing
ABI's SoLiO system
PacBio Sequel System
Life 2022, Í2(1), 30; https://doi.Org/10.3390/life12010030
Metody přípravy knihovny o
Fragmentace DNA na uniformní délku
• Enzymatická
• Fyzikální (sonikace, nebulizace, Hydroshear)
Ligace adaptorů Amplifikace
Library preparation
Emulsion PCR
"Polony" PCR on a slide
Semiconductor sequencing (Ion Torrent)
Reversable terminator sequencing umina)
Pyrosequencing (454)
Sequencing by ligation (SOLiD)
Selekce fragmentů podle velikosti
E-gel Systém
Weil raw for library recovery
Unligated Ion adapiors
i Add SPRIsele«
Selekce pomocí magnetických kuliček
Size Selection Separation
Etna nol Wash Elution Buffer Transfer
Magnet
i
Discard Supernatant
Discard EtOH
100-200 bp size selection
bp 800 A
400
200
*200 bp -100 bp
200 100
500 bp
200 bp
Ligace adaptorů
p5
\h index
ii iri e y
\
Rd2 SP UMI
UMI Rd1 SP
II II
Rd1 SP UMI Insert UMI Rd2 SP
\
pE
5' 3'
Nucleic Acids Research, 46(6), doi: 10.1093/nai7gky1ffT
3'
3'
N
i7 index
15 index
®
end repair
5'®.
3' ■
tailing
3'
51
5'(El
3* A-
[Mill
L
1®
3' 5'
ligation
mni
*T
A
* 111111
3' 5'
PCR(barcode incorporation)
-T
■A ■T'
+ amplified library
iT ■A*
■A ■T'
Typy uspořádání NGS sekvenování
Single Read
Paired-end read (PE)
Mate-pair read (MP)
výsledkem jsou miliony krátkých čtení sekvencí z náhodných částí genomu
Orientace párových čtení
<— —>
—► <— < —>
<--► 4-->
—► 4- < » 4- >
4- ->•
Paired end (PE) reads » < pe, MP
Mate pair (MP) reads ^- ->- mp
Hloubka sekvenování (pokrytí)
• Coverage (pokrytí) = (počet získaných čtení * průměrná délka čteníývelikost genomu
• Fragment 2000 bází sestavíme z 8 čtení o délce 500 bp -> 8x500/2000 = 2
• Příklad 1: Získali jsme 106 čtení s technologií lontorrent, velikost genomu je 3 Mb. Jaké je pokrytí?
• Příklad 2: Sekvenátor lllumina poskytuje 200 milionů čtení. Kolik genomů o velikosti 5 Mb mohu osekvenovat s použitím chemie poskytující čtení o délce 150 nt, abych získal pokrytí 50*?
Ion Torrent polovodičové
sekvenování
• Nástupce pyrosekvenování (454-sekvenování)
• prvním platforma, která nepoužívá pro detekci sekvenovaných bází DNA světelný signál, který by byl uvolňovaný při enzymatických reakcích s fluorescenčními nebo chemiluminscenčními substráty
• Sekvenování Ion Torrent je založené na elektrochemické detekci vodíkových iontů (pH) které jsou uvolněny při replikaci sekvenovaného templátu na speciálním polovodičovém čipu.
Uvolneni vodiku v nepufrujicich podminkacn
O
4dNTPs
5' 3'
3' 5'
dNTPs
Example:
Primer
Template
Příprava knihovny při emulzní PCR
Příprava jednořetězcové DNA knihovny
- Umožňuje zpracovat různé typy vzorků
• genomové DNA
• produkty PCR
• klonované DNA
- Frakcionace dlouhých úseků na 300- až 500-bp dlouhé fragmenty
- Vazba dvou adaptorů specifických pro 3'- a 5'-konce na každý fragment
• Adaptor A obsahuje vazebné místo pro primer
• Adaptor B obsahuje 5'-biotinovou značku, která slouží k imobilizaci DNA knihovny na mikrosféry pokryté streptavidinem
• Klonální amplifikace knihovny
- emulzní PCR, amplifikační reagencie ve směsi voda-olej ->• mikroreaktory obsahující jedinou kuličku s unikátním fragmentem DNA z knihovny - (107) kopií
• Separace kuliček a výběr pouze těch, které obsahují amplifikovanou DNA (enrichment)
• Sekvenační reakce
• Analýza dat a assembly
lonTorrent polovodičové sekvenování
• Na čipu se nachází milióny jednotlivých reakčních cell (reaktorů), ve kterých probíhá sekvenační analýza individuálních kopií DNA na základě kontinuálního střídání reakčních složek (jednotlivých typů nukleotidů) v mikrofluidním systému.
• DNA imobilizovaná na mikrosférách (po emulzní PCR)
• Kapacita závisí na typu použitého polovodičového chipu
- 10-65 miliónů
- 100-600 miliónů
- > 1000 miliónů
lonTorrent čip
Ion Torrent polovodičové
sekvenování
• Technologie Ion Torrentu je otevřená pro sekvenování DNA de-novo i cílené sekvenování vybraných oblastí genomu
• Minimální délka sekvenačního čtení
- V jedno směru: 400bp
- Obousměrné (Paired end)
- Počet vzorků analyzovaných v jednom běhu
- až 96 vzorků - pomocí označení tzv. barkodem
• Doba sekvenační analýzy
- 2 - 3,5 hodiny - podle použitého čipu
Výstup z Torrent server
Reail Summary: Unaligned
1.05 G
Total ESiei
■III
80 %
isp Loaamg
ISP Density
40
Kay Signal
3,162,233 Total Raadi
ml
ISP Summai y
80%
Loading
93%
Final Library
33%
Polyclonal
2% Test Fragments 0% Adapter Dimer 5% Low Quality
332 bp 330 bp 392 tip
■idlin Hadi
Re.nl LeiHjtli I
100 200 300 400 500 Re^d Length
Ali