Sekvenování DNA
• stanovení pořadí nukleotidů v molekule DNA (primární struktury)
Sekvencovänl / Sekvenoväni
■ ■
Sequencing /
die Sequenzierung /
Klasické techniky sekvenování
• 2 metody:
- Chemická (Maxamova-Gilbertova)
• Již se nepoužívá
- Enzymová (Sangerova)
• V současnosti se používá automatická varianta
- společný rys obou metod: příprava a separace fragmentů DNA, jejichž velikost se liší o 1 nukleotid
• Metody sekvenování nové generace (NGS)
• Metody sekvenování třetí generace (z jedné molekuly)
Základní požadavky pro úspěšné stanovení sekvence klasickou
technikou:
Příprava knihovny pro sekvenování - DNA s přesně definovanými konci
• s místem pro vazbu primem
• s koncovou značkou
Příprava souboru všech fragmentů ssDNA lišících se svou délkou o jeden nukleotid
Přesné rozdělení těchto fragmentů na základě jejich délky a detekce koncové báze
Chemická metoda (Maxam-Gilbert)
Sekvence je odvozena z molekuly DNA, která se chemicky degraduje v místech, kde se vyskytuje báze určitého typu na fragmenty.
Ty se následně oddělují elektroforézou.
Enzymatická metoda (Sanger)
1. Příprava ssDNA jejíž sekvence má být stanovena
2. Rozdělení do 4 vzorků
3. Reakce s DNA polymerázou při níž se začlení do syntetizované DNA místo normálního deoxyribonukleosidtrifosfátu jeho analog, který působí jako koncový inhibitor syntézy DNA - dideoxvnukleosidtrifosfát (ddNTP). V každém ze 4 vzorků vzniknou fragmenty, které jsou zakončeny příslušným ddNTP (ddCTP, ddGTP, ddATP a ddTTP).
Reakce obsahuje: •molekulu DNA
•značený primer při pojující se k části molekuly DNA (místo odkud začínáme stanovovat sekvenci) •směs obsahující 4 normální nukleotidy •jeden ddNTP (v každém ze 4 vzorků je jiný) •DNA polymerázu
4. Denaturace produktů
5. Elektroforetická separace umožňující oddělení fragmentů lišících se délkou o jednu bázi
6. Detekce fragmentů, které nesou označený konec
Dideoxynukleotidy nemají hydroxy 1 na 3'-konci
Ribose Deoxyribose Dideoxyribose
HO-CH2 HO-CH2 HO-CH2
23.4 DEOXYNUCLEOSIDE TRIPHOSPHATE 23.7 dideoxyribose blocks elongation
Pokudje dideoxynukleotid inkorporován do syntetizujícího se řetězce, působí jako terminátor reakce
HO H
Nucleotide will join on here at 3' position
Replikace DNA s normálními deoxynukleotidy
Původní sekvence AGCCTGG CGACCATCGT TCGGACCGCTGGTAGCA
Denaturovaný templátový řetězec 3' AGCCTGG CGACCATCGT 5'
Prfektní kopie AGCCTGGCGACCATCGT
TCGGACCGCTGGTAGCA
Co se stane pokud při reakci použijete směs dGTP a ddGTP?
AGCCTGG CGACCATCGT TCGGACCGCTGGTAGCA
AGCCTGGCGACCATCGT
A T C G T T A G C A
T CG T C GG
TCGGACCG TCGGACCGCTG TCGGACCGCTGG TCGGACCGCTGGTAG
<C)
5' GCATATGTCAGTCCAG 3' 3' CGTATACAGTCAGGTC 5'
dvou řetězcová DNA
označený primer j
5' GCAT 3' . . .
jednoretezcova 3* CGTATACAGTCAGGTC 5' DNA
+ nadbytek dATP dTTP dCTP dGTP
UddATP
\+ DNA-polymeráza
ddTTP + ddCTP
DNA-polymeráza \ + DNA-polymeráza
+ ddGTP
' + DNA-polymeráza
GCAT A	GCAT AT	GCAT ATGTC	GCAT	ATG
GCAT ATGTCA	GCAT ATGT	GCAT ATGTCAGTC	GCAT ATGTCAG	
GCAT ATGTCAGTCCA	GCAT ATGTCAGT	GCAT ATGTCAGTCC	GCAT ATGTCAGTCCAG	
seq4.mov
Obraz autoradiogramu ze sekvenačního gelu
W I
ATGC ATGC ATGC ATGC
Automatické sekvenování DNA
• Je variantou enzymatického sekvenování DNA.
• Syntéza DNA probíhá v jedné reakci
• Ke značení produktů se používaj í čtyřmi různými fluorescenčními značkami označené
• primery
• dideoxyribonukleotidy
Asymetrická PCR pro sekvenování
Reakční směs
Enzym, dNTR ddNTP, pufr
Primer
Pripojení primem
(50-55 jC)
Prodloužení primem
(60-70 jC)
Denaturace
(95-96 i C)
PRODUKTY
Strategie barevných primem
DENATURACE
O c
c
PŘIPOJENÍ SYNTÉZA
PRIMERU      Enzyme, dNTPs,
reaction-specilic ddNTP
i O
G*0
[Gl
PRODUKTY
A C C G T [A]
O A E]
O A C i
A C CG
O O
A C C Gffl A C C G T A[T]
Strategie barevných terminátorů
DENATURACE
PŘIPOJENÍ PRIMERU
SYNTÉZA
Enzyme, dNTPs, dye-labeled terminators
PRODUKTY
* O ♦ O *
AO
co
A A A A
CO
CO
GJO
mm
c
c c
C C G
GO
TO
A C C G T\Ä\0
A C C G T A [Ť]<
Princip detekce produktů
•   Detekce produktů probíhá během elektroforézy pomocí laserového detektoru (laserem indukovaná fluorescence, LIF) napojeného na počítač, který vyhodnocuje sekvenci.
CACCGCATCGAAATTAACTTCCAAAGTTAAGCTTGG
Fragmenty
í        i 1 H i 3 ■ • <■ ■	
	
	
Příprava gelu
Laserový detektor Rezervoár pufru Automatické nanášení vzorku
Soustava kapilár
Genetický analyzátor ABI 3100
Vyhřívaná deska
Příklad výstupu
:    ! - . '        ;   j 1' '-ta-'
. li; ä i; ji
s á Jí 5 tór
I ;! ií-li: S J t:i i
TTOĽAT GCCT Q» 99 CO*C7CT A íťi ä»T(CCC <M ä T JUTU*       T Ol* AT TG OTA A TCAT QQTCA T AQCT QTTTCCT QT QTQA A AT TQTT A T CCäCTC A CA A T TCOA C ACAA.C AT ACG AOC CO 1D 2£ » 40 ■ Éfl íí JO H 1M 110 US
:aaccA acacac-aaaa Aa^aacaar TTaeaiAi ia aacaccAaaar aariTTier tttcaccabtba aAcaaac* aca sciaATTacac-- -ďccaec-aacec-aH-a■■■ a'-a- -ac-ac 'a
2iů ad
jm 11 ti
acaar cc a ca ct q qt t t ac&ccA a CAaac&iiAA a tc ctgtt t q a Ta araaT tccba aat caacA a a at ce ct tataaatcm. aaoaat aacc aa aaat Aaaa ttbaot a t tqt tccaqttti
WŮ tm 2ÍŇ 4w 410 4h 1» 4*4 4m 4*11 4h1 4ůú
acca - ft* a acA c t aa at c s a'- 'ccc        = 2 :     ::»a ni"h baocttw oaaaa/ľ '■accaaca"' cara aca'- a'- *■ '-aa" a aa *aqaa faca'-'- 'aa *acaaac a t a aaa
Hl] ri-íli
USl Mil
ih to- .'id ran
1 dráha na gelu
Sekvenování genomů
V praxi je velice často potřeba stanovit sekvenci fragmentu DNA, který je delší než průměrná délka 500 - 1 000 bází dosahovaná v jedné reakci.
K tomuto účelu sekvenování genomů mohou být zvoleny dvě zcela odlišné strategie:
- náhodné sekvenování
- uspořádané sekvenování sousedních úseků
Příprava knihovny pro náhodné sekvenování genomů
• Při náhodném sekvenování genomu jsou nejdříve připraveny mechanickým stříháním genomové DNA fragmenty
s optimální velikostí (1 300 - 2 000 bp) a po úpravě jejich konců jsou nahodile nakloňovány do vhodného vektoru za vzniku velkého počtu klonů.
• Ke štěpení DNA se využívá sonikace nebo pankreatická DNáza I za přítomnosti Mn2+.
• Předpokládá se, že celková informace o sekvenci obsažená v připravených malých klonech odpovídá původní DNA a sekvence fragmentů jednotlivých klonů se vzájemně překrývají.
• Pomocí univerzálních sekvenačních primem připojujících se k vektoru poblíž klonovacího místa jsou stanoveny sekvence krátkých úseků na koncích klonovaných fragmentů (minimálně 500 bází).
• Stanovené sekvence jsou pak použity k uspořádání klonovaných fragmentů z jednotlivých vektorů do souvislých sekvencí genomové DNA - kontigů.
Vektor
Fragmentace
C D
Úprava konců a klonování
ö°ö,P
B C
O
ÖÖ
Sestavení překrývajících se klonů
AB   C    DE     F G  H I
.........
Uspořádané sekvenování
- Pro doplnění sekvence mezer zbývajících po náhodném sekvenování
- Pro sekvenování malých fragmentů DNA
•   Dva odlišné přístupy:
- procházení primerem
• vyžaduje znalost sekvence, ke které se připojuje primer, který umožní prodloužení řetězce DNA-polymerázou.
• získaná sekvence z první reakce je použita pro návrh primem pro další reakci a tento krok se opakuje, dokud není dosaženo kompletního stanovení sekvence.
• Tento proces nevyžaduje další klonování a minimalizuje stanovení nadbytečných sekvencí, ale správnost stanovené sekvence by měla být ověřena sekvenováním obou řetězců.
- postupné zkracování fragmentu exonukleázou a tvorba sousedících delecí
Metody uspořádaného sekvenování
Procházení primerem
Sousední delece
l
Metody sekvenování nové generace
(next generation sequencing)
Liší se v provedení a chemii
V základu se podobají v sekvenování tisíců až miliónů klonálně amplifikovaných molekul (masivní paralelní sekvenování)
Probíhá vývoj technik
- Více čtení
- Delší čtení
- Rychlejší sekvenování
- Nižší cena
Nové aplikace v klinické oblasti, vývoj kitů cílených na určité části genomů (dědičná onemocnění nádorová onemocnění, metagenomika, 16S rRNA)
Clonal Reaction Amplification Output
Pyrosequencing Roche/454
Sequencing by Ligation Life Tech/SOLiD
H+ Ion Generation Life Tech/Ion Torrent
Reversible Dye Terminators lllumina
ePCR
ePCR
ePCR
Cluster
Luminescence
Fluorescence
pH Change
>
Fluorescence
Signal/Noise Conversion
Sequence
J
Third Generation Sequencing
• Pacific Biosciences
• Helicos Biosciences
• NABsys
• VisiGen Biotechnologies
• Oxford Nanophore Technologies
Vývoj ceny sekvenování na
příkladu HGP
$2.7 Billion
$1.5 Million
Human Genome Project
\
• Inovace
Chemie reakcí Optika Fluidika Hardware Bioinformatika
$100,000
Sanger
Transformační krok Next Gen Seq
* í
$ <10,000
< $5,000
1990
2003
2008
2010
2015
Typy uspořádání NGS sekvenování
Single Read
Paired-end read
Mate-pair read
Metody přípravy knihovny
Library preparation
Emulsion PCR "Polony" PCR on a slide
Pyrosequencing Sequencing by ligation (454) (SOLiD)
Pyrosekvenování
Sekvenování se syntézou DNA v reálném čase nevyžadující elektroforézu ani separaci fragmentů
Je založené na uvolnění pyrofosfátu (PPi) při enzamatické syntéze DNA (Nyren et a ., 1987)
1. krok: Sekvenační primer hybridizuje k jed no řetězcové mu templátu a je inkubován s:
• DNA polymerázou
• ATP sulfurylázou ÍDNAV*nP-"-W™
• Luciferázou
• Apyrázou
• substrátem, adenozin 5'-fosfosulfátem (APS)
• luciferinem
2. krok: První ze 4 dNTP - dATP je přidán k reakci
- Pokud je na matrici komplementární báze, DNA polymeráza katalyzuje připojení nukleotidu k primem
- Pokud na matrici není komplementární báze nukleotid bude degradován apyrázou
- Postupně budou přidány jeden po druhém všechny čtyři dNTP
- Každé připojení nukleotidu je provázeno uvolněním pyrofosfátu (PPi) v množství ekvimolárním množství přidaného nukleotidu
3. krok: ATP sulfuryláza kvantitativně přeměňuje PPi na ATP za přítomnosti APS Sul(i ňlaie
- Vzniklý ATP umožní luciferázou zprostředkovanou konverzi luciferinu
MfltPH AIP
na oxyluciferin, který vytvoří světelný záblesk zaznamenaný detektorem ^J^,
-tirwii
fotonů a zobrazený jako pík na pyrogramu nudaotidainwrporationginaratMiight
sain m a [tak In lha pvmiram
4. krok: Apyráza degraduje nepřipojené dNTP a
nespotřebované ATP dWTP-       -frdHDF + dNMP + ptnpMa
ATP-ApVraSe^ADP + MAP + phaphrtai
- Až je degradace kompletní je přidán další dNTP, který je v pořadí
Proces se znovu opakuje a sekvence je odečítána z pyrogramu
Namísto standardního dATP je používán a-thiosubstituovaný dATP, který je přijímán DNA polymerázou, ale nikoli luciferázou
Metoda je ve vývoji a je používána pro identifikaci jednonukleotidových polymorfizmu (SNPs)
primer       templátová DNA
11111 ■......
je degradován je degradován
"O
+
dTTP -
+
dATP —
+
dGTP  ^chemiluminiscence — +
dCTP  ^chemiluminiscence =
+
dTTP- je degradován
+
dATP   ^chemiluminiscence:
+
i chemiluminiscence
dGTP
+ dCTP
^chemiluminiscence
J chemiluminiscence ^chemiluminiscence
1 1 ! ! '.........
GC
I i......■ ■ 1
I I i i 1......
..i..GCAGG
I 1 ' 1 1 ■ 1.......
T-n-r-rGCAGGCC
N i i i ■ ■......■
dTTP   ^chemiluminiscence = M +
dATp —  je degradován
+
, ■ , , ,GCAGGCCT XI 1 1 1 • ■.......
Princip pyrosekvenování
pyrogram
odečtená nukleotidová sekvence H   B   ■   K   ofl   cc t
T       rt Ů
ta       í      C       Ť       A Ů
přidaný nukleotid
Klonální amplifikace knihovny emulzní
PCR
Příprava jednořetězcové DNA knihovny
- Umožňuje zpracovat různé typy vzorků
• genomové DNA
• produkty PCR
• BACs
• cDNA
- Frakcionace dlouhých úseků na 300- to 800-bp fragmenty
- Vazba dvou adaptorů A a B - specifických pro 3'- a 5'-konce na každý fragment
• Adaptor A obsahuje vazebné místo pro primer
• Adaptor B B obsahuje 5'-biotinovou značku, která slouží k imobilizaci DNA knihovny na mikrosféry (DNA Capture Beads) pokryté streptavidinem
Klonální amplifikace knihovny emulzní
PCR
- Separace kuliček a výběr pouze těch, které obsahují navázaný jediný fragment ssDNA
Klonální amplifikace knihovny v emulzi
- emulzní PCR, amplifikační reagencie ve směsi voda-olej -» mikroreaktory obsahující jedinou kuličku s unikátním fragmentem DNA z knihovny - (107) kopií
Pyrosekvenování
Analýza dat s využitím bioinformatických nástrojů
Sekvenátor FLX firmy Roche
Pyrosekvenování (One Bead = One Read)
Kuličky se z emulze extrahují a jsou umístěny pomocí centrifugace do PicoTiterPIate, čipu z optických vláken o rozměrech 70 x 75 mm
MAS 3 »V 2£ínm«50
Průměr jamek PicoTiterPIate dovoluje umístění pouze jedné kuličky průměru 28 ^ (im
• Na jednom čipu je 1 600 000 jamek
Převrstvení směsí obsahující reagencie pro pyrosekvenování, enzymy jsou rovněž imobilizovány na malých mikrosférách
• Spodní část čipu je v optickém kontaktu s dalšími optickými vlákny napojenými na CCD senzor - zachycení až 10000 emitovaných fotonů na 1 nukleotid
i I I i I I i I i i I i I I i J
a A. JBdC QCCATGCT A A A G T C A*
am
liic:if<!jni
Lighl + axy lucifef in
Sekvenátor FLX fi
Kombinace vysoké intenzity signálu a pozičně specifické informace na mikrodestičce umožňuje současně analyzovat více než 1 milion sekvenačních běhů za 10 hod.
- Délka stanovené sekvence 400 bp
- Stanovení až 400 Mbp de novo
- Resekvenace genomů jakékoli velikosti
Limitující faktory
- Negativní posuny čtecího rámce
• 3'—>5' exonukleázová aktivita DNA polymerázy
• homopolymerní úseky
- Pozitivní posuny čtecího rámce
• Nedostatečná enzymatická aktivita apyrázy
- Přesnost 99,5 % na prvních 250 bp
Sekvenátor FLX firmy Roche
• Paralelní analýza více vzorků
- Adaptory obsahující sekvence MID (Multiplex Identifiers)
• Až 12 různých unikátních sekvencí
• Přidány během přípravy knihovny
• Koamplifikovány s fragmenty DNA
- Rozdělení mikrodestičky do 2, 4, 8 nebo 16 menších oblastí
• Zabránění vzájemné kontaminace vzorků
- Možnost sekvenovat současně až 192 různých vzorků DNA
GS Run Browser _ □
a
0 GS Run Processor data set: D_2012_03_22_16_33_14_JRG91GG374_fullProcessing
GS Run Browser
0 GS Run Processor data set: □_2012_03_22_16_33_14_JRQ91QQ374_fullPro(:essing
Overview
Wells
Signals Reads
Control DNA
Filters
Read Attributes -® Read Length O Base Quality
Well Categories -
® GACT (Library)
O CATG (Control-Type I)
O ATGC (Control-Type II)
Number Of Library Reads
1 200
l ooo
800
eoo
400
200
250        300        350       400 450
Read Length, Region Total
550        600 650
GACT (Library)
Raw Wells Key Pass Wells
Region
1
175 313 15S 132
Total
175 313 158 132
Fl
Ö
Aplikace Místa Systém
GS De novo Assembler
Čt, 24. květen, 15:47 LMDM
B
Project:   Staral [Genomic]
Location: /home/LMDM/Plocria/analyza/5tafal
Ready for analysis
base: read: val:
Project
Overview Contig a
contigOOOOl        20 149
Parameters
Result files
Alignment results
Flowgrams
Bases
contigGOGG2	18 049
contigOOOQ3	14 160
contig00004	11 926
contigOOOQS	8 637
contigOOOOe	7 994
contig00007	6 816
contigQQQQS	6 697
contigOOOOg	4 476
contigOOOlO	3 326
contigOOOll	3 095
contig00012	3 014
contig00013	2 722
contig00014	2 690
contigQQQ15	2 383
contigOOOie	2 329
contigOOOlľ	2 191
contig00018	2 036
contig00019	1 499
contig0002Q	1 352
contig00021	1 166
contig00022	1 050
contigQOQ23	1 016
contig00024	948
	77(1
-1
Cünt i g: contigOOOOl - 20 149 bp.
Base
left
2 032
selected
conti liOOOOI HK6IEBF01BN89B HK5IEBF01ARRSN HK6IEBF01A3MAV HK6IEBF01BHKX2 HK5IEBF01A5THI HK6IEBF01AHUA1 HK5IEBF01A9E9P HK6IEBF01BKM7X HK6IEBF01AV175 HK5IEBF01BJYSL HK6IEBF01BBYUP HK6IEBF01AI6AC HK5IEBF01AW7YC HK6IEBF01B1IE6 HK6IEBF01AYV3H HK5IEBF01BN288 HK6IEBF01BG5IC HK6IEBF01BJFDR HK5IEBFO1B04U2 HK6IEBF01A39J2 HK6IEBF01BSDDB HK5IEBF01BPQRL HK6IEBF01BBCE9 HK5IEBF01B1K98 HK6IEBF01AXRBZ HK6IEBF01ACSI1 HK5IEBF01BWH8V HK6IEBF01AVZR6
right 2 132
TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTC
TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGGGTTTTTTACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGGGTTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACAT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACAT TCTTCTCCTAAAAACCCCTAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT AAAA-CCC-TAA-GTATCAAGG-TTTTT-ACAAACCTCTACATT AAAA-CCC-TAA-GTATCAAGG-TTTTT-ACAAACCTCTACATT
■AGGTAAGT-AACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT
T T T -
-ACAAACCTCTACATT-
AG
AGGTAAGT
AGGTAAGT-AACCGAAAGGTTCTATACTAGAATC AGGTAAGT-AACCGAAAGGTTCTATACTAGAATCTGTA
AGGTAAGT- AACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT AGGTAAGT- AACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT AGGTAAGT-AACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT AGGTAAGT-AACCGAAAGGTTCTATACTAGAATCTGTATAT AGGTAAGT-AACCGAAAGGTTCTATACTAGAATCTGTATATAAACT AGGTAAGT-AACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT AGGTAAGT-AACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT AGGTAAGT-AACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT AGGTAAGT-AACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT AGGTAAGT-AACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT AGGTAAGT-AACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT AGGTAAGT-AACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT CAGGTAAGT-AACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT CAGGTAAGT-AACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT AGGTAAGT-AACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT AGGTAAGT-AACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT AGGTAAGT-AAGCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT AGGTAAGT- AACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT AGGTAAGT-AACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT AGGTAAGT- AAGCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT AGG-AAGTTAACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT AGGTAAGT-AACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT _CTAGAATCTGTATATAAACTATTTGT
CD
□
New
Open
©
Start
(D Info
5Jafal: Opened Assembler project: /home/LMDM/Plocha/analyza/5tafal
: Analysis messages
[GS De novo Assembl... || g| LMDM
[Untitled 1 - QperiQffi... || ™ GS De novo Assembler
Aplikace Mfsta  System  fy) [2
Project:   Stafal [Genomic]
Location: /home/LMDM/Plocha/analyza/Stafal
d}>) j^j Ct, 24. kveten, 15:47 LMDM
GS De novo Assembler
Ready for analysis
Overview    |    Project_Parameters_Result files    |    Alignment results_Flowgrams
Read Name
HK6IEBF01BN89B
I I    [> Next I
Ö
comia.00001 vs. HK6IEBF01BN89B
Number of Bases - Consensus
										
-prjp, ,rj, ,rjti.,		u		ü			u			
Number of Bases - Read (reverse complement)
							
-Wl.rtl.rHl.j				u	ljJj,TPJqJ,[jJ|PJ,pJ,,P,,Lj[lT|T[lJ,TL[l,,[l[l[l,,l		1,,[i[i,,[il[i,,i[ljT[l,i,[ij,
Number of Bases - Difference
T AC CT AC CT AC GT AC CT AC CT AC CT AC CT AC CT AC CT AC GT AC CT AC CT AC CT AC GT AC CT AC CT AC GT AC CT AC CT AC CT AC GT AC CT AC CT AC CT AC CT AC CT AC CT AC GT AC CT AC C 1310C
<D Info        5lafal: Opened Assembler project: /home/LMDM/Plocha/analyza/Stafal
Exit
□
New
Open
®
®
Stop
©
About
©
Help
[GS De novo Assembl... II g| LMDM
[Untitled 1 - OpenOffi... ||     GS De novo Assembler
Ion Torrent polovodičové sekvenování
• prvním sekvenátor DNA, který nepoužívá pro detekci sekvenovaných bází DNA světelný signál, který by byl uvolňovaný při enzymatických reakcích s fluorescenčními nebo chemiluminscenčními substráty.
• Sekvenování Ion Torrent je založené na elektrochemické detekci vodíkových iontů (pH) které jsou uvolněny při replikaci sekvenovaného templátu na speciálním polovodičovém čipu.
Uvolnění vodíku v nepufrujících podmínkách
lonTorrent polovodičové sekvenování
• Na čipu se nachází milióny jednotlivých reakčních cell (reaktorů), ve kterých probíhá sekvenační analýza individuálních kopií DNA na základě kontinuálního střídání reakčních složek (jednotlivých typů nukleotidů) v mikrofluidním systému.
• DNA imobilizovaná na mikrosférách (emulzní PCR)
• Kapacita závisí na typu použitého polovodičového chipu
- 10-65 miliónů
- 100-600 miliónů
- > 1000 miliónů
Ion PGM™ System na
i-' V
			Sequencing Run Time		Output*		Reads
			200-base reads	400-base reads	200-base reads	400-base reads	
Ion 314™ Chip v2	IMP		2.3 hrs	3.7 hrs	30-50 Mb	60-100 Mb	400-550 thousand
Ion 316™| Chipv2			3.0 hrs	4.9 hrs	300-600 Mb	600 Mb -1 Gb	2-3 million
Ion 318™ Chip v2	LV?		4.4 hrs	7.3 hrs	600 Mb -1 Gb	1.2-2 Gb	4-5.5 million
lonTorrent čip
lonTorrent - detekce
Sensing Layer		
	Sensor Plate	
A V
Drain Source Silicon Substrate
To column receiver
Nue Flow
Rothberg J.M. et al Nature doi:10.1038/naturel0242
Přímá detekce iontů vodíku a konverze na elektrický signál zpracovaný čipem
Ion Torrent polovodičové sekvenování
• Technologie Ion Torrentu je otevřená pro sekvenování DNA de-novo i cílené sekvenování vybraných oblastí genomu
• Minimální délka sekvenačního čtení
- V jedno směru: 400bp
- Obousměrné (Paired end)
- Počet vzorků analyzovaných v jednom běhu
- až 96 vzorků - pomocí označení tzv. barkodem
• Doba sekvenační analýzy
- 2 - 3,5 hodiny - podle použitého čipu
SOLiD (Sequencing by Oligonucleotide
Ligation and Detection)
• Nová generace vysoce účinného sekvenování, dostupná od 2008 (Applied Biosystems)
• Založená na kombinaci metod
- MPSS (Massively Parallel Signature Sequencing) [Brenner et al., 2000]
- Multiplex Polony Sequencing [Shendure et al., 2005]
• Sekvenčně specifická ligace oktamerních oligonukleotidových sond označených fluorescenčními barvivy
• Průměrná délka sekvenovaného úseku je 30 až 40 bp
• Přesnost vyšší než 99,95 % na prvních 25 bp
SOUD
Příprava jednoho ze dvou typů knihovny DNA
- Fragmentová knihovna (fragment library)
- Párová knihovna (mate-paired library)
Fragment m/á knihovna
adaptoi PI adaptor P2
sekvencovaná DNA
Párová knihovna adaptoi Pí vnitrní adaptor adaptor P2
sekvencovaná DNA
sekvencovaná DNA
SOUD
• Amplifikace knihovny
• PCR v emulzi
- DNA knihovny
- Primery P1 a P2
- magnetické kuličky o velikosti 1 |jm vázající DNA
- DNA poľymeráza a nukleotidy
SOUD
Amplifikované templáty vázané na kuličkách
- Denaturace templátů vázaných na kuličkách a odseparovaní nepoužitých kuliček
SOUD
Modifikace 3'-konců pro kovalentní vazbu na sklíčko pro sekvenování
Nanesení kuliček
- Sklíčko je rozděleno na pole umožňující oddělení vzorků do jedné, čtyř nebo osmi oblastí.
- Klíčovou výhodou systému je možnost přípravy sklíček s velmi vysokou hustotou kuliček
SOLiD
Sekvenovani prostrednictvim ligace
<
Primer 3'-
3J i i i i i i i i i p5' C-A-rm-n-z-M
_+
C-T-IWHH-Z-Z
+  *77- 3-
_ T G-G-n-n-ri-z-z-z J"
Bead -5'-
Adapter Sequence
Template Sequence
3'-
Bead -5'-
Prirner
+
C-A-rm-n-z-z-z
GT
Adapter Sequence
Template Sequence
UJ
3-
Bead ■-5'-
Cleavage _
Primer y z-i-i
+
C-A-rwHi p5'
Gl
Adapter Sequence
Template Sequence
G-C-n-n-n-z-r-i
3'
3'
Opakuje se několik cyklů (ligace, detekce, štěpení); počet cyklů určuje délku stanovené sekvence
Po několika cyklech (7) je prodloužený produkt odstraněn a templát je resetován s primerem komplementárním k pozici n-1,
- celkem je použito 5 primerů (n, n-1, n-2, n-3 a n-4)
- Každá báze je integrována ve dvou nezávislých ligacích s použitím dvou primerů
1. Navázání přiměni, ligace sondy
" p o ŕ
TI
PRIMER I
iimii
Univerzálni primer in) Jat
Adaptor P1 2. Zachyceni ohrazu
TA
.................... ľ
Templátová sekvence
Excitace Fluorescence
V
III I mill....../
;',.......■.......*................
ta
3. Odštěpení fluorescenční části sondy
HO
AT
11lllllll1111P
.....■■■■■■■■■■■
5. Reset primerů
llí»»iiimi**fn,m*n)^
Univerzální primer ín-11 ' lllllllllllllllll
2. Reset primerů
mi
_■' 1. Roz-hepení
prodloužené sekvence
....................:
6. Opakování kroku 1 až 6 s novým přiměřeni
^bázový posui)
PRIMER 2
Univerzální primer ín-1
.................
CA    CG   TC    AA   TA CC
miniím ■■■■ ■■■■■■■ ■■■■■■■
................................r
T    GT    GC    AG   TT   AT GG
7. Opakování celého cyklu s priinery n - 2, n - 3 a n - 4
ta
4. Opakování kroku 1 až 4
Vazelíny cyklus   1       2       3       4       E       6       7 ... (n cyklů)
SOUD - čtení sekvence
2nd Base
CD
to
CD
co
G A
TG GT AC
Sequencing primer n-4 x x m T
I I I I I I I I  I I
lilii'......
N N N T
N N T
GG TT
NXXNNN I I I I I I .......
[lil
P1 Adapter
CTACGTACAATTATGGTCTTGCGC
3'
SOLiD - Pravidla a dešifrování barevného kódu
Read Position		0		2	3			7	8	9	to	11	12	13	14	15	16	17	IS	19	20	21	22	23		25	26	27	28	25	30	31	32	33	34	
1               Universal seq primer In)																																				
,        Universal seq primer (n-1)		•	•				• i	t			•	•				•	•				•	•				•	«				•	•				
<= ,       Universal seq primer (n-j	>>																																			
																																				
t£  .     Universal seq primer (n-3|				•		*			•	•				•	•				•	•				•	•				•	•				•	•	
6  Universal seq primer (n-4)						-		•	•				•	•				•	•				•	•				•	•			•		•	_	
• Indicates positions of interrogation      Ligation Cycle | 2   3   i   5   B |
• Systém pracuje se 4 základními bázemi - A, C, G, T.
• Základní barvy jsou označeny 0, 1, 2 a 3 (modrá, zelená, žlutá a červená)
• Dvě odlišné dvojice bází, které mají stejnou počáteční bázi, se barví odlišnou barvou: barva (AC) f barva (AG)
• Dvojice bází, které jsou reverzní, se barví stejnou barvou: barva (AC) = barva (CA)
• Dvojice stejných bází se barví stejnou barvou: barva (AA) = barva (CC)
• Dvojice bází, které jsou odlišné, ale mají stejnou druhou bázi, se barví odlišně: barva (AC) ŕ barva (GC)
SOLiD - paralelní analýza více vzorků
• SOLiD využívá šestnáct různých „kódů" (barcoding) pro odlišení vzorků.
- Vázány na 3'-konec sekvence pomocí modifikovaného adaptoru P2
- Podobná teplota Tm
- Nízké procento chyb
- Unikátní v barevném kódu
- Možnost současně analyzovat až 256 vzorků (při využití dvou sekvenačních destiček rozdělených na osm polí).
- Metoda SOLiD poskytuje 9000 Mbp během 5 dnů
Fragment
Mate Pair
Barcode
P1 Tag 1
Barcode
P1_* Tag1
2 separate ligation-based sequencing reactions
O
Internal Adaptor
3 separate ligation-based sequencing reactions
AGGTTCCGATACGGATTACCATGTG — Barcode 1
AGGTTCCGATACGGATGACCATGTG        Barcode 2
Technologie firmy Illumina/Solexa
• Uvedena na trh 2006
• Masivní paralelní sekvenování milionů fragmentů DNA („polony" sequencing)
• Sekvenacování syntézou na čipu (flow cell), které využívá strategii reverzi bil nich terminátorů
• Nevyžaduje klonování ani přípravu knihovny na mikrosférách
• Dosahuje 99,9 % přesnosti
na/Solexa
Příprava knihovny
- Náhodná fragmentace DNA na krátké úseky 200 - 500 bp
- Zatupení konců a vytvoření 1 nt A-přesahu na 3'-konci (T4 DNA polymeráza, Klenow a polynukleotid-kináza T4)
- Navázání adaptorů umožňujících kovalentní vazbu na opticky transparentní povrch pro sekvenování
- Každý fragment je na povrchu uchycen pouze jedním koncem, po přidání enzymů pro amplifikaci dochází k ohnutí fragmentu do „mostu".
- Výsledkem amplifikace jsou dva řetězce, každý s jedním volným a jedním pevným koncem
- Po denaturaci jsou fragmenty narovnány a uspořádány do shluků, ve kterých je dosažena značná hustota, až 1000 kopií fragmentu na |jm2 povrchu
- Na celém povrchu je dosaženo hustoty deseti milionů shluků na cm2
A
i i
42
875868
Bridge amplification: initiation
OH
P7 E5 Grafted flowrell
ill Ii   Ii M   II ll
Template hybridization
Initial extension
D o na h nation
On the surface: complementary oligos
Illumina/Solexa
• Průběh sekvenační reakce
• Přidání primem ve směsi s DNA polymerázou a fluorescenčně značenými dNTP
• Nukleotidy jsou na 3'-konci modifikovány tak, že umožňují reverzibilní ukončení prodlužujícího se řetězce DNA
• Je tak zajištěno, že se řetězec v každém cyklu prodlouží právě o jednu bázi.
• Po zachycení obrazu připojené báze následuje
odblokování 3'-konce
Illumina (Solexa) sequencing
Mate-pair sequencing
Fragment DNA Perform End Repair Biotin Label Size-Select DNA
Circularize DNA Digest Linear DNA
B
Biotin Labelled Fragment
Circularized Fragment
Fragment Circularized DNA
Purify Biotinylated DNA Perform End Repair
A-tail Adapter Ligation
Fragmented Circles
Purified Mate Pair Library Fragments, Bound to Streptavidin Beads
Mate Pair Library Fragments with Cluster and Sequencing Sites Attached
PCR Enrichment Size-Select Library
Mate Pair Library Fragments with Cluster and Sequencing Sites Attached
Illumina/Solexa
Délka čtených úseků:
- HiSeq : 100 ntor 150 nt
- MiSeq : 250 nt
Mnohonásobné pokrytí sekvence (30 x - 100 x) Možnost mnohonásobného sekvenování
- Povrch sklíčka rozdělen do částí
- Vzorky označeny pomocí dvanácti různých oligonukleotidů
- Současně lze analyzovat až 96 různých vzorků.
Produkuje desítky až stovky Gb za 1 běh (2 - 8 dnů) Aplikace
- Resekvenování
- Sekvenování RNA
- Stanovení metylací
Mi
Sekvenování třetí generace
• Analýza jedné molekuly
• Potřeba malého množství vzorku
• Bez rizika kontaminace
• Analýza jakékoli NK (DNA/RNA)
• Analýza poškozených NK (archaické, muzejní, forenzní)
• Analýza DNA z nekultivovatelných organismů
• Absolutní kvantifikace
Sekvenování třetí generace - Helicos
Sekvenování třetí generace - PacBio RS
Pacific Biosciences
Single molecule real-time sequencing
4 nucleotides with different fluorescent dye simultaneous present
2-3 nucleotides/sec
2-3 Kb (up to 50) read length
6 TB data in 30 minutes
laser damages polymerase
Emission Illumination
400
8 3j 300 £ £200 ü c 100
C T   C   G    A   TO    AAG T  A  C A
.A
tnJLkí
104 5      105 0     105 5     106 0     106 5     107 0     107 5     106 0     108 5
Time (s)