Sekvenování DNA • stanovení pořadí nukleotidů v molekule DNA (primární struktury) Sekvencovänl / Sekvenoväni ■ ■ Sequencing / die Sequenzierung / Klasické techniky sekvenování • 2 metody: - Chemická (Maxamova-Gilbertova) • Již se nepoužívá - Enzymová (Sangerova) • V současnosti se používá automatická varianta - společný rys obou metod: příprava a separace fragmentů DNA, jejichž velikost se liší o 1 nukleotid • Metody sekvenování nové generace (NGS) • Metody sekvenování třetí generace (z jedné molekuly) Základní požadavky pro úspěšné stanovení sekvence klasickou technikou: Příprava knihovny pro sekvenování - DNA s přesně definovanými konci • s místem pro vazbu primem • s koncovou značkou Příprava souboru všech fragmentů ssDNA lišících se svou délkou o jeden nukleotid Přesné rozdělení těchto fragmentů na základě jejich délky a detekce koncové báze Chemická metoda (Maxam-Gilbert) Sekvence je odvozena z molekuly DNA, která se chemicky degraduje v místech, kde se vyskytuje báze určitého typu na fragmenty. Ty se následně oddělují elektroforézou. Enzymatická metoda (Sanger) 1. Příprava ssDNA jejíž sekvence má být stanovena 2. Rozdělení do 4 vzorků 3. Reakce s DNA polymerázou při níž se začlení do syntetizované DNA místo normálního deoxyribonukleosidtrifosfátu jeho analog, který působí jako koncový inhibitor syntézy DNA - dideoxvnukleosidtrifosfát (ddNTP). V každém ze 4 vzorků vzniknou fragmenty, které jsou zakončeny příslušným ddNTP (ddCTP, ddGTP, ddATP a ddTTP). Reakce obsahuje: •molekulu DNA •značený primer při pojující se k části molekuly DNA (místo odkud začínáme stanovovat sekvenci) •směs obsahující 4 normální nukleotidy •jeden ddNTP (v každém ze 4 vzorků je jiný) •DNA polymerázu 4. Denaturace produktů 5. Elektroforetická separace umožňující oddělení fragmentů lišících se délkou o jednu bázi 6. Detekce fragmentů, které nesou označený konec Dideoxynukleotidy nemají hydroxy 1 na 3'-konci Ribose Deoxyribose Dideoxyribose HO-CH2 HO-CH2 HO-CH2 23.4 DEOXYNUCLEOSIDE TRIPHOSPHATE 23.7 dideoxyribose blocks elongation Pokudje dideoxynukleotid inkorporován do syntetizujícího se řetězce, působí jako terminátor reakce HO H Nucleotide will join on here at 3' position Replikace DNA s normálními deoxynukleotidy Původní sekvence AGCCTGG CGACCATCGT TCGGACCGCTGGTAGCA Denaturovaný templátový řetězec 3' AGCCTGG CGACCATCGT 5' Prfektní kopie AGCCTGGCGACCATCGT TCGGACCGCTGGTAGCA Co se stane pokud při reakci použijete směs dGTP a ddGTP? AGCCTGG CGACCATCGT TCGGACCGCTGGTAGCA AGCCTGGCGACCATCGT A T C G T T A G C A T CG T C GG TCGGACCG TCGGACCGCTG TCGGACCGCTGG TCGGACCGCTGGTAG Fluorescence Signal/Noise Conversion Sequence J Third Generation Sequencing • Pacific Biosciences • Helicos Biosciences • NABsys • VisiGen Biotechnologies • Oxford Nanophore Technologies Vývoj ceny sekvenování na příkladu HGP $2.7 Billion $1.5 Million Human Genome Project \ • Inovace Chemie reakcí Optika Fluidika Hardware Bioinformatika $100,000 Sanger Transformační krok Next Gen Seq * í $ <10,000 < $5,000 1990 2003 2008 2010 2015 Typy uspořádání NGS sekvenování Single Read Paired-end read Mate-pair read Metody přípravy knihovny Library preparation Emulsion PCR "Polony" PCR on a slide Pyrosequencing Sequencing by ligation (454) (SOLiD) Pyrosekvenování Sekvenování se syntézou DNA v reálném čase nevyžadující elektroforézu ani separaci fragmentů Je založené na uvolnění pyrofosfátu (PPi) při enzamatické syntéze DNA (Nyren et a ., 1987) 1. krok: Sekvenační primer hybridizuje k jed no řetězcové mu templátu a je inkubován s: • DNA polymerázou • ATP sulfurylázou ÍDNAV*nP-"-W™ • Luciferázou • Apyrázou • substrátem, adenozin 5'-fosfosulfátem (APS) • luciferinem 2. krok: První ze 4 dNTP - dATP je přidán k reakci - Pokud je na matrici komplementární báze, DNA polymeráza katalyzuje připojení nukleotidu k primem - Pokud na matrici není komplementární báze nukleotid bude degradován apyrázou - Postupně budou přidány jeden po druhém všechny čtyři dNTP - Každé připojení nukleotidu je provázeno uvolněním pyrofosfátu (PPi) v množství ekvimolárním množství přidaného nukleotidu 3. krok: ATP sulfuryláza kvantitativně přeměňuje PPi na ATP za přítomnosti APS Sul(i ňlaie - Vzniklý ATP umožní luciferázou zprostředkovanou konverzi luciferinu MfltPH AIP na oxyluciferin, který vytvoří světelný záblesk zaznamenaný detektorem ^J^, -tirwii fotonů a zobrazený jako pík na pyrogramu nudaotidainwrporationginaratMiight sain m a [tak In lha pvmiram 4. krok: Apyráza degraduje nepřipojené dNTP a nespotřebované ATP dWTP- -frdHDF + dNMP + ptnpMa ATP-ApVraSe^ADP + MAP + phaphrtai - Až je degradace kompletní je přidán další dNTP, který je v pořadí Proces se znovu opakuje a sekvence je odečítána z pyrogramu Namísto standardního dATP je používán a-thiosubstituovaný dATP, který je přijímán DNA polymerázou, ale nikoli luciferázou Metoda je ve vývoji a je používána pro identifikaci jednonukleotidových polymorfizmu (SNPs) primer templátová DNA 11111 ■...... je degradován je degradován "O + dTTP - + dATP — + dGTP ^chemiluminiscence — + dCTP ^chemiluminiscence = + dTTP- je degradován + dATP ^chemiluminiscence: + i chemiluminiscence dGTP + dCTP ^chemiluminiscence J chemiluminiscence ^chemiluminiscence 1 1 ! ! '......... GC I i......■ ■ 1 I I i i 1...... ..i..GCAGG I 1 ' 1 1 ■ 1....... T-n-r-rGCAGGCC N i i i ■ ■......■ dTTP ^chemiluminiscence = M + dATp — je degradován + , ■ , , ,GCAGGCCT XI 1 1 1 • ■....... Princip pyrosekvenování pyrogram odečtená nukleotidová sekvence H B ■ K ofl cc t T rt Ů ta í C Ť A Ů přidaný nukleotid Klonální amplifikace knihovny emulzní PCR Příprava jednořetězcové DNA knihovny - Umožňuje zpracovat různé typy vzorků • genomové DNA • produkty PCR • BACs • cDNA - Frakcionace dlouhých úseků na 300- to 800-bp fragmenty - Vazba dvou adaptorů A a B - specifických pro 3'- a 5'-konce na každý fragment • Adaptor A obsahuje vazebné místo pro primer • Adaptor B B obsahuje 5'-biotinovou značku, která slouží k imobilizaci DNA knihovny na mikrosféry (DNA Capture Beads) pokryté streptavidinem Klonální amplifikace knihovny emulzní PCR - Separace kuliček a výběr pouze těch, které obsahují navázaný jediný fragment ssDNA Klonální amplifikace knihovny v emulzi - emulzní PCR, amplifikační reagencie ve směsi voda-olej -» mikroreaktory obsahující jedinou kuličku s unikátním fragmentem DNA z knihovny - (107) kopií Pyrosekvenování Analýza dat s využitím bioinformatických nástrojů Sekvenátor FLX firmy Roche Pyrosekvenování (One Bead = One Read) Kuličky se z emulze extrahují a jsou umístěny pomocí centrifugace do PicoTiterPIate, čipu z optických vláken o rozměrech 70 x 75 mm MAS 3 »V 2£ínm«50 Průměr jamek PicoTiterPIate dovoluje umístění pouze jedné kuličky průměru 28 ^ (im • Na jednom čipu je 1 600 000 jamek Převrstvení směsí obsahující reagencie pro pyrosekvenování, enzymy jsou rovněž imobilizovány na malých mikrosférách • Spodní část čipu je v optickém kontaktu s dalšími optickými vlákny napojenými na CCD senzor - zachycení až 10000 emitovaných fotonů na 1 nukleotid i I I i I I i I i i I i I I i J a A. JBdC QCCATGCT A A A G T C A* am liic:if5' exonukleázová aktivita DNA polymerázy • homopolymerní úseky - Pozitivní posuny čtecího rámce • Nedostatečná enzymatická aktivita apyrázy - Přesnost 99,5 % na prvních 250 bp Sekvenátor FLX firmy Roche • Paralelní analýza více vzorků - Adaptory obsahující sekvence MID (Multiplex Identifiers) • Až 12 různých unikátních sekvencí • Přidány během přípravy knihovny • Koamplifikovány s fragmenty DNA - Rozdělení mikrodestičky do 2, 4, 8 nebo 16 menších oblastí • Zabránění vzájemné kontaminace vzorků - Možnost sekvenovat současně až 192 různých vzorků DNA GS Run Browser _ □ a 0 GS Run Processor data set: D_2012_03_22_16_33_14_JRG91GG374_fullProcessing GS Run Browser 0 GS Run Processor data set: □_2012_03_22_16_33_14_JRQ91QQ374_fullPro(:essing Overview Wells Signals Reads Control DNA Filters Read Attributes -® Read Length O Base Quality Well Categories - ® GACT (Library) O CATG (Control-Type I) O ATGC (Control-Type II) Number Of Library Reads 1 200 l ooo 800 eoo 400 200 250 300 350 400 450 Read Length, Region Total 550 600 650 GACT (Library) Raw Wells Key Pass Wells Region 1 175 313 15S 132 Total 175 313 158 132 Fl Ö Aplikace Místa Systém GS De novo Assembler Čt, 24. květen, 15:47 LMDM B Project: Staral [Genomic] Location: /home/LMDM/Plocria/analyza/5tafal Ready for analysis base: read: val: Project Overview Contig a contigOOOOl 20 149 Parameters Result files Alignment results Flowgrams Bases contigGOGG2 18 049 contigOOOQ3 14 160 contig00004 11 926 contigOOOQS 8 637 contigOOOOe 7 994 contig00007 6 816 contigQQQQS 6 697 contigOOOOg 4 476 contigOOOlO 3 326 contigOOOll 3 095 contig00012 3 014 contig00013 2 722 contig00014 2 690 contigQQQ15 2 383 contigOOOie 2 329 contigOOOlľ 2 191 contig00018 2 036 contig00019 1 499 contig0002Q 1 352 contig00021 1 166 contig00022 1 050 contigQOQ23 1 016 contig00024 948 77(1 -1 Cünt i g: contigOOOOl - 20 149 bp. Base left 2 032 selected conti liOOOOI HK6IEBF01BN89B HK5IEBF01ARRSN HK6IEBF01A3MAV HK6IEBF01BHKX2 HK5IEBF01A5THI HK6IEBF01AHUA1 HK5IEBF01A9E9P HK6IEBF01BKM7X HK6IEBF01AV175 HK5IEBF01BJYSL HK6IEBF01BBYUP HK6IEBF01AI6AC HK5IEBF01AW7YC HK6IEBF01B1IE6 HK6IEBF01AYV3H HK5IEBF01BN288 HK6IEBF01BG5IC HK6IEBF01BJFDR HK5IEBFO1B04U2 HK6IEBF01A39J2 HK6IEBF01BSDDB HK5IEBF01BPQRL HK6IEBF01BBCE9 HK5IEBF01B1K98 HK6IEBF01AXRBZ HK6IEBF01ACSI1 HK5IEBF01BWH8V HK6IEBF01AVZR6 right 2 132 TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTC TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGGGTTTTTTACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGGGTTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACAT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACAT TCTTCTCCTAAAAACCCCTAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT TCTTCTCCTAAAAACCC-TAAAGTATCAAGG-TTTTT-ACAAACCTCTACATT AAAA-CCC-TAA-GTATCAAGG-TTTTT-ACAAACCTCTACATT AAAA-CCC-TAA-GTATCAAGG-TTTTT-ACAAACCTCTACATT ■AGGTAAGT-AACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT T T T - -ACAAACCTCTACATT- AG AGGTAAGT AGGTAAGT-AACCGAAAGGTTCTATACTAGAATC AGGTAAGT-AACCGAAAGGTTCTATACTAGAATCTGTA AGGTAAGT- AACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT AGGTAAGT- AACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT AGGTAAGT-AACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT AGGTAAGT-AACCGAAAGGTTCTATACTAGAATCTGTATAT AGGTAAGT-AACCGAAAGGTTCTATACTAGAATCTGTATATAAACT AGGTAAGT-AACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT AGGTAAGT-AACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT AGGTAAGT-AACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT AGGTAAGT-AACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT AGGTAAGT-AACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT AGGTAAGT-AACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT AGGTAAGT-AACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT CAGGTAAGT-AACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT CAGGTAAGT-AACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT AGGTAAGT-AACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT AGGTAAGT-AACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT AGGTAAGT-AAGCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT AGGTAAGT- AACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT AGGTAAGT-AACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT AGGTAAGT- AAGCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT AGG-AAGTTAACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT AGGTAAGT-AACCGAAAGGTTCTATACTAGAATCTGTATATAAACTATTTGT _CTAGAATCTGTATATAAACTATTTGT CD □ New Open © Start (D Info 5Jafal: Opened Assembler project: /home/LMDM/Plocha/analyza/5tafal : Analysis messages [GS De novo Assembl... || g| LMDM [Untitled 1 - QperiQffi... || ™ GS De novo Assembler Aplikace Mfsta System fy) [2 Project: Stafal [Genomic] Location: /home/LMDM/Plocha/analyza/Stafal d}>) j^j Ct, 24. kveten, 15:47 LMDM GS De novo Assembler Ready for analysis Overview | Project_Parameters_Result files | Alignment results_Flowgrams Read Name HK6IEBF01BN89B I I [> Next I Ö comia.00001 vs. HK6IEBF01BN89B Number of Bases - Consensus -prjp, ,rj, ,rjti., u ü u Number of Bases - Read (reverse complement) -Wl.rtl.rHl.j u ljJj,TPJqJ,[jJ|PJ,pJ,,P,,Lj[lT|T[lJ,TL[l,,[l[l[l,,l 1,,[i[i,,[il[i,,i[ljT[l,i,[ij, Number of Bases - Difference T AC CT AC CT AC GT AC CT AC CT AC CT AC CT AC CT AC CT AC GT AC CT AC CT AC CT AC GT AC CT AC CT AC GT AC CT AC CT AC CT AC GT AC CT AC CT AC CT AC CT AC CT AC CT AC GT AC CT AC C 1310C 1000 miliónů Ion PGM™ System na i-' V Sequencing Run Time Output* Reads 200-base reads 400-base reads 200-base reads 400-base reads Ion 314™ Chip v2 IMP 2.3 hrs 3.7 hrs 30-50 Mb 60-100 Mb 400-550 thousand Ion 316™| Chipv2 3.0 hrs 4.9 hrs 300-600 Mb 600 Mb -1 Gb 2-3 million Ion 318™ Chip v2 LV? 4.4 hrs 7.3 hrs 600 Mb -1 Gb 1.2-2 Gb 4-5.5 million lonTorrent čip lonTorrent - detekce Sensing Layer Sensor Plate A V Drain Source Silicon Substrate To column receiver Nue Flow Rothberg J.M. et al Nature doi:10.1038/naturel0242 Přímá detekce iontů vodíku a konverze na elektrický signál zpracovaný čipem Ion Torrent polovodičové sekvenování • Technologie Ion Torrentu je otevřená pro sekvenování DNA de-novo i cílené sekvenování vybraných oblastí genomu • Minimální délka sekvenačního čtení - V jedno směru: 400bp - Obousměrné (Paired end) - Počet vzorků analyzovaných v jednom běhu - až 96 vzorků - pomocí označení tzv. barkodem • Doba sekvenační analýzy - 2 - 3,5 hodiny - podle použitého čipu SOLiD (Sequencing by Oligonucleotide Ligation and Detection) • Nová generace vysoce účinného sekvenování, dostupná od 2008 (Applied Biosystems) • Založená na kombinaci metod - MPSS (Massively Parallel Signature Sequencing) [Brenner et al., 2000] - Multiplex Polony Sequencing [Shendure et al., 2005] • Sekvenčně specifická ligace oktamerních oligonukleotidových sond označených fluorescenčními barvivy • Průměrná délka sekvenovaného úseku je 30 až 40 bp • Přesnost vyšší než 99,95 % na prvních 25 bp SOUD Příprava jednoho ze dvou typů knihovny DNA - Fragmentová knihovna (fragment library) - Párová knihovna (mate-paired library) Fragment m/á knihovna adaptoi PI adaptor P2 sekvencovaná DNA Párová knihovna adaptoi Pí vnitrní adaptor adaptor P2 sekvencovaná DNA sekvencovaná DNA SOUD • Amplifikace knihovny • PCR v emulzi - DNA knihovny - Primery P1 a P2 - magnetické kuličky o velikosti 1 |jm vázající DNA - DNA poľymeráza a nukleotidy SOUD Amplifikované templáty vázané na kuličkách - Denaturace templátů vázaných na kuličkách a odseparovaní nepoužitých kuliček SOUD Modifikace 3'-konců pro kovalentní vazbu na sklíčko pro sekvenování Nanesení kuliček - Sklíčko je rozděleno na pole umožňující oddělení vzorků do jedné, čtyř nebo osmi oblastí. - Klíčovou výhodou systému je možnost přípravy sklíček s velmi vysokou hustotou kuliček SOLiD Sekvenovani prostrednictvim ligace < Primer 3'- 3J i i i i i i i i i p5' C-A-rm-n-z-M _+ C-T-IWHH-Z-Z + *77- 3- _ T G-G-n-n-ri-z-z-z J" Bead -5'- Adapter Sequence Template Sequence 3'- Bead -5'- Prirner + C-A-rm-n-z-z-z GT Adapter Sequence Template Sequence UJ 3- Bead ■-5'- Cleavage _ Primer y z-i-i + C-A-rwHi p5' Gl Adapter Sequence Template Sequence G-C-n-n-n-z-r-i 3' 3' Opakuje se několik cyklů (ligace, detekce, štěpení); počet cyklů určuje délku stanovené sekvence Po několika cyklech (7) je prodloužený produkt odstraněn a templát je resetován s primerem komplementárním k pozici n-1, - celkem je použito 5 primerů (n, n-1, n-2, n-3 a n-4) - Každá báze je integrována ve dvou nezávislých ligacích s použitím dvou primerů 1. Navázání přiměni, ligace sondy " p o ŕ TI PRIMER I iimii Univerzálni primer in) Jat Adaptor P1 2. Zachyceni ohrazu TA .................... ľ Templátová sekvence Excitace Fluorescence V III I mill....../ ;',.......■.......*................ ta 3. Odštěpení fluorescenční části sondy HO AT 11lllllll1111P .....■■■■■■■■■■■ 5. Reset primerů llí»»iiimi**fn,m*n)^ Univerzální primer ín-11 ' lllllllllllllllll 2. Reset primerů mi _■' 1. Roz-hepení prodloužené sekvence ....................: 6. Opakování kroku 1 až 6 s novým přiměřeni ^bázový posui) PRIMER 2 Univerzální primer ín-1 ................. CA CG TC AA TA CC miniím ■■■■ ■■■■■■■ ■■■■■■■ ................................r T GT GC AG TT AT GG 7. Opakování celého cyklu s priinery n - 2, n - 3 a n - 4 ta 4. Opakování kroku 1 až 4 Vazelíny cyklus 1 2 3 4 E 6 7 ... (n cyklů) SOUD - čtení sekvence 2nd Base CD to CD co G A TG GT AC Sequencing primer n-4 x x m T I I I I I I I I I I lilii'...... N N N T N N T GG TT NXXNNN I I I I I I ....... [lil P1 Adapter CTACGTACAATTATGGTCTTGCGC 3' SOLiD - Pravidla a dešifrování barevného kódu Read Position 0 2 3 7 8 9 to 11 12 13 14 15 16 17 IS 19 20 21 22 23 25 26 27 28 25 30 31 32 33 34 1 Universal seq primer In) , Universal seq primer (n-1) • • • i t • • • • • • • « • • <= , Universal seq primer (n-j >> t£ . Universal seq primer (n-3| • * • • • • • • • • • • • • 6 Universal seq primer (n-4) - • • • • • • • • • • • • _ • Indicates positions of interrogation Ligation Cycle | 2 3 i 5 B | • Systém pracuje se 4 základními bázemi - A, C, G, T. • Základní barvy jsou označeny 0, 1, 2 a 3 (modrá, zelená, žlutá a červená) • Dvě odlišné dvojice bází, které mají stejnou počáteční bázi, se barví odlišnou barvou: barva (AC) f barva (AG) • Dvojice bází, které jsou reverzní, se barví stejnou barvou: barva (AC) = barva (CA) • Dvojice stejných bází se barví stejnou barvou: barva (AA) = barva (CC) • Dvojice bází, které jsou odlišné, ale mají stejnou druhou bázi, se barví odlišně: barva (AC) ŕ barva (GC) SOLiD - paralelní analýza více vzorků • SOLiD využívá šestnáct různých „kódů" (barcoding) pro odlišení vzorků. - Vázány na 3'-konec sekvence pomocí modifikovaného adaptoru P2 - Podobná teplota Tm - Nízké procento chyb - Unikátní v barevném kódu - Možnost současně analyzovat až 256 vzorků (při využití dvou sekvenačních destiček rozdělených na osm polí). - Metoda SOLiD poskytuje 9000 Mbp během 5 dnů Fragment Mate Pair Barcode P1 Tag 1 Barcode P1_* Tag1 2 separate ligation-based sequencing reactions O Internal Adaptor 3 separate ligation-based sequencing reactions AGGTTCCGATACGGATTACCATGTG — Barcode 1 AGGTTCCGATACGGATGACCATGTG Barcode 2 Technologie firmy Illumina/Solexa • Uvedena na trh 2006 • Masivní paralelní sekvenování milionů fragmentů DNA („polony" sequencing) • Sekvenacování syntézou na čipu (flow cell), které využívá strategii reverzi bil nich terminátorů • Nevyžaduje klonování ani přípravu knihovny na mikrosférách • Dosahuje 99,9 % přesnosti na/Solexa Příprava knihovny - Náhodná fragmentace DNA na krátké úseky 200 - 500 bp - Zatupení konců a vytvoření 1 nt A-přesahu na 3'-konci (T4 DNA polymeráza, Klenow a polynukleotid-kináza T4) - Navázání adaptorů umožňujících kovalentní vazbu na opticky transparentní povrch pro sekvenování - Každý fragment je na povrchu uchycen pouze jedním koncem, po přidání enzymů pro amplifikaci dochází k ohnutí fragmentu do „mostu". - Výsledkem amplifikace jsou dva řetězce, každý s jedním volným a jedním pevným koncem - Po denaturaci jsou fragmenty narovnány a uspořádány do shluků, ve kterých je dosažena značná hustota, až 1000 kopií fragmentu na |jm2 povrchu - Na celém povrchu je dosaženo hustoty deseti milionů shluků na cm2 A i i 42 875868 Bridge amplification: initiation OH P7 E5 Grafted flowrell ill Ii Ii M II ll Template hybridization Initial extension D o na h nation On the surface: complementary oligos Illumina/Solexa • Průběh sekvenační reakce • Přidání primem ve směsi s DNA polymerázou a fluorescenčně značenými dNTP • Nukleotidy jsou na 3'-konci modifikovány tak, že umožňují reverzibilní ukončení prodlužujícího se řetězce DNA • Je tak zajištěno, že se řetězec v každém cyklu prodlouží právě o jednu bázi. • Po zachycení obrazu připojené báze následuje odblokování 3'-konce Illumina (Solexa) sequencing Mate-pair sequencing Fragment DNA Perform End Repair Biotin Label Size-Select DNA Circularize DNA Digest Linear DNA B Biotin Labelled Fragment Circularized Fragment Fragment Circularized DNA Purify Biotinylated DNA Perform End Repair A-tail Adapter Ligation Fragmented Circles Purified Mate Pair Library Fragments, Bound to Streptavidin Beads Mate Pair Library Fragments with Cluster and Sequencing Sites Attached PCR Enrichment Size-Select Library Mate Pair Library Fragments with Cluster and Sequencing Sites Attached Illumina/Solexa Délka čtených úseků: - HiSeq : 100 ntor 150 nt - MiSeq : 250 nt Mnohonásobné pokrytí sekvence (30 x - 100 x) Možnost mnohonásobného sekvenování - Povrch sklíčka rozdělen do částí - Vzorky označeny pomocí dvanácti různých oligonukleotidů - Současně lze analyzovat až 96 různých vzorků. Produkuje desítky až stovky Gb za 1 běh (2 - 8 dnů) Aplikace - Resekvenování - Sekvenování RNA - Stanovení metylací Mi Sekvenování třetí generace • Analýza jedné molekuly • Potřeba malého množství vzorku • Bez rizika kontaminace • Analýza jakékoli NK (DNA/RNA) • Analýza poškozených NK (archaické, muzejní, forenzní) • Analýza DNA z nekultivovatelných organismů • Absolutní kvantifikace Sekvenování třetí generace - Helicos Sekvenování třetí generace - PacBio RS Pacific Biosciences Single molecule real-time sequencing 4 nucleotides with different fluorescent dye simultaneous present 2-3 nucleotides/sec 2-3 Kb (up to 50) read length 6 TB data in 30 minutes laser damages polymerase Emission Illumination 400 8 3j 300 £ £200 ü c 100 C T C G A TO AAG T A C A .A tnJLkí 104 5 105 0 105 5 106 0 106 5 107 0 107 5 106 0 108 5 Time (s)