Daniel Renčiuk BFU AV ČR, v.v.i. Sekvenování VFU, Brno 11.10.2018 1 Daniel Renčiuk BFU AV ČR, v.v.i. Sekvenování VFU, Brno 11.10.2018 2 Stanovení sekvence nukleotidů v molekule = Stanovení primární struktury DNA / RNA • de novo sekvenace celých genomů – whole genome sequencing • analýza polymorfizmů (SNP, …) a mutací - targeted resequencing • identifikace organizmů – genome sequencing + resequencing • identifikace cílových motivů proteinů vážících se na DNA – sekvenace výsledků chromatinové imunoprecipitace – ChIP seq • analýza transkriptomu – kvantifikace RNA – RNA seq • identifikace metylace DNA (cytosinů) – Bisulfite sequencing Proč sekvenovat? 3 Obecný postup 4 Příprava materiálu Sekvenace Zpracování dat Experiment • De novo seq • ChIP seq • … Platforma • Illumina • PacBio • … Příprava knihovny • Klonování genomu do BAC vektorů • … Příprava fragmentů • Náhodné seq • Uspořádané seq • Izolace DNA/RNA • … Signál - sekvence • Kontrola kvality • Base call • Assembly • Alignment • … Vizualizace… • Hledání genů • Hledání variant • Analýza exprese • Metagenomika • Vazebná místa Klasické techniky • Chemická sekvenace – dle Maxam a Gilbert • Enzymatická sekvenace – Sanger / dideoxy • Nyní automatizovaná – kapilární sekvenátory Next-generation sequencing (NGS) • 454 sekvenování / pyrosekvenování – Roche • Ion Torrent – now ThermoFisher • SOLiD – Sequencing by Oligonucleotide Ligation and Detection – ABI / Life Technologies / ThermoFisher • Illumina (Solexa) • … Sekvenování třetí generace (3rd generation sequencing) • Helicos • PacBio – metoda SMRT- Single-Molecule Real-Time sequencing – Pacific Biosciences • NanoPore – proteinové nanopóry (α-hemolysin, …) – Oxford Nanopore • … Sekvenační techniky – dle generace 5 Klasické techniky • Chemická sekvenace – dle Maxam a Gilbert • Enzymatická sekvenace – Sanger / dideoxy • Nyní automatizovaná – kapilární sekvenátory Next-generation sequencing (NGS) • 454 sekvenování / pyrosekvenování – Roche • Ion Torrent – now ThermoFisher • SOLiD – Sequencing by Oligonucleotide Ligation and Detection – ABI / Life Technologies / ThermoFisher • Illumina (Solexa) • … Sekvenování třetí generace (3rd generation sequencing) • Helicos • PacBio – metoda SMRT- Single-Molecule Real-Time sequencing – Pacific Biosciences • NanoPore – proteinové nanopóry (α-hemolysin, …) – Oxford Nanopore • … Sekvenační techniky – dle generace 6 Klasické techniky • Vstupem každé jednotlivé sekvenace je velké množství molekul NK pro přípravu jednořetězcového templátu jenž je sekvenován • Každý fragment je sekvenován a detekován individuálně jako samostatná reakce Next-generation sequencing (NGS) • Vstupem každé jednotlivé sekvenační reakce je jediná molekula NK, která je amplifikována na velké množství jednořetězcových templátů, jež jsou následně sekvenovány • Sekvenuje se paralelně velké množství menších fragmentů NK (krátká čtení), jež se násobně překrývají Sekvenování třetí generace (3rd generation sequencing) • Vstupem každé jednotlivé sekvenační reakce je jediná molekula NK, jež je přímo sekvenována bez amplifikace • Sekvenuje se paralelně více velmi dlouhých fragmentů (dlouhá čtení) Sekvenační techniky – dle generace 7 Sekvenační techniky – dle principu 8 Sekvenace štěpením – dlouhá NK je specificky štěpená v místech jednotlivých bazí • Maxam a Gilbert Sekvenace syntézou – detekována je inkorporace specifických bazí při / po polymerační reakci • Sangerovo sekvenování • Pyrosekvenování • Illumina Sekvenace ligací • SOLiD Sekvenace elektrochemickou detekcí – jednotlivé báze NK při průchodu membránovým pórem poskytují elektrickou odezvu • NanoPore Náhodné sekvenování (shotgun sequencing) 9 {Gavin Sherlock, Stanford.edu} • Při náhodném sekvenování genomu jsou nejdříve připraveny mechanickým stříháním genomové DNA fragmenty s optimální velikostí (1 300 – 2 000 bp) a po úpravě jejich konců jsou nahodile naklonovány do vhodného vektoru za vzniku velkého počtu klonů. • Ke štěpení DNA se využívá sonikace nebo pankreatická DNáza I za přítomnosti Mn2+ Uspořádané sekvenování 10 Procházení primerem - „primer walking“ • vyžaduje znalost sekvence, ke které se připojuje primer, který umožní prodloužení řetězce DNA- polymerázou. • získaná sekvence z první reakce je použita pro návrh primeru pro další reakci a tento krok se opakuje, dokud není dosaženo kompletního stanovení sekvence. 1. kolo 2. kolo 3. kolo Uspořádání sekvenačního experimentu 11 Single read Paired-end read Mate-pair read Mate-pair library 12 • Problém sekvenování repetitivních oblastí pomocí platforem produkujících krátká čtení • Mate-pair knihovny – delší oblast je reprezentována jediným fragmentem, který obsahuje ligované konce této oblasti. • Informace o vzájemné pozici vzdálenějších oblastí, čitelná i pomocí krátkých čtení. Next-Generation + 3rd gen. sekvenování Čtení (read) • Sekvenace jednoho fyzického fragmentu nukleové kyseliny Délka čtení (read length) • Obvyklá délka osekvenovaného fragmentu v rámci jedné „reakce“ Pokrytí / hloubka sekvenování (coverage / sequencing depth) • Počet osekvenování jednoho nukleotidu/oblasti • Průměrná hloubka = množství osekvenovaných dat (Gb) / velikost sekvenovaného genomu Přesnost • Přesnost osekvenování – v případě jediného fyzického fragmentu může být, dle použité metody i nižší (<90%) • Díky vyššímu pokrytí je výsledná přesnost vysoká Čtení (read) Pokrytí – 14x Délka čtení (read length) Next-Generation + 3rd gen. sekvenování Next-Generation + 3rd gen. sekvenování • Pro různé typy experimentů vhodné různé délky čtení x pokrytí, tedy různé platformy • De novo sekvenování – lepší delší čtení s dostatečným pokrytím pro stanovenou přesnost • ChIP / RNA seq – pro dostatečnou „statistiku“ nutné vysoké počty čtení jednotlivých oblastí („jakoby pokrytí“), ale nejsou nutná dlouhá čtení Sekvenování dle Maxam a Gilbert 1. Příprava jednořetězcové NK (DNA) 2. Terminální značení (5‘ konec - T4 PNK, 3‘ konec – TdT, fluorescenční primer) 3. Rozdělení na 4 reakce 4. Specifická chemická modifikace bazí 5. Štěpení NK alkalickou hydrolýzou (1M piperidin; 90°C; 30 min) 6. Elektroforéza (denaturační PAGE, kapilární při fluorescenčním značení) 7. Vizualizace (autoradiografie, fluorescence) Maxam AM, Gilbert W. A new method for sequencing DNA. Proc Natl Acad Sci U S A. 1977;74(2):560-4. G Dimetyl sulfát A+G k. mravenčí T+C Hydrazin voda C Hydrazin 5M NaCl Sekvenování dle Maxam a Gilbert *-GATCGGTGAACTGTCCAGA Jednořetězcová DNA *-G *-GATCG *-GATCGG *-GATCGGTG *-GATCGGTGAACTG *-GATCGGTGAACTGTCCAG *-G *-GA *-GATCG *-GATCGG *-GATCGGTG *-GATCGGTGA *-GATCGGTGAA *-GATCGGTGAACTG *-GATCGGTGAACTGTCCA *-GATCGGTGAACTGTCCAG *-GATCGGTGAACTGTCCAGA Denaturační PAGE *-GAT *-GATC *-GATCGGT *-GATCGGTGAAC *-GATCGGTGAACT *-GATCGGTGAACTGT *-GATCGGTGAACTGTC *-GATCGGTGAACTGTCC *-GATC *-GATCGGTGAAC *-GATCGGTGAACTGTC *-GATCGGTGAACTGTCC Sangerovo sekvenování 1. Příprava jednořetězcové NK (DNA) jako templátu 2. Terminální značení primeru (5‘ konec - T4 PNK, 3‘ konec – TdT, fluorescenční primer) 3. Rozdělení na 4 reakce, každá s přídavkem jednoho dideoxyNTP (ddNTP) 4. Polymerační reakce – prodlužování primeru (templát + primer + polymeráza + dNTP mix + příslušný ddNTP v malém množství) 5. Elektroforéza (denaturační PAGE, kapilární při fluorescenčním značení) 6. Vizualizace (autoradiografie, fluorescence) Sanger F, Nicklen S, Coulson AR. DNA sequencing with chain-terminating inhibitors. Proc Natl Acad Sci U S A. 1977;74(12):5463-7. G dNTP ddGTP A dNTP ddATP T dNTP ddTTP C dNTP ddCTP Sangerovo sekvenování GATCGGTGAACTGTCCAGA *-CTAG*-primer templát *-CTAGCCACTTGACAGGTCA *-CTAGCCA *-CTAGCCA *-CTAGCCACTTGA *-CTAGCCACTTGACA *-CTAGCCACTTGACAGGTCA Optimální směs dATP + ddATP Polymerační reakce za přítomnosti 4 dNTP a některého ddNTP Denaturační PAGE Automatizované Sangerovo sekvenování Wikipedia.org Fluorescenčně značené mohou být primery nebo terminátory Next-Generation Sekvenování • Vstupem každé jednotlivé sekvenační reakce je jediná molekula NK, která je amplifikována na velké množství jednořetězcových templátů, jež jsou následně sekvenovány • Sekvenuje se paralelně velké množství menších fragmentů NK, jež se násobně překrývají Illumina Ion Torrent SOLiD Pyrosekvenování Amplifikace NK pro sekvenování Před samotným sekvenováním NGS je nutné amplifikovat vstupní fragmenty NK tak, aby amplikony každého fragmentu byly separovány od ostatních fragmentů. Emulzní PCR Bridge / Polony PCR Emulzní PCR Maxam AM, Gilbert W. A new method for sequencing DNA. Proc Natl Acad Sci U S A. 1977;74(2):560-4. Bridge / „Polony“ PCR atdbio.com Illumina (Solexa) • Amplifikace pomocí bridge PCR – tvorba clusterů • Sekvenace polymerací • Využití odlišně fluorescenčně značených „reversible terminator“ nukleotidů • Detekce fluorescence souběžně pro všechny clustery po každém připojení nukleotidu – „mikroskopicky“ • Krátká čtení (150 bp), paired-end • Velké množství paralelních čtení (107-1010) • Velký objem výstupních dat (až Tb / běh) www.illumina.comwww.nanoHub.com Illumina (Solexa) www.illumina.comTÉŽ: https://www.illumina.com/documents/seminars/presentations/2010_09_sq_lakdawalla_compendium_of_genomic_dna_sequencing.pdf Illumina (Solexa) www.illumina.com IonTorrent SOLiD Sequencing by Oligonucleotide Ligation and Detection • Sekvenčně specifická ligace oktamerních oligonukleotidových sond označených fluorescenčními barvivy • Velmi vysoká přesnost na prvních nukleotidech, velmi krátká čtení SOLiD Pyrosekvenování (454-sekvenování) • Sekvenování se syntézou DNA v reálném čase nevyžadující elektroforézu ani separaci fragmentů • Je založené na uvolnění pyrofosfátu (PPi) při enzamatické syntéze DNA (Nyren et al., 1987) • Namísto standardního dATP je používán α−thiosubstituovaný dATP, který je přijímán DNA polymerázou, ale nikoli luciferázou • Používána pro identifikaci jednonukleotidových polymorfizmů (SNPs) Pyrosekvenování (454-sekvenování) 3rd generation sekvenování • Vstupem každé jednotlivé sekvenační reakce je jediná molekula NK, jež je přímo sekvenována bez amplifikace • Sekvenuje se paralelně více velmi dlouhých fragmentů (dlouhá čtení) NanoPore Pacific Biosciences – SMRT PacBio - SMRT Nanopore Náklady na sekvenování