Masivně paralelní sekvenování Boris Tichý Sdílená laboratoř Genomika Brno, 9.11.2021 ‹#› Informace je uložená v DNA Informace uložená jako sekvence bazí A, C, G, T V každé lidské buňce je ~ 3 miliardy bazí = ~ 3 metry = ~ 6.6 pikogramů Sekvence DNA je v každé bunce stejná ‹#› Sekvenování DNA Maxam-Gilbert sequencing - chemické sekvenování ‹#› Sekvenování DNA Vytvoření různě dlouhých fragmentů DNA Gel → kapilární elektroforéza Značené primery nebo ddNTPs Sanger sequencing ‹#› Sekvenování DNA Pyrosequencing adenosine 5´ phosphosulfate (APS) ‹#› Masivně paralelní sekvenování PCR amplifikace jednotlivých DNA fragmentů nebo Sekvenování jednotlivých DNA fragmentů = Single molecule sequencing Sekvence je čtena při syntéze nového řetězce Technologie a přístroje přizpůsobeny paralelizaci Stovky milionů jednotlivých PCR reakcí a sekvenací najednou (běžně prodávané kapilární sekvenátory jsou max. 96-kapilární) Většinou kratší sekvence – desítky bazí (kapilární – běžně až 1000 bazí) Masivně paralelní sekvenování Sequencing by synthesis Polymeráza Sestavování nového řetězce z jednotlivých nukleotidů Sequencing by ligation Ligáza Sestavování nového řetězce z oligonukleotidů Non-enzymatic sequencing Nanopory, elektronová mikroskopie Přímé čtení sekvence Masivně paralelní sekvenování Technologie Ion Emulzní PCR Masivně paralelní sekvenování Sequencing by synthesis ‹#› Masivně paralelní sekvenování Technologie Roche/454 Pyrosekvenování ‹#› Masivně paralelní sekvenování Technologie Illumina Bridge amplifikace ‹#› Masivně paralelní sekvenování Technologie Illumina Sekvenování s reverzibilními terminátory https://www.youtube.com/watch?v=fCd6B5HRaZ8 ‹#› Masivně paralelní sekvenování Paired-end sequencing Illumina ‹#› Masivně paralelní sekvenování Mate-pair sequencing Illumina ‹#› Masivně paralelní sekvenování Technologie Illumina HiSeq X Ten – kapacita 18.000 genomů ročně, cena za genom $1.000, cena $10M HiSeq 4000 Kapacita 12 genomů/běh (24/týden), 1,5TB/běh NextSeq 500 Kapacita 1 genom/běh (3/týden), 120GB/běh MiSeq Kapacita 0,15 genomu/běh, 15GB/běh NovaSeq Kapacita 16 genomů/běh, 2TB/běh (48 genomů/6TB brzy) MiniSeq Kapacita 0,07 genomu/běh, 7,5GB/běh Masivně paralelní sekvenování Technologie Ion Torrent https://www.youtube.com/watch?v=WYBzbxIfuKs&list=PLGlvFEwL2wDEWlXSWNtEZRFrXXHJLxs8V&index=2 Masivně paralelní sekvenování Technologie Ion Torrent Ion Torrent PGM Kapacita 2GB/běh Ion S5 Kapacita 10+GB/běh Ion Proton Kapacita 10+GB/běh ‹#› Masivně paralelní sekvenování Class IIs restriction endonucleases 400 – 500 bp DNA nanoball sequencing Technologie cPAL ‹#› Masivně paralelní sekvenování Technologie cPAL ‹#› Masivně paralelní sekvenování Technologie cPAL > 2,5 miliardy jamek na ploše velikosti podložního sklíčka (rozestup 0,7 mikrometru) ‹#› Masivně paralelní sekvenování Sekvenování (hybridizací a) ligací Up to 10 bases are sequenced on either side of each adaptor sequence. A total of 70 bases from the original 500b fragment are sequenced, 35 bases on each end. ‹#› Masivně paralelní sekvenování Technologie cPAL Kompletní systém pro sekvenování lidských genomů a exomů Výrobce BGI (Čína) Kapacita 12.000 genomů/rok, cena $ 12M ‹#› Masivně paralelní sekvenování Technologie cPAL BGISEQ-500 Kapacita až 200GB BGISEQ-50 Kapacita až ?GB ‹#› Masivně paralelní sekvenování 3. generace Technologie SMRT (Single Molecule Real Time) With an active polymerase immobilized at the bottom of each ZMW, nucleotides diffuse into the ZMW chamber. In order to detect incorporation events and identify the base, each of the four nucleotides A, C, G and T are labeled with a different fluorescent color. Since only the bottom 30nm of the ZMW is illuminated, only those nucleotides near the bottom fluoresce. http://www.pacb.com/smrt-science https://www.youtube.com/watch?v=v8p4ph2MAvI ‹#› Masivně paralelní sekvenování Oxford Nanopore https://www.nanoporetech.com https://www.youtube.com/watch?v=hs0FdiTHMbc https://www.youtube.com/watch?v=GUb1TZvMWsw 'Strand sequencing' is a technique that passes intact DNA polymers through a protein nanopore, sequencing in real-time as the DNA translocates the pore. SmidgION MinION GridION PromethION ‹#› Masivně paralelní sekvenování 4. generace??? ReadCoor Fluorescent In Situ Sequencing ‹#› Aplikace nových technologií Celogenomový screening Sekvence SNP Strukturní aberace, početní aberace Cílený screening Sekvence SNP Analýza DNA ‹#› Cílený screening Target enrichment Hybridizace na čipu v roztoku PCR běžná mikrofluidní ‹#› Cílený screening Exome sequencing Všechny exprimované geny Většinou včetně nekódujících Hybridizace (v roztoku) Gene enrichment Jeden gen – např. dědičné poruchy PCR, hybridizace multiplexing Skupiny genů – např. multifaktoriální nemoci, nádory PCR, hybridizace Úseky genomu – strukturní aberace hybridizace ‹#› RNA-Seq Transcriptome sequencing Single-end – kvantifikace Paired-end – struktura transkriptů Tag sequencing 3' tagy, kvantifikace, bez informace o struktuře Degradome sequencing 5' tagy, identifikace cílů microRNA Small RNA sequencing MicroRNA kvantifikace i de-novo identifikace Imunoprecipitace, RNA vázající proteiny ‹#› Epigenomika DNA metylace C → Met-C, snížená exprese Modifikace histonů Aktivní I neaktivní chromatin ‹#› Metylace DNA MeDIP - Imunoprecipitace metylované DNA Protilátka rozpoznávající Met-C Pozice metylovaných úseků DNA Bisulfite treatment Konverze C → U, Met-C se nemění Přesná identifikace jednotlivých metylovaných bazí Některé dědičné choroby, nádory ‹#› Analýza NGS dat Quality Control Assembling – vytvoření kontigů De-novo Mapování na referenční sekvenci Identifikace variant SNP (SNV) In/del Strukturní aberace – chromosomy, transkripty Kvantifikace DNA – amplifikace/delece, místa vazby transkripčních faktorů RNA – tagy, exony, transkripty ‹#› NGS projekty TCGA – The Cancer Genome Atlas ICGC – International Cancer Genome Consortium Genomics England – 100000 Genomes (25000 cancer) Adobe Systems Děkuji za pozornost Středoevropský technologický institut c/o Masarykova univerzita Žerotínovo nám. 9 601 77 Brno, Česká republika www.ceitec.cz | info@ceitec.cz