Sekvenování nukleových kyselin a analýza DNA sekvencí doc. RNDr. Milan Bartoš, Ph.D. bartosm@vfu.cz Přírodovědecká fakulta MU, 2014 Obsah přednášky 1) Pojem sekvenování 2) Maxamovo-Gilbertovo sekvenování 3) Sangerova metoda s využitím fluoroforú 4) Pyrosekvenování 5) Nové přístupy k sekvenování 6) Příklad reálné analýzy Doporučená literatura www.farmakogenomika.cz Sekvenování Rozhodující metoda pro stanovení nukleotidových sekvencí > Konečná fáze procesu individualizace jednotlivých izolátů > Metoda je pro většinu mikrobiologických aplikací pnlis presna Metody sekvenování nukleových kyselin Chemická metoda sekvenování (Maxamovo-Gilbertovo sekvencování) Enzymová metoda sekvenování (Sangerovo sekvenování) Pyrosekvenování Chemická metoda sekvenování (Maxamovo-Gilbertovo sekvenování) Podstatou je specifické štěpení molekuly ssDNA po modifikaci jednotlivých bází chemickými činidly s následnou elektroforetickou detekcí v denaturujícím polyakrylamidovém gelu. Chemická činidla jsou specifická pro modifikaci určitých bází: G A+G C+T C - DMS - piperidin - hydrazin - hydrazin + NaCI Chemická metoda sekvenování Příprava ssDNA a značení Modifikace bazí Štěpení ssDNA Odečtení výsledku Chemická metoda sekvenování Příprava ssDNA a značení 5'- GATCAGG - 3' 3'- CTAGTCC - 5' Modifikace bazí Štěpení ssDNA Odečtení výsledku Asymetrická PCR Využití vazby biotinylovaného primeru 32 p 32P - GATCAGG - 3' Chemická metoda sekvenování Příprava ssDNA a značení 32P - GATCAGG - 3' Modifikace bazí Štěpení ssDNA Odečtení výsledku + DMS piperidin hydrazin Hydrazin + NaCI Chemická metoda sekvenování 32P - GATCAGG - 3' Příprava ssDNA a značení Modifikace bazí Štěpení ssDNA Odečtení výsledku + DMS piperidin hydrazin Hydrazin + NaCI Štěpení piperidinem při vysoké teplotě CO ■o I o > —I o > o o CO ro ■o I o > H o > o o CO ro ■o I o > —I o > o o CO ro ■o I o > H O > o 32P - GATCAGG - 3' G DMS + < piperidin 32P - GATCAG 32P 32P- GATCAGG 32P 32 p 32 p + hydrazin Hyd raz i n + NaCI GA GATCA GATCAG GATCAGG 32P - GAT 32P 32P - GATC GATC Reálný výsledek chemické metody sekvenovánl O I- O O I- O 0+ + A OO+ + A w < o < < o < ••§-•»«1* Převzato z: Site-specific DNA transesterification catalyzed by a restriction enzyme Giedrius Sasnauskas*, Bernard A. Connollyt, Stephen E. HalfordJ, and Virginijus Siksnys*§ * Institute of Biotechnology, Graiciuno 8, Vilnius, LT-02241, Lithuania; flnstitute for Cell and Molecular Biosciences, University of Newcastle, Newcastle upon Tyne NE2 4HH, United Kingdom; and ^Department of Biochemistry, School of Medical Sciences, University of Bristol, University Walk, Bristol BS8 1TD, United Kingdom Úkol Z výše uvedeného záznamu odečtěte výslednou nukleotidovou sekvenci Výsledek bude tedy asi tento CTg ggC TgC TgA ACC AgC CCA gCA gCC Cag Tg Sangerova metoda d i d eoxy te rm i n áto ry 3' OH H Dideoxyterminátory 3' H H 3' H H Průběh sekvenování 1. denaturace (92-96°C) dsDNA 2. annealing (45-72X) 3. extenze (72°C) Průběh sekvenování 1. denaturace (92-96°C) dsDNA 2. annealing (45-72°C) 3. extenze (72°C) Výsledek sekvenování Následuje rozdělení fragmentů Následuje rozdělení fragmentů Sekvenování - záznam Kapilární gelová elektroforéza > rozdělí produkty sekvenování podle velikosti > detekuje fluorofory laserem Úkol Na základě výsledků sekvenování zařadte izoláty bakterií čeledi Pasteurellaceae Použijte výukový materiál Pyrosekvenování > Metoda popsaná Mostafa Ronaghi et al. v roce 1990 > Určena pro krátké úseky DNA, SNP a úseky metylované Polymerase v------ACCTTGAGTACCATCTAGGA 5»------TGGAACTCA PP, dATP ATP sulfutyíase -> (d)ADP Apyrase (d)AMP > 4 enzymy > velmi přesná > reakce se záhy „zahltí" Průběh pyrosekvenování (DNA)n + dXTP (DNA)n+1 + PPj DNA polymeráza Průběh pyrosekvenování Potymerase 3>------ACCTTGAGTACCATCTAGGA y------TGGAACTCA PPi+ APS ATP + S042" ATP sulfuryláza Průběh pyrosekvenování Potymerase 3>------ACCTTGAGTACCATCTAGGA y------TGGAACTCA (d)ADP I (d)AMP ATP + luciferin + 02 AMP + PPl + oxyluciferin + C02 + světlo luciferáza Průběh pyrosekvenování Polymerase 3 i------ACCTTGAGTACCATCTAGGA y------TGGAACTCA PP, ATP suífutylase ATP Luciferase m ; jjV dXTP dXMP apyraza Parametry pyrosekvenování > žádné značené primery ani značené nukleotidy > žádná elektroforéza > Principem je uvoln a emise viditelnéhc > Množství uvolněné množství zabudové > Namísto standardn 2-deoxyadenosin-který není substrát Polymerase 3 i------ACCTTGAGTACCATCTAGGA y------TGGAACTCA ATP sulfutylase > Rychlost sekvenování = 1 báze za minutu > Délka stanovené sekvence = 100 nukleotidů Pyrosekvenování - záznam Intenzita signálu odpovídá počtu začleněných nukleotidů Sekvenování pomocí hybridizace > Nepřímá metoda využívající DNA čipu > > Výsledek odečten konfokálním mikroskopem Sekvence Q^^na dedukcí T A C G T A A T G C A T C G G C A T G T G A A C C T A C A G A A A C G C Otázka Kdyby byly na čipu naneseny 20 mery, kolik políček by musel obsahovat čip pro sekvenování 1 Mb? Prý celkem 1,112 x 106 Minisekvenování > Metoda využívající technologie DNA čipu > Využívá se pro stanovení jednoduchých nukleotidových polymorfismů > Více variant, metoda je automatizovaná, multiplexní SNP, (CG) (CC) lllllllll llllllllllllll PCR products • DNA potymeras* Mix o' labelled ddNTPa 9191 TA TA 9l9l 9l9l GC CG GC GC 5' S V- J_ v- 5' 6' Transcrtxxi RNA o-e taoeHM »rcäworse transcriptase ♦ unlabeled dMTPs 4 ŕ$ ►TA CA 11 TA CA G C CG AC GC SNP, SNP2 SNP3 "-V SNP, SNP2 SNP3 1.1-7 AA CG CC c 5' SNP, -T-O \_ -G-O A. 5V o o T T \ -Q-Q Capture o s \ O o G G \ \ SNP, SNPp SNP3 -7^77 Products ol pnmer oxtertaon n solution AA CG CC Nature Reviews | Generics Emulsní PCR > Amplifikace probíhá v emulsi (voda-olej) > DNA je fragmentována na úseky dlouhé 300-800 bp > Jednotlivé matrice jsou navázány samostatně na povrch jednotlivých kapek obalených primery Emulsní PCR > Amplikon je výsledkem jedinečné PCR > Méně nespecifických produktů a ...................y................... Si b c * \ Conventional PCR Emulsion PCR Komerční aplikace emulsní PCR 454 sekvenční systém firmy Roche > Produkty PCR jsou sekvenovány pyrosekvenováním 454 sekvenční systém Základní kroky > Tvorba jednořetězcových DNA matríc > Připojení adaptérů a vazba na pevné částice > Amplifikace DNA matric v emulzi > Vytvoření sekvenčních dat > Analýza sekvencí různými nástroji bioinformatiky Podívejte se na komerční prezentaci na stránkách http://454.com/products/technology.asp 454 sekvenční systém Výsledný záznam Další moderní přístupy najdete na http://qrf.lshtm.ac.uk/sequenc inq.htm 454/Pyrosequencing (Roche) SOLEXA (lllumina) Porovnání 454 a polony (SOLiD) (1) Sheering to small fragments prime připojení adapterů destička pyrosekve nování (2a) Linker attachment (3a) Amplification on beads ^ (4a) Beads applied to picotiter plate M (2b) Cifculanzation and Imker attachment (3b) Amplification on ePCR beads (4b) Beads immobilizec in a monolayer in anacrylamtde matrix (5a) Pyrosequencing by primer extension (5b) Ligation with oligo pools added in cycles ^ndjourcotonrnacjin^^^^^^^^^^^^ cirkulalizace a linearizace monovrstva na PAGE ligace značených oligo Hall N J Exp Biol 2007;210:1518-1525 Sekvenování mikroorganismů > První sekvenovaný mikroorganismus = Haemophillus influenzae, 1995, TIGR > V roce 2000 následovaly Mycobacterium tuberculosis, Escherichia coli a Archaeoglobus fulgidus > První eukaryotický mikroorganismus = Plasmodium falciparum, 2002 > Následovaly kvasinky, ... > V současnosti jsou v databázích stovky sekvencí > Podívejte se na http://www.ncbi.nlm.nih.gov/qenome Úkol Podívejte se do databáze a zjistěte, u kolika halobakterií (třída Halobacteria) je v současné době známa nukleotidová sekvence genomu, a to jak kompletní, tak i částečná Zjistěte totéž u čeledi Pasteurellaceae A ještě u cyanobakterií (kmen Cyanobacteriá) Další příklady I Genome Gallery A selection of notable genomes that have been sequenced. OX 174 (1977) 5386 bp First genome sequenced, a bacteriophage Haemophilus influenzae (1995) 1830000 bp First genome of a free-living organism Mycoplasma genitalium (1995) 580000 bp Smallest genome of any free-living organism Saccharomyces cerevisiae (1996) 12100000 bp First genome of a eukary-otic' (nucleus-containing) organism, the yeast used by brewers and bakers Methanococcus jannaschii (1996) 1660000 bp The first genome from the third kingdom, Archae, which comprises microbes that live in harsh environments, for example thermal springs Escherichia coli (1997)4670000 bp Workhorse bacterium for biologists Helicobacter pylori (1997) 1660000 bp Bacterium associated with gastric disease Genome Gallery Mycobacterium tuberculosis (1998)4 400000 bp Cause of the disease tuberculosis Další příklady II Deinococcus radiodurans (1999) 2600000 bp Highly radiation-resistant bacterium S 5 Í Caenorhabditis elegans (1998) 97000000 bp The first genome sequence of an animal, the roundworm First human chromosomes (1999 and 2000) Chromosomes 22, 48000000 bp and 21, 45000000 bp respectively Drosophila melanogaster (2000) 180000000 bp Fruit fly, an important laboratory organism in genetics Genome Gallery Vibrio cholerae (2000)4 030000 bp Cause of the disease cholera Další příklady III LU Arabidopsis thaliana (2000) 120000000 bp The first genome of a plant, the mustard weed ■X, 0 1 3 3 <£ 8. £ P Mycobacterium leprae (2001) 3270000 bp Cause of the disease leprosy Prehled stävajfcfch a novych technik celogenomoveho sekvenoväni r 7 DNA Amplification followed by mass spectrometry In vitro cloning T Mass Array Jurinke et al. (2002) Sequencing by synthesis T Hybridization and ligation In vivo cloning Sanger method Sanger et al. (1977) Single molecule r Arrayed fragments Brasiavsky et al. (2003) Nanopore readers Kasianowicz et al. (1996) 454 Solexa Polony MPSS Margulies et al. (2005) Bennett et al. (2005) Shendure et al. (2005) Brenner et al. (2000) Hall N J Exp Biol 2007;210:1518-1525 A teď se podíváme na něco praktického Použijte připravený výukový materiál ze sekvenování zástupců čeledi Pasteurellaceae Shrnutí 1) Pojem sekvenování 2) Maxamovo-Gilbertovo sekvenování 3) Sangerova metoda s využitím fluoroforů 4) Pyrosekvenování 5) Nové přístupy k sekvenování 6) Příklad reálné analýzy