Jak přečíst pořadí nukleotidů v mikrobiálních genech a jak pořadí aminokyselin v jejich produktech? doc. RNDr. Milan Bartoš, Ph.D. Bartoš.Milan@atlas.cz Přírodovědecká fakulta MU, 2017 Obsah přednášky 1) Pojem sekvenování Maxamovo-Gilbertovo sekvenování Sangerova metoda s využitím fluoroforu Pyrosekvenování Nové přístupy k sekvenování Sekvenování RNA Sekvenování proteinů Doporučená literatura www.farmakogenomika.cz Sekvenování Rozhodující metoda pro stanovení nukleotidových sekvencí > Konečná fáze procesu individualizace jednotlivých izolátů > Metoda je pro většinu mikrobiologických aplikací vru ■ v v r pnlis presna Metody sekvenování nukleových kyselin Chemická metoda sekvenování (Maxamovo-Gilbertovo sekvencování) Enzymová metoda sekvenování (Sangerovo sekvenování) Py rosekvenování Kombinované velkokapacitní systémy Chemická metoda sekvenování (Maxamovo-Gilbertovo sekvenování) Podstatou je specifické štěpení molekuly ssDNA po modifikaci jednotlivých bází chemickými činidly s následnou elektroforetickou detekcí v denaturujícím polyakrylamidovém gelu. Chemická činidla jsou specifická pro modifikaci určitých bází: G A+G C+T C DMS piperidin hydrazin hydrazin + NaCI Chemická metoda sekvenování Příprava ssDNA a značení Modifikace bazí Štěpení ssDNA Odečtení výsledku Chemická metoda sekvenování Příprava ssDNA a značení 5'- GATCAGG - 3' 3'- CTAGTCC - 5' Modifikace bazí Štěpení ssDNA Odečtení výsledku Asymetrická PCR Využití vazby biotinylovaného primeru 32 p 32P - GATCAGG - 3' Chemická metoda sekvenování Příprava ssDNA a značení 32 P - GATCAGG - 3 Modifikace bazí Štěpení ssDNA Odečtení výsledku O + DMS piperidin hydrazin Hydrazin + NaCI Chemická metoda sekvenování 32 P - GATCAGG - 3 Příprava ssDNA a značení Modifikace bazí Štěpení ssDNA Odečtení výsledku DMS piperidin hydrazin Hydrazin + NaCI Štěpení piperidinem při vysoké teplotě N) -o I O > N) -o I o > N) -o I o > I O > o > o o > O > o > o 32P - GATCAGG - 3' DMS 1 32P -GATCAG 32P -GATCAGG + < piperidin i 32 p 32 p 32 p 32 p O + hydrazin GA GATCA GATCAG GATCAGG Hydrazin + NaCI 32P - GAT 32P 32P - GATC l GATC A+G T+C Reálný výsledek chemické metody sekvenování O H O OHO OC5+ + A 00+ + A < O < < O < 1 r5s <3 ~" '■li*!- 'í1! Převzato z: Site-specific DNA transesterification catalyzed by a restriction enzyme Giedrius Sasnauskas*, Bernard A. Connollyf, Stephen E. HalfordJ, and Virginijus Siksnys*§ ^Institute of Biotechnology, Graiciuno 8, Vilnius, LT-02241, Lithuania; flnstitute for Cell and Molecular Biosciences, University of Newcastle, Newcastle upon Tyne NE2 4HH, United Kingdom; and {Department of Biochemistry, School of Medical Sciences, University of Bristol, University Walk, Bristol BS8 1TD, United Kingdom Úkol Z výše uvedeného záznamu odečtěte výslednou nukleotidovou sekvenci Výsledek bude tedy asi tento Sanger ova metoda dideoxyterminátory 3' OH H Dideoxyterminátory 3 H H 3 H H Průběh sekvenování 1. denaturace (92-96°C) dsDNA 2. annealing (45-72°C) 3. extenze (72°C) Průběh sekvenování 1. denaturace (92-96°C) dsDNA 2. annealing (45-72°C) 3. extenze (72°C) Výsledek sekvenování Následuje rozdělení fragmentů Následuje rozdělení fragmentů DETEKTOR Sekvenování - záznam 'A AAGCCTGGGGTGCCTA ATGAGTGA G C TA AC TC AC A T TAAT T GC GTT GC GC TCAC TGCCCGCT' TTCCAGTCGGG A A AC CTGTC GTGCCAGC TGCATTAATGA ATCGGC CAAC G C G C G GG G A GAG GC GC 250 260 270 280 290 300 BT TTGC GTATTGGGC GCTCTTCC GC TTCCTCGC TCAC T G AC TC GC T GC GC TC G GTC GTTCGGC TG Kapilární gelová elektroforéza > rozdělí produkty sekvenování podle velikosti > detekuje fluorofory laserem Úkol V praktickém cvičení zařaďte na základě výsledků sekvenování izoláty bakterií čeledi Pasteurellaceae Prohlédněte si animaci na http://wwwnc.cdc.gov/eid/article/13/2/06-1032_article.htm Pyrosekvenování > Metoda popsaná Mostafa Ronaghi et al. v roce 1990 > Určena pro krátké úseky DNA, SNP a úseky metylované Polymerase 3>------ACCTTGAGTACCATCTAGGA y------TGGAACTCA PP, dATP ATP sulfurylase -> (d)ADP Apyrase (d)AMP > 4 enzymy > velmi přesná > reakce se záhy „zahltí" Pyrosekvenování - záznam Intenzita signálu odpovídá počtu začleněných nukleotidů Prohlédněte si animaci o pyrosekvenování na http://www.youtube.com/watch?v=jylCHBxTKkw&feature =related Emulsní PCR > Amplifikace probíhá v emulsi (voda-olej) > DNA je fragmentována na úseky dlouhé 300-800 bp > Jednotlivé matrice jsou navázány samostatně na povrch jednotlivých kapek obalených primery Emulsní PCR > Amplikon je výsledkem jedinečné PCR > Méně nespecifických produktů Conventional PCR 1 Emulsion PCR Komerční aplikace emulsní PCR 454 sekvenční systém firmy Roche > Produkty PCR jsou sekvenovány pyrosekvenováním 454 sekvenční systém Základní kroky > Tvorba jednořetězcových DNA matríc > Připojení adaptérů a vazba na pevné částice > Amplifikace DNA matríc v emulzi > Vytvoření sekvenčních dat > Analýza sekvencí různými nástroji bioinformatiky Podívejte se na komerční prezentaci na stránkách http://454.com/products/technology.asp 454 sekvenční systém Výsledný záznam Další moderní přístupy najdete na http://qrf.lshtm.ac.uk/sequenc inq.htm ''o 454/Pyrosequencing (Roche) / 1 Jmi V y\ \liY 1 /Al / SOLEXA (lllumina) Hovorime o NGS = Next generation sequencing TGS = Third generation sequencing Sekvenování RNA Whole Transcriptome Shotgun Sequencing (WTSS) > je možno provést sekvenování cDNA a tím získat informaci o obsahu RNA v daném okamžiku života buňky Morin et al. (2008): Profiling the HeLa S3 transcriptome using randomly primed cDNA and massively parallel short-read sequencing". BioTechniques 45 (1): 81-94. Separace různých druhů RNA ...je prvním krokem při sekvenování RNA rRNA (90%) tRNA k separaci se používají nejčastěji magnetické kuličky s poly(T) Separace RNA Isolate Total RNA / V Fragmentation and/or Isolation In this case, isolation via Poly{T) coated magnetic beads Poly(A) RNA molecules bind to the Poly(T) magnetic beads Zpětná transkripce ...po separaci RNA následuje její fragmentace na krátké oligonukleotidy .... ... delší úseky RNA totiž tvoří sekundární struktury ... fragmentace ale není vždy nezbytná ... fragmentované molekuly jsou přepsány do cDNA ... ... která je následně podrobena sekvenování Zpětná transkripce Magnetically isolate and wash beads Fragment and/or Reverse Transcribe ...................'...........nu........mnú AAAAA Fragmentation (if not done already), size selection, and sequence ............ nTTTmiiinini lllllllllllllllllllllll lllllllllll TTXTénui.......mim mil mi in in iiujiiiiiii lllumina Solexa, Roche 454, or ABI SOLiD Graphic shown here is lllumina Na jaké fragmenty nastříhat RNA ? Délka čtení 454 lllumina SOUD Podrobnosti k moderním sekvenačním metodám v 5. ročníku Co s vzniklými fragmenty? > Poskládání do souvislých sekvencí > Porovnání s genetickými databázemi Intro n pre-mRNA Exon Short read is split by intron when aligning to reference Genome Více uslyšíte v 5. ročníku (http://www.ncbi.nlm.nih.gov/) Přímé sekvenování RNA V průběhu přípravy cDNA vznikají artefakty Snaha sekvenovat RNA přímo Direct RNA Sequencing (DRSTM) Helicos Biosciences (http://www.helicosbio.com/) Princip primeho sekvenování RNA > Připojení jednotlivé molekuly k ukotvenému oligo(dT) > Polymerace virtuálního terminátoru http://wwwTsc.org/chemistryworld/News/2009/September/23090903.asp Průběh přímého sekvenování RNA > Připojení k oligo(dT) > Fixace a uzamčení > Polymerace NTP s VT > Odmytí zbylých NTP > Zachycení fluorescence > Odštěpení VT > Polymerace dalšího NTP s VT Využití přímého sekvenování RNA Prvně použita k sekvenování m RNA ze S. cerevisiae Oszolak et al. (2009): Direct DNA sequencing. Nature 8;461(7265):814-8 Firma HelicosBiosciences doporučuje > Kvantitativní mapování polyA/Digitální genová exprese > Analýza transkriptomu > Kvantifikace RNA ve formalínových a parafínových preparátech > Malé RNA/nekódující RNA > Imunoprecipitace RNA > Charakterizace RNA na úrovni atomolů Otázka Jeden attomol, kolik je to molekul RNA o délce 300 a 500 nukleotidů? 1 mol = 6,023 x 1023 molekul 1 x 10-18 = 6,023 x 105 molekul Pro náruživé statistiky Statistical Design and Analysis of RNA Sequencing Data Auer a Doerge (2010): Statistical Design and Analysis of RNA Sequencing Data. Genetics 185: 405-416 Novinky ze sekvenování RNA najdete na http://www.rna-seqblog.com/ Ale je to spíš o vyšších eukaryotech Komerční aplikace lllumina (TruSeq RNA Sample Preparation Kits) http://www.illumina.com/applications/sequencing/rna.il mn?source=transcriptome Invitrogen (Ion Total RNA-Seq Kit) http://products.invitrogen.com/ivgn/product/44 75936 Prohlédněte si animaci o lllumina na http://www.youtube.com/watch?v=l99aKKHcxC4&feature =related Otázka z června 2012 Zdroj http://seqanswers.com/forums/showthread.php?t=21016 Can we separate virus using small RNA sequencing? We have a plant material which infected virus. Now we want to know the detail information about the virus. How should we do? Can we use small RNA sequencing to separate it? Thank you! Sekvenování proteinů Sekvenování proteinů ... je stanovení sekvence aminokyselin v polypeptidovém řetězci > První protein, bovinní inzulín byl sekvenován v roce 1953 Frederikem Sangerem > Sanger obdržel Nobelovu cenu v roce 1958 Strategie sekvenování > Zjistit počet polypeptidových řetězců (podjednotek) > Určit počet disulfidických můstků (uvnitř řetězce a mezi řetězci) > Stanovit sekvenci aminokyselin každého z retezcu > Je-li podjednotka příliš dlouhá, fragmentovat na kratší polypeptidy > Sekvenovat fragmenty metodou podle Edmana > Poskládat sekvence analýzou překryvů Analýza koncových skupin > Počet podjednotek lze zjistit podle počtu C konců > Analýza N konců - Dansyl chlorid - Fenylisothiokyanát/ Edmanovo reagens - Aminopeptidáza > Analýza C konců - Karboxypeptidáza Převeďte úsek DNA do sekvence aminokyselin, vyznačte C a N konec kódující DNA-řetězec: 5'- ATG AAA TAC GCT CCC TTA AAA - 3' antikódující DNA-řetězec: 3'- TAC TTT ATG CGA GGG AAT TTT - 5' Tabulka genetického kódu: AAA - Lys GCA -Ala AAU - Asn GCU -Ala ACU -Thr GGG -Gly AUG -Met UAC - Tyr CGA - Arg UGA - Term CGU - Arg UUA - Leu CCC - Pro UUU - Phe N - Met - Lys - Tyr - Ala - Pro - Leu - Lys - C Analýza N konců dansyl chloridem > Hlavní reagencie: 1-dimetyl aminoftalen-5-sulfonyl chlorid (dansyl chlorid) > Příprava dansylovaného polypeptidu > Kyselá hydrolýza - uvolnění všech AA a N-koncové dansylované AA > Separace aminokyselin > Detekce fluoreskující dansylované AA > Porovnání s dansylovanými standardy AA + R, 0 1 1 HjH — CM-C-MN- R3 0 1 1 CH — C —HN ľ' — CM- 0 1 c---- 6*utf»fry< ffcluild* (d«"iyt chlorid P—*H T 50 R, 0 R, III 1 HH —CH —C —MN —CM- 0 R» 0 ! 1 1 -C —MN —CH —C-- M,0* • U JL J SO. R, 0 1 T 1 HN — CM — C — OH + H R, 0 • 1 1 ,N —CH —C—OM + H,N —CH — 0 C—OM Analýza N konců podle Edmana I Metoda degradační > Nukleofilní atak fenyl izothiokyanátu, Edmanovo V reagens, v mírném VIL^---ľ l t + Hjfl —CH —C— R2 0 R3 0 II II HN — CH — C — HN — CH —C— ••• alkalickém prostředí (N- S polypeptide metyl pi perid in/voda/metan PITC HjO* ol) f > Tvorba fenylcarbamyl derivátu (PTC-peptid) C —HN — CH — C—HN — CH 0 R3 0 1 1 0 — C—HN —CH —C— •• ■ ^^^^ PTC poly l>o|iiid« Analýza N konců podle Edmana II > Kyselina trifluoro octová (TFA) štěpí koncovou aminokyselinu - vzniká thiozolinový derivát a zbylý nemodifikovaný peptid > Thiozolinový derivát je extrahován organickým rozpouštědlem (např. N-butyl chloridem) C-HÍJ-CH-C— HN—CH—C— HN — CH—C---- S ^—*s PTC polypepiltlc anhydrnus Triíluoroaceíir: acid (F3CCO);?í) HNPh hinzolinont (ÍBiivative > Zbylý nemodifikovaný peptid nese volnou koncovou aminokyselinu Analýza N konců podle Edmana III > Thiozolinový derivát extrahovaný v organickém rozpouštědle je opracován kyselinou (25% TFA) -vzniká derivát fenylthiohydantoinu (PTH) > PTH je detekován na základě absorbce UV při 296 nm > PTH AA je separována chromatograficky nebo elfo > AA je detekována podle retenčního času nebo hmotnosti > Sekvenci lze opakovat 40-60x VY + HNPh H+ // o. S PIH ,'iinJihj ,icmI Analýza N a C konců exopeptidázami > Exopeptidázy štěpí AA od konců řetězce > Aminopeptidázy od N-konce > Karboxypeptidázy od C-konce > Oba enzymy jsou vysoce specifické, ale pracují pomalu a některé AA jimi nelze odštěpit B I li I II H,N-CH —C—HN-CM—C — HN-CM —C--- polypcplidc Aminopi*ptid<»se f ř , ± í M MjN —CM —C—0* + M3N —CH —C-MN —CH —C- I U I II I II HN-CM-C-HN-CM-C-HN-CM-C-O- pntypeplirii* CdiboxypupliclAsi? i ii i ii ii •• -HN-CM-C-HN-CM-C-O- + H,Ň-CM-C-0 Štěpení dísulfídíckých můstků > Redukce na thioly prostřednictvím dithiothreitolu nebo 2-merkaptoetanolu u ••• — HN —CH —C — ••• 1 CH, S 2HSCH>CH-vOH g ?^nefc«plo«rt».ínol 1 M ••• — HN — CH — C---- 1 CH2SH CH3OH 0« CH2OH 1 CH,SH ilitfiiotlueitol (DÍT) > Thioly jsou opracovány alkylačními činidly (např. kyselinou jodooctovou), aby se zabránilo reoxidaci během následujících kroků 0 cysíin 0 II •■• — HN — CH — C---- 1 CH2 1 SH SCHjCHjOH + SH SCM?CHjOH T' ••• — HN — CH — C— • •• n HO ■ X) HO Účinně sekvenovat lze do 50 aminokyselin, pak se reakce zahltí zplodinami Pracujte s fragmenty Jak získat fragmenty? Trypsin > Štěpí pozitivně nabité AA (Arg nebo Lys), jestliže další AA není prolin > Štěpí od C-konce Endopeptidázy > Pepsin; štěpí u N-konce Phe, Tyr, Trp není-li předchozí AA prolin > Chymotrypsin: štěpí u C-konce Phe, Trp, Tyr jestliže další AA není prolin > Endopeptidáza GluC: štěpí u C-konce Glu Jak získat fragmenty? Exopeptidázy > Leucin aminopeptidáza: štěpí N-koncovou AA leucin, neštěpí N-koncový prolin > Aminopeptidáza M: štěpí všechny AA od N-konce > Karboxypeptidáza A: štěpí všechny AA kromě Arg, Lys, and Pro, zvlášť účinná pro AA s alifatickými a aromatickými postranními řetězci, neštěpí je-li následující AA prolin > Karboxypeptidáza B: štěpí C-koncový Arg a Lys, není-li následující AA prolin > Karboxypeptidáza C: štěpí aminokysliny od C-konce Existují i chemické metody štěpení uvnitř polypeptidových řetězců . Cyanogen bromid Jak rozdělit fragmenty? Tradiční metody > Separace podjednotek po štěpení S-S můstků metodou SDS-PAGE nebo HPLC > Zapotřebí hmotnostní standardy a kalibrační křivka > Přibližný počet AA ve fragmentu lze určit z molekulové hmotnosti fragmentu/110 Moderní postupy > MALDI - přesnější a rychlejší Stanovení sekvence aminokyselin 1) Získání fragmentů více metodami 2) Sekvenování jednotlivých fragmentů 3) Poskládání fragmentů s využitím překryvů trypsin <-> <-><-> Ala-Phe-Lys-Asp-Met-Cys-GIn-Arg-Leu-Pro-Met-Ser-GIn <-><-> <-> CNBr Stanovení pozice S-S můstku 1) Fragmentace polypeptidových řetězců 2) 2D gel směsi fragmentů, stejné podmínky v obou rozměrech 3) Po separaci v prvním rozměru opracovat kyselinou permravenčí, která štěpí všechny S-S můstky 4) Separace ve druhém rozměru - Fragmenty bez S-S můstku se rozmístí podél diagonály - Fragmenty s S-S můstky vytvoří spoty mimo diagonálu - Fragmenty s S-S můstky lze z gelu extrahovat a sekvenovat Příklad analýzy proteinových komplexů fragmenty s S-S můstky kDa 250 1 150 H 100 —I 75 i kDa 250 150 —I 25 20 Not Boiled. SDS-PAGE I Boiled, SDS-PAGE Gubbens et al. (2008): Protein complexes in bacterial and yeast mitochondrial membranes differ in their sensitivity towards dissociation by SDS. Biochimica et Biophysica Acta (BBA) - Proteins & Proteomics 1784 (12), 2012-2018, Sekvenování MALDI-TOF matrix-assisted laser desorption ionization time-of- flight > varianta hmotnostní spektrometrie > peptidy jsou ionizovány a stanoví se poměr hmoty k náboji na základě doby letu (time-of-flight) k detektoru > vypočte se M a ta je specifická pro každou aminokyselinu Schéma zařízení Target plate spotted with proteins of interest Pulsating light Detection Sample plate \ ! Laser Reflection r L -J! H 1111111111 - 111 ■ 111111 Ionisation Protein identification Záznam z MALDI-TOF □.i. ■soudu ■?fimn líliluu 13030 10030 50c0 ■n ■.□ k* "i ■£ i— m- 'A1 Li ■r- i-- c 'ji -r-j ji ■W r> n" irr ľH U. LL1 ť "-b. LU- -- Vr1 MU ,.......Ü ■ľiZ- iŕr i-^l-L -1-1-1-1-1-1-1-1-j-1-1-1-1-j-1-1-1-1— 11 OD 16D0 21CD mjfe Shotgun protein sequencing > Tento koncept vycházející z analogie pro sekvenování DNA se objevil v roce 2007 > Byla zpracována data získaná ze směsi proteinů sekvenovaných hmotnostní spektrometrií > Analýza podobně jako v případě práce s DNA Bandeira et al. (2007): Shotgun Protein Sequencing. Molecular & Cellular Proteomics 6:1123-1134. Kolik materiálu potřebujeme na analýzu? > limit je kolem 2 pmol, tj. asi 1010 molekul > protein by měl být co nejčistší (purifikace HPLC) Shrnutí 1) Pojem sekvenování Maxamovo-Gilbertovo sekvenování Sangerova metoda s využitím fluoroforů Pyrosekvenování Nové přístupy k sekvenování Sekvenování RNA Sekvenování proteinů