IV107 Bioinformatika I Přednáška 3 Katedra informačních technologií Masarykova Univerzita Brno Podzim 2015 Před týdnem DNA nepřímo (přes proteiny) řídí většinu procesů v buňce. Její struktura vykazuje všechny potřebné rysy. Je nositelem genů. Exprese genů ► transkripce ► translace Struktura proteinů ► primární (sekvence aminokyselin) ► sekundární (a, (3, etc.) ► terciární (3-D) ► kvartérní (makromolekulami komplexy) http://www.molviz.org/ Hemoglobin Chime An introductory presentation suitable for lectures or individual study. i['-'T..I1'. PpltLKIUiSSj MHC Chime The Major Histocompatibility Complex presents peptides from foreign proteins to T lymphocytes, crucial to disease immunity, DNA Structure Chime An introductory level, nonlinear self-pace tutorial, i Deutsch, Espaiiol, Portuques) 'Wln-IE6-Compallbf Antibody Chime An introductory presentation suitable for lectures or individual study, (Deutsch I Lipid Bilayers and Membrane Channel Chime Introduces cholesterol and phospholipids, then proceeds to lipid bilayer and the gramicidin membrane channel embedded within the bilayer. Includes molecular dynamics simulations of both gel and fluid membrane states. By Eric Martz and Angel Herraei. (Espariol) I Molecular Vibrations: IR Spectrum Chime Water Chime by Motyka, Lahti 8 Lancashire. ■ f Theoretical simulation of 10 water molecules condensing into a hydrogen-bonded droplet. Includes challenge questions for students, 'Win-IEG-Coinpatible* YYY 'Win-IES-Compatible- from nonspecific to specific DNA binding, -Win-IE6-Comr»tlble- Bacterial flagella are whip-like organelles that bacteria use to swim about. The hook acts as a molecular universal joint. It's composed of over 100 protein subunits. Schéma 1 doubl« stf ueture of heliu bay* pairing DNA & RNA RNA structure splicing cxoni ■o Ircm DNA to protein U3riKľíptior> mRHA genetic cede protein Schéma 2 amino acids have preferred conformations evolution lowenergy state protein structure aim i no acids chain of primary amino acids c-helix secondary p-strand p-turn loops tertiary folds/domains quaternary multiple folds Outline Makromolekuly v laboratoři DNA Rekombinace DNA a klonování Syntéza, kopírování a PCR (amplifikace) Detekce hybridizací a sekvenování DNA Detekce hybridizací a sekvenování DNA Proteiny Analýza sekvencí niky manipulující DNA a RNA ► Rekombinace DNA a klonování ► izolace z buněk ► štěpení restrikčními endonukleázami rekombinace (ligace) ► transformace organizmů rekombinantní DNA ► Syntéza, kopírování a amplifikace DNA ► syntéza oligonukleotidů ► transkripce in vitro ► syntéza cDNA ► amplifikace pomocí PCR ► Editace DNA ► Cas9-CRISPR ► TALEN ► ZF nukleázy ► Detekce, analýza a sekvenace ► elektroforéza (dělení podle velikosti) ► hybridizace se značenými sondami ► určování sekvence Reštrikční endonukleázy enzým zdroj reštrikční m isto fragment[kbp] Alul Arthrobacter luteus AGJ.CT TCtGA 0.3 BamHI Bacillus amyloliquefaciens H GJ.GATC C C CTAGfG 7.0 EcoRI Escherischia coli R GJ.AATT C C TTAAfG 3.1 Haelll Haemophilus aegyptus GG4.CC CCtGG 0.6 Notl Norcadia otitidis-caviarum GC+GGCC GC CG CCGGfCG <9700 Pstl Providencia stuartii C TGCAJ.G GfACGT C 7.0 Taql Thermus aquaticus TJ.CG A A GCtT 1.4 Hindlll Haemophilus influenzae Rd AJ.AGCT T T TCGAJ.A 3.1 Rekombinace a klonování Rekombinace DNA a klonování Identifikace DNA na agarózovém gelu V laboratoři http://www.ct.gov/dps/cwp/view.asp?a=2155&q=314998 http://www.sme.sk/c/3753490/Genetika-nadei-pre-paciento^.tfln'il PCR (polymerázová řetězová reakce) PCR : Polymerase Chain Reaction 30 - 40 cycles of 3 sieps I t W i I 1 minut 94 °C rrnrminiiTmnTnTTTnTTTrriT^^ ? IWmlflTnWTinilTnTmij,,,^^ j Slep 2 ; annealing S| t-r x i „- j^nimiuiiUJuwi™'' I ,v| ^k' . _ i 1 * ' 2 minutes 72 "C 'iTOiw^iirriiii*-3' 1 r- '4 * i**^ PCR (polymerázová řetězová reakce) Third cycle PCR (polymerázová řetězová reakce) Verification of PCR product on agarose or scparidc gci -1857 -1058 - ]kb ; 300- - 383 ladder PCR fragments PCR (polymerázová řetězová reakce) Cas9-CRISPR Cas9-CRISPR 19303037 TALEN (a) LTPDQVVAIASHDGGKQALETVQRLLPVLCQDHG ____________NLS AD ni , "-iiriTii......... II I I ~J -'''s ÜHß, Binding Domain '"-^ ^ fh N! NG HD NN HD HD Nl HD NG Nl HD HD NN N<3 I I I I I I I I I I I I I I I 5 CATC GCCACTAC CGT Target DNA HD-»C NI^A NG->T NN -* G (b) NLS NLS ......I I I I I II I I I I F°kl ^ DNA Binding Domain J-tF^ 5> -ACSTSGCTGCATCGCCÄCTACCGTAr(at1/<3^!lCTaTGCAG'!TSTGGTTrGtCTaCCGTS 31 -T 3CAT C GAC GTAGG GG TBAT 3 GC ATACT A»£ JIIGAC AC 3TC AA CA C CA A A C AGA TGGC Ar nukleázy Sekvence DNA ► Pořadí nukleotidů ve směru 5' 3' uloženo pro budoucí generace jako dlouhý řetězec symbolů A, C, G a T ► Dobrá zpráva pro budoucnost bioinformatiků: zatím je osekvenováno jenom asi 1000 organizmů, data budou přibývat ► Polymorfizmus: Rozdíl mezi jedinci Horno sapiens sapiens 1/1000 bazí ► Personál Genomics Project (PGP) Sekvence DNA ► Sekvenace se dělá ve dvou fázích ► Za použití DNA polymerázy a směsi normálních a modifikovaných deoxyribonukleotidů se syntetizují vlákna DNA (imitace replikace), templátem je sekvenovaná molekula DNA ► Produkty polymerizace se v automatických strojích chromatograficky dělí podle velikosti a vypovídají o sekvenci ► Jedna reakce podá informaci o 500-1000 bazích Dideoxynukleotid neumožňuje navázání dlaších nukleotidů —C5' Q Thymine H H Dideoxythymidine triphosphate (ddTTP) < □ ► <9 MlMl) -lili •OO.O Polymeráza se zastaví při použití ddNTP DU* Po íss ivhíí th» Uaurlsis Urtíid snů1 sřnthusiřft a n*w f »:ond sírami Iv r i.-f i. a 51 - TflceceeKtflcsoTimiifceňcccuTFirjtnMCCofllSw * }■ - BTtCfrtBTTiSEcaTBrflnr.cTsrciifiiiTfisfiTfiiirTňiSriiffiírfiii IF SXt* ttw T nucksptklw aroactually ídfiSffiíLlheowcN strand wilItpmiliwiUi i' ■ ■ ThCeCGGIHACGGTHTGlTCGfltmrffllinflCítfrit- J' - ■ TflcecsoTOflCEOTBTSTTceflcte nifl uč r» 5 1 ■ T HCECBbTnRCGOTftTbT T IľSi ň ■ ■ TťiĽeŕGtirtfiCsiiKUtíiciifiĽĽti- ■ TflC6CS0TflflCĚ6I0T8TT* í' ■ ■ Tfiiľf.rr.j;infii:sf iiiííT. &' ■ ■ T111: 1! i ■ i:" li 11 i! '■■ :i í :l ľ* 111ĽUĽU4>: IIHťEilJ 1- .........■: - Výsledek automatického sekvenování Výsledek automatického sekvenování Sekvenace hybridizací je založena na vázání se DNA na destičku s různými oligonukleotidy Přechod DNA pórem v membráně nitridu silikonu generuje elektrický signál, který by mohl umožnit sekvenování Historie sekvenace genomů 1975 bakteriofag MS2 1977 bakteriofag PhiX174 5,375 bp 1982 bakteriofag Lambda 1984 HIV-1 1990 virus HCMV 230 Kbp 1995 H. influenzae 1,83 Mbp 1996 E. coli 4,60 Mbp 1996 S. cerevisiae 12,00 Mbp 1998 C. elegans 96 Mbp 2000 D. melanogaster 120 Mbp 2000 A. thaliana 130 Mbp 2001 H. sapiens 3 000 Mbp 2001 M. musculus 3 000 Mbp Microarray Cancer Cells Normal Cells "R*d FluortGCftnt" Tahiti "Green fluorescent" Tarsals Combine Targets Hybridize tö Microarray Microarray Techniky manipulující proteiny ► izolace z buněk ► elektroforéza (dělení podle velikosti) ► zjišiování aktivity ► štěpení peptidázami ► určování sekvence ► generování protilátek pro daný protein ► ELISA a podobné testy ► produkce rekombinantních proteinů (např lacZ, GFP) ► krystalizace a určování struktury ► hmotnostní spektrometrie SDS-PAGE (elektroforéza v polyakrylamidovém gelu) Pole na bázi proteinů i i JE_£_ Era ymř-5ubE I rn ts Biosenzory v proteinových čipech ELISA (enzyme-linked immunosorbent assay) Slovní pojmů molekulární biologie central dogma gene RNA genome ORF transcription DNA gene structure mRNA nucleotide promoter gene expression 375' intron microarray hybridization exon probe replication prokaryote EST DNA polymerase ATG translation vector GC content codon plasmid eukaryote protein sequence alignment TATA PCR enhancer mass spectrometry DNA sequence silencer signal transduction proteome antibody western blot restriction enzyme endonuclease phylogenetics Analýza sekvencí Outline Příloha For Further Reading x