PB051 Výpočetní metody v bioinformatice a systémové biologii - Týden 1 PB051 Výpočetní metody v bioinformatice a systémové biologii Týden 1 Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeči Katedra informačních technologií Masarykova Univerzita Brno Jaro 2015 Tento projekt je spofufinanrován rvropskýin sociálním fondem a státním rozpočtem 'eskŕ repu M ky. INVESTICE DO ROZVOJE VZDĚLÁVÁNI Outline PB051 Výpočetní metody v bioinformatice a systémové biologii - Týden 1 Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče PB051 Výpočetní metody v bioinformatice a systémové biologii - Týden 1 Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče ► Dr. Matěj Lexa, C506 (lexa@fi.muni.cz) ► Kurz: Út 12:00-13:50 (B117) ► Konzultace: Čt 13:00-15:00 (C506) ► http://www.fí.muni.czriexa/teaching.html Kontaktní údaje PB051 Výpočetní metody v bioinformatice a systémové biologii - Týden 1 Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče ► Dr. David Šafránek, A408 (xsafran1@fi.muni.cz) Klasifikace PB051 Výpočetní metody v bioinformatice a systémové biologii - Týden 1 Informace o kurzu Struktura genomu Dynamika genomu Genomové data pr< ► Hodnotí se Úkoly 4x5 bodů Semestrální úkol 30 bodů Zkouška 50 bodů ► Klasifikační stupnice A 91 -100 >• B 81 -90 ► C 71 -80 ► D 61 - 70 ► E 51 -60 F méně než 51 ► Genomové anotace ► Výpočty nad sekvencemi, konsenzus, repetice, mapování ► Aplikace Markovovských modelů v bioinformatice ► Statická analýza sítí ► Dynamická analýza sítí Analýza dat v genomovém kontextu PB051 Výpočetní metody v bioinformatice a systémové biologii - Týden 1 Informace o kurzu Struktura genomu Dynamika genomu Genomové data pr< ► Prohlížeče genomů (UCSC, Ensembl, Argo, GBrowse) ► Pokročilé funkce UCSC Genome Browser a Table Browser ► Programovatelný přístup ke genomu přes rozhraní Biomart z prostredi R/Bioconductor ► Bioinformatika genové regulace (TRANSFAC, Matlnspector)) Výpočty nad sekvencemi, konsenzus, repetice, mapování PB051 Výpočetní metody v bioinformatice a systémové biologii - Týden 1 Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče ► Mnohočetné zarovnání a konsenzuální sekvence Diagra "dot ploť'a tandemové repetice ► Mapování sekvencí (BLAST, Bowtie-2) Aplikace Markovovských modelů v bioinformatice PB051 Výpočetní metody v bioinformatice a systémové biologii - Týden 1 Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče ► Markovovy řetězce ► Markovovy řetězce proměnného řádu ► Skryté Markovovské modely (HMM) HMM profily ► HMM pro identifikaci genů Náplň předmětu - část systémová biologie PB051 Výpočetní metody v bioinformatice a systémové biologii - Týden 1 Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče ► metody a nástroje statické analýzy a integrace dat integrace dat rekonstrukce sítě genových interakcí z experimentálních dat analýza interakční sítě jako obecného grafu Metody a nástroje statické analýzy PB051 Výpočetní metody v bioinformatice a systémové biologii - Týden 1 Informace o kurzu Struktura genomu Dynamika genomu f r , , Genomové data pr< ► statická analýza síti a integrace dat nástroje: Cytoscape s několika moduly ► rekonstrukce genových regulačních sítí z microarray dat nástroje: GeneNetworks, GinSim ► dynamická analýza pravděpodobnostních modelů genových sítí nástroje: Dizzy ► metabolické sítě a jejich analýza - nástroje: KEGG, metacyc, COPASI Outline PB051 Výpočetní metody v bioinformatice a systémové biologii - Týden 1 Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče Biologie genomu PB051 Výpočetní metody v bioinformatice a systémové biologii - Týden 1 Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče Biologie genomu PB051 Výpočetní metody v bioinformatice a systémové biologii - Týden 1 Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče .......Iji-j Biologie genomu PB051 Výpočetní metody v bioinformatice a systémové biologii - Týden 1 Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče i Human Görfcnn* "1 { 310CMfr j Genes and Gene Related- Sequeno« 12iJLiWb Biologie genomu PB051 Výpočetní metody v bioinformatice a systémové biologii - Týden 1 Genome compacting PB051 Výpočetní metody v bioinformatice a systémové biologii - Týden 1 Condensed section of chromosome Eukaryotic transcription PB051 Výpočetní metody v bioinformatice a systémové biologii - Týden 1 general transcription RNA polymerase II 9ene gene regulatory proteins factors f regulatory proteins - gene X-, i gene X Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeči Selected organizational characteristics of genomes PB051 Výpočetní metody v bioinformatice a systémové biologii - Týden 1 Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče ► by topology modular hierarchical discrete, but elements sometimes fuzzy ► by end-product >• DNA (structure) ► RNA (tRNA, ncRNA, rRNA, siRNA...) protein complexes and particles (membrane sensor, flagellum, viral particle) Struktura genomu PB051 Výpočetní metody v bioinformatice a systémové biologii - Týden 1 ► Geny proteiny (kódující, exon, intron) >• RNA ► Regulační sekvence promotory enhancery jiné ► Repetitivní sekvence mikrosatelity (STR) ► minisatelity (VNTR) satelity DNA transpozony, helitrony retrotranspozony (LINE, SINE, LTR) ► Cizí sekvence viry endo(retro)viry ► Oblasti (ne)podobnosti (homology) ► SNP delší strukturní variace Genomické ostrovy Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeči Outline PB051 Výpočetní metody v bioinformatice a systémové biologii - Týden 1 Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče Genome changes (in sequence or number) PB051 Výpočetní metody v bioinformatice a systémové biologii - Týden 1 ► topology unchanged SNPs (point mutations) tandem repeat expansion/contraction ► 1-point translocation chromosome breakage chromosome fusion ► 2-point translocation deletions, conversions and exchanges (recombination effects) cut-paste (DNA transposon) copy-paste (retrotransposons) roling-circle (helitrons) ► 2-point translocation ► DNA methylation Histone methylation/acetylation Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeči Genome module changes PB051 Výpočetní metody v bioinformatice a systémové biologii - Týden 1 Informace o kurzu Struktura genomu Dynamika genomu Genomové data pr< ► at DNA level exonization exon shuffling gene migration genome duplication ► at RNA level alternative splicing transcriptional fusion ► at protein level translational fusion Mutations PB051 Výpočetní metody v bioinformatice a systémové biologii - Týden 1 □ NA (coding strand] ^ 1 Transcription ; mRNA ugÖIaIguuuggIcIuBW Translation | | J ^ | Amino acid sequence ^— Lys — phg- 2> g» 4* * 1 '2*3*4 *e *e *7 Js *0 V> *1Vs%*s *e V *3 *0 *10 tnitiatiori Dissociation 1 234&S789 10 Renybridizolion Dftcrta** rn repeat length 1 2t 3 4t '1 '2 '3 '4 '5 'e *7 '0 0 '0 '1 '2 "3 "4 "s 'e '7 'e *ö '10 12 3 4 Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče J 5 6 7 8 0 10 11 1 234667BÖ10 The new strand b a different length to the template 4 5 6 7 8 0 10 1 23466780 10 4 G 6 7 8 0 10 Chromosome breakage and repair PB051 Výpočetní metody v bioinformatice a systémové biologii - Týden 1 A. Breakage-and-reunion ol ■ radiation makes two breaks- (i) nort-ticmologouR end Joining homologous end Joining simple aberration radiation makes mo« than two breaks complete aberration B. Recombination a I misrepair (1 -hit) si homologous "repair" radiation makes a break C, Exchange theory radiation makes two lesions Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče Chiasma and crossinq-over durinq meiosis SSíSs^líS biologii-Týden 1 Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče Gene cross-over or conversion PB051 Výpočetní metody v bioinformatice a systémové biologii - Týden 1 Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče Gůj-iů ůonvar slůn Crossover Gene cross-over or conversion PB051 Výpočetní metody v bioinformatice a systémové biologii - Týden 1 DNAduplexespair Homologous strands are nicked 1111111 II 111111 Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče 3z Second nick; made in same strand Second nicks made in otherstrand Second strands Nicks are sealed J03:3 over betwsen duplexes, and nicks are sealed Genomes are not recombinant, but contain heleroduplexregion Reciprocal recombinant UMJMmmMAMA genomesare generated fTTTYTTTTTTYTTT Gene conversion in immunoglobulin PB051 Výpočetní metody v bioinformatice a systémové biologii - Týden 1 Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče Pseudogenes Exon shuffling PB051 Výpočetní metody v bioinformatice a systémové biologii - Týden 1 _______________________________________ \ Epidermal growth \ factor gene with multiple \ EGF exons (green] Exon _.■>*" shuffling --..... t---j i____r t ■ ■■ \ |:-.-.-:-| |-:-.-:-:| ^:-:.:-:-g \ 4 Fibroneetin gene with multiple 'finger" exons [orange] Exon duplication Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeči Plasm inogen gene with a "kringle" exon (blue) shuffling TPň gene as it exists today Alternative splicing PB051 Výpočetní metody v bioinformatice a systémové biologii - Týden 1 Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeči -Alternative Splicing - 'Jo i N-a u y.i- i i ■ 23D5 flmnrican Assctía^an a\ hlfl urn logical Eurgean-s- Transposons PB051 Výpočetní metody v bioinformatice a systémové biologii - Týden 1 Transposons PB051 Výpočetní metody v bioinformatice a systémové biologii - Týden 1 CIsh I element Reverse crariitrtprion Cíass II Piempni. TIR Tiarij-posase TIR He lil ran ATC Single- ^ Transpose -. ■ ■ .-. I. ■: nick ^ 0 Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče Nature Reviewi | Gůnétíi! Transposase is the key protein in DNA transposons Q Transposase i V Transposase binds Nv the ends of Ac \. and Ds elements. \ / teg ration into new target site PB051 Výpočetní metody v bioinformatice a systémové biologii - Týden 1 Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče Transposons shape genomes of maize varieties c&l !!?/>':>? ilk HolA Hem 1 rp!35A ňyprol zfíf B73 (73 Kb) VLJi rp!35A A188 (S5 hb) ■■At CML253 (66 Kbi tiCGQSB rpl35A hyprol r077f wtac7077¥? uce2 ■. rpf35A tec$Q$$ 7r,4 - tac7077^ ucr2 I137TN (121 kb) *n>/f-bprthypn,<**i(dň* •liXJ rpf3&^^ypraffqj*?\ znf^f^rtac7Q77 ^ uce2 NalTal (79 ih> Coroico [1S9 *>b) tacSOSS y/J^y^Évpr^pB? w^W'^F' tac7077^ uce2 n PB051 Výpočetní metody v bioinformatice a systémové biologii - Týden 1 Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče Transposons shape phenotypes of maize Z^šfí^z ■ ■ ■ J ■ biologii - Týden 1 kernels Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče Transposons shape phenotypes of qrape Z^Sfl^z I II ■» I +J I biologii - Týden 1 varieties Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče Ruby Okuyama Natu« Reviews | Genetics Získávání experimentálních dat o genomu PB051 Výpočetní metody v bioinformatice a systémové biologii - Týden 1 ► organizace (konfokální a elektronová mikroskopie) ► sekvenace ► mapování metylace, nukleozomů ► měření transkripce (RNA-Seq, DNA čipy) ► identifikace regulačních sekvencí (Chip-Seq) ► funkce genů - podrobný výzkum Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče In silico anotace sekvence genomu PB051 Výpočetní metody v bioinformatice a systémové biologii - Týden 1 Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče ► predikce genů (např. GeneMark) ► homologie (zjišťování podobnosti sekvencí) (BLAT, MUMMER, BLAST) ► identifikace opakování (např. RepeatMasker, LTR Finder) Outline PB051 Výpočetní metody v bioinformatice a systémové biologii - Týden 1 Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče UCSC Genome Browser PB051 Výpočetní metody v bioinformatice a systémové biologii - Týden 1 Location Edit View Bookmarks Tools Settings Help O OO O " | J id=73350821£(knownGene=fullH [|QL V Human chr5:70,256,524-70,20.. y Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeči Home Genomes Blat Tables Gene Sorter PCR DNA Convert PDF/PS Help UCSC Genome Browser on Human Mar. 2006 Assembly move I | " R1 =» | " P"" I zoom in [ la<] 3« | 10k | base | z00m out | 1.5k |1>T| position/search |chr5:70,256,524-70,2B4,592 | jump | dear a|ze 28,069 bp | configure chr-5: FIKÍ38833 SMF13 UCSC Known Genes 762791-Wl 78£,;;J"3ijl»i Based on UniProt, ReFSea. and -----------^.^^^^jj.^-.j] 762866661 Spliced ESTs Conservat ion 1 L ■ ± lik HucBaFplFfrRNfls From GenBank n ESTs That Have Been Sol iced iTnliii Ml^lll 11=11 ■•i- ■ ■ ■ ■ ■ ■ ■ -li 11 7 Species;. Jil.L IdJ 1 m 1 M j-«-M==*=BH-m http://genome.ucsc.edu/cgi-bin/hgc?hgsid=733...523Eir=70284592&db=hgl86ipiK=620 Ensembl Genome Browser PB051 Výpočetní metody v bioinformatice a systémové biologii - Týden 1 -Meiged Krmun Protein coding Vega Hj-.ara PLitatue FracssfAl iionc-iir-i Ivega Havana Krwn Protein coding RNAPäeudogsne[Ni BEST gene Haiiana Known Protei needing Vega Havana Processed pseudogene Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeči D « — PB051 Výpočetní metody v [j lOWSG bioinformatice a systémové biologii - Týden 1 GBrowse view of the Pto DC3000 region near PSPTO_1375 Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeči PSPT0_1371 fill proteins uith links to NCBI type III effector- HopNl tiipe III helper- pi type III effector protei Putative orthaloes Putative orthologs Putative orthologs Putative orthologs in Pseudononas aeruginosa PH14 in Pseudononas fluorescens Př-5 in Pseudononas putida KT244B Putative orthologs in Pse P;ijr_llB7 PJP?H..1K;> type III chaperon P5PPH_1268 PB051 Výpočetní metody v bioinformatice a systémové biologii - Týden 1 DecodeMe Browser PB051 Výpočetní metody v bioinformatice a systémové biologii - Týden 1 Golden Helix Genome Browser PB051 Výpočetní metody v bioinformatice a systémové biologii - Týden 1 Ptol of Column CortfTfwid -foglO P from Assudatton Test* ftddfolve ModeLJ f3121 T3ÖB F*s Wen Hřto UiůhCíňlrdLrlirfMí a Cůrt^refH-uigwp^ífcjt Eto COrr^rtnJ -bgjŮPzchr ß £ Corr/Treirf *glOP;th' „ 0: It twr/Trend -bgw pt chr .. ß ÍĚ íWTi-enJ -íjgKl P: dv . mu CHABÉ M Cjrtrt řtatory User Anrofflbůra SH*_A-i2W9W CBi.Trmd JoglU P: d» - S: a.SOOOEB PoPTBfi: oVĚSSÉÍO-tS* UCEC - friymbl -NCBI -Hajt-Vo 5 s 7 s io li u is it 15 i61? le 7 • 6 - S 4 - Corr/Trend -LoglO P-value ■ Corr/Trend-kqilPjdY *i ■ CwtjTtokI-boiOPidír »i o CBTyTrend-fe^iaP:dK - J * ton/Trend -toulOP: úw - t í*rfl:i8,z&^M chrB:w.fl&íini chreisi.tziBM III»! I II ■ 1 II IIIIII : IHIM BlilllllKIIIIII IIIIII.IIIIIII Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeči IGB PB051 Výpočetní metody v bioinformatice a systémové biologii - Týden 1 |/™\| Q PB051 Výpočetní metody v J | [j I O WS w I bioinformatice a systémové biologii - Týden 1 ;scaffold_1:1-100000 A|>|>ly Size: 100000 Fe.iluie: JAM UserModels:522 1.5* 3* «* AA Fit Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče DHfl I ,:,• Fr hÍ I w h h h ii« mi iii-«iu'iíe r'"":ffls um: i CSUSM.unigeres Blat ► Jan 30 17:18:22|20ň9r 75»; maiiiially eijratfct > h iH IIHI1IP i I^Vt im Hi !!► V H HM~ IIHHII1' II 'ii 1191 ■I* ■ RIKEN Genome Browser SSESS biologii - Týden 1 d) <3> s ■ (gtij.-.-" Li ,:t-i ilrLc 'i" i0UiKaíEriti-itJVmík-h ■ Bui...:* ma qihf .- ) aailSMi-flilJW« ÍTOSi|FW^[lntf4M[ll0ÍlŮř^rW'SPTFlfUeilŮ=JiJ3lJpLlSFeM,n; ^ iii^*r«(r(iMi PS .-Vi'Pjin—irfiinriir rtiiiiT" t- wu> i, RKmli mi Hnuu«Hi ■a_ "'0 ■ _ m Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeči ® ® ®