IV107 Bioinformatika I -Přednáška 6 IV107 Bioinformatika I Přednáška 6 Katedra informačních technologií Masarykova Univerzita Brno Jaro 2011 príšte Jine analýzy Předchozí týden IV107 Bioinformatika I -Přednáška 6 Příště Jiné analýzy ► GenBank ► UniProt ► PDB ► Gene Ontology KEG G Pathways ► genomické a proteomické databáze Vizualizace proteinů IV107 Bioinformatika I -Přednáška 6 Příště Jiné analýzy ► QuickPDB (Java) & Co. ► Povray + pdb2pov (CSG language,C) ► PyMol (Python) PovRay raytracing - používá CSG constructive solid geometry IV107 Bioinformatika I -PrednáSka 6 Pří ste Jine analýzy sphere { < 0,0,0 >, 180 pigment {colorYellow } } cylinder { < 0,0, 0 >, < 150,200,300 >, 60 pigment { colorWhite } } camera{ location < 0.0,0.0,800.0 > direction < 0.0,0.0, -1.0 > } light.source{< 0,0,1000 > colorWhite} Analýza proteinové sekvence IV107 Bioinformatika I -Přednáška 6 Příště Jiné analýzy ► strukturní *■ predikce domén - predikce sekundární struktury *■ predikce a modelování 3D ►• homolognf ►• "threadingVfbld recognition" (navlékánf) ►• z fragmentů ►• ab initio ► funkční (anotace) - přenos funkce sekvenční podobností (BLAST + GO) - podle příslušnosti k rodině proteinů - podle obsahu motivů (PRINTS—BLOCKS + GO) IV107 Bioinformátiká i -Prednáská 6 0 01 masaqsfynqssvlkinvmvvdddhvfldimsrmlqhskyrdpsvmeiaviav 061 stlkiqrdnidliitdyympgmnglqlkkqitqefgnlpvlvmssdtnkeees 121 fipkpihptdltkiyqfalsnkrngkstlsteqnhkdadvsvpqqitlvpeqa 181 kncsfksdsrtvnstngscvstdgsrknrkrkpnggpsddgesmsqpakkkki 2 41 dlflqairhigldkavpkkilafmsvpyltrenvashlqkyriflrrvaeqgl 3 01 gidsmfrqthikepyfnyytpstswydtrlnnrsfyskpvhgfgqskllsttr 3 61 mpynymnrsstyephrigsgsnltlpiqsnlsfpnqpsqneerrsffeppvma 421 qvlgfgqlgpsaisghnfnnnmtsrygslipsqpgpshfsygmqsflnnenvt 4 81 nattqpnldelpqlenlnlyndfgntselpynisnfqfddnkhqqgeadptkf 541 stelnheddgdwtfvninqgqsngetsntiaspetntpilninhnqnqgqdvp 6 01 ldpqelvdddfmnslfnndmn Príste Jine ánálýzy Metody predikce domén IV107 Bioinformatika I -Přednáška 6 Příště Jiné analýzy ► vyskytují se ve mnoha proteinech (BLAST) ► kostra mezi doménami je flexibilní ► vlastnosti aminokyselin se liší podle pozici vůči prostředí ► motivy v rámci jedné domény spolu souvisí Identifikace domén na základě podobnosti (BLAST) IV107 Bioinformatika I -PřednáSka 6 priste Jiné analýzy Identifikace domén na základě podobnosti (BLAST + CDD) IV107 Bioinformatika I -PřednáSka 6 priste Jiné analýzy http://www.ncbi.nlm.nih.gov/Structure/cdd/cdd.shtml Identifikace domén na zaklade podobnosti (BLAST + PFAM) IV107 Bioinformatika I -PřednaSka 6 priste Jine analýzy IV1O7 Bioinformatika I -Přednaška Q http://pfam.šanger.ac.uk/ n [ Frekvence aminokyselin na rozhraní domen IV107 Bioinformatika i -PŕednaSka 6 PŕíSte Jine analýzy Tahle I. Linket propťinuiiea All ]-linker 2-linkíT 3-linker Small Medium HcIh:jI Nun-hdicül Pro 1.259 1.3.G2 1.2S6 1.332 1.241 1.314 1.309' 0.0 1.316 Arg 1.143 1.129 1.137 1.069 1.131 1.132 1.18í Ü39 103 e PhE Leu U19 1.1Z2 I.0&S 1.11 1.11 0.381 1.368 1:121 1 05S 1.09 í.Í51 1l 1,193 1.192 1.106 0.9 9 4 1.276 0.885 Ota 1.051 1.054 1,139 0.992 0.736 1,0531 1.115 1.199 0.9 Gin 1.047 ..h. 0,91fl 1 3.111 0.861 0.9919 1.2 1.124 0.968 Mel 1.032 ojea 1.077 0.998 1.369 1.093 0.7621 1.171 0.878 Thr 1.017 1.023 1,018 0.982 0.968 1 11 0-B32 1,1.8? His 1.014 0.949 1,034 0.973 1.054 n.99? 1.012 1.05 Tyr ] 0.902 i ASI 0.836 1.09 0.866 1,075 0.945 Ala 0.964 0.974 0.938 1.042 1.065 0. S 9 0.892 uns 0.643 Vil 0.955 0.923 0.959 1.001 0.957 0.9 o.9oa Ser 0.947 0.932 0.956 0,984 1 G97 0.911 0.986 O.BBE 1 003 Asn 0.944 0.988 itÉca 0.828 0.762 0.373 0.927 0556 LJS 0.944 0.94S 0,052 0.979 0.476 1.003 0.944 1*08 0.893 lie 0.922 0-928 0,986 O.B52 1.189 055 0.817 0S12 0.946 Asp 0.91í 0.892 0.857 0.97 0.836 0.915 0.325 0519 0.906 Srp 0.895 0.879 0*71 056 1*17 0,839 C.B41 Q «61 0.852 Oly 0.835 0.846 0.862 0.743 11)22 0.785 0*17 Q4BB 3.97i CyS 0.778 0,972 0,6356 0.5 1.015 0.644 1,035 0662 0 896 Pŕevzato z George and Heringa (2002) DSSP je standardem přirazení sekundární struktury proteinům v PDB ► helix ► strand ► loop ► coil H alpha helix G 3-helix(3/10 helix) I 5 helix (pi helix) residue in isolated beta-bridge E extended strand, participates in beta ladder T turn (hydrogen bonded) S bend (curvature only) C coil Pfirazeni sekundarni struktury rodine proteinu z PDB IV107 Bioinformatika I -PrednaSka 6 PriSte Jine analyzy HSKVILVGD GAVGSSYAFAMVLHGI AQEIGIVDI GARVVV1GA GFVGASYVFALMN&GI ADHIVLIDA RCKITVVGV GDVGMACAISILLKGL ADELALVDA YNKITVVGV GAVGHACA1S1LHKBL ADEVALVDV DNKITVVGV GQVGMACA1SILGKSL TDELALVDV PIRVLVTGAAGQ1AYSLLYS1GNGSVFGKDGP1ILVLLDI CCCBBBCCC CCBBBBBCC CCBBBBBCC CCBBBBBCC CCBBBBBCC CCCBBBCCC CHHHHHHHHHHHHHCC CHHHHHHHHHHHCCCC CHHHHHHHHHHHCCCC CHHHHHHHHHHHHCCC CHHHHHHHHHHHCCCC CHHHHHHHHHHHHHCC CCCBBBCCC CCBBBBBCC CCBBBBBCC CCBBBBBCC CCBBBBBCC C C CBBBC C C multiple alignment DSSP assignment CCBBBBBCCCCHHHHHHHHHHHCCCCCCCCCCBBBBBBCC CCCBBBCCCCCHHHHHHHHHHHCCCCCCCCCCCBBBBCCC minimum consensus CBBBBBBCCCCHHHHHHHHHHHHHCCCCCCCCBBBBBBCC maximum consensus n [ - * SI* -OQ.O Pouzzití metody Chou-Fasman, 1978 IV107 Bioinformatika I -Přednaška 6 Příšte Jine analýzy i.i- 1 tB » M Í8 56 6B vsř&v* is pij* vl PDflBLí EB lEiVTAřCřřSPLřrrBiřřSTTaTPSTflPTa psvpoppp Metoda zaloZena na zastoupení aminokyselin v jednotlivých typech sekundarní struktury Blízké a vzdálené interakce IV107 Bioinformatika I -Přednáška 6 Predikce sekundární struktury neuronovými sítemi IV107 Bioinformátiká I -PřednáSká 6 príste Jine ánálýzy Predikce sekundární struktury různými nástroji IV107 Bioinformátiká I -PřednáSká 6 príste Jine ánálýzy n [ 93 Pokročilá predikce sekundární struktury IV107 Bioinformátiká I -PrednáSká 6 príste Jine ánálýzy □ O" - tl» -o^o Predikce zavisí od existenci homoiogů IV107 Bioinformatika i -Prednaska 6 Prste Jine anaiýzy homologní Je k dispozici struktura s podobností > 20 - 30% identity "threading" Protein je Členem rodiny se známými strukturami fragmentova Protein nese lokální strukturní podobnosti k mnoha proteinem se znamou strukturou ab initio Realisticke pro kratke sekvence Princip modeiovaní podie homoiogů IV107 Bioinformatika i -Prednaska 6 Určité posloupnosti aminokyselin mají vždy stejnou strukturu IV107 Bioinformatika I -Přednaska 6 Prísté Jiné analyžy □ SP - = -šl= O^O1 Ab initio modelovaní - hledaní globálního minima IV107 Bioinformatika i -PŕednaSka 6 □ g - = -š| = -O^O Modeiovaní smycek IV107 Bioinformatika i -Prednaska 6 CATH - Class, Architecture, Topology, Homology IV107 Bioinformatika I -Prednaska 6 PriSte Jine analyzy Charakterizace sady genů pomocí GO IV107 Bioinformatika I -PrednaSka 6 Přiste IV107 Bioinformatika I -Prednaska 6 Priste Jine analýzy Daisítyden: Jine analyzy □ fit ~ » i|-s -OQ^O Outline IV107 Bioinformatika I -Přednáška 6 Dodatek For Further Reading Dodatek For Further Reading IV107 Bioinformatika I -Prednaska 6 Dodatek For Further Reading X