Katedra informačních technologií Masarykova Univerzita Brno Jaro 2010 IV107 Bioinformatika I-Přednáška 8 IV107 Bioinformatika I Přednáška 8 i dat Uplatnění v medicíně Analýza expresních dat Příklad použití microarray dat v ádorů Příště ií proteinů a hmotnostní spektra □ rS1 M= -O^O Předchozí týden Alternativní struktury DNA «- křížová «- triplex - tetraplex Tandemová a jiná opakování (Xlandscape) Interakce DNA/protein (TRANSFAC, TESS) Egr-1 early growth response 1 (induces apoptosis, consensus WTGCGTGGGCGK) GATATACGG Msx-1 (aka Hox-7; muscle segment homeobox-like 1; CNGTAWNTG) Interakce protein/protein (DIP, PIP) Fylogenetické stromy (program PHYLIP) - Matice párových vzdáleností «• UPGMA, NJ, max parsimony, ML - format NewickA(B(D,E),C) IV107 Bioinformatika I-Pŕednáška 8 i dat Uplatnění v medicíně Analýza expresních dat Příklad použití microarray dat v ádorů Příště íí proteinů a hmotnostní spektra □ rS1 M= -O^O Cesta k údajům o expresi IV107 Bioinformatika I-Pŕednáška 8 Získávání expresních dat Uplatnění v medicíně Analýza expresních dat Příklad použití microarray dat v ádorů Příště ií proteinů a hmotnostní spektra □ ö :|= -O^O COMPARING THE ACTIVITY OF GENES IN TWO DIFFERENT YEAST CELLS Tub two DNAs are nixed and washed over the fixed DNA or the microarray. where thev stick to comp lem erilary sequences. mRNAfrom Active Genes DMAMicroarray □ ö IV107 Bioinformatika I-Pŕednáška 8 Získávání expresních dat Uplatnění v medicíně Analýza expresních dat Příklad použití microarray dat v ádorů Příště Štěpení proteinů a hmotnostní spektra :|= -O^O A scanner measures the fluorescence of each dye separately. The higher ratio of red to green fluorescence at the spot labeled Iff í, for instance, shows that the TEPl gene is expressed more highly in sporulatirrg than in budding yeast cells. □ ö IV107 Bioinformatika I-Pŕednáška 8 Získávání expresních dat Uplatnění v medicíně Analýza expresních dat Příklad použití microarray dat v sdorů Příště spektra -š = ^)Q,0 Nasnímaný obraz z DNA čipu vypovídá o přítomnosti DNA určité sekvence ve vzorku IV107 Bioinf or matika I -Přednáška 8 Získávání expresních dat Uplatnění v medicíně Analýza expresních dat Štěpení proteinií a hmotnostní Factory-made DNA chips such as this one are produced with, techniques normally lined in the semiconductor industry. IV107 Bioinformatika I-Pŕednáška 8 Získávání expresních dat Uplatnění v medicíně Analýza expresních dat Příklad použití microarray dat v sdorů Příště spektra □ g - _= = >T)(\(y Uplatnění v medicíně Rakovina nekontrolované dělení buněk v důsledku mutace (onkogeny, supresory nádorů). Měření genové exprese nachází uplatnění v diagnostice rakoviny. ► o jaký druh rakoviny se jedná ? ► jaká je prognóza pro danou diagnózu ? IV107 Bioinformatika I-Přednáška 8 Získáváni expresních dat Uplatnění v medicíně í proteinů a hmotnostní spektra □ g t\= -00,0 Rakovina krvi nebo kostní dřeně leukémie IV107 Bioinformatika I-Pŕednáška 8 í expresních dat Uplatnění v medicíně Příště Štěpení proteinů a hmotnostní spektra ► Myelogenní, lymfocytická, akutní, chronická ? ► Acute Myelogenous Leukemia (AML) Acute Lymphocytic Leukemia (ALL) ► Není produkováno dostatečné množství krvinek ► Anémie —>■ slabost, infekce, snížená sráženlivost krve ► AML: 10,000 případů ročně ► ALL: 3,500 dospělí / 2,400 novorozenci ► AML nebo ALL ? IV107 Bioinformatika I-Přednáška 8 Získávání expresních dat Uplatnění v medicíně Diagnóza ve specializované laboratoři - ALL: 58 AML: 14 Léčba: Chemotherapie, transplantace kostní dřeně «- ALL: corticosteroidy, vincristin, methotrexat, L-asparaginasa «- AML: daunorubicin, cytarabin Správná diagnóza je velice důležitá pro nasazení správné léčby Microarray může podporovat rozhodování í proteinů a hmotnostní spektra □ rS1 M= -O^O Príklad sady genů, které korelují s prognózou IV107 Bioinformatika I-Přednáška 8 Získávání expresních dat Uplatnění v medicíně Fatal I Retractor. i ■ ■ m n ■ 11 i ■ ■ m nul lni ■ i ■ u n ■■ i n ni i ■ i iiiiiiii iB i ii Milium i m ■■ n ■ nu ■ 11 ......in muni i nun t i n hihi h n I II IIIIIII IUI IUI II II II Ml III I III I II 111 II I I II II I II E 13 I I II I I II ii mi ■ n n ■ _ n i ■ n u mi inn mi ; n i mu i hi in mi i m ii ■■ ■ 1111 iiiiiii ■■ i ni n i u ■ ■ m ii í proteinů a hmotnostní spektra n^Tjfj'iňif!,i!fijuŕ(ik*? Sl>Tň tí isfrowi pratal IJqďiipťMřri :>(■:■.<■!. v -r. ;v.-, , l*NOHŕHQftl ! --y-■ i .'i ,\J i n M '■■■! RfÉípbl HľJI rf.ti'*:if ľ «.f i-i-l inou pa:n 11 PKJfl Prw*nhA*i* C-Wti-1 CWŕucinlft5wrjltin íiic'iVffíií",i;Mi::ii fto.WúdHt LJs:níC*rfl ■3a -fo -1(1 0 t Id i?? '3n □ ö :|= -O^O Analýza expresních dat měření s nízkým počtem opakování rozpoznávání obrazu převod na matici číselných hodnot normalizace statistika jednotlivých pozic a genů (průměrná hodnota, rozptyl, eliminace extrémních hodnot, atd.) kontrast: dvě sady experimentálních podmínek specifika: n >> p PCA, LDA, shluková analýza (clustering), strojové učení analýza v kontextu funkce (GO, KEGG) analýza v kontextu sekvence (blízké motivy a geny, zvlášť promotor) analýza časových a prostorových řad (koregulovane geny) IV107 Bioinformatika I-Přednáška 8 Získávání expresních dat Analýza expresních dat klasifikaci nádorů spektra □ rS1 M= -O^O Co je to expresní profil? Sample I Sample 2 .... Simple n í £ Expiessoii Profile ---------m- □ S1 IV107 Bioinformatika I-Pŕednáška 8 Získávání expresních dat Analýza expresních dat Štěpení proteinů a hmotnostní spektra :|= -O^O Jak zjištujeme podobnost dvou expresních profilů či jejich schopnost klasifikovat vzorek? AM. .'.L. lili C -(1,1,1,1.1,1,0,0,0.0.0,0) gw«, -