Katedra informačních technologií Masarykova Univerzita Brno Jaro 2009 IV107Bioinformatikal -Přednáška 8 IV107 Bioinformatika I Přednáška 8 i dat Uplatnění v medicíně Analýza expresních dat Příklad použití microarray dat v ádorú Příště oteinů a hmotnostní spektra □ rS1 M= -O^O Předchozí týden ► Alternativní struktury DNA «- křížová «- triplex - tetraplex Tandemová a jiná opakování (Xlandscape) ► Interakce DNA/protein (TRANSFAC, TESS) Egr-1 early growth response 1 (induces apoptosis, consensus WTGCGTGGGCGK) GATATACGG Msx-1 (aka Hox-7; muscle segment homeobox-like 1; CNGTAWNTG) ► Interakce protein/protein (DIP, PIP) ► Fylogenetické stromy (program PHYLIP) - Matice párových vzdáleností «• UPGMA, NJ, max parsimony, ML - format NewickA(B(D,E),C) IV107Bioinformatikal -Prednáška 8 i dat Uplatnění v medicíně Analýza expresních dat Príklad použití microarray dat v ádorú Příště oteinů a hmotnostní spektra □ rS1 M= -O Q* O- IV107 Bioinformatika I - Přednáška 8 Cesta k údajům o expresi _. *^VwAt ■ L Hb ^1 ■ ■ Získávání expresních dat Uplatnění v medicíně Analýza expresních dat Příklad použití microarray dat v ádorú Příště oteinů a hmotnostní spektra □ rS1 M= -O^O COMPARING THE ACTIVITY OF GENES IN TWO DIFFERENT YEAST CELLS The two DNAs are nixed and washed over the fixed DNA or the microarray. where they stick to comp lem erlary sequences. mRNAfrom Active Genes DMAMicroarray □ ö IV107Bioinformatikal -Přednáška 8 Získávání expresních dat Uplatnění v medicíně Analýza expresních dat Příklad použití microarray dat v ádorú Příště oteinů a hmotnostní spektra :|= -O^O A scanner measures the fluorescence of each dye separately. The higher ratio of red to green fluorescence at the spot labeled Iff í, for instance, shows that the TEPl gene is expressed more highly in sporulatirrg than in budding yeast cells. □ ö IV107Bioinformatikal -Přednáška 8 Získávání expresních dat Uplatnění v medicíně Analýza expresních dat Příklad použití microarray dat v sdorú Příště spektra -š = ^)Q,0 Nasnímaný obraz z DNA čipu vypovídá o přítomnosti DNA určité sekvence ve vzorku IV107 Bioinf or matika I -Přednáška 8 h dat Získávání expresi Uplatnění v medicíně Analýza expresních dat Štěpení protei □ rS Factory-made DNA chips such as this one are produced with, techniques normally lined in the semiconductor industry. IV107Bioinformatikal -Přednáška 8 Získávání expresních dat Uplatnění v medicíně Analýza expresních dat Příklad použití microarray dat v sdorú Příště spektra □ g - _= = >T)(\(y IV107 Bioinformatika I - Přednáška 8 Získávání expresních dat Uplatnění v medicíně Uplatnění v medicíně Rakovina nekontrolované dělení buněk v důsledku mutace (onkogeny, supresory nádorů). Měření genové exprese nachází uplatnění v diagnostice rakoviny. ► o jaký druh rakoviny se jedná ? ► jaká je prognóza pro danou diagnózu ? spektra □ rS1 M= -O^O IV107 Bioinformatika I - Přednáška 8 Získávání expresních dat Uplatnění v medicíně PříklaapuuZ,L.....eroarray dat v Rakovina krvi nebo kostní drene leukémie Příště ► Myelogenní, lymfocytická, akutní, chronická ? ► Acute Myelogenous Leukemia (AML) Acute Lymphocytic Leukemia (ALL) ► Není produkováno dostatečné množství krvinek ► Anémie —>■ slabost, infekce, snížená sráženlivost krve ► AML: 10,000 případů ročně ► ALL: 3,500 dospělí / 2,400 novorozenci ► AML nebo ALL ? □ o - _= = >T)(\(y IV107 Bioinformatika I - Přednáška 8 Získávání expresních dat Uplatnění v medicíně Diagnóza ve specializované laboratoři - ALL: 58 AML: 14 Léčba: Chemotherapie, transplantace kostní dřeně «- ALL: corticosteroidy, vincristin, methotrexat, L-asparaginasa «- AML: daunorubicin, cytarabin Správná diagnóza je velice důležitá pro nasazení správné léčby Microarray může podporovat rozhodování spektra □ rS1 M= -O^O Príklad sady genů, které korelují s prognózou Ä Fatal I Relracton i ■ ■ hi ■■ ■ 11 ■ ■ ■ m »nl ■•■■ ■ i ■ u n ■■ i n m i ■ i iiniiH nm ■■■líniu i ■■■ ■■ ii i mi ■ 11 ■ ■ ■ ■ inn linuli i nun t i ii nun n n .....■«■■■ ■' '■ ■■■■ ■■ m n. m m i m n m n ■ i D ID ■ I II i ii mi ■ n n i ■ n u mi 11111 mi i n i mu i in ii i m ii ■■ ■ 1111 mim n i hi n i n i i m i i IV107Bioinformatikal Prednáška 8 i dat Uplatnění v medicíně nózou Príklad Pulbil.....CI u0i , ay dat V ádorú Příště Štěpení proteinů a hmotnostní MAl UúdHi spektra Ji:HjlÍ*rfl Dvihli JttciodUWkin 2 H 3UTň■'. =.-<■ ;■-."pratal M ĹfctfMpäifeld Sľ Prctair kŕju# £ ultima 5? WNŮHrNOtl jH ! •-•y-■ i .'i ,\J i ~\ u EĎ •tf-'i-r. 5J Hill M fransd« ľ ».ŕi-ľl ■iiiy-i pa:n 11 i>H PQHB N WSMtitOŮ M F (■■■, 1 ■ Y, í. 1 i l) ■ 5fl C^fíwlDl^!wrílíin ft .■rnc'iVľfu^n;;i-h4ľV:i^ u tip i?p Jin □ rS1 :|= -O^O Analýza expresních dat ► měření s nízkým počtem opakování ► rozpoznávání obrazu převod na matici číselných hodnot ► normalizace ► statistika jednotlivých pozic a genů (průměrná hodnota, rozptyl, eliminace extrémních hodnot, atd.) kontrast: dvě sady experimentálních podmínek ► specifika: n >> p ► PCA, LDA, shluková analýza (clustering), strojové učení ► analýza v kontextu funkce (GO, KEGG) ► analýza v kontextu sekvence (blízké motivy a geny, zvlášť promotor) ► analýza časových a prostorových řad (koregulovane geny) IV107Bioinformatikal -Přednáška 8 Získávání expresních dat Analýza expresních dat klasifikaci nádorů spektra □ rS1 M= -O^O Co je to expresní profil? Sample 1 Sample 2 Geiie 1 Gene 1 • Expression Piofik — ------»- One |! IV107Bioinformatikal -Přednáška 8 San plen Získávání expresních dat Analýza expresních dat klasifikaci nádorů spektra □ rS1 - M= -O^O Jak zjišťujeme podobnost dvou expresních profilů či jejich schopnost klasifikovat vzorek? ALL C -(1,1,1,1.1,1,0,0,0,0,0,0) I j 9«ne, •tei.tí,ti......til IV107Bioinformatikal -Prednáška 8 Získávání expresních dat Analýza expresních dat klasifikaci nádorů spektra Expresní profil je chápán jako množina bodů v multidimenzionálním prostoru, popř. jako sada postupných výběrů z populace genů či zdroj informací o vzorku c.genel vektorový součin (cos uhlu, který zvírají) d(c,gene) euklidovská vzdálenost (postihuje i absolutní hodnoty exprese) corr(c,gene) korelace Ml(c,gene) vzájemná informace □ g t\= -00,0 Problém smíšených dat r \ <\ IVWBioinformatikal -Přednáška 8 Získávání expresních dat Uplatnění v medicíně Analýza expresních dat Štěpení protei □ S1 IV107 Bioinformatika I - Přednáška 8