IV107 Bioinformatika I Přednáška 8 Získávání expresních dat Uplatnění v medicíně Analýza expresních dat Příklad použití microarray dat v klasifikaci nádorů Příště Štěpení protein ů a hmotnostní spektra IV107 Bioinformatika I Přednáška 8 Katedra informačních technologií Masarykova Univerzita Brno Jaro 2008 IV107 Bioinformatika I Přednáška 8 Získávání expresních dat Uplatnění v medicíně Analýza expresních dat Příklad použití microarray dat v klasifikaci nádorů Příště Štěpení protein ů a hmotnostní spektra Předchozí týden Alternativní struktury DNA křížová triplex tetraplex Tandemová a jiná opakování (Xlandscape) Interakce DNA/protein (TRANSFAC, TESS) Egr-1 early growth response 1 (induces apoptosis, consensus WTGCGTGGGCGK) GATATACGG Msx-1 (aka Hox-7; muscle segment homeobox-like 1; CNGTAWNTG) Interakce protein/protein (DIP, PIP) Fylogenetické stromy (program PHYLIP) Matice párových vzdáleností UPGMA, NJ, max parsimony, ML format Newick A(B(D,E),C) IV107 Bioinformatika I Přednáška 8 Získávání expresních dat Uplatnění v medicíně Analýza expresních dat Příklad použití microarray dat v klasifikaci nádorů Příště Štěpení protein ů a hmotnostní spektra Cesta k údajům o expresi IV107 Bioinformatika I Přednáška 8 Získávání expresních dat Uplatnění v medicíně Analýza expresních dat Příklad použití microarray dat v klasifikaci nádorů Příště Štěpení protein ů a hmotnostní spektra IV107 Bioinformatika I Přednáška 8 Získávání expresních dat Uplatnění v medicíně Analýza expresních dat Příklad použití microarray dat v klasifikaci nádorů Příště Štěpení protein ů a hmotnostní spektra IV107 Bioinformatika I Přednáška 8 Získávání expresních dat Uplatnění v medicíně Analýza expresních dat Příklad použití microarray dat v klasifikaci nádorů Příště Štěpení protein ů a hmotnostní spektra Nasnímaný obraz z DNA čipu vypovídá o přítomnosti DNA určité sekvence ve vzorku IV107 Bioinformatika I Přednáška 8 Získávání expresních dat Uplatnění v medicíně Analýza expresních dat Příklad použití microarray dat v klasifikaci nádorů Příště Štěpení protein ů a hmotnostní spektra IV107 Bioinformatika I Přednáška 8 Získávání expresních dat Uplatnění v medicíně Analýza expresních dat Příklad použití microarray dat v klasifikaci nádorů Příště Štěpení protein ů a hmotnostní spektra Uplatnění v medicíně Rakovina nekontrolované dělení buněk v důsledku mutace (onkogeny, supresory nádorů). Měření genové exprese nachází uplatnění v diagnostice rakoviny. o jaký druh rakoviny se jedná ? jaká je prognóza pro danou diagnózu ? IV107 Bioinformatika I Přednáška 8 Získávání expresních dat Uplatnění v medicíně Analýza expresních dat Příklad použití microarray dat v klasifikaci nádorů Příště Štěpení protein ů a hmotnostní spektra Rakovina krvi nebo kostní dřeně leukemie Myelogenní, lymfocytická, akutní, chronická ? Acute Myelogenous Leukemia (AML) Acute Lymphocytic Leukemia (ALL) Není produkováno dostatečné množství krvinek Anemie slabost, infekce, snížená sráženlivost krve AML: 10,000 případů ročně ALL: 3,500 dospělí / 2,400 novorozenci AML nebo ALL ? IV107 Bioinformatika I Přednáška 8 Získávání expresních dat Uplatnění v medicíně Analýza expresních dat Příklad použití microarray dat v klasifikaci nádorů Příště Štěpení protein ů a hmotnostní spektra Diagnóza ve specializované laboratoři ALL: 58 AML: 14 Léčba: chemotherapie, transplantace kostní dřeně ALL: corticosteroidy, vincristin, methotrexat, L-asparaginasa AML: daunorubicin, cytarabin Správná diagnóza je velice důležitá pro nasazení správné léčby Microarray může podporovat rozhodování IV107 Bioinformatika I Přednáška 8 Získávání expresních dat Uplatnění v medicíně Analýza expresních dat Příklad použití microarray dat v klasifikaci nádorů Příště Štěpení protein ů a hmotnostní spektra Příklad sady genů, které korelují s prognózou IV107 Bioinformatika I Přednáška 8 Získávání expresních dat Uplatnění v medicíně Analýza expresních dat Příklad použití microarray dat v klasifikaci nádorů Příště Štěpení protein ů a hmotnostní spektra Analýza expresních dat měření s nízkým počtem opakování rozpoznávání obrazu převod na matici číselných hodnot normalizace statistika jednotlivých pozic a genů (průměrná hodnota, rozptyl, eliminace extrémních hodnot, atd.) kontrast: dvě sady experimentálních podmínek specifika: n >> p PCA, LDA, shluková analýza (clustering), strojové učení analýza v kontextu funkce (GO, KEGG) analýza v kontextu sekvence (blízké motivy a geny, zvlášť promotor) analýza časových a prostorových řad (koregulované geny) IV107 Bioinformatika I Přednáška 8 Získávání expresních dat Uplatnění v medicíně Analýza expresních dat Příklad použití microarray dat v klasifikaci nádorů Příště Štěpení protein ů a hmotnostní spektra Co je to expresní profil? IV107 Bioinformatika I Přednáška 8 Získávání expresních dat Uplatnění v medicíně Analýza expresních dat Příklad použití microarray dat v klasifikaci nádorů Příště Štěpení protein ů a hmotnostní spektra Jak zjišťujeme podobnost dvou expresních profilů či jejich schopnost klasifikovat vzorek? Expresní profil je chápán jako množina bodů v multidimenzionálním prostoru, popř. jako sada postupných výběrů z populace genů či zdroj informací o vzorku c.gene1 vektorový součin (cos uhlu, ktery zvírají) d(c,gene) euklidovská vzdálenost (postihuje i absolutní hodnoty exprese) corr(c,gene) korelace MI(c,gene) vzájemná informace IV107 Bioinformatika I Přednáška 8 Získávání expresních dat Uplatnění v medicíně Analýza expresních dat Příklad použití microarray dat v klasifikaci nádorů Příště Štěpení protein ů a hmotnostní spektra Problém smíšených dat IV107 Bioinformatika I Přednáška 8 Získávání expresních dat Uplatnění v medicíně Analýza expresních dat Příklad použití microarray dat v klasifikaci nádorů Příště Štěpení protein ů a hmotnostní spektra Multiclass cancer diagnosis using tumor gene expression signatures (Ramaswamy et al., 2001) V praxi se k diagnostice používá soubor klinických a histologických vyšetření. Je možné je nahradit molekulárním vyšetřením ? 218 nádorů a 90 zdravých tkání microarray (exprese genů) 5 000 000 zjištěných hodnot metody strojového učení (CLUSTER, SOM, SVM) klasifikace (OVA = one v. all) úspěšnost 78% IV107 Bioinformatika I Přednáška 8 Získávání expresních dat Uplatnění v medicíně Analýza expresních dat Příklad použití microarray dat v klasifikaci nádorů Příště Štěpení protein ů a hmotnostní spektra Třídy a metody pro klasifikaci IV107 Bioinformatika I Přednáška 8 Získávání expresních dat Uplatnění v medicíně Analýza expresních dat Příklad použití microarray dat v klasifikaci nádorů Příště Štěpení protein ů a hmotnostní spektra Hierarichické aglomerativí zhlukování IV107 Bioinformatika I Přednáška 8 Získávání expresních dat Uplatnění v medicíně Analýza expresních dat Příklad použití microarray dat v klasifikaci nádorů Příště Štěpení protein ů a hmotnostní spektra Jak funguje klasifikace do více tříd IV107 Bioinformatika I Přednáška 8 Získávání expresních dat Uplatnění v medicíně Analýza expresních dat Příklad použití microarray dat v klasifikaci nádorů Příště Štěpení protein ů a hmotnostní spektra Kvalita predikcí s různými stupni spolehlivosti IV107 Bioinformatika I Přednáška 8 Získávání expresních dat Uplatnění v medicíně Analýza expresních dat Příklad použití microarray dat v klasifikaci nádorů Příště Štěpení protein ů a hmotnostní spektra Počet genů potřebný k úspěšné klasifikaci IV107 Bioinformatika I Přednáška 8 Získávání expresních dat Uplatnění v medicíně Analýza expresních dat Příklad použití microarray dat v klasifikaci nádorů Příště Štěpení protein ů a hmotnostní spektra Spolehlivost klasifikace IV107 Bioinformatika I Přednáška 8 Získávání expresních dat Uplatnění v medicíně Analýza expresních dat Příklad použití microarray dat v klasifikaci nádorů Příště Štěpení protein ů a hmotnostní spektra Příště Štěpení proteinů a hmotnostní spektra IV107 Bioinformatika I Přednáška 8 Dodatek For Further Reading Outline Dodatek IV107 Bioinformatika I Přednáška 8 Dodatek For Further Reading For Further Reading X