Výpočetní metody v bioinformatice a systémové biologii

Týden 10 - Analýza expresních profilů

Rozbalte a spustťe nástroj STEM.

Načtěte expresní data z výše uvedeného souboru.

Proveďte clustering pomocí metody K-means a analyzujte výsledky.

Proveďte clustering dle interního algoritmu STEM a analyzujte získané rozdělení profilů a genů do klastrů.

Vytvořte množinu všech genů (gene set) relevantních flagelárnímu modulu a nechte si vypočítat její statistický význam v získaném rozdělení.

Stáhněte nástroj TreeView z výše uvedeného odkazu a proveďte instalaci.

Stáhněte níže uvedený soubor expresních dat sinice při extrémním ozáření. Načtěte soubor do TreeView a prohlédněte hierarchicky uskupená data.

 

Prostudujte dokumentaci k SW Gene Cluster (Eisen Lab) a zkuste Gene Cluster nainstalovat. Načtěte do Gene Cluster soubor expresních dat sinice získaných při zvýšené intenzitě světla. Proveďte hierarchické seskupení dat, porovnejte různé varianty nastavení algoritmu.

Soubor expresních dat sinice
The file cyano.txt contains the gene expression data, after preprocessing and linear spline fitting, of a time-course cDNA microarray experiment of the cyanobacterium Synechocystis sp PCC 6803 under high light conditions. This experiment is described in Yukako Hihara, Ayako Kamei, Minoru Kanehisa, Aaron Kaplan, and Masahiko Ikeuchi: "DNA Microarray Analysis of Cyanobacterial Gene Expression during Acclimation to High Light", The Plant Cell, Volume 13, pp. 793-806, April 2001. The k-means clustering result applied to these data was published in M.J.L. de Hoon, S. Imoto, S. Miyano: "Statistical analysis of a small set of time-ordered gene expression data using linear splines", Bioinformatics, Volume 18, no. 11, pp. 1477-1485, November 2002.