Cluster Heat Map PA055 Vizualizace komplexních dat Karel Sedlář Heat Map • = forma grafické reprezentace dat, kde jsou hodnoty kódovány do barevné stupnice Cluster Heat Map • data uložená v pravoúhlé matici • matice zdrojových dat je podrobena shlukové analýze v jednom nebo obou směrech (shlukování řádků, shlukování sloupců) • následně je matice přerovnána a vizualizována barevným kódováním • vizualizace s nejširším využitím v bioinformatice (biostatistice) Metody klástrování • nemá omezení • nejčastěji hierarchické alglomerativní (complete, single, average linkage, wardova metoda) • možno použít ty nehierarchické divizivní (k-means clustering) Historie • 1873 Loua: Shaded matrix (stínovaná matice) o vytvořena ručně, matice bez přerovnání o zachycuje složení obyvatelstva 20 různých částí Paříže Historie • 1914 Brinton: Permuting matrix (zpřeházená matice) o upraveno pouze pořadí řádků • ~1950 vizualizace asociačních matic Microarrays • typické využití v bioinformatice při zpracování genové exprese • Eisen, M., Spellman, P., Brown, P., and Botstein, D. (1998), Cluster analysis and display of genomewide expression patterns,“ Proceedings of the National Academy of Sciences“, 95, 14863-14868. • červeno-zelená stupnice • příklad: o sledování genové exprese sinic při vystavení silnému zdroji světla o k-means clustering (nehierarchická metoda -> není dendrogram) o výrazně zelená skupina genů -> protein kódující geny uplatňující se při tvorbě Phycobilisome, tj. systém antének pro sběr světla o software: Cluster + TreeView Vizualizace vztahů • nástavba vícerozměrných statistických analýz (PCA, PCoA, CoA, FA…) • vyjádření korelací rozsáhlých souborů dat • zpravidla jiná než červeno-zelená stupnice • příklad: o vizualizace korelací složení mikroflóry ryb s genovou expresí genů rezistence o metagenomická analýza 16S o amplikonové sekvenování na Roche 454 Vizualizace korelací • OTU table • gen table Vizualizace korelací • Spearmanův korelační koeficient o negativní výsledek Shapiro-Wilks testu na normalitu dat v jednotlivých skupinách o nepřehledná tabulka, není vidět informace o vztazích Vizualizace korelací o software: Matlab, R A to je vše přátelé!