Pokročilé metody analýzy dat v neurovědách IBA # RNDr. Eva Janoušová doc. RNDr. Ladislav Dušek, Dr. Jaro 2016 Blok 4 Shluková analýza Janoušová, Dušek: Pokročilé metody analýzy dat v neurovědách ll^Jj 2 Osnova i- 1. Podstata a cíle shlukové analýzy dat 2. Shluková analýza hierarchická - hierarchické aglomerativní shlukování 3. Shluková analýza hierarchická - hierarchické divizivní shlukování 4. Shluková analýza nehierarchická 5. Identifikace optimálního počtu shluků Janoušová, Dušek: Pokročilé metody analýzy dat v neurovědách l^JJ Podstata a cíle shlukové analýzy dat Janoušová, Dušek: Pokročilé metody analýzy dat v neurovědách ij^Jj 4 Shluková analýza - cíle a postupy Shluková analýza se snaží o identifikaci shluků objektů ve vícerozměrném prostoru a následnou redukci vícedimenzionálního problému kategorizací objektů do zjištěných shluků Existuje řada různých metod pro shlukování dat lišících se: Měřením vzdálenosti mezi objekty - Algoritmem spojování objektů do shluků - Interpretací výstupů Každá z metod má své vlastní předpoklady výpočtu a je nasaditelná pro různé typy úloh Porušení předpokladů nebo nasazení chybné metody může vést k zavádějícím výsledkům CM CD N tu E b 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0 /[ i £ D ■\ f \ E ( ■\ / J J C t ■v ■N K J /B J / f \ \ J 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Dimenze 1 Janoušová, Dušek: Pokročilé metody analýzy dat v neurovědách IBA Obecný princip hledání shluků v datech • Vzájemnou pozici objektů ve vícerozměrném prostoru lze popsat jejich vzdáleností (např. Euklidovou, Čebyševovou apod.) • Smysluplnost výsledků shlukování závisí jednak na objektivní existenci shluků v datech, jednak na arbitrárne nastavených kritériích definice shluků oooo oooo oooo oooo Jednoznačné odlišení existujících Shluková analýza je možná i v tomto shluků v datech (obdoba případě, nicméně hranice shluků jsou multimodálního rozložení) dány pouze naším rozhodnutím. MU Janoušová, Dušek: Pokročilé metody analýzy dat v neurovědách ^BÄ ^! 6 Shluková analýza - typy metod 1. Krok Shluková analýza I Hierarchické shluky jsou definovány postupným skládáním objektů Nehierarchické shluky jsou definovány v jednom kroku Aglomerativní Po spojení první dvojice objektů dochází k postupnému napojování dalších objektů. Divizivní Objekty jsou nejprve rozděleny do dvou shluků, tyto shluky jsou dále rozděleny atd. Divizivní objekty rozděleny do předem nastaveného počtu shluků. Aglomerativní síť spojených bodů oo Kolik shluků chceme Minimum spanning definovat? Například 4 tree, Prime network 2. Krok •• • OO oo X. Krok Atd. Atd. Výpočet ukončen Výpočet ukončen MU Janoušová, Dušek: Pokročilé metody analýzy dat v neurovědách ^BA ^! Shluková analýza hierarchická -hierarchické aglomerativní shlukování Janoušová, Dušek: Pokročilé metody analýzy dat v neurovědách Hierarchické aglomerativní shlukování • Při tomto způsobu shlukování jsou postupně shlukovány nejpodobnější objekty až do doby, kdy jsou všechny objekty propojeny do jednoho shluku spojujícího všechny objekty v analyzovaném souboru • Analýza má dva hlavní kroky: 1. Výběr vhodné metriky vzdálenosti/podobnosti pro výpočet asociační matice (analýza může probíhat na libovolných metrikách vzdálenosti/podobnosti) 2. Výběr shlukovacího algoritmu, který podstatným způsobem ovlivňuje výsledky analýzy a možnosti její interpretace • Algoritmus výpočtu postupuje v následujícím cyklu 1. Výpočet asociační matice 2. Spojení dvou nejpodobnějších objektů 3. Přepočítání asociační matice tak, že spojené objekty již nadále vystupují jako jediný objekt (v tomto kroku se uplatňuje zvolený shlukovací algoritmus, který definuje, jak bude počítána vzdálenost/podobnost spojených objektů vůči ostatním objektům) 4. Spojení dvou nejpodobnějších objektů z přepočítané asociační matice 5. Atd. až do spojení všech objektů MU Janoušová, Dušek: Pokročilé metody analýzy dat v neurovědách ^BÄ ^! 9 Hierarchické aglomerativní shlukování - schéma výpočtu Výběr metriky podobnosti/vzdálenosti O Asociační matice Výpočet podobnosti sloučené dvojice objektů k ostatním objektům Výběr shlukovacího algoritmu Nalezení dvojice nejpodobnéjších objektů Ukončení výpočtu po spojení všech objektů Dendrogram A B C D E 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Linkage Distance Amalgamation schedule/graph Amalgamation Schedule (clustering_demoj Complete Linkage Euclidean distances linkage distance Obj. No. 1 Obj. No. 2 Obj. No. 3 Obj. No. 4 Obj. No. 5 1.414214 □ E| 4.000000 A B 5.830952 C D E 12.80625 A B C D E Janoušová, Dušek: Pokročilé metody analýzy dat v neurovědách IBA W io Popis výstupů - dendrogram Shlukované objekty - jejich pořadí je dáno přiřazením do shluků, není problém jejich pořadí v grafu měnit (např. v tomto konkrétním grafu prohodit A a B), pouze nesmí dojít ke změně shluků B Tree Diagram for 5 Cases Complete Linkage <-Euclidean distances 4 5 Linl -> 6 7 8 9 10 11 12 13 14 age Distance Výstupy shlukové analýzy musí být vždy popsány použitou metrikou vzdáleností a shlukovacím algoritmem Propojení shlukovaných objektů Vzdálenost, na níž došlo ke spojení shluku: •je v rozměrech použité metriky vzdáleností/podobností a v tomto kontextu ji lze kvantitativně interpretovat • interpretace vzdálenosti shlukování se liší podle použitého shlukovacího algoritmu • někdy se uvádí ve škále 0-100%, kde 100% je maximální vzdálenost shlukování MU Janoušová, Dušek: Pokročilé metody analýzy dat v neurovědách ^BÄ ^! H Popis výstupů - Amalgamation schedule/graph Popis postupu shlukování; využitelné i pro identifikaci optimálního počtu shluků Amalgamation Schedule íclustering_demo) Complete Linkage Euclidean distances linkage distance Obj. Ho. 1 Obj. No. 2 Obj. No. 3 Obj. No. ObĽ^tí" 1.414214 D E 4.000000 A I— B 5.830952 C D E 12.30625 A. B C D E Objekty spojené v jednotlivých krocích shlukování Souvislost s dendrogramem: Grafické vyjádření kroků shlukování a vzdálenostech, na nichž došlo k propojení objektů: 14 A B C D E 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Linkage Distance Pokud je v grafu dlouhá vzdálenost bez napojení shluku, jde o možné místo zastavení shlukování a definici finálních shluků 4 5 Janoušová, Dušek: Pokročilé metody analýzy dat v neurovědách IBA W 12 Shlukovací algoritmy hierarchického aglomerativního shlukování Metoda nejbližšího souseda (jednospojná metoda, metoda jediné O vazby, metoda krátké ruky, nearest neighbour, simple linkage) O----f - spojení dle nejmenší vzdálenosti mezi objekty shluků o o Metoda průměrné vazby (středospojná metoda, average linkage) -spojení dle průměrné vzdálenosti mezi objekty shluků - Nevážená [unweighted, UPGMA) - výpočet spojovací vzdálenosti je ovlivněn velikostí spojovaných shluků - Vážená [weighted, WPGMA) - odstranění vlivu velikosti shluků, shluky bez ohledu na velikost přispívají k výpočtu spojovací vzdálenosti stejnou vahou Centroidová metoda (centroidní metoda, metoda středospojné vzdálenosti, Gowerova metoda, centroid method) - spojení dle vzdálenosti centroidů shluků - Nevážená [unweighted, UPGMC) - výpočet spojovací vzdálenosti je ovlivněn velikostí spojovaných shluků — Vážená [weighted, WPGMC, mediánová metoda, medián method) -odstranění vlivu velikosti shluků o^o- o o Metoda nejvzdálenějšího souseda (všespojná metoda, metoda dlouhé ruky, furthest neigbour, complete linkage) - spojení dle největší vzdálenosti mezi objekty shluků • •- o v-o Janoušová, Dušek: Pokročilé metody analýzy dat v neurovědách for Wl 13 Shlukovací algoritmy hierarchického aglomerativního shlukování Metoda nejbližšího souseda (jednospojná metoda, metoda jediné vazby, metoda krátké ruky, nearest neighbour, simple linkage) - spojení dle nejmenší vzdálenosti mezi objekty shluků Metoda průměrné vazby (středospojná metoda, average linkage) -spojení dle průměrné vzdálenosti mezi objekty shluků - Nevážená [unweighted, UPGMA) - výpočet spojovací vzdálenosti je ovlivněn velikostí spojovaných shluků - Vážená [weighted, WPGMA) - odstranění vlivu velikosti shluků, shluky bez ohledu na velikost přispívají k výpočtu spojovací vzdálenosti stejnou vahou Centroidová metoda (centroidní metoda, metoda středospojné vzdálenosti, Gowerova metoda, centroid method) - spojení dle vzdálenosti centroidů shluků - Nevážená [unweighted, UPGMC) - výpočet spojovací vzdálenosti je ovlivněn velikostí spojovaných shluků — Vážená [weighted, WPGMC, mediánová metoda, median method) -odstranění vlivu velikosti shluků Přechod mezi oběma extrémy (metoda flexible clustering umožňuje dle nastavení zcela plynulý přechod) Metoda nejvzdálenějšího souseda (všespojná metoda, metoda dlouhé ruky, furthest neigbour, complete linkage) - spojení dle největší vzdálenosti mezi objekty shluků Janoušová, Dušek: Pokročilé metody analýzy dat v neurovědách Shlukovací algoritmy hierarchického aglomerativního shlukování-Wardova metoda Principielně podobné ANOVA Shluky jsou vytvářeny tak, aby nově vzniklý shluk přispíval co nejméně k sumě čtverců vzdáleností objektů od centroidů jejich shluků V počátečním kroku je každý objekt sám sobě shlukem, a tedy vzdálenost od centroidů shluku je rovna 0 Pro výpočet vzdáleností od centroidů je používána Euklidovská vzdálenost Pro popis vzdálenosti shlukování je v dendrogramu možné použít řadu postupů (nezbytné ověřit, jaký přístup je k dispozici v použitém SW): - Čtverce vzdáleností - Odmocnina čtverce vzdáleností - Podíl variability (čtverce vzdáleností) připadající na daný shluk - Aj. Krok 1: každý objekt je sám sobě centroidem o # o Krok 2: spojení objektů, které nejméně přispějí k sumě čtverců vzdáleností od centroidů Krok 3: spojení objektů, které nejméně přispějí k sumě čtverců vzdáleností od centroidů Krok 4: stejný postup až do spojení všech objektů Janoušová, Dušek: Pokročilé metody analýzy dat v neurovědách IBA W 15 Metoda nejbližšího souseda: 1. krok výpočtu )- • Je vypočtena asociační matice A B C D E A 0.0 4.0 7.2 12.8 12.7 B 4.0 0.0 4.5 10.0 10.3 C 7.2 4.5 0.0 5.7 5.8 D 12.8 10.0 5.7 0.0 1.4 E 12.7 10.3 5.8 1.4 0.0 Je definován shluk dvou nejbližších objektů D-E C\l V ( i / V J 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Dimenze 1 Janoušová, Dušek: Pokročilé metody analýzy dat v neurovédách IBA W 18 Metoda nejbližšího souseda: 4. krok výpočtu Je vypočtena asociační matice, kde objekty (A-B)-C již vystupují jako jeden objekt, jehož vzdálenost od ostatních objektů je dána nejmenší vzdáleností od jeho členů (A, B, C) A+B C D+E A+B 0.0 4.5 10.0 C 4.5 0.0 5.7 D+E 10.0 5.7 0.0 O A+B+C D+E A+B+C 0.0 5.7 D+E 5.7 0.0 • Je definován shluk dvou nejbližších objektů ((A-B)-C)-(D-E) • Všechny objekty jsou spojeny, algoritmus je ukončen C\l i ŕ i / V P / 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Dimenze 1 Janoušová, Dušek: Pokročilé metody analýzy dat v neurovédách IBA W 19 Metoda nejbližšího souseda: výsledek analýzy )- • Výsledek analýzy je vizualizován ve formě dendrogramu Metoda nejvzdálenějšího souseda: 1. krok výpočtu )- • Je vypočtena asociační matice A B C D E A 0.0 4.0 7.2 12.8 12.7 B 4.0 0.0 4.5 10.0 10.3 C 7.2 4.5 0.0 5.7 5.8 D 12.8 10.0 5.7 0.0 1.4 E 12.7 10.3 5.8 1.4 0.0 Je definován shluk dvou nejbližších objektů D-E C\l vt\í 3 / 2 \ J 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Dimenze 1 Janoušová, Dušek: Pokročilé metody analýzy dat v neurovédách IBA W 23 Metoda nejvzdálenějšího souseda: 4. krok výpočtu Je vypočtena asociační matice, kde objekty (D-E)-C již vystupují jako jeden objekt, jehož vzdálenost od ostatních objektů je dána největší vzdáleností od jeho členů (D, E, C) A+B C D+E A+B 0.0 7.2 12.8 C 7.2 0.0 5.8 D+E 12.8 5.8 0.0 A+B D+E+C A+B D+E+C 0.0 12.8 12.8 0.0 • Je definován shluk dvou nejbližších objektů ((D-E)-C)-(A-B) • Všechny objekty jsou spojeny, algoritmus je ukončen C\l 7 8 9 10 11 12 13 14 15 16 Dimenze 1 Janoušová, Dušek: Pokročilé metody analýzy dat v neurovédách IBA W 24 Metoda nejvzdálenějšího souseda: výsledek analýzy i- • Výsledek analýzy je vizualizován ve formě dendrogramu Tree Diagram for 5 Cases Complete Linkage Euclidean distances 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Linkage Distance 16 r 15 : 14 ■ 13 - 12 ■ 11 - 10 - C\l 9 : 0 N C 8° ' o 0 t PETALLEN „Ji PETAL WID 2.0 2.5 3.0 3.5 SEPALLEN rTTTK o© o o o o o 8? 4ob§ °o §1 Bao 0 08 ° °oo i o § 48fef q © - o -4--CÍ--4 1 SEPAL WID ioS o ■4-0-4- o g S o o 4o4—ť- o 0 8b8?f 8° ° 0 o PETALLEN f--p~-[--r©i-- 8 i ° 8 ° o í § o 0 ■ > o o [-™bH™ oo o 0 o odo o co 0 oo o o o 00 o o ocococccoo o (juuuuuuqqooo o oo o 00 o o -[--q-í- "~"f"OÍ" 0 ooo o ooo o o oooooo o oo o PETALWID □ . Janoušová, Dušek: Pokročilé metody analýzy dat v neurovědách IBA W 36 Identifikace optimálního počtu shluků - metody • Dunnův validační index • Daviesův-Bouldinův validační index • Metoda siluety • Izolační index • C-index • Goodmanův-Kruskalův index Janoušová, Dušek: Pokročilé metody analýzy dat v neurovědách ^j^- (^) 37 Výpočet shlukové analýzy v softwarech Janoušová, Dušek: Pokročilé metody analýzy dat v neurovědách STATISTICA - hierarchické aglomerativní shlukování Statistics - Multivariate Exploratory Techniques - Cluster Analysis - Joining (tree clustering) - OK Variables: výběr proměnných (např. objem hipokampu, amygdaly a pallida) Cluster: zvolit, zda chceme shlukovat proměnné (Variables (columns)) či subjekty (Cases (rows)) Amalgamation (linkage) rule = volba shlukovacího algoritmu: - Single Linkage - metoda nejbližšího souseda - Complete Linkage - metoda nejvzdálenějšího souseda - Unweighted pair-group average - metoda průměrné vazby (nevážená) - Weighted pair-group average - metoda průměrné vazby (vážená) - Unweighted pair-group centroid - centroidová metoda (nevážená) - Weighted pair-group centroid (median) - centroidová metoda (vážená) = mediánová metoda - Ward's method - Wardova metoda Distance measure = volba metrik vzdáleností objektů (subjektů): - Squared Euclidean distances - čtverec Euklidovy vzdálenosti - Euclidean distances - Euklidova metrika - City-block (Manhattan) distances - Hammingova (manhattanská) metrika - Chebychev distance metric - Čebyševova metrika - Power: SUM(ABS(x-y)**p)**l/r - pokud r=p, jde o Minkovského metriku - Percent disagreement - 1-Pearson r- jedna mínus Pearsonův korelační koeficient J MU Janoušová, Dušek: Pokročilé metody analýzy dat v neurovědách ^BA ^! 39 STATISTICA- hierarch. aglom. shluk. - pokračování Tree Diagram for 1$ Cases Single Linkage Euclidean distances Trse Diagram for 19 Cases Single Linkage Euclidean distances linkage distance Amalgamation Schedule (Data_neuro_shkikovky] " Single Linkage Euclidean distances Obj. No. 1 Obj. No. 2 Obj. No. 3 Obj. No. 4 Obj. No. 6 O 125.1972 C 161 C 10 1392640 C 1 C B 143.9270 C 11 C 14 147.0S73 C 4 C S 164.1363 C 17 C 19 16S.E528 C 12 C 13 176.3964 C 3 C 12 C 13 133.2707 C 2 C 7 202.7584 C 1 C S C 2 C 7 223.0460 C 1 C s C 2 C 7 C 5 ' . *c Joining Results: Data_neuro_EÍilukovky V £3 Number of variables: 3 Number cf caaea: IS Joining of caaea Hiaaing data were caaewiae deleted Amalgámation (joining) rule: Single Linkage Distance metric ia: Euclidean distances (non-standardized) Quick Advanced Horizontal hierarchical tree plot Vertical icicle plot Descriptive statistics [V Rectangular branches □ Scale tree to dlink/dmax*100 amalgamation schedule Graph of amalgamation schedule Plot of Linkage Distances across Steps En I i dean di&tarces Distance matrix Matrix Save classifications ] Sort by cluster membership Summary Cancel Opt ions ^; By Group asociační matice Euklidových vzdáleností Euclidean distances (□ata_neLro_shljkuvky) Case No. C 1 C 2 C 3 C4 C 5 C6 C: C 1 0 291 299 490 271 139 C 2 291 ' í 244 264 454 251 C 3 299 244 0 500 527 311 C 4 490 271 264 500 0 535 410 C 5 454 527 535 0 223 c e 139 261 311 410 223 0 C 7 307 183 262 328 399 203 n o T07 2 4 6 Janoušová, Dušek: Pokročilé metody analýzy dat v neurovédách IBA W 40 STATISTICA - nehierarchické shlukování i- • Statistics - Multivariate Exploratory Techniques - Cluster Analysis - K-means clustering - OK - přepnout se na záložku Advanced • Variables: výběr proměnných (např. objem hipokampu, amygdaly a pallida) • Cluster: zvolit, zda chceme shlukovat proměnné (Variables (columns)) či subjekty (Cases (rows)) • Number of clusters: zvolit počet shluků (např. 3) • Number of iterations: volba počtu iterací (metoda /e-průměrů je iterativní metoda) • Initial cluster centers: volba počátečních středů shluků příslušnost jednotlivých subjektů do shluků nalezneme na záložce Advanced v ..Members of each cluster & distances'' Janoušová, Dušek: Pokročilé metody analýzy dat v neurovědách ij^Jj 41 SPSS - hierarchické aglomerativní shlukování Analyze - Classify - Hierarchical Cluster... Cluster: zvolit, zda chceme shlukovat proměnné (Variables) či subjekty (Cases) Statistics...: zatrhnout Proximity matrix (= asociační matice vzdáleností či podobností) Plots...: zatrhnout Dendrogram (možnost volby Vertical či Horizontal) Method...: - Cluster Method = volba shlukovacího algoritmu: - Between-groups linkage - metoda průměrné vazby mezi skupinami - Within-groups linkage - metoda průměrné vazby uvnitř skupin - Nearest neighbor - metoda nejbližšího souseda - Furthest neighbor - metoda nejvzdálenějšího souseda - Centroid clustering - centroidová metoda (nevážená) - Median clustering - centroidová metoda (vážená) = mediánová metoda - Ward's method - Wardova metoda - Distance measure: volba metrik vzdáleností objektů (subjektů): - Euclidean distance - Euklidova metrika - Squared Euclidean distance - čtverec Euklidovy vzdálenosti - Cosine - kosinová metrika - Pearson correlation - Pearsonův korelační koeficient - Chebychev - Čebyševova metrika - Block - Hammingova (manhattanská) metrika - Minkowski - Minkovského metrika - Customized - výpočet pomocí SUM(ABS(x-y)**p)**l/r - Transform Values, Transform Measure - je možno transformovat původní data nebo vypočtené vzdálenosti HU Janoušová, Dušek: Pokročilé metody analýzy dat v neurovědách ^BÄ ^! 42 SPSS - nehierarchické shlukování • Analyze - Classify - K-Means Cluster... • Variables: výběr proměnných (např. objem hipokampu, amygdaly a pallida) • Number of clusters: zvolit počet shluků (např. 3) • Method: přepnout na „Classify only'' v případě, že známe středy shluků, které můžeme načíst pomocí „Read initial" • Iterate... - Maximum Iterations (volba počtu iterací - metoda /e-průměrů je iterativní metoda) • Options... - zatrhnout „Cluster information for each case", abychom získali tabulku, do kterého shluku patří který subjekt Janoušová, Dušek: Pokročilé metody analýzy dat v neurovědách ij^Jj 43 Software R - hierarchické aglomerativní shlukování • funkce dist na výpočet vzdáleností objektů (či subjektů): - „euclidean" - Euklidovská metrika - „maximum'' - Čebyševova metrika - „manhattan" - Hammingova (manhattanská) metrika - „canberra" - Canberrská metrika - „minkowski" - Minkovského metrika • funkce hclust na výpočet shlukové analýzy: - „ward.D" a „ward.D2" - dva algoritmy pro Wardovu metodu - „single'' - metoda nejbližšího souseda (single linkage) - „complete" - metoda nejvzdálenějšího souseda (complete linkage) - „average" - metoda průměrné vazby (nevážená) (average linkage) - „mcquitty" - metoda průměrné vazby (vážená) - „medián" - centroidová metoda (vážená) = mediánová metoda - „centroid" - centroidová metoda (nevážená) • podrobná ukázka v souboru Shlukovky_skript.R MU Janoušová, Dušek: Pokročilé metody analýzy dat v neurovědách ^BÄ ^! 44 Software R - nehierarchické shlukování • funkce kmeans * ukázka: cl <- kmeans(data.vyber, 3) # provedeni shlukové analýzy table(cl$cluster,groupCodes) # zjištěni, kolik subjektu bylo spatné zaražených Janoušová, Dušek: Pokročilé metody analýzy dat v neurovědách ij^Jj 45 Matlab - hierarchické aglomerativní shlukování • funkce linkage, která umožňuje volbu shlukovacího algoritmu i volbu metriky vzdálenosti mezi objekty (subjekty) • volba shlukovacího algoritmu: - „average" - metoda průměrné vazby (nevážená) (average linkage) - „centroid" - centroidová metoda (nevážená) - „complete" - metoda nejvzdálenějšího souseda (complete linkage) - „medián'' - centroidová metoda (vážená) = mediánová metoda - „single'' - metoda nejbližšího souseda (single linkage) - „ward" - Ward ova metoda - „weighted" - metoda průměrné vazby (vážená) • volba metriky vzdáleností - stejná nabídka jako u funkce pdist • ukázka: [num, txt] = xlsread('Data_neuro_shlukovky.xlsx',l); data=num(:,[23,24,26]); Z=linkage(data,'complete','euclidean'); % provedeni shlukové analýzy dendrogram (Z) % vykresleni dendrogramu c=cluster(Z,'maxclusť,3); % vytvořeni definovaného poctu shluku crosstab(c,num(:,3)) % zjištěni, kolik subjektu bylo spatné zaražených MU Janoušová, Dušek: Pokročilé metody analýzy dat v neurovědách ^BA ^! 46 Matlab - nehierarchické shlukování 1 funkce kmeans * ukázka: [idx,C]=kmeans(data,3); % provedeni shlukové analýzy (matice C - centroidy skupin) crosstab(idx,num(:,3)) % zjištěni, kolik subjektu bylo spatné zaražených funkce kmedoids bohužel není ve starých verzích Matlabu ukázka: [idx,C]=kmedoids(data,3); % provedeni shlukové analýzy (matice C - medoidy skupin) crosstab(idx,num(:,3)) % zjištěni, kolik subjektu bylo spatné zarazených Janoušová, Dušek: Pokročilé metody analýzy dat v neurovědách ^BA W 47 Poděkování Příprava výukových materiálů předmětu „DSAN02 Pokročilé metody analýzy dat v neurovědách" byla finančně podporována prostředky projektu FRMU č. MUNI/FR/0260/2014 „Pokročilé metody analýzy dat v neurovědách jako nový předmět na LF MU" Janoušová, Dušek: Pokročilé metody analýzy dat v neurovědách ^jjj- I^J 48