Vícerozměrné statistické metody Podobnostia vzdálenostive vícerozměrném prostoru, asociační matice I Jiří Jarkovský, Simona Littnerová Vícerozměrné statistické metody Princip využití vzdálenostíve vícerozměrném prostoru Jiří Jarkovský, SimonaLittnerová:Vícerozměrnéstatistickémetody Vzdálenosti nebo podobnosti objektů ve vícerozměrném prostoru • Vícerozměrný popis objektůpředstavujejejich pozici ve vícerozměrném prostoru • Vztahy mezi objekty lze vyjádřit pomocí jejich vzdálenostiv prostoru • Existuje celá řada způsobů měření vzdálenostiv prostoru pro různé typy dat (binární, kategoriální,spojitá) • Výběr metriky vzdálenostinebo podobnostisilně ovlivňujevýsledky analýzy, protože definuje jakým způsobem vztah mezi objekty interpretujeme 3 • Výběr metriky je dán dvěma pohledy: • Typ dat – s různými typy dat jsou spjaty různé metriky • Předpokladyvýpočtu metriky – obdobně jako klasické statistické metody ani metriky nelze použít ve všech situacích a v některých by dokonce díky jejich předpokladůmšlo o hrubou chybu • Expertní interpretacevztahů objektů Jiří Jarkovský, SimonaLittnerová:Vícerozměrnéstatistickémetody Euklidovská vzdálenost jako princip výpočtu vícerozměrných analýz • Nejsnáze představitelnýmměřítkem vztahu dvou objektůve vícerozměrném prostoru je jejich vzdálenost • Nejjednoduššímtypem této vzdálenosti(bohužel s omezeným použitím na data společenstev) je Euklidovskávzdálenostvycházející z Pythagorovy věty 4 a b c y11 y12 y21 y22 2 211211 )(),( jj p j yyxxD −∑= = X1 X2 Jiří Jarkovský, SimonaLittnerová:Vícerozměrnéstatistickémetody Různé přístupy k měření vzdálenosti 5 A B Jednou na Manhattanu ……. Hodnoty parametrů pro jednotlivé objekty NxP MATICE ASOCIAČNÍ MATICE Korelace, kovariance, vzdálenost, podobnost Výpočet metriky podobností/ vzdáleností Asociační matice Jiří Jarkovský, SimonaLittnerová:Vícerozměrnéstatistickémetody Mapa prostoru 7 Vzdálenost v km Barcelona Bělehrad Berlín Brusel Bukurešť Budapešť Kodaň Dublin Hamburg Istanbul Kiev Londýn Madrid Barcelona 0 1528 1497 1062 1968 1498 1757 1469 1471 2230 2391 1137 504 Bělehrad 1528 0 999 1372 447 316 1327 2145 1229 809 976 1688 2026 Berlín 1497 999 0 651 1293 689 354 1315 254 1735 1204 929 1867 Brusel 1062 1372 651 0 1769 1131 766 773 489 2178 1836 318 1314 Bukurešť 1968 447 1293 1769 0 639 1571 2534 1544 445 744 2088 2469 Budapešť 1498 316 689 1131 639 0 1011 1894 927 1064 894 1450 1975 Kodaň 1757 1327 354 766 1571 1011 0 1238 287 2017 1326 955 2071 Dublin 1469 2145 1315 773 2534 1894 1238 0 1073 2950 2513 462 1449 Hamburg 1471 1229 254 489 1544 927 287 1073 0 1983 1440 720 1785 Istanbul 2230 809 1735 2178 445 1064 2017 2950 1983 0 1052 2496 2734 Kiev 2391 976 1204 1836 744 894 1326 2513 1440 1052 0 2131 2859 Londýn 1137 1688 929 318 2088 1450 955 462 720 2496 2131 0 1263 Madrid 504 2026 1867 1314 2469 1975 2071 1449 1785 2734 2859 1263 0 Vzdálenost měst v mapě není ničím jiným než maticí vzdálenosti v 2D prostoru Jiří Jarkovský, SimonaLittnerová:Vícerozměrnéstatistickémetody Metrika vzdálenosti/podobnosti jako klíčový bod vícerozměrné analýzy • Výběr metriky vzdálenosti/podobnosti jeklíčovým bodem každé vícerozměrné analýzy: – Některé metody umožňují úplnou volnost ve výběru metriky podobnosti (hierarchická aglomerativní shluková analýza, multidimensional scaling) – Některé metody jsou přímo spjaté s konkrétní metrikou (PCA, CA, k-means clustering) • Chybnývýběr metriky může vést k chybným závěrům analýzy (stejně jako v klasické statistické analýze výběr nevhodnéhotestu nebo popisné statistiky) • Metriky podobnostínebo vzdálenostíkromě vícerozměrných statistickýchmetod mohou vstupovati do klasických statistickýchvýpočtů: – Popisná statistika a vizualizace metrik – Analogie t-testů a ANOVA pro asociační matice – Korelace asociačních matic – Regrese asociačních matic 8 Jiří Jarkovský, SimonaLittnerová:Vícerozměrnéstatistickémetody Software pro výpočet metrik podobnosti/vzdálenosti • Různé SW obsahujírůzné typy metrik – Statistica – velmi omezený seznam – SPSS – velké množství metrik – R – jakékoliv metriky, potřeba nainstalování knihoven 9 Vícerozměrné statistické metody Kvantitativnímetriky vzdáleností a podobností Jiří Jarkovský, SimonaLittnerová:Vícerozměrnéstatistickémetody Euklidovská vzdálenost • Jde o základnímetrické měřítko vzdálenostia počítá vzdálenost objektů obdobně jako Pythagorova věta počítá přeponu pravoúhléhotrojúhelníku.Metodaje citlivá na rozdílnýrozsah hodnot vstupujícíchproměnných(vhodným řešením může být standardizace)a double zero problém. Nemá horní hranicihodnot. • Jako další měřítko se používátaké čtverec této vzdálenosti. . Jeho nevýhodoujsou semimetrické vlastnosti. 2 211211 )(),( jj p j yyxxD −∑= = 2 21121 2 )(),(1 jj p j yyxxD −∑= = y12 y11 y22 y21 X1 D1(X1,X2) X2 Jiří Jarkovský, SimonaLittnerová:Vícerozměrnéstatistickémetody Průměrná vzdálenost • Euklidovská vzdálenostje přepočítánana počet parametrů (druhů v případě vzdálenosti společenstev odběrů). 2 21121 2 )( 1 ),(2 jj p j yy p xxD −∑= = 2 21 22 ),( DxxD = Jiří Jarkovský, SimonaLittnerová:Vícerozměrnéstatistickémetody Chord distance (Orlóci, 1967) • Odstraňujedouble zero problém a vliv rozdílného počtu jedincůdruhů ve vzorcích při výpočtu Euklidovskévzdálenosti. Její maximálníhodnota je druhá odmocninaze dvou a minimum 0. Při výpočtu počítápouze s poměry druhů v rámci jednotlivých vzorků. Jde vlastně o Euklidovskou vzdálenostpočítanoupro vektory vzorků standardizovanéna délku1, nebo je možný přímý výpočet už zahrnující standardizaci.Vnitřníčást výpočtu je vlastně cosinus úhlu svíranéhovektory, zápis vzorce je možný i v této formě.           ∑∑ ∑ −= == = 2 21 2 1 211 213 1 12),( j p j p j jj p j yy yy xxD j ( )θcos123 −=D Jiří Jarkovský, SimonaLittnerová:Vícerozměrnéstatistickémetody Geodetická metrika • Počítá délku výseče jednotkové kružnice mezi normalizovanýmivektory (viz. Chord distance).       −= 2 ),( 1arccos)( 21 2 3 2,14 xxD xxD Jiří Jarkovský, SimonaLittnerová:Vícerozměrnéstatistickémetody Mahalanobisova vzdálenost (Mahalanobis 1936) • Jde o obecné měřítko vzdálenostiberoucí v úvahukorelaci mezi parametry a je nezávislána rozsahu hodnot parametrů. Počítávzdálenost mezi objekty v systému souřadnic jehožosy nemusí být na sebe kolmé. V praxi se používá pro zjištění vzdálenosti mezi skupinamiobjektů. Jsou dánydvě skupinyobjektů w1 a w2 o n1 a n2 počtu objektů a popsané p parametry: • Kde je vektor o délce p rozdílů mezi průměry p parametrů v obou skupinách. V je vážená disperzní matice (matice kovariancíparametrů) uvnitř skupin objektů. • kde S1 a S2 jsou disperzní matice jednotlivýchskupin.Vektor měří rozdíl mezi prozměrnými průměry skupin a V vkládádo rovnice kovariancimezi parametry. ` 12 1 1221 2 5 ),( dVdwwD − = 12d ( ) ( )[ ]211 21 21 2 1 SnSn nn V −+− −+ = 12d Jiří Jarkovský, SimonaLittnerová:Vícerozměrnéstatistickémetody Minkowskeho metrika • Je obecnou formou výpočtu vzdálenosti – podle zadanéhokoeficientumůže odpovídatnapř. Euklidovskénebo Manhattanskémetrice. Se stoupající koeficientem umocňovánístoupávýznamnost větších rozdílů. Existuje ještě obecnější forma, kdy koeficient umocňovánía odmocňováníje zadávánzvlášť. [ ]rr jj p j yyxxD 1 211´216 ),( −∑= = Jiří Jarkovský, SimonaLittnerová:Vícerozměrnéstatistickémetody Manhattanská vzdálenost • Jde vlastně o součet rozdílů jednotlivýchparametrů popisujícíchobjekty jj p j yyxxD 211´217 ),( −∑= = Jiří Jarkovský, SimonaLittnerová:Vícerozměrnéstatistickémetody Mean character difference (Czekanowski 1909) • Manhattanská vzdálenostpřepočítanána počet parametrů. jj p j yy p xxD 211´218 1 ),( −∑= = Jiří Jarkovský, SimonaLittnerová:Vícerozměrnéstatistickémetody Whittakerův asociační index (Whittaker 1952) • Je dobře použitelnýpro data abundancí,každý druh je nejprve transformován ve svůj podílve společenstvu, následujícívýpočet je opět obdobouManhattanské vzdálenosti. • Jeho hodnota je 0 v případě identickýchproporcí druhů. Stejný výsledek lze získat i jako součet nejmenších podílův rámci obou vzorků. j p j j ij p j jp j y y y y xxD 21 2 1 1 1219 2 1 ),( == = ∑ − ∑ ∑=                 ∑ −= = j p j j y y xxD 1 219 min1),( Jiří Jarkovský, SimonaLittnerová:Vícerozměrnéstatistickémetody Canberra metric (Lance & Williams 1966) • VariantaManhattanskévzdálenosti (před výpočtem musí být odstraněnydouble zero a není jimy tedy ovlivněna).Stejný rozdíl mezi početnými druhy ovlivňuje vzdálenost méně než mezi druhy vzácnějšími. • Stephenson et al. (1972) a Moreau& Legendre (1979) použili tuto metriku jako součást koeficientupodobnosti ( )∑=         + − = p j jj jj yy yy xxD 1 21 21 2110 ),( 1021 1 1),( D p xxS −= Jiří Jarkovský, SimonaLittnerová:Vícerozměrnéstatistickémetody Koeficient divergence • Obdobnámetrika jako D10 ale založená na Euklidovskévzdálenostia vztažená na počet parametrů. ∑ =         + − = p j jj jj yy yy p xxD 1 2 21 21 2111 1 ),( Jiří Jarkovský, SimonaLittnerová:Vícerozměrnéstatistickémetody Coefficient of racial likeness (Pearson 1926) • Umožňuje srovnávatskupinyobjektů podobnějako Mahalanobisova vzdálenost, ale na rozdíl od ní neeliminujevliv korelace parametrů. Dvě skupiny objektů w1 a w2 jsou charakterizovány (průměr parametrů ve skupinách)a (rozptyl parametrů ve skupinách). ijy 2 ijs ( ) ( ) p n s n s yy p wwD p j jj jj 21 , 1 2 2 2 1 2 1 2 21 2112 −                       +         − = ∑= Jiří Jarkovský, SimonaLittnerová:Vícerozměrnéstatistickémetody χ2 metrika (Roux & Reyssac 1975) • První ze skupinymetrik založených na χ2 pro výpočet vzdálenostíodběrů založenýchna abundancíchdruhů nebo jiných frekvenčních datech (nejsou přípustné žádné záporné hodnoty). Data původnímatice abundancí/frekvencíY jsou nejprve přepočítánado matice poměrných frekvencí (součty frekvencí v řádcích (odběry) jsou rovny 1). Jako dodatečnécharakteristikyuplatňovanépři výpočtu jsou spočteny součty řádků yi+ a sloupců y+j celé! matice n(i) odběrů x p(j) druhů. • Výpočet odstraňujeproblém double zero. Nejjednoduššímvýpočtem je obdoba Euklidovskévzdálenosti • která je dále vážena součty jednotlivýchdruhů     →                     = + + i ij iij y y yy Y [ ] +++ yy j 2 1 2 2 1 1 21 ),( ∑= ++         −= p j jj y y y y xxD 2 1 2 2 1 1 2115 1 ),( ∑= +++         −= p j jj j y y y y y xxD Jiří Jarkovský, SimonaLittnerová:Vícerozměrnéstatistickémetody χ2 vzdálenost (Lébart & Fénelon 1971) • Výpočet je podobnýχ2 metrice, ale vážení je prováděnorelativníčetností řádku v matici místo jeho absolutního součtu,při výpočtu se užívá parametr y++ (celkový součet matice). Je využívánataké při výpočtu vztahů řádků a sloupců kontingenční tabulky. 2 1 2 2 1 1 2 1 2 2 1 1 2116 11 ),( ∑∑ = +++ ++ = ++ ++ +         −=        −= p j jj j p j jj j y y y y y y y y y y y y xxD Jiří Jarkovský, SimonaLittnerová:Vícerozměrnéstatistickémetody Hellingerova vzdálenost (Rao 1995) • Koeficient související s D15 a D16. 2 1 2 2 1 1 2117 ),( ∑= ++         −= p j jj y y y y xxD Vícerozměrné statistické metody Symetrické binárníkoeficienty podobnosti Jiří Jarkovský, SimonaLittnerová:Vícerozměrnéstatistickémetody Koeficienty podobosti (indexy podobnosti) • Ve vícerozměrné analýze se využívá řada indexů podobnosti založených buď na přítomnosti/nepřítomnosti kategorií objektů Binární koeficienty podobnosti Společenstvo 1 Spol ečen stvo 2 1 0 1 a b 0 c d a, b, c, d = počet případů, kdy souhlasí binární charakteristika společenstev 1 a 2 a+b+c+d=p Symetrické binární koeficienty - není rozdíl mezi případem 1-1 a 0-0 Asymetrickébinární koeficienty - rozdíl mezi případem 1-1 a 0-0 Více informací a další měření vzdáleností a podobnostínajdetev knize LEGENDRE, P. & LEGENDRE, L. (1998). Numerical ecology. Elseviere Science BV, Amsterodam. Jiří Jarkovský, SimonaLittnerová:Vícerozměrnéstatistickémetody Simple matching coefficient (Sokal & Michener, 1958) • Obvyklou metodou pro výpočet podobnosti mezi dvěma objekty je podíl počtu deskriptorů, které kódují objekt stejně, a celkového počtu deskriptorů. Při použití tohoto koeficientu předpokládáme, že není rozdíl mezi nastáním 0 a 1 u deskriptorů. p da xxS + =),( 211 Jiří Jarkovský, SimonaLittnerová:Vícerozměrnéstatistickémetody Rogers & Tanimoto koeficient (1960) • Dávávětší váhu rozdílům než podobnostem. dcba da xxS +++ + = 22 ),( 212 Jiří Jarkovský, SimonaLittnerová:Vícerozměrnéstatistickémetody Sokal & Sneath (1963) • Další čtyři navržené koeficienty obsahují double-zero, ale jsou navrženy tak, aby se snížil vliv double-zero: • tento koeficient dává dvakrát větší váhu shodným deskriptorům než rozdílným; • porovnává shody a rozdíly prostým podílem v měřítku jdoucím od 0 do nekonečna; • porovnává shodné deskriptory se součty okrajů tabulky; • je vytvořen z geometrických průměrů členů vztahujících se k a a d, podle koeficientu S5. dcba da xxS 22 22 ),( 213 +++ + = cb da xxS + + =),( 214       + + + + + + + = dc d db d ca a ba a xxS 4 1 ),( 215 ))(())(( ),( 216 dcdb d caba a xxS ++++ = Jiří Jarkovský, SimonaLittnerová:Vícerozměrnéstatistickémetody Hammannův koeficient Yuleho koeficient Pearsonovo Φ (phi) p cbda S −−+ = bcad bcad S + − = ))()()(( dbcadcba bcad ++++ − =φ Vícerozměrné statistické metody Kvantitativníasymetrické metriky podobnostia vzdálenosti Jiří Jarkovský, SimonaLittnerová:Vícerozměrnéstatistickémetody „Klasické“ indexy podobnosti • Sørensenův kvantitativníkoeficient,kde aN a bN jsou celkové počty jedincův společenstvech A a B, jN je pak suma abundancípokudse druh nachází v obou společenstvech, je počítánavždy z nižší abundancedaného druhu ve společenstvu • Morisita-Horn index, kde aN je celkový počet jedinců ve společenstvu A a ani počet jedinců druhu i ve společenstvu A (obdobně platípro společenstvo B) )( 2 bNaN jN CN + = bNaNdbda bnan C ii mH .).( )(2 + = ∑ 2 2 aN an da i∑= Jiří Jarkovský, SimonaLittnerová:Vícerozměrnéstatistickémetody Jednoduchý srovnávací koeficient (Sokal & Michener, 1958) • modifikovaný simplematching coefficient může být použit pro multistavové deskriptory - čitatelobsahuje počet deskriptorů, pro které jsou dva objekty ve stejném stavu – např. je-li dvojice objektů popsánanásledujícímideseti multistavovými deskriptory:hodnotaS1,vypočítanápro 10 multistavových deskriptorů bude S1,(x1,x2) = 4 agreements/ 10 descriptors = 0.4 • Podobnýmzpůsobem je možné rozšířit všechny binárníkoeficienty pro multistavovédeskriptory. Deskriptors Σ Object x1 9 3 7 3 4 9 5 4 0 6 Object x2 2 3 2 1 2 9 3 2 0 6 Agreements 0 + 1 + 0 + 0 + 0 + 1 + 0 + 0 + 1 + 1 4 p agreements xxS =),( 211 Jiří Jarkovský, SimonaLittnerová:Vícerozměrnéstatistickémetody Gowerův obecný koeficient podobnosti (1971) I. • Gover navrhlobecný koeficient podobnosti, který můžekombinovatrůznétypy deskriptorů. Podobnostmezi dvěma objekty je vypočítána jako průměr podobností, vypočítaných pro všechny deskriptory. Pro každý deskriptor j je hodnota parciálnípodobnostis12j mezi objekty x1 a x2 vypočítána následovně:  Pro binární deskriptory sj=1 (shoda) nebo 0 (neshoda). Gower navrhldvěformy tohoto koeficientu. Následující forma je symetrická, dává sj=1 double-zero. Druhá forma, Gowerův asymetrický koeficientS19 dává pro doublezero sj=0  Kvalitativní a semikvantitivní deskriptory jsou upravenypodlejednoduchého zaměňovacího pravidla, sj=1 při souhlasu a sj = 0 při nesouhlasu deskriptorů. Doublezero jsou ošetřenystejnějako v předchozímodstavci.  Kvantitativní deskriptory (reálná čísla) jsou zpracovány následovně: pro každýdeskriptor senejprvevypočte rozdílmezistavy obou objektů který je poté vydělen největším rozdílem(Rj), nalezenýmpro daný deskriptor mezi všemiobjekty ve studii (nebo v referenčnípopulaci – doporučujesevypočítat největšídiferenci Rj každého deskriptoru j pro celou populaci, aby byla zajištěna konzistencevýsledků pro všechny parciálnístudie). ∑= = p j js p xxS 1 122115 1 ),( Jiří Jarkovský, SimonaLittnerová:Vícerozměrnéstatistickémetody Gowerův obecný koeficient podobnosti (1971) II. • normalizovaná vzdálenost může být odečtena od 1 aby byla transformována na podobnost: • Gowerův koeficent může být nastaven tak, aby zahrnoval přídavný flexibilní prvek: žádné porovnání není vypočítáno u deskriptorů, u nichž chybí informace buď u jednoho, nebo u druhého objektu. Toto zajišťuje člen wj, nazývaný Kroneckerovo delta, popisující přítomnost/nepřítomnost informace v obou objektech: je-li informace o deskriptoru yj přítomna u obou objektů (wj=1), jinak (wj=0), tento koeficient nabývá hodnot podobnosti mezi 0 a 1 (největší podobnost objektů). Další možností je vážení různých deskriptorů prostým přiřazením čísla v rozsahu 0-1 wj.         − −= j jj j R yy s 21 12 1 ∑ ∑ = = = p j j p j jj w sw xxS 1 12 1 1212 2115 ),( Vícerozměrné statistické metody Asymetrické binárníkoeficienty Jiří Jarkovský, SimonaLittnerová:Vícerozměrnéstatistickémetody Jaccardův koeficient (1900, 1901, 1908) • Všechny členy mají stejnou váhu cba a xxS ++ =),( 217 Jiří Jarkovský, SimonaLittnerová:Vícerozměrnéstatistickémetody Sørensenův koeficient (1948) (Coincidence index, Dice(1945)) • varianta předchozího koeficientu dává dvojnásobnou váhu dvojitým prezencím , protože se může zdát, že přítomnost druhů je více informativní než jejich absence, která může být způsobena různými faktory a nemusí nutně odrážet rozdílnost prostředí. Prezence druhu na obou lokalitách je silným ukazatelem jejich podobnosti. S7 je monotónní k S8, proto podobnost pro dvě dvojice objektů vypočítaná podle S7 bude podobná stejnému výpočtu S8. Oba koeficienty se liší pouze v měřítku. Tento index byl poprvé použit Dicem v R-mode studii asociací druhů. Jiná varianta tohoto koeficientu dává duplicitním prezencím trojnásobnou váhu. cba a xxS ++ = 2 2 ),( 218 cba a xxS ++ = 3 3 ),( 218 Jiří Jarkovský, SimonaLittnerová:Vícerozměrnéstatistickémetody Sokal & Sneath (1963) • navržen jako doplněk Rogers & Tanimotova koeficientu(S2), dávádvojnásobnou váhu rozdílům ve jmenovateli. cba da xxS 22 ),( 2110 ++ + = Jiří Jarkovský, SimonaLittnerová:Vícerozměrnéstatistickémetody Russel & Rao (1940) • navržená míra umožňuje porovnání počtu duplicitních prezencí (v čitateli) proti celkovému počtu druhů, nalezených na všech lokalitách, zahrnujícím druhy, které chybějí (d) na obou uvažovaných lokalitách. p a xxS =),( 2111 Jiří Jarkovský, SimonaLittnerová:Vícerozměrnéstatistickémetody Kulczynski (1928) • koeficient porovnávající duplicitníprezence s diferencemi cb a xxS + =),( 2112 Jiří Jarkovský, SimonaLittnerová:Vícerozměrnéstatistickémetody Binární verze asymetrického kvantitativního Kulczynski koeficientu (1928) • Mezi svými koeficienty pro presence/absence data zmiňují Sokal & Sneath (1963) tuto verzi kvantitativního koeficientu S18, kde jsou duplicitní prezence srovnávány se součty okrajů tabulky (a+b) a (a+c).       + + + = ca a ba a xxS 2 1 ),( 2113 Jiří Jarkovský, SimonaLittnerová:Vícerozměrnéstatistickémetody Ochiachi (1957) • použil jako míru podobnostigeometrický průměr poměrů a k počtu druhů na každé lokalitě,tj. se součty okrajůtabulky(a+b) a (a+c), tento koeficient je obdobouS6, bez části, týkajícíse double-zero (d). ))(()()( ),( 2114 caba a ca a ba a xxS ++ = ++ = Jiří Jarkovský, SimonaLittnerová:Vícerozměrnéstatistickémetody Faith (1983) • V tomto koeficientu je neshoda (přítomnost na jedné a absence na druhé lokalitě) vážena proti duplicitníprezenci. Hodnota S26 klesá s růstem double-zero p da xxS 2/ ),( 2126 + = Vícerozměrné statistické metody Práce s asociační maticí Jiří Jarkovský, SimonaLittnerová:Vícerozměrnéstatistickémetody Asociační matice • Typickáasociační matice je čtvercová matice • Typickáasociační matice je symetrická kolem diagonály – Ve speciálních případech existují i asymetrické asociační matice • Diagonálaobsahuje0 (v případě vzdáleností) nebo identitu objektu se sebou samým (podobnosti,obvykle 1 nebo 100%) • Asociační matice může být spočtena mezi objekty pomocí metrik podobnostia vzdálenosti (Q mode analýza)nebo mezi proměnnýmipomocí korelací a kovariancí (R mode analýza) • Asociační matice mohou být jak vstupem do vícerozměrných analýztak vstupem pro klasické jednorozměrné statistické výpočty, kdy základníjednotkou není jeden objekt, ale podobnost/vzdálenostdvojice objektů 47 Jiří Jarkovský, SimonaLittnerová:Vícerozměrnéstatistickémetody Příklad výpočtu asociační matice 48 Asociační matice euklidovských vzdáleností mezi rostlinami Jiří Jarkovský, SimonaLittnerová:Vícerozměrnéstatistickémetody Histogram jako popis asociační matice 49 Euclid 0 200 400 600 800 1000 1200 1400 Jiří Jarkovský, SimonaLittnerová:Vícerozměrnéstatistickémetody Vztahy mezi různými metrikami vzdáleností 50 Euclid Euclid standardized Squared Euclid standardized Manhattan standardized