1 EKOLOGICKÁ NEPODOBNOST (ECOLOGICAL DISSIMILARITY) VÍCEROZMĚRNÁ NEPODOBNOST (MULTIVARIATE DISSIMILARITY) oVýpočet nepodobností (typicky mezi pozorováními) je prvním krokem mnohorozměrné analýzy •Výsledkem je matice nepodobností • oNepodobnost (dissimilarity) je opak podobnosti (similarity) •D = 1-S oVzdálenost = nepodobnost založená na metrické vzdálenosti •Lze zobrazit v prostoru (n-rozměrném) 2 EKOLOGICKÁ NEPODOBNOST 3 společenstvo jedinec jedinci stejného druhu EKOLOGICKÁ NEPODOBNOST 4 EKOLOGICKÁ NEPODOBNOST Q VS R ANALÝZA 5 Vzorky Druhy druh 1 druh 2 druh 3 vzorek 1 0 1 1 vzorek 2 1 0 0 vzorek 3 0 4 4 vztahy mezi vzorky Q analýza vztahy mezi druhy (nebo obecně mezi deskriptory) R analýza PODOBNOSTI X NEPODOBNOSTI (Q ANALÝZA) •Nepodobnosti a jejich koeficienty (dissimilarity coefficients) oslouží k umístění vzorků v mnohorozměrném prostoru onejnižší hodnota 0 – vzorky mají shodné vlastnosti ohodnota se zvyšuje se zvyšující se nepodobností mezi vzorky •Indexy podobnosti (similarity coefficients) oslouží k vyjádření podobnosti mezi vzorky, ne k jejich umístění do mnohorozměrného prostoru (například ordinace) onejnižší hodnota 0 – vzorky nesdílejí žádný druh onejvyšší hodnota (1 nebo jiná) – vzorky jsou identické • o 6 VZDÁLENOST – CO TO JE? 7 druh 1 druh 2 druh 3 vzorek A 0 1 1 vzorek B 1 0 0 vzorek C 0 4 4 Párové Euklidovské vzdálenosti (jako bychom změřili pravítkem) 0 2 4 2 1 3 2 4 1 3 5 4 1 3 druh 3 B C A EUKLIDOVSKÁ VZDÁLENOST PARADOX PŘI POUŽITÍ ABUNDANČNÍCH DAT opři použití abundančních dat se může stát, že dva vzorky, které sdílí některé druhy (vzorky 1 a 3), budou mít větší vzdálenost než dva vzorky, které nesdílí ani jeden druh (vzorky 1 a 2) 8 1,732 4,243 druh 1 druh 2 druh 3 vzorek A 0 1 1 vzorek B 1 0 0 vzorek C 0 4 4 0 2 4 2 1 3 2 4 1 3 5 4 1 3 druh 3 B C A A B C A 0 1.73 4.24 B 1.73 0 5.74 C 4.24 5.74 0 Community matrix Dissimilarity matrix INDEXY (NE)PODOBNOSTI (DIS-SIMILARITY COEFFICIENTS) •kvalitativní vs kvantitativní okvalitativní – pro presenčně-absenční data okvantitativní – pro data vyjadřující abundance, počty aj. • •symetrické vs asymetrické odvojité nepřítomnosti („double-zero“) – počet druhů, které chybí zároveň v obou vzorcích, v kontrastu s počtem druhů které se vyskytují zároveň v obou vzorcích osymetrické – dvojité nepřítomnosti hodnotí stejně jako dvojité přítomnosti (totiž že vyjadřují podobnost mezi vzorky) oasymetrické – dvojité nepřítomnosti ignorují; nejčastější typ indexů podobnosti v ekologii o 9 PROBLÉM DVOJITÝCH NEPŘÍTOMNOSTÍ (DOUBLE-ZEROS) •Skutečnost, že druh je přítomen zároveň v obou snímcích znamená, že: ovzorky leží uvnitř jeho ekologické niky * lokality jsou si podobné •Naproti tomu skutečnost, že druh chybí zároveň v obou snímcích, může znamenat, že: ovzorky leží mimo ekologickou niku druhu •nevíme ale, zda oba vzorky leží na stejné straně ekologického gradientu mimo niku druhu (a jsou si tedy docela podobné) nebo na stranách opačných (a jsou pak úplně odlišné) ovzorky leží uvnitř ekologické niky druhy, ale druh se ve vzorku nevyskytuje, protože •se tam nedostal (dispersal limitation) •jsme ho přehlédli a nezaznamenali (sampling bias) oDvojité nuly ale mohou být informativní u experimentálních dat a v opakovaných pozorováních •Např. orchideje vyhynuly po aplikaci hnoje na plochy v louce, kde předtím rostly o 10 PROBLÉM DVOJITÝCH NEPŘÍTOMNOSTÍ (DOUBLE-ZERO PROBLEM) ovzorky 1 až 3 jsou seřazeny podle vlhkosti stanoviště – vzorek 1 je nejvlhčí, vzorek 3 nejsušší ovzorek 1 a 3 neobsahují ani jeden mezický druh – vzorek 1 je pro tyto druhy příliš vlhký, vzorek 3 příliš suchý osymetrické indexy podobnosti: dvojitá nepřítomnost mezických druhů bude zvyšovat podobnost vzorků 1 a 3 oasymetrické indexy: dvojité nepřítomnosti budou ignorovány o 11 INDEXY PODOBNOSTI PRO KVALITATIVNÍ DATA 12 •a – počet druhů přítomných v obou vzorcích •b, c – počet druhů přítomných jen v jednom vzorku •d – počet druhů, které chybí v obou vzorcích („double zeros“) druh je ve vzorku č. 1 přítomen nepřítomen ve vzorku č. 2 přítomen a b nepřítomen c d a b c vzorek č. 1 vzorek č. 2 d INDEXY PODOBNOSTI PRO KVALITATIVNÍ DATA oJaccardův koeficient podobnosti •podíl shodných druhů ku počtu všech druhů zaznamenaných na páru lokalit •-> metrická distance oSørensenův koeficient •oproti Jaccardovi má společná přítomnost druhů (a) dvojnásobnou váhu •-> semimetrická distance (metrická je odmocnina) •binární forma Bray-Curtis indexu oSimpsonův koeficient •vhodný pro vzorky s velmi rozdílnými počty druhů o 13 a b c vzorek č. 1 vzorek č. 2 d INDEXY (NE)PODOBNOSTI PRO KVANTITATIVNÍ DATA oPercentage similarity • • • •W – množství „shodných“ jedinců, A – počet jedinců v jednom vzorku, B – počet jedinců ve druhém vzorku •xi, yi ... kvantita i-tého druhu ve srovnávaných vzorcích x a y •má rozsah od 0 do 1 •pro presenčně absenční data přechází v 2a / (2a + b + c) = Sørensen •velmi vhodný pro ekologická data •semimetrický (odmocnina je metrická) opercentage dissimilarity (PD, Bray-Curtis index) = 1-PS • 14 NEPODOBNOSTI A PODOBNOSTI - PŘEVODY ovšechny metrické nebo semimetrické indexy podobnosti (kvalitativní i kvantitativní) lze převést na vzdálenosti • • • •kde D je vzdálenost (distance) a S je podobnost (similarity) •odmocninový převod se používá například pro Sørensenův koeficient – zajistí, že vzniklá distance je metrická onaopak to ale vždy neplatí •např. převod Euklidovské vzdálenosti na podobnost lze provést jen na relativní škále 15 nebo VZDÁLENOSTI MEZI VZORKY (DISTANCE MEASURES) oEuklidovská vzdálenost (Euclidean distance) •rozsah: od 0 (identické vzorky), horní mez není dána •rozsah hodnot výrazně záleží na použitých jednotkách •míra citlivá na odlehlé body •symetrická míra vzdálenosti – trpí problémem dvojitých nul • otětivová vzdálenost (chord distance, relativized Euclidean distance) •Euklidovská vzdálenost použitá na datech standardizovaných přes vzorky (method = „normalize“, MARGIN = 1 ve funkci decostand) •rozsah: od 0 (identické vzorky) do 21/2 (vzorky nesdílí žádný druh) •netrpí problémem dvojitých nul • oHellingerova vzdálenost (Hellinger distance) •Euklidovská vzdálenost aplikovaná na data po aplikaci Hellingerovy standardizace •netrpí problémem dvojitých nul •vlastně tětivová vzdálenost vypočítaná na odmocninách abundancí • oChi-kvadrát vzdálenost (chi-square distance) •málokdy se používá přímo na výpočet vzdálenosti mezi vzorky •netrpí problémem dvojitých nul •vyjadřuje vzdálenost mezi vzorky v unimodálních ordinačních metodách (např. v korespondenční analýze, CA) o 16 INDEXY (NE)PODOBNOSTI MEZI DRUHY (R ANALÝZA) o o o o o oDiceův index o o •stejný jako Sørensenův index pro podobnost mezi vzorky •uveden dříve než Sørensen (Dice 1945 vs Sørensen 1948) oPearsonův korelační koeficient r •není vhodný pro data s velkým počtem nul, ani po transformaci ophi-koeficient •Pearson r na kvalitativních datech – ten je naopak velmi vhodný oLze použít i chi-kvadát distanci – • • o 17 V kolika vzorcích je ... druh č. 1 přítomen nepřítomen druh č. 2 přítomen a b nepřítomen c d MATICE (NE)PODOBNOSTÍ MEZI VZORKY (NEBO DRUHY) oje symetrická (podobnost mezi 2. a 3. snímkem = podobnost mezi 3. a 2. snímkem) odiagonála obsahuje pouze nuly (matice nepodobností) nebo pouze jedničky (matice podobností) oV R – dist objekt: pouze oblast pod diagonálou o o 18 1 2 3 4 5 6 7 8 9 10 1 0 12.37 11.70 17.92 13.86 10.58 11.92 10.54 13.82 15.59 2 12.37 0 11.14 13.34 16.58 13.96 9.64 13.56 13.64 13.42 3 11.70 11.14 0 14.42 16.16 11.53 10.34 13.71 14.90 13.78 4 17.92 13.34 14.42 0 18.36 15.78 9.64 17.03 14.42 7.48 5 13.86 16.58 16.16 18.36 0 13.71 14.49 9.00 14.04 15.46 6 10.58 13.96 11.53 15.78 13.71 0 11.31 11.87 10.54 12.85 7 11.92 9.64 10.34 9.64 14.49 11.31 0 13.82 12.77 9.43 8 10.54 13.56 13.71 17.03 9.00 11.87 13.82 0 10.95 14.35 9 13.82 13.64 14.90 14.42 14.04 10.54 12.77 10.95 0 10.39 10 15.59 13.42 13.78 7.48 15.46 12.85 9.43 14.35 10.39 0 matice Euklidovských vzdáleností mezi 10 vzorky MATICE NEPODOBNOSTÍ (BRAY-CURTIS) V R (DATASET BÍLÉ KARPATY) • CMA CEM CMI HUP HUS JAZ KAZ KOR LES1 •CEM 0.3990148 •CMI 0.4188563 0.5626911 •HUP 0.8827586 0.8534923 0.8080000 •HUS 0.8284672 0.8126126 0.8077572 0.4752852 •JAZ 0.7668919 0.6594324 0.5102041 0.7719298 0.8252788 •KAZ 0.9366667 0.9242175 0.8852713 0.7439446 0.7582418 0.8881356 •KOR 0.8747764 0.8162544 0.8178808 0.7355680 0.7386139 0.8324226 0.6804309 •LES1 0.8945455 0.8563734 0.8218487 0.8143939 0.7983871 0.8000000 0.8284672 0.6765286 19 MANTELŮV TEST oTestuje korelaci mezi dvěma (stejně velkými) maticemi (ne)podobností •Spočte Pearson r na základě hodnot nepodobností matic •Testuje pomocí permutačního testu -Permutuje se pořadí vzorků v jedné z matic a spočte se permutované r -To se provede mnohokrát -> nulová distribuce r -děleno celkovým počtem •P = k/(n+1) -k je počet permutací, kdy permutované r >= skurečné r -n je celkový počet permutací (typicky 999 nebo 9999) oPoměrně „primitivní“ metoda oLze použít třeba na testování korelace mezi prostorovou vzdáleností a nepodobností společenstev 20