NEPŘÍMÉ ORDINACE CA, DCA, PCOA A NMDS 1 KORESPONDENČNÍ ANALÝZA CORRESPONDENCE ANALYSIS (CA) ozaložena na konceptu niky (Hutchinson 1957) •druhy vykazují unimodální odpověď na ekologické gradienty, optima druhů stejně jako jejich niky se vzájemně liší •CA hledá takové gradienty, na nichž se niky druhů maximálně separují • ozachovává Χ2 (chi kvadrát) vzdálenosti •odráží rozdíly v relativním zasoupení druhů vážené celkovou početností •Netrpí problémem dvojitých absencí (double zeros) •možné použít na přímá data početností •nesmí být negativní hodnoty a prázdné vzorky •V ekologii CA zavedena Markem Hillem v roce 1973 pod názvem reciprocal averaging – což je algoritmus, který se používá pro konstrukci ordinačních os • 2 SIMULOVANÁ DATA JEDEN EKOLOGICKÝ GRADIENT osimulovaný gradient dlouhý 5000 jednotek o300 druhů s unimodální odpovědí, různými šířkami nik o500 vzorků náhodně rozmístěných podél gradientu o 3 species_response_curves.png CA – ŠKÁLOVÁNÍ ORDINAČNÍCH SKÓRE ostejně jako u PCA 2 častá škálování o •1 – zaměřeno na vzorky, umístění vzorků odpovídá váženému průměru druhů, jsou zachovány X2 vzdálenosti mezi vzorky • •2 – zaměřeno na druhy, umístění druhů odpovídá váženému průměru vzorků, zachovává X2 vzdálenosti mezi druhy 4 CA – ORDINAČNÍ DIAGRAM (DRUHY A VZORKY) 5 ARTEFAKTY NEPŘÍMÝCH ORDINACÍ SIMULOVANÁ DATA 6 PCA - podkova CA - oblouk o vzorky + druhy ARTEFAKTY V ORDINACÍCH PŘÍČINY odůsledek algoritmu (lineární nezávislost všech os), ale kvadratická není ošetřena odůsledek projekce (nelineární vztahy mezi druhy -> lineární prostor) o 7 http://ordination.okstate.edu/3Gauss.jpg http://ordination.okstate.edu/3gauss3d.jpg ORDINAČNÍ DIAGRAMY 8 lineární metoda unimodální metoda ARTEFAKTY V ORDINACÍCH MOŽNOSTI ŘEŠENÍ oodstranění trendu z ordinačních os (detrending) •detrendovaná korespondenční analýza, Detrended Correspondence Analysis (DCA, Hill & Gauch 1980) •detrending by segments (nejčastější) •detrending by polynomials opoužití takových ordinačních technik, které umožňují ordinaci vzorků v prostoru pomocí jiných metrik než je Euklidovská distance (PCA) nebo chi-kvadrát distance (CA) •analýza hlavních koordinát, Principal Coordinate Analysis (PCoA) •nemetrické mnohorozměrné škálování, Non-metric Multidimensional Scaling (NMDS) o o 9 DCA – ODSTRANĚNÍ TRENDU (Detrended Correspondence Analysis, detrendovaná korespondenční analýza) •Krok 1 – rozdělení první osy na několik segmentů • • • • • • •Krok 2 – vycentrování druhé osy každého segmentu kolem nuly o 10 http://ordination.okstate.edu/boomca.jpg http://ordination.okstate.edu/casegments.jpg http://ordination.okstate.edu/carecentered.jpg http://ordination.okstate.edu/casegments.jpg DCA – ODSTRANĚNÍ TRENDU (Detrended Correspondence Analysis, detrendovaná korespondenční analýza) •Krok 3 – nelineární přeškálování první osy • • • • • • • • • • • • o 11 http://ordination.okstate.edu/boomdca.jpg http://ordination.okstate.edu/carecentered.jpg Výsledek škálování: •osy naškálované v jednotkách směrodatné odchylky (SD) • •celé druhové složení se obmění na 4 SD •nelinární přeškálování první osy odstraňuje nahloučení vzorků na koncích gradientů – a zajišťuje konstantní betadiverzitu •polovina druhového složení se obmění na délce gradientu 1-1,4 SD Výhody a nevýhody: Lneelegantní metoda, která je někdy přirovnávána k použití kladiva na data (hlavně část týkající se rozdělení osy na segmenty a jejich centrování) Lvýsledek je silně ovlivněn arbitrárním rozhodnutím o počtu segmentů (doporučuje se vyzkoušet více možností) Lpokud jsou v datech dva nebo více hlavních gradientů (ordinačních os), DCA si s nimi neporadí (detrending do určité míry poškodí druhou a vyšší ordinační osy) Ji kladivo, pokud je v rukou odborníka, může být použito efektivně - metoda často dává ekologicky dobře interpretovatelné výsledky Josy DCA jsou v jednotkách SD, které umožňují zjistit, jak dlouhý gradient naše data pokrývají VÝBĚR ORDINAČNÍ METODY NA ZÁKLADĚ DCA LINEÁRNÍ NEBO UNIMODÁLNÍ? •Pokud je délka 1. osy DCA • omenší než 3 SD – homogenní data - lineární metoda ovětší než 4 SD – heterogenní data - unimodální metoda ov rozmezí 3-4 SD – obě techniky pracují rozumně • •Platí jen pro detrendování po segmentech a délku první osy! o 12 PCOA – PRINCIPAL COORDINATE ANALYSIS (analýza hlavních koordinát) ometoda založená na nepodobnostech mezi vzorky ovstupní data – matice nepodobností mezi vzorky •Bray-Curtis (percent dissimilarity) – vhodná metrika nepodobnosti pro abundanční data; netrpí problémem dvojitých nul •Sörensen, Jaccard index – pro presence/absence data; netrpí problémem dvojitých nul •pokud zvolím Euklidovskou vzdálenost -> obdoba PCA •pokud zvolím Chi-kvadrát vzdálenost -> obdoba CA oumístí objekty na základě jejich nepodobností do Euklidovského prostoru (tvořeného souřadnicemi – skóre vzorků na osách) oPři převodu nepodobností (B-C, Sör, Jacc) do Eukleidovkého prostoru mohou vznikat osy s negativními eigenvalues a skóre tvořenými imaginárními čísly •Problém pro intepretaci výsledků (množství vysvětlené variability), •Často lze vyřešit odmocněním původní nepodobnosti (zejuména u semimetrických nepodobností - B-C, Sör) osynonymum MDS – (metric) MultiDimensional Scaling o o 13 PCOA – PŘÍKLAD NA VZDÁLENOSTECH MEZI MĚSTY 14 Vzdálenosti mezi městy (km) NMDS - NON-METRIC MULTIDIMENSIONAL SCALING) NEMETRICKÉ VÍCEROZMĚRNÉ ŠKÁLOVÁNÍ onemetrická varianta PCoA (nepracuje přímo s distancemi mezi vzorky, ale s jejich pořadím) ovstupní data – matice nepodobností mezi vzorky oiterativní algoritmus, který nemusí pokaždé dojít ke stejnému výsledku (lokální optima) oStress – parametr kvality analýzy onutno určit počet dimenzí, se kterými bude metoda pracovat •Buď počet zobrazovaných dimenzí nebo tento počet+1 •Je dobré zkusit více hodnot k (typicky až 5) a sledovat, kde dochází k prudkému poklesu stresu. Toto k následně zvolíme pro konečnou analýzu ona rozdíl od PCoA optimalizuje výsledné vzdálenosti mezi vzorky do několika málo (dvě – tři) dimenzí • o 15 NMDS – SHEPARDŮV DIAGRAM 16 Pro stress-value přibližně platí: < 0.05 – vynikající < 0.1 – výborný < 0.2 – dobrý > 0.3 – špatný (Clarke & Warwick 2001) nepodobnost mezi vzorky POROVNÁNÍ METOD DCA A NMDS 17 DCA NMDS při větším počtu vzorků tvoří trojúhelník nebo pěticípou hvězdu (artefakt) tradiční algoritmus má tendenci jakákoliv data zobrazit jako kouli KTEROU NEPŘÍMOU ORDINACI ZVOLIT? o 18 Měřené proměnné - Parametry prostředí - Morfometrická data Druhové složení PCA ANO (standardizace po proměnných) ANO (ale tyicky vyžaduje standardizaci po vzorcích – např. Hellingerova standardizace) DCA NE ANO – dobře identifikuje gradienty v datech PCoA ANO, pokud nelze použít std-PCA; např. Gower dissimilarity pro kombinaci kategoriálních a kvantitativních proměnných ANO (Bray-Curtis pro abundance; Jaccard nebo Sörensen pro pres/abs data) Dobře identifikuje gradienty. NMDS NE ANO – dobře zobrazuje vzdálenosti mezi vzorky v 2D prostoru přes více (ale ne mnoho!) gradientů PROBLÉM VZÁCNÝCH DRUHŮ onázor, že mají příliš velký relativní vliv na výslednou ordinaci v unimodálních metodách (Legendre and Gallagher 2001) oGreenacre (2013) naopak demonstruje, že příspěvek vzácných druhů k X2 vzdálenostem je malý odownweighting rare species •(nepříliš) sníží početnosti „vzácných“ druhů •vzácnost stanovena pomocí inverzního Simpsonova indexu •Iweigh parameter v cca()/decorana() •Diskuze o downweighting na: •http://r.789695.n4.nabble.com/ordination-in-vegan-what-does-downweight-do-td4010352.html oObecně je dobré odstranit druhy s 1 výskytem – představují prakticky jen neinterpretovatelný šum v datech oU velkých dat (tisíce vzorků) s omezenou kvalitou (fytocenologické databáze) i druhy s více výskyty – < 10, < 20 apod. oOdstranění vzácných druhů může „stvořit“ prázdné vzorky! o 19