1 Statistická analýza plošných jevů 1. porovnání prostorového uspořádání studovaného jevu s uspořádáním teoretickým (shlukovým, pravidelným či náhodným) 2. typologie prostorového uspořádání jevů (bez územní souvislosti) 3. regionalizace - seskupování jednotek (polygonů) do vyšších územně souvisejících celků 4. interpolace a vyhlazování areálových dat Studium prostorových vztahů může být zaměřeno na následující typy úloh: • Prostorová autokorelace je významným ukazatelem k hodnocení dynamiky a časových změn v prostorovém uspořádání objektů a pro predikce. • Další význam prostorové autokorelace spočívá ve skutečnosti, že řada statistických ukazatelů (např. regresní modely) požaduje splnění předpokladu náhodnosti výběru objektů a jejich vzájemné nezávislosti. Míry prostorové autokorelace tak mohou potvrdit či vyvrátit splnění uvedených předpokladů. Význam prostorové autokorelace Míry prostorového uspořádání ploch Prostorová autokorelace– hodnoty atributů ploch spolu korelují v závislosti na jejich vzájemné poloze. To je v důsledku podobných přirozených (přírodních) podmínek (např. produkce zemědělských podniků) či v důsledku přirozené spojitosti jevů. Příklad pozitivní prostorové autokorelace (shlukové uspořádání - vlevo) a negativní prostorové autokorelace (disperzní uspořádání – vpravo) Matice prostorových vah (Spatial weight matrices) V případě vyšetřování prostorové autokorelace bodů je podobnost polohy hodnocena pomocí jejich vzdálenosti. V případě prostorové autokorelace plošných objektů je vhodné podobnost polohy hodnotit jinými způsoby, například pomocí vztahů sousedství. Nejprve musí být vztahy sousedství jistým způsobem kvantifikovány – k tomu se využívá tzv. matic prostorových vah Způsoby definování sousedství (Rook’s case – věž, Queen’s case – Dáma) Vedle sousedství je další běžně užívanou mírou prostorové relace plošných objektů vzdálenost jejich centroidů. Binární matice konektivity (BCM – binary connectivity matrix) Analogicky jako v případě linií – binární, čtvercová symetrická matice C s prvky cij, 1 – sousedí, 0 - ne) Vlastnosti BCM: • Prvky na hlavní diagonále mají hodnoty 0 • Matice je symetrická – redundance uložené informace • Suma v řádku nese informaci o počtu sousedů dané jednotky • Pro větší počet prostorových jednotek obsahuje velké množství nul a je tedy paměťově náročná 2 Stochastická matice či matice se standardizovanými řádkovými vahami (RSWM) Nahrazuje jedničky vahou wij , vypočtenou jako poměr mezi hodnotu cij a sumou v řádku – tj. počtem sousedů. Tedy má-li jednotka 4 sousedy, bude její váha rovna 0,25 – tak dostaneme z matice C matici W, označovanou jako matici se standardizovanými řádkovými vahami. Stejně jako matice C má i W na hlavní diagonále nuly, není však již symetrická. Na místo vzdáleností centroidů jsou použity vzdálenosti dvou nejbližších částí dvou polygonů. Takto definované váhy jsou výhodné pro charakterizování prostorových kontaktů či difuze. U takto sestavené matice buňky s nulami mimo hlavní diagonálu (sousedé) odpovídají buňkám s jedničkami v binární matici sousedství. Matice nejbližších vzdáleností Míry prostorové autokorelace areálů Globální míry prostorové autokorelace: • Data nominální - JCS - joint count statistics – Statistika charakteru sousedství • Data intervalová a poměrová - Moranův index I, Gearyho poměr C, G- statistika Prostorová autokorelace se může měnit v rámci studované oblasti Lokální míry prostorové autokorelace • Local Indicator of Spatial Association (LISA) • Lokální verze G-statistiky (local G-statistics). Ke grafickým prostředkům hodnotícím prostorovou autokorelaci patří Moranův diagram (scatterplot, t.j. korelační pole) Statistika charakteru sousedství - Joint count statistics (JCS) Touto metodou lze zjistit, zda uspořádání ploch, které mohou nabývat binárních hodnot vykazuje prvky náhodnosti. Tedy zda existuje pozitivní (clustered pattern) či negativní (random pattern) prostorová autokorelace. Podstata metody: U – zástavba, R – volná krajina. Čtyři typy sousedství: UU, RR, UR, RU. UR + RU < 50% pozitivní prostorová autokorelace. UR + RU > 50%, negativní prostorová autokorelace Náboženské vyznání vybraných obcí v okrese Jindřichův Hradec méně než 30% více než 30% Podíl věřících 0 5 10 15 20 25 30 km Spoje typu AA: 16 Spoje typu BB: 13 Spoje typu AB: 12 Očekávané spoje AA: 12.4025 Očekávané spoje BB: 8.3025 Očekávané spoje AB: 20.295 Rozptyl spojů AA: 31.7103 Rozptyl spojů BB: 22.0578 Rozptyl spojů AB: 41.5552 Testovací hodnota z spojů AA: 0.638852 Testovací hodnota z spojů BB: 1.0002 Testovací hodnota z spojů AB: -1.28678 Příklad analýzy metodou JSC - pozitivní prostorová autokorelace • Jsou využitelné pro intervalová a poměrová data • Vhodnější vlastnosti vzhledem k rozdělení hodnot má index I. • Jsou založeny na porovnávání hodnot atributů sousedních ploch. • Mají-li tyto sousední plochy v celé studované oblasti podobné hodnoty, potom obě statistiky budou svědčit o silné pozitivní prostorové autokorelaci a naopak. • Obě statistiky využívají odlišný přístup k porovnávání hodnot sousedních ploch. Moranův (I) a Gearyho (C) index jako míry prostorové autokorelace plošných jevů 3 Moranův (I) index jako míra prostorové autokorelace plošných jevů ∑ ∑∑ − −− = 2 )( ))(( xxW xxxxwn I i jiij kde xi je hodnota proměnné v ploše i wij jsou váhy, W matice vah Hodnota indexu kolísá od -1 pro negativní prostorovou autokorelaci do +1 pro pozitivní prostorovou autokorelaci. Očekávaná hodnota (případ nulové prostorové autokorelace) )1( 1 − −= n EI Váhy - matice binární či stochastická. Interpretace Moranova I • Budou-li ve zpracovávané oblasti převažovat sousedé s obdobnými hodnotami, Moranův index I bude kladný. • Vypočteme hodnoty I a E(I) a následně musíme zjistit, zda rozdíl mezi nimi je statisticky významný. • Tento rozdíl je opět nutné vztáhnout k míře variability (např. rozptylu) a pomocí ní odvodit standardizovanou hodnotu (z-skóre) )( )( 2 I IEI Zn σ − = • Odhady rozptylu se budou lišit podle způsobu, jakým mohou být hodnoty vyšetřovaného atributu přiřazeny k jednotlivým plochám – viz. předpoklad normality a předpoklad náhodnosti • Pokud je hodnota Zn(I) menší (resp. větší) než -1,96 (resp. 1,96) je hodnota indexu I statisticky významně negativní (resp. pozitivní) na hladině významnosti α=0,05. Příklad 1: Kartogram průměrného příjmu pro sedm států v Ohiu. Z hodnot vypočtených indexů vyplývá, že hodnota Moranova indexu indikuje negativní prostorovou autokorelaci (státy s vysokou hodnotou studovaného atributu jsou blízko států s nízkými hodnotami). Tato tendence však není statisticky významná na hladině 5 %. Omezení globálních měr I, C • rozsah studované oblasti • počet objektů (ploch) I = 0,76 Z = 9,5 Pouze řeší, zda: Podobné blízko sebe – pozitivní prostorová autokorelace Nepodobné blízko sebe – negativní prostorová autokorelace Obecná G - statistika (Getis-Ord statistics) • Indexy I a C mají dobře definované statistické vlastnosti, které popisují prostorovou autokorelaci globálně • Nejsou však efektivní k identifikaci rozdílných shluků prostorového uspořádání uvnitř oblasti. • Identifikují oblasti s podobnými hodnotami atributů, nerozlišují však, zda tyto podobné hodnoty nabývají vysokých či nízkých hodnot. • Shluky ploch (též. místa prostorové koncentrace - spatial concentration) vysokých hodnot vyšetřovaného atributu ve studované oblasti se označují jako „hot spots“, naopak místa se shluky nízkých hodnot jako „cold spots“. • Odlišit oby typy shluků lze pomocí tzv. obecné G-statistiky (general G-statistics). Obecná G - statistika ∑∑ ∑∑= ji jiij xx xxdw dG )( )( • G-statistika je definována vzdáleností d mezi plochou i a plochami sousedními. • Váha wij(d) má hodnotu 1, jestliže se plocha j nachází ve vzdálenosti menší či rovné d od plochy i, jinak je váha rovna 0. • Matice vah je maticí binární a symetrickou, vztahy sousedství jsou definovány vzdáleností d. Suma těchto vah matice se rovná: ji ≠pro∑∑= i j ij dwW )( ji ≠pro 4 Interpretace G - statistiky • Vysoké hodnoty G(d) indikují prostorovou asociaci vysokých hodnot (hot spots) zkoumaného atributu, nízké G(d) potom prostorovou asociaci nízkých hodnot (cold spots). • Před výpočtem G(d) je nutné určit vzdálenost d, která definuje plochy, které budou považovány za sousedy plochy posuzované. Musí být vhodně zvolena tak, aby posuzovaná plocha měla alespoň jednoho souseda. • K interpretaci G(d) je nutné vyčíslit očekávanou hodnotu G(d), tedy E(G) a následně standardizovanou hodnotu z-skóre a tedy i rozptyl hodnoty G(d). Očekávaná hodnota G(d) bude: )1( )( − = nn W GE • Očekávaná hodnota odpovídá nulové prostorové asociaci. Např. je-li vypočtená hodnota G(d) větší než očekávaná, můžeme říci, že pozorované uspořádání vykazuje pozitivní prostorovou asociaci. • Statistickou významnost tohoto tvrzení je opět nutné testovat výpočtem hodnoty rozptylu a z-skóre. Hodnota z-skóre menší než 1,96 indikuje statisticky nevýznamný výsledek na hladině α=0,05. Příklad 2: Jsou použita stejná vstupní data jako v případě I a C indexů. Výchozí matice vzdáleností centroidů je převedena na matici binární na základě zvolené vzdálenosti d (d=30 mil) Výchozí matice vzdáleností centroidů Matice sousedství vypočtená pro d=30 Vypočtená hodnota G(d) vykazuje mírnou úroveň prostorové asociace, podle hodnoty z-skóre však výsledek není statisticky významný. Jinými slovy – dané uspořádání průměrného příjmu v sedmi státech Ohia je spíše výsledkem náhody než určitého systematického procesu. Lokální statistiky prostorové autokorelace • Výše uvedené indexy jsou příkladem indexů globálních. • Hodnoty prostorové autokorelace se mohou v různých suboblastech měnit. Navíc můžeme očekávat, že pozitivní autokorelaci lze nalézt v jednom sub-regionu a negativní v jiném. • LISA (Local Indicators of Spatial Association) - lokální verze Moranova, Gearyho indexu či G - statistiky • Ke zjištění úrovně prostorové autokorelace na lokální úrovni se vypočte hodnota indexu pro každou plochu zpracovávaného území. Distribution (Quartiles) of the NSDAP 1930 Vote in Percentages Distribution of Local Indicators of Spatial Association for the NSDAP 1930 Vote http://www.colorado.edu/IBS/PEC/johno/pub/nazi_long/Pnazi_long.htm Příklad použití lokálních měr prostorové autokorelace Lokální Moranův index pro jednotku i : ∑= i jijii zwzI kde zi a zj jsou odchylky od průměru nebo σ )( xx z i i − = kde σ je směrodatná odchylka xi. • Vysoké hodnoty znamenají kumulaci podobných hodnot atributů (vysokých či nízkých) v sousedních plochách, nízké hodnoty potom kumulaci odlišných hodnot atributů. • Hodnoty wij mohou představovat po řadách standardizovanou matici vah, lze použít i jiných matic vah. Lokální verze Gearyho poměru: ∑ −= j jiiji zzwc 2 )( Shlukování podobných hodnot atributů vede k nízkým hodnotám tohoto indexu a naopak. Lokální G-statistika ∑ ∑= j j jij i x xdw dG )( )( ji ≠pro I v případě lokálních měr je nutné interpretovat hodnoty indexů pomocí očekávaných hodnot, hodnot rozptylu a standardizovaných skóre 5 Příklad 3: Pro data z příkladu 1 byly vypočteny hodnoty lokálního Moranova indexu I (pro každý stát. Jako matice vah byla použita matice stochastická. Výsledky jsou prezentovány ve formě kartogramu. Interpretace: Vysoké hodnoty indexu I mají ty státy, jejichž sousedé mají velmi podobné hodnoty studované charakteristiky. Podle z-skóre žádná z hodnot není statisticky významná a dané uspořádání průměrných příjmů v sedmi státech lze interpretovat jako náhodný proces. Obdobným způsobem lze vizualizovat a hodnotit výsledky analýzy založené na lokálním indexu C a lokální G-statistice. G*i statistic for percentage over 25 years with a higher/professional degree, 5 US midwestern states, 1990 census. Zdroj: http://www.math.uni-klu.ac.at/stat/users/agebhard/ERSA-98-D8-427/node23.html?language=en Příklad mapování „cold spots“ a „hot spots“ s využitím lokální G-statistiky Moranovo korelační pole (Moran Scatterplot) Lokální statistiky vystihují prostorovou heterogenitu v jednotlivých částech studovaného území. Lze jimi identifikovat oblasti s neobvyklými hodnotami měr prostorové autokorelace, které lze označit jako oblasti s odlehlými hodnotami (outliers). Efektivním nástrojem pro takovouto diagnostiku území je Moranovo korelační pole založené na regresním počtu. Předpokládejme, že x značí vektor hodnot xi vyjádřený v odchylkách od průměru )( xxi − Dále W značí po řádcích standardizovanou matici vah. Lze sestavit regresní závislost hodnot Wx na x. Směrnice této regresní závislosti indikuje vzájemný vztah sousedních hodnot atributů. Moranovo korelační pole (Moran Scatterplot) Sestavíme regresní závislost hodnot Wx na x. Směrnice této regresní závislosti indikuje vzájemný vztah sousedních hodnot atributů. IWxax += kde parametr a značí absolutní člen (intercept). • Hodnota I je regresní koeficient reprezentující směrnici a také hodnotou Moranova globálního indexu I. • Vynesení regresní závislosti Wx na x umožňuje identifikovat odlehlé hodnoty. Pokud budou mít všechna pozorování podobné hodnoty prostorové autokorelace, v korelačním poli budou body tvořit regresní přímku. • Pokud některá pozorování budou ukazovat lokálně výrazně vysoké či nízké hodnoty prostorové autokorelace ve vztahu k jejich sousedům, tato pozorování budou v grafu tvořit body výrazně nad či pod regresní čarou. Příklad 4: Hodnota Moranova indexu (viz. Příklad 1) indikuje slabou negativní prostorovou autokorelaci (státy s vysokou hodnotou studovaného atributu jsou blízko států s nízkými hodnotami). Parametr b představuje hodnotu Moranova indexu I. Z grafu je patrné že příjem (x) je nepřímo úměrný vážené hodnotě příjmu (Wx). Množinou bodů lze proložit přímku. Body, které se výrazně odchylují od přímky představují „outliers“ – představují oblasti s výrazně odlišnými hodnotami prostorové autokorelace. Příklad prostorového uspořádání atributu, který vykazuje silnou pozitivní autokorelaci a příslušný Moranův diagram Moranovo korelační pole - Interpretace 6 Z Moranova diagramu lze vybrat plochy vykazující stejné tendence v hodnotách měr prostorové autokorelace – příklad pozitivní prostorové autokorelace GeoDa http://geodacenter.asu.edu/ Zdroj: http://www.academicjournals.org/ajar/fulltext/2011/ Příklad mapování s využitím LISA Local Indicator of spatial association for the degree of soil degradation in Mexico. Cluster map showing the associations between different degrees of soil degradation in the study area. Příklad využití metody JCS