1 Modelování prostorového uspořádání s využitím prostorové autokorelace (SPATIAL AUTOCORRELATION) Jak analýza kvadrátů tak analýza vzdálenosti nejbližšího souseda pracují pouze s polohou bodů. Nerozlišují body podle hodnot jejich atributů. Oba parametry (polohu i atributy) hodnotí prostorová autokorelace (SA) – je tedy metodou vhodnější. Východiska prostorové autokorelace: Většina jevů se v prostoru mění spojitě. Blízké body budou mít i podobné hodnoty studovaného jevu a naopak. (First law of geography - Tobler, 1970) Koncept prostorové autokorelace • Prostorová autokorealce udává, do jaké míry hodnoty atributu v určitém bodě souvisí či nesouvisí s hodnotami v bodech okolních • Pravidelné uspořádání hodnot proměnné indikuje vysokou prostorovou autokorelaci • Náhodné uspořádání bodů vykazuje nízkou prostorovou autokorelaci Prostorová autokorelace • Pozitivní prostorová autokorelace – atributy sousedních či blízkých bodů mají podobné hodnoty • Negativní prostorová autokorelace – atributy sousedních či blízkých bodů mají odlišné hodnoty Průměrný příjem Moran’s I: 0,66 Náhodná proměnná Moran’s I: 0,012 Moranův index I - příklad Koeficienty prostorové autokorelace Míry prostorové autokorelace kombinují v jednom výrazu míry podobnosti atributů i míry podobnosti polohy. Mezi nejpoužívanější koeficienty prostorové autokorelace náleží: • Gearyho poměr C (Geary’s Ratio) • Moranův index I (Moran’s I) Lze jich využít pro intervalová a poměrová data. Obě statistiky lze využít jako globální či lokální míry prostorové autokorelace ∑ ∑= = n i n j ijij wc1 1 cij – podobnost atributu v bodech i a j wij – podobnost polohy bodů i a j. wii = 0 pro všechny body xi – hodnota studovaného atributu v bodě i n – počet bodů ve vyšetřovaném vzorku Míry prostorové autokorelace 2 Koeficient prostorové autokorelace - SAC (spatial autocorrlelation coefficient) je úměrný vážené míře podobnosti atributů bodů – obecně: Koeficienty prostorové autokorelace ∑∑ ∑∑ = = = = ⋅ ≈ n i n j ij n i n j ijij w wc SAC 1 1 1 1 Gearyho poměr C: V případě Gearyho poměru se podobnost hodnot atributu mezi dvěma body vypočte podle následujícího vztahu: 2 )( jiij xxc −= ∑∑ ∑∑ ∑∑ ∑∑ = = = = = = = = ⋅ −⋅ = ⋅ ⋅ = n i n j ij n i n j jiij n i n j ij n i n j ijij w xxw w wc C 1 1 2 1 1 2 1 1 2 1 1 2 )( 2 σσ kde σ2 je rozptyl hodnot atributu x s průměrem x )1( )( 1 2 2 − − = ∑= n xx n i i σ Moranův index I )()( xxxxc jiij −⋅−= V případě Moranova indexu se podobnost hodnot atributu v bodech i a j vyjádří následovně: ∑∑ ∑∑ ∑∑ ∑∑ = = = = = = = = −⋅−⋅ = ⋅ = n i n j ij n i n j jiij n i n j ij n i n j ijij ws xxxxw ws wc I 1 1 2 1 1 1 1 2 1 1 )()( kde s2 je v tomto případě výběrový rozptyl: n xx s n i i∑= − = 1 2 2 )( Definování míry podobnosti polohy bodů Podobnost polohy bodů i a j, - hodnota wij. se určí jako inverzní hodnota vzdálenosti těchto bodů. Tedy podle výše uvedených předpokladů dáváme malou váhu hodně vzdáleným bodům a velkou váhu bodům blízkým tedy: ij ij d w 1= Obor hodnot koeficientů prostorové autokorelace Rozdíly mezi oběma indexy jsou dány způsobem výpočtu rozdílů mezi hodnotami atributu. Obor hodnot, kterých mohu oba indexy nabývat se tedy také liší, jak uvádí následující tabulka: Prostorové uspořádání Gearyho poměr C Moranův index I Shlukové uspořádání, sousední body vykazují podobné hodnoty 0 < C <1 I >E(I) Náhodné uspořádání, body nevykazují znaky podobnosti C ~ 1 I ~ E(I) Pravidelné uspořádání, sousední body vykazují rozdílné charakteristiky 1 < C < 2 I < E(I) kde E(I) = (-1)/(n-1) je očekávaná hodnota indexu Předpoklad náhodnosti a předpoklad normality Při studiu prostorového uspořádání, můžeme předpokládat dva základní způsoby, kterými jsou atributy přiřazeny jednotlivým bodům. 1. Předpoklad náhodnosti (randomization, nonfree sampling) – předpokládáme, že hodnoty atributů v bodech představují pouze jednu z možných variant uspořádání při použití stejné množiny hodnot. 2. Alternativně můžeme předpokládat, že hodnoty atributů v množině studovaných bodů jsou pouze jednou z nekonečného množství možností. Každá hodnota je nezávislá na hodnotách jiných v množině bodů – předpoklad normality (normality, free sampling). Příklad: Studovaná plocha obsahuje sedm bodů: Předpoklad náhodnosti – může existovat pouze různá konfigurace 4 „černých“ a 3 „bílých“ bodů. Předpoklad normality - může existovat různá konfigurace jakéhokoliv (0 až 7) počtu „černých“ a „bílých“ bodů. 3 Určení odhadů očekávaných hodnot • Výše uvedené předpoklady náhodnosti ( R ) a normality (N) ovlivňují způsob výpočtu očekávaných (E – expected) hodnot i hodnot rozptylu. • Očekávané hodnoty indexů a hodnoty rozptylů potřebujeme pro testování, zda se vypočtené hodnoty indexů C a I statisticky významně liší od náhodného uspořádání. [ ] 2 2 21 )1(2 4)1)(2( )( Wn WnSS CVARN + −−+ = ∑∑= = = n i n j ijwW 1 1 2 )(1 1 2 1 ∑ ∑= = + = n i n j jiij ww S ∑= += n i ii wwS 1 2 ..2 )( 2 1 2 1 4 )( )(       − − = ∑ ∑ = = n i i n i i xx xx k Odhad očekávaných hodnot pro náhodné uspořádání (random pattern) a rozptyly pro Gearyho poměr C 1)( =CEN 1)( =CER [ ] [ ] [ ] 2 222 2 22 2 2 2 1 )3)(2( )1(3 )3)(2(4 )2(63)1( )3)(2( )1(33)1( )( Wnnn knnW Wnnn knnnnSn Wnnn knnnSn CVARR −− −−− + −− +−−−+− − −− −−+−− = kde Odhad očekávaných hodnot Moranova indexu I a hodnot rozptylu pro náhodné uspořádání ( ) ( ) 1 1 − − == n IEIE RN ( ) [ ]2 22 2 21 2 )( )1( 3 )( IE nW WnSSn IVAR NN − − +− = ( )[ ] [ ] [ ]2 2 2 21 2 2 2 21 2 )( )3)(2)(1( 3)( )3)(2)(1( 333 )( IE Wnnn WnSSnnk Wnnn WnSSnnn IVAR RR − −−− +−− − −−− +−+− = Máme-li vypočteny očekávané hodnoty indexů a jejich rozptyly, můžeme vyjádřit standardizované hodnoty (Z-skóre) )( )( IVAR IEI Z − = nebo )( )( CVAR CEC Z − = Pro hodnoty Z pak mohou být použity stejné kritické hodnoty, tedy na hladině významnosti α=0,05: -1,96 < Z < +1,96 Určení standardizovaných hodnot Příklad výpočtu měr prostorové autokorelace Interpretace hodnot koeficientů prostorové autokorelace: Pokud zjištěné hodnoty z-skóre padnou vně intervalu (-1,96 ; +1,96), potom se prostorové uspořádání bodů statisticky významně liší (na hladině 5 %) od uspořádání náhodného. Alternativy výpočtu V uvedených vztazích lze modifikovat výrazy pro vyjádření podobnosti polohy. Hodnoty wij mohou nabývat binárních hodnot 0, 1 podle toho, zda jde o body sousední či nikoliv. Jako sousední body považujeme centroidy regionů, které obklopují daný region. Modifikovat lze také váhy vzdálenosti bodů výrazem: b ij ij d w 1= kde koeficient b může nabývat různých hodnot v závislosti na povaze studovaného problému (vzdálenost měřená dosažitelností autem a letadlem je jiná). Hodnota b je často rovna 2. Uvedených koeficientů prostorové autokorelace lze využít pro výpočet podobnosti mezi polygony. 4 Příklady použití měr prostorové autokorelace 10 Highest Crash Frequency Intersections in Honolulu (analýza lokálních a globálních vlivů) 1. Hledání příčin určitého prostorového rozložení jevů Crime analysis (prostorová analýza kriminality) http://www.ncjrs.gov/html/nij/mapping/index.html http://www.icpsr.umich.edu/CRIMESTAT/ Využití měr prostorové autokorelace pro charakterizování struktury v krajinné ekologii 2. testování předpokladu prostorové nezávislosti reziduálních hodnot v regresních modelech • Byla sestavena mapa prostorové variability výšky sněhové pokrývky • Mapa byla sestavena interpolací z bodů (stanic). • Byl použit regresní model závislosti výšky sněhové pokrývky na nadmořské výšce • Na obrázku je mapa reziduálních hodnot – tedy model – naměřená hodnota 2. testování předpokladu prostorové nezávislosti reziduálních hodnot v regresních modelech Prostorová regrese DEM 2. testování předpokladu prostorové nezávislosti reziduálních hodnot 5 Sestavení regresní závslosti Pole srážek vytvořené pomocí regresního modelu R = DEM*0,286 + 421,9 Testování vhodnosti modelu Analýza reziduálních hodnot Rezidua jsou vzdálenosti skutečných hodnot yi od modelem odhadnutých hodnot yj` Zvolený regresní model považujeme za vhodný, pokud reziduální hodnoty splňují všechny následující podmínky: • rezidua jsou náhodná a nezávislá • mají normální rozdělení s nulovým průměrem a konstantním rozptylem • rozptyl reziduí je konstantní. Pole reziduálních hodnot Analýza prostorové autokorelace reziduálních hodnot Moranův Index I Analýza prostorové autokorelace reziduálních hodnot Moranův Index I INTERPRETACE: Reziduální hodnoty jsou prostorově nezávislé, regresní model závislosti R na DEM je vhodný 6 Jak interpretovat výsledek v případě prostorové závislosti reziduálních hodnot? I >> 0 nebo I << 0 • sampling (výběr vzorků) viz. dále • další nezávisle proměnná Y = X1*a + X2*b + c Možná řešení? Využití měr prostorové autokorelace bodů 3. SAMPLING (vzorkování) testování předpokladu prostorové nezávislosti výběru bodů pro následnou interpolaci • řada interpolačních algoritmů vyžaduje nezávislost vstupních hodnot (náhodnost) • tuto lze měřit měrami prostorové autokorelace K – funkce (Ripley's K function) Zjišťuje celkový počet všech bodů, které se kolem bodu vyšetřovaného vyskytují do určité zvolené vzdálenosti Je-li tento počet bodů větší než počet bodů, který by odpovídal náhodnému rozdělení, potom body jeví tendenci se shlukovat. Další míry prostorové závislosti K - funkce ( ) ∑∑≠ = ji ijijdI n A dK 2 A – plocha území n – počet bodů d – vzdálenost (zvolený poloměr) I – váha: I = 1 pokud dij < d I = 0 pokud dij > d Transformace K - funkce ( ) ( )1− = ∑∑≠ nn dIA dL ji ijij π Interpretace: • při zcela náhodném rozdělení bude přímka v grafu svírat s osou x úhel 45° • Bude-li průběh přímky hodnot L vyšetřovaných bodů nad touto přímkou – tendence ke shlukování • Bude-li průběh přímky hodnot L vyšetřovaných bodů pod touto přímkou – tendence k rovnoměrnému rozložení bodů Možnosti využití prostorové autokorelkace • popis a identifikace struktury, uspořádání, hledání příčin • identifikace shluků, odlehlých hodnot (viz. lokální míry) • odhalení trendu v datech • testování vhodnosti použitých regresních modelů • princip vybraných metod interpolace