1 Geostatistické metody prostorové interpolace Geostatistické metody interpolace Stochastické metody lokální interpolace, Optimalizují výběr bodů okolí, ze kterých je interpolována nová hodnota. K této optimalizaci se provádí tzv. strukturní analýza založená na studiu tzv. strukturních funkcí ­ např. semivariogramu. Semivariogram z empiricky zjištěných dat je nahrazen teoretickým modelem a parametry tohoto modelu jsou použity ve vlastním krigování. Kriging je založen na odhadu závislosti průměrné změny v hodnotách studované veličiny a vzdálenosti měřených bodů. Základní komponenty spojitého povrchu I ­ trendová složka ­ drift ii ­ regionalizovaná proměnná iii ­ náhodná složka ( ) '' )()( ++= hxxZ Regionalizovaná proměnná se odhaduje v tzv. strukturní analýze pomocí hodnot strukturní funkce - tzv. semivariance (h) Příklad výpočtu měr prostorové variability pro 1D - řadu hodnot průměr = (1+3+6+5+3+1+2+3)/8=3,0 rozptyl=[(1-3)2+(3-3)2+(6-3)2+(5-3)2+(3-3)2+(1-3)2+(2-3)2+(2-3)2]/8=2,75 kovariance(1)=[(1-3)*(3-3)+(3-3)*(6-3)+(6-3)*(5-3)+(5-3)*(3-3)+(3-3)*(1-3)+(1- 3)*(2-3)+(2-3)*(3-3)]/7=1,14 semivariance(1)=[(1-3)2+(3-6)2+(6-5)2+(5-3)2+(3-1)2+(1-2)2+(2-3)2]/7=3,43 semivariance(2)=[(1-6)2+(3-5)2+(6-3)2+(5-1)2+(3-2)2+(1-3)2]/6=9,83 semivariance(3)=[(1-5)2+(3-3)2+(6-1)2+(5-2)2+(3-3)2]/5=12,50 Strukturní analýza Experimentální semivariogram Strukturní analýza v 2D ­ výpočet semivariogramu z naměřených dat: n - počet dvojic bodů pozorování proměnné s atributem z vzdálených o hodnotu h h - tzv. lag - vzdálenost dané dvojice bodů. Experimentální semivariogram (+) s charakteristickými hodnotami pro vzdálenosti h (ˇ) a proložený teoretický model semivariogramu (plná čára) ( ) ( ) ( )( )= +-= n i ii hxzxz n h 1 2 2 1 ^ Strukturní analýza Experimentální semivariogram Teoretický semivariogram 2 Strukturní analýza Prvky (parametry) semivariogramu a - dosah (range), d ­ rozpětí, c0 - zbytkový rozptyl (nugget), c=c0 + c1 - práh (sill), h ­ lag (krok vzdálenosti) Strukturní analýza Efekt anizotropie Příklady teoretických semivariogramů: sférický lineární sinový Základní nástroje průzkumové analýzy prostorových dat Vykreslení množiny hodnot semivariance či kovariance ˇ Každý bod v grafu představuje dvojici bodů v analyzovaném prostoru nacházejících se v určité vzdálenosti (osa x). ˇ Podobnost hodnot interpolované veličiny je vyjádřena semivariancí (osa y). KRIGING jako metoda interpolace = = n i ii xzxz 1 0 )()(^ Odhad hodnoty v bodě x0 a odhad jeho rozptylu = += n i iie xx 1 0 2 ),(^ Je konstruován tak, aby byl minimální = =+ n i jjii xxxx 1 0 ),(),( Hodnoty semivariancí poskytuje strukturní analýza - z vhodného teoretického modelu semivariogramu váhy, které musíme vypočítat Postup řešení: 1. Na základě předem provedené strukturní analýzy použijeme vhodnou strukturní funkci (např. sférický semivariogram) s příslušnými hodnotami parametrů 2. Řešíme soustavu rovnic, kde jednotlivé členy mají následující význam: bA = A ­ matice semivariancí mezi všemi dvojicemi bodů b ­ vektor semivariancí mezi všemi body a bodem predikovaným ­ vektor vah jednotlivých bodů ­ tzv. Lagrangeův člen 3. Soustavu rovnic řešíme pro váhy , tak, aby byla splněna podmínka 1= (proto je v soustavě použit člen ) =- bA 1 4. K určení hodnot semivariancí je zapotřebí vytvořit matici vzdáleností mezi datovými body a vektor vzdáleností mezi měřenými body a bodem predikovaným 5. Řešením soustavy rovnic získáme hodnoty vah a hodnotu 6. Vypočteme predikovanou hodnotu v bodě (i=0): 7. Vypočteme rozptyl odhadu: = = n i ii xzxz 1 0 )()(^ = += n i iie xx 1 0 2 ),(^ Z(xi=0) =4,560 e 2 = 4,008 Postup řešení: 3 Základní krigování (ordinary kriging) ( ) )()( iii xxxZ += kde je neznámá hodnota trendu. Typy krigování Univerzální krigování (Universal kriging) ( ) )()( iii xxxZ += kde (x) je deterministická funkce Indikátorové krigování ( ) )( ii xxI += kde neznámá konstanta, (x) autokorelovaná náhodná proměnná a I(x) je binární proměnná, která nabývá hodnot 0 nebo 1. Hodnocení a verifikace modelů Krigování jako interpolační metoda umožňuje pro každý interpolovaný bod odhadnout potenciální velikost chyby odhadu. Mapy druhé odmocniny tzv. směrodatné chyby (odchylky) krigingu (Standard error map), 2 e Mají-li chyby predikce normální rozdělení, potom 95% interval spolehlivosti predikovaných hodnot lze určit z následujícího vztahu: 2 0 96,1)( exZ kde Z(x0) je odhad hodnoty proměnné z v bodě x0 a e 2 je rozptyl odhadu. Při opakovaném použití stejného modelu padne 95 % odhadovaných hodnot do uvedeného intervalu Křížová validace modelu Jednotlivé body měření (červené) jsou po jednom postupně vynechány ze vstupní množiny dat Ze zbývajících (modrých) je vypočtena hodnota v místě vynechaného bodu. Následně jsou porovnány pozorované a vypočtené hodnoty Validace modelu Vstupní soubor měřených hodnot rozdělí na dvě části ­ data trénovací a testovací. Trénovací množina dat se použije pro odhad trendu a autokorelačního modelu. Pokud sestavený model vyhovuje trénovacím datům, je ověřen na datech testovacích. Korelační pole měřených a predikovaných hodnot Obecnou vlastností krigingu jako interpolační metody je podhodnocení vysokých hodnot a naopak nadhodnocení hodnot nízkých. 4 Sumární statistika rozdílů pozorovaných a vypočtených hodnot Rozdíly pozorovaných a vypočtených hodnot lze hodnotit dále uvedenými měrami: MPE ­ mean prediction error - průměr rozdílů měřených a předikovaných hodnot - hodnoty chyb odhadů by měly být nestranné ­ tedy jejich průměr by se měl rovnat nule. n xzxZ MPE n i ii= - = 1 ))()(^( RMSPE (root mean square prediction error) ­ druhá odmocnina průměrného čtverce vzdálenosti vypočtených hodnot od teoretických. Slouží k porovnání několika různých modelů. Čím menší je RMSPE, tím vhodnější je model (tím bližší jsou vypočtené hodnoty hodnotám měřeným). n xzxZ RMSPE n i ii= - = 1 2 ))()(^( Základní kriging