1 KRIGING geostatistické metody interpolace Kriging K této optimalizaci se provádí tzv. strukturní analýza založená na studiu tzv. strukturních funkcí – např. semivariogramu. Semivariogram z empiricky zjištěných dat je nahrazen teoretickým modelem a parametry tohoto modelu jsou použity ve vlastním krigování. ∑= ⋅= n i ii xzxz 1 0 )()(ˆ λ Skupina interpolačních metod, které optimalizují výběr bodů okolí, ze kterých je odhadována nová hodnota podle obecného modelu: Kriging je založen na odhadu závislosti průměrné změny v hodnotách studované veličiny a vzdálenosti měřených bodů. Metoda krigování se často označuje akronymem BLUE (Best Linear Unbiased Estimator – tedy nejlepší lineární nezkreslený odhad). Výchozí podmínky krigování: Vlastnosti krigování Odhadovaná hodnota je vypočtena jako lineární kombinace vstupních hodnot Nezkreslený (nestranný) odhad značí, že průměrná chyba tohoto odhadu je rovna nule Odhad je nejlepší, protože je minimalizován rozptyl odhadu ∑= ⋅= n i ii xzxz 1 0 )()(ˆ λ kde pro váhy platí ∑= = n i i 1 1λ .min)ˆ( 2 =−∑ ii zz ( ) 0ˆ =− ii zzE Pokud prostorově závislá náhodná kolísání nejsou překryta nekorelovaným šumem, potom může být semivariogram využit k určení vah λi potřebných pro interpolaci, kdy váhy jsou odhadnuty geostatistickými metodami. Váhy λi jsou zvoleny tak, aby odhad byl nestranný a odhad rozptylu byl menší, než jakákoliv jiná lineární kombinace pozorovaných hodnot (minimální). Vlastnosti krigování Přitom pro minimální rozptyl hodnot platí výraz : ∑= += n i iie xx 1 0 2 ),(ˆ φγλσ )(ˆ 0xz ),( 0xxiγ semivariance proměnné z mezi body xi a x0 Lagrangeův multiplikátor, který zajišťuje požadavek minimalizace odchylek a zároveň podmínku, že suma vah je rovna jedné. φ ∑= =+ n i jjii xxxx 1 0 ),(),( γφγλ pro všechna j.kde PŘÍKLAD: Výpočet neznámé hodnoty v bodě metodou základního krigingu. Postup řešení:                       =                                             1 . . . . . . *. 01...11 1... ... ... ... 1... 1... 0 20 10 2 1 21 22221 11211 nnnnnn n n γ γ γ φ λ λ λ γγγ γγγ γγγ 2 Postup řešení: 2. Řešíme soustavu rovnic, kde jednotlivé členy mají následující význam: bA =⋅λ A – matice semivariancí mezi všemi dvojicemi bodů b – vektor semivariancí mezi všemi body a bodem predikovaným λ – vektor vah jednotlivých bodů Φ – tzv. Lagrangeův člen 3. Soustavu rovnic řešíme pro váhy λ, tak, aby byla splněna podmínka 1=∑λ (proto je v soustavě použit člen Φ)       =⋅− φ λ bA 1 1. Na základě předem provedené strukturní analýzy použijeme vhodnou strukturní funkci (např. sférický semivariogram) s příslušnými hodnotami parametrů 4. K určení hodnot semivariancí je zapotřebí vytvořit matici vzdáleností mezi datovými body a vektor vzdáleností mezi měřenými body a bodem predikovaným 5. Řešením soustavy rovnic získáme hodnoty vah λ a hodnotu Φ 6. Vypočteme predikovanou hodnotu v bodě (i=0): 7. Vypočteme rozptyl odhadu: ∑= ⋅= n i ii xzxz 1 0 )()(ˆ λ ∑= += n i iie xx 1 0 2 ),(ˆ φγλσ Z(xi=0) =4,560 σe 2 = 4,008 Postup řešení: Prediction map, základní krigování (ordinary kriging) Prediction standard error map, základní krigování (ordinary kriging) • krigování s bodovým odhadem • krigování s blokovým odhadem • základní (ordinary) krigování • jednoduché (simple) krigování • univerzální krigování • indikátorové krigování • pravděpodobnostní krigování • co-kriging • lognormální krigování. Typy krigování Základní krigování (ordinary kriging) ( ) )()( iii xxxZ εµ += kde µ je neznámá hodnota trendu. 3 Jednoduché krigování (Simple kriging) ( ) )()( iii xxxZ εµ += kde µ je známá konstanta. Univerzální krigování (Universal kriging) ( ) )()( iii xxxZ εµ += kde µ(x) je deterministická funkce Indikátorové krigování ( ) )( ii xxI εµ += kde µ neznámá konstanta, ε(x) autokorelovaná náhodná proměnná a I(x) je binární proměnná, která nabývá hodnot 0 nebo 1 - indikátor Výsledkem odhadu je pravděpodobnost překročení určité prahové hodnoty Pravděpodobnostní krigování (probalility kriging) ( ) )())(( 111 xcxZIxI εµ +=>= ( ) )(22 xxZ εµ += kde µ1 a µ2 jsou neznámé konstanty. I(x) je binární proměnná vytvořená indikátorovým prahováním (I(Z(x) > c1) a ε1(x) a ε2(x) jsou dvě náhodné chyby. Co-kriging Proměnné z1 a z2 vykazují prostorovou korelaci. Proměnná z2 je snáze získatelná Hodnot proměnné z2 je využito k interpolaci hodnot proměnné z1. Základní co-kriging využívá následujících modelů: ( ) )(111 xxZ εµ += ( ) )(222 xxZ εµ += kde µ1 a µ2 jsou neznámé konstanty a ε1(x) a ε2(x) dvě náhodné chyby. K odhadům se používají vzájemné (cross) semivariaogramy Blokový odhad při základním krigování 4 Hodnocení a verifikace modelů Krigování jako interpolační metoda umožňuje pro každý interpolovaný bod odhadnout potenciální velikost chyby odhadu. Mapy druhé odmocniny tzv. směrodatné chyby (odchylky) krigingu (Standard error map), 2 eσ Mají-li chyby predikce normální rozdělení, potom 95% interval spolehlivosti predikovaných hodnot lze určit z následujícího vztahu: 2 0 96,1)( exZ σ⋅± kde Z(x0) je odhad hodnoty proměnné z v bodě x0 a σe 2 je rozptyl odhadu. Při opakovaném použití stejného modelu padne 95 % odhadovaných hodnot do uvedeného intervalu Probability map Jaká je pravděpodobnost, že predikovaná hodnota bude v daném bodě větší než prahová hodnota (např. 1 na obr. vlevo)? Při konstantní prahové hodnotě se její pravděpodobnost výskytu pro jednotlivé body mění – tedy lze z ní vytvořit mapu pravděpodobností (probability map). P > 100 mm Quantile map Jaká je v daném bodě hodnota překročená se zadanou pravděpodobností? Při konstantní pravděpodobnosti se budou měnit hodnoty kvantilů a lze je opět prezentovat ve formě tzv. kvantilové mapy (quantile map). P = 90% Křížová validace modelu Jednotlivé body měření (červené) jsou po jednom postupně vynechány ze vstupní množiny dat Ze zbývajících (modrých) je vypočtena hodnota v místě vynechaného bodu. Následně jsou porovnány pozorované a vypočtené hodnoty Validace modelu Vstupní soubor měřených hodnot rozdělí na dvě části – data trénovací a testovací. Trénovací množina dat se použije pro odhad trendu a autokorelačního modelu. Pokud sestavený model vyhovuje trénovacím datům, je ověřen na datech testovacích. Korelační pole měřených a predikovaných hodnot Obecnou vlastností krigingu jako interpolační metody je podhodnocení vysokých hodnot a naopak nadhodnocení hodnot nízkých. Sumární statistika rozdílů pozorovaných a vypočtených hodnot Rozdíly pozorovaných a vypočtených hodnot lze hodnotit dále uvedenými měrami: MPE – mean prediction error - průměr rozdílů měřených a předikovaných hodnot - hodnoty chyb odhadů by měly být nestranné – tedy jejich průměr by se měl rovnat nule. n xzxZ MPE n i ii∑= − = 1 ))()(ˆ( RMSPE (root mean square prediction error) – druhá odmocnina průměrného čtverce vzdálenosti vypočtených hodnot od teoretických. Slouží k porovnání několika různých modelů. Čím menší je RMSPE, tím vhodnější je model (tím bližší jsou vypočtené hodnoty hodnotám měřeným). n xzxZ RMSPE n i ii∑= − = 1 2 ))()(ˆ( 5 Porovnání metod interpolace a) Thiessenovy polygony b) IDW c) Globální polynom 6. řádu) d) Spline s různými parametry (tension) e) Kriging (nulový zbytkový rozptyl, „dlouhý“ dosah f) Kriging velký zbytkový rozptyl, dlouhý dosah resp. nulový zbytkový rozptyl, velmi krátky dosah Porovnání metod interpolace (Burrough, 1986)