1 Kriging 20.3.2024 2 Kriging ̶ Geostatistický postup pro konstrukci lineárního odhadu minimální odchylky v místě, kde je hodnota neznámá ̶ Založen na váženém průměru, jehož váhy jsou optimalizovány tak, aby chyba odhadu byla minimální ̶ Hlavními prvky pro odhad vah v krigingu jsou: ̶ blízkost údajů k odhadovanému místu ̶ redundance mezi daty ̶ variogram ̶ Nepoužívá se přímo pro mapování prostorového rozložení atributu (někdy, když je atribut hladký, nebo potřebujeme pracovat pouze s interpolacemi), používá se však pro tvorbu podmíněných distribucí pro stochastickou simulaci 3 Vlastnosti krigingu ̶ Účelem krigingu není vytvořit hezkou křivku nebo plochu ̶ Kriging dává shlazený průběh prostorové veličiny, který minimalizuje chybu odhadu, viz obr. 1 Obr. 1 Průběh prostorové veličiny 4 Variogram/Semivariogram ̶ Často používáno jako synonyma, nicméně rozdíl je v jednotlivých definicích a matematickém detailu (Semivariogram popisuje polovinu průměrné kvadratické rozdílnosti mezi páry datových bodů jako funkci vzdálenosti mezi těmito body, zatímco Variogram ve své méně striktní definici představuje celkový rozptyl) ̶ Grafické znázornění konceptu prostorové autokorelace ̶ strukturní funkce - popisuje strukturu prostorové veličiny ̶ vzdálenost středů tříd se nazývá krok (lag) ̶ modelujeme teoretický SV pomocí parametrů tak, aby co nejlépe vystihoval datovou sadu. Teoretický SV určuje váhy. Oproti IDW je to mnohem víc objektivní způsob. 5 ̶ Schéma výpočtu empirického variogramu 6 ̶ Teoretický variogram a jeho základní parametry ̶ nugget - odsazení počátku modelu, může být přičítán buď mikrovariabilitě nebo chybě měření ̶ range (dosah) – body nacházející se za dosahem nejsou prostorově autokorelovány ̶ sill (práh) – maximální hodnota semivariance 7 8 Vliv parametrů na výslednou interpolaci ̶ Vliv typu variogramu na kriging ̶ Odshora dolů: lineární, exponenciální a gaussovský variogram ̶ Vpravo výsledky interpolace dvojice bodů. 9 ̶ Vliv dosahu (range) variogramu na kriging ̶ Exponenciální variogram s různým range 10 ̶ Vliv nugget efektu ̶ Exponenciální variogram, exponenciální variogram s nugget efektem a čistý nugget efekt. 11 Anizotropie ̶ Směrovost, které lze modelovat pomocí semivariogramu (pokud máme pádný důvod předpokládat, že data v určitém směru jsou prostorově autokorelována silněji) Např. u dat teplot na území, kde je nějaký převládající směr větru. 12 Typy krigingu ̶ Existuje více typů krigingu, které byly navrženy pro různé situace ̶ Ordinary krigin (základní, nejpoužívanější) ̶ Simple kriging (jednoduchý kriging) ̶ Universal kriging (univerzální kriging) ̶ Empirical bayesian kriging (automatická verze přechozích typů krigingu) 13 Ordinary krigin ̶ základní kriging ̶ nejvíce používaný typ ̶ omezuje součet vah na 1, proto střední hodnotu nemusíme znát, průměr by měl být na celém území stejný ̶ BLUE (Best Linear Unbiased Estimate) ̶ průměrná chyba je rovna 0 ̶ rozptyl chyby je minimální 14 Simple kriging ̶ neomezuje váhy a pracuje se zbytky z průměru ̶ cz: univerzální kriging ̶ v datech se nachází trend (střední hodnota není konstantní) Universal kriging 15 EMPIRICAL BAYESIAN KRIGING (EBK) ̶ Automatická verze přechozích typů krigingu ̶ Vstupní data si rozdělí na více podmnožin (Subset Size), pro které odhadne model variogramu 16 EBK Regression Prediction ̶ Je přesnější než EBK, ale pro jeho výpočet je potřeba mít vysvětlující/pomocnou proměnou. ̶ Příklad: Pokud interpoluji teplotu, tak by touto proměnou mohla být nadmořská výška. 17 ESDA v Geodě ̶ Linking Histograms ̶ Linking Box Plots ̶ Brushing Scatter Plots and Maps ̶ Percentile map ̶ Box Map ̶ Cartogram ̶ (Map Animation, Conditional Maps) 18 Cvičení ̶ Ve cvičení použijeme opět dvě datové sady se kterými už jsme se setkali ̶ Data: Geodatabáze Oregon.gdb ̶ Data teplot jsou ve stupních Fahrenheita. Je tam i DEM. 19 Postup při zpracování ̶ 1) Metodami průzkumové analýzy (Geostatistical Analyst – Explore Data) doplňte Vaše poznatky o povaze vstupních dat ze cv. 2 a 3. Zjistěte, zda vstupní data mají normální rozdělení, zda obsahují trend a je vhodné je podrobit transformaci, zda obsahují outliery, jestli pole bodů vykazuje izotropii atp. Výsledků explorační analýzy využijte při volbě vhodného teoretického modelu při strukturní analýze. ̶ 2) Pomocí nástroje Geostatistical Wizard zvolte metodu interpolace krigování (Kriginig/CoKriging) a v rámci ní metodou tzv. základního krigování (Ordinary Kriging) s pomocí modelování semivariogramu vytvořte mapu interpolovaných hodnot. 20 ̶ 3) V následné strukturní analýze proveďte několik nastavení parametrů vhodného teoretického modelu semivariogramu. Prozkoumejte případnou anizotropii vašich vstupních dat. Vašim cílem je nalézt vhodný teoretický model semivariogramu, jehož parametry budou vstupovat do vlastní interpolace metodou krigování jako váhy. Volte různé modely, hodnoty dosahu (range), prahu (sill) a zbytkového rozptylu (nugget). Volit můžete též hodnoty vzdálenosti (lag) - tuto hodnotu mohu zjistit pomocí nástroje Average Nearest Neighbor, na kterou se spojují obdobně vzdálené body při výpočtu empirických hodnot semivariancí a také počet hodnot lag. ̶ Tip - anizotropie ̶ Anizotropii povolíte změněním parametru Anisotropy na "true". Vliv anizotropie pak můžete zkoumat při změně "show search direction" opět na "true" a podobně jako tomu bylo u průzkumové analýzy, můžete zakliknutím a potažením myši měnit zkoumaný směr. 21 ̶ 4) Vhodnost nastavení parametrů semivariogramu kontrolujte hodnotami průměrné chyby predikce (Mean Prediction Error) – ideálně nula a průměrné čtvercové chyby (Root Mean Square Prediction Error) – čím menší, tím lepší odhad. ̶ 5) Vytvořte mapu směrodatné chyby predikce (pravým tlačítkem na vytvořený korigovaný povrch Change Output to Prediction Standard Error). Z ní určete, která část zpracovávaného území vykazuje největší chyby predikce. Analogicky se vrátíte k původní mapě. ̶ 6) Obdobně vyzkoušejte Simple a Universal kriging. U metody Simple kriging použijte Normal Score Transformation (defaultní) a u Universal kriging odstranění trendu (trend se v prvním kroce odstraní, poté se modeluje semivariogram na reziduích a po provedení interpolace se odstraněný trend opět přičte). ̶ Tip ̶ Všechny tři uvedené druhy krigingu umožňují kromě samotných interpolací počítat i další druhy povrchů - kvantilové a pravděpodobostní mapy. 22 ̶ 7) Vyzkoušejte EBK ̶ 8) Použijte nástroj Extract Multi Values To Points (do bodové vrstvy teplot se propíše hodnota nadmořské výšky z rastru) k zjištění korelace teploty a nadmořské výšky. Vyzkoušejte EBK Regression Prediction. - Source Dataset: vstupní data - Dependent Variable: parametr, který interpolujme (Mean Aug Temp) - Raster 1: proměnná, která pomůže zpřesnit interpolaci teplot (Elevation) ̶ 9) Porovnejte mezi sebou jak EBK a EBKRP, tak předchozí 3 metody krigingu.