1 Metody prostorové interpolace Prostorová interpolace slouží k odhadu hodnot určitého jevu či jeho intenzity v libovolném místě studované plochy, pro niž existují známé hodnoty tohoto jevu pouze v určitých lokalitách (meteorologické stanice, výškově zaměřené body apod.) Metod tedy lze využít ke konstrukci spojitých polí, k následné analýze prostorových dat ­ morfometrické a hydrologické modelování, optimální lokalizace apod.) Interpolace ­ skupina metod, které slouží k odhadu neznámých hodnot proměnné v jistých bodech (neměřených) na základě hodnot proměnné v bodech měřených. Prostorová interpolace ­ skupina metod, které slouží k vytváření spojitých povrchů (polí) z bodových měření. Body mohou být lokalizovány v 1, 2 i 3 rozměrném prostoru. Interpolace se může týkat nejenom bodů, ale i linií a ploch. V rámci interpolace je často řešen také problém extrapolace ­ tedy odhad hodnot proměnné vně oblasti definované krajními body měření. Naprostá většina interpolačních postupů je založena na principu prostorové autokorelace ­ tedy na předpokladu, že hodnoty odhadované veličiny v lokalitách blízkých si boudou více podobné než hodnoty v lokalitách vzdálených. Výběr reprezentativních vzorků Lokalizace měřených (odměrných) bodů v zájmovém území. Rozmístění (tzv. sampling) je důležité pro výběr interpolačního algoritmu a úspěšnost vlastní interpolace. Rozmístění ˇ pravidelné ˇ náhodné ˇ stratifikované náhodné Obr. Možné způsoby rozmístění reprezentativních vzorků Prezentace spojitých polí - grid, TIN, izočáry, areály Průzkumová analýza dat (EDA ­ Exploratory Data Analysis) ˇ ESDA ­ Exploratory Spatial Data Analysis ˇ ESTDA ­ Exploratory Spatio ­ Temporal Data Analysis 2 Množina statistických metod a speciálních nástrojů, zvláště grafických metod, používaných k lepšímu porozumění datům, k odhalení jejich důležitých vlastností. Jejím cílem je zjistit základní informace o charakteru vstupních dat v tomto případě za účelem následné interpolace. Postupy a nástroje ESDA jsou využívány i v obecné prostorové analýze dat (studium prostorové autokorelace, pattern detectors). EDA slouží k průzkumu, deskripci, vizualizaci, zvýrazňování základních rysů dat, jejich distribuce (nejen ve smyslu prostorovém). Nástroje EDA jsou často propojeny s vlastní mapou (ESRI, Usng ArcGIS Geostatistical analyst). Základní postupy průzkumové analýzy prostorových dat ˇ výpočet základní popisné statistiky včetně momentů vyššího řádu (asymetrie a špičatosti) ˇ prověření požadavků normality a stacionarity ˇ analýza rozdělení hodnot - analýza histogramu ˇ analýza kvantilového grafu (Q-Q grafu) ˇ zkoumání odlehlých hodnot a jejich případné odstranění ˇ analýza trendu a jeho případné odstranění ˇ případná transformace vstupních dat (log) Rozdělení metod prostorové interpolace a. Metody lokální a globální b. Metody exaktní a aproximující c. Metody spojité a zlomové (abrupt) d. Metody deterministické a stochastické 3 Přehled vybraných interpolačních metod Globální interpolátory využívající analýzy trendu Jestliže se určitá vlastnost v prostoru mění kontinuálně a je spojitá (teplota , nadmořská výška, apod.), lze body z tohoto povrchu interpolovat polynomickou funkcí. Body v neměřených lokalitách lze vypočítat z koeficientů, vypočtených na základě bodů měřených a souřadnic bodů neměřených (interpolovaných). Nejjednodušší způsob - mnohonásobná regrese hodnot atributu vs. geografické souřadnice. Metodou nejmenších čtverců lze nalézt nejvhodnější koeficienty pro daný polynom n-tého řádu. Předpokládá se normální rozdělení. Předpokládejme měření studované veličiny v transektu (profilu). Jestliže hodnoty obecně rostou či klesají (zanedbáme-li náhodná kolísání) - lze hodnoty interpolovat pomocí lineárního regresního modelu: z(x) = b0 + b1x + b0 a b1 - koeficienty - náhodný šum - nezávislý na hodnotách x s normálním rozdělením Není-li povrch rovinou, ale složitějším tvarem - lze ho interpolovat polynomem vyššího řádu, např. kvadrátem: z(x) = b0 + b1x + b2x2 + Zvyšováním stupně polynomu lze vystihnout složitější tvary a redukuje se náhodná složka. Uvedené rovnice platí pro 1D, ve dvourozměrném prostoru budou v rovnici začleněny obě souřadnice x, y: lineární trend: z = b0 +b1x + b2y kvadratický trend: z = b0 + b1x+ b2y + b3x2 + b4xy + b5y2 kubický trend: z = b0+ b1x + b2y + b3x2 + b4xy+ b5y2 + b6x3 + b7x2 y+ b8xy2 + b9y3 Obr. Proložení polynomu 1 až 3 stupně množinou měřených bodů Trendový povrch prezentovaný polynomem vyššího řádu vykazuje značné chyby na okrajích zpracovávaného povrchu (edge effects). Mimo zpracovávané území může nabývat extrémních či dokonce záporných hodnot interpolované vlastnosti (nemajících fyzikální význam- např. záporná hodnota atmosférických srážek). Jde o globální interpolátor, který zřídka prochází měřenými body a který shlazuje lokální odchylky. Protože lokální odchylky jsou prostorově závislé, často se tohoto postupu využívá k definování částí povrchu, které se významně odlišují od obecného trendu. Druhý častý způsob využití je odfiltrování obecného trendu a aplikace lokálních interpolátorů na reziduální 4 složku prostorových změn studovaného jevu. Vypočtený trend lze testovat z hlediska jeho významnosti. Globální interpolátory využívající regresní analýzy V řadě případů existuje zřejmá vazba mezi hodnotami interpolované veličiny a vybranými jinými atributy studovaného prostoru (teplota a nadmořská výška, srážky a vzdálenost od moře, koncentrace znečištění a vzdálenost od zdroje apod.). Lze tedy sestavit empirický model závislosti interpolované veličiny na hodnotách jedné či několika veličin nezávislých. Tento model má následující obecnou formu: z(x) = b0 + b1P1 + b2P2 + b0 ...bn - regresní koeficienty P1 ... Pn - nezávisle proměnné Sestavení regresní závislosti je založeno na metodě nejmenších čtverců, výsledný model může být lineární i nelineární a jako nezávisle proměnné lze kombinovat geografické souřadnice s jinými atributy. Obr. Příklad sestavení regresního modelu závislosti teplotních sum na nadmořské výšce, zápis modelu v prostředí Map Calculator a vytvořená mapa teplotních sum pro ČR Metody lokální interpolace (lokální interpolátory) Výše uvedené globální interpolátory považovaly lokální efekty za náhodný šum. Lokální interpolátory využívají k výpočtu hledané hodnoty pouze určitého počtu měření z předem definovaného okolí počítaného bodu. Obecný postup se sestává z následujících kroků: 1. definování velikosti a tvaru zájmového okolí 2. nalezení měřených bodů v tomto okolí 3. nalezení matematické funkce vystihující kolísání hodnot nacházejících se v okolí daného bodu 4. výpočet hodnoty pro uzly regulérní sítě (grid) Uvedený postup je opakován do té doby, dokud nejsou vypočteny hodnoty interpolované veličiny pro všechny uzly (buňky) gridu. Pro každý konkrétní postup lokální interpolace jsou důležité následující skutečnosti: ˇ druh použité interpolační funkce ˇ velikost, tvar a orientace okolí ˇ počet bodů v okolí zahrnutých do výpočtu ˇ rozložení uvažovaných bodů (regulérní či nepravidelné) ˇ možné začlenění externí informace např. o obecném trendu Většina lokálních interpolátorů pracuje na principu ,,filtrovacího okénka", do jisté míry počítají průměrnou hodnotu z bodů v okolí či v definované vzdálenosti. 5 Metoda nejbližšího souseda (thiessenovy polygony) Hodnoty atributů v neměřených místech jsou určeny z hodnot nejbližšího místa měřeného. Podle schématu uvedeného na obrázku je zpracovávané území rozděleno na nepravidelné trojúhelníky (Delaunay triangulace). Z nich jsou poté definovány tzv. thiessenovy polygony. V závislosti na rozmístění měřených dat mohou tyto polygony být pravidelné či nepravidelné. V GIS se často využívají jako rychlý prostředek pro vztažení bodu k určitému okolí. Celá metoda je založena na předpokladu např., že meteorologická data z určité oblasti mohou být určena z nejbližší meteorologické stanice. Tato metoda je nevhodná pro spojitě se měnící jevy (srážky, teplota, ...). Obr. Konstrukce thiessenových polygonů na pravidelně rozmístěných bodech Obr. Příklady interpolace množiny nepravidelně rozmístěných bodů v ploše metodou thiessenových polygonů Lokální, exaktní metoda interpolace. Metoda původě využívaná pro plošné odhady srážek. Je to metoda robustní, vždy produkuje stejný povrch ze stejné množiny vstupních dat. Nelze při ní však použít externí informace o faktorech, které mohou ovlivňovat hodnoty v místech měření. Je vhodná k vymezování teritoria (oblasti vlivu). Forma výsledného povrchu (mapy) 6 je determinována rozdělením původních měřených bodů. Změny v hodnotách atributů se dějí skokem, na hranicích každého polygonu. Postup však lze použít na kvalitativní data. Metody konstrukce sítě nepravidelných trojúhelníků (TIN) Exaktní metoda vhodná pro nepravidelně rozmístěné body měření. Tyto body jsou spojeny liniemi a vytváří síť nepravidelných trojúhelníků. Protože hodnoty v bodech na počátku a konci linií jsou známy, lze použít jednoduchou lineární závislost k interpolaci bodů mezi dvěma body na linie. TIN je metoda interpolace i způsob vizualizace spojitých povrchů. Pro některé druhy povrchů je vhodná ­ obecně pro povrchy které se vyznačují náhlými změnami spádu (fluviálně erodované povrchy). Proces vytváření spojitého povrchu metodou nepravidelné trojúhelníkové sítě zahrnuje: ˇ výběr charakteristických bodů (ne z jakékoliv množiny nepravidelně rozmístěných bodů lze vytvořit TIN) ˇ způsob propojení bodů do trojúhelníkové sítě ˇ způsob modelování povrchu uvnitř trojúhelníků Způsob propojení bodů do trojúhelníkové sítě se řeší např. metodou Delaunay triangulace: Tři body tvoří tzv. Delaunay trojúhelník pouze v případě, pokud kružnice, která je těmto třem bodům opsaná neobsahuje žádný další bod. Tato podmínka zaručuje, že trojúhelníky jsou přibližně rovnostranné a jakýkoliv vnitřní bod trojúhelníka je co možná nejblíže jednomu z vrcholů ­ tedy bodu měření. Delaunaly triangulace může být také vytvořena z thiessenových polygonů (viz. výše). Obr. Podmínka tzv. Delaunay triangulace TIN je model vhodný k následné konstrukci izolinií. Nejprve se zvolí krok, se kterým budou izolinie interpolovány, poté jsou identifikovány všechny linie, které bude protínat izolinie s danou hodnotou. Poté se podél všech těchto linií vypočtou souřadnice x, y bodu ,,přechodu" izočáry. Následně se body spojí. Pro ,,hladký" průběh izolinií se body spojují nelineární funkcí. Metody není možné použít k extrapolaci ­ výsledný povrch má plochu, která vznikne spojením vnějších měřených bodů (konvexní obal). Obr. Vytvoření TIN a konstrukce izolinií 7 Metoda inverzní vzdálenosti Tato metoda kombinuje ideu vzdálenosti využívanou v thiessenových polygonech a ideu postupných změn trendových povrchů. Je založena na předpokladu, že hodnota atributu v určitém bodě je váženým aritmetickým průměrem hodnot okolních měřených bodů. Váhy jsou určeny pro každý bod například jako inverzní vzdálenost měřeného bodu od bodu interpolovaného (čím bližší bod, tím má větší váhu). Nejjednodušším je lineární interpolátor. Jde většinou o exaktní interpolátor. Forma výsledného interpolovaného povrchu závisí na shlucích bodů a na odlehlých měřeních. Dává nejlepší výsledky při dostatečném množství měřených bodů pravidelně rozmístěných v interpolovaném prostoru. Obecný vzorec pro odhad hodnoty Z: = = = n i i n i ii w zw Z 1 1^ kde váhy se nejčastěji určují ze vztahu k d w 1 = a nebo kd ew - = hodnoty vah wi představují funkci vzdálenosti d. Hodnota exponentu k se nejčastěji volí 1 či 2 a ovlivňuje, v jakém poměru klesá hodnota váhy měřeného bodu s rostoucí vzdáleností od bodu interpolovaného. Obr. Odhad hodnoty v bodě metodou inverzní vzdálenosti Metoda IDW často produkuje povrch, který je charakteristický koncentrickými strukturami kolem interpolovaných bodů (tzv. ,,bulls eyes"). Protože IDW je založena na lokálním průměrování, neposkytuje odhady mimo rozsah hodnot měřených bodů. Výsledkem jsou často nereálné tvary výsledného povrchu (viz. následující obr). Obr. Metoda inverzní vzdálenosti efekt ,,průměrování"- potlačení lokálních extrémů Interpolace metodou lokálních polynomů Polynom n-tého stupně je aplikován ne na celý interpolovaný povrch, ale vždy na část povrchu definovanou jako okolí interpolovaného bodu přičemž tato okolí se překrývají. Stejně jako v případě IDW je specifikován tvar okolí, min. a max. počet bodů v okolí resp. rozdělení 8 okolí na sektory. Body definovaného okolí je proložen polynom n-tého stupně a interpolovaná hodnota je použita pro střední bod okolí. V následném kroku se okolí posouvá po interpolované ploše stejně jako v případě klouzavých průměrů. Jedná se o aproximativní metodu interpolace, která však více zohledňuje lokální vlivy než metoda ,,globálních" polynomů. Obrázek ukazuje v transektu čtyři kroky postupného prokládání přímky třemi nejbližšími body. Obr. 17 Interpolace metodou lokálních polynomů Model lokálních polynomů je optimalizován výpočtem RMSPE a může počítat s efektem anizotropie stejně jako v případě metody inverzní vzdálenosti. Metoda je závislá na správné volbě velikosti okolí interpolovaného bodu. Lokální interpolátory využívající regresní analýzy Spočívají v sestavení empirického modelu závislosti interpolované veličiny na hodnotách jedné či několika veličin nezávislých a to pro jisté okolí interpolovaného bodu. Regresní vztah je tedy na rozdíl od globální varianty této metody sestaven pouze pro body v předem definovaném okolí bodu. Interpolovaná hodnota je použita pro střední bod okolí, které se posouvá stejně jako v případě klouzavých průměrů. Splinové funkce (piece wise polynomial function) Splinové funkce jsou matematicky definované křivky, které po částech interpolují jednotlivé body povrchu a to exaktně, přitom navíc zajišťují kontinuální spojení jednotlivých částí interpolovaného povrchu. Se spliny lze modifikovat část povrchu aniž bychom museli přepočítávat celý povrch (toto například neumožňují trendy). Pro interpolování linií se používá tzv. kubických splinů. Obr. Interpolace splinovými funkcemi 9 Kubické spliny používané ke shlazování čar dávají v případě interpolovaných povrchů značný počet chyb (výrazně malých či velkých hodnot), ať již v důsledku chyb měření či v důsledku komplexnosti interpolovaného povrchu. V tomto případě se na místo přesných splinů používá tzv. ,,thin plate splines". Ty nahrazují části povrchů interpolované přesným splinem lokálně shlazenou průměrnou hodnotou. Povrch je interpolován tak, aby procházel co nejblíže měřeným bodům a také aby zachoval podmínku minimální křivosti. Spliny jsou tedy lokálním interpolátorem - používají v daném čase pouze několika málo bodů, na rozdíl od trendových funkcí a povrchů interpolovaných metodou vážené inverzní vzdálenosti spliny zachovávají řadu lokálních rysů interpolované proměnné. Spliny interpolované povrchy jsou často značně shlazené a jsou tedy vhodné pro interpolaci jevů, které se mění spojitě (např. tak vzduchu). Jistou nevýhodou splinových funkcí je, že produkují ,,falešná" lokální minima a maxima. Obr. Příklad izolinií vytvořených interpolací gridových hodnot přízemního pole tlaku vzduchu splinovými funkcemi Metody radiálních funkcí (RBF) Jedná se o skupinu exaktních interpolátorů využívajících stejně jako splinové funkce podmínky mimimalizování křivosti povrchu (analogie ,,přetažení" gumové membrány přes body v prostoru). Obr. uvádí porovnání RBF metod s metodou inverzní vzdálenosti. Jak je z obrázku patrné, výsledkem interpolace metodou inverzní vzdálenosti nikdy nejsou body, které by byly větší než maximální hodnota v měřeném bodě resp. menší než minimální hodnota v měřeném bodě. Obr. Porovnání výsledků interpolace metodami splinových funkcí (RBW) a metodou inverzní vzdálenosti (IDW). Jsou vhodné pro hladké povrchy generované z velkého počtu bodů (např. modely terénu). Naopak se nehodí pro interpolaci jevů, které se v prostoru mění skokem a dále pro interpolaci jevů, u nichž existuje jistá míra nejistoty ohledně přesnosti měřených bodů.