1 Prostorové modelování a základy geostatistiky Petr Dobrovolný Obsah přednášky 1. Prostorové a kartografické modelování 2. Kartografický model a základní členění modelů 3. Mapová algebra -modelování s rastrovými daty 4. Třídy funkcí v mapové algebře a příklady využití 5. Statistický popis prostorového uspořádání objektů (bodů, linií, ploch) 6. Úvod do geostatistiky 7. Přehled metod interpolace 8. Klasifikační metody, krajinné metriky, ... Základní literatura DeMERS, N.M. (2002): GIS Modelling in Raster. Wiley & Sons. New York, 203 s. LEE, J., WONG, D.W.S. (2001): Statistical Analysis with ArcView GIS, J. Willey & Sons, New York, 192 s. ROGERSON, P. (2006): Statistical Methods for Geography. A Studenťs Guide. Sage Publ., London, 300 s. BORROUGH, P.A., McDONNELL, R.,A (1988): Principles of Geographical Information Systems. Oxford University Press, Oxford, 333s. Materiály k programům ESRI - Spatial Analysis Motivace Cílem prostorové analýzy je objektivně zhodnotit, změřit a objasnit rozmístění objektů či intenzitu procesů v prostoru. Příklady: * rozložení srážek na ploše území * výskyt minerálů v lokalitě * výskyt nemocí, epidemiologie * lokality s výskytem násilné trestné činnosti * aplikace živin na plochy polí Rozmístění objektů či intenzita procesů jsou často determinovány polohou v prostoru. Porto Alegre ,,temperarature of violence" Prostorové modelování * Řada informací má prostorový charakter ­ jsou vázány k určitému místu (geoinformace). * Prostorové modelování je skupina technik jejichž cílem je analýza dat s důrazem na jejich prostorové vztahy. * Významné postavení mezi těmito obory zaujímá statistika, ale řada postupů byla odvozena v geografii, geostatistice, ekonometrii, epidemiologii, v územním plánování a urbanizmu, zdravotnictví a kriminalistice. Prostorové modelování je souborem technik pro analýzu lokalizovaných objektů, kde výsledky analýz závisí na prostorovém uspořádání těchto objektů a jejich vlastností. Na rozdíl od jiných forem analýz vyžadují prostorové analýzy atributová data i geografickou lokalizaci objektů. Příklady prostorových analýz 1736, Euler Snow,1854 2 Kartografické modelování * Obecná metodologie, která využívá map v prostředí digitální kartografie k analýze popisných i prostorově lokalizovaných dat * Atributy i souřadnice objektů v mapách transformuje či kombinuje za účelem podpory rozhodovacích procesů. * Pomocí vlastních postupů a nástrojů analyzuje prostorovou informaci uloženou ve formě vektorového i rastrového modelu * Mapy v podobě rastrového modelu lze vhodně analyzovat nástroji mapové algebry A cartographic model is a set of interacting, ordered map operations that act on raw data, as well as derived and intermediate data, to simulate a spatial decision making process (Tomlin 1990, in DeMers, 1997:353). Model tematických vrstev jako prezentace reality Vývojový diagram jako způsob prezentace modelu Kartografické modelování Cíle prostorové analýzy Od jednoduché deskripce k předpovídání vývoje jevů v prostoru. Příklady: 1. Popis objektů či událostí včetně popisu jejich prostorového uspořádání (Proč jsou určité jevy či objekty více seskupeny v některých místech? Je upořádání náhodné, pravidelné či je zde tendence vytvářet shluky? 2. Výběr určitého místa na základě splnění jisté sady podmínek (či obecněji podle jistého rozhodovacího schématu) nebo zkoumání míry splnění daných podmínek v určitém místě nebo území. 3. Interpretace procesů, které vedly k pozorovanému stavu uspořádání objektů či událostí ve sledovaném prostoru (systematický průzkum), např. interpretace vzniku pozorovaného uspořádání bodů, vysvětlení vývoje území v čase. 4. Optimalizace uspořádání objektů/jevů ve sledovaném prostoru např. na lokalizační a alokační úlohy, volba způsobu distribuce toků (rozmístění zaměstnaných, dětí do škol, zboží), ale také např. návrh vhodného systému vzorkování. 5. Zlepšení schopnosti předpovídat a kontrolovat objekty či události ve sledovaném prostoru (využití prediktivních modelů). 6. Redukce původního množství dat do menší, úspornější a přehlednější sady dat. Provádíme např. generalizaci původních dat pro lepší popis sledovaného jevu nebo jen za účelem snadnější manipulace. Cíle prostorové analýzy (pokrač.) Různá hlediska - podle využitých postupů způsobu zpracování, úrovně zpracování, počtu současně studovaných jevů či podle typu reprezentace prostorových objektů či jevů. Rozdělení metod prostorové analýzy Dělení podle využitých postupů: * statistické prostorové analýzy dat (spatial statistics) * mapová analýza (překryvné operace) * metody matematického modelování (regresní modely) * lokalizační a alokační metody (optimální lokalizace objektů) * interpolační metody * síťové analýzy (dopravní, hydrologické) (jedná se spíše o posloupnost tří etap resp. úrovní zpracování) 1. Zobrazovací (vizualizační) metody - vytváření map, které dokumentují objekty a jevy ve sledovaném území, sledování rozmístění objektů, evidence výskytu shluků, anomálních oblastí, Příklad ­ tvorba kartogramů a kartodiagramů. Deskriptivní modely 2. Průzkumové metody ­ (explorační analýza prostorových dat ­ ESDA) úvodní kroky analýzy, které mají za cíl zvýraznit podstatné rysy studovaného problému: sumarizace, vyhlazení, transformace, filtrace sledování trendu, detekce extrémních hodnot. Identifikují, zda jsou vlastnosti studovaných jevů vhodné či nevhodné pro vlastní modelování (nap. pro interpolační algoritmy) 3. Modelovací metody ­ vlastní sestavování vhodného modelu z prostorových dat (Př. model odtoku vody z povodí,lokalizační a alokační úlohy). Definování parametrů modelu, jejich testování, verifikace modelu. Modely statické i dynamické, deskriptivní i prediktivní.Vytváření modelů ve formě map (nejen klasických, ale i takových, které umožňuje rozvoj geoinformatiky (3D, 4D). Dělení metod podle způsobu zpracování 3 Dělení metod podle typu prostorové reprezentace * metody vhodné pro kontinuální reprezentaci * metody vyžadující diskrétní diskrétní reprezentaci Podle použitého datového modelu * vektorový * rastrový * Modely prezentující objekty * Modely prezentující procesy v krajině Modelování není ovládání SW (znalost práce s textovým editorem nezaručuje znalost psaní dobrých románů). Modelování a GIS Prostorové modelování je základním nástrojem analýzy v GIS. Nástroji GIS je vytvářen model reálného světa. Nad tímto modelem je vytvářen další (formální) model, který popisuje, předpovídá, simuluje, syntetizuje či analyzuje procesy a jevy ­ kartografický model. REALITA DATOVY MODEL DATOVÁ STRUKTURA STRUKTURA DATOVÉHO SOUBORU Kartografické modelování Jednotlivé úrovně abstrakce reality Jednotlivé úrovně abstrakce reality 1. Co má být výstupem modelu (co modeluji ­ chci popsat daný stav, nebo něco předpovědět, nebo najít vhodné řešení z několika možných) 2. Jakých datových zdrojů bude zapotřebí - vrstvy a vazby mezi nimi 3. Způsob prezentace reálného světa (prostorové informace) v modelu ­ jakým datovým modelem budou objekty a vztahy mezi nimi prezentovány. 4. Jakých nástrojů použijeme Modelování je proces, který vyžaduje porozumění a vyjasnění následujících kroků: V závislosti na zvolených kritériích existuje několik způsobů klasifikací kartografických modelů, neexistuje jednotná terminologie, mezi dvěma kategoriemi modelů často neexistuje striktní hranice ale postupný přechod. Základní dělení kartografických modelů 3 základní kritéria třídění (DeMers, 2002): 1. Dělení modelů na základě účelu použití 2. Dělení modelů na základě použité metodologie a technik 3. Dělení modelů na základě použité logiky 4 1. Dělení modelů podle účelu použití 1.1 Modely deskriptivní - účelem je popsat současné procesy a funkce složek v systému (krajiny, dopravního systému, ekosystému, ...) 1.2 Modely preskriptivní - účelem je predikovat možné budoucí stavy systému. Deskriptivní modely * Jedná se o modely pasivní. Hlavním úkolem je popis jednotlivých složek studovaného území, jejich současného stavu. Odpovídají tedy především na otázku: Co se nachází tady? * Snaží se kvantifikovat současný stav ­ např. geometrické vztahy objektů na mapě či mapách. Od jednoduchého měření (vzdálenost, plocha, obvod, ...) až po komplexní integrující charakteristiky (tvar, izolovanost, struktura, hierarchie). * Tyto modely umožňují především zjišťovat strukturní vztahy (pattern), porovnávat je mezi dvěma mapami či územími. * Dekonstruktivní modely ­ pro testování sensitivity či významnosti jednotlivých složek v modelu lze jednu každou složku z modelu odstranit a studovat její vliv na fungování celku. Preskriptivní modely * Lze je charakterizovat jako aktivní. Řeší odpověď na otázku ,,Co by mělo být?" ­ typický příklad: optimální lokalizace objektu. * Možná předpověď vzniká na základě důkladné deskripce * Dvojí charakter výstupu z modelu: A. nejlepší (jedno) řešení na základě stanovených kritérií B. variantní řešení (několik) které vyhovují zadaným kritériím. * Umožňují analyzovat dynamiku procesů. Dále je lze dělit na modely * holistické ­ modelují proces jako celek * atomistické- model ,,vrstev" ­ četnější Preskriptivní (prediktivní) modely - příklady 2. Dělení modelů podle použité metodologie 2.2 Deterministické ­ založené jasně definovaných vztazích příčiny a následku (např. odtokový model, model predikce znečištění, modely erozní - USLE) 2.1 Modely stochastické ­ založené na pravděpodobnostní statistice a emirii (např. regresní model) 3. Dělení modelů podle použité logiky 3.1 Induktivní metody ­ konstrukce obecného modelu z jednotlivých tématik, běžně využívají empirických vztahů (data driven). 3.2 Deduktivní metody ­ od obecných pravidel ke specifickému, algoritmické (theory driven). 5 Modelování s rastrovými daty * Je řada věcí, které lze modelovat vhodněji s použitím vektorových dat (síťové analýzy) a naopak (modelování spojitých polí ­ povrchů, difúzní modely) * Používané algoritmy na řešení problémů v prostředí ,,vektorovém" a ,,rastrovém" se často značně liší. * Důvody historické (průhlednost a jednoduchost prvních nástrojů) a pragmatické (cena a dostupnost) * Doména environmentálního modelování (na rozdíl od modelů technických - doména CAD systémů). Proč modelovat s rastrovými daty? * Možnost prezentace diskrétních i spojitých prostorových informací * Možnost definování vztahů sousednosti * Využitelnost principů mapové algebry pro kartografické modelování, jednoduchost řady algoritmů * Výrazně rostoucí podíl prostorových dat získávaných metodou DPZ a jejich rastrová povaha * Kompatibilita s obdobnými datovými zdroji * Jednoduchý sběr dat * Vhodné pro kombinování více vrstev ­ mapová algebra, snadné překrývání * Jednoduchost operací, jednoduchost datové struktury (matice) * Vhodné pro analýzy souvislých povrchů * Rychlé polohové dotazování Nevýhody Výhody * Velká paměťová náročnost * Omezená geometrická přesnost daná rozlišením (velikostí buňky) * Nižší vizuální kvalita * Nevhodnost pro síťové analýzy Rastrový datový model * Jednou či několika sousedícími buňkami jsou prezentovány základní typy geometrických prvků (bod. linie, plocha). * Prostorové vztahy mezi prvky jsou implicitně obsaženy přímo v rastru. * Buňka musí splňovat dvě podmínky: * Nekonečné opakování * Rekurzivní rozkládání Možné tvary buněk v rastru? * Spočívá v rozdělení prostoru do pravidelné sítě, která se skládá z buněk. * Buňka představuje základní nedělitelnou prostorovou jednotku. Rastrový datový model Přesnost a kvalitu zobrazení reality za pomoci rastrového modelu ovlivňují tyto faktory: * Rozměr buňky (,,prostorové rozlišení" v DPZ) * Způsob přiřazení hodnoty atributu buňce * Počet úrovní použitých pro zaznamenání hodnot atributu (,,radiometrické rozlišení" v DPZ) Ad 1) Menší rozměr buňky znamená přesnější geometrii, avšak geometricky narůstající paměťový prostor, (vzrůst počtu tzv. smíšených pixelů v DPZ) Ad 2) Hodnoty atributu v buňce mohou být určeny několika způsoby: * Bodová hodnota zaznamenaná kdekoliv v buňce * Aritmetický průměr několika bodových měření * Vážený aritmetický průměr (váha ­ např. plocha či počet bodů s určitou hodnotou) * Minimální či maximální hodnota atributu v ploše * Hodnota s nejvyšší vahou * Výsledek interpolačního algoritmu Ad 3) Používané hloubky rozlišení (počet stavů použitých k popisu změn v chování atributu): Binární rastr (0,1), integer, floating point (real) 6 Základní druhy rastru a datové struktury používané k ukládání rastru: * jednoduchý rastr * rozšířený rastr (extended) ­ umožňuje propojení s tabulkou atributů * optimalizovaný rastr (čtyřstrom ­ quad tree) Prostřednictvím rastru lze ukládat data diskrétní i spojitá Optimalizovaný rastr (čtyřstrom ­ quad tree) Jednoduchý rastr Rozšířený rastr (extended) integer, real integer Zdroje rastrových dat: * primární (obrazová data DPZ) * sekundární * metody interpolace bodových měření (GPS) * metody rasterizace vektorových dat * skenování analogových dat Prezentace základních druhů objektů v rastrovém datovém modelu * body * linie * polygony * povrchy