Geoinformatika II – GIS jako zpracování dat jaro 2017 Petr Kubíček kubicek@geogr.muni.cz Laboratory on Geoinformatics and Cartography (LGC) Institute of Geography Masaryk University Czech Republic Geoinformatika GIS životní cyklus dat Historie GIS • V 50. letech 20. století začaly pokusy s automatizovaným mapováním za využití výpočetní techniky. • V roce 1963 zavedl pojem GIS Kanaďan R. F. Tomlinson a označil tak nové technologie pracující s daty a podávajícími informaci o terénu pomocí výpočetní techniky. ??Jak dostat mapu do počítače?? Historie GIS • Pionýrské období (konec 60. let až 1975) hlavně průkopnické práce, univerzity - důraz na digitální kartografii. • 1975- začátek 80. let - ujednocení pokusů s institucemi na lokální úrovni - první LIS. • 1982 - konec 80. let - komercionalizace problematiky – běžně dostupné softwarové systémy pro GIS (ESRI, Intergraph, …), první systémy založené na CAD (systémy před tím měly minimální grafické možnosti). Autocarto, EuroCarto (1987 Brno). • 1986 – P. Burrough - učebnice GIS; Konečný a Rais – GIS v ČR. Historie GIS • NCGIA – National Centre for Geographic Information and Analysis;GI science (USA). Změna pojetí GIS jako nástroje (research with GIS) na přijetí GIS jako výzkumného směru (research about GIS – spatial information theory). • 90. léta - počátky standardizace, uživatelské GIS, Desktop GIS, otevřené systémy (Open GIS), Internet. • Výuka GIS v Č(SS)R – Brno, Ostrava, Olomouc… • AGILE; Conference on Spatial Information Theory (COSIT). • Současnost - vývoj objektově orientovaných systémů, masivní propojení s databázemi, vzdálený přístup přes Internet/Intranet, webové služby, sociální sítě, geoparticipace (VGI). • Mobilní GIS ... Komplexní GIS schéma TEORETICKÉ POJETÍ GIS Pohledy na reálný svět Tři základní pohledy - Objektový , Jevový, Procesní Jevový a procesní pohled • Dělení jevů – kvalitativní x kvantitativní; statické x dynamické; kontinuální x diskrétní. • Procesní pohled – vnáší do reálného světa dynamiku a ovlivňuje jak jevy, tak objekty. • Pro modelování jevů a objektů využívá geoinformatika odlišné datové modely. Geoinformatika Modelování geografických objektů • v geoinformatice se nezaobíráme reálnými objekty, ale z důvodu zjednodušené reprezentace - modelem reality. • Modelování - abstrahování týkající se všech součástí geografické informace: – geometrické, – topologické, – tematické – dynamické. Geoinformatika Proces modelování • modelování – je proces abstrakce, při kterém jsou podstatné elementy reálného světa zdůrazněny a nepodstatné eliminovány (s ohledem na cíl, který má toto modelování splnit): – úmyslně – zobrazují se jen ty elementy, které jsou předmětem zkoumání, ostatní se potlačují; – neúmyslně – v dané fázi poznání jsou nedostupné či nepoznatelné. • Principem modelování je snaha o poznání vlastností studované části reality. Geoinformatika GIS jako obraz reálného světa (Rapant) • Reálný svět je pozorován pozorovatelem. Ten vytváří na základě svých vjemů vnitřní (mentální model) tohoto světa. • Mentální model je velmi blízký reálnému světu, ale vždy je tu jisté zjednodušení. • Pro převedení mentálního modelu do GISu je potřeba ji zdigitalizovat. Jednotlivé prostorové prvky (geoprvky) jsou nahrazeny základními geometrickými prvky a ty jsou dále tříděny podle tématu do jednotlivých vrstev. Geoinformatika GIS jako obraz reálného světa Výsledný obraz reálného světa v GISu je: • složen z bodů, linií a polygonů (geometrie) • roztříděných do jednotlivých vrstev (tematika) • dvourozměrný • statický • zjednodušený (chybí mnoho informací) • obsahuje mnoho chyb a nepřesností vzniklých z převodem reality do podoby GIS. Geoinformatika Složky geografických dat • Neprostorová složka (tzv. Atributy) – Čísla – kvantitativní hodnoty – Řetězce znaků – kvalitativní hodnoty – Datum – časové určení – Komplementární atributy – linky, videa, dokumenty … • Časový aspekt odráží změnu jevu v čase (od jednoho záznamu ke druhému) • Prostorová složka (tzv. Geometrie) – tvar – poloha – topologie Všechny měřitelné nebo popsatelné vlastnosti reálných entit spadají do jednoho z aspektů: prostoru, tématu nebo času. Geoinformatika Neprostorová složka - atributy Popisující geografické objekty a jejich vlastnosti • Typy atributových dat • poměr - např. procenta • interval - např. celá čísla z intervalu (0,10), desetinná čísla z intervalu (0.5-14.0) • pořadí (ordinální) - řadová číslovka • výčet (nominální) - např. pro typ silnice to může být (dálnice, rychlostní silnice, silnice 1.třídy, silnice 2.třídy, ostatní silnice) Příklad: • Objekt = lesní porost • Atribut = dřevinná skladba, průměrná výška porostu, věková struktura, apod. • Atributy jsou neprostorové (nereprezentují informaci o lokalizaci či o prostorových vztazích), mají vytvořenou vazbu na prostorové prvky atributové hodnoty, reprezentující kvalitu geografického objektu, nelze vždy měřit nebo udávat v jednotném měřítku. • Př. Borovicový porost není nikdy 100% složen pouze z borovice. Při analýzách to nevadí, ale je nutno s touto skutečností počítat (míry kvality). Geoinformatika Časová složka • Čas – dynamický popis – dynamika charakterizuje časovou variabilitu geografických objektů. – tyto změny se mohou týkat geometrie, topologie i tematického popisu. • Modelování dynamických prostorových procesů v rozměrném prostoru vyžaduje složité modely a metody. V praxi se ale používá zjednodušení: • 1. Analýza časové série na jednom měřícím bodě - časová změna. • 2. Prostorová změna atributové hodnoty mezi dvěma body v tom samém čase - prostorová změna. Geoinformatika Prostorová složka - tvar • Dvě chápání prostoru – vektorový a rastrový – Jev –> jeho vymezení -> hranice -> objekty • Kartografický model reality – Bod, Linie, Plocha • Uspořádaný soubor souřadnic - VEKTOR. – Prostor -> jeho rozdělení -> jaký jev je přítomen v dílu • Vzorkování • Různé druhy členění podle charakteru buněk – Pravidelnost, komplexita • Matice hodnot – u pravidelného a jednoduchého členění - RASTR. Geoinformatika Datové modelování – vektorová reprezentace Bod – nemá délku, hloubku ani šířku - bezrozměrný (0D) prvek – je jednotlivý pár souřadnic X, Y, reprezentující geografický prvek – je příliš malý na to, aby byl zobrazen jako linie či plocha. Geoinformatika Typy geometrických objektů - linie Linie – má délku, ale nemá šířku ani hloubku - jednorozměrný (1D) geografický prvek; – je sled orientovaných úseček (hran) definovaných souřadnicemi vrcholů (vertex) mezi dvěma uzly (nodes); – tvar reprezentovaného geografického prvku je příliš úzký na to, aby mohl být zobrazen jako plocha. Geoinformatika Typy geometrických objektů - plocha • Polygon (plocha) – mají délku a šířku, ale nemají hloubku - dvojrozměrný (2D) geografický prvek; – je uzavřený obrazec, jehož hranicí je uzavřená linie. – První a poslední vrchol jsou stejné. Geoinformatika Sítě • systém linií s topologickou strukturou; • je řada vzájemně propojených linií, podél níž probíhá tok informací. Povrchy • je to souvislá entita, pro kterou v každém bodě existuje nějaká hodnota (2,5 D) x,y,z. Objemy • mají všechny rozměry (délku, šířku, hloubku) - trojrozměrné (3D) geografické prvky. Geoinformatika Špagetový datový model • Nejjednodušší – CAD, CAM. • Objekt na mapě se reprezentuje jedním logickým záznamem v souboru a je definovaný jako řetězec x,y souřadnic. •Nevýhody - ačkoli jsou všechny objekty v prostoru definovány, struktura neposkytuje informace o vztazích mezi objekty. •Společná linie je pro každý polygon ukládána dvakrát. •Pro většinu prostorových analýz je tento model nevhodný, protože veškeré potřebné prostorové vztahy musí být spočítány před každou analýzou. Geoinformatika Topologický datový model • V tomto modelu každá linie začíná a končí v bodě nazývaném uzel - node. • Dvě linie se mohou protínat opět jenom v uzlu. Každá část linie je uložena s odkazem na uzly a ty jsou uloženy jako soubor souřadnic x,y. Ve struktuře jsou ještě uloženy identifikátory označující pravý a levý polygon vzhledem k linii. Tímto způsobem jsou zachovány základní prostorové vztahy •Použitelné pro analýzy. Navíc tato topologická informace umožňuje body, linie a polygony uložit v neredundantní podobě (bez opakovaného zápisu). Geoinformatika Geoinformatika Vektorová reprezentace - topologie • Topologie je matematický způsob, jak explicitně vyjádřit prostorové vztahy mezi jednotlivými geometrickými objekty. • Proč vůbec topologie? Má jisté výhody, například: – Umožní ukládat data efektivněji. – Mnoho analýz v GIS využívá pouze topologické a nikoli geometrické vztahy. • Důvod pro využívání topologie (ESRI 1995): • "Topology is useful in GIS because many spatial modeling operations don't require coordinates, only topological information. For example, to find an optimal path between two points requires a list of the arcs that connect to each other and the cost to traverse each arc in each direction. Coordinates are only needed for drawing the path after it is calculated." Geoinformatika Tři základní topologické koncepty • Konektivita – dvě linie se na sebe napojují v uzlech. • Definice plochy – linie, které uzavírají nějakou plochu, definují polygon. • Sousednost - linie mají směr a nesou informaci o objektech nalevo a napravo od nich. Geoinformatika Kahoot  Geoinformatika ArcGIS Shapefile • Jeden soubor obvykle reprezentuje jeden typ mapového prvku, např. silnice, jezera, obce • Shapefile specifikuje i další pomocné soubory. • „Jméno.přípona“ prefix zůstává stejný, přípona se mění: • Povinné – .shp – samotný hlavní soubor s geodaty (geometrie). – .shx – indexový soubor (posun vůči počátku souboru, délka záznamu). – .dbf – soubor s atributy resp. popisné data. • Nepovinné – .prj – zdrojový souřadnicový systém. – WKT-string GEOGCS["GCS_WGS_1984",DATUM["D_WGS_1984",SPHER OID[„WGS_1984",6378137,298.257223563]],PRIMEM["Gre enwich",0],UNIT ["Degree",0.017453292519943295]] – .cpg – specifikuje kódování v dbf souboru. – UTF-8. Geoinformatika Struktura *.SHP • Geometrický prvek v záznamu - shape • Samotnou geometrii shape ukládá jako sekvenci bodů (např. GPS souřadnic). • Nedefinuje topologickou strukturu. • Jeden záznam shape – jeden řádek v atributech. Geoinformatika Hlavička souboru *.SHP Geoinformatika Hlavička/obsah záznamu Geoinformatika Atributová data *. dbf • Standartní DBF soubor (tabulka) • Ke každému záznamu existuje právě jeden řádek v tabulce ve stejném pořadí jako ve zdrojovém shapefile. • Stejný prefix jako zdrojový shapefile. • Kódování uloženo v .cfg souboru. • Velké množství dat, redundance. Shapefile - shrnutí + výhody • Neukládá topologii dat • Snadná editace bodů • Rychlá vizualizace geodat • Jednoduše pochopitelná struktura • Podpora v GIS softwarech • Snadná projekce do jiných souřadnicových systémů - výhody • Neukládá topologii dat • Redundance dat (např. body sousedících polygonů) • Manipulace s detailní shapefile (až 100MB soubor) je pomalá. • Špatná podpora Unicode. Geoinformatika Vektorová data Výhody • lze pracovat s jednotlivými objekty jako se samostatnými celky; • menší náročnost na paměť; • dobrá reprezentace jevové struktury dat; • vysoká geometrická přesnost • kvalitní grafika, přesné kreslení, znázornění blízké mapám; • jednoduché vyhledávání, úpravy a generalizace objektů a jejich atributů. Nevýhody • výpočtová náročnost (problémy při náročných analytických operacích); • komplikovanost datové struktury; • složitější odpovědi na polohové dotazy; • obtížná tvorba překryvů vektorových vrstev (overlay) ; • problémy při modelování a simulaci jevů.