FI MUNI, Drášil 2010 1 Úvod do GIS I Fakulta Informatiky, Masarykova Universita v Brně Fólie k přednášce PV019 – Úvod do geoinformačních systémů FI MUNI, Drášil 2010 2 Úvod do GIS I 1. Co to je geoinformační systém? Pojmy související s GIS:  Mapování - vytváření map měřením nebo fotogrammetrickým mapováním pomocí geodetických základů - bodů geodetických sítí. Mapa je 2D obraz zemského povrchu.  Měřítko mapy a úroveň územní podrobnosti obsahu geografického informačního systému.  Dálkový průzkum Země (DPZ) - získávání informací o zemském povrchu a jeho blízkém okolí pomocí snímacích zařízení (kamery, skenery) umístěných v letadlech nebo družicích  Topografická mapa - je grafická prezentace (zobrazení) části zemského povrchu se standardizovaným obecným obsahem (voda, lesy, komunikace, objekty viditelné na zemském povrchu..)  Tématická mapa - zobrazení geografických dat a jevů v topografickém podkladu pomocí grafické reprezentace prostorových dat: bodů, linií a areálů. Metody reprezentace: bodové značky, lokalizované kartodiagramy, kartodiagramy, symbologie čar, kartogramy. FI MUNI, Drášil 2010 3 Úvod do GIS I Mapové dílo v ČR Mapy velkých měřítek do 1:5000 - katastrální mapy (mapy stabilního katastru) v systému Cassini-Soldner (počátek Gusterberg v Čechách, Sv. Štěpán na Moravě) v sáhových měřítkách 1:2880, 1:1440, 1:720 (měřítko je odvozeno ze vztahu 1 jitro - 1600 čtverečních sáhů - je zobrazeno jako čtvereční palec), ale v dekadických měřítkách - katastrální mapy v S-JTSK (systém jednotné trigonometrické sítě katastrální - Křovák), měřítka 1:1000 ve městech (intravilán), 1:2000 v extravilánu vznikaly po roce 1928 - Státní mapa odvozená v měřítku 1:5000, systém JTSK, obsah: vlastnické hranice, polohopis (vnitřní kresba) - Digitální katastrální mapa - mapa vedená digitálně, postupně ji vytvářejí katastrální úřady Státní mapové dílo velkých měřítek v České republice vznikalo v průběhu dvou století. Mapové dílo je charakteristické svou rozmanitostí a rozdílnou kvalitou (především vzhledem k přesnosti a aktuálnosti mapy). Mapy středních měřítek 1 : 10000 až 1 : 200 000 - Základní mapa středního měřítka - v měřítkách 1:10000, 1:25000, 1:50000, 1:100000, 1:200000 s obsahem topografické mapy, v digitální formě mapové dílo ZABAGED. - Topografická mapa GŠ ČSA, měřítko 1:25000 (v některém území i 1:10000) FI MUNI, Drášil 2010 4 Úvod do GIS I Příklad 1 - Informační systém o nemovitostech Uvažujme „klasický“ informační systém o nemovitostech s datovým modelem v relačním databázovém systému, entity systému jsou navrženy v E-R diagramu. Klasický IS je schopen reagovat na dotazy typu:  kdo vlastní parcelu ..?.  jaké parcely vlastní osoba ...?; jakou cenu mají parcely, které vlastní osoba …? FI MUNI, Drášil 2010 5 Úvod do GIS I GIS jsou navrhovány tak, aby byly schopny reagovat na dotazy typu:  kde se nalézá parcela ...?  jaké typy parcel se nalézají v daném regionu ...?  Jakou výměru parcel vlastní daný Oprávněný subjekt FI MUNI, Drášil 2010 6 Úvod do GIS I Vymezení pojmu GIS: GIS je jakýkoliv manuálně nebo počítačově založený soubor postupů užívaných k ukládání a manipulování geograficky vztažených dat. Geograficky vztažená data mají dvě složky:  fyzikální rozměr respektive třídu (průměrná výška stromů v lese, počet obyvatel města, šířka silnice respektive typ sídla, typ vegetace, geomorfologický typ, apod.)  prostorovou lokalizaci ve vztahu ke zvolenému souřadnému systému (polární souřadnice, souřadnice ve zvoleném systému kartografického zobrazení) Typy GIS – tradiční dělení  Land Information System (LIS), Land Related Information System (LRIS), územně orientovaný informační systém speciální případ GIS v podrobnosti velkého měřítka, který zahrnuje vlastnické vztahy (hranice parcel a informace o vlastnících parcel).  Geoinformační systém - systém pracující s daty, která lze lokalizovat v území, ale ne vždy je lze považovat za geografická (umístění vodovodního šoupátka, dopravní značky).  Grafický informační systém - systém pracující s obrazovými daty, která nemá smysl lokalizovat v nějakém (jednotném) prostoru.  V poslední době toto dělení ztrácí smysl, po geoinformačních systémech je požadována komplexní funkcionalita. FI MUNI, Drášil 2010 7 Úvod do GIS I Základní členění prostorových dat: Vektorová data - reprezentují objekty pomocí datových struktur, jejichž základní položkou je bod 2-rozměrného spojitého (euklidovského) prostoru. Termínem “spojitý” myslíme spojitý, až na technické omezení použité počítačové aritmetiky. Rastrová data - podmnožina 2D prostoru je pravidelně rozdělena (většinou čtvercovou) sítí, každý element této sítě je nositelem tématické části (geografické) informace. Prostorová lokalizace je určena indexem elementární složky sítě, popřípadě jeho zobrazením do cílového (kartografického) souřadného systému. Grid data - Základem této reprezentace je opět pravidelná síť položená na 2D prostor. Rozdíl oproti rastrovým datům spočívá v tom, že tématická část informace je získávána na základě předem definované sítě, kterou je rozděleno zájmové území. Topologie - vymezuje vztahy mezi entitami (objekty) systému, aniž by obsahovala umístění objektu v prostoru. Například informační systémy o spojení míst silniční sítí nevyžadují přesné umístění uzlů v prostoru, pracují pouze s relací na množině všech uzlů. FI MUNI, Drášil 2010 8 Úvod do GIS I 2. Kartografická zobrazení Zemský povrch - geometricky složitý útvar - geoid, proto je modelován rotačním elipsoidem, který je určen hlavní a vedlejší poloosou. Pro různá kartografická zobrazení je jsou používány různé elipsoidy. Bessel Hayford Krasovskij IAG 1967 WGS-84 rok 1841 1909 1940 1967 1984 a[m] 6377397.16 6378388 6378245 6378160 6378137 b[m] 6356078.96 6356911.95 6356863.02 6356774.52 6356752.31 Geodetické datum: model zemského tělesa (koule, elipsoid..), jeho umístění (orientace) vůči zemskému tělesu a datum určení. Matematická kartografie - disciplína zabývající se převodem zemského povrchu do roviny. Konformní zobrazení - ponechává nezkreslené úhly, značně jsou však zde zkreslovány plochy. Ekvidistantní zobrazení - nezkresluje délky určité soustavy. Zpravidla touto soustavou bývají zeměpisné poledníky nebo rovnoběžky. Nelze definovat ekvidistantní zobrazení, které by nezkreslovalo žádné délky. Ekvivalentní zobrazení - nezkresluje plochy, zkreslení úhlů je však zde poměrně značné, což se projevuje zejména ve tvarech ploch. FI MUNI, Drášil 2010 9 Úvod do GIS I Geografické souřadnice – určení polohy bodu na ploše elipsoidu pomocí zeměpisné šířky φ a zeměpisné délky λ. Šířka φ je definována jako úhel mezi normálou k ploše elipsoidu a rovinou rovníku (-90º , 90º) k severnímu a jižnímu pólu. Délka λ je úhel mezi rovinou základního poledníku (meridiánu) a poledníku daného bodu (0º,360º) nebo (-180º,180 º). Geocentrické souřadnice X,Y,Z - prostorový souřadný systém s počátkem ve středu elipsoidu, osa X je vložena do průsečíku rovníku a roviny základního (nultého) poledníku, osa Z spojuje střed elipsoidu a severní pól a osa Y leží v rovině rovníku otočena o 90º proti směru hodinových ručiček od osy X. Rovinné souřadnice – určení polohy v rovině pomocí dvojice rovinných souřadnic X,Y v ortogonálním souřadném systému. V některých zobrazeních (zobrazení UTM) se používá symbolika E,N (Easting, Northing) tj. rovinné souřadnice narůstající k východu resp. k severu. Základní typy převodu geografických do rovinných souřadnic: Válcové zobrazení FI MUNI, Drášil 2010 10 Úvod do GIS I Kuželové zobrazení Azimutální zobrazení Kartografický souřadný systém – je soubor těchto údajů : - Geodetické datum (elipsoid, referenční bod, datum určení) - Souřadný systém geografických souřadnic φ, λ, (včetně volby základního poledníku) - Zobrazovací rovnice do rovinných souřadnic - Souřadný systém rovinných souřadnic X,Y FI MUNI, Drášil 2010 11 Úvod do GIS I Nejpoužívanější souřadné systému v ČR Civilní souřadnicový systém S-JTSK je určen – Besselovým elipsoidem z roku 1841 s referenčním bodem Herrmanskogel, zeměpisné délky se určují od ferrského poledníku, zobrazovací rovnice dvojitého konformního kuželového zobrazení v obecné poloze (Křovákovo zobrazení) s volbou délkového faktoru 0.9999 pro snížení vlivu délkového zkreslení. Vojenský souřadnicový systém S-42 je určen – Krasovského elipsoidem z roku 1942 s referenčním bodem Pulkovo, zeměpisné délky se měří od Greenwiche, zobrazovací rovnice Gaussova-Krügerova zobrazení s opakovatelností vždy pro šestistupňové poledníkové pásy. Od r. 2005 je nahrazen WGS84 – zobrazení UTM (Universal Transversal Mercator) Souřadný systém WGS 84 - Word Geodetic System 1984 je globální geocentrický geodetický systém pevně spojený se zemským tělesem. Počátek a orientace jeho os X,Y,Z jsou realizovány pomocí 12 pozemských stanic se známými přesnými souřadnicemi, které nepřetržitě monitorují dráhy družic systému GPS-NAVSTAR. Systém byl původně definován Ministerstvem obrany USA pro obranné účely, dnes je celosvětově používanou technologií prostorové lokalizace. UTM (Universal Transversal Mercator) – Systém transverzálního válcového zobrazení používající elipsoid WGS 84. Jsou použity šestistupňové pásy. Cassini-Soldner – Válcové zobrazení na Zachově elipsoidu s referenčními body Sv. Štěpán, resp. Gusterberg. Definováno v Rakousko Uherské monarchii pro stabilní katastr v měřítkách 1:2800 a 1:1440 (dodnes používaná). ETRS-LAEA: ETRS89 (Lambert Azimuthal Equal Area) – Elipsoid ETRS89 (téměř shodný s WGS 84), azimutální zobrazení používané pro střední a malá měřítka FI MUNI, Drášil 2010 12 Úvod do GIS I Transformace souřadných systémů: Problém: Mapy různých kartografických zobrazení transformovat do zobrazení cílového. Základem je znalost, jak transformovat bod. Přímá transformace 1. Zdrojové souřadnice [x,y] převedeme na geografické souřadnice zdrojového systému [φ,λ]. 2. [φ,λ] korigujeme do cílových geografických souřadnic [φ´,λ´] 3. Geofrafické souřadnice [φ´,λ´] převedeme do cílového rovinného zobrazení [x´,y´] Korekce geografických souřadnic: 1. Geografické souřadnice [φ,λ] převedeme na geocentrické souřadnice [xs,ys,zs] 2. Pro převod mezi dvěma systémy geocentrických souřadnic použijeme tzv. Helmertovu prostorovou transformaci: x = (1 + m)( xs + γys - βzs) + Δx y = (1 + m)(-γxs + ys + αzs) + Δy z = (1 + m)( βxs - αys + zs) + Δz 3. Geocentrické souřadnice z 1. převedeme na geografické. FI MUNI, Drášil 2010 13 Úvod do GIS I Poznámka: Parametry Helmertovy prostorové transformace jsou získávány ze sad identických bodů, které se mohou lišit vlivem nehomogenity kartografické projekce pro různá území. Lze interpretovat jako:  vektor posunu – [Δx, Δy, Δz]  úhel otočení pro jednotlivé osy - [α, β, γ]  změna měřítka - m Tím dostáváme velmi snadno transformaci inverzní, jednoduše změníme znaménka všech parametrů. Polynomiální transformace Ze znalosti identických bodů ve zdrojovém a cílovém rovinném zobrazení [Xi,Yi]→ [Xi´,Yi´] určíme koeficienty polynomiální transformace a tuto potom použijeme pro jednotlivé body. Používáme polynomy do 3. stupně, vyšší stupeň vede k nestabilitě řešení (omezený počet platných cifer). Používá se v případech, kdy:  Není známá zdrojová kartografická projekce prostorových dat.  Zdrojová projekce je sice známá, avšak je zatížena takovou chybou, že obecná polynomiální transformace dává lepší výsledky.  Zdrojová projekce je známá, ale její výpočet je příliš náročný vzhledem k počtu geometrických elementů a polynomiální transformace výsledek významně nezkreslí. V tomto případě použijeme kartografickou transformaci pro generování sítě odpovídajících si bodů (např. rohové body dotazového okna) a tyto body potom použijeme pro výpočet transformačního klíče. FI MUNI, Drášil 2010 14 Úvod do GIS I Základní typy polynomiálních transformací: Lineárni: x=f(u,v)=a1u + b1v + c1 y=g(u,v)=a2u + b2v + c2 Bilineární: f(u,v)=a1u + b1v + c1uv + d1 g(u,v)=a2u + b2v + c2uv + d2 Kvadratická, kubická, obecná polynomiální … Nalezení koeficientů polynomiální transformace: Vstup: Dva seznamy „odpovídajících“ si bodů: {[x1,y1].. [xn,yn]} {[u1,v1].. [un,vn]} Výstup: Seznam koeficientů polynomiální transformace zvoleného stupně. Transformujeme [u,v] do [x,y] s co nejmenší chybou, tedy: dist2 ([xi,yi],[f(ui,vi),g(ui,vi)]) = min kde dist2 ([x1,y1],[x2,y2])=(x1-x2)2 +(y1-y2)2 FI MUNI, Drášil 2010 15 Úvod do GIS I Lineární regrese (příklad pro lineární transformaci): ( označuje sumu pro všechny dvojice odpovídajících si bodů) (a1ui+b1vi+c1–xi)2 +(a2ui+b2vi+c2–yi)2 = min Výraz derivujeme podle proměnných a1..c2 a derivaci položíme rovnu 0 (hledání extrémů funkcí více proměnných). d/da1 = 2(a1ui + b1vi + c1 – xi).ui = 0 d/db1 = 2(a1ui + b1vi + c1 – xi).vi = 0 d/dc1 = 2(a1ui + b1vi + c1 – xi) = 0 . . Dostáváme soustavu tzv. normálních rovnic (pro g(u,v) analogicky): a1 ui 2 + b1 uivi + c1 ui = xiui a1 uivi + b1 vi 2 + c1 vi = xivi a1 ui + b1 vi + c1 .n = xi FI MUNI, Drášil 2010 16 Úvod do GIS I Příklad: Ukázka zdrojového kódu pro převod geografických souřadnic do systému S-JTSK. Je zřejmé, že použití např. bilineární transformace je mnohem méně výpočtově náročné, v některých případech (např. pro rastrový obrázek 1024*1024 pixelů) hodně významně. public override bool FromEllipsoid ( double lat, double lon, double alt, ref double x, ref double y, ref double h ) { try { Double dpom; Double de, dsfi; Double du, dv, ddeltav; Double ds, dd; Double dro, depsilon; Double xx, yy; /* konstanty Besselova elipsoidu */ Double consta = 6377397.15508; Double constb = 6356078.96290; /* konstanty */ Double constalfa = 1.00059749837159; Double constr = 6380703.610617; Double constk = 0.996592486879232; /* uhel v radianech odpovidajici 45 */ Double constu45 = 0.785398163397448; /* uhel v radianech odpovidajici 78:30 */ Double constu7830 = 1.370083462815548; /* uhel v radianech odpovidajici 59:42:42.6969 */ Double constuk = 1.042168563853224; /* uhel v radianech odpovidajici 42:31:31.41725 */ Double constvk = 0.742208135432484; /* uhel v radianech odpovidajici 17:39:59.7354 */ Double constferra = 0.308340218368665; /* prevod vzhledem k ferra */ lon += constferra; /* prevod lat,lon (Bessel) -> u,v (Gaussova koule) */ dv = constalfa * lon; de = Math.Sqrt(consta * consta - constb * constb) / consta; dsfi = Math.Sin(lat); dpom = (1 - de * dsfi) / (1 + de * dsfi); FI MUNI, Drášil 2010 17 Úvod do GIS I dpom = Math.Pow(dpom, de / 2); dpom = dpom * Math.Tan(lat / 2 + constu45); dpom = Math.Pow(dpom, constalfa) / constk; du = 2 * (Math.Atan(dpom) - constu45); /* prevod u,v (Gaussova koule) -> s,d (sirka,delka) */ ddeltav = constvk - dv; dpom = Math.Sin(constuk) * Math.Sin(du) + Math.Cos(constuk) * Math.Cos(du) * Math.Cos(ddeltav); ds = Math.Asin(dpom); dd = Math.Asin(Math.Sin(ddeltav) * Math.Cos(du) / (ds)); /* prevod s,d -> x,y (rovinne, JTSK) */ dpom = Math.Tan(constu7830 / 2 + constu45) / Math.Tan(ds / tu45); dpom = Math.Pow(dpom, Math.Sin(constu7830)); dro = dpom * 0.9999 * constr / Math.Tan(constu7830); depsilon = Math.Sin(constu7830) * dd; x = dro * Math.Cos(depsilon); y = dro * Math.Sin(depsilon); h = alt; return (true); } catch { return (false); } } FI MUNI, Drášil 2010 18 Úvod do GIS I 3. Datové sklady geoinformačních systémů Rastrové datové sklady Využívají běžné formáty obrazových dat (bmp, png, jpeg tif, gif,ecw..). Některé z nich mohou mít informace o vztahu k souřadnicím kartografické projekce přímo ve své hlavičce u ostatních se používá „doplňující“ textový soubor (*.tfw), který obsahuje:  Rozměr pixelu v x-ové ose  Úhel otočení osy X  Úhel otočení osy Y  Rozměr pixelu v y-ové ose  X souřadnice levého horního rohu  Y souřadnice levého horního rohu tfw soubor neobsahuje informaci o kartografické projekci. Příklad tfw souboru: 12.7011007620660457239627434377653 0 0 -12.701100762066045723962743437765 -775450 -965225 FI MUNI, Drášil 2010 19 Úvod do GIS I Vektorové datové sklady Pro fyzickou reprezentaci je možné použít vlastních datových struktur a ukládat je přímo ve file systému operačního systému. Přes nesporné výhody tohoto přístupu, jako je optimalizace uložení prostorové složky informace, převažují nevýhody, zejména aplikační závislost. Běžnější přístup je použití robustních databázových strojů, které vektorovou geometrii běžně používají (Oracle, Microsoft SQL-Server, MySQL). Není jednotný standard ukládání vektorové geometrie. Nejpoužívanější veřejné formáty: Shape file (systém ARC/INFO fy. ESRI) Geograficky vztažená informace je obsažena ve trojici souborů  *.shp prostorová informace  *.shx prostorový index  *.dbf popisná informace a topologické vazby Základní geometrické primitivy: Point bod MultiPoint body Line lomená čára MultiLine lomené čáry Polygon areál MultiPolygon areály Vše 2D a 3D varianty. Norma neobsahuje symbologii (barva, síla, styl liníí, výplň polygonu). Tu obsluhuje aplikace na základě popisných informací. Norma neobsahuje „heterogenní“ kolekce geometrií a tím i definici mapových symbolů. Jako mapové symboly jsou použity speciální znakové sady (fonty). FI MUNI, Drášil 2010 20 Úvod do GIS I Shape file byl jedním z prvních obecně používaných formátů, dodnes je podporován většinou „velkých“ geoinformačních systémů. DGN file, norma IGDS (Intergraph, Bentley) Geometrická informace je obsažena v souboru *.DGN, soubor sám o sobě nenese popisnou informaci, ta je uložena v relační databázi (nebo *.dfb souboru), DGN soubor obsahuje pouze tzv. „link“ = společný klíč v souboru/databázi. Základní geometrické primitivy: CELL_HEADER_ELM Hlavička buňky LINE_ELM Úsečka LINE_STRING_ELM Lomená čára SHAPE_ELM Polygon TEXT_ELM Text TEXT_NODE Textový uzel CURVE_ELM Křivka CMPLX_STRING_ELM Komplexní linie CMPLX_SHAPE_ELM Komplexní polygon ELLIPSE_ELM Elipsa ARC_ELM Oblouk POINT_STRING_ELM Body BSPLINE_ELM B-spline DIMENSION_ELM Kóta  Komplexní línie se mohou skládat z různých segmentů – např. lomených čar a oblouků.  Geometrie obsahuje symbologii geometrických primitiv.  Typ CELL může opět obsahovat buňku. Podobné vlastnosti mají i ostatní CAD formáty (DXF, DWG..) FI MUNI, Drášil 2010 21 Úvod do GIS I Bohatý repertoár geometrických primitiv CAD formátů umožňuje i definici mapových symbolů. Problematické jsou interpretace nelineárních geometrií v různých klientských aplikacích (např. B-spline) a složitějších zobrazovacích symbolik (např, linie vzorovaná symbolem). Dalším problémem jsou operace na složitějšími geometriemi (např. průnik polygonů, jejichž hranice se skládají z lomených čar, eliptických oblouků …). ORACLE 7x (Spatial Data Option): Geometrie je reprezentována čtyřmi tabulkami: _SDOLAYER - obsahuje služební údaje pro prostorovou indexaci _SDODIM - obsahuje rozsah pro jednotlivé dimenze geometrie _SDOGEOM - obsahuje vlastní geometrii _SDOINDEX - obsahuje prostorové indexy objektů možné typy geometrie jsou: bod, lomená čára a areál, Jednalo se o první pokus o standardizaci geometrie – ten se vlivem denormalizace uložení souřadnic ukázal jako slepá ulička, v současné době není rozvíjen. FI MUNI, Drášil 2010 22 Úvod do GIS I ORACLE 8x a výše – datový typ SDO_GEOMETRY: UNKNOWN_GEOMETRY neznámá geometrie POINT bod LINESTRING lomená čára POLYGON areál (oblast) COLLECTION kolekce geometrií MULTIPOINT Body MULTILINESTRING více linií MUTIPOLYGON více areálů  Línie jsou tvořeny sekvencemi bodů a kruhových oblouků.  Typ COLLECTION nemůže obsahovat typ COLLECTION.  Definice neobsahuje symbologii geometrických primitiv. Open GIS Consortium, Inc. Je sdružení soukromých, veřejných organizací (universit, komerčních firem..) se zájmem na vybudování „standardu“ struktur a služeb v prostorových datech. I přes byrokratickou těžkopádnost způsobenou množstvím subjektů, které se účastní vývoje standardů lze konstatovat, že standardy OGC jsou poměrně rozšířeny a podporovány (např. Oracle podporuje konverzi datových typů, prostorová informace MySQL je přímou implementací OGC), i když původní proklamace zní s odstupem času až úsměvně. Our Vision - is a world in which everyone benefits from geographic information and services made available across any network, application, or platform. Our Mission - is to deliver spatial interface specifications that are openly available for global use. FI MUNI, Drášil 2010 23 Úvod do GIS I OGC Well known binary: Je norma binárního ukládání vektorové geometrie včetně C- definic: // Basic Type definitions // byte : 1 byte // uint32 : 32 bit unsigned integer (4 bytes) // double : double precision number (8 bytes) // Building Blocks : Point, LinearRing Point { double x; double y; }; LinearRing { uint32 numPoints; Point points[numPoints]; } enum wkbByteOrder { wkbXDR = 0, // Big Endian wkbNDR = 1 // Little Endian }; WKBPoint { byte byteOrder; uint32 wkbType; // 1 Point point; }; WKBLineString { byte byteOrder; uint32 wkbType; // 2 uint32 numPoints; Point points[numPoints]; }; FI MUNI, Drášil 2010 24 Úvod do GIS I WKBPolygon { byte byteOrder; uint32 wkbType; // 3 uint32 numRings; LinearRing rings[numRings]; }; WKBMultiPoint { byte byteOrder; uint32 wkbType; // 4 uint32 num_wkbPoints; WKBPoint WKBPoints[num_wkbPoints]; }; WKBMultiLineString { Byte byteOrder; uint32 wkbType; // 5 uint32 num_wkbLineStrings; WKBLineString WKBLineStrings[num_wkbLnStrgs]; }; wkbMultiPolygon { byte byteOrder; uint32 wkbType; // 6 uint32 num_wkbPolygons; WKBPolygon wkbPolygons[num_wkbPolygons]; } WKBGeometry { union { WKBPoint point; WKBLineString linestring; WKBPolygon polygon; WKBGeometryCollection collection; WKBMultiPoint mpoint; WKBMultiLineString mlinestring; WKBMultiPolygon mpolygon; } }; FI MUNI, Drášil 2010 25 Úvod do GIS I WKBGeometryCollection { Byte byte_order; uint32 wkbType;// 7 uint32 num_wkbGeometries; WKBGeometry wkbGeometries[num_wkbGeoms]; } Základní datové typy WKB neumožňují vykreslit mapu, neobsahují:  Symbologie (grafická reprezentace – barva, síla, tloušťka) geometrických elementů  reprezentace bodových prvků, mapové symboly  texty (velikost, rotace, font …) Definice WKB neobsahuje definici kruhových oblouků, což může působit obtíže při práci v měřítkách, kde platí Euklidovská geometrie a „kružítko“ běžně používáme. Rekurzivní definice WKBGeometryCollection umožňuje i definici mapových symbolů. GML – Geographic Markup Language: Norma WKB v XML formátu Formát GML definuje XML reprezentaci geometrie, popisnou část informace nijak neomezuje. Vzhledem k masivní podpoře XML parserů mnoha vývojových prostředí se zřejmě jedná výměnný „formát budoucnosti“. Pro ukládání prostorových informací je však nevhodný, jeho velikost je oproti binárnímu formátu až desetinásobná. FI MUNI, Drášil 2010 26 Úvod do GIS I Příklad GML: 10225914 271527 -595427397,-1075666207 -595438694,-1075937499 10239989 671864 -594758645,-1075683985 -595382726,-1075607457 -595425487,-1075601997 . . FI MUNI, Drášil 2010 27 Úvod do GIS I OGC specifikace pro ukládání prostorových informací v relačních databázích: OpenGIS Simple Features Specification For SQL metamodel GEOMETRY_COLUMNS F_TABLE_CATALOG F_TABLE_SCHEMA F_TABLE_NAME F_GEOMETRY_COLUMN G_TABLE_CATALOG G_TABLE_SCHEMA G_TABLE_NAME STORAGE_TYPE GEOMETRY_TYPE COORD_DIMENSION MAX_PPR SRID SPATIAL_REFERENCE_SYSTEMS SRID AUTH_NAME AUTH_SRID SRTEXT GEOMETRY_COLUMNS GID ESEQ ETYPE SEQ X1 Y1 … … X Y GEOMETRY_COLUMNS GID XMIN YMIN XMAX YMAX WKB_GEOMETRY Feature Table/View GID (Geometry Column) or FI MUNI, Drášil 2010 28 Úvod do GIS I OGC – Web Map Service (WMS): Je webová služba poskytující mapu v zadaném výřezu a zadané kartografické projekci. Obsahuje dva základní dotazy: GetCapabilities – vrací metainformace o službě ve formátu XML. Metainformace obsahují zejména výčet mapových vrstev, podporované kartografické projekce a rozsah měřítek, pro které jsou tato data poskytována. Příklad: http://wms.cuzk.cz/wms.asp? request=GetCapabilities&version=1.1.1 WMS KN - CUZK EPSG:102067 EPSG:32633 EPSG:32634 EPSG:28403 EPSG:28404 EPSG:4326 EPSG:4258 EPSG:3035 EPSG:2065 . . obrazy_parcel Obrazy parcel . . FI MUNI, Drášil 2010 29 Úvod do GIS I GetMap – vrátí obrázek s požadovanou mapou. Příklad: http://wms.cuzk.cz/wms.asp? request=GetMap& version=1.1.1& layers=dalsi_p_mapy_i,hranice_parcel_i, obrazy_parcel_i,OMP,parcelni_cisla_i& srs=EPSG:102067& bbox=-815350,-1096562,-815058,-1096388& width=1371& height=815& bgcolor=0x999999& Format=image/gif FI MUNI, Drášil 2010 30 Úvod do GIS I OGC – Web Map Tile Service (WMTS): Je služba, která poskytuje „dlaždice map“ v definované kartografické projekci. Je používána tam, kde se obsah mapy příliš nemění v čase a dlaždice je možné předem připravit. Na podobném principu pracují i robustní světové servery (Google maps, Bing maps). Služba obsahuje opět dva základní dotazy: GetCapabilities – vrací metadata služby ve formátu XML. Metadata obsahují informace o dlaždicových sadách (TileMatrixSet, TileMatrix), jejich měřítkách a umístění v souřadném systému. Příklad: URL?request=GetCapabilities& version=1.1.1& service=WMTS . . - OrtoFoto ORTOMAPA EPSG:102067 - Zoom_09 Zoom_09 14285.714285714286 -931496 -819102 256 256 512 512 - Zoom_10 Zoom_10 7142.8571428571431 -931496 -819102 256 256 1024 1024 . . FI MUNI, Drášil 2010 31 Úvod do GIS I GetTile – vrací mapovou dlaždici. URL&service=WMTS& request=GetTile& TileMatrixSet=ORTOMAPA& TileMatrix=Zoom_11& TileRow=1024& TileCol=1024 FI MUNI, Drášil 2010 32 Úvod do GIS I Příklad: Definice složitého mapového symbolu (Sídla Městského úřadu v GIS pro města). Je zřejmé, že v takovém případě je výhodné mít k dispozici robustní CAD formát vektorových dat, u kterého si každý geometrický element nese i „default“ symbologii kresby. FI MUNI, Drášil 2010 33 Úvod do GIS I 4. Efektivní přístup k prostorovým datům 4.1. VYMEZENÍ PROBLÉMU Problém vyhledání: - Pole V (seznam) objektů stejného typu T1, ve které vyhledáváme. - Množina Q (potenciálně nekonečná) typu T2, definující možné dotazy. - Množina R (typu T3) definující možné odpovědi. - Funkce check(r,q): R x Q → {true,false}, která určuje, zda rR vyhovuje dotazu qQ. Problém vyhledání je funkce libovolná search(q,V), která pro dotaz q nad množinou Q vrací všechny možné vyhovující odpovědi: search(q,V)= {rR | check(r,q)=true} Příklad - Problém příslušnosti prvku k množině: - Položme T1 = T2 (typ vyhledávací množiny je totožný s typem dotazu) - V  R a |V|< - R = {true,false} - check(r,q)=true  r=true  qV potom říkáme, že funkce search řeší problém příslušnosti na typu T1. FI MUNI, Drášil 2010 34 Úvod do GIS I Příklad - Rozsahový dotaz na uspořádané množině: - Nechť (U,) je úplně uspořádaná množina s prvky typu T1, vyhledávací množina je úplně uspořádaná (její každé dva elementy lze porovnat). - V  U a |V|< - Q  U x U, [low,high]Q  low  high - R = U - check(r,[low,high]) = true   rV  low  r  high potom říkáme, že funkce search řeší problém rozsahového výběru na typu T1. FI MUNI, Drášil 2010 35 Úvod do GIS I Příklad - Rozsahový dotaz na body ve 2D prostoru: - V E2 a |V| < (konečná množina bodů euklidovského 2D prostoru). - Q  E2 x E2 taková, že [xmin,ymin,xmax,ymax]Q  xmin GTABLE_IDX GID GRID_X GRID_Y NUMBER NUMBER NUMBER SPATIAL_QUERY ID XMIN YMIN XMAX YMAX NUMBER NUMBER NUMBER NUMBER NUMBER SPATIAL_QUERY_IDX ID GRID_X GRID_Y NUMBER NUMBER NUMBER FI MUNI, Drášil 2010 43 Úvod do GIS I Omezení a prostorové indexy: alter table GTABLE_IDX add constraint GTABLE_IDX_PK primary key (gid,grid_x,grid_y); alter table GTABLE_IDX add constraint GTABLE_IDX_fk1 foreign key (GID) references GTABLE(GID) ON DELETE CASCADE; create index GTABLE_IDX_I1 on GTABLE_IDX(grid_x, grid_y); Triggerem zajistíme vkládání prostorových indexů: create trigger gtable_spatial before insert or update of x,y on GTABLE for each row begin xfrom:=GET_GRID_X(:NEW.XMIN); xto :=GET_GRID_X(:NEW.XMAX); yfrom:=GET_GRID_Y(:NEW.YMIN); yto :=GET_GRID_Y(:NEW.YMAX); pro xfrom<=i<=xto a yfrom<=j<=yto begin INSERT INTO GTABLE_IDX VALUES(:NEW.GID,i,j); end; end; / (funkce GET_GRID_X/Y vrací gridové indexy) FI MUNI, Drášil 2010 44 Úvod do GIS I Implementace prostorového dotazu: Vytvoříme dotazovou tabulku: create table SPATIAL_QUERY ( id int, xmin int, ymin int, xmax int, ymax int, constraint SPATIAL_QUERY_PK primary key (id) ); A ostatní objekty (indexová tabulka, integritní omezení, trigger) stejně jako u tabulek s prostorovými daty. Prostorový dotaz pro obdélník [xmin,ymin,xmax,ymax] provedeme následovně: 1) Identifikace dotazu: Z databáze získáme nový (jednoznačný) klíč dotazu id, například ze sekvence. 2) Inicializace dotazu: insert into spatial_query values (id,xmin,ymin,xmax,ymax), vlivem triggeru SPATIAL_QUERY_SPATIAL automaticky vloží identifikace gridových čtverců to tabulky spatial_query_idx FI MUNI, Drášil 2010 45 Úvod do GIS I 3) Prostorový dotaz: select … from gtable A, gtable_idx B, spatial_query_idx C where A.GID=B.GID AND B.grid_x=C.grid_x AND B.grid_y=C.grid_y AND C.query_id=id; 4) Ukončení prostorového dotazu: delete from spatial_query where id=id; Jaký mechanismus odstraňuje řádky z tabulky spatial_query_idx?) Výhody vs. nevýhody GRID metody. + - velmi snadná implementace v prostředí RDBMS - snadné rozšíření na více dimenzí (?) - relativně snadná (resp. řešitelná implementace neobdélníkových dotazů) - netriviální odhad velikosti GRIDových čtverců, špatná volba má dramatické důsledky - nepravidelné chování při řádově rozdílné velikosti geometrických objektů FI MUNI, Drášil 2010 46 Úvod do GIS I 4.3. MODIFIKACE BINÁRNÍCH STROMŮ PRO PROSTOROVÉ VYHLEDÁVÁNÍ, K-D STROMY Definice - Binární strom: - Nechť (U,) je úplně uspořádaná množina, V  U a |V|< - Nechť (V,E)je strom ve smyslu teorie grafů, takový, že každý jeho uzel obsahuje maximálně dva syny. - Každý syn má vlastnost „pravý“/“levý“. - Všechny uzly „levého“ podstromu libovolného uzlu jsou menší, než tento uzel. - Všechny uzly „pravého“ podstromu libovolného uzlu jsou větší, než tento uzel. Implementaci binárního stromu si můžeme představit jako jednoduchou strukturu: class KeyType : IComparable { … … } class BinTreeNode { KeyType Key; BinTreeNode Left; BinTreeNode Right; } (Interface IComparable vynucuje „srovnatelnost“ libovolných instancí typu KeyType) FI MUNI, Drášil 2010 47 Úvod do GIS I Algoritmus - Vyhledání klíče v binárním stromu: 1.Vstup: kořen stromu nod, klíč key. 2.Je-li nod=null (strom je prázdný), potom končíme vyhledávání ”neúspěchem”. 3.Je-li nod.Key=key, potom končíme ”úspěchem”. 4.Je-li keynod.Key, pokračujeme krokem 1 pro nod.Right Algoritmus - Vkládání klíče do binárního stromu: 1.Vstup: klíč key. 2.Procházíme strom, jako bychom hledali klíč k, dokud nenarazíme na volnou pozici, tedy končíme bodem 2 předešlého algoritmu. 3.Do volné pozice vložíme klíč key. Algoritmus - Rozsahové vyhledání v binárním stromu: 1.Vstup: interval [min,max], kořen stromu nod. 2.Je-li nod=null (strom je prázdný), potom konec. 3.Patří-li nod.Key do intervalu [min,max], pošleme jej na výstup a aplikujeme algoritmus na nod.Left a nod.Right. 4.Je-li maxnod.Key, aplikujeme algoritmus na nod.Right. Zlepšení časové složitosti spočívá v tom, že v určitých fázích algoritmů jsme schopni rozhodnout, kterou větev stromu můžeme bez rizika vynechat. Potíže způsobuje skutečnost, že v jistých případech může být strom degenerovaný (např. nod.Left=null pro všechny uzly). Degenerace nastává tehdy, když jednotlivé prvky vstupují do stromu v nevhodném pořadí (jsou uspořádány). FI MUNI, Drášil 2010 48 Úvod do GIS I V případě statické verze vyhledávacích problémů lze vybudovat tzv. optimální binární strom (na vstupu procedury build známe celou množinu V). Definice - Optimální strom: Strom nazveme optimální, liší-li se počty uzlů v podstromech |nod.Left| a |nod.Right|maximálně o 1 pro jeho každý uzel nod.. Poznámka: Hloubka optimálního stromu obsahujícího |V| klíčů je: log(|V|) Algoritmus - Vybudování optimálního binárního stromu: 1.Vstup: množina klíčů V, kořen stromu nod. 2.Je-li V = null, skonči. 3.Rozděl množinu V na po dvou disjunktní množiny V1,{med(V)},V2 tak, že med(V) je medián množiny V, klíče z V1 jsou menší než med(V) a klíče z V2 jsou větší než med(V). 4.Definuj kořen stromu jako med(V). 5.Aplikuj algoritmus na množinu V1 pro levý podstrom nod.Left. 6.Aplikuj algoritmus na množinu V2 pro pravý podstrom nod.Right. FI MUNI, Drášil 2010 49 Úvod do GIS I Definice - Vyvážené stromy: Binární strom nazveme vyvážený, liší-li se hloubky nod.Left a nod.Right maximálně o 1 pro jeho každý uzel nod (hloubkou stromu rozumíme maximální délku cesty od kořene k listu). Poznámka – Rotace ve vyvážených stromech: Podmínku vyvážení lze udržovat dynamicky pomocí tzv. rotací (AVL stromy). Každý uzel si může zapamatovat hloubku levého a pravého podstromu. Při vložení nového klíče se strom v těch uzlech, ve kterých došlo k porušení podmínky vyvážení přeorganizuje, např: h h+1 hhh+1h C D EA B ED B+C A++ Počet uzlů v podstromu s kořenem nod označíme |nod|. Definice - BB[] stromy: Buď 0 <  < 1/2. Binární strom patří do třídy BB[] stromů, platí-li pro jeho každý uzel nod  < |nod.Left|/(|nod|) < 1- FI MUNI, Drášil 2010 50 Úvod do GIS I Poznámka – smysl BB[]: Pokud byl v nějakém okamžiku podstrom definovaný uzlem nod optimální, pak k porušení podmínky z definice BB[] stromů musí dojít k minimálně c*|nod| vložení/mazání uzlů do/z příslušného podstromu (c je konstanta závislá pouze na parametru ). Definice k-D strom: Úrovní level(nod) uzlu nod binárního stromu rozumíme délku cesty k tomuto uzlu od kořene stromu. Buď (S,) uspořádaná množina, k>0, x=(x0,..,xi,..,xk-1),y=(y0,..,yi,..,yk-1)Sk Říkáme, že x i y, jestliže xi  yi k-D stromem nad S nazveme binární strom, jehož uzly jsou ktice z Sk , a kde pro každý uzel nod, jeho levý podstrom nod.Left a všechny uzly tohoto podstromu nodL platí: nodl i nod kde i = level(nod) mod k Analogická podmínka musí být splněna i pro pravý podstrom nod.Right. Algoritmus – Vyhledání bodu ve 2-d stromu: Analogicky k binárním stromům, s tím rozdílem že na každé úrovni použijeme jinou srovnávací metodu (i). FI MUNI, Drášil 2010 51 Úvod do GIS I Algoritmus – Vložení bodu do 2-d stromu: Analogicky k binárním stromům, hledáme ve stromu „bod“ dokud nenarazíme na volnou pozici. Do ní vložíme nový klíč.¨ Geometrická interpretace 2-D stromu, každý vložený bod dělí, jistou část roviny na dvě „poloroviny“. 4 3 2 1 4 23 1 Algoritmus - Rozsahový dotaz pro body ve 2-d stromu: 1.Vstup: Kořen nod a obdélník q=[xmin,ymin,xmax,ymax]. 2.Je-li nod=null,konec. 3.Je-li nod.Key (tj. bod ve 2D prostoru) dotazovém obdélníku, pošli jej na výstup a aplikuj algoritmus na oba dva syny. 4.Vyber syny, pro které budeš aplikovat algoritmus a to podle úrovně ve které se nachází uzel nod, například je-li: level(nod) mod 2=0  nod.Key.x > xmax potom aplikuj algoritmus jen na větev nod.Left, analogicky pro další možné případy. FI MUNI, Drášil 2010 52 Úvod do GIS I 4 3 2 1 Dotazovýobdélník Vyvažování multidimensionálních stromů je komplikované. Nedají se totiž provádět rotace jako v klasických binárních stromech, protože v každém patře stromu měníme srovnávací kritérium, např. (obrázek rotace) z B.Key.x>A.Key.x  D.Key.yA.key.y Pomocí BB[] techniky lze však k-D stromy udržovat vyvážené pomocí částečné reorganizace, tedy „hlídat“ v každém uzlu k-D stromu poměr počtu uzlů v jeho levém a pravém podstromu a v případě porušení podmínky BB[] nahradit vybudovat optimální strom. Algoritmus -Vybudování optimálního 2-D stromu: 1. Vstup: množina bodů V, kořen stromu nod, úroveň uzlu l{'x','y'} 2. Je-li V = null, skonči. 3. Rozděl množinu V na po dvou disjunktní množiny V1,{medl(V)},V2 tak, že medl(V) je takový bod, že jeho l-ová souřadnice je medián množiny l-ových souřadnic z V, l-ové souřadnice z V1 jsou menší než medl(V) a l-ové z V2 jsou větší než medl(V). 4. Definuj kořen stromu jako medl(V). 5. Je-li l rovno 'x 'potom přiřaď l='y' jinak l='x' 6. Aplikuj algoritmus na množinu V1 pro levý podstrom nod.Left. 7. Aplikuj algoritmus na množinu V2 pro pravý podstrom nod.Right. FI MUNI, Drášil 2010 53 Úvod do GIS I Poznámka: Rozdělení množiny z kroku 3. lze realizovat modifikaci metody QuickSort. Metodu k-D stromů lze použít i na obdélníky, které můžeme považovat za 4D body [xmin,ymin,xmax,ymax]. Použijeme tedy 4-D strom. Algoritmus - Rozsahový výběr pro obdélníky ve 4-d stromu: 1.Vstup: kořen stromu nod, dotazový obdélník q=[xmin,ymin,xmax,ymax]. 2.Je-li nod = null, skonči. 3.Jsou-li obdélníky q a nod.Key incidentní, pošli nod na výstup a aplikuj algoritmus na nod.Left a nod.Right. 4.Podle úrovně, ve které se nacházíš ve stromu, se rozhodni, zda můžeš vynechat nějakou větev, např. Je-li: level(nod) mod 4=0 a nod.Key.xmin > q.xmax aplikuj algoritmus pouze pro nod.Left. Analogicky pro další úrovně, v každé se dá za jistých podmínek jedna větev vynechat. FI MUNI, Drášil 2010 54 Úvod do GIS I 4.4. QUAD TREE – KVADRANTOVÉ STROMY Kvadrantové stromy jsou prostorové vyhledávací struktury založené na pravidelném dělení části 2D prostoru (většinou čtverce) na čtyři stejné části. V základní verzi mohou přímo definovat polygonální geometrii. FI MUNI, Drášil 2010 55 Úvod do GIS I Definice – kvadrantový strom: Kvadrantový strom hloubky h je kvartérní strom (tj. každý uzel má maximálně 4 následníky) s těmito vlastnostmi: - Uzel je tvořen obdélníkem R=[xmin,ymin,xmax,ymax]a příznakem content{empty,full,half}. - List má příznak content{empty,full}. - Nelistový uzel má čtyři následníky a příznak content=half. - Následníci uzlu dělí obdélník rodičovského uzlu na čtyři „stejné“ části (podle středu). - Maximální délka od kořene k listu je h. Podle toho, jakou část rodičovského obdélníku reprezentuje uzel, označíme jej TL, TR, BL, BR (top/bottom left/right). Poznámka: Struktura je velmi dobře použitelná v těch případech, kdy je prostor pevně rozdělen na „dlaždice“, například pro služby typu WMTS (viz datové sklady GIS). Každá úroveň podrobnosti n je reprezentována maticí dlaždic 2n x2n .Struktura potom odpovídá na dotaz, zda je dlaždice obsazená (je na ní mapa/jev). Strukturu lze implementovat jednoduchým objektem: public class QtreeNode { public QtreeNode TopLeft; public QtreeNode TopRight; public QtreeNode BottomLeft; public QtreeNode BottomRight; public QtreeContent Content; } FI MUNI, Drášil 2010 56 Úvod do GIS I Struktura neobsahuje souřadnice čtverce/obdélníku, který reprezentuje, stačí si pamatovat nultý čtverec/obdélník kořene stromu. Souřadnice ostatních uzlů jsou potom definovány cestou od kořene. Algoritmus – vyhledání dlaždice v QuadTree: 1. Vstup sloupec col, řádek row, podrobnost zoom a kořen node. 2. i=zoom 3. Je-li node.Content≠half vrať node.Content a konec. 4. Je-li i==0 vrať node.Content a konec. 5. Nechť coli je i-tá binární cifra čísla col zprava, rowi je itá binární cifra čísla row zprava. 6. Je-li coli=0 pokračuj nahoru, je-li coli=1 pokračuj dolů, Je-li rowi=0 pokračuj doleva, je-li rowi=1 pokračuj doprava. Přiřaď uzlu node= node .„pokračování“, i=i-1 a pokračuj 3. Na struktuře lze velmi snadno a elegantně provádět množinové operace. Stačí implementovat operaci inverze a např. průniku, ostatní množinové operace lze provést pomocí těchto dvou. FI MUNI, Drášil 2010 57 Úvod do GIS I Algoritmus – inverze QuadTree 1. Vstup kořen node. 2. Je-li node.Content==full potom node.Content=empty a návrat. 3. Je-li node.Content==empty potom node.Content=full a návrat. 4. Je-li node.Content==half potom proveď kroky 2. a 3. pro všechny následníky. Algoritmus – průnik QuadTree: 1. Vstup kořeno dvou stromů node1 a node2. 2. Je-li node1.Content==empty nebo node2.Content==empty vrať uzel node s obsahem node.Content= empty. 3. Je-li node1.Content==full a node2.Content==full vrať uzel node s obsahem node.Content=full. 4. Je-li node1.Content==half a node2.Content==full vrať node1. 5. Je-li node2.Content==half a node1.Content==full vrať node2. 6. Jinak vytvoř nový uzel node a následníkům přiřaď uzly opakováním kroků 2. – 6. pro odpovídající dvojice následníků uzlů node1 a node2. Vrať nový uzel node. FI MUNI, Drášil 2010 58 Úvod do GIS I Pevný kvartérní strom (non-pointer Quad Tree) Zájmové území je postupně děleno na obdélníkové části a podle nich je jim přidělován „klíč“ 4300 4400 42003000 2000 4100 1000 Obr. - Číslování obdélníků-dlaždic v non-pointer Quad Tree. Obdélník bude mít index takové dlaždice „pevné struktury“ která je jeho nadmnožinou a je nejmenší s touto vlastností. - Pro libovolný obdélník R označme Q(R) jeho klíč v non-pointer QuadTree. - Pro libovolný klíč K označme jeho „nenulovou“ část, tedy levý podřetězec symbolem NZ(K). - Délku znakového řetězce K označme len(K). - Podřetězec řetězce K z levé strany délky l označme substr(K,l). FI MUNI, Drášil 2010 59 Úvod do GIS I Tvrzení – incidence obdélníků n non-pointer QuadTree: Buďte A, B libovolné obdélníky, jejichž strany jsou rovnoběžné s osami souřadného systému. Nechť dále A  B  . Označíme-li, l=min{len(NZ(Q(A))),len(NZ(Q(B)))} potom: substr(Q(A),l)=substr(Q(B),l) Algoritmus - Vyhledání obdélníků v non-pointer QuadTree: 1. Vstup – obdélník S=[xmin,ymin,xmax,ymax]. 2. Pošli na výstup všechny obdélníky A, pro které: substr(Q(A),len(NZ(Q(S))))= NZ(Q(S)) a A  S   3. Pošli na výstup všechny obdélníky A, pro které: Q(A)=P a A  S   kde P jsou všechny klíče, které jsou na cestě od Q(S) ke kořenu, tj. v Q(S) zprava postupně nahrazujeme nenulové číslice nulami. Tento postup má jednu nevýhodu, v případě, že dotaz inciduje se středem území, potom procházíme v bodě 2 všechno. Této nevýhodě se vyhneme dekomponování dotazu. FI MUNI, Drášil 2010 60 Úvod do GIS I Algoritmus - Dekompozice dotazu v non-pointer QuadTree: 1. Vstup – dotazový obdélník S. 2. Rozděl obdélník S na obdélníky S1 a S2 (S1  S2 = S) podle takové souřadnice x resp. y, která způsobila klíčování v nonpointer quadTree, tj. takovou, která ohraničuje nějaký čtverec v non-pointer quadTree a prochází dotazovým obdélníkem S. V případě, že taková souřadnice neexistuje potom obdélník S neděl a konec. 3. Aplikuj krok 2. na čtverce S1 a S2 podle druhé souřadnice. Tímto postupem získáme maximálně 4 obdélníky na které aplikujeme algoritmus vyhledání obdélníků Výhody této metody: - Velmi snadná implementace v prostředí SQL - tedy relačních databází, například norma WKB nepředepisuje metodu efektivního výběru, tímto způsobem ji můžeme doplnit. - „jeden objekt“´=„jeden klíč“, znamená, že prostorová indexace je zabezpečena přímo v geometrické tabulce. Prostorový výběr nevyžaduje součin, či spojení s dalšími tabulkami. FI MUNI, Drášil 2010 61 Úvod do GIS I Dekompozice dotazu – 4 obdélníky sklíči: 2330000000,2343000000,4110000000,4120000000 SELECT ID FROM KM_ALL WHERE ( (SPAT_KEY BETWEEN '2330000000' AND '2335000000') OR (SPAT_KEY BETWEEN '2343000000' AND '2343500000') OR (SPAT_KEY BETWEEN '4110000000' AND '4115000000') OR (SPAT_KEY BETWEEN '4120000000' AND '4125000000') ) OR SPAT_KEY IN ('0000000000', '2000000000', '2300000000', '2340000000', '4000000000', '4100000000' ) AND (xmax>=-642646042) AND (ymax>=-1114990337) AND (xmin<=-569087654) AND (ymin<=-1070777051) FI MUNI, Drášil 2010 62 Úvod do GIS I 4.5. SB+ STROMY Definice – B+ -stromy: B-strom řádu m je strom s těmito vlastnostmi: - každý uzel má maximálně m synů - každý uzel, s výjimkou kořene a listů, má minimálně m/2 synů - kořen má minimálně 2 syny, pokud není list - všechny listy jsou na stejné úrovni - nelistový uzel s k syny obsahuje k-1 klíčů - pro klíče v uzlu key1,. . ,keyk jsou vzestupně uspořádány - ukazatel pi ukazuje na uzel, jehož všechny klíče jsou v intervalu [keyi,keyi+1] (formálně předpokládáme, že key0=- a keyk+1= Uzly B+ stromu mají tedy tvar p0key1p1…pk-1keykpk. Algoritmus vložení klíče do B+ stromu: 1. Vstup klíč key a kořen B+ stromu. 2. Není-li uzel list vyber dvojici klíčů keyi,keyi+1 s vlastností keyi-1m, rozděl uzel. FI MUNI, Drášil 2010 63 Úvod do GIS I Algoritmus dělení uzlů v B+ stromu řádu m : 1. Vstup uzel s m+1 klíči. 2. Nechť k=m/2+1, vytvoř dva nové uzly: p0key1p1…pk-2keyk-1pk-1 a pkkeyk+1pk+1…pmkeym+1pm+1 a ukazatele na ně q resp. r 3. Je-li uzel kořen, vytvoř nový prázdný kořen: q keyk r jinak nechť pi je ukazatel z otcovského uzlu. Vlož klíč keyk do otcovského uzlu na pozici: ..keyi pi keyi+i..  keyi q keyk r keyk+i 4. Má-li otcovský uzel m+1 klíčů, opakuj pro něj kroky 1.-3. Na základě struktury B+ byl definován SB+ strom: SB+ strom je B+ strom z počátečních a koncových bodů intervalů a navíc: - V SB+ stromech jsou k listům přidány seznamy identifikátorů intervalů, které jsou incidentní s klíčem v listu (tj. nějakým počátkem resp. koncem nějakého intervalu). - S každým identifikátorem je pamatován příznak, který označuje zda v se jedná o počáteční hodnotu intervalu, koncovou hodnotu intervalu, popřípadě zda interval touto hodnotou prochází. FI MUNI, Drášil 2010 64 Úvod do GIS I 2 2 4 6 8 10 12 14 16 4 6 8 R1 R2 S1 S2 S3 R3 8 4 12 16 1 2 4 6 8 10 12 14 16 R1 b R1 c R2 b R1 c R2 c S1 b S2 b R1 e R2 e S1 c S2 c S1 e S2 c S2 e S3 b R3 b S3 c R3 c S3 e R3 e FI MUNI, Drášil 2010 65 Úvod do GIS I Algoritmus – Incidence intervalů v SB+ stromech: 1. Vstup dotazový interval [xmin,xmax]. Existující SB+ strom S. 2. Najdi ve stromu takový list, že pro bod ip který reprezentuje tento list platí: ip=min{i; i  S, i>xmin} 3. Pro všechna i s vlastností: ip < i< xmax 4. Pošli na výstup identifikace intervalů ze seznamu listu reprezentovaným bodem i (identifikace se mohou opakovat, posíláme jen jednou). FI MUNI, Drášil 2010 66 Úvod do GIS I Algoritmus – Vkládání intervalů do SB+ stromu: 1. Vstupní interval [xmin,xmax], jeho identifikace I. 2. Najdi ve stromu takový list, že pro bod ip který reprezentuje tento list platí ip=xmin. 3. Jestliže v kroku 2. jsme takový list nenašli, potom: 3.1. Vlož do stromu bod xmin standardní metodou pro B+ stromy 3.2. Nechť pip je bezprostřední předchůdce xmin, nip bezprostřední následník xmin v SB+ stromu. 3.3. Polož: xmin.seznam = pip.seznam  nip.seznam bez ohledu na příznak typu incidence. 3.4. Polož příznak typu incidence =’c’ pro všechny intervaly z xmin.seznam. 4. Kroky 2.-3. pro xmax. 5. Pro všechny listy SB+ stromu takové, že pro jejich body ip platí xmin  ip  xmax: 5.1. Je-li ip=xmin potom přidej do ip.seznam identifikaci I a příznak typu incidence „b‟. 5.2. Je-li ip=xmax potom přidej do ip.seznam identifikaci I a příznak typu incidence „e‟. 5.3. Je-li xmin0 a a b b (0,0) Algoritmus - Určení orientace polygonu: 1.Vyber z hranic oblastí takovou hranici a tři po sobě jdoucí její body tak, aby střední bod měl minimální souřadnici y (ze všech souřadnic y v polygonu) a první bod měl souřadnici y větší, než bod prostřední. 2.Rotuj souřadnou soustavu tak, aby orientovaná úsečka definovaná prvními dvěma body splynula s osou x v kladném směru. 3.Znaménko souřadnice y posledního bodu určuje orientaci polygonu. FI MUNI, Drášil 2010 76 Úvod do GIS I Poloha bodu vůči polygonu: Algoritmus - Bod v polygonu: 1. Najdi v bodech polygonu bod, jehož y-ová souřadnice je různá od souřadnice bodu, který testujeme. Nechť pp je polopřímka vycházející z testovaného bodu rovnoběžná s osou x v kladném směru. nPrus:=0.Od vybraného bodu postupně procházej všechny úsečky a proveď body 2 – 5. 2. Leží-li testovaný bod na úsečce, ukonči proceduru s výsledkem NA_HRANICI. 3. Má-li úsečka vlastní průsečík s polopřímkou pp, potom nPrus:=nPrus+1. 4. Končí-li úsečka na polopřímce a začíná-li mimo polopřímku, stanov podle počátku úsečky odkud:=POD nebo odkud:=NAD. 5. Začíná-li úsečka na polopřímce a končí-li mimo polopřímku a pokračuje-li do jiné poloroviny, než je stav proměnné odkud, potom nPrus:=nPrus+1. 6. Je-li nPrus sudý, ukonči proceduru s výsledkem VNĚ. 7. Je-li nPrus lichý, ukonči proceduru s výsledkem UVNITŘ. FI MUNI, Drášil 2010 77 Úvod do GIS I Poloha bodu vůči úsečce: (0,0) Rotujeme souřadnou soustavu tak, aby její počátek splynul s počátečním bodem úsečky a koncový bod ležel na x-ové souřadnici v kladném směrů. Určení polohy je potom triviální operace (nalevo, napravo, minimální vzdálenost..) x’=x.cos()-y.sin() y’=x.sin()+y.cos() Vzdálenost geometrických objektů: Distance(g1 Geometry, g2 Geometry) : Double Kombinace metod podle typu geometrií: Vzdálenost bod-bod, poloha bodu vůči úsečce, průsečík úseček, bod v polygonu… FI MUNI, Drášil 2010 78 Úvod do GIS I Konvexní obal množiny bodů: Je nejmenší konvexní polygon s takovou vlastností, že všechny vstupní body leží uvnitř něj nebo na jeho hranici. Konvexní polygon je polygon s touto vlastností: Každý vnitřní bod úsečky, jejíž krajní body leží na hranici polygonu, je i vnitřním bodem polygonu. Nechť polygon C={s0,..,sn} je konvexní obal množiny bodů S, s0 má minimální y souřadnici a maximální x souřadnici (v případě více minim y). Nechť dale {α1,..,αn} jsou úhly mezi x osou a úsečkou [s0,sn]. Potom: - Bod si leží nalevo od přímky definované body [si-2,si-1] - Polygon C je tvořen nejvíce body z S s předešlou vlastností - αi  αi+1 FI MUNI, Drášil 2010 79 Úvod do GIS I Algoritmus – konvexní obal (Graham scan - O(N*log(N)): 1.Vstup - soubor N bodů S 2. Vyber z S bod P0 s minimální y-souřadnicí ten nejvíce vpravo (max. X-souřadnice). 3. Setřiď body podle úhlu, které svírá přímka procházející daným bodem a bodem P0 do pole P[], bod P0 bude prvním bodem pole. 4. Vlož do zásobníku R bod P[0]=P0 a bod P[1]. 5. Pro 1 < i < N, kde N je počet bodů v P: 6. Nechť PT1 je první bod v zásobníku R, PT2 druhý bod 7. Je-li P[i] napravo od přímky PT1PT2, vlož P[i] do zásobníku a i:=i+1, jinak odstraň PT1 ze zásobníku a znovu 6. 8. Zásobník R obsahuje konvexní obal bodů. FI MUNI, Drášil 2010 80 Úvod do GIS I Množinové operace: Intersection (g1 Geometry, g2 Geometry) : Geometry Difference (g1 Geometry, g2 Geometry) : Geometry Union (g1 Geometry, g2 Geometry) : Geometry SymDifference(g1 Geometry, g2 Geometry) : Geometry Buffer (g1 Geometry, d Double Precision): Geometry Bod – bod: Triviání operace. Pozor, pro příslušnost bodu k množině je nutné použít vhodnou přístupovou metodu k prostorovým datům. Bod – lomená čára: Vzájemná poloha úsečka X bod. Bod – oblast: Poloha bodu vůči polygonu Lomená čára – lomená čára: Poloha dvou úseček. FI MUNI, Drášil 2010 81 Úvod do GIS I Lomená čára – oblast: Algoritmus - Průnik lomené čáry s oblastí. 1.Vstup: oblast a lomená čára. 2.Ze vstupní lomené čáry vytvoř seznam P segmentů lomené čáry takových, které buď neprotínají hranice oblasti, nebo jsou celé tečné. 3.Ze seznamu P vytvoř seznam SP takový, že libovolný vnitřní bod každého segmentu z S leží uvnitř oblasti. 4.Zřetěz segmenty z S do “co nejdelších” lomených čar, a výsledek pošli na výstup Oblast – oblast: Doplněk: Změna orientace hranic oblasti. Průnik dvou oblastí: A B AB FI MUNI, Drášil 2010 82 Úvod do GIS I AB B A Algoritmus - Průnik dvou oblastí: 1.Vstup: dvě orientované oblasti. 2.Všechny hrany hranic oblastí modifikuj tak, aby se vzájemně neprotínaly, mohou však splývat s hranami hranic z druhé oblasti. Potom mají tyto vlastnosti hrana splývá s jinou z druhé oblasti hrana leží celá uvnitř druhé oblasti hrana leží celá vně oblasti 3.Do seznamu zařaď ty hrany, které buď, leží celé v druhé oblasti, nebo splývají s nějakou hranou z druhé oblasti, se kterou mají stejnou orientaci, (totožné hrany jen jednou). 4.Z vybudovaného seznamu zřetěz hranice výsledné oblasti a výsledek pošli na výstup. (Nástin důkazu, že 4. Je uskutečnitelný…) FI MUNI, Drášil 2010 83 Úvod do GIS I Obalová zóna poloměru m (buffer zone): Je takový polygon, jehož vnitřní body mají vzdálenost od vstupního objektu maximálně m. Algoritmus – Obalová zóna linie: 1. Obalíme jednotlivé sementy (úsečky) lomenné čáry. 2. Obaly segmentů sjednotíme. Algoritmus – Obalová zóna oblasti: 1. Obalíme všechny hranice předešlým algoritmem 2. Výsledek sjednotíme se vstupem (polygonem, oblastí) FI MUNI, Drášil 2010 84 Úvod do GIS I Příklad: V GIS systému máme (mimo jiné ..) vrstvu lesů reprezentovanou jako areály a vrstvu venkovních úseků vysokého napětí. Zajímá nás, kde lesy zasahují do bezpečnostního pásma 10 metrů kolem úseků vysokého napětí. Jednotlivé úseky obalíme buffer zónou o daném poloměru. Obalové zóny useků nemusí být disjunktní, sjednotíme je. Výsledek pronikneme s vrstvou lesů. FI MUNI, Drášil 2010 85 Úvod do GIS I 6. Rastrová data v GIS Typy rastrových dat používaných pro GIS technologie jsou stejná jako v počítačové grafice: binární polotónová víceúrovňová FI MUNI, Drášil 2010 86 Úvod do GIS I Pro další práci očíslujeme sousedy pixelu P následujícím způsobem: 3 2 1 4 P 0 5 6 7 Sousedi 0,2,4,6 se nazývají přímí (d-) sousedi pixelu p. Sousedi 1,3,5,7 se nazývají nepřímí (i-) sousedi pixelu p. Definice - Histogram obrazu: Nechť f je polotónový obraz barev 1..M. Jeho histogramem rozumíme konečnou posloupnost h(f)=(h1..hM), kde, hi je počet pixelů s barvou i. 2550 počet hodnota Obr. 18 - Histogram obrazu Definice - Matice sousednosti: Nechť f je polotónový obraz barev 1..M. Jeho maticí sousednosti rozumíme čtvercovou MxM matici CM(f)={cmij}, kde, cmij je počet (přímo) sousedících pixelů o barvě i a j FI MUNI, Drášil 2010 87 Úvod do GIS I Lineární filtrace: Buď f polotónový obraz, M > 0. Položme g(x,y)= H(M,x,y) kde H je libovolná funkce, která v konstantním čase počítá novou hodnotu pixelu g(x,y) z okolí pixelu (x,y) o rozměru M. Funkce H bývá někdy vyjádřena váženým průměrem pixelů a lze ji vyjádřit: H(M,x,y)=i=-M,M j=-M,M h(i,j)*f(x+i,y+j) FI MUNI, Drášil 2010 88 Úvod do GIS I a) Zhlazující filtry: a) b) 1 1 1 1 2 1 1 1 1 2 4 2 1 1 1 1 2 1 FI MUNI, Drášil 2010 89 Úvod do GIS I Filtry, které se snaží „zostřit“ obraz: -1 -1 -1 -1 n -1 -1 -1 -1 FI MUNI, Drášil 2010 90 Úvod do GIS I Detektory hran: Základním filtr této třídy přiřadí novému pixelu největší absolutní hodnotu ze dvou výsledků: 1 2 1 1 0 -1 0 0 0 2 0 -2 -1 -2 -1 1 0 -1 FI MUNI, Drášil 2010 91 Úvod do GIS I Původní obraz Zhlazovací filtr: Zostřující filtr: Detektor hran: FI MUNI, Drášil 2010 92 Úvod do GIS I Kontura (hranice) oblasti v binárním obrazu: Nechť O je libovolná oblast (množina složená z jedniček) v binárním obrazu, Konturou (hranicí) oblasti O rozumíme všechny pixely patřící této oblasti, které mají nulového d- souseda. 1 1 1 11 1 1 1 000 0 0 0 0 0 rastrověvektorově FI MUNI, Drášil 2010 93 Úvod do GIS I Transformace obrazu: 1. Určíme bodové objekty ve zdrojovém obrazu, jejichž (kartografické) souřadnice jsou známé. Například přesně odečtené z mapy, geodeticky zaměřené apod. 2. Určíme transformační funkce z nového do starého obrazu komerční produkty většinou poskytují polynomiální transformaci založené na metodě nejmenších čtverců, je však možné použít i přesnou kartografickou transformaci. i = F(x,y) j = G(x,y) kde (i,j) značí souřadný systém originálního obrazu, (x,y)souřadný systém obrazu nového. 3. V této fázi procházíme cílový obraz, pomocí transformačních funkcí F a G se „díváme“ do originálu a počítáme hodnotu pixelu. Podle toho, z jakého okolí zdrojového pixelu určujeme výslednou hodnotu pixelu nového, se hovoří o metodách nejbližší soused bilineární transformace konvoluce okolí MxM [i,j] [x,y] FI MUNI, Drášil 2010 94 Úvod do GIS I První případ prostě přenese hodnotu pixelu do nového obrazu, v dalších případech se výsledná hodnota se počítá z jistého okolí pixelu v originálním obrazu. Velmi často se setkáváme s následující situací (například v klientech WMS služby). - Známe omezující obdélník cílové kartografické projekce a rozměr obrazu v pixelech - Známe sadu projekcí, které poskytuje (WMS) server - Potřebujeme dostat mapovou kompozici do “okna” na klientskou stanici. V tomto případě postupujeme takto: 1. Vybereme vhodnou serverovou projekci (např. WGS84, tu poskytuje každý WMS server). 2. Transformujeme dotazový obdélník do serverové projekce, upravíme pixelový rozměr obrazu. K tomuto účelu použijeme ”přesný” převod souřadnic (rovina_1→ elipsoid_1 centr_1→ centr_2 → elipsoid_2→ rovina_2, viz. transformace souřadných systémů). 3. Provedeme dotaz, získáme obraz v souřadnicích (i,j). 4. Vybereme sadu zdrojových pixelových souřadnic (většinou pravidelná mřížka NxN, nebo rohy obrazu). Tyto převedeme do zdrojových souřadnic, poté “přesnou” kartografickou transformací do souřadnic cílové projekce a cílových souřadnic pixelových (x,y). Takto získáme sadu dvojic “odpovídajících si” pixelů, kterou použijeme pro získání parametrů polynomiální transformace obrazu. FI MUNI, Drášil 2010 95 Úvod do GIS I Tento postup “šetří” výpočtovou náročnost tím, že nahradí náročné přepočty kartografických souřadnic polynomiální transformací. Skelet binárního obrazu: ..... ..... .*.*.. .*.*. ..*.*.. ..*.. ..*..*.. ..*.. ..*...*.. ..*.. ..*....*.. ..*.. ..*.. ..*.. ..*.. ..*.. ..*.. ..*.. ..*.. ..*.. ..*.. ..*.. ..*.. ..*.. ..*.. ..*.. ..*.. ..*.. ..*....*.. ..*.. ..*...*.. ..*.. ..*..*.. ..*.. ..*.*.. .*.*. ..*.*. ..... ..... Definice - Skelet: Nechť R je množina pixelů, B její hranice (kontura), P bod v R. Nejbližší soused bodu P na hranici B je bod M z B takový, že pro každý bod M´ z B je vzdálenost PM´ větší nebo rovna vzdálenosti PM. Má-li bod P více než jednoho nejbližšího souseda, nazývá se bodem skeletu množiny R. Sjednocení všech bodů skeletu tvoří skelet množiny R. FI MUNI, Drášil 2010 96 Úvod do GIS I Algoritmus - Určení skeletu: 1.Urči hranici (konturu) B(R) množiny R. 2.Urči množinu násobných pixelů M(R) v hranici B(R) 3.Je-li B(R) = M(R), skonči. 4.Polož R = R - (B(R) - M(R)) a pokračuj krokem 1. (a) (b) (c) A A A A A A A A C 0 P 0 A P 0 0 P 2+ B B B A 0 2 B B C Pixel označený 2 je hraniční pixel, pixel označený 2+ je hraniční nebo násobný pixel. (a), (b): Alespoň jeden pixel ze skupiny pixelů A, B je nenulový (c): Alespoň jeden pixel ze skupiny C musí být nenulový. Pokud jsou oba nenulové, pak může být hodnota pixelů ve skupinách A i B libovolná. Pokud je jeden pixel skupiny C nulový, musí být alespoň jeden pixel skupiny A i skupiny B nenulový. FI MUNI, Drášil 2010 97 Úvod do GIS I 7. Topologické úlohy v GIS Byly efektivně řešeny před tím, než byly vůbec GIS technologie vymezeny, přesto je můžeme považovat za součást analytického jádra topologicky orientovaných GIS. Základní datová struktura síťového grafu: Základní datová struktura areálového grafu: Nejčastější úlohy: Trasování grafu: Vyber všechny uzly/hrany, které jsou “napájeny” z daného uzlu, hodně používaná úloha pro dispečery sítí, modelování situací „co se stane, když?“. Uzel Vedení Přípojka HranaHrana Uzávěr Odběrné místo začíná končí Areál Hr. obce Hr. katas HranaHrana Obec Katastr 1.areál 2.areál FI MUNI, Drášil 2010 98 Úvod do GIS I Nejkratší cesta z uzlu do uzlu: Používá se klasický Dijkstrův algoritmus. Lze výhodně využít vlastnosti, že uzly grafu jsou prostorově lokalizovány. Algoritmus „Minimální cesta (Best search): Nechť (U,H) je graf s nezáporně ohodnocenými hranami, váhu libovolné hrany hH označme w(h). Nechť dále každý uzel uiU má 2D souřadnice (xi,yi). Pro libovolné uzly u,v označme d(u,v) jejich vzdálenost v E2. Pro libovolnou hranu hi=(ui,vi) nechť dále je d(ui,vi)w(h) – platí trojúhelníková nerovnost metrického prostoru E2. Potom pro libovolné uzly u0,vU, následující postup vede k nalezení minimální cesty z u0 do v. 1. Inicializace: Pro každý uzel uiU, uiu0 položme d_pathi=, d_path0=0, a položme každý uzel uiU c_pathi=NULL. 2. Výběr pivota: Položme c_pathi=d_pathi pro takový ui, pro který je c_pathi=NULL, d_pathi< a pro který je d_pathi+d(ui,v) minimální. Když neexistuje – končíme, cesta neexistuje. Je-li ui=v, potom konec c_pathi je délka minimální cesty a provedeme zpětný chod. 3. Expanze: Pro všechny uzly ukU takové, že existuje hrana hkH, hk=(ui,uk) (ui je pivot z předchozího kroku) položme d_pathk=min{d_pathk, c_pathi+w(hk)} a pokračujeme 2. Problém obchodního cestujícího: Hamiltonovská kružnice v grafu, extrémně obtížná úloha, dosud nebyla uspokojivě vyřešena (jedná se o NP úplný problém). FI MUNI, Drášil 2010 99 Úvod do GIS I Topologicko-geometrické úlohy: - Vytváření topologických vazeb na základě geometrických vlastostí objektů; jedná se o vytvoření přislušného typu grafu (uzel-hrana, hrana-hrana, areálový graf). Hojně se využívá přístupových metod pro geometrické objekty. - Generování oblastí z hran areálového grafu. - Identifikace hran areálového grafu. - Generování vyšších územních celků areálového grafu. - Kontrola konzistence geometrických a topologických vlastností dat (kontrola shody umístění uzlu a konce hrany s ním incidentní, kontrola křížení hran, kontrola stupňů uzlových bodů a další kontroly).