Otevřená data Mapové zdroje Mgr. Radim Štampach, Ph.D. Prof. RNDr. Milan Konečný, CSc. Obecně OpenData jsou dnes velké téma: • konference • hackathony • předvolební kampaně • … Definice Otevřená data jsou: • Informace a data bezplatně a volně dostupná na internetu ve strukturované a strojově čitelné podobě a zpřístupněná způsobem, který jejich využití neklade zbytečné technické či jiné překážky. nebo • Data zveřejněná na internetu, která jsou úplná, snadno dostupná, strojově čitelná, používající standardy s volně dostupnou specifikací, zpřístupněná za jasně definovaných podmínek užití dat s minimem omezení a dostupná uživatelům při vynaložení minima možných nákladů. Otevřená data nejsou: • tabulky zveřejněné v podobě PDF souborů • tabulky zveřejněné v podobě HTML stránky Definice • úplná - zveřejněná v maximálním možném rozsahu, tj. nejsou záměrně odstraňovány vybrané záznamy a data jsou udržována co možná nejaktuálnější, • snadno dostupná - dostupná na internetu a dohledatelná běžnými nástroji informačních technologií, • strojově čitelná - ve formátu, který je strukturovaný tak, že pomocí programu z něj lze získat žádané údaje, • používající standardy s volně dostupnou specifikací (tzv. otevřené standardy) - ve formátu, který je volně (bezplatně) dostupný pro libovolné použití nebo do takovéhoto formátu převoditelný volně (bezplatně) dostupnou aplikací, Definice • zpřístupněna za jasně definovaných podmínek užití dat (licence) s minimem omezení, tj. podmínky užití musí být jasně definovány a musí umožňovat využití dat pro komerční i nekomerční účely, • dostupná uživatelům při vynaložení minima možných nákladů na jejich získání: • jejich poskytovatelé jsou oprávněni žádat úhradu maximálně ve výši, která nesmí přesáhnout náklady spojené s jejich zpřístupněním uživateli, • poskytovatel dat může jednorázově vyžádat i úhradu za mimořádně náročné pořízení dat, pokud si uživatel zpřístupnění těchto dat vyžádá. • Zpoplatnění je však předpokládáno ve zcela výjimečných případech. Pět hvězdiček • Tim Berners-Lee • Brit, Sir, ředitel W3C… • jeden z tvůrců Internetu • pětihvězdičkový systém hodnocení otevřenosti dat • jednoduchá orientace ve stupni otevřenosti datových sad Pět hvězdiček http://5stardata.info/en/ Definice Dostupná data • Data jsou zveřejněna na Internetu pod otevřenou licencí, nezáleží na formátu. Existují tedy určitá technická omezení pro jejich využití, nicméně legislativní omezení jsou odstraněna. • Např. mapa ve formátu PDF. Strukturovaná data • Data jsou zveřejněna ve strojově čitelném formátu. Formát není otevřený. Musíte mít určitý software. • Např. Excel nebo data uložená v Esri GeoDatabase. Data v otevřeném formátu • Data jsou zveřejněna v otevřeném formátu. Strojový formát je otevřený, tj. veřejně publikovaný s licencí umožňující jeho využití. • CSV, GML, SHP – nemusí to být jen standard OGC. Definice Data s identifikátorem • Data jsou dohledatelná, mají unikátní identifikátor (URI) v celé síti Internet. Jednotlivé datové sady musí mít vlastní adresu. • Formát RDF (Resource Description Framework) • Pracnější i pro poskytovatele dat. Vlastní stránky pro každou datovou sadu, složitější struktura dat. Propojená data (=„linked data“) • Data jsou navzájem prolinkovaná, lze mezi nimi navigovat. Data jsou nejen identifikovatelná pomocí URI, ale obsahují odkazy na další datové sady. • Propojení dat spočívá v tom, že u různých datasetů (pomocí kódu) určíte, která data jsou společná. • Pomocí dotazovacího jazyka SPARQL se pak můžete dotazovat na propojená data z různých tabulek. • Pro poskytovatele dat to znamená hlídat funkčnost odkazů na externí zdroje. RDF Resource Description Framework • obecný rámec pro popis, výměnu a znovupoužití metadat • vytvořen W3C • zaznamenává vztah subjekt, predikát a objekt (=podmět, vlastnost a předmět) • např. „Geografický ústav sídlí na Přírodovědecké fakultě.“ • tyto vztahy se dají vzájemně řetězit • např. popis webové stránky, události v kalendáři… • zapisuje se v XML, číst a posílat si ho navzájem mají počítače RDF 3115 Jihomoravský kraj CZ064 1163508 Brno 3140 Moravskoslezský kraj CZ080 1205834 Ostrava RDF s propojením 3115 Jihomoravský kraj CZ064 1163508 rdf:resource="http://geo-app.ucn.muni.cz:8181/geoserver/MU/stampach_obce/brno" 3140 Moravskoslezský kraj CZ080 1205834 rdf:resource="http://geo-app.ucn.muni.cz:8181/geoserver/MU/stampach_obce/ostrava" SPARQL Simple Protocol and RDF Query Language • dotazovací jazyk, který je určený k dotazům nad RDF formátem • podobný SQL (pojmy SELECT, WHERE…) • standard W3C GeoSPARQL • rozšíření pro práci s prostorovými daty – např. topologie • standard OGC SPARQL Příklad z Wikipedie: „Jaké objekty mají geometrii v obdélníku s lomovými body: 38,913574° s.š., 77,089005° z.d. a 38,886321° s.š., 77,029953° z.d.?“ SPARQL Použití klikacích rozhraní: https://data.europa.eu/euodp/cs/linked-data Legislativa Zákon č. 106/1999 o svobodném přístupu k informacím „Otevřenými daty se pro účely tohoto zákona rozumí informace zveřejňované způsobem umožňujícím dálkový přístup v otevřeném a strojově čitelném formátu, jejichž způsob ani účel následného využití není omezen a které jsou evidovány v národním katalogu otevřených dat.“ • Vláda stanoví nařízením seznam informací zveřejňovaných jako otevřená data. • Definují se prioritní datové sady vhodné pro otevření. • Nařízení vlády č. 425/2016 Sb. Seznam informací zveřejňovaných jako otevřená data (podle Nařízení vlády č. 425/2016 Sb.) 1. Informace obsažené v seznamu znalců a tlumočníků podle zákona č. 36/1967 Sb., o znalcích a tlumočnících, ve znění pozdějších předpisů 2. Informace obsažené v seznamu znaleckých ústavů podle zákona č. 36/1967 Sb., ve znění pozdějších předpisů … … 24. Informace bez jejich předchozích změn obsažené v registru osob oprávněných v oblasti spotřebitelského úvěru k činnostem podle zákona o spotřebitelském úvěru vedeném podle zákona č. 257/2016 Sb., o spotřebitelském úvěru, ve znění pozdějších předpisů… Legislativa 15. Informace obsažené v základním registru územní identifikace, adres a nemovitostí podle zákona č. 111/2009 Sb., ve znění pozdějších předpisů Prostorových dat zmíněno moc není. Národní katalog otevřených dat https://data.gov.cz/ https://data.gov.cz/datov%C3%A9-sady Národní katalog otevřených dat • Skoro všechna data na NKOD patří ČÚZK. Mnoho tisíc datových sad. Ostatní instituce mají jen stovky datových sad. • Jak to, že je ČÚZK o tolik lepší než ostatní? ČÚZK a otevřená data • Co jsou otevřená data od ČÚZK? ČÚZK a otevřená data • ČÚZK považují soubor každé obce za zvláštní datovou sadu. • RÚIAN, katastr, INSPIRE stahovací služby… • cca 6200 obcí • x několik různých tématik • = celkem 128 000 otevřených sad ČÚZK a otevřená data ČÚZK a otevřená data • Registr územní identifikace, adres a nemovitostí (RÚIAN) • Katastrální mapy ve vektorové formě • Data INSPIRE pro témata Parcely, Územní správní jednotky, Adresy, Budovy a Zeměpisné soustavy souřadnicových sítí • Soubor správních hranic a hranic katastrálních území ČR • Digitální geografický model území ČR (Data50) • Topografická databáze České republiky (Data200) • Úhrnné hodnoty pozemků https://www.cuzk.cz/Uvod/Produkty-a-sluzby/Otevrena-data.aspx • nová směrnice o otevřených datech • s účinností od července 2021 ČÚZK a otevřená data https://data.gov.cz/2019/11/18/sm%C4%9Brnice-o- otev%C5%99en%C3%BDch-datech.html Velká Británie Jak by mohl fungovat národní katalog? https://data.gov.uk Praha http://opendata.praha.eu/ základní portál pro otevřená data Brno https://data.brno.cz/ Svět Mapa portálů s otevřenými daty https://opendatainception.io/ Odkazy na informace v ČR • https://data.gov.cz/ - Národní katalog otevřených dat • http://opendata.gov.cz/ - státní stránky (MV ČR) s návodem, jak publikovat otevřená dat, metodiky a standardy, jak publikovat, co publikovat, časový harmonogram • spousta webů neziskového sektoru