Otevřená data
Mapové zdroje
Mgr. Radim Štampach, Ph.D.
Prof. RNDr. Milan Konečný, CSc.
Obecně
OpenData jsou dnes velké téma:
• konference
• hackathony
• předvolební kampaně
• …
Definice
Otevřená data jsou:
• Informace a data bezplatně a volně dostupná na internetu ve
strukturované a strojově čitelné podobě a zpřístupněná způsobem,
který jejich využití neklade zbytečné technické či jiné překážky.
nebo
• Data zveřejněná na internetu, která jsou úplná, snadno dostupná,
strojově čitelná, používající standardy s volně dostupnou specifikací,
zpřístupněná za jasně definovaných podmínek užití dat s minimem
omezení a dostupná uživatelům při vynaložení minima možných
nákladů.
Otevřená data nejsou:
• tabulky zveřejněné v podobě PDF souborů
• tabulky zveřejněné v podobě HTML stránky
Definice
• úplná - zveřejněná v maximálním možném rozsahu, tj. nejsou záměrně
odstraňovány vybrané záznamy a data jsou udržována co možná
nejaktuálnější,
• snadno dostupná - dostupná na internetu a dohledatelná běžnými
nástroji informačních technologií,
• strojově čitelná - ve formátu, který je strukturovaný tak, že pomocí
programu z něj lze získat žádané údaje,
• používající standardy s volně dostupnou specifikací (tzv. otevřené
standardy) - ve formátu, který je volně (bezplatně) dostupný pro
libovolné použití nebo do takovéhoto formátu převoditelný volně
(bezplatně) dostupnou aplikací,
Definice
• zpřístupněna za jasně definovaných podmínek užití dat (licence) s
minimem omezení, tj. podmínky užití musí být jasně definovány a musí
umožňovat využití dat pro komerční i nekomerční účely,
• dostupná uživatelům při vynaložení minima možných nákladů na
jejich získání:
• jejich poskytovatelé jsou oprávněni žádat úhradu maximálně ve výši,
která nesmí přesáhnout náklady spojené s jejich zpřístupněním
uživateli,
• poskytovatel dat může jednorázově vyžádat i úhradu za mimořádně
náročné pořízení dat, pokud si uživatel zpřístupnění těchto dat
vyžádá.
• Zpoplatnění je však předpokládáno ve zcela výjimečných
případech.
Pět hvězdiček
• Tim Berners-Lee
• Brit, Sir, ředitel W3C…
• jeden z tvůrců Internetu
• pětihvězdičkový systém hodnocení otevřenosti dat
• jednoduchá orientace ve stupni otevřenosti
datových sad
Pět hvězdiček
http://5stardata.info/en/
Definice
Dostupná data
• Data jsou zveřejněna na Internetu pod otevřenou licencí,
nezáleží na formátu. Existují tedy určitá technická omezení pro
jejich využití, nicméně legislativní omezení jsou odstraněna.
• Např. mapa ve formátu PDF.
Strukturovaná data
• Data jsou zveřejněna ve strojově čitelném formátu. Formát není
otevřený. Musíte mít určitý software.
• Např. Excel nebo data uložená v Esri GeoDatabase.
Data v otevřeném formátu
• Data jsou zveřejněna v otevřeném formátu. Strojový formát je
otevřený, tj. veřejně publikovaný s licencí umožňující jeho využití.
• CSV, GML, SHP – nemusí to být jen standard OGC.
Definice
Data s identifikátorem
• Data jsou dohledatelná, mají unikátní identifikátor (URI) v celé
síti Internet. Jednotlivé datové sady musí mít vlastní adresu.
• Formát RDF (Resource Description Framework)
• Pracnější i pro poskytovatele dat. Vlastní stránky pro každou
datovou sadu, složitější struktura dat.
Propojená data (=„linked data“)
• Data jsou navzájem prolinkovaná, lze mezi nimi navigovat. Data
jsou nejen identifikovatelná pomocí URI, ale obsahují odkazy na
další datové sady.
• Propojení dat spočívá v tom, že u různých datasetů (pomocí
kódu) určíte, která data jsou společná.
• Pomocí dotazovacího jazyka SPARQL se pak můžete dotazovat
na propojená data z různých tabulek.
• Pro poskytovatele dat to znamená hlídat funkčnost odkazů na
externí zdroje.
RDF
Resource Description Framework
• obecný rámec pro popis, výměnu a znovupoužití
metadat
• vytvořen W3C
• zaznamenává vztah subjekt, predikát a objekt
(=podmět, vlastnost a předmět)
• např. „Geografický ústav sídlí na Přírodovědecké
fakultě.“
• tyto vztahy se dají vzájemně řetězit
• např. popis webové stránky, události v kalendáři…
• zapisuje se v XML, číst a posílat si ho navzájem mají
počítače
RDF
3115
Jihomoravský kraj
CZ064
1163508
Brno
3140
Moravskoslezský kraj
CZ080
1205834
Ostrava
RDF s propojením
3115
Jihomoravský kraj
CZ064
1163508
rdf:resource="http://geo-app.ucn.muni.cz:8181/geoserver/MU/stampach_obce/brno"
3140
Moravskoslezský kraj
CZ080
1205834
rdf:resource="http://geo-app.ucn.muni.cz:8181/geoserver/MU/stampach_obce/ostrava"
SPARQL
Simple Protocol and RDF Query Language
• dotazovací jazyk, který je určený k dotazům nad RDF
formátem
• podobný SQL (pojmy SELECT, WHERE…)
• standard W3C
GeoSPARQL
• rozšíření pro práci s prostorovými daty – např. topologie
• standard OGC
SPARQL
Příklad z Wikipedie:
„Jaké objekty mají geometrii v obdélníku s lomovými body:
38,913574° s.š., 77,089005° z.d. a 38,886321° s.š., 77,029953° z.d.?“
SPARQL
Použití klikacích rozhraní: https://data.europa.eu/euodp/cs/linked-data
Legislativa
Zákon č. 106/1999 o svobodném přístupu k informacím
„Otevřenými daty se pro účely tohoto zákona rozumí
informace zveřejňované způsobem umožňujícím dálkový
přístup v otevřeném a strojově čitelném formátu, jejichž
způsob ani účel následného využití není omezen a které jsou
evidovány v národním katalogu otevřených dat.“
• Vláda stanoví nařízením seznam informací zveřejňovaných
jako otevřená data.
• Definují se prioritní datové sady vhodné pro otevření.
• Nařízení vlády č. 425/2016 Sb.
Seznam informací zveřejňovaných jako otevřená data (podle Nařízení vlády č. 425/2016 Sb.)
1. Informace obsažené v seznamu znalců a tlumočníků podle zákona č. 36/1967 Sb., o znalcích a tlumočnících,
ve znění pozdějších předpisů
2. Informace obsažené v seznamu znaleckých ústavů podle zákona č. 36/1967 Sb., ve znění pozdějších předpisů
…
…
24. Informace bez jejich předchozích změn obsažené v registru osob oprávněných v oblasti spotřebitelského
úvěru k činnostem podle zákona o spotřebitelském úvěru vedeném podle zákona č. 257/2016 Sb., o
spotřebitelském úvěru, ve znění pozdějších předpisů…
Legislativa
15. Informace obsažené v základním registru územní identifikace, adres a
nemovitostí podle zákona č. 111/2009 Sb., ve znění pozdějších předpisů
Prostorových dat zmíněno moc není.
Národní katalog otevřených dat
https://data.gov.cz/
https://data.gov.cz/datov%C3%A9-sady
Národní katalog otevřených dat
• Skoro všechna data na NKOD patří ČÚZK. Mnoho tisíc
datových sad. Ostatní instituce mají jen stovky datových sad.
• Jak to, že je ČÚZK o tolik lepší než ostatní?
ČÚZK a otevřená data
• Co jsou otevřená data od ČÚZK?
ČÚZK a otevřená data
• ČÚZK považují soubor každé obce za zvláštní datovou sadu.
• RÚIAN, katastr, INSPIRE stahovací služby…
• cca 6200 obcí
• x několik různých tématik
• = celkem 128 000 otevřených sad
ČÚZK a otevřená data
ČÚZK a otevřená data
• Registr územní identifikace, adres a nemovitostí (RÚIAN)
• Katastrální mapy ve vektorové formě
• Data INSPIRE pro témata Parcely, Územní správní
jednotky, Adresy, Budovy a Zeměpisné soustavy
souřadnicových sítí
• Soubor správních hranic a hranic katastrálních území ČR
• Digitální geografický model území ČR (Data50)
• Topografická databáze České republiky (Data200)
• Úhrnné hodnoty pozemků
https://www.cuzk.cz/Uvod/Produkty-a-sluzby/Otevrena-data.aspx
• nová směrnice o otevřených datech
• s účinností od července 2021
ČÚZK a otevřená data
https://data.gov.cz/2019/11/18/sm%C4%9Brnice-o-
otev%C5%99en%C3%BDch-datech.html
Velká Británie
Jak by mohl
fungovat
národní
katalog?
https://data.gov.uk
Praha
http://opendata.praha.eu/
základní portál pro
otevřená data
Brno
https://data.brno.cz/
Svět
Mapa portálů s otevřenými daty
https://opendatainception.io/
Odkazy na informace v ČR
• https://data.gov.cz/ - Národní katalog otevřených dat
• http://opendata.gov.cz/ - státní stránky (MV ČR) s návodem,
jak publikovat otevřená dat, metodiky a standardy, jak
publikovat, co publikovat, časový harmonogram
• spousta webů neziskového sektoru