PLIN021 SÉMANTICKÁ ANALÝZA V PRAXI
ZUZANA NEVĚŘILOVÁ
2020/21
A bowl of oranges
ZDROJE ZNALOSTÍ PRO ZPRACOVÁNÍ PŘIROZENÉHO JAZYKA
SÉMANTICKÉ SÍTĚ
A picture containing text, electronics, typewriter Description automatically generated
¡Různé typy znalostí
¡Znalost jazyka
¡Znalost „světa“
¡Encyklopedická znalost
¡Common sense
¡Pro člověka poměrně srozumitelné
¡Pro počítačové programy dobře zpracovatelné
¡API (application programming interface)
APLIKAČNÍ PROGRAMOVÉ ROZHRANÍ
APPLICATION PROGRAMMING INTERFACE (API)
¡Způsob, jak spolu komunikují dva počítačové programy
¡Jazyk pro komunikaci:
¡XML, JSON, RDF(S)/OWL
¡Jazyky jsou standardizované,
význam jednotlivých relací nikoli.
RDF(S)/OWL: JAZYKY SÉMANTICKÉHO WEBU
¡Sémantický web: webové stránky nejsou jen text, ale obsahují sémantické anotace, tudíž jsou
zpracovatelné počítačovými programy
¡Jazyky pro sémantické anotace: RDF, RDFS, OWL a varianty
¡Tyto jazyky popisují propozice jako trojice tvrzení (subjekt, predikát, objekt)
¡RDF(S) obsahuje relace podtřída a umožňuje typovou kontrolu
¡OWL umožňuje definovat typy relací (symetrické, tranzitivní)
¡
¡Pomocí RDF(S)/OWL definujeme odvozování faktů.
Image depicting the subject predicate object relation.
RDF: PŘÍKLAD
¡Bob is interested in The Mona Lisa.
¡Bob is born on 14 July 1990.
¡Bob is a Person.
¡Bob is a friend of Alice.
¡La Joconde a Washington is about The Mona Lisa.
¡The Mona Lisa was created by Leonardo Da Vinci.
¡
Informal graphs of the sample triples
https://www.w3.org/TR/rdf11-primer/
RDF(S)/OWL: PŘÍKLAD INFERENCE
¡Symetrie: A is sibling of B -> B is sibling of A.
¡Tranzitivita: A has part B, B has part C -> A has part C.
¡Inverzní relace: A has part B -> B is part of A.
SPARQL: DOTAZOVACÍ JAZYK PRO RDF(S)/OWL
¡PREFIX dbo:
PREFIX xsd:
PREFIX foaf:
PREFIX :
SELECT ?name ?birth ?death ?person
¡WHERE { ?person dbo:birthPlace :Berlin .
¡ ?person dbo:birthDate ?birth .
¡ ?person foaf:name ?name .
¡ ?person dbo:deathDate ?death .
¡FILTER (?birth < "1900-01-01"^^xsd:date) . }
¡ORDER BY ?name
¡Najdi všechny osoby (jméno, datum narození, úmrtí) takové, že se narodily v Berlíně před rokem
1900.
¡Hledáme v dbPedii
¡Využíváme ale schémata i jiných ontologií
¡FOAF – friend of a friend (relace mezi lidmi)
¡XSD – XML schema (datové typy)
http://sites.linkeddata.center/help/devop/examples/sparql-examples
OKÉNKO DO ROKU 2069
¡Neměl v pokoji standardní informatický panel, musel dolů do vestibulu, chtěl-li získat údaje,
které potřeboval. Jako naschvál byla kabinka obsazena nějakou starší dámou, které trvalo pátrání v
informačních zdrojích tak dlouho, že Morgan už málem na dveře budky zabouchal. Ale nakonec se
loudalka přece jen s nějakým omluvným zamumláním z kabiny vybatolila a Morgan stál tváří v tvář
nashromážděným vědomostem a tvořivým silám celého lidstva.
¡Již za svých studentských let zvítězil v několika takových pátračských šampionátech, kdy o závod s
časem lovil a vyhrabával nejzasutější informace požadované testy; formulovali je až geniálně
sadističtí sudí. („Jaké bylo množství srážek v hlavním městě nejmenšího jednonárodního státu světa
v den, kdy v kolejním baseballovém mistrovství byl zaznamenán druhý největší počet celých oběhů?“ –
tenhle mu snad nejvíc utkvěl v paměti i v srdci.)
¡
Arthur C. Clarke: RAJSKÉ FONTÁNY, 1979
LITERATURA
¡Lee Feigenbaum: SPARQL By Example: A Tutorial. VP Technology & Standards, Cambridge Semantics.
2009 https://www.w3.org/2009/Talks/0615-qbe/
¡W3C: Web Ontology Language (OWL). W3C Semantic Web. 2012. https://www.w3.org/OWL/
¡OpenLink Software: Virtuoso SPARQL Query Editor. 2020. http://dbpedia.org/sparql