Standardy sémantického webu RDF(S) ISKM89 Organizace dat - sémantický web | podzim 2023 Zuzana Nevěřilová | Centrum zpracování přirozeného jazyka Sémantický web kolem nás Web obsahuje stránky v HTML mikroformáty a mikrodata: do stránky v HTML přidáme sémantická metadata Výhody: ● přesnější odpovědi na vyhledávací dotazy ● odkazy na další, sémanticky propojené objekty ● agregace dat (např. vyhledávač zboží, sumarizované recenze) HTML rendering: ● prohlížeč dostane instrukce, jak stránku zobrazit pro člověka ● mikrodata se nezobrazují, ale slouží pro komunikaci s jinými počítači Standardy pro web a sémantický web URI - světově unikátní identifikátor, obsahuje schéma, může obsahovat jmenný prostor namespace - jmenný prostor pro uvedení do kontextu HTML - jazyk pro hypertextové dokumenty XML - zobecnění HTML, jazyk pro popis hierarchií RDF - jazyk pro popis objektů a relací mezi nimi SPARQL - dotazovací jazyk pro data v RDF Resource Description Framework - RDF = model pro výměnu dat mezi počítačovými programy Ideje: ● nevadí, že jiný návrhář použil jiný model pro stejnou situaci ● nevadí, že potřebujeme časem modelovat data podrobněji ● stávající data není třeba kvůli změnám v návrhu měnit ● každý objekt, který modelujeme, má URI ● relace mezi objekty jsou definované objekty (tudíž mají URI) ● ne všechna data musí být strukturovaná Film je umělecké dílo. Resource Description Framework - graf Trojice subjekt-predikát-objekt je tvrzení (statement). Tvrzení má pravdivostní hodnotu. Tvrzení je způsob, jak uložit strukturované i nestrukturované informace. Resource Description Framework - graf Bob is interested in The Mona Lisa . Bob is born on 14 July 1990 . Bob is a Person . Bob is a friend of Alice . La Joconde a Washington is about The Mona Lisa . The Mona Lisa was created by Leonardo Da Vinci . Příklad grafu https://www.w3.org/TR/rdf11-primer/ Bob is interested in The Mona Lisa . Bob is born on 14 July 1990 . Bob is a Person . Bob is a friend of Alice . La Joconde a Washington is about The Mona Lisa . The Mona Lisa was created by Leonardo Da Vinci . Příklad grafu . “14 July 1990” . . . . . RDF je způsob, jak modelovat znalosti (strukturované informace). RDF nabízí slovník (vocabulary) se základními koncepty. RDF Schema (RDFS) je rozšířením tohoto slovníku. Zpravidla se používá jak RDF, tak RDFS (https://www.w3.org/TR/rdf12-schema/) Resource Description Framework - model a také schéma RDF RDFS Statement subClassOf type label List Literal https://www.w3.org/TR/rdf11-concepts/#vocabularies RDF(S) - jmenné prostory Namespace prefix Namespace IRI RDF vocabulary rdf http://www.w3.org/1999/02/22-rdf-syntax-ns# The RDF built-in vocabulary [RDF11-SCHEMA] rdfs http://www.w3.org/2000/01/rdf-schema# The RDF Schema vocabulary [RDF11-SCHEMA] xsd http://www.w3.org/2001/XMLSchema# The RDF-compatible XSD types rdfs:subClassOf je QName (kvalifikované jméno) Je zvykem používat URI: ● US-ASCII ● nepoužívat mezery ● pro víceslovné identifikátory používat camelCase ● objekty začínají velkým písmenem, vlastnosti malým písmenem Modelování znalostí a RDF(S) XSD - XML Schema Definition (https://www.w3.org/TR/rdf11-concepts/#dfn-rdf-compatible-xsd-types) koncepty datových typů: xsd:string, xsd:integer, xsd:gYear Další slovník (kvůli literálům) “14 July 1990” . “14 July 1990”^^xsd:date . Označení jsou v přirozeném jazyce. Jazyky mají standardní zkratky. Literály jsou jen označení “The Mona Lisa”@en . “La Joconde”@fr . “Mona Lisa”@cs . “La Gioconda”@it . https://www.w3.org/TR/2004/REC-rdf-concepts-20040210/ O čem jsme ještě nemluvili: ● jaké znaky smí obsahovat literál ● jak porovnávat literály ● jak porovnávat grafy ● jak data v RDF ukládat ● co graf v RDF znamená? jaká je jeho sémantika? RDF(S) jsou standardy