Parafráze Reprezentace znalostí Jazyky sémantického webu OWL: Inference Dotazy Aplikace rodiny RDF PLIN037 Sémantika a počítače Zuzana Nevěřilová xpopelk@fi.muni.cz Centrum zpracování přirozeného jazyka, B203 Fakulta informatiky, Masarykova univerzita 11. dubna 2019 Parafráze Reprezentace znalostí Jazyky sémantického webu OWL: Inference Dotazy Aplikace rodiny RDF Parafráze Reprezentace znalostí Jazyky sémantického webu OWL: Inference Dotazy Aplikace rodiny RDF Parafráze Reprezentace znalostí Jazyky sémantického webu OWL: Inference Dotazy Aplikace rodiny RDF Parafráze Čím jsou zajímavé: • schopnost parafrázovat vyžaduje schopnost porozumět • aplikace ve strojovém překladu • aplikace ve výuce jazyka • aplikace v detekci obsahového překryvu • aplikace v detekci plagiátů Parafráze Reprezentace znalostí Jazyky sémantického webu OWL: Inference Dotazy Aplikace rodiny RDF Klasifikace parafrází • obtížný úkol, se kterým se každý vyrovná po svém (→ nízká mezianotátorská shoda) • anotační manuál (který buď nezachytí všechny případy, nebo ho nikdo nebude číst) • řešení neshody (třetí anotátor) • řešení náhodné shody? (výpočet Cohen κ nebo Fleiss κ) Parafráze Reprezentace znalostí Jazyky sémantického webu OWL: Inference Dotazy Aplikace rodiny RDF Klasifikace parafrází • obtížný úkol, se kterým se každý vyrovná po svém (→ nízká mezianotátorská shoda) • anotační manuál (který buď nezachytí všechny případy, nebo ho nikdo nebude číst) • řešení neshody (třetí anotátor) • řešení náhodné shody? (výpočet Cohen κ nebo Fleiss κ) lepší je formulovat lépe úkol pro anotátory, nejlépe jako klasifikační úlohu pro velmi málo tříd Parafráze Reprezentace znalostí Jazyky sémantického webu OWL: Inference Dotazy Aplikace rodiny RDF Reprezentace znalostí K sémantické analýze potřebujeme znalost jazyka a znalost světa. Znalost světa je dostupná ve znalostních bázích: • lexikální sítě (wordnety) • valenční slovníky • doménové znalosti (doménové ontologie) • encyklopedické znalosti (DBPedia) • common-sense (ConceptNet, CyC) • metadata (DublinCore) Parafráze Reprezentace znalostí Jazyky sémantického webu OWL: Inference Dotazy Aplikace rodiny RDF Jazyky sémantického webu Delší dobu trvající snahy o standardizaci přinesly několik různých způsobu zápisu faktů a odvozovacích pravidel do znalostních bází, např. KIF: (documentation AudiA6 EnglishLanguage "The A6 model of cars made by Audi beginning in 1995") (subclass AudiA6 AudiAutomobile) (subclass AudiAutomobile Automobile) (termFormat EnglishLanguage AudiA6 "Audi A6") (termFormat EnglishLanguage AudiAutomobile "Audi") Jazyky sémantického webu (RDF, OWL) • ukládají data ve formě trojic • mají několik standardizovaných formátů (NT, XML, Turtle). Parafráze Reprezentace znalostí Jazyky sémantického webu OWL: Inference Dotazy Aplikace rodiny RDF Sémantický web Sémantický web (také Web 3.0) – web, kterému budou počítačové programy „rozumět“.1 • aktivita W3C (autorem myšlenky je sir Tim Berners-Lee) • standardizovaný jazyk pro popis sémantických vztahů: RDF 1 Parafráze Reprezentace znalostí Jazyky sémantického webu OWL: Inference Dotazy Aplikace rodiny RDF Web a sémantický web

CD Nejlepší kapela: The Worst Of

Nejlepší kapela je vítězem soutěže Evropská unie má talent. Na svém novém CD The Worst Of hrají ty nejlepší pecky.

CD Nejlepší kapela : The Worst Of

Nejlepší kapela je vítězem soutěže < item id="id4" type="contest -name">Evropská unie má talent . Na svém novém CD The Worst Of hrají ty nejlepší pecky.

Parafráze Reprezentace znalostí Jazyky sémantického webu OWL: Inference Dotazy Aplikace rodiny RDF Jazyky sémantického webu: rodina RDF RDF = Resource Description Framework RDFS = RDF Scheme OWL = Web Ontology Language ... Parafráze Reprezentace znalostí Jazyky sémantického webu OWL: Inference Dotazy Aplikace rodiny RDF Jazyky sémantického webu: rodina RDF trojice: subjekt–predikát–objekt Tim Berners-Lee – vynalezl – web Parafráze Reprezentace znalostí Jazyky sémantického webu OWL: Inference Dotazy Aplikace rodiny RDF Rodina RDF: několik způsobů zápisu Tim Berners-Lee – vynalezl – web N3 (Notation3): @PREFIX dc: . dc:creator XML: Parafráze Reprezentace znalostí Jazyky sémantického webu OWL: Inference Dotazy Aplikace rodiny RDF Rodina RDF: validace zápisu Parafráze Reprezentace znalostí Jazyky sémantického webu OWL: Inference Dotazy Aplikace rodiny RDF Rodina RDF: složitější příklad 1991 -08 -07 Parafráze Reprezentace znalostí Jazyky sémantického webu OWL: Inference Dotazy Aplikace rodiny RDF Rodina RDF: složitější příklad 1991 -08 -07 Parafráze Reprezentace znalostí Jazyky sémantického webu OWL: Inference Dotazy Aplikace rodiny RDF RDF: není trojice málo? Není. Díky reifikaci (zpředmětování, reification). subjekt predikát objekt Tim Berners-Lee dc:creator WWW Parafráze Reprezentace znalostí Jazyky sémantického webu OWL: Inference Dotazy Aplikace rodiny RDF RDF: není trojice málo? Není. Díky reifikaci (zpředmětování, reification). subjekt predikát objekt Tim Berners-Lee dc:creator WWW ⇐ 1991-08-07 Parafráze Reprezentace znalostí Jazyky sémantického webu OWL: Inference Dotazy Aplikace rodiny RDF RDF: není trojice málo? Není. Díky reifikaci (zpředmětování, reification). subjekt predikát objekt tvrzení1 rdf:type rdf:Statement tvrzení1 rdf:subject Tim Berners-Lee tvrzení1 rdf:predicate dc:creator tvrzení1 rdf:object WWW Parafráze Reprezentace znalostí Jazyky sémantického webu OWL: Inference Dotazy Aplikace rodiny RDF RDF: není trojice málo? Není. Díky reifikaci (zpředmětování, reification). subjekt predikát objekt tvrzení1 rdf:type rdf:Statement tvrzení1 rdf:subject Tim Berners-Lee tvrzení1 rdf:predicate dc:creator tvrzení1 rdf:object WWW tvrzení1 dc:date 1991-08-07 Parafráze Reprezentace znalostí Jazyky sémantického webu OWL: Inference Dotazy Aplikace rodiny RDF RDF: reifikace 1991 -08 -07 Parafráze Reprezentace znalostí Jazyky sémantického webu OWL: Inference Dotazy Aplikace rodiny RDF RDF: reifikace Parafráze Reprezentace znalostí Jazyky sémantického webu OWL: Inference Dotazy Aplikace rodiny RDF Sémantický web? “This simple idea . . . remains largely unrealized.” [?] Parafráze Reprezentace znalostí Jazyky sémantického webu OWL: Inference Dotazy Aplikace rodiny RDF OWL: Inference Tvrzení o vlastnostech: • rdf:property je symetrická • rdf:property je antisymetrická • rdf:property je tranzitivní • rdf:property je ekvivalence • rdf:property má definiční obor (domain) • rdf:property má obor hodnot (range) Parafráze Reprezentace znalostí Jazyky sémantického webu OWL: Inference Dotazy Aplikace rodiny RDF OWL: Inference pomocí SubClassOf Class: bus_driver EquivalentTo: person that drives some bus Class: driver EquivalentTo: person that drives some vehicle Class: bus SubClassOf: vehicle Parafráze Reprezentace znalostí Jazyky sémantického webu OWL: Inference Dotazy Aplikace rodiny RDF Dotazy Dotazovací jazyky: SPARQL, RDQL, . . . (všechny podobné jako SQL) PREFIX dc: PREFIX rdf: SELECT ?creator WHERE { ?creator dc:creator . } Parafráze Reprezentace znalostí Jazyky sémantického webu OWL: Inference Dotazy Aplikace rodiny RDF Aplikace rodiny RDF FOAF, dbPedia, GoPubMed, WordNet as RDF Parafráze Reprezentace znalostí Jazyky sémantického webu OWL: Inference Dotazy Aplikace rodiny RDF