PA153 Počítačové zpracování přirozeného jazyka 05 - Sémantika II (logická reprezentace, od věty k diskurzu) Karel Pala, Zuzana NevěTilová Centrum ZPJ, Fl MU, Brno 20. listopadu 2014 Karel Pala, Zuzana Nevěřilová PA153 Zpracováni přirozeného jazyka Q Lexikální význam a kontext Kontext Q Větná sémantika, logická sémantika Q Sloveso jako predikát PA153 Zpracování přirozeného jazyka Lexikální význam a kontext lexikální význam: izolovaný význam slov plnovýznamové (autosémantické) lexikální jednotky (LU): • substantiva • adjektiva • verba • adverbia černý, moci, nechat, být, tak, vlastně pomocné (synsémantické) LU: z, proč, jak, ten ostatní: kykyryký Lexikální význam a kontext Krakutel z jejich mrusy se ploc blutkal, načež potom tražil také všechny své stěvače. Lexikální význam a kontext Vyšetřovatel jopuz hrych vlády tre moc naštval, bruvěz slekym rozzuřil vičké kruky moré posluchače. Lexikální význam a kontext Krakutel z jejich mrusy se ploc blutkal, načež potom tražil také všechny své stěvače. Vyšetřovatel jopuz hrych vlády tre moc naštval, bruvěž slekym rozzuřil vičké kruky moré posluchače. Vyšetřovatel z jejich vlády se moc naštval, načež potom rozzuřil také všechny své posluchače. Kontext • verbální kontext (co bylo řečeno, co bude následovat) • situační kontext (místo, čas, počet komunikačních partnerů, jejich vzájemný vztah, presupozice mluvčího) komunikační situace: KS = s, a, oi,..., o„, p, t, kde s - mluvčí, a - adresát, oi,..., o„ - promluvové objekty, p - místo komunikace, t - čas komunikace presupozice mluvčího: společná báze znalostí (to, co není třeba zmiňovat) • sociální kontext (vzdělání, zkušenost, životní podmínky, status sociální skupiny) Kontext • verbální kontext (co bylo řečeno, co bude následovat) • situační kontext (místo, čas, počet komunikačních partnerů, jejich vzájemný vztah, presupozice mluvčího) komunikační situace: KS = s, a, oi,..., o„, p, t, kde s - mluvčí, a - adresát, oi,..., o„ - promluvové objekty, p - místo komunikace, t - čas komunikace presupozice mluvčího: společná báze znalostí (to, co není třeba zmiňovat) • sociální kontext (vzdělání, zkušenost, životní podmínky, status sociální skupiny) Jak zkoumat verbální kontext: v době „předkorpusové" konkordance v korpusu (středně velké korpusy) vord sket Ikandidát czTenTen12 [Majka] frekvence = 213578 {39.3 v milionu) 9026B -1.4 5105 10.02 2404 9.23 4647 9792 1055 1516 2315 745 8.74 8.43 8.34 8.28 8.19 7.42 post na post primátor prezident senátor eurokomisara pozice děkan rektor 45490 -7.3 2878 8.8 1617 8.14 3946 7.52 701 7.35 216 7.27 4181 7.2 382 7.15 321 7.03 gen 2 hodnost zvolení pětice nominace slyšení výběr představování navrhování 22232 -0.9 258 7.01 161 6.62 139 6.49 272 6.31 109 6.28 1822 6.11 62 6.11 91 6.08 Karel Pala, Zuzana Nevěřilová PA153 Zpracování přirozeného jazyka 05 - Sémantika II 6/24 Kontext a word sketch Jak vypočítat word sketch? Kontext a word sketch Jak vypočítat word sketch? word sketch grammar Kontext a word sketch Jak vypočítat word sketch? word sketch grammar multi-word sketch Větná sémantika význam věty: význam slov + syntaktické vztahy mezi větnými složkami (princip kompozicionality) Compositionality Principle: • The meaning of the whole is a function of the meaning of the parts and the mode of combining them. • The meaning of a complex expression is uniquely determined by the meaning of its constituents and the syntactic construction used to combine them. Logická sémantika • redukuje lexikálni význam LU na logický typ (individum, čas, ...) • zůstává predikátová struktura u sloves, příp. deverbativ a propozice mají pravdivostní hodnotu propozice1: informační obsah věty vyjádřený větou pronesenou v určitém kontextu více různých vět může vyjadřovat tutéž propozici: The Earth is round. Země je kulatá. 1http://plato.stanford.edu/entries/propositions-structured/ Logická sémantika a predikátová logika Predikátová logika 1. řádu (First Order Predicate Logic) [Mendelson, 1997] • termy: proměnné (x), funkce (f(x)) 9 predikátové symboly (P(x)) 9 logické spojky (V, A, =4>, • kvantifikátory (V, 3) • symbol rovnosti (=) • mimologické symboly (aritmetické symboly, řetězce atd.) Logická sémantika a predikátová logika Kdo nebude znát malou násobilku, dostane hodnocení Logická sémantika a predikátová logika Kdo nebude znát malou násobilku, dostane hodnocení Vx : ->Z(x," malá násobilka") =4> H(x," F") (Z(x, y) - x zná y, /7(x, y) - x dostal hodnocení y) Logická sémantika a predikátová logika Kdo nebude znát malou násobilku, dostane hodnocení Vx : ->Z(x," malá násobilka") =4> H(x," F") (Z(x, y) - x zná y, /7(x, y) - x dostal hodnocení y) Petr nezná malou násobilku. Logická sémantika a predikátová logika Kdo nebude znát malou násobilku, dostane hodnocení F. Vx : ->Z(x," malá násobilka") =4> H(x," F") (Z(x, y) - x zná y, /7(x, y) - x dostal hodnocení y) Petr nezná malou násobilku. -iZ("Petr" ," malá násobilka") Logická sémantika a predikátová logika Kdo nebude znát malou násobilku, dostane hodnocení F. Vx : ->Z(x," malá násobilka") =4> H(x," F") (Z(x, y) - x zná y, /7(x, y) - x dostal hodnocení y) Petr nezná malou násobilku. -iZ("Petr" ," malá násobilka") Úsudek: -iZ(" Petr" ," malá násobilka") =4> H(" Petr"," F") Logická sémantika a predikátová logika Kdo nebude znát malou násobilku, dostane hodnocení F. Vx : ->Z(x," malá násobilka") =4> H(x," F") (Z(x, y) - x zná y, /7(x, y) - x dostal hodnocení y) Petr nezná malou násobilku. -iZ("Petr" ," malá násobilka") Úsudek: -iZ(" Petr" ," malá násobilka") =4> H(" Petr"," F") je pravdivý Logická sémantika a predikátová logika Vyzkoušejte: Komu se nelení, tomu se zelení. Honza se odrazil od podlahy a vyskočil do dvou metrů. Tahle vláda není ani ryba ani rak. Logická sémantika a predikátová logika Vyzkoušejte: Komu se nelení, tomu se zelení. Vx : N {x) => Z(x) Honza se odrazil od podlahy a vyskočil do dvou metrů. Tahle vláda není ani ryba ani rak. Logická sémantika a predikátová logika Vyzkoušejte: Komu se nelení, tomu se zelení. Vx : N {x) => Z(x) Honza se odrazil od podlahy a vyskočil do dvou metrů. 0(" Honza" ," podlaha") V(" Honza" ," 2 metry") Tahle vláda není ani ryba ani rak. Logická sémantika a predikátová logika Vyzkoušejte: Komu se nelení, tomu se zelení. Vx : N {x) => Z(x) Honza se odrazil od podlahy a vyskočil do dvou metrů. 0(" Honza" ," podlaha") V(" Honza" ," 2 metry") Tahle vláda není ani ryba ani rak. -■(" tahle vláda" =" ryba") A tahle vláda" =" rak") Limity predikátové logiky • ne všechny konstrukce v přirozeném jazyce jsou propozice ► Dobrý den. Děkuji vám. ► Kdybych tak měl milión .. . ► Nedá se nic dělat. • ne všechny propozice jsou 1. řádu Všichni lidé mají společné vlastnosti. 3Wx : V(x) • v přirozeném jazyce je mnohem víc kvantifikátorů ► většina ► velká část ► kdekdo ► pár lidí, skoro nikdo, pokud vůbec někdo • implicitní existence Predikátová logika, typy argumentů Z(x,y) - x žije v y Honza žil v Brně. Z(" Honza"," Brno") Karel Pala, Zi Nevěřilová PA153 Zpracování přirozeného jazyka Predikátová logika, typy argumentů Z{x,y) - x žije v y Honza žil v Brně. Z(" Honza"," Brno") Honza žil ještě v sobotu. Z(" Honza"," sobota") Nevěřilová PA153 Zpracování přirozeného jazyka Predikátová logika, typy argumentů Z(x,y) - x žije v y Honza žil v Brně. Z(" Honza"," Brno") Honza žil ještě v sobotu. Z(" Honza"," sobota") Z(x,y) - x žije v y a y je místo Karel Pala, Zi Nevěřilová PA153 Zpracování přirozeného jazyka Predikátová logika, typy argumentů Z(x, y) - x žije v y Honza žil v Brně. Z(" Honza"," Brno") Honza žil ještě v sobotu. Z(" Honza"," sobota") Z(x, y) - x žije v y a y je místo typované logiky Karel Pala, Zi Nevěřilová PA153 Zpracování přirozeného jazyka Sloveso jako predikát sloveso (příp. deverbativum) jako predikát, větné členy jako argumenty predikátu valence Sloveso jako predikát Kluk rozbil okno. Kámen vletěl do okna a rozbil ho. Okno se rozbilo. rozbít: AG(osoba) ART(výrobek) INS(nástroj) Sloveso jako predikát Kluk rozbil okno. Kámen vletěl do okna a rozbil ho. Okno se rozbilo. rozbít: AG(osoba) ART(výrobek) INS(nástroj) kluk osoba kámen nástroj okno výrobek Valenční slovníky české: • Vallex: In VALLEX 2.x, there are roughly 2,730 lexeme entries containing together around 6,460 lexical units ("senses"). 2 • VerbaLex: 3 ► 21032 literálú (sloveso + význam) ► 10469 slovesných lemmat anglické: • VerbNet: 8537 total verbs represented 4 2 http://"uial.mii.cuni.cz/vallex/2.6/doc/home.html 3http://nip.fi.muni.cz/cs/VerbaLex 4http://verbs.Colorado.edu/verb-index/index.php Roles • Agent [+int_control] • Patient |+conckete] • Instrument [+concrete] Frames NPVNP example "The Romans destroyed the city." syntax Agent V Patient semantics cause(Agent, e) destroyed(result(E), Patient) NPVNP PP.lnstrument example "The builders destroyed the warehouse with explosives." syntax Agent V Patient {with} Instrument semantics cause(Agent, E) use(during(E), Agent, Instrument) destroyed(result(E), Patient) NP.instrument V NP example "The explosives destroyed the warehouse." syntax Instrument V Patient semantics cause(?Agent, e) cse(during(E), ?Agent, Instrument) destroyed(result(E), Patient) zmařitf zničiť rozbítpf 3 5 3 mařiťnf ničiť"1'* rozbíjet im<* | 1 | zmařit^ mafit^ ä | 2 | rozbít^, rozbíjet^, zničit^ "iat^ s -frame: GROUP <írSlitution:l> obl VERB obl GROUP 0 il ľ -example: policie rozbila zločinecký gang (pí) sloveso a jeho synonyma (synset) překlad slovesná třída (slovesa komunikace, slovesa ničení ... [Wu and Palmer, 1994]) slovesné rámce (jednotlivé případy užití slovesného synsetu) počet argumentů (slotů) syntaktické informace (větné členy: pořadí, pád, příp. předložka) sémantické role ýběrová omezení (typický reprezentan PA153 Zpracování přirozeného jazyka 05 - Sémantika II 21 / 24 Propojení valenčních rámců: od slovníků k sémantické síti popisy typických situací: skripty (scénáře), rámce: nakupovat, měřit, dolovat, zemřít • návrhy od 70. let: Schank, Abelson, Minsky • aplikace (datové zdroje): od 90. let FrameNet 5 5https://framenet.icsi.berkeley.eďu/fndrupal/ Definition: This transparent noun frame is concerned with _ Hillary lives in the middle of FTi! B Js for measuring the of regie A.CRES|ofwhea Paul owns cigwrjaaa ESgSE. Semantic Type: Transparent Noun FEs: Core: The region whose surface is being measured. Excludes: Occupant Klaas has a 10 WW US peach ffWTWW |Count []| The number of nBjs. Smiley owns HECTARES Mi.l.l..l-JJJ:IIJ=lW. Odkazy I H Mendelson, E. (1997). Introduction to Mathematical Logic. Discrete Mathematics and Its Applications Series. Chapman & Hall. 1 Wu, Z. and Palmer, M. (1994). Verbs semantics and lexical selection. In Proceedings of the 32nd annual meeting on Association for Computational Linguistics, ACL '94, pages 133-138, Stroudsburg, PA, USA. Association for Computational Linguistics.