PA153 Počítačové zpracování přirozeného jazyka 05 - Sémantika II (logická reprezentace, od věty k diskurzu) Karel Pala, Zuzana IMevěrilová Centrum ZPJ, Fl MU, Brno 14. října 2013 PA153 Zpracování při Q Lexikální význam a kontext Kontext Q Větná sémantika, logická sémantika Q Sloveso jako predikát PA153 Zpracování přirozeného jazyka Lexikální význam a kontext lexikální význam: izolovaný význam slov plnovýznamové (autosémantické) lexikální jednotky (LU): • substantiva • adjektiva • verba • adverbia černý, moci, nechat, být, tak, vlastně pomocné (synsémantické) LU: z, proč, jak, ten ostatní: kykyryký PA153 Zpracování přirozeného jazyka 2 '—Lexikální význam a kontext ó 7 I po —Lexikální význam a kontext o Některé LU mají izolovaný význam, uvedené LU jsou do jisté míry protipříklady. Např. „černý" znamená „neplatící", ale jen v kolokaci „černý pasažér". Pomocná a způsobová (modálni) slovesa mají význam oslabený. U některých LU má smysl mluvit o významu skutečně jen v kontextu. Lexikální význam a kontext Krakutel z jejich mrusy se ploc blutkal, načež potom tražil také všechny své stěvače. Vyšetřovatel jopuz hrych vlády tre moc naštval, bruvěž slekym rozzuřil vičké kruky moré posluchače. Vyšetřovatel z jejich vlády se moc naštval, načež potom rozzuřil také všechny své posluchače. PA153 Zpracování přirozeného jazyka 2 '—Lexikální význam a kontext ó 7 I po —Lexikální význam a kontext o U těchto vět zkusíme určit slovní druhy a větné členy. U té první věty by to mělo být snazší než u té druhé. V první větě jsou plnovýznamová slova nahrazena nesmyslnými slovy, ale koncovka je zachována. V druhé větě jsou nahrazena všechna neplnovýznamová slova, konec slova je opět zachován. Jde o ukázku důležitosti funkčních slov pro pochopení významu věty. Význam těchto slov si uvědomíme právě jen v kontextu věty. Kontext » verbální kontext (co bylo řečeno, co bude následovat) • situační kontext (místo, čas, počet komunikačních partnerů, jejich vzájemný vztah, presupozice mluvčího) komunikační situace: KS = s, a, oi,..., o„, p, t, kde s - mluvčí, a - adresát, oi,..., o„ - promluvové objekty, p - místo komunikace, t - čas komunikace presupozice mluvčího: společná báze znalostí (to, co není třeba zmiňovat) • sociální kontext (vzdělání, zkušenost, životní podmínky, status sociální skupiny) Ale sakra himl hergot, já nikdy neřekl, že na mě nikdo nemá Jak zkoumat verbální kontext: v době „předkorpusové" konkordance v korpusu (středně velké korpusy) vord sket Ikandidát czTenTen12 [Majka] frekvence = 213578 {39.3 v milionu) 9026B -1.4 5105 10.02 2404 9.23 4647 9792 1055 1516 2315 745 8.74 8.43 8.34 8.28 8.19 7.42 post na post primátor prezident senátor eurokomisara pozice děkan rektor 45490 -7.3 2878 8.8 1617 8.14 3946 7.52 701 7.35 216 7.27 4181 7.2 382 7.15 321 7.03 gen 2 hodnost zvolení pětice nominace slyšení výběr představování navrhování 22232 -0.9 258 7.01 161 6.62 139 6.49 272 6.31 109 6.28 1822 6.11 62 6.11 91 6.08 Karel Pala, Zuzana Nevěřilová PA153 Zpracování přirozeného jazyka 05 - Sémantika II 6/24 Kontext a word sketch Jak vypočítat word sketch? word sketch grammar multi word sketch Větná sémantika význam věty: význam slov + syntaktické vztahy mezi větnými složkami (princip kompozicionality) Compositionality Principle: • The meaning of the whole is a function of the meaning of the parts and the mode of combining them. • The meaning of a complex expression is uniquely determined by the meaning of its constituents and the syntactic construction used to combine them. Logická sémantika • redukuje lexikálni význam LU na logický typ (individum, čas, ...) • zůstává predikátová struktura u sloves, příp. deverbativ a propozice mají pravdivostní hodnotu propozice1: informační obsah věty vyjádřený větou pronesenou v určitém kontextu více různých vět může vyjadřovat tutéž propozici: The Earth is round. Země je kulatá. 1http://plato.stanford.edu/entries/propositions-structured/ Logická sémantika a predikátová logika Predikátová logika 1. řádu (First Order Predicate Logic) [Mendelson, 1997] • termy: proměnné (x), funkce (f(x)) 9 predikátové symboly (P(x)) 9 logické spojky (V, A, =4>, • kvantifikátory (V, 3) • symbol rovnosti (=) • mimologické symboly (aritmetické symboly, řetězce atd.) Logická sémantika a predikátová logika Kdo nebude znát malou násobilku, dostane hodnocení F. Vx : ->Z(x," malá násobilka") =4> H(x," F") (Z(x, y) - x zná y, /7(x, y) - x dostal hodnocení y) Petr nezná malou násobilku. -iZ("Petr" ," malá násobilka") Úsudek: -iZ(" Petr" ," malá násobilka") =4> H(" Petr"," F") je pravdivý Logická sémantika a predikátová logika Vyzkoušejte: Komu se nelení, tomu se zelení. Vx : N {x) => Z(x) Honza se odrazil od podlahy a vyskočil do dvou metrů. 0(" Honza" ," podlaha") V(" Honza" ," 2 metry") Tahle vláda není ani ryba ani rak. -■(" tahle vláda" =" ryba") A tahle vláda" =" rak") Limity predikátové logiky • ne všechny konstrukce v přirozeném jazyce jsou propozice ► Dobrý den. Děkuji vám. ► Kdybych tak měl milión .. . ► Nedá se nic dělat. • ne všechny propozice jsou 1. řádu Všichni lidé mají společné vlastnosti. 3Wx : V(x) • v přirozeném jazyce je mnohem víc kvantifikátorů ► většina ► velká část ► kdekdo ► pár lidí, skoro nikdo ► pokud vůbec někdo Predikátová logika, typy argumentů Z(x, y) - x žije v y Honza žil v Brně. Z(" Honza"," Brno") Honza žil ještě v sobotu. Z(" Honza"," sobota") Z(x, y) - x žije v y a y je místo typované logiky Karel Pala, Zi Nevěřilová PA153 Zpracování přirozeného jazyka PA153 Zpracování přirozeného jazyka '—Větná sémantika, logická sémantika '—Predikátová logika, typy argumentů 0 tom bude mluvit Vojta K. v semináři č. 9. Sloveso jako predikát sloveso (příp. deverbativum) jako predikát, větné členy jako argumenty predikátu valence Sloveso jako predikát Kluk rozbil okno. Kámen vletěl do okna a rozbil ho. Okno se rozbilo. rozbít: AG(osoba) ART(výrobek) INS(nástroj) kluk osoba kámen nástroj okno výrobek Valenční slovníky české: • Vallex: In VALLEX 2.x, there are roughly 2,730 lexeme entries containing together around 6,460 lexical units ("senses"). 2 • VerbaLex: 3 ► 21032 literálú (sloveso + význam) ► 10469 slovesných lemmat anglické: • VerbNet: 8537 total verbs represented 4 2 http://"uial.mii.cuni.cz/vallex/2.6/doc/home.html 3http://nip.fi.muni.cz/cs/VerbaLex 4http://verbs.Colorado.edu./verb-index/index.php Roles • Agent [+int_control] • Patient |+conckete] • Instrument [+concrete] Frames NPVNP example "The Romans destroyed the city." syntax Agent V Patient semantics cause(Agent, e) destroyed(result(E), Patient) NPVNP PP.lnstrument example "The builders destroyed the warehouse with explosives." syntax Agent V Patient {with} Instrument semantics cause(Agent, E) use(during(E), Agent, Instrument) destroyed(result(E), Patient) NP.instrument V NP example "The explosives destroyed the warehouse." syntax Instrument V Patient semantics cause(?Agent, e) cse(during(E), ?Agent, Instrument) destroyed(result(E), Patient) zmařitf zničiť rozbítpf 3 5 3 mařiťnf ničiť"1'* rozbíjet im<* | 1 | zmařit^ rnant^ ä | 2 | rozbity, rozbíjet^, zničit^ "iat^ s -frame: GROUP <írSlitution:l> obl VERB obl GROUP 0 il ľ -example: policie rozbila zločinecký gang (pí) sloveso a jeho synonyma (synset) překlad slovesná třída (slovesa komunikace, slovesa ničení ... [Wu and Palmer, 1994]) slovesné rámce (jednotlivé případy užití slovesného synsetu) počet argumentů (slotů) syntaktické informace (větné členy: pořadí, pád, příp. předložka) sémantické role (role) ýběrová omezení (typický reprezentan PA153 Zpracování přirozeného jazyka 05 - Sémantika II 21 / 24 PA153 Zpracování přirozeného jazyka '—Sloveso jako predikát '—Zachycení významu ve valenčním rámci Dostáváme se zpět k tomu, o čem byla zmín prototypu Propojení valenčních rámců: od slovníků k sémantické síti popisy typických situací: skripty (scénáře), rámce: nakupovat, měřit, dolovat, zemřít • návrhy od 70. let: Schank, Abelson, Minsky • aplikace (datové zdroje): od 90. let FrameNet 5 5https://framenet.icsi.berkeley.eďu/fndrupal/ Definition: This transparent noun frame is concerned with _ Hillary lives in the middle of FTi! B Js for measuring the of regie A.CRES|ofwhea Paul owns cigwrjaaa ESgSE. Semantic Type: Transparent Noun FEs: Core: The region whose surface is being measured. Excludes: Occupant Klaas has a 10 WW US peach ffWTWW |Count []| The number of nBjs. Smiley owns HECTARES Mi.l.l..l-JJJ:IIJ=lW. Odkazy I H Mendelson, E. (1997). Introduction to Mathematical Logic. Discrete Mathematics and Its Applications Series. Chapman & Hall. 1 Wu, Z. and Palmer, M. (1994). Verbs semantics and lexical selection. In Proceedings of the 32nd annual meeting on Association for Computational Linguistics, ACL '94, pages 133-138, Stroudsburg, PA, USA. Association for Computational Linguistics.