Rozšírenie VerbNetu Kristína Miklášová, PA153 30.11.2017 (A large-scale extension of VerbNet with novel verb classes) VerbNet ● najväčší online lexikón slovies pre angličtinu ● detailný syntakticko-sémantický popis originálnych slovesných tried od Beth Levinovej (1993) ● lexikálne triedy slovies pre generalizáciu lingvistických vlastností Využitie ● výpočtová lexikografia ● strojový preklad ● desambiguácia ● získavanie subkategorizácií Subkategorizácia ● slovesá s významom „spôsob pohybu”: run / travel / walk - I traveled/ran/walked - I traveled/ran/walked to London - I traveled/ran/walked five miles Slovesná trieda ● tématická rola & obmedzenia na argumenty ● členovia triedy ● rámce obsahujúce syntaktický popis ● sémantická informácia Trieda pre sloveso „hit“ Role & Restrictions: Agent[+init_control] Patient[+concrete] Instrument[+concrete] Members: bang, bash, hit, kick ... Frames: Name: Basic Transitive Example: Paula hit the ball Syntax: Agent V Patient Semantics: cause(Agent, E) manner(during(E), directedmotion, Agent) !contact(during(E), Agent, Patient) manner(end(E), forceful, Agent) contact(end(E), Agent, Patient) Rozšírenie VerbNetu ● Korhonen & Briscoe - r. 2004 - 57 nových tried - 2 až 45 členov ● Korhonen & Ryant - r. 2005 - 53 nových tried - 2 až 37 členov Integrácia nových tried I ● priradenie syntakticko-sémantického popisu slovies ako vo VerbNete: - nekompatibilný syntaktický popis - nedostatočný sémant. popis ● nekonzistentnosť tried K&B a K&R z hľadiska granularity Integrácia nových tried II 1. úplne nové triedy 2. podtriedy už existujúcich tried 3. reorganizácia originálnych tried Trieda Príklady slovies URGE ask, persuade FORCE manipulate, pressure WISH hope, expect ALLOW allow, permit FORBID prohibit, ban HELP aid, assist K&B triedy Začlenenie rozšírení K&B triedy K&R triedy počet kandidátov 57 53 vyhodené triedy 2 7 podtriedy už existujúcich tried 42 11 reorganizácia pôvodných tried 13 nové triedy - 35 Rozdiely medzi K&B a K&R ● K&B: 1. interakcia medzi 2 živými entitami FORCE, BATTLE, CONSPIRE 2. stupeň zapojenia sa do aktivity TRY, NEGLECT, FOCUS 3. entita vs. abstraktná myšlienka WISH, DISCOVER Rozdiely medzi K&B a K&R II ● K&R: 1. sociálne interakcie medzi živými entitami DOMINATE, HIRE, SUBJUGATE 2. tvorenie abstrakcie ESTABLISH, PATENT 3. jedinečné triedy USE, SEEM, MULTIPLY Zhrnutie pred rozšírením po rozšírení lemy 3445 3769 triedy 191 274 pokrytie tokenov v PropBank 78,45% 90,86% PropBank ● korpus, v kt. sú argumenty prísudku oanotované ich sémantickými rolami VerbaLex ● obdoba VerbNetu na FI MU ● najrozsiahlejší slovník českých valenčných rámcov ● vychádza z WordNetu Ďakujem za pozornosť