Databáze slovesných valenčních rámců PLIN059 Mgr. Dana Hlaváčková, Ph.D. Slovesná valence . slovesná valence - schopnost slovesa vázat k sobě další lexikální jednotky (substantiva, adjektiva, adverbia, infinitiv jiného slovesa, vedlejší větu) . jíst jídlo, stát se slavným, vidět rudě, jít běhat, říct, aby přísli . schopnost je dána (2 přístupy): - gramaticky (gramatickými vlastnostmi slovesa) - Vallex (Praha) - sémanticky (významem slovesa) - VerbaLex (Brno) . pozn. existuje také valence substantiv či adjektiv Slovesná syntax - teoretická východiska . závislostní syntax (L. Tesniěr) - doplnění slovesa - aktanty a cirkumstanty (= volná doplnění) . pádová gramatika (Case Grammar, Ch. Fillmore) - zavádí tzv. hloubkové pády (Semantic Roles - Agent, Patient ad.), Frame Semantics . v ČR zejména František Danes (oba přístupy, Větné vzorce v češtině, 1987) - Jana bolí hlava. - gramatické větné vzorce (GVV) Sj-VF- S4 - sémantické větné vzorce (SVV) agens - actio - patiens . později Petr Karlík (ÚČJ FF MU, směr Fillmore) a Jarmila Panevová (ÚFAL MFF UK, směr Tesniěr a FGP Petra Sgalla) Valenční rámce . formální záznam slovesné valence . zachycují valenci - levostrannou (subjekt/podmět) - pravostrannou (objekt/předmět a další aktanty/argumenty/doplnění) . bývají doplněny o sémantické informace - hloubkové pády/sémantické role/tématické role/funktory, příp. o další informace o slovesech . Petr jí jídlo příborem v jídelně. Valenční slovníky a databáze . Svozilová N., Prouzová H., Jirsová A. - Slovesa pro praxi. Valenční slovník nejčastějších českých sloves. Praha: Academia, 1997. (tištěná publikace, elektronicky na webu ÚJČ AVČR) . Vallex - ÚFAL MFF UK, od r. 2002, webová aplikace a tištěná publikace - Lopatková, M., Kettnerová, V., Bejček, E., Vernerová, A., Žabokrtský, Z.: Valenční slovník českých sloves VALLEX. Praha: Karolinum, 2016. - popis viz http://ufal.mff.cuni.cz/vallex - prohlížení Vallexu 4.5 https: //ufa I. mff. cu n i. cz/va I lex/4.5/ Valenční slovníky a databáze . VerbaLex - CZPJ Fl MU (Hlaváčková, Horák) - webová aplikace - od r. 2004 - proti Vallexu více zaměřen na sémantickou rovinu - propojen s WordNetem - bližší popis viz dizertační práce Hlaváčková, D. Databáze slovesných valenčních rámců VerbaLex, 2008 (v ISu) VerbaLex - stručná charakteristika . začátek práce v roce 2004 . 15 anotátorů + 6 pracovníků CZPJ (softwarová podpora) . zpracováno 10 596 slovesných lemmat • výchozí zdroje . BRIEF (1997, Fl MU), 15 000 sloves, 50 000 povrchových valenčních rámců . Czech WordNet (2002-2004, Balkanet, Fl MU), 1 359 valenčních rámců k 824 synsetům . Vallex (od 2002, UFAL MFF UK), Vallex 2.0 - 4 250 lemmat VerbaLex - stručná chrakteristika . typické rysy Verba Lexu . částečně inspirace z Princeton WordNetu . slovesné lemma (variantní lemma) s číslem významu - jíst: 1; bydlet/bydlit: 1 . synonymické řady (tvořeny posloupností lemmat) - jísť.1, požít(požívat):2) . syntaktická a sémantická rovina rámce . základní a komplexní valenční rámec Základní valenční rámec Synset: jísť.1, požít(požívat):2 Def: přijímat potravu Subsynset: jísť.1 Sémantická role 1. úrovně AG - agens INS - instrument obligatórni Pozice slovesa ^ fakultativní AG(kdol;;obl) VERB SUBS(co4;;obl)INS(čím7;;opt) SUBS - substance zájmenný výraz Sémantická role 2. úrovně s číslem pádu Komplexní valenční rámec - príklad jíst:1(impf), požít:2(pf), požívat:2(impf) definition: přijímat potravu class: eat-39.1 passive: yes jíst: 1 ~ -frame: AG(kdo1;;obl) VERB SUBS(co4;;obl) INS(čím7;;opt) -example: synovec jedl zmrzlinu (impf) -example: dcera jí polévku lžící (impf) -synonym: požít:2, požívat:2 -use: prim -reflexivity: no Dvouúrovňové sémantické role . EuroWN vrcholová ontológie (Top-Ontology) ► vrcholová hyperonyma EuroWN (63 prvků), entity 1., 2. a 3. řádu . Např.: EuroWN Top-Ontology: entita 1. řádu ► . Substance - ve VerbaLexu sémantická role 1. úrovně SUBS . 2. Úroveň - hyperonymum S U bS ta n ce 11 definition - that which has mass and occupies space . dvouúrovňová sémantická role SUBS(substance:1) milk:1, alcohol:1, chocolate:1, fruitjuice:1, soft drink:1, coffee:1, tea:1, drinking water.1,... .hyponymické lexikální jednotky specifikující význam (beverage: 1 - definition - any liquid suitable for drinking) Sémantické třídy sloves Motivace: sémantická klasifikace predikátů (Daneš, Grepl, Karlík), vztah sémantických rolí ve VerbaLexu k sémantickým třídám sloves • Východisko: Beth Levin, English Verb Classes and Alternations - . 48 základních sémantických tříd Martha Palmer, VerbNet- 82 základních sémantických tříd, celkem 395 podtříd . české sémantické třídy - modifikovaný překlad, doplnění o další synonyma, vidové protějšky a prefigovaná slovesa, . 82 základních sémantických tříd, celkem 258 podtříd, aktuálně seznam zahrnuje 11 241 sloves, z toho 6 393 různých lemmat Dostupnost . dostupnost: - https://nlp.fi.muni.cz/verbalex/html2 (starší webové rozhraní, úplné informace) . Adam Rambousek - https://nlp.fi.muni.cz/verbalex/html3/ (novější webové rozhraní, neúplné informace) . Zuzana Nevěřilová - v obou případech login: verbalex, heslo: cjbb85 - nová verze designu přes Lexonomy https://www.lexonomy.eu/# . Adam Rambousek