Počítačové nástroje pro češtinu Jaro 2019 Markéta Masopustová Valenční slovníky Termíny • Valence; • Verbum finitum; • Verbum infinitum; • Synset; • Funktor. ? Termíny • Valence – schopnost vázat na sebe syntaktické pozice; • Verbum finitum – sloveso v určitém tvaru; • Verbum infinitum – sloveso v neurčitém tvaru; • Synset – synonymická řada; • Funktor – typ syntakticko-sémantického vztahu mezi slovesem a jeho doplněním. ? Valenční slovníky • Slovesa pro praxi: valenční slovník nejčastějších českých sloves; • BRIEF; • VALLEX; • VerbaLex. Slovesa pro praxi • N. Svozilová, 1997. • První a dlouho jediný tištěný valenční slovník pro češtinu. • Zdrojem lístkový lexikální archiv ÚJČ AV ČR a Frekvenční slovník češtiny (Jelínek, 1961). • Celkem 767 valenčně analyzovaných sloves. • Zápis obsahuje heslové slovo, informaci o vidu, stylovém zařazení, výklad významu, větný vzorec a příklady. • Navazuje na něj Slovník slovesných, substantivních a adjektivních vazeb a spojení (Svozilová, Prouzová, Jirsová, 2005). BRIEF • K. Pala a P. Ševeček, 1997. • Elektronický slovník na FI MU. • Obsahuje 15 000 sloves a přes 50 000 valenčních rámců. • Zdrojem knižně vydané slovníky (SSJČ, SSČ, Slovník českých synonym). • Pouze pravostranné valence, u slovesa uvedeny přímé a předložkové pády. • Základem pro Český syntaktický slovník (Skoumalová, 2001). • Nejsou přístupné pro veřejnost. VALLEX • M. Lopatková, V. Kettnerová, Z. Žabokrtský; vzniká od roku 2001. • Několik verzí, v roce 2008 vyšla první knižní verze. • Formální popis valenčních rámců; využívá sémantické role (funktory). • Vychází z funkčního generativního popisu sloves. • Zápis obsahuje sloveso v základním tvaru, informaci o vidu, jednotlivé významy, upřesnění pomocí synonymických výrazů, valenční rámec, příklad a případně sémantická třída. • Valenční pozice obsahují informaci o obligatornosti / fakultativnosti a číslo pádu. VALLEX 3.0 • http://ufal.mff.cuni.cz/vallex /3.0/ • 4 586 českých sloves, která odpovídají 10 821 lexikálním jednotkám. • Přímé propojení s PDT. • Zdrojem BRIEF, SSČ, SSJČ, Slovesa pro praxi, korpusy ČNK řady SYN, PDT. VerbaLex • D. Hlaváčková, A. Horák; vzniká od roku 2005. • Inspirace ve VALLEXu. • Zdrojem BRIEF, VALLEX a český WordNet. • Systém synonymických řad převzatý s WordNetu (odlišnost od ostatních slovníků). • Dvě úrovně sémantických rolí: • První úroveň – sémantická role podle EuroWordNetu; celkem 38 rolí. • Druhá úroveň – hyperonymum; přímý odkaz na Princeton WordNet; otevřená množina. VerbaLex • Obsahuje 10 469 sloves (slovesných lemmat) a 19 247 valenčních rámců. • Zápis obsahuje synset (slovesa mají uvedenou vidovou variantu, číslem je označeno pořadí), seznam jednotlivých sloves (čísla v rámečku) s jejich valenčními rámci (obě úrovně), informaci o pádu a příklad. VerbaLex – sémantické třídy sloves • Motivace v sémantické klasifikaci predikátů (Daneš, Grepl, Karlík). • Východiskem: • B. Levin: English Verb Classes and Alternations (48 základních sémantických tříd); • M. Palmer: VerbNet (82 základních sémantických tříd, celkem 395 podtříd). • České sémantické třídy: • modifikovaný překlad, doplnění o další synonyma, vidové protějšky, prefigovaná slovesa; • 82 základních sémantických tříd, celkem 258 podtříd, aktuálně seznam zahrnuje 11 241 sloves, z toho 6 393 různých lemmat. VerbaLex • https://nlp.fi.muni.cz/verbalex /html3/index.php • Přístup: plin/plin. Děkuji za pozornost.