PLIN063_6 Algoritmický popis morfologie osolsobe@phil.muni.cz Slovnědruhové přechody a přesahy •Zájmenná adverbia •Číslovky Algoritmický popis adverbií paradigmaticky tvořených od adjektiv •Zájmenná adverbia •Měrové výrazy •potence a realita - deadverbiální adjektiva •adverbializace jmenných tvarů adjektiv a problém jejich zachycení a interpretace ve strojových slovnících Zájmenná adverbia PŘÍSLOVCE určitá neurčitá záporná tázací vztažná reflexivní ukazovací zájmenná všude, všady, jinde, jinam, onam, druhde ně() nikde, nikudy, nikam, odnikud, pranikde kde, kudy, kam, pokud kdež, kamž tu, tady, tam, tudy, tamtudy, odtud, potud, zde, sem, semhle pokaždé, jedině, jedinkrát(e), po(v)obakakrát(e), vždy, navždy, jindy, najindy, odjindy, dojindy, druhdy ně() nikdy, odnikdy, donikdy, nanikdy, pranikdy kdy, odkdy, dokdy, nakdy, pokdy, dokavad teď, tehdy, dotehdy, odtehdy, natehdy, jinak, onak ně() nijak, pranijak, nikterak jak přičemž, načež, začež, pročež tak, takto Značkování adverbií v korpusech řady SYN •Db •Dg Měrové výrazy •Substantivum, adverbium (málo) •Číslovka, adverbium (mnoho) Slovnědruhová platnost výrazu mnoho (mnoha, mnohem, …) slovnědruhová platnost výrazu málo (mála, málem) potence a realita - deadverbiální adjektiva •Dg.* •Pravidelné rozgenerování a možnost stupňovat •Deadverbiální adjektiva a problém stupňování •Adverbiální platnost denumerálií prve, prvně, druhdy adverbializace jmenných tvarů adjektiv a problém jejich zachycení a interpretace ve strojových slovnících •Predikativa – syntaktická klasifikace •Jmenné tvary •Substantivizace a adverbializace • Algoritmický popis číslovek •číslovka jak sémanticky definovaný slovní druh •druhy číslovek v českých mluvnicích a značkování číslovek v korpusech •nepřítomnost slovnědruhového značkování číslovek jako překážka dalšího využití automatických nástrojů v lingvistickém výzkumu • subklasifikace číslovek a zájmen jako morfologická deskripce a pomůcka pro syntaktickou analýzu •slovnědruhová přesažnost číslovek, adverbií a zájmen, číslovky neurčité Sémantická klasifikace druhů číslovek - počet čeho vyjadřují •napříč klasifikací – určité/neurčité (vyjadřují určitý/neurčitý počet) •prostý počet - číslovky základní •pořadí - číslovky řadové •počet souborů nebo druhů - číslovky úhrnné/číslovky druhové/ číslovky souborné •četnost - číslovky násobné •podíl - substantiva z číslovek (polovina, třetina,…, tisícina) - číslovky dílové •počet skupin - substantiva z číslovek (dvojka, pětka,…) - číslovky skupinové • Subklasifikace slovního druhu ve značkách ČNK: C.* Subklasifikace slovního druhu ve značkách analyzátoru ajka Vzory pro číslovky Slovnědruhové přehodnocení některých skupin Číslovky (https://wiki.korpus.cz/doku.php/cnk:syn2020:tag) •Značení číslovek (C) bylo rozšířeno na úkor jiných slovních druhů. Jako číslovky jsou oproti dřívějším korpusům řady SYN značena: •původní substantiva: základní číslovky substantivně skloňované (sto, tisíc, milion, miliarda atd.); několik číslovek dílových (polovina, půl, polovic, čtvrt); všechny úhrnné číslovky (čtvero, patero, desatero atd.; dvé, tré) •původní adjektiva: násobné číslovky adjektivně skloňované (např. dvojitý, čtyřnásobný, mnohonásobný) •původní adverbia: násobné číslovky adverbiální (osminásobně, dvojnásob, několikanásobně), některé adverbiální spřežky (nadvakrát, zatřetí, naponěkolikáté) •Dochází tak k většímu souladu značkování číslovek v korpusu s tradičním dělením číslovek ve slovnících a gramatikách. Nová subkategorizace číslovek na 2. pozici (https://wiki.korpus.cz/doku.php/cnk:syn2020:tag:prehled_pozic_1_a_2) Jak je značkováno lemma=první Jak je značkováno lemma=druhý (SYN2020 a SYN2010) Jak je značkován tvar lc=jednou Jak jsou značkována lemmata jinaký, jinačí, onačí, onačejší Závěr •Některé návrhy projektu NovaMorf (např. změny v subklasifikaci číslovek) byly již implementovány v praxi •Některé problémy souvisí s desambiguací •Některé problémy se dále řeší