CJBB84 Morfologické varianty a dublety – korpus jako zdroj dat pro observace a generalizace (variantní a dubletní koncovky v české substantivní flexi) Dva metodologické přístupy KL •Corpus based / korpusem ověřovaný, na korpusu založený výzkum •Pravidlo/výjimka – otevřený/uzavřený seznam, frekvence •Corpus driven / korpusem inspirovaný výzkum, korpusem řízený výzkum •Výzkum kolokací /lexical bundles Mějme tvrzení •Výskyt variantních koncovek se řídí pravidly. Seznamy výjimek jsou otevřené/uzavřené. •Maskulina mají v češtině v gen. pl. koncovku –ů (pánů, hradů, mužů, strojů, předsedů, soudců). Z tohoto pravidla existují výjimky. Které? Kolik? •Nulovou koncovku v genitivu plurálu mají feminina skloňovaná podle vzoru žena (žen) a neutra skloňovaná podle vzoru město (měst) a kuře (kuřat). Slova skloňovaná podle ostatních vzorů mají koncovku –í. Z tohoto pravidla existují výjimky. Které? Kolik? Práce s korpusem •Výjimky jsou většinou buď velmi frekventovaná slova, nebo naopak slova z periferie systému. •Korpus – vhodný nástroj pro zkoumání výjimek. • Co chceme? •Vyhledat všechna maskulina/feminina/neutra v genitivu plurálu •Pozorovat konkordance •Odstranit pravidelně tvořené tvary •Na základě pozorování frekvenčních seznamů nepravidelně tvořených tvarů formulovat pravidla pro výskyt výjimek • Vyhledat všechna maskulina/feminina/neutra v genitivu plurálu, která jsou výjimkami z pravidel •[tag="N.[MI]P2.*" & lc!=".*ů"] •[tag="N.FP2.*" & lemma!=".*a" & lc!=".*í"] •[tag="N.NP2.*" & lemma!=".*[ío]" & lc!=".*at" & lc!=".*í"] Frekvenční seznam lemma+tvar MI Frekvenční seznam lemma+tvar F Frekvenční seznam lemma+tvar N Kde se berou výjimky? •Plurália tantum – lemmatem není nominativ singuláru, ale nominativ plurálu. •Plurália tantum (většinou propria) zachovávají někdy v genitivu plurálu koncovku mužských (i středních) o-kmenů – nulová koncovka, zatímco maskulina v rámci přestavby systému flexe substantiv z kmenového principu na rodový přejala většinově koncovku flexe mužských u-kmenů (ov>ů). Dále jsou výjimkami jednotlivá slova. •Slova přejatá z klasických jazyků si v nominativu při přejímání uchovávají původní zakončení (-um, -eum, -ium), které se v nepřímých pádech odsouvá a slova se začleňují do flexe neuter. Ta má svá pravidla. •V případě měkkých vzorů růže a moře lze výjimky rozdělit do dvou skupin, a sice skupina závislá na slovotvorné utvářenosti substantiva a b) jednotlivá slova. Další otázky •Existují další příklady splývání rozdílů mezi vzory (unifikace)? •Existují další případy, kdy je distribuce varianty spojena s derivačním typem? Mějme tvrzení •Koncovku –ech mají v lokálu plurálu maskulina a neutra skloňovaná podle tvrdých vzorů (pánech, hradech, předsedech, městech) •Koncovku –ích mají v lokálu plurálu maskulina, neutra a feminina skloňovaná podle měkkých vzorů (mužích, strojích, soudcích, růžích, mořích) •Koncovku –ách mají v lokálu plurálu feminina skloňovaná podle tvrdého vzoru žena (ženách) • • [tag="N..P6.*"] Frekvenční seznam lemma+tvar Jak najít výjimky? •[tag="N.FP6.*" & lc=".*ech"] •[tag="N.[MIN]P6.*" & lc=".*ách"] •[tag="N..P6.*" & lemma=".*[aodtnkghrbpfvmqwx]" & lc=".*ích"] •[tag="N..P6.*" & lemma=".*[lsz]"] • • • • • Feminina _ výjimky Frekvenční seznam lemma+tvar Maskulina a neutra _ výjimky Frekvenční seznam lemma+tvar Tvrdé vzory _ výjimky Frekvenční seznam lemma+tvar Maskulina na [lsz] Frekvenční seznam lemma+tvar Výjimky •Vzor kost nelze postihnout v rámci dichotomie tvrdý/měkký. •Unifikační tendence zasahují zejména flexi pluralií tantum. •Výjimky se objevují u cizích slov, jejichž flexe podléhá samostatné sadě pravidel. •Varianta typická pro měkké deklinační typy se pravidelně vyskytuje u tvrdých typů v návaznosti na typ kmenové finály a její pravidelné alternace v kontextu předního vokálu v následujícím morfu. • • • • • Výjimky •[tag="N.[MIN]P6.*" & lc=".*ách"] •N-filtr •[lemma=".*([kghya]|[kgh][oay]|[kgh]um)"] • Frekvence lemma/tvar [lemma=".*[lsz]" & tag="N.[MI]P6.*"] Frekvence lemma/tvar Vzpomenete si na některá další maskulina na [lsz] skloňovaná podle tvrdých vzorů s konc. -ích Frekvence lemma/tvar N-filtr [lemma= ".*tel "] (zmizí hotel i kostel!) Vadí vám? Výjimky •Přestože –ách je v lokále plurálu typická koncovka substantiv skloňovaných podle vzoru žena, mají ji rovněž plurália tantum, ale i některá substantiva rodu mužského i středního zakončená na veláry. •Kromě toho se u maskulin objevuje ve spojení „jako ve snách“ a u neuter ve spojení „o polednách“. •Koncovka –ích je typická pro lokál plurálu všech měkkých vzorů bez ohledu na rod. Vyskytuje se ovšem i u tvrdých vzorů, a sice u maskulin a neuter na finálu kmene veláru, která pravidelně alternuje. Kromě toho se objevuje i u maskulin tvrdé flexe na [lsz], a to u substantiv les, prales, hotel, kostel, okres a někdy i klášter a sloup a u životných manžel a anděl, která kolísají mezi tvrdou a měkkou flexí. K unifikačním tendencím maskulin •Variantní koncovky nominativu (vokativu) plurálu životných maskulin •Na základě pozorování korpusových dat stanov pravidla distribuce flektivní koncovky (-í, -ové, -é) [tag="N.MP1.*"] N filtr [lc=".*[ié]"] Domácí úkol na 14. 11. 2018 •Na základě pozorování korpusových dat formulujte pravidla, jimiž se řídí distribuce variantních koncovek vokativu singuláru maskulin. •Všimněte si problému desambiguace. •Projevují se v případě sledovaných variant tendence, které jsme sledovali výše?