CJBB84 1 GAK – CJBB84 čt. 12.30-14.00 1.12. 2011 CJBB84 2 Substandardní jevy v jazyce a jazykové korpusy lMSČ a koncept minimální intervence lZnačkování korpusů automatickými nástroji lJak hledat v korpusech okrajové jevy Hláskoslovné varianty ý-ej (é-í) aj. lbejt lmlejn lmlíko lstrejda lrejt l bejt rejt mejt Pozorujte lČím se liší morfologická značka ? lJak najdeme všechna (slovesa s KoV –ý-, např. krejt, …), která tuto podmínku splňují ? l slovesa s KoV –ý- (word=„.*ýt“) skrejt mlejn prejt Další kandidáti ? (lemm=„.*ý.“& tag=„[NX].*“) lemma=„strejc“ word=„strejc.*“ Lemmatizace a značkování substandardních tvarů slovesa být llemma=„být“ lKonkordance-Statistiky-lc+tag l158 ř. lP-filtr tag=„…………..6.“ 17 variant Pokuste se uvést další a najít, jak jsou značkovány lsou – su ? su Pozice 15 - Varianta, stylový příznak apod. l- neurčuje se ("základní" tvar pro kategorie v pozicích 1-14) l1 varianta, víceméně rovnocenná ("méně častá") l2 řídká, archaická nebo knižní varianta l3 velmi archaický tvar, též hovorový l4 velmi archaický nebo knižní tvar, pouze spisovný (ve své době) l5 hovorový tvar, ale v zásadě tolerovaný ve veřejných projevech l6 hovorový tvar (koncovka standardní obecné češtiny) l7 hovorový tvar (koncovka standardní obecné češtiny), varianta k '6‚ l8 zkratky l9 speciální použití (tvary zájmen po předložkách apod.) P-filtr tag=„…………..[123456789].“ 45 variant bychme lnenalezen lword=„bychme“ l word=„bychme“ sú budó Substandardní koncovky lAdjektivní složená flexe (kterejch, …) lI. pl. –ama/-e(ě)ma/-ima (holkama, klukama, ulicema, …) l1. pl. ind. préz. akt. –m (jedem, …) lKolísání píseň/kost word=„.*ama“ lP-filtr tag=X.* lP-filtr tag=N.* X.* N.* Závěr lPři vyhledávání substandardních tvarů je třeba nespoléhat na značkování (1 pozice – X, 15 pozice – problematická). lProblémy spojené se zkoušením „guesserů“ ve značkování SYN2005. lRuční práce, několikeré ověřování. Posuny v kodifikaci samohláskových alternací ve kmeni (vzor žena) – úkol na 8. 12. 2011 lK samohláskovým alternacím dochází u některých substantiv skloňovaných podle vzoru žena, a to a) obligatorně v gen. pl. a b) fakultativně v některých dalších pádech (tráva – trav, síla – sil, míra – měr, houba – hub, …) l1. Popiš postup, jímž lze z korpusu SYN2010 získat kandidáty (feminina skloňovaná podle vzoru žena) na substantiva, která takovou alternaci mohou mít. l2. Vyber z nich slova (nejméně 3 ke každé alternaci), o nichž víš, že takovou alternaci mají. V případě nejistoty ověř svůj jazykový cit ve výkladovém slovníku (např. SSČ). l3. Sleduj v korpusu všechny tvary vybraných lemmat a uveď, u kterých tvarů se fakultativně vyskytuje stejná alternace jako v genitivu plurálu.