Syntetické futurum v češtině PLIN032 Klára Osolsobě osolsobe@phil.muni.cz Značkovaní korpusů je dobrá věc ALE ulingvistické předpoklady : morfologický slovník + tagset utechnická řešení (rozdělení na pozice, různé nelingvistické přístupy k disambiguaci) u Kvalita značkování z lingvistického hlediska ukvalita zdrojů umožnosti a meze formalizace uúplnost výčtu některých okrajových jevů Futurum uanalytické futurum (slovesa nedokonavá) - MWE udokonavá slovesa a jejich prézentní tvary – 9. pozice: P usyntetické futurum (budu, jít, jet, ...) – 9. pozice: B Gramatiky a slovníky ugramatiky: definují skupinu sloves pohybu výčtem (rozsah odpovídá rozsahu gramatiky). upraxe slovníků je nejednotná (u některých sloves např. vézt se SSJČ a SSČ rozcházejí). u Česká mluvnice (Havránek, Jedlička, 1981) uhovoří o: … „některých slovesech nedokonavých (většinou s významem pohybu, řidčeji stavu) …. u … nemají složený tvar času budoucího, leda v jiném významovém odstínu … umožnost tvořit u některých tvarů imperativ … s malým významovým rozdílem, který je na dvou příkladech charakterizován u slovesa pojď jako … pohyb k mluvčímu… u sloves poběž, poleť jako …počátek usamostatně se zmiňuje imperativ poslyš, který nemá oporu ve tvarech syntetického futura indikativu (slyšet - *poslyším – slyš – poslyš) Příruční mluvnice češtiny (Karlík, Nekula, Rusínová, 1996) uhovoří o … zvláštní skupině sloves pohybu a některých jiných, která pohyb implikují udále uvádí, že … u nich lze rozeznat rozdíl mezi určeností a neurčeností co do cíle pohybu… přičemž … oba tyto významy se vyjadřují v rámci sloves nedokonavého vidu… ukonstatuje, že … nejde o dokonavé futurum, od těchto forem nelze utvořit infinitiv ani préteritum, jsou však možné formy složené ... Čeština řeč a jazyk (Čechová a kol., 1996) uU některých nedokonavých sloves (sloves pohybu a změny stavu) se tvoří ještě (míní se kromě tvarů budu + infinitiv nedokonavého slovesa) tvary jednoduché s předponou po-. Mluvnice češtiny 2 (Komárek a kol., 1987) u… prefix po- (s ojediněle se vyskytující variantou pů-): spojuje se s tvary ind. préz. akt. některých nedokonavých sloves, zvláště s významem jednosměrného pohybu v tzv. jednoduché, syntetické futurum …, umá tedy gramatickou kategoriální platnost; tato platnost je oslabena ve tvarech imperativu těchto sloves, …, které jsou synonymní s tvary bez tohoto prefixu. uslovesa jsou charakterizována jako …. slovesa jednosměrného pohybu a slovesa trvání nebo změny stavu (jež jsou rovněž pojaty jako jednosměrný pohyb) upředpona po- má zde význam pouze gramatický, nikoli lexikální; nemění ani lexikální význam, ani nedokonavý vid slovesa uvedle futurálních tvarů jednoduchých je možno tvořit i pravidelné tvary složené futura opisného, …. Mluvnice současné češtiny (Cvrček a kol., 2010) uSpecifická omezená skupina sloves má tvary budoucího času vyjádřené pomocí předpony po/pů : půjdu, pojedu, potrvá, poroste, ponesu, povedu, poběžím, poletíš, polezeš, poteče, poženu, povezeme, poplujete, pohrne, pocestujou, postěhuje, poplazí. frekvence lemmat v synv11 tag= ="........F.*" Syntetické futurum – slovníky a další tištěné zdroje uSSJČ : 50 sloves (27 navíc, které neuvádí SSČ) uSSČ : 21 sloves (3 navíc, které neuvádí SSJČ) uSSSJČ i SSČ : 18 sloves uČermák, 1990, s. 106 : 5 dalších sloves, které neuvádí ani SSJČ, ani SSČ uŠmilauer, 1972 s. 223 : 2 další slovesa uKopečný,1962 s. 46-50 : 115 sloves vézt vézt lézt lézt Zachycení na úrovni morfologické značky (tagu) uPozice 2 - Detailní určení slovního druhu uB sloveso, tvar přítomného nebo budoucího času uPozice 9 - Čas -neurčuje se uF futurum (budoucí čas) uH minulost nebo přítomnost (P/R)* uP prézens (přítomný čas) uR minulý čas uX libovolný čas (F/R/P)*) SYNv7 VB......F.* utvary budu, budeš, ... uněkolik sloves, která tvoří synteticky futurum prefixem po-/pů- Frekvenční seznam lemmat 1 být 2 jít 3 jet 4 trvat 5 vést 6 růst 7 nést 8 běžet 9 letět 10 téci 11 vézt 12 hrnout 13 lézt 14 plout 15 hnát 16 stěhovat 17 táhnout 18 kvést 19 vanout 20 plavat 21 plavit 22 krást 23 cestovat 24 linout 25 mazat 26 šlapat 27 fičet 28 řítit 29 klusat 30 plazit 31 zorat 32 frčet 33 kutálet 34 kanout 35 šněrovat zorat Mohou korpusy přispět k poznání tohoto jevu ? ua) Výčet získaný pomocí výše uvedeného tagu je úplný/neúplný. ub) Další doklady se vyskytují/nevyskytují v korpusech. uc) Existuje/neexistuje nějaký postup, jak je z korpusů získat/získávat. u Hledání kandidátů syntetického futura v lemmatizovaných korpusech u[tag="X.*" & lc="po.*(u|e|eš|e[mt]e|í|í[mš]í[mt]e)"] uN-filtrem lze odstranit lemmata na pod-, popo-, pona-, ..., kdy může jít o jiný prefix, kombinaci více prefixů atd. ufrekvenční seznam lemmat uruční výběr kandidátů uověření předpokladu Příklady chybné lemmatizace Příklady chybné lemmatizace Heslo trvat Heslo potrvat SYNv7 SYNv7 SYNv7 SYNv7 Výsledky získané z korpusů (20) (ne SSJČ a SSČ) upofrčí/frčet (*)pověje/vát u*pomaže/mazat *povalí (se)/valit (se) upokráčí/kráčet *popase se/pást se u*pošine se/šinout se posviští/svištět u*potáhne/táhnout se *potrénuje/trénovat u*popeče s kým/péci pošupe/šupat upobrodí se/brodit se pocrčí/crčet upošupajdí/šupajdit poharcuje/harcovat upokoučuje/koučovat *povesluje/veslovat upoprýští/prýštit pošupačí/šupačit Výsledky získané z internetu (3) (ne SSJČ a SSČ) upotryská/tryskat (v syn v8 – 1 doklad) upotrtá/trtat upozdrhá/zdrhat upověje/vát (v syn v8 – 1 doklad) ALE: na internetu u... Možná by neškodilo, kdyby vítr, který nám přinese novou vládu, zavál i do těchto koutů. Uvidíme, jakým směrem pověje i na našem resortním ministerstvu, které přislíbilo o tomto tématu jednat. ... uPověj, větříčku, pověj, moju hlavěnku ověj! Moja hlavěnka mladá větříčkovi je ráda. u... Pověje-li vítr od slunce východu, mříti bude dobytek bez plodu. Pověje-li vítr od slunce západu, králové, páni nemocní budou, ... mazat NEBO pomazat bmk uak potom dyž sou tři tři tři mocnosti tak se | můžeš @ potom rozhodnout jako s kerou to popečeš | --- | | dyž sou tři tak | no ae to by bylo zajímavé prtože by se mohly vytvářet různé koalice . ORALv4 u Synv11 Synv11 Synv11 Zastoupení lemmat v tištěných zdrojích, korpusech a na internetu (2010) slovníky a tištěné zdroje 53+7 lemmat 72,29 % pouze korpusy 20 lemmat 24,1 % korpusy i slovníky a tištěné zdroje 37 lemmat 44,58 % pouze slovníky a tištěné zdroje 23 lemmat 27,71 % pouze internet 3 lemmata 3,61 % slovníky + tištěné zdroje + korpusy 83 lemmat 100 % Hodnocení useznam lze nadále doplňovat (slovníky, gramatiky, učebnice) uvysoká míra homonymie – problémy automatické lemmatizace a následné disambiguace udalší možnosti zkoumat poměr syntetického a analytického vyjádření futura (rozsah korpusů) usémantické vymezení skupiny sloves Upřesnění definice významu sloves schopných tvořit tvary syntetického futura uPohyb v konkrétním slova smyslu (přemísťování z místa na místo jednosměrně/ v určeném směru) : (půjde, pojede, poběží, poplazí se, pokráčí, pošine se, povalí, pomaže, ...) upohyb bez určení směru (různými směry) : (pošíří se, poline se, ... ). uProces zahrnující pohyb ua) přírodní (povane, pověje, pol(i/e)je, poprší, ...); ub) s neživým nositelem (rostlina: pokvete, poroste, poplazí se, strom: ponese (ovoce), ...; hudba: poline se, povalí ...; vůně: pošíří se, poline se, ...; voda: poteče, povalí, pocrčí, poprýští..., zpráva: pošíří se ,... ); uc) mentální (popálí mu to) ud) s živým nositelem (poroste, popase se, ... pták: ponese (vejce), ...); ue) ve významu fungovat (v přeneseném významu jít) (správně) poklape, pošlape, povalí ...; vycházet s někým, (poklape, pošlape, popeče, ...). uf) ve významu vést (pokoučuje, potrénuje, povládne) u Závěr uotevřená třída sloves uupřesnění definice uopravy chybné lemmatizace a značkování [tag="X.*" & lc="po.*(u|e|eš|e[mt]e|í|í[mš]í[mt]e)"] P- filtr [lemma!="[[:upper:]].*"] Problémy urozsah dat ucizí slova upřeklepy (vynechaná písmena, spojená slova) uhomonymie slovesných koncovek (definice dotazu) uhomonymie (syntetické futurum/distributivní a další významy prefixu po- : pomaže × pomaže) uzdlouhavá ruční práce unízká frekvence sloves, která nejsou dosud zachycena u Homonymie a jazyková hra (Irena Dousková: Oněgin byl Rusák) uDalo se předpokládat , že po týhle exekuci už dá pokoj . „ Tak co je , Jíchová , co je . ? Kdybyste laskavě ráčila hejbnout zadkem . Nemáme času nazbyt , musíme ještě probrat Povolží , Podněstří . . . " „ Pozvrací a Poprdí . . . " ozvalo se zezadu . „ Píšu si vás , Joch ! Píšu si vás do třídní knihy ! " zaječela Ema . „ Ale to jsem nebyl já . " „ To mě nezajímá . Řekla jsem , že si vás píšu . ??? ?pořádí 1 doklad ?poléčí ?pomete ?poklape ?potaje ?povlaje Internet uJejich sebechvála však posmrdí až do nebe a opět dokazuje, že své prognózy, řeči a»vysvětlení«vytvářejí vždy jen podle toho, jak vítr zrovna vane. uPokud jste se dočetl o přivřených přívodech, je to správně, Třeba ale terciální přívod se vám zavřít nepodaří a přes kamna to pořád pofučí naplno, čímž to nebude kvalitně spalovat. A toto se snažíte brzdit klapkou. uOcet došel, už jsem šáhla i po citronové šťávě......šampony abych kupovala na litry........ Tož tak......sbalim jí ranec a pofajruje do Prahy! To není pes, to je prase....... Dú na příště uDú: Vyberte si ze seznamu sloves, která mohou v češtině tvořit jak synteticky (prefixem po-), tak analyticky (opisu bud.* + infinitiv příslušného slovesa bez po-) nejméně 3 slovesa a popište postup, jak v korpusu vyhledat a) tvary syntetického futura a b) tvary opisného futura (např.: postoupá.*/bud.* stoupat); uBerte v úvahu různé slovosledné možnosti analytických tvarů. uShrňte do tabulky poměr užití syntetických a analytických tvarů u Bibliografie u uCVRČEK A KOL. (2010): Mluvnice současné češtiny. Praha : Karolinum. uČECHOVÁ A KOL. (1996): Čeština, řeč a jazyk. Praha : ISVN. uČERMÁK, F. (1990): Syntagmatika a paradigmatika českého slova. Praha : Karlova Univerzita. uHAJIČ J. (1994): Unification Morphology Grammar. Praha : MFF UK, (disert. práce). uHAJIČ J. (2004): Desambiguation of Rich Inflection (Computational Morphology of Czech). Praha : Karolinum. uHAVRÁNEK, B. A KOL. (1989): Slovník spisovného jazyka českého (SSJČ). Praha : Academia. u FILIPEC, J. A KOL. (2005): Slovníku spisovné češtiny pro školu a veřejnost (SSČ). Praha : Academia. uKARLÍK, P., NEKULA, M., RUSÍNOVÁ, Z. (1996): Příruční mluvnice češtiny. Praha : Nakladatelství Lidové noviny. uKARLÍK, P., NEKULA, M., PLESKALOVÁ, J. (2002): Encyklopedický slovník češtiny. Praha: Nakladatelství Lidové noviny. Bibliografie uKOMÁREK, M. a kol. (1986): Mluvnice češtiny II., Praha : Academia. uKOPEČNÝ, F. (1962): Slovesný vid v češtině. Praha : Nakladatelství československé akademie věd. uOSOLSOBĚ, K. (2007): Syntetické futurum v češtině – gramatiky, slovníky, korpusy. Přednášky a besedy z XL. běhu LŠSS. Brno, s. 131-144. uOSOLSOBĚ, K. (2007): Popis gramatických významů jednoduchých slovesných tvarů v anotacích českých (slovenských) korpusů. SPFFMU A, 55, s. 201-218. uOSOLSOBĚ, K. (2008): Značkování gramatických kategorií v korpusech ČNK a jejich zachycení v gramatice a ve slovníku (syntetické futurum, stupňování adjektiv, neurčité číslovky a příslovce míry). In Štícha, F. (ed.) Grammar & Corpora / Gramatika a korpus 2007. Academia : Praha, s. 407-416. uSEDLÁČEK, R. (2004): Morphematic analyser for Czech. Brno : FI MU (disert. práce). uŠMILAUER, V. (1972): Nauka o českém jazyku. Praha : SPN. u u uDěkuji Vám za pozornost !