Jiří Berka, učo: 360766 CJBB84 - Morfologie a korpus Kondicionál minulý Kondicionál minulý (KM) je v češtině ve většině případů třísložkový tvar - skládá se z pomocného slovesa (ne)být, příp. (ne)bývat ve tvaru participia minulého (Vp^b), kondicionálové částice by[1] v příslušné osobě (Vc) a l-ového participia plnovýznamového slovesa (Vp^M). Jak uvidíme dále, možné jsou i varianty se dvěma pomocnými, neplnovýznamovými slovesy, k nimž někdy také přiléhá ještě čtvrtá složka v podobě autosémantického slovesa. Tehdy hovoříme o rozšířeném KM. K vyhledání třísložkových tvarů kondicionálu minulého v korpusu je třeba nejprve zvážit otázku, v jakém pořadí mohou v rámci slovosledu tyto tři složky za sebou následovat. Z hlediska kombinatoriky existuje [c1] možných pořádí, z nichž však vzato z hlediska jazykového některá jsou přípustná a jiná nikoliv. Ke zjištění, jaká pořadí jsou možná, resp. užívaná, nám poslouží data z korpusu. Vycházejme v této práci z předpokladu, že nejčastější jsou takové případy užití kondicionálu minulého, kdy všechny složky, ať už seřazené jakkoliv, stojí semknuty těsně k sobě, tj. nenacházejí se mezi nimi žádné další jednotky[2]. Pro účely vyhledávání zvolíme jako centrální složku kondicionálovou částici, tvary slovesné budeme dohledávat v kontextu napravo či nalevo od ní. Tabulka níže znázorňuje, jakými dotazy pro jaký kontext jsme vyhledali jednotlivé možné kombinace a kolik na každou z nich připadá výskytů v korpusu SYN2010. Forma slovosledu Vc-Vp^b-Vp^M Vp^b-Vc-Vp^M Vc-Vp^M-Vp^b Vp^M-Vc-Vp^b Vp^b-Vp^M-Vc Vp^M-Vp^b-Vc Dotaz Kontext Query: [tag="Vc.*"] <0, 0> <0, 0> <0, 0> <0, 0> <0, 0> <0, 0> P-filter: [lc="(|ne)byl(|[aioy])|(|ne)býval(|[aioy])"] <1, 1> <-1, -1> <2, 2> <1, 1> <-2, -2> <-1, -1> P-filter: [tag="Vp.*"] <2, 2> <1, 1> <1, 1> <-1, -1> <-1, -1> <-2, -2> N-filter: [lc="(|ne)byl(|[aioy])|(|ne)býval(|[aioy])"] <2, 2> <1, 1> - - - - Počet výskytů v korpusu SYN2010 922 484 115 88 2 0 Tabulka výše znározňuje, že nalezená užití kondicionálu minulého lze rozdělit do tří hlavních skupin podle toho, jakou složkou končí. První a početně nejvýznamnější skupinu představuje dvojice posloupností, kdy na pozici nejvíce vpravo stojí l-ové příčestí plnovýznamového slovesa. V menší míře jsou pak zastoupeny dvě kombinace, které tvoří skupinu druhou a jejichž pořadí uzavírá participium minulé pomocného slovesa být či bývat. U této skupiny je však nutné vzít v potaz, že je tvořena až na několik výjimek výskyty, kdy složka Vp^M odpovídá, stejně jako Vp^b, tvaru být či bývat v minulém čase, jsou zde tedy přítomna dvě pomocná slovesa. To je způsobeno tím, že výsledky dotazu [tag="Vp.*"], kterým jsme vyhledali Vp^M, se prolínají s odpověďmi na dotaz [lc="(|ne)byl(|[aioy])|(|ne)býval(|[aioy])"]), jímž jsme vyhledali pomocná slovesa. Z tohoto důvodu jsme u první skupiny kombinací tyto výskyty pro Vp^M negativním filtrem následně eliminovali. V opačném případě bychom měli tuto množinu výsledků obsaženou v obou skupinách, jak v první, tak ve druhé. Doklady ve druhé skupině jsou tedy díky výše zmíněnému kvalitativně odlišné od těch ve skupině první. Jsou to až na výjimky třísložkové případy bez plnovýznamového slovesa a také zde jsou zahrnuty výskyty čtyřsložkového, tzv. rozšířeného kondicionálu minulého, kde čtvrtou složku tvoří sloveso plnovýznamové. Třetí, o poznání méně významná skupina, kterou představují pouze dva ojedinělé výskyty kombinace Vp^b-Vp^M-Vc, v zásadě pouze doplňuje tu druhou, neboť v těchto dokladech rovněž odpovídá Vp^M pomocnému slovesu. Slovosled je však odlišný. Na konci této práce zjistíme, že se jedná o velice specifická a okrajová užití, jejichž okolní kontext napovídá, že jsou součástí básnického jazyka. Poslední kombinace, Vp^M-Vp^b-Vc se jeví vzhledem k nulovému počtu výskytů jako jediná z posloupností jazykově nepřípustná. Zaměřme postupně pozornost na každou doloženou posloupnost a podrobme úvaze primární otázku této práce, tj. jakými pravidly se řídí možnost vkládat mezi jednotlivé složky další slovní jednotky. 1. Kombinace zakončené hlavním slovesem a) Vc-[?]-Vp^b-[?]-Vp^M Postupně hledáme doklady, kdy je kontextové okno vyplněno jednou, dvěma, třemi atd. pozicemi. Pro eliminaci nežádoucích dat při tom zajišťujeme negativním filtrem, že na žádné z těchto pozic nestojí konjunkce ani interpunkční znak. Nejprve prozkoumáme možnosti levého a následně pravého okna. Viz tabulky níže: Forma slovosledu Vc-[1]-Vp^b-Vp^M Vc-[2]-Vp^b-Vp^M Vc-[3]-Vp^b-Vp^M Vc-[4]-Vp^b-Vp^M Vc-[5]-Vp^b-Vp^M Vc-[6]-Vp^b-Vp^M Dotaz Kontext Query: [tag="Vc.*"] <0, 0> <0, 0> <0, 0> <0, 0> <0, 0> <0, 0> P-filter: [lc="(|ne)byl(|[aioy])|(|ne)býval(|[aioy])"] <2, 2> <3, 3> <4, 4> <5, 5> <6, 6> <7, 7> N-filter: [tag="[ZJ].*] <1, 1> <1, 2> <1, 3> <1, 4> <1, 5> <1, 6> P-filter: [tag="Vp.*"] <3, 3> <4, 4> <5, 5> <6, -6> <7, 7> <8, 8> N-filter: [lc="(|ne)byl(|[aioy])|(|ne)býval(|[aioy])"] <3, 3> <4, 4> <5, 5> <6, -6> <7, 7> <8, 8> Počet výskytů v korpusu SYN2010 1015 280 87 19 14 3 Forma slovosledu Vc-Vp^b-[1]-Vp^M Vc-Vp^b-[2]-Vp^M Vc-Vp^b-[3]-Vp^M Vc-Vp^b-[4]-Vp^M Vc-Vp^b-[5]-Vp^M Vc-Vp^b-[6]-Vp^M Dotaz Kontext Query: [tag="Vc.*"] <0, 0> <0, 0> <0, 0> <0, 0> <0, 0> <0, 0> P-filter: [lc="(|ne)byl(|[aioy])|(|ne)býval(|[aioy])"] <1, 1> <1, 1> <1, 1> <1, 1> <1, 1> <1, 1> N-filter: [tag="[ZJ].*] <2, 2> <2, 3> <2, 4> <2, 5> <2, 6> <2, 7> P-filter: [tag="Vp.*"] <3, 3> <4, 4> <5, 5> <6, 6> <7, 7> <8, 8> N-filter: [lc="(|ne)byl(|[aioy])|(|ne)býval(|[aioy])"] <3, 3> <4, 4> <5, 5> <6, 6> <7, 7> <8, 8> Počet výskytů v korpusu SYN2010 376 163 98 37 19 5 Výše uvedené přehledy[3] ilustrují skutečnost, že obě okna první posloupnosti je možné zaplnit větším množstvím jednotek. Toto množství není striktně stanovitelné. Obrázky níže zachycují vzorek dat z korpusu pro slovosledné formy Vc-[6]-Vp^b-Vp^M a Vc-Vp^b-[6]-Vp^M. Vidíme na nich, že obsazených šest pozic nemusí být zdaleka konečný počet. Je možné představit si tyto věty rozvinuté o další větné členy. Možnost zaplnění zde tedy nepodléhá žádnému pevnému omezení, pouze statistickému. Vyhledané výskyty pochopitelně nejsou všechny, které posloupnost Vc-Vp^b-Vp^M umožňuje. Nebrali jsme doposud v potaz případy, kdy v obou oknech stojí více jednotek, např. v levém 2 a v pravém 3. Takové případy se samozřejmě v korpusu vyskytují, viz: Vzhledem k cíli této práce se jimi zde však nebudeme dále zabývat. Postačí nám vědět, že existují. b) Vp^b-[?]-Vc-[?]-Vp^M Obdobný postup jako v případě první kombinace zvolíme i u druhé posloupnosti z první skupiny: Forma slovosledu Vp^b-[1]-Vc-Vp^M Vp^b-[2]-Vc-Vp^M Vp^b-[3]-Vc-Vp^M Vp^b-[4]-Vc-Vp^M Vp^b-[5]-Vc-Vp^M Vp^b-[6]-Vc-Vp^M Dotaz Kontext Query: [tag="Vc.*"] <0, 0> <0, 0> <0, 0> <0, 0> <0, 0> <0, 0> P-filter: [lc="(|ne)byl(|[aioy])|(|ne)býval(|[aioy])"] <-2, -2> <-3, -3> <-4, -4> <-5, -5> <-6, -6> <-7, -7> N-filter: [tag="[ZJ].*] <-1, -1> <-1, -2> <-1, -3> <-1, -4> <-1, -5> <-1, -6> P-filter: [tag="Vp.*"] <1, 1> <1, 1> <1, 1> <1, 1> <1, 1> <1, 1> N-filter: [lc="(|ne)byl(|[aioy])|(|ne)býval(|[aioy])"] <1, 1> <1, 1> <1, 1> <1, 1> <1, 1> <1, 1> Počet výskytů v korpusu SYN2010 0 0 0 0 0 0 Vp^b-Vc-[1]-Vp^M Vp^b-Vc-[2]-Vp^M Vp^b-Vc-[3]-Vp^M Vp^b-Vc-[4]-Vp^M Vp^b-Vc-[5]-Vp^M Vp^b-Vc-[6]-Vp^M Dotaz Kontext Query: [tag="Vc.*"] <0, 0> <0, 0> <0, 0> <0, 0> <0, 0> <0, 0> P-filter: [lc="(|ne)byl(|[aioy])|(|ne)býval(|[aioy])"] <-1, -1> <-1, -1> <-1, -1> <-1, -1> <-1, -1> <-1, -1> N-filter: [tag="[ZJ].*] <1, 1> <1, 2> <1, 3> <1, 4> <1, 5> <1, 6> P-filter: [tag="Vp.*"] <2, 2> <3, 3> <4, 4> <5, 5> <6, 6> <7, 7> N-filter: [lc="(|ne)byl(|[aioy])|(|ne)býval(|[aioy])"] <2, 2> <3, 3> <4, 4> <5, 5> <6, 6> <7, 7> Počet výskytů v korpusu SYN2010 744 370 185 80 23 18 Zde již nastává odlišná situace. Jak vidíme, předchází-li kondicionálové částici pomocné sloveso být nebo bývat ve tvaru příčestí minulého, nemůže mezi nimi stát žádná další jednotka. V případě okna napravo je situace stejná jako v případě předchozí kombinace - omezení zde existuje pouze statistické. 2. Kombinace zakončené pomocným slovesem Druhou skupinu posloupností prozkoumáme tím samým způsobem jako tu první. Měnit budeme pouze kontext, pro který budeme zadávat jednotlivé dotazy. a) Vc-[?]-Vp^M-[?]-Vp^b Forma slovosledu Vc-[1]-Vp^M-Vp^b Vc-[2]-Vp^M-Vp^b Vc-[3]-Vp^M-Vp^b Vc-[4]-Vp^M-Vp^b Vc-[5]-Vp^M-Vp^b Vc-[6]-Vp^M-Vp^b Dotaz Kontext Query: [tag="Vc.*"] <0, 0> <0, 0> <0, 0> <0, 0> <0, 0> <0, 0> P-filter: [lc="(|ne)byl(|[aioy])|(|ne)býval(|[aioy])"] <3, 3> <4, 4> <5, 5> <6, 6> <7, 7> <8, 8> N-filter: [tag="[ZJ].*] <1, 1> <1, 2> <1, 3> <1, 4> <1, 5> <1, 6> P-filter: [tag="Vp.*"] <2, 2> <3, 3> <4, 4> <5, 5> <6, 6> <7, 7> Počet výskytů v korpusu SYN2010 47 14 7 3 1 0 Forma slovosledu Vc-Vp^M-[1]-Vp^b Vc-Vp^M-[2]-Vp^b Vc-Vp^M-[3]-Vp^b Vc-Vp^M-[4]-Vp^b Vc-Vp^M-[5]-Vp^b Vc-Vp^M-[6]-Vp^b Dotaz Kontext Query: [tag="Vc.*"] <0, 0> <0, 0> <0, 0> <0, 0> <0, 0> <0, 0> P-filter: [lc="(|ne)byl(|[aioy])|(|ne)býval(|[aioy])"] <3, 3> <4, 4> <5, 5> <6, 6> <7, 7> <8, 8> N-filter: [tag="[ZJ].*] <2, 2> <2, 3> <2, 4> <2, 5> <2, 6> <2, 7> P-filter: [tag="Vp.*"] <1, 1> <1, 1> <1, 1> <1, 1> <1, 1> <1, 1> Počet výskytů v korpusu SYN2010 5 3 0 0 0 0 b) Vp^M-[?]-Vc-[?]-Vp^b Forma slovosledu Vp^M-[1]-Vc-Vp^b Vp^M-[2]-Vc-Vp^b Vp^M-[3]-Vc-Vp^b Vp^M-[4]-Vc-Vp^b Vp^M-[5]-Vc-Vp^b Vp^M-[6]-Vc-Vp^b Dotaz Kontext Query: [tag="Vc.*"] <0, 0> <0, 0> <0, 0> <0, 0> <0, 0> <0, 0> P-filter: [lc="(|ne)byl(|[aioy])|(|ne)býval(|[aioy])"] <1, 1> <1, 1> <1, 1> <1, 1> <1, 1> <1, 1> N-filter: [tag="[ZJ].*] <-1, -1> <-2, -1> <-3, -1> <-4, -1> <-5, -1> <-6, -1> P-filter: [tag="Vp.*"] <-2, -2> <-3, -3> <-4, -4> <-5, -5> <-6, -6> <-7, -7> Počet výskytů v korpusu SYN2010 0 0 0 0 0 0 Forma slovosledu Vp^M-Vc-[1]-Vp^b Vp^M-Vc-[2]-Vp^b Vp^M-Vc-[3]-Vp^b Vp^M-Vc-[4]-Vp^b Vp^M-Vc-[5]-Vp^b Vp^M-Vc-[6]-Vp^b Dotaz Kontext Query: [tag="Vc.*"] <0, 0> <0, 0> <0, 0> <0, 0> <0, 0> <0, 0> P-filter: [lc="(|ne)byl(|[aioy])|(|ne)býval(|[aioy])"] <2, 2> <3, 3> <4, 4> <5, 5> <6, 6> <7, 7> N-filter: [tag="[ZJ].*] <1, 1> <1, 2> <1, 3> <1, 4> <1, 5> <1, 6> P-filter: [tag="Vp.*"] <-1, -1> <-1, -1> <-1, -1> <-1, -1> <-1, -1> <-1, -1> Počet výskytů v korpusu SYN2010 51 11 5 2 0 0 U druhé skupiny jsme dospěli ke stejnému závěru: Předchází-li kondicionálové částici minulé participium slovesa, je možnost vkládání dalších jednotek mezi tyto dvě složky nepřípustná. 3. Kombinace Vp^b-[?]-Vp^M-[?]-Vc Pro poslední z doležených kombinací máme k dispozici pouze 2 výskyty v semknuté formě. Také pro ni se pokusíme najít doklady v korpusu, kdy jsou kontextová okna mezi jejími jednotlivými složkami vyplněna určitým počtem pozic. Forma slovosledu Vp^b-[1]-Vp^M-Vc Vp^b-[2]-Vp^M-Vc Vp^b-[3]-Vp^M-Vc Vp^b-[4]-Vp^M-Vc Vp^b-[5]-Vp^M-Vc Vp^b-[6]-Vp^M-Vc Dotaz Kontext Query: [tag="Vc.*"] <0, 0> <0, 0> <0, 0> <0, 0> <0, 0> <0, 0> P-filter: [lc="(|ne)byl(|[aioy])|(|ne)býval(|[aioy])"] <-3, -3> <-4, -4> <-5, -5> <-6, -6> <-7, -7> <-8, -8> N-filter: [tag="[ZJ].*] <-2, -2> <-3, -2> <-4, -2> <-5, -2> <-6, -2> <-7, -2> P-filter: [tag="Vp.*"] <-1, -1> <-1, -1> <-1, -1> <-1, -1> <-1, -1> <-1, -1> Počet výskytů v korpusu SYN2010 0 0 0 0 0 0 Forma slovosledu Vp^b-Vp^M-[1]-Vc Vp^b-Vp^M-[2]-Vc Vp^b-Vp^M-[3]-Vc Vp^b-Vp^M-[4]-Vc Vp^b-Vp^M-[5]-Vc Vp^b-Vp^M-[6]-Vc Dotaz Kontext Query: [tag="Vc.*"] <0, 0> <0, 0> <0, 0> <0, 0> <0, 0> <0, 0> P-filter: [lc="(|ne)byl(|[aioy])|(|ne)býval(|[aioy])"] <-3, -3> <-4, -4> <-5, -5> <-6, -6> <-7, -7> <-8, -8> N-filter: [tag="[ZJ].*] <-1, -1> <-2, -1> <-3, -1> <-4, -1> <-5, -1> <-6, -1> P-filter: [tag="Vp.*"] <-2, -2> <-3, -3> <-4, -4> <-5, -5> <-6, -6> <-7, -7> Počet výskytů v korpusu SYN2010 0 0 0 0 0 0 Jak vidíme, nenalezli jsme žádné výskyty. Může to znamenat, že vkládání jednotek zde je nepřípustné anebo, že zkoumaný jev je natolik okrajový, že pro něj neexistuje v korpusu dostatek dat. V daném případě by proto bylo možná vhodné zkoumat možnosti této kombinace introspekcí. Vezměme v potaz nalezené výskyty, ty, v nichž jsou složky semknuty těsně k sobě: [c2] Instrospekcí dospějeme k závěru, že je zde možné vkládat další jednotky do levého okna (viz např. hypotetické: moře byla kdysi dávno lapila by vůle), do pravého okna ale žádné další slovo vložit nelze, což koresponduje se závěry, ke kterým jsme dospěli pozorováním korpusových dat. Závěr: Vkládat v zásadě libovolné možství slovních jednotek mezi jednotlivé složky kondicionálu minulého je přípustné ve všech případech, kromě těch, kdy kondicionálová částice následuje v rámci slovosledu za některým z participií. Tehdy tyto dvě složky musí stát bezprostředně za sebou. ________________________________ [1] Rovněž aby, kdyby a další spojky obsahující by. Vzhledem k povaze problematiky zkoumané primárně v této práci se těmito případy zde nebudeme zabývat. [2]V průběhu získávání dat zjistíme, že tento předpoklad nemusí být vždy nutně správný; v některých případech je častější situace, kdy je mezi určitými dvěma složkami obsazena jedna pozice. [3] Vzhledem k vysoké náročnosti, kterou by s sebou přinesla ruční kontrola získaných dat, jsou zde uváděné hodnoty zatížené chybami. Hodnoty ponecháváme tak, jak nám je poskytnul výstup korpusového manažeru. Upravujeme je ručně pouze tam, kde jejich počet zjevně převyšuje polovinu získaných dokladů (tehdy počet chyb odečítáme) a také tam, kde jsou všechny výskyty chybové (tehdy snižujeme výsledek na nulu). ________________________________ [c1]???? [c2]první příklad nesedí: várku jódu solí čpěla síla ta kterou moře < byla lapila by> vůle ona jež svět nařídila víckrát už všemohoucí nebyla. Richard Weiner: Mezopotamie (poezie, nemá interpunkci)