PLIN032 Gramatika a korpus

Filozofická fakulta
jaro 2018
Rozsah
0/2/0. 5 kr. Ukončení: zk.
Vyučující
prof. PhDr. Klára Osolsobě, Dr. (přednášející)
Garance
doc. PhDr. Zdeňka Hladká, Dr.
Ústav českého jazyka – Filozofická fakulta
Kontaktní osoba: Jaroslava Vybíralová
Dodavatelské pracoviště: Ústav českého jazyka – Filozofická fakulta
Rozvrh
St 12:30–14:05 G13
Předpoklady
Předpokladem přijetí do semináře je absolvování kurzu CJBB84.
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Předmět si smí zapsat nejvýše 20 stud.
Momentální stav registrace a zápisu: zapsáno: 0/20, pouze zareg.: 0/20, pouze zareg. s předností (mateřské obory): 0/20
Mateřské obory/plány
Cíle předmětu
Cílem kurzu (volně navazujícího na výběrový kurz bakalářského studia Morfologie a korpus) je naučit studenty používat jazykové korpusy jakožto zdroje observací fungování přirozeného jazyka (češtiny).
Výstupy z učení
Student musí být schopen pro lingvistickou hypotézu vyhledat v korpusu relevantní data a pomocí korpusových nástrojů s nimi pracovat. Na základě pozorování dat by měl být schopen hypotézu reformulovat, potvrdit, vyvrátit.
Osnova
  • 1) Jak lze v korpusech hledat doklady pro výzkum hláskových alternací v rámci substantivní flexe? 2) Další samohláskové alternace v české substantivní flexi 3) Varianty a dublety – korpusy jako zdroje dat pro formulaci pravidel distribuce variantních spisovných koncovek v české substantivní flexi 4) Varianty a dublety – korpusy jako zdroje dat pro formulaci pravidel distribuce variantních spisovných koncovek v české slovesné flexi 5) Vlastnosti adjektiv zakončených na -cí 6) Slovnědruhové přesahy 7) Syntetické futurum v češtině 8) Příslovečné spřežky 9) Ještě jednou k adjektivům zakončeným na –cí 10) Víceslovné výrazy (Multiword Expression)
Literatura
  • ČERMÁK, F. - BLATNÁ, R. (EDS.): Korpusová lingvistika: Stav a modelové přístupy. Praha : Nakladatelství LN. 2006. JELÍNEK, T. Nové značkování v Českém národním korpusu. Naše řeč 91, 2008, 13–20.
Výukové metody
Prostředkem k vytyčenému cíli je soubor cvičení. Nejdříve si studenti pod vedením pedagoga osvojí metody při řešení zadaných problémů (vyhledávání dat, třídění dat, vyvozování závěrů na základě pozorovaní dat). Následně budou samostatně zpracovávat zadané úkoly, prezentovat je a diskutovat o nich. Jsou vyžadována cvičení, domácí úkoly, následná diskuze a projekt.
Metody hodnocení
Předmět je ukončen zkouškou. Závěrečná práce (5-10 stran).
Informace učitele
Studijní literatura: ČERMÁK, F. - BLATNÁ, R. (EDS.): Korpusová lingvistika: Stav a modelové přístupy. Praha : Nakladatelství LN. 2006. CVRČEK, V. A KOL.: Mluvnice souĉasné češtiny. Praha : Nakladatelství LN. 2010. DOKULIL, M.- KOMÁREK, M. A KOL.: Mluvnice ĉeńtiny I, II. Praha : Academia. 1986. HAJIČ J.: Desambiguation of Rich Inflection (Computational Morphology of Czech). Praha : Karolinum. 2004. JELÍNEK, T. Nové značkování v Českém národním korpusu. Naše řeč 91, 2008, 13–20. OSOLSOBĚ, K.: Korpus soukromé korespondence (KSK) z hlediska morfologického značkování. In SPFFBU, A 54, 185–199. Brno: MU. OSOLSOBĚ, K.: Popis gramatických významů (hodnot) jednoduchých slovesných tvarů v anotacích ĉeských (slovenských) korpusů. Linguistica Brunensia, Brno, Masarykova Univerzita. 2007, vol. A 55, no. 1, s. 201-218. PETKEVIČ, V. Reliable Morphological Desambiguation of Czech: Rule-Based Approach is Necessary. In Šimková, M. (ed.), Insight into the Slovak and Czech Corpus Linguistics, Bratislava : Veda. 2006. ŠIMANDL, J.: Dneńní skloňování substantiv typů kámen, břímě. Nakladatelství LN. Praha 2010. ŠTÍCHA,F. (ED.): Gramatika a korpus 2007. In Grammar & Corpora, sborník příspěvků ze stejnojmenné konference, 25.- 27.9.2007. Praha : Academia. 2008. ŠTÍCHA, F. (ED.): Možnosti a meze české gramatiky. Praha : Academia. 2006. Korpusový manažer NoSketch Engine dostupný z http://korpus.cz/corpora/ Morfologický analyzátor ajka dostupný z http://nlp.fi.muni.cz/projekty/wwwajka. http://ucnk.ff.cuni.cz DEBII — Dictionary Editor and Browser
Další komentáře
Předmět je vyučován každoročně.
Předmět je zařazen také v obdobích jaro 2014, jaro 2015, jaro 2016, jaro 2017, jaro 2019, podzim 2019, podzim 2020, podzim 2021, podzim 2022, podzim 2023, podzim 2024.