PLIN032 Gramatika a korpus II

Filozofická fakulta
jaro 2015
Rozsah
0/2/0. 5 kr. Ukončení: zk.
Vyučující
prof. PhDr. Klára Osolsobě, Dr. (přednášející)
Garance
doc. PhDr. Zdeňka Hladká, Dr.
Ústav českého jazyka – Filozofická fakulta
Kontaktní osoba: Jaroslava Vybíralová
Dodavatelské pracoviště: Ústav českého jazyka – Filozofická fakulta
Rozvrh
každou lichou středu 9:10–10:45 G13
Předpoklady
Předpokladem přijetí do semináře je absolvování kurzu CJBB84.
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Předmět si smí zapsat nejvýše 20 stud.
Momentální stav registrace a zápisu: zapsáno: 0/20, pouze zareg.: 0/20, pouze zareg. s předností (mateřské obory): 0/20
Mateřské obory/plány
Cíle předmětu
Cílem kurzu (volně navazujícího na výběrový kurz bakalářského studia Morfologie a korpus) je naučit studenty používat jazykové korpusy jakožto zdroje observací fungování přirozeného jazyka (češtiny).
Osnova
  • 1. Morfologické značkování českých korpusů. Porovnání shod a rozdílů tzv. pražského a brněnského systému. 2. Sociolingvistické anotace v korpusech mluvených a ksk. 3. Metody ukládání a zpřístupňování dat, která nejsou dostupná ve strojově čitelné podobě 4. Pravidla přepisu nahrávek mluvených korpusů v českém prostředí. 5. Olomoucký mluvený korpus – charakteristika a specifika v českém prostředí. 6. Charakteristika dostupných zdrojů pro výzkum starších stádií češtiny. 7. Charakteristika dostupných elektronických slovníků v českém prostředí. 8. Přehled korpusových manažerů užívaných v českém prostředí 9. Korpusové nástroje - Morfio, SYD, Deriv a jejich využití v lingvistickém výzkumu 10. Valenční počítačové slovníky češtiny (VALEX a VERBALEX). 11. Pražský závislostní korpus 12. Projekt INTERKORP
Literatura
  • ČERMÁK, F. - BLATNÁ, R. (EDS.): Korpusová lingvistika: Stav a modelové přístupy. Praha : Nakladatelství LN. 2006. JELÍNEK, T. Nové značkování v Českém národním korpusu. Naše řeč 91, 2008, 13–20.
Výukové metody
Prostředkem vytyčenému cíli je soubor cvičení. Nejdříve si studenti pod vedením pedagoga osvojí metody při řešení zadaných problémů (vyhledávání dat, třídění dat, vyvozování závěrů na základě pozorovaní dat). Následně budou samostatně zpracovávat zadané úkoly, prezentovat je a diskutovat o nich. Jsou vyžadována cvičení, domácí úkoly, následná diskuze a projekt.
Metody hodnocení
Předmět je ukončen zkouškou. Písemný referát a jeho prezentace na semináři.
Informace učitele
Studijní literatura: ČERMÁK, F. - BLATNÁ, R. (EDS.): Korpusová lingvistika: Stav a modelové přístupy. Praha : Nakladatelství LN. 2006. CVRČEK, V. A KOL.: Mluvnice souĉasné češtiny. Praha : Nakladatelství LN. 2010. DOKULIL, M.- KOMÁREK, M. A KOL.: Mluvnice ĉeńtiny I, II. Praha : Academia. 1986. HAJIČ J.: Desambiguation of Rich Inflection (Computational Morphology of Czech). Praha : Karolinum. 2004. JELÍNEK, T. Nové značkování v Českém národním korpusu. Naše řeč 91, 2008, 13–20. OSOLSOBĚ, K.: Korpus soukromé korespondence (KSK) z hlediska morfologického značkování. In SPFFBU, A 54, 185–199. Brno: MU. OSOLSOBĚ, K.: Popis gramatických významů (hodnot) jednoduchých slovesných tvarů v anotacích ĉeských (slovenských) korpusů. Linguistica Brunensia, Brno, Masarykova Univerzita. 2007, vol. A 55, no. 1, s. 201-218. PETKEVIČ, V. Reliable Morphological Desambiguation of Czech: Rule-Based Approach is Necessary. In Šimková, M. (ed.), Insight into the Slovak and Czech Corpus Linguistics, Bratislava : Veda. 2006. ŠIMANDL, J.: Dneńní skloňování substantiv typů kámen, břímě. Nakladatelství LN. Praha 2010. ŠTÍCHA,F. (ED.): Gramatika a korpus 2007. In Grammar & Corpora, sborník příspěvků ze stejnojmenné konference, 25.- 27.9.2007. Praha : Academia. 2008. ŠTÍCHA, F. (ED.): Možnosti a meze české gramatiky. Praha : Academia. 2006. Korpusový manažer NoSketch Engine dostupný z http://korpus.cz/corpora/ Morfologický analyzátor ajka dostupný z http://nlp.fi.muni.cz/projekty/wwwajka. http://ucnk.ff.cuni.cz DEBII — Dictionary Editor and Browser
Další komentáře
Studijní materiály
Předmět je zařazen také v obdobích jaro 2014, jaro 2016, jaro 2017, jaro 2018, jaro 2019, podzim 2019, podzim 2020, podzim 2021, podzim 2022, podzim 2023, podzim 2024.