CJBB105 Korpusová lingvistika - přednáška

Filozofická fakulta
jaro 2012
Rozsah
2/0/0. 4 kr. Ukončení: k.
Vyučující
prof. PhDr. Klára Osolsobě, Dr. (přednášející)
Garance
prof. PhDr. Klára Osolsobě, Dr.
Ústav českého jazyka – Filozofická fakulta
Kontaktní osoba: Jaroslava Vybíralová
Dodavatelské pracoviště: Ústav českého jazyka – Filozofická fakulta
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
předmět má 8 mateřských oborů, zobrazit
Cíle předmětu
Přednáška má poskytnout základní orientaci v oboru korpusová lingvistika. Studenti jsou seznamováni s následujícími okruhy: 1) historií korpusové lingvistiky, 2) vymezením termínu jazykový korpus, 3) oblastmi lingvistiky využívajícími jazykové korpusy (kvantitativní lingvistika, počítačová lingvistika), 4) tzv. vytěžováním (mining) korpusu, 5) anotacemi korpusu 6) korpusovými nástroji.
Osnova
  • 1) Historie korpusové lingvistiky 2) Co je to korpus a co v něm můžeme najít? 3) Kvantitativní data 4) Korpus a jazykověda 5) Korpus a počítačová lingvistika 6) Korpusové manažery 7) Tagování korpusu 8) Český národní korpus 9) Korpusy na MU
Literatura
  • Čermák F., Králík J., Kučera K. (1997): Recepce současné češtiny a reprezentativnost korpusu (Výsledky a některé souvislosti jedné orientační sondy na pozadí budování Českého národního korpusu). SaS, 58, 2, s. 118-124.
  • Čermák F., Klímová J., Petkevič V. (eds.) (2000): Studie z korpusové lingvistiky , Praha: FF UK.
  • Burnard L. (1993): A Gentle Introduction to XML.
  • Čermák F, Blatná R. (eds.) (1995): Manuál lexikografie. Jinočany : H&H.
  • McEnery A., Wilson A. (1996): Corpus Linguistics. Edinburgh University Press, Edinburgh.
  • Čermák, F.: Jazykový korpus: Prostředek a zdroj poznání. SaS, 56, 1995, s. 119-140.
  • Čermák František (1999): Oxfordská lexikografie přechází také plně na korpus. Slovo a slovesnost, 60, s. 136-141.
  • http://ucnk.ff.cuni.cz/
  • Karlík P., Nekula M., Pleskalová J. (eds.) (2002): Encyklopedický slovník češtiny. Praha : Nakladatelství Lidové noviny.
  • Barnbrook G. (1996): Language and Computers. Edinburgh University Press, Edinburgh. Boguraev B., Briscoe T. (1989): Computational Lexicography for Natural Language Processing. Longman, London - New York.
Výukové metody
Samostatné studium textů, konzultace.
Metody hodnocení
Výuka probíhá formou samostatného studia textů a průběžných individuálních konsultací Písemný test : zvládnutí základního pojmosloví oboru a problematiky na úrovni textů zadaným ke studiu.
Navazující předměty
Další komentáře
Studijní materiály
Předmět je vyučován každý semestr.
Výuka probíhá každý týden.
Nachází se v prerekvizitách jiných předmětů
Předmět je zařazen také v obdobích jaro 2006, podzim 2006, jaro 2007, podzim 2007, jaro 2008, podzim 2008, jaro 2009, podzim 2009, jaro 2010, podzim 2010, jaro 2011, podzim 2011, podzim 2012, jaro 2013, podzim 2013, jaro 2014, podzim 2014, jaro 2015, podzim 2015, podzim 2016, podzim 2017, podzim 2018, jaro 2020, jaro 2021, jaro 2022, jaro 2023, jaro 2024, jaro 2025.