CJBB105 Korpusová lingvistika - přednáška

Filozofická fakulta
podzim 2015
Rozsah
2/0/0. 4 kr. Ukončení: zk.
Vyučující
Mgr. Dana Hlaváčková, Ph.D. (přednášející)
Garance
prof. PhDr. Klára Osolsobě, Dr.
Ústav českého jazyka – Filozofická fakulta
Kontaktní osoba: Jaroslava Vybíralová
Dodavatelské pracoviště: Ústav českého jazyka – Filozofická fakulta
Rozvrh
St 10:50–12:25 U34
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Předmět si smí zapsat nejvýše 40 stud.
Momentální stav registrace a zápisu: zapsáno: 0/40, pouze zareg.: 0/40, pouze zareg. s předností (mateřské obory): 0/40
Mateřské obory/plány
předmět má 9 mateřských oborů, zobrazit
Cíle předmětu
Přednáška má poskytnout základní orientaci v oboru korpusová lingvistika. Studenti jsou seznamováni s následujícími okruhy: 1) s historií korpusové lingvistiky, 2) s vymezením termínu jazykový korpus, 3) s oblastmi lingvistiky využívajícími jazykové korpusy (kvantitativní lingvistika, počítačová lingvistika), 4) s tzv. vytěžováním (mining) korpusu, 5) s anotacemi korpusu, 6) s korpusovými nástroji.
Osnova
  • 1. Historie KL a historie KL v ČR (ÚČNK) 2. Korpus v moderním slova smyslu a budování korpusů 3. Dostupné korpusy a jejich stručná charakteristika 4. Automatická morfologická analýza (tokenizace, analýza a desambiguace, tagging a lemmatizace) 5. Praxe v českém prostředí 6. Mluvené korpusy 7. Korpus soukromé korespondence 8. Korpusové manažery 9. Kvantitativní data 10. Diachronie a korpusy
Literatura
  • Čermák František (1999): Oxfordská lexikografie přechází také plně na korpus. Slovo a slovesnost, 60, s. 136-141.
  • http://ufal.mff.cuni.cz/pdt2.0/index-cz.html
  • http://ucnk.ff.cuni.cz/
  • Čermák F, Blatná R. (eds.) (1995): Manuál lexikografie. Jinočany : H&H.
  • Čermák F., Králík J., Kučera K. (1997): Recepce současné češtiny a reprezentativnost korpusu (Výsledky a některé souvislosti jedné orientační sondy na pozadí budování Českého národního korpusu). SaS, 58, 2, s. 118-124.
  • Čermák, F.: Jazykový korpus: Prostředek a zdroj poznání. SaS, 56, 1995, s. 119-140.
  • Encyklopedický slovník češtiny. Edited by Petr Karlík - Marek Nekula - Jana Pleskalová. Praha: Nakladatelství Lidové noviny, 2002, 604 s. ISBN 80-7106-484-X. info
  • Studie z korpusové lingvistiky. Edited by František Čermák - Jana Klímová - Vladimír Petkevič. Vyd. 1. V Praze: Karolinum, 2000, 531 s. ISBN 807184893X. info
  • MCENERY, Tony a Andrew WILSON. Corpus linguistics. Edinburgh: Edinburgh University Press, 1996, 209 s. ISBN 0-7486-0482-0. info
  • BARNBROOK, Geoff. Language and computers :a practical introduction to the computer analysis of language. Edinburgh: Edinburgh University Press, 1996, ix, 209 s. ISBN 0-7486-0785-4. info
Výukové metody
Přednáška spojená s prezentací korpusů a korpusových manažerů. Samostatné studium doporučených textů.
Metody hodnocení
Kolokvium. Písemný test: zvládnutí základního pojmosloví oboru a problematiky na úrovni odpřednášené látky a textů zadaných ke studiu. Test obsahuje celkem 10 otázek (minimální počet bodů je 66,6 %).
Navazující předměty
Další komentáře
Studijní materiály
Předmět je vyučován každoročně.
Nachází se v prerekvizitách jiných předmětů
Předmět je zařazen také v obdobích jaro 2006, podzim 2006, jaro 2007, podzim 2007, jaro 2008, podzim 2008, jaro 2009, podzim 2009, jaro 2010, podzim 2010, jaro 2011, podzim 2011, jaro 2012, podzim 2012, jaro 2013, podzim 2013, jaro 2014, podzim 2014, jaro 2015, podzim 2016, podzim 2017, podzim 2018, jaro 2020, jaro 2021, jaro 2022, jaro 2023, jaro 2024, jaro 2025.