CJBB105 Korpusová lingvistika - přednáška

Filozofická fakulta
jaro 2021
Rozsah
2/0/0. 4 kr. Ukončení: zk.
Vyučující
Mgr. Dana Hlaváčková, Ph.D. (přednášející)
Garance
Mgr. Dana Hlaváčková, Ph.D.
Ústav českého jazyka – Filozofická fakulta
Kontaktní osoba: Jaroslava Vybíralová
Dodavatelské pracoviště: Ústav českého jazyka – Filozofická fakulta
Rozvrh
Út 12:00–13:40 D31
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Předmět si smí zapsat nejvýše 40 stud.
Momentální stav registrace a zápisu: zapsáno: 1/40, pouze zareg.: 0/40, pouze zareg. s předností (mateřské obory): 0/40
Mateřské obory/plány
předmět má 17 mateřských oborů, zobrazit
Cíle předmětu
Přednáška má poskytnout základní orientaci v oboru korpusová lingvistika. Studenti jsou seznamováni s následujícími okruhy:
1) s historií korpusové lingvistiky,
2) s vymezením termínu jazykový korpus,
3) s oblastmi lingvistiky využívajícími jazykové korpusy (kvantitativní lingvistika, počítačová lingvistika),
4) s tzv. vytěžováním (mining) korpusu,
5) s anotacemi korpusu,
6) s korpusovými nástroji.
Výstupy z učení
Student je po absolvování kurzu schopen:
- orientovat se v problematice korpusové lingvistiky,
- pochopit a užívat základní terminologii oboru,
- orientovat se v typologii korpusů,
- mít přehled o možnostech využívání korpusů.
Osnova
  • 1. Historie KL a historie KL v ČR (ÚČNK).
  • 2. Korpus v moderním slova smyslu a budování korpusů.
  • 3. Dostupné korpusy a jejich stručná charakteristika.
  • 4. Automatická morfologická analýza (tokenizace, analýza a desambiguace, tagging a lemmatizace).
  • 5. Praxe v českém prostředí.
  • 6. Mluvené korpusy.
  • 7. Korpus soukromé korespondence.
  • 8. Korpusové manažery.
  • 9. Kvantitativní data.
  • 10. Diachronie a korpusy.
Literatura
  • Čermák, F.: Jazykový korpus: Prostředek a zdroj poznání. SaS, 56, 1995, s. 119-140.
  • Čermák F., Králík J., Kučera K. (1997): Recepce současné češtiny a reprezentativnost korpusu (Výsledky a některé souvislosti jedné orientační sondy na pozadí budování Českého národního korpusu). SaS, 58, 2, s. 118-124.
  • Čermák F, Blatná R. (eds.) (1995): Manuál lexikografie. Jinočany : H&H.
  • http://ufal.mff.cuni.cz/pdt2.0/index-cz.html
  • Čermák František (1999): Oxfordská lexikografie přechází také plně na korpus. Slovo a slovesnost, 60, s. 136-141.
  • http://ucnk.ff.cuni.cz/
  • Encyklopedický slovník češtiny. Edited by Petr Karlík - Marek Nekula - Jana Pleskalová. Praha: Nakladatelství Lidové noviny, 2002, 604 s. ISBN 80-7106-484-X. info
  • Studie z korpusové lingvistiky. Edited by František Čermák - Jana Klímová - Vladimír Petkevič. Vyd. 1. V Praze: Karolinum, 2000, 531 s. ISBN 807184893X. info
  • MCENERY, Tony a Andrew WILSON. Corpus linguistics. Edinburgh: Edinburgh University Press, 1996, 209 s. ISBN 0-7486-0482-0. info
  • BARNBROOK, Geoff. Language and computers :a practical introduction to the computer analysis of language. Edinburgh: Edinburgh University Press, 1996, ix, 209 s. ISBN 0-7486-0785-4. info
Výukové metody
Přednáška spojená s prezentací korpusů a korpusových manažerů. Samostatné studium doporučených textů.
Metody hodnocení
Kolokvium. Písemný test: zvládnutí základního pojmosloví oboru a problematiky na úrovni odpřednášené látky a textů zadaných ke studiu. Test obsahuje celkem 10 otázek.
Navazující předměty
Další komentáře
Studijní materiály
Předmět je vyučován každoročně.
Nachází se v prerekvizitách jiných předmětů
Předmět je zařazen také v obdobích jaro 2006, podzim 2006, jaro 2007, podzim 2007, jaro 2008, podzim 2008, jaro 2009, podzim 2009, jaro 2010, podzim 2010, jaro 2011, podzim 2011, jaro 2012, podzim 2012, jaro 2013, podzim 2013, jaro 2014, podzim 2014, jaro 2015, podzim 2015, podzim 2016, podzim 2017, podzim 2018, jaro 2020, jaro 2022, jaro 2023, jaro 2024, jaro 2025.