CJBB105 Korpusová lingvistika - přednáška

Filozofická fakulta
jaro 2013
Rozsah
2/0/0. 4 kr. Ukončení: k.
Vyučující
prof. PhDr. Klára Osolsobě, Dr. (přednášející)
Garance
prof. PhDr. Klára Osolsobě, Dr.
Ústav českého jazyka – Filozofická fakulta
Kontaktní osoba: Jaroslava Vybíralová
Dodavatelské pracoviště: Ústav českého jazyka – Filozofická fakulta
Rozvrh
Čt 9:10–10:45 VP
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
předmět má 8 mateřských oborů, zobrazit
Cíle předmětu
Přednáška má poskytnout základní orientaci v oboru korpusová lingvistika. Studenti jsou seznamováni s následujícími okruhy: 1) historií korpusové lingvistiky, 2) vymezením termínu jazykový korpus, 3) oblastmi lingvistiky využívajícími jazykové korpusy (kvantitativní lingvistika, počítačová lingvistika), 4) tzv. vytěžováním (mining) korpusu, 5) anotacemi korpusu 6) korpusovými nástroji.
Osnova
  • 1. Matematická lingvistika 2. Historie korpusové lingvistiky 3. Co je to korpus a co v něm můžeme najít? 4. Využití korpusů pro lingvistická bádání 5. Kvantitativní data 6. Korpusy a počítačová lingvistika 7. Český národní korpus – základní charakteristika a širší souvislosti 8. Tematická reprezentativnost korpusů 9. Korpusy na FF MU (bmk, ksk) 10. Statistické modelování a automatická analýza přirozeného jazyka (morfologie, syntax, překlad) 11. Morfologické značkování ksk 12. Pražský závislostní korpus
Literatura
  • Čermák, F.: Jazykový korpus: Prostředek a zdroj poznání. SaS, 56, 1995, s. 119-140.
  • Čermák F., Králík J., Kučera K. (1997): Recepce současné češtiny a reprezentativnost korpusu (Výsledky a některé souvislosti jedné orientační sondy na pozadí budování Českého národního korpusu). SaS, 58, 2, s. 118-124.
  • http://ucnk.ff.cuni.cz/
  • Čermák F, Blatná R. (eds.) (1995): Manuál lexikografie. Jinočany : H&H.
  • http://ufal.mff.cuni.cz/pdt2.0/index-cz.html
  • Čermák František (1999): Oxfordská lexikografie přechází také plně na korpus. Slovo a slovesnost, 60, s. 136-141.
  • Encyklopedický slovník češtiny. Edited by Petr Karlík - Marek Nekula - Jana Pleskalová. Praha: Nakladatelství Lidové noviny, 2002, 604 s. ISBN 80-7106-484-X. info
  • Studie z korpusové lingvistiky. Edited by František Čermák - Jana Klímová - Vladimír Petkevič. Vyd. 1. V Praze: Karolinum, 2000, 531 s. ISBN 807184893X. info
  • MCENERY, Tony a Andrew WILSON. Corpus linguistics. Edinburgh: Edinburgh University Press, 1996, 209 s. ISBN 0-7486-0482-0. info
  • BARNBROOK, Geoff. Language and computers :a practical introduction to the computer analysis of language. Edinburgh: Edinburgh University Press, 1996, ix, 209 s. ISBN 0-7486-0785-4. info
Výukové metody
Samostatné studium textů, konzultace, tj. bezkontaktní výuka.
Metody hodnocení
Výuka probíhá formou samostatného studia textů a průběžných individuálních konzultací. Písemný test : zvládnutí základního pojmosloví oboru a problematiky na úrovni textů zadaným ke studiu.
Navazující předměty
Informace učitele
Na začátku semestru budou upřesněny konzultační hodiny k předmětu.
Další komentáře
Studijní materiály
Předmět je vyučován každý semestr.
Nachází se v prerekvizitách jiných předmětů
Předmět je zařazen také v obdobích jaro 2006, podzim 2006, jaro 2007, podzim 2007, jaro 2008, podzim 2008, jaro 2009, podzim 2009, jaro 2010, podzim 2010, jaro 2011, podzim 2011, jaro 2012, podzim 2012, podzim 2013, jaro 2014, podzim 2014, jaro 2015, podzim 2015, podzim 2016, podzim 2017, podzim 2018, jaro 2020, jaro 2021, jaro 2022, jaro 2023, jaro 2024, jaro 2025.