PLIN059 Proseminář z počítačové lingvistiky

Filozofická fakulta
podzim 2022
Rozsah
0/2/0. 4 kr. Ukončení: zk.
Vyučující
Mgr. Dana Hlaváčková, Ph.D. (přednášející)
Mgr. Richard Holaj, Ph.D. (přednášející)
Mgr. Hana Žižková, Ph.D. (přednášející)
Garance
Mgr. Dana Hlaváčková, Ph.D.
Ústav českého jazyka – Filozofická fakulta
Kontaktní osoba: Jaroslava Vybíralová
Dodavatelské pracoviště: Ústav českého jazyka – Filozofická fakulta
Rozvrh
Út 12:00–13:40 G13
Předpoklady
! CJBB85 Počítač. nástroje pro češt. && !NOWANY( CJBB85 Počítač. nástroje pro češt. )
Omezení zápisu do předmětu
Předmět je určen pouze studentům mateřských oborů.

Předmět si smí zapsat nejvýše 20 stud.
Momentální stav registrace a zápisu: zapsáno: 11/20, pouze zareg.: 0/20
Mateřské obory/plány
Cíle předmětu
Kurz pro studenty představuje vstup do světa počítačové lingvistiky. Seznámí se v něm s vymezením oboru a jeho vztahu k ostatním vědám, s jeho podoblastmi a počítačovým zpracováním jednotlivých rovin popisu jazyka. Součástí semináře je výklad teoretických východisek i aplikačních výsledků v (převážně české) počítačové lingvistice. Semináře se vždy skládají z teoretického uvedení do problematiky a praktického využití softwarových nástrojů, které jsou k dispozici pro zpracování přirozeného jazyka (zpravidla češtiny). Důraz je kladen na získání orientace v jednotlivých částech počítačového zpracování češtiny, schopnost efektivně využívat existující nástroje a znalost základní terminologie oboru. Studenti na konci semestru zpracují prakticky zaměřený seminární úkol. Předmět je zakončen zkouškou v podobě písemného testu.
Výstupy z učení
Student je po skončení kurzu schopen:
- orientovat se v jednotlivých oblastech počítačové lingvistiky,
- vysvětlit podstatu oboru a jeho vztah k dalším vědním oborům,
- znát nástroje, které se používají pro počítačové zpracování češtiny, a umět je využívat,
- znát a užívat základní terminologii počítačové lingvistiky.
Osnova
  • 1. Uvedení do problematiky oboru, přehled o pracovištích počítačové lingvistiky v ČR.
  • 2. Zpracování zvukového signálu - rozpoznávání a syntéza řeči.
  • 3. Základy počítačové lexikografie (online slovníky, webová rozhraní).
  • 4. Základní informace o korpusové lingvistice (české korpusy a korpusové manažery).
  • 5. Morfologická anlýza češtiny (analyzátory, morfologické značkování korpusů).
  • 6. Slovotvorná analýza češtiny (derivační rozhraní a vizualizace).
  • 7. Praktická cvičení (práce s korpusovými nástroji).
  • 8. Syntaktická analýza češtiny (parsery, závislostní banky).
  • 9. Sémantická analýza češtiny (Czech WordNet, projekty jiných jazyků).
  • 10. Valenční slovníky a databáze (Vallex, VerbaLex).
  • 11. Zadání seminárního úkolu.
  • 12. Shrnutí a opakování hlavních částí výkladu a základní terminologie oboru.
Literatura
  • Studie z korpusové lingvistiky. Edited by František Čermák - Jana Klímová - Vladimír Petkevič. Vyd. 1. V Praze: Karolinum, 2000, 531 s. ISBN 807184893X. info
  • HORÁK, Aleš, Karel PALA, Adam RAMBOUSEK a Albena RANGELOVA. Nové nástroje pro českou lexikografii - DEB2. In Sborník konference Grammar & Corpora 2005. 2006. vyd. Praha: Ústav pro jazyk český Akademie věd ČR, 2006, s. 190-196. ISBN 80-86496-32-5. info
  • PALA, Karel a Pavel ŠEVEČEK. Česká lexikální databáze typu WordNet (v rámci projektu EuroWordNet-2). Sborník prací filosofické fakulty brněnské university. Brno: MU Brno, 1999, roč. 1999, A 47, s. 51-64. ISSN 0231-7567. info
Výukové metody
Teoretická příprava, praktická cvičení na počítači.
Metody hodnocení
Aktivní účast na semináři, úspěšné zpracování seminárního úkolu, zkouška - závěrečný písemný test (ověření základních znalostí a terminologie).
Další komentáře
Studijní materiály
Předmět je zařazen také v obdobích podzim 2019, podzim 2020, podzim 2021, podzim 2023, podzim 2024.