CJBB85 Počítačové nástroje pro češtinu

Filozofická fakulta
podzim 2018
Rozsah
0/2/0. 3 kr. Ukončení: z.
Vyučující
Mgr. Dana Hlaváčková, Ph.D. (přednášející)
Garance
doc. PhDr. Zdeňka Hladká, Dr.
Ústav českého jazyka – Filozofická fakulta
Kontaktní osoba: Jaroslava Vybíralová
Dodavatelské pracoviště: Ústav českého jazyka – Filozofická fakulta
Rozvrh
Út 12:00–13:40 G13
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Předmět si smí zapsat nejvýše 22 stud.
Momentální stav registrace a zápisu: zapsáno: 0/22, pouze zareg.: 0/22, pouze zareg. s předností (mateřské obory): 0/22
Mateřské obory/plány
Cíle předmětu
Studenti se v semináři seznámí s možnostmi, které lingvistům nabízí počítačové zpracování přirozeného jazyka. Pozornost bude věnována především konkrétním počítačovým nástrojům, které jsou schopny značně zjednodušit a urychlit zpracování jazykového materiálu převážně z oblasti morfologie a slovotvorby. Studenti si vyzkouší práci s lingvistickým softwarem vyvíjeným na Fakultě informatiky MU a s jeho pomocí budou zpracovávat konkrétní úkoly. Hlavní cíle kurzu jsou: získat základní orientaci v oboru NLP; seznámit se se softwarem vhodným pro lingvisty; naučit se nástroje používat a využívat; s použitím vybraného softwaru zpracovat zadanou seminární práci.
Výstupy z učení
Student je po skončení kurzu schopen:
- orientovat se v oblasti počítačového zpracování přirozeného jazyka,
- znát nástroje, které se používají pro počítačové zpracování češtiny, a umět je využívat,
- zvolit vhodný nástroj při zpracování konkrétního úkolu.
Osnova
  • Úvod, lingvistické webové stránky, pracoviště NLP.
  • Prohlížeč a editor slovníků DebDict, překladový slovník Metatrans.
  • Jazykové korpusy, manažer Bonito 2, Word Sketches.
  • Morfologický analyzátor AJKA, Derivační rozhraní.
  • Syntaktická analýza, KLARA, PDTB, SYNT.
  • Sémantická síť WordNet.
  • Valenční slovníky Vallex, VerbaLex.
  • Zpracování zadaného seminárního úkolu.
Literatura
  • SMRŽ, Pavel a Karel PALA. Elektronická podoba SSJČ. 2001. URL info
  • HORÁK, Aleš, Karel PALA, Adam RAMBOUSEK a Albena RANGELOVA. Nové nástroje pro českou lexikografii - DEB2. In Sborník konference Grammar & Corpora 2005. 2006. vyd. Praha: Ústav pro jazyk český Akademie věd ČR, 2006, s. 190-196. ISBN 80-86496-32-5. info
  • Studie z korpusové lingvistiky. Edited by František Čermák - Jana Klímová - Vladimír Petkevič. Vyd. 1. V Praze: Karolinum, 2000, 531 s. ISBN 807184893X. info
  • PALA, Karel a Pavel ŠEVEČEK. Česká lexikální databáze typu WordNet (v rámci projektu EuroWordNet-2). Sborník prací filosofické fakulty brněnské university. Brno: MU Brno, 1999, roč. 1999, A 47, s. 51-64. ISSN 0231-7567. info
Výukové metody
Přednášky, diskuse v semináři, praktické ukázky softwaru, práce na počítači.
Metody hodnocení
Aktivní účast na semináři, seminární úkol - anotace jazykových dat pomocí počítačových nástrojů.
Další komentáře
Studijní materiály
Předmět je vyučován každý semestr.
Předmět je povinný pro studenty Č. jazyka se specializací počítač. lingvistika, tito dostanou při zápisu přednost.
Nachází se v prerekvizitách jiných předmětů
Předmět je zařazen také v obdobích podzim 2004, jaro 2005, podzim 2005, jaro 2006, podzim 2006, podzim 2007, jaro 2008, podzim 2008, jaro 2009, podzim 2009, jaro 2010, podzim 2010, jaro 2011, podzim 2011, jaro 2012, podzim 2012, jaro 2013, podzim 2013, jaro 2014, podzim 2014, jaro 2015, podzim 2015, jaro 2016, podzim 2016, jaro 2017, podzim 2017, jaro 2018, jaro 2019, jaro 2020, jaro 2021.