CJBB85 Počítačové nástroje pro češtinu

Filozofická fakulta
jaro 2017
Rozsah
0/2/0. 3 kr. Ukončení: z.
Vyučující
Mgr. Dana Hlaváčková, Ph.D. (přednášející)
Garance
doc. PhDr. Zdeňka Hladká, Dr.
Ústav českého jazyka – Filozofická fakulta
Kontaktní osoba: Jaroslava Vybíralová
Dodavatelské pracoviště: Ústav českého jazyka – Filozofická fakulta
Rozvrh
Út 12:30–14:05 G13
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Předmět si smí zapsat nejvýše 20 stud.
Momentální stav registrace a zápisu: zapsáno: 0/20, pouze zareg.: 0/20, pouze zareg. s předností (mateřské obory): 0/20
Mateřské obory/plány
Cíle předmětu
Studenti se v semináři seznámí s možnostmi, které lingvistům nabízí počítačové zpracování přirozeného jazyka. Pozornost bude věnována především konkrétním počítačovým nástrojům, které jsou schopny značně zjednodušit a urychlit zpracování jazykového materiálu převážně z oblasti morfologie a slovotvorby. Studenti si vyzkouší práci s lingvistickým softwarem vyvíjeným na Fakultě informatiky MU a s jeho pomocí budou zpracovávat konkrétní úkoly. Hlavní cíle kurzu jsou: získat základní orientaci v oboru NLP; seznámit se se softwarem vhodným pro lingvisty; naučit se nástroje používat a využívat; s použitím vybraného softwaru zpracovat zadanou seminární práci.
Osnova
  • 1. Úvod, co je to počítačová lingvistika, pracoviště NLP v ČR.
  • 2. Počítačová lexikografie, webová rozhraní, prohlížeč a editor slovníků DEBDict.
  • 3. Rozpoznávání a syntéza řeči.
  • 4. Korpusová lingvistika, jazykové korpusy, rozhraní Sketche Engine.
  • 5. Aplikace v korpusové lingvistice, WSE, Corpus Architect a další.
  • 6. Morfologická analýza, morfologické analyzátory, značkování korpusů.
  • 7. Syntaktická analýza, analyzátory synt, set, stromové banky.
  • 8. Sémantická analýza, sémantická síť WordNet
  • 9. Valenční slovníky Vallex, VerbaLex.
  • 10. Slovotvorná analýza, derivační rozhraní Deriv.
  • 11. Zpracování zadaného seminárního úkolu.
  • 12. Zpracování zadaného seminárního úkolu.
Literatura
  • SMRŽ, Pavel a Karel PALA. Elektronická podoba SSJČ. 2001. URL info
  • HORÁK, Aleš, Karel PALA, Adam RAMBOUSEK a Albena RANGELOVA. Nové nástroje pro českou lexikografii - DEB2. In Sborník konference Grammar & Corpora 2005. 2006. vyd. Praha: Ústav pro jazyk český Akademie věd ČR, 2006, s. 190-196. ISBN 80-86496-32-5. info
  • Studie z korpusové lingvistiky. Edited by František Čermák - Jana Klímová - Vladimír Petkevič. Vyd. 1. V Praze: Karolinum, 2000, 531 s. ISBN 807184893X. info
  • PALA, Karel a Pavel ŠEVEČEK. Česká lexikální databáze typu WordNet (v rámci projektu EuroWordNet-2). Sborník prací filosofické fakulty brněnské university. Brno: MU Brno, 1999, roč. 1999, A 47, s. 51-64. ISSN 0231-7567. info
Výukové metody
Přednášky, diskuse na semináři, praktické ukázky, práce na počítači.
Metody hodnocení
Aktivní účast na semináři, seminární úkol.
Další komentáře
Studijní materiály
Předmět je vyučován každý semestr.
Předmět je povinný pro studenty Č. jazyka se specializací počítač. lingvistika, tito dostanou při zápisu přednost.
Nachází se v prerekvizitách jiných předmětů
Předmět je zařazen také v obdobích podzim 2004, jaro 2005, podzim 2005, jaro 2006, podzim 2006, podzim 2007, jaro 2008, podzim 2008, jaro 2009, podzim 2009, jaro 2010, podzim 2010, jaro 2011, podzim 2011, jaro 2012, podzim 2012, jaro 2013, podzim 2013, jaro 2014, podzim 2014, jaro 2015, podzim 2015, jaro 2016, podzim 2016, podzim 2017, jaro 2018, podzim 2018, jaro 2019, jaro 2020, jaro 2021.