CJBB85 Lingvistický software

Filozofická fakulta
jaro 2009
Rozsah
0/2/0. 3 kr. Ukončení: z.
Vyučující
Mgr. Dana Hlaváčková, Ph.D. (přednášející)
Mgr. Jan Bušta (pomocník)
RNDr. Miloš Jakubíček, Ph.D. (pomocník)
Garance
Mgr. Dana Hlaváčková, Ph.D.
Ústav českého jazyka – Filozofická fakulta
Kontaktní osoba: Jaroslava Vybíralová
Rozvrh
Po 10:00–11:35 A01
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Předmět si smí zapsat nejvýše 30 stud.
Momentální stav registrace a zápisu: zapsáno: 0/30, pouze zareg.: 0/30, pouze zareg. s předností (mateřské obory): 0/30
Mateřské obory/plány
předmět má 8 mateřských oborů, zobrazit
Cíle předmětu
Studenti se v semináři seznámí s možnostmi, které lingvistům nabízí počítačové zpracování přirozeného jazyka. Pozornost bude věnována především konkrétním počítačovým nástrojům, které jsou schopny značně zjednodušit a urychlit zpracování jazykového materiálu převážně z oblasti morfologie a slovotvorby. Studenti si vyzkouší práci s lingvistickým softwarem vyvíjeným na Fakultě informatiky MU a s jeho pomocí budou zpracovávat konkrétní úkoly. Hlavní cíle kurzu jsou: získat základní orientaci v oboru NLP; seznámit se se softwarem vhodným pro lingvisty; naučit se nástroje používat a využívat; s použitím vybraného softwaru zpracovat zadanou seminární práci.
Osnova
  • Úvod, lingvistické webové stránky, pracoviště NLP.
  • Prohlížeč a editor slovníků DebDict, překladový slovník Metatrans.
  • Jazykové korpusy, manažer Bonito 2, Word Sketches.
  • Morfologický analyzátor AJKA, Derivační rozhraní.
  • Syntaktická analýza, KLARA, PDTB, SYNT.
  • Sémantická síť WordNet.
  • Valenční slovníky Vallex, VerbaLex.
  • Zpracování zadaného seminárního úkolu.
Literatura
  • SMRŽ, Pavel a Karel PALA. Elektronická podoba SSJČ. 2001. URL info
  • HORÁK, Aleš, Karel PALA, Adam RAMBOUSEK a Albena RANGELOVA. Nové nástroje pro českou lexikografii - DEB2. In Sborník konference Grammar & Corpora 2005. 2006. vyd. Praha: Ústav pro jazyk český Akademie věd ČR, 2006, s. 190-196. ISBN 80-86496-32-5. info
  • Studie z korpusové lingvistiky. Edited by František Čermák - Jana Klímová - Vladimír Petkevič. Vyd. 1. V Praze: Karolinum, 2000, 531 s. ISBN 807184893X. info
  • PALA, Karel a Pavel ŠEVEČEK. Česká lexikální databáze typu WordNet (v rámci projektu EuroWordNet-2). Sborník prací filosofické fakulty brněnské university. Brno: MU Brno, 1999, roč. 1999, A 47, s. 51-64. ISSN 0231-7567. info
Metody hodnocení
přednášky, diskuse na semináři, praktické ukázky, práce na počítači
aktivní účast na semináři, seminární úkol
Další komentáře
Studijní materiály
Nachází se v prerekvizitách jiných předmětů
Předmět je zařazen také v obdobích podzim 2004, jaro 2005, podzim 2005, jaro 2006, podzim 2006, podzim 2007, jaro 2008, podzim 2008, podzim 2009, jaro 2010, podzim 2010, jaro 2011, podzim 2011, jaro 2012, podzim 2012, jaro 2013, podzim 2013, jaro 2014, podzim 2014, jaro 2015, podzim 2015, jaro 2016, podzim 2016, jaro 2017, podzim 2017, jaro 2018, podzim 2018, jaro 2019, jaro 2020, jaro 2021.