FI:PA154 Nástroje pro korpusy - Informace o předmětu
PA154 Nástroje pro korpusy
Fakulta informatikyjaro 2008
- Rozsah
- 2/0. 2 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: k, z.
- Vyučující
- doc. Mgr. Pavel Rychlý, Ph.D. (přednášející)
- Garance
- prof. Ing. Václav Přenosil, CSc.
Katedra strojového učení a zpracování dat – Fakulta informatiky
Kontaktní osoba: doc. Mgr. Pavel Rychlý, Ph.D. - Rozvrh
- Čt 8:00–9:50 B410
- Omezení zápisu do předmětu
- Předmět je nabízen i studentům mimo mateřské obory.
- Mateřské obory/plány
- předmět má 21 mateřských oborů, zobrazit
- Cíle předmětu
- Předmět představuje úvod do korpusové lingvistiky a počítačové lexikografie. Lze v něm získat základní informace o typech korpusů, korpusových nástrojů, o značkování and disambiguation. V části věnované počítačové lexikografii je možno seznámit se s elektronickými slovníky a lexikálními databázemi a principy jejich budování.
- Osnova
- Textové korpusy a jejich typy. Standardizace korpusových dat - SGML, XML. Tvorba korpusů. Korpusové manažery a procesory (CQP, Manatee), grafická rozhraní (GCQP, Bonito), konkordanční programy (OCP). Značkování a značkovací nástroje (ajka). Morfologické, syntaktické a sémantické značkování (WSD). Desambiguace a desambiguátory (DIS aj., pravidlové, stochastické). Paralelní korpusy, zarovnávání a zarovnávače. Práce s korpusy, využití korpusových při budování slovníkü. Rozpoznávání významů slov v korpusových datech. Nástroje pro počítačovou lexikografii. Elektronické slovníky a jejich typy. Prohlížeče a editory pro elektronické slovníky. Lexikografická pracovní stanice. Lexikální databáze typu WordNet a EuroWordNet. Nástroje: Polaris, VisDic.
- Literatura
- Další komentáře
- Studijní materiály
Předmět je vyučován každoročně.
- Statistika zápisu (jaro 2008, nejnovější)
- Permalink: https://is.muni.cz/predmet/fi/jaro2008/PA154