FI:IB030 Úvod do počítač. lingv. - Informace o předmětu
IB030 Úvod do počítačové lingvistiky
Fakulta informatikypodzim 2005
- Rozsah
- 2/0. 2 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: k, z.
- Vyučující
- doc. RNDr. Aleš Horák, Ph.D. (přednášející)
- Garance
- prof. Ing. Václav Přenosil, CSc.
Katedra strojového učení a zpracování dat – Fakulta informatiky
Kontaktní osoba: doc. RNDr. Aleš Horák, Ph.D. - Rozvrh
- St 12:00–13:50 B204
- Předpoklady
- ! I030 Úvod do počítač. lingv.
Před IB030 doporučuji zapsat PV122 Formální struktura přirozeného jazyka. Vhodná je znalost Prologu. - Omezení zápisu do předmětu
- Předmět je nabízen i studentům mimo mateřské obory.
- Mateřské obory/plány
- Aplikovaná informatika (program FI, B-AP)
- Český jazyk a literatura (program FF, M-FI) (2)
- Český jazyk a literatura (program FF, M-HS)
- Informatika a druhý obor (program FI, B-BI)
- Informatika a druhý obor (program FI, B-FY)
- Informatika a druhý obor (program FI, B-GE)
- Informatika a druhý obor (program FI, B-GK)
- Informatika a druhý obor (program FI, B-CH)
- Informatika a druhý obor (program FI, B-IO)
- Informatika a druhý obor (program FI, B-MA)
- Informatika a druhý obor (program FI, B-SO)
- Informatika a druhý obor (program FI, B-TV)
- Informatika (program FI, B-IN)
- Cíle předmětu
- Předmět představuje úvod do počítačového zpracování přirozeného jazyka. Studenti se v něm seznámí s algoritmickým popisem jednotlivých jazykových rovin: morfologické, syntaktické, sémantické a pragmatické, a se zdroji jazykových dat: korpusy. Pozornost je věnována také reprezentaci znalostí, inferenci a vztahům k umělé inteligenci.
- Osnova
- Východiska počítačového zpracování přirozeného jazyka.
- Přirozený jazyk jako hlavní nástroj lidské komunikace. Jazyková data v korpusech.
- Roviny: fonetika, fonologie, morfologie, syntax, sémantika, pragmatika. Klasické a formální gramatiky: reprezentace morfologických a syntaktických struktur, reprezentace významu, gramatiky: nekontextové, kontextové, logické -- DCG, transformační, Analýza a syntéza: morfologická, syntaktická, sémantická, Analyzátory: morfologický -- AJKA, syntaktický -- KLARA, Strategie analýzy: shora, zdola, smíšené, heuristiky. Problém víceznačnosti a prohledávání.
- Počítačové slovníky: reprezentace znalostí o lexikálních jednotkách. Typy elektronických slovníků: výkladové, thesaury, frazeologické, slovníky kmenů, překladové -- vícejazyčné, jejich formalizace.
- Reprezentace významu věty: logická vs. lexikální sémantika, Princip kompozicionality: skládání významů. Sémantické klasifikace: valenční rámce, predikáty, ontologie, transparentní intenzionální logika a její aplikace na analýzu významů vět přirozeného jazyka.
- Pragmatika: sémantická a pragmatická povaha jmenných skupin, struktura promluvy, deiktické výrazy, kontexty. Porozumění jazyku: význam, inference a reprezentace znalostí.
- Literatura
- PALA, Karel. Počítačové zpracování přirozeného jazyka. 1. vyd. Brno: FI MU, 2000, 190 s. info
- ALLEN, James. Natural Language Understanding. 2nd ed. Redwood City: Benjamin/Cummings Publishing Company, 1995, xv, 654 s. ISBN 0-8053-0334-0. info
- The Oxford handbook of computational linguistics. Edited by Ruslan Mitkov. Oxford: Oxford University Press, 2003, xx, 784. ISBN 0198238827. info
- CHOMSKY, Noam. Syntaktické struktury., Logický základ teorie jazyka., O pojmu gramatické pravidlo. 1. vyd. Praha: Academia, 1966, 209 s. info
- MATERNA, Pavel a Jan ŠTĚPÁN. Filozofická logika: nová cesta? Olomouc: Olomouc (Univerzita Palackého), 2000, 127 s. ISBN 80-244-0109-6. info
- Metody hodnocení
- Závěrečné hodnocení se děje na základě písemné zkoušky. Účast na přednáškách není povinná.
- Informace učitele
- http://nlp.fi.muni.cz/poc_lingv/
- Další komentáře
- Předmět je vyučován každoročně.
- Statistika zápisu (podzim 2005, nejnovější)
- Permalink: https://is.muni.cz/predmet/fi/podzim2005/IB030