IB030 Úvod do počítačového zpracování přirozeného jazyka

Fakulta informatiky
jaro 2024
Rozsah
2/0/0. 2 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: k, z.
Vyučující
doc. RNDr. Aleš Horák, Ph.D. (přednášející)
RNDr. Zuzana Nevěřilová, Ph.D. (pomocník)
Garance
doc. RNDr. Aleš Horák, Ph.D.
Katedra strojového učení a zpracování dat – Fakulta informatiky
Kontaktní osoba: doc. RNDr. Aleš Horák, Ph.D.
Dodavatelské pracoviště: Katedra strojového učení a zpracování dat – Fakulta informatiky
Rozvrh
St 14:00–15:50 A318; a Út 7. 5. 12:00–13:50 D3
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
Cíle předmětu
Předmět představuje úvod do počítačového zpracování přirozeného jazyka. Studenti se v něm seznámí s algoritmickým popisem jednotlivých jazykových rovin: morfologické, syntaktické, sémantické a pragmatické, a se zdroji jazykových dat: korpusy. Pozornost je věnována také reprezentaci znalostí, inferenci a vztahům k umělé inteligenci.
Výstupy z učení
Student bude po absolvování předmětu schopen:
- identifikovat a shrnout hlavní fáze počítačové analýzy jazyka;
- popsat principy algoritmů využívaných pro analýzu řeči;
- uvést a vysvětlit hlavní přístupy k analýze na morfologické a syntaktické rovině jazyka;
- poskytnout přehled o hlavních jazykových datových zdrojích, jejich formátech a zpracování;
- rozumět přístupům k výpočetní sémantice a jejím aplikacím.
Osnova
  • Východiska počítačového zpracování přirozeného jazyka (Natural Language Processing, NLP).
  • Roviny jazyka - fonetika a fonologie, morfologie, syntaxe, sémantika a pragmatika.
  • Reprezentace morfologických a syntaktických struktur.
  • Analýza a syntéza: řečová, morfologická, syntaktická a sémantická.
  • Formy reprezentace znalostí o lexikálních jednotkách.
  • Porozumění jazyku: reprezentace významu věty, logická inference.
Literatura
  • Dan Jurafsky and James H. Martin. Speech and Language Processing (3rd ed. draft). https://web.stanford.edu/~jurafsky/slp3/
  • The Oxford handbook of computational linguistics (2nd ed). Edited by Ruslan Mitkov. Oxford: Oxford University Press, 2014-2021. ISBN 9780199573691.
  • PALA, Karel. Počítačové zpracování přirozeného jazyka. 1. vyd. Brno: FI MU, 2000, 190 s. info
  • CHOMSKY, Noam. Syntaktické struktury., Logický základ teorie jazyka., O pojmu gramatické pravidlo. 1. vyd. Praha: Academia, 1966, 209 s. info
  • MATERNA, Pavel a Jan ŠTĚPÁN. Filozofická logika: nová cesta? Olomouc: Olomouc (Univerzita Palackého), 2000, 127 s. ISBN 80-244-0109-6. info
Výukové metody
Přednášky s ukázkami systémů, praktický samostatný úkol.
Metody hodnocení
Závěrečné hodnocení se děje na základě písemné zkoušky.
Informace učitele
http://nlp.fi.muni.cz/nlp_intro/
Další komentáře
Studijní materiály
Předmět je vyučován každoročně.
Předmět je zařazen také v obdobích podzim 2002, podzim 2003, podzim 2004, podzim 2005, jaro 2007, jaro 2008, jaro 2009, jaro 2010, jaro 2011, jaro 2012, jaro 2013, jaro 2014, jaro 2015, jaro 2016, jaro 2017, jaro 2018, jaro 2019, jaro 2020, jaro 2021, jaro 2022, jaro 2023, jaro 2025.