FI:IB030 Úvod do NLP - Informace o předmětu
IB030 Úvod do počítačového zpracování přirozeného jazyka
Fakulta informatikyjaro 2024
- Rozsah
- 2/0/0. 2 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: k, z.
- Vyučující
- doc. RNDr. Aleš Horák, Ph.D. (přednášející)
RNDr. Zuzana Nevěřilová, Ph.D. (pomocník) - Garance
- doc. RNDr. Aleš Horák, Ph.D.
Katedra strojového učení a zpracování dat – Fakulta informatiky
Kontaktní osoba: doc. RNDr. Aleš Horák, Ph.D.
Dodavatelské pracoviště: Katedra strojového učení a zpracování dat – Fakulta informatiky - Rozvrh
- St 14:00–15:50 A318; a Út 7. 5. 12:00–13:50 D3
- Omezení zápisu do předmětu
- Předmět je nabízen i studentům mimo mateřské obory.
- Mateřské obory/plány
- Analýza a zpracování obrazu (program FI, N-VIZ)
- Aplikovaná informatika (program FI, B-AP)
- Bioinformatika a systémová biologie (program FI, N-UIZD)
- Bioinformatika (program FI, B-AP)
- Computer Games Development (program FI, N-VIZ_A)
- Computer Graphics and Visualisation (program FI, N-VIZ_A)
- Computer Networks and Communications (program FI, N-PSKB_A)
- Cybersecurity Management (program FI, N-RSSS_A)
- Český jazyk a literatura (program FF, M-FI) (2)
- Český jazyk a literatura (program FF, M-HS)
- Český jazyk se specializací počítačová lingvistika (program FF, B-FI)
- Formální analýza počítačových systémů (program FI, N-TEI)
- Grafický design (program FI, N-VIZ)
- Graphic Design (program FI, N-VIZ_A)
- Hardware Systems (program FI, N-PSKB_A)
- Hardwarové systémy (program FI, N-PSKB)
- Image Processing and Analysis (program FI, N-VIZ_A)
- Informační bezpečnost (program FI, N-PSKB)
- Informatika a druhý obor (program FI, B-BI)
- Informatika a druhý obor (program FI, B-EB)
- Informatika a druhý obor (program FI, B-FY)
- Informatika a druhý obor (program FI, B-GE)
- Informatika a druhý obor (program FI, B-GK)
- Informatika a druhý obor (program FI, B-CH)
- Informatika a druhý obor (program FI, B-IO)
- Informatika a druhý obor (program FI, B-MA)
- Informatika a druhý obor (program FI, B-SO)
- Informatika a druhý obor (program FI, B-TV)
- Informatika (program FI, B-IN)
- Informatika (program FI, B-INF) (2)
- Informatika ve veřejné správě (program FI, B-AP)
- Informatika ve vzdělávání (program FI, B-IVV) (2)
- Information Security (program FI, N-PSKB_A)
- Kvantové a jiné neklasické výpočetní modely (program FI, N-TEI)
- Matematická informatika (program FI, B-IN)
- Paralelní a distribuované systémy (program FI, B-IN)
- Počítačová grafika a vizualizace (program FI, N-VIZ)
- Počítačová grafika a zpracování obrazu (program FI, B-IN)
- Počítačová lingvistika (program FF, B-PLIN_) (3)
- Počítačové sítě a komunikace (program FI, B-IN)
- Počítačové sítě a komunikace (program FI, N-PSKB)
- Počítačové systémy a zpracování dat (program FI, B-IN)
- Principy programovacích jazyků (program FI, N-TEI)
- Programování a vývoj aplikací (program FI, B-PVA)
- Programovatelné technické struktury (program FI, B-IN)
- Programovatelné technické struktury (program FI, N-IN)
- Řízení kyberbezpečnosti (program FI, N-RSSS)
- Řízení vývoje služeb (program FI, N-RSSS)
- Řízení vývoje softwarových systémů (program FI, N-RSSS)
- Services Development Management (program FI, N-RSSS_A)
- Služby - výzkum, řízení a inovace (program FI, N-AP)
- Sociální informatika (program FI, B-AP)
- Software Systems Development Management (program FI, N-RSSS_A)
- Software Systems (program FI, N-PSKB_A)
- Softwarové systémy (program FI, N-PSKB)
- Strojové učení a umělá inteligence (program FI, N-UIZD)
- Učitel informatiky a správce sítě (program FI, N-UCI)
- Učitelství informatiky pro střední školy (program FI, N-UCI) (2)
- Umělá inteligence a zpracování přirozeného jazyka (program FI, B-IN)
- Vývoj počítačových her (program FI, N-VIZ)
- Zpracování a analýza rozsáhlých dat (program FI, N-UIZD)
- Zpracování přirozeného jazyka (program FI, N-UIZD)
- Cíle předmětu
- Předmět představuje úvod do počítačového zpracování přirozeného jazyka. Studenti se v něm seznámí s algoritmickým popisem jednotlivých jazykových rovin: morfologické, syntaktické, sémantické a pragmatické, a se zdroji jazykových dat: korpusy. Pozornost je věnována také reprezentaci znalostí, inferenci a vztahům k umělé inteligenci.
- Výstupy z učení
- Student bude po absolvování předmětu schopen:
- identifikovat a shrnout hlavní fáze počítačové analýzy jazyka;
- popsat principy algoritmů využívaných pro analýzu řeči;
- uvést a vysvětlit hlavní přístupy k analýze na morfologické a syntaktické rovině jazyka;
- poskytnout přehled o hlavních jazykových datových zdrojích, jejich formátech a zpracování;
- rozumět přístupům k výpočetní sémantice a jejím aplikacím. - Osnova
- Východiska počítačového zpracování přirozeného jazyka (Natural Language Processing, NLP).
- Roviny jazyka - fonetika a fonologie, morfologie, syntaxe, sémantika a pragmatika.
- Reprezentace morfologických a syntaktických struktur.
- Analýza a syntéza: řečová, morfologická, syntaktická a sémantická.
- Formy reprezentace znalostí o lexikálních jednotkách.
- Porozumění jazyku: reprezentace významu věty, logická inference.
- Literatura
- Dan Jurafsky and James H. Martin. Speech and Language Processing (3rd ed. draft). https://web.stanford.edu/~jurafsky/slp3/
- The Oxford handbook of computational linguistics (2nd ed). Edited by Ruslan Mitkov. Oxford: Oxford University Press, 2014-2021. ISBN 9780199573691.
- PALA, Karel. Počítačové zpracování přirozeného jazyka. 1. vyd. Brno: FI MU, 2000, 190 s. info
- CHOMSKY, Noam. Syntaktické struktury., Logický základ teorie jazyka., O pojmu gramatické pravidlo. 1. vyd. Praha: Academia, 1966, 209 s. info
- MATERNA, Pavel a Jan ŠTĚPÁN. Filozofická logika: nová cesta? Olomouc: Olomouc (Univerzita Palackého), 2000, 127 s. ISBN 80-244-0109-6. info
- Výukové metody
- Přednášky s ukázkami systémů, praktický samostatný úkol.
- Metody hodnocení
- Závěrečné hodnocení se děje na základě písemné zkoušky.
- Informace učitele
- http://nlp.fi.muni.cz/nlp_intro/
- Další komentáře
- Studijní materiály
Předmět je vyučován každoročně.
- Statistika zápisu (jaro 2024, nejnovější)
- Permalink: https://is.muni.cz/predmet/fi/jaro2024/IB030