FI:PA153 Počítačové zpracování PJ - Informace o předmětu
PA153 Počítačové zpracování přirozeného jazyka
Fakulta informatikypodzim 2020
- Rozsah
- 2/0/0. 2 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: k, z.
- Vyučující
- doc. Mgr. Pavel Rychlý, Ph.D. (přednášející)
prof. PhDr. Karel Pala, CSc. (přednášející), doc. RNDr. Aleš Horák, Ph.D. (zástupce)
RNDr. Zuzana Nevěřilová, Ph.D. (náhr. zkoušející) - Garance
- prof. PhDr. Karel Pala, CSc.
Katedra strojového učení a zpracování dat – Fakulta informatiky
Kontaktní osoba: doc. Mgr. Pavel Rychlý, Ph.D.
Dodavatelské pracoviště: Katedra strojového učení a zpracování dat – Fakulta informatiky - Rozvrh
- St 12:00–13:50 B410
- Omezení zápisu do předmětu
- Předmět je nabízen i studentům mimo mateřské obory.
- Mateřské obory/plány
- Analýza a zpracování obrazu (program FI, N-VIZ)
- Aplikovaná informatika (program FI, N-AP)
- Bezpečnost informačních technologií (angl.) (program FI, N-IN)
- Bezpečnost informačních technologií (program FI, N-IN)
- Bioinformatika a systémová biologie (program FI, N-UIZD)
- Bioinformatika (program FI, N-AP)
- Computer Games Development (program FI, N-VIZ_A)
- Computer Graphics and Visualisation (program FI, N-VIZ_A)
- Computer Networks and Communications (program FI, N-PSKB_A)
- Cybersecurity Management (program FI, N-RSSS_A)
- Formální analýza počítačových systémů (program FI, N-TEI)
- Grafický design (program FI, N-VIZ)
- Graphic Design (program FI, N-VIZ_A)
- Hardware Systems (program FI, N-PSKB_A)
- Hardwarové systémy (program FI, N-PSKB)
- Image Processing and Analysis (program FI, N-VIZ_A)
- Informační bezpečnost (program FI, N-PSKB)
- Informační systémy (program FI, N-IN)
- Informatika (angl.) (program FI, D-IN4)
- Informatika (program FI, D-IN4)
- Information Security (program FI, N-PSKB_A)
- Kvantové a jiné neklasické výpočetní modely (program FI, N-TEI)
- Paralelní a distribuované systémy (program FI, N-IN)
- Počítačová grafika a vizualizace (program FI, N-VIZ)
- Počítačová grafika (program FI, N-IN)
- Počítačová lingvistika (program FF, N-PLIN_) (3)
- Počítačové sítě a komunikace (program FI, N-IN)
- Počítačové sítě a komunikace (program FI, N-PSKB)
- Počítačové systémy a technologie (angl.) (program FI, D-IN4)
- Počítačové systémy a technologie (program FI, D-IN4)
- Počítačové systémy (program FI, N-IN)
- Principy programovacích jazyků (program FI, N-TEI)
- Programovatelné technické struktury (angl.) (program FI, N-IN)
- Programovatelné technické struktury (program FI, N-IN)
- Řízení kyberbezpečnosti (program FI, N-RSSS)
- Řízení vývoje služeb (program FI, N-RSSS)
- Řízení vývoje softwarových systémů (program FI, N-RSSS)
- Services Development Management (program FI, N-RSSS_A)
- Služby - výzkum, řízení a inovace (angl.) (program FI, N-AP)
- Služby - výzkum, řízení a inovace (program FI, N-AP)
- Sociální informatika (program FI, B-AP)
- Software Systems Development Management (program FI, N-RSSS_A)
- Software Systems (program FI, N-PSKB_A)
- Softwarové systémy (program FI, N-PSKB)
- Strojové učení a umělá inteligence (program FI, N-UIZD)
- Teoretická informatika (program FI, N-IN)
- Učitelství výpočetní techniky pro střední školy (program FI, N-SS) (2)
- Umělá inteligence a zpracování přirozeného jazyka (program FI, N-IN)
- Vývoj počítačových her (program FI, N-VIZ)
- Zpracování a analýza rozsáhlých dat (program FI, N-UIZD)
- Zpracování obrazu (program FI, N-AP)
- Zpracování přirozeného jazyka (program FI, N-UIZD)
- Cíle předmětu
- Předmět nabízí seznámení s počítačovým zpracováním přirozeného jazyka na jednotlivých rovinách: morfologické, syntaktické, sémantické a pragmatické. Na každé rovině se probírají teoretická východiska a používané algoritmické popisy a nástroje a také jejich organizace do složitějších systémů.
- Výstupy z učení
- Studenti získají znalosti o jednotlivých rovinách analýzy jazyka - morfologické, syntaktické, sémantické a pragmatické.
Zvládnou problematiku jazykových dat - korpusů, korpusových nástrojů, značkování korpusových textů, budou se orientovat v otázkách disambiguace s použitím pravidlových a statistických systémů.
Studenti se seznámí representací morfologických stuktur, notací a algoritmy morfologické analýzy.
Budou schopni pracovat s representacemi syntaktických struktur, formálními gramatikami a jejich typy. Seznámí se s gramatikami - nekontextovými, funkcionálními, vymezených formulí (definite-clause) a s algoritmy syntaktické analýzy.
Budou probrány datové struktury jako valenční slovesné rámce a jejich typy.
Osvojí si problematiku sémantické representace. Bude probrána lexikální sémantika - významy slov a slovních spojení (kolokací), elektronické slovníky, lexikální databáze (WordNet,EuroWordNet, thesaury).
Budou charakterizovány základní principy sémantické analýzy věty na bázi logické sémantiky včetně Normálního translačního algoritmu.
Studenti získají základní představu o problematice pragmatiky.
Pozornost bude věnována analýze promluvy a její segmentaci, dále anafoře a koreferenci.
Prezentovány budou dialogové systémy.
Dále pak problematika inference a reprezentace znalostí pro systémy zpracování přirozeného jazyka.
Studenti získají základní informace o komunikačních agentech a evaluačních technikác - Osnova
- Počítačové zpracování přirozeného jazyka a počítačová lingvistika.
- Počítačové porozumění přirozenému jazyku.
- Roviny analýzy jazyka - morfologie, syntax, sémantika.
- Jazyková data - textové korpusy. Typy korpusů. Korpusové nástroje. Značkování korpusových textů. Disambiguace, pravidlové a statistické systémy.
- Representace morfologických struktur, notace, morfologické algoritmy.
- Representace syntaktických struktur - formální gramatiky a jejich typy. Nekontextové, funkční, DC (definite-clause) gramatiky. Algoritmy syntaktické analýzy. Valenční rámce a jejich typy.
- Sémantická representace. Lexikální významy - slova a kolokace, elektronické slovníky, lexikální databáze (WordNet, EuroWordNet, thesaury).
- Semantická analýza věty, Normální translační algoritmus.
- Pragmatika.
- Analýza promluvy a její segmentace. Anafora a koreference.
- Dialogové systémy.
- Inference a reprezentace znalosti pro NL systémy.
- Komunikační agenti.
- Evaluační techniky.
- Literatura
- Výukové metody
- Výuka probíhá formou přednášek a seminářů, v nichž se kombinuje ústní projev učitele s použitím slidů a ukázek relevantních softwarových nástrojů. Studenti absolvují domácí úkoly, připravují prezentace na základě prostudované literatury a vypracovávají menší projekty. Na vhodných místech výuky se pracuje formou otevřeného dialogu mezi učitelem a studenty.
- Metody hodnocení
- písemná zkouška
- Další komentáře
- Studijní materiály
Předmět je vyučován každoročně.
- Statistika zápisu (podzim 2020, nejnovější)
- Permalink: https://is.muni.cz/predmet/fi/podzim2020/PA153