FI:IA161 ZPJ v praxi - Informace o předmětu
IA161 Pokročilé techniky zpracování přirozeného jazyka
Fakulta informatikypodzim 2021
- Rozsah
- 1/1/0. 2 kr. (plus ukončení). Ukončení: k.
- Vyučující
- doc. RNDr. Aleš Horák, Ph.D. (přednášející)
RNDr. Miloš Jakubíček, Ph.D. (přednášející)
RNDr. Marek Medveď, Ph.D. (přednášející)
RNDr. Zuzana Nevěřilová, Ph.D. (přednášející)
RNDr. Adam Rambousek, Ph.D. (přednášející)
doc. Mgr. Pavel Rychlý, Ph.D. (přednášející)
RNDr. Vít Suchomel, Ph.D. (přednášející) - Garance
- doc. RNDr. Aleš Horák, Ph.D.
Katedra strojového učení a zpracování dat – Fakulta informatiky
Dodavatelské pracoviště: Katedra strojového učení a zpracování dat – Fakulta informatiky - Rozvrh
- St 15. 9. až St 8. 12. St 12:00–13:50 A219
- Předpoklady
- Všichni studenti by měli mít praktické znalosti programování v jazyce Python. Předpokládají se přehledové znalosti o oblasti zpracování přirozeného jazyka na úrovni úvodových kurzů jako např. IB030 Úvod do počítačového zpracování přirozeného jazyka nebo PA153 Natural Language Processing. Seminář je veden v angličtině. Řešení úloh mohou být v angličtině, češtině nebo slovenštině.
- Omezení zápisu do předmětu
- Předmět je nabízen i studentům mimo mateřské obory.
- Mateřské obory/plány
- Analýza a zpracování obrazu (program FI, N-VIZ)
- Aplikovaná informatika (program FI, B-AP)
- Aplikovaná informatika (program FI, N-AP)
- Bezpečnost informačních technologií (angl.) (program FI, N-IN)
- Bezpečnost informačních technologií (program FI, N-IN)
- Bioinformatika a systémová biologie (program FI, N-UIZD)
- Bioinformatika (program FI, B-AP)
- Bioinformatika (program FI, N-AP)
- Computer Games Development (program FI, N-VIZ_A)
- Computer Graphics and Visualisation (program FI, N-VIZ_A)
- Computer Networks and Communications (program FI, N-PSKB_A)
- Computing Technology and Methodology (program FI, D-INF_A)
- Cybersecurity Management (program FI, N-RSSS_A)
- Digitální lingvistika (program FI, N-DL)
- Formální analýza počítačových systémů (program FI, N-TEI)
- Fundamentals of Computer Science (program FI, D-INF_A)
- Fundamenty informatiky (program FI, D-INF)
- Grafický design (program FI, N-VIZ)
- Graphic Design (program FI, N-VIZ_A)
- Hardware Systems (program FI, N-PSKB_A)
- Hardwarové systémy (program FI, N-PSKB)
- Image Processing and Analysis (program FI, N-VIZ_A)
- Informační bezpečnost (program FI, N-PSKB)
- Informační systémy (program FI, N-IN)
- Informatika a druhý obor (program FI, B-EB)
- Informatika a druhý obor (program FI, B-FY)
- Informatika a druhý obor (program FI, B-GE)
- Informatika a druhý obor (program FI, B-GK)
- Informatika a druhý obor (program FI, B-CH)
- Informatika a druhý obor (program FI, B-IO)
- Informatika a druhý obor (program FI, B-MA)
- Informatika a druhý obor (program FI, B-TV)
- Informatika (angl.) (program FI, D-IN4)
- Informatika (program FI, B-INF) (3)
- Informatika (program FI, D-IN4)
- Informatika ve veřejné správě (program FI, B-AP)
- Informatika ve vzdělávání (program FI, B-IVV) (2)
- Information Security (program FI, N-PSKB_A)
- Interakce člověka s počítačem (program FI, N-IZU)
- Kvantové a jiné neklasické výpočetní modely (program FI, N-TEI)
- Kyberbezpečnost (program FI, B-CS)
- Matematická informatika (program FI, B-IN)
- Nasazení a provoz softwarových systémů (program FI, N-SWE)
- Návrh a vývoj softwarových systémů (program FI, N-SWE)
- Paralelní a distribuované systémy (program FI, B-IN)
- Paralelní a distribuované systémy (program FI, N-IN)
- Počítačová grafika a vizualizace (program FI, N-VIZ)
- Počítačová grafika a zpracování obrazu (program FI, B-IN)
- Počítačová grafika (program FI, N-IN)
- Počítačová lingvistika (program FF, N-PLIN_) (3)
- Počítačové sítě a komunikace (program FI, B-IN)
- Počítačové sítě a komunikace (program FI, N-IN)
- Počítačové sítě a komunikace (program FI, N-PSKB)
- Počítačové systémy a technologie (angl.) (program FI, D-IN4)
- Počítačové systémy a technologie (program FI, D-IN4)
- Počítačové systémy a zpracování dat (program FI, B-IN)
- Počítačové systémy (program FI, N-IN)
- Použitelná bezpečnost (program FI, N-IZU)
- Principy programovacích jazyků (program FI, N-TEI)
- Programování a vývoj aplikací (program FI, B-PVA)
- Programovatelné technické struktury (angl.) (program FI, N-IN)
- Programovatelné technické struktury (program FI, B-IN)
- Programovatelné technické struktury (program FI, N-IN)
- Řízení kyberbezpečnosti (program FI, N-RSSS)
- Řízení vývoje služeb (program FI, N-RSSS)
- Řízení vývoje softwarových systémů (program FI, N-RSSS)
- Services Development Management (program FI, N-RSSS_A)
- Služby - výzkum, řízení a inovace (angl.) (program FI, N-AP)
- Služby - výzkum, řízení a inovace (program FI, N-AP)
- Sociální informatika (program FI, B-AP)
- Software Systems Development Management (program FI, N-RSSS_A)
- Software Systems (program FI, N-PSKB_A)
- Softwarové systémy (program FI, N-PSKB)
- Strojové učení a umělá inteligence (program FI, N-UIZD)
- Technologie a metodologie počítačových systémů (program FI, D-INF)
- Teoretická informatika (program FI, N-IN)
- Učitel informatiky a správce sítě (program FI, N-UCI)
- Učitelství informatiky pro střední školy (program FI, N-EB)
- Učitelství informatiky pro střední školy (program FI, N-FY)
- Učitelství informatiky pro střední školy (program FI, N-GK)
- Učitelství informatiky pro střední školy (program FI, N-MA)
- Učitelství informatiky pro střední školy (program FI, N-SS)
- Učitelství informatiky pro střední školy (program FI, N-TV)
- Učitelství informatiky pro střední školy (program FI, N-UCI) (2)
- Učitelství výpočetní techniky pro střední školy (program FI, N-FY)
- Učitelství výpočetní techniky pro střední školy (program FI, N-GK)
- Učitelství výpočetní techniky pro střední školy (program FI, N-MA)
- Učitelství výpočetní techniky pro střední školy (program FI, N-SS) (2)
- Učitelství výpočetní techniky pro střední školy (program FI, N-TV)
- Umělá inteligence a zpracování přirozeného jazyka (program FI, B-IN)
- Umělá inteligence a zpracování přirozeného jazyka (program FI, N-IN)
- Uživatelská rozhraní ve vizuální informatice (program FI, N-IZU)
- Vývoj počítačových her (program FI, N-VIZ)
- Zpracování a analýza rozsáhlých dat (program FI, N-UIZD)
- Zpracování obrazu (program FI, N-AP)
- Zpracování přirozeného jazyka (program FI, N-UIZD)
- Cíle předmětu
- Studenti předmětu budou mít příležitost poznat, vyzkoušet a experimentovat s pokročilými technikami zpracování přirozeného jazyka a pochopit možnosti a omezení aktuálních nejlepších řešení. Cílem předmětu je představení současných nejlepších přístupů k řešení problémů jazykového inženýrství a praktické seznámení se s programovacími technikami využívanými v aplikacích jazykových technologií.
- Výstupy z učení
- Student bude po absolvování předmětu schopen:
- vysvětlit vybraný problém z oblasti NLP a vyjmenovat jeho hlavní aspekty;
- vytvořit základní či mírně pokročilou aplikaci pro obtížnější úkoly zpracování jazyka, typicky pro český, slovenský nebo anglický jazyk;
- vytvořit datové podklady (model, testovací sadu) pro vybraný problém z oblasti NLP a vyhodnotit jejich přínos;
- porovnat vybrané dostupné nástroje na řešení pokročilých úloh zpracování přirozeného jazyka a aplikovat je na zvolené datové sady, případně je upravit pro konkrétní úlohu. - Osnova
- Prezentované úkoly zpracování přirozeného jazyka se soustředí na praktické problémy spojené se zpracování textových dat vytvořených lidmi. Konkrétní témata zahrnují:
- Dolování názorů, analýza sentimentu (Opinion mining, sentiment analysis)
- Strojový překlad (Machine translation)
- Syntaktická analýza češtiny: Pravidla i statistika (Parsing of Czech: Between Rules and Statistics)
- Rozpoznávání jmenných entit (Named Entity Recognition)
- Tvorba jazykových zdrojů z webu (effective crawling, boilerplate removal, tokenisation, near duplicates identification)
- Jazykové modelování (Language modelling)
- Identifikace tématu, modelování tématu (Topic identification, topic modelling)
- Extrakce strukturovaných informací z textu
- Automatická extrakce relací (hypernyms, synonyms, ...)
- Adaptivní elektronické slovníky
- Identifikace terminologie (keywords, key phrases)
- Rozpoznávání anaforických výrazů (Anaphora resolution)
- Stylometrie
- Automatické jazykové korekce
- Literatura
- Dan Jurafsky and James H. Martin. Speech and Language Processing (2020, 3rd ed. draft). https://web.stanford.edu/~jurafsky/slp3/
- J. Eisenstein, Introduction to Natural Language Processing (2019), MIT Press.
- https://www.aclweb.org/anthology/
- Výukové metody
- Každá přednáška se skládá z hodinového představení teorie a řešení vybraného problému zpracování přirozeného jazyka a hodinové praktické práce u počítače zaměřené na implementaci, úpravy a vyhodnocení prezentovaných technik na běžných datech.
- Metody hodnocení
- Řešení úkolů v praktické části přednášky případně domácí úkoly.
- Vyučovací jazyk
- Angličtina
- Informace učitele
- http://nlp.fi.muni.cz/NlpInPracticeCourse
- Další komentáře
- Studijní materiály
Předmět je vyučován každoročně.
- Statistika zápisu (podzim 2021, nejnovější)
- Permalink: https://is.muni.cz/predmet/fi/podzim2021/IA161