FI:IA161 Pokročilé techniky ZPJ - Informace o předmětu
IA161 Pokročilé techniky zpracování přirozeného jazyka
Fakulta informatikypodzim 2015
- Rozsah
- 1/1/0. 2 kr. (plus ukončení). Ukončení: k.
- Vyučující
- doc. RNDr. Aleš Horák, Ph.D. (přednášející)
Mgr. et Mgr. Vít Baisa, Ph.D. (přednášející)
RNDr. Miloš Jakubíček, Ph.D. (přednášející)
RNDr. Vojtěch Kovář, Ph.D. (přednášející)
RNDr. Jiří Materna, Ph.D. (přednášející)
RNDr. Marek Medveď, Ph.D. (přednášející)
RNDr. Zuzana Nevěřilová, Ph.D. (přednášející)
RNDr. Adam Rambousek, Ph.D. (přednášející)
RNDr. Jan Rygl (přednášející)
RNDr. Vít Suchomel, Ph.D. (přednášející)
Mgr. Ján Švec (přednášející) - Garance
- doc. RNDr. Aleš Horák, Ph.D.
Katedra strojového učení a zpracování dat – Fakulta informatiky
Dodavatelské pracoviště: Katedra strojového učení a zpracování dat – Fakulta informatiky - Rozvrh
- Po 10:00–11:50 A219
- Předpoklady
- PA153 Počítačové zpracování PJ || IB030 Úvod do počítač. lingv.
Všichni studenti by měli mít praktické znalosti programování v jazyce Python. - Omezení zápisu do předmětu
- Předmět je nabízen i studentům mimo mateřské obory.
- Mateřské obory/plány
- Umělá inteligence a zpracování přirozeného jazyka (program FI, N-IN)
- Cíle předmětu
- Studenti předmětu budou mít příležitost poznat, vyzkoušet a experimentovat s pokročilými technikami zpracování přirozeného jazyka a pochopit možnosti a omezení aktuálních nejlepších řešení. Cílem předmětu je představení současných nejlepších přístupů k řešení problémů jazykového inženýrství a praktické seznámení se s programovacími technikami využívanými v aplikacích jazykových technologií.
- Osnova
- Prezentované úkoly zpracování přirozeného jazyka se soustředí na praktické problémy spojené se zpracování textových dat vytvořených lidmi. Konkrétní témata zahrnují:
- Dolování názorů, analýza sentimentu (Opinion mining, sentiment analysis)
- Strojový překlad (Machine translation)
- Syntaktická analýza češtiny: Pravidla i statistika (Parsing of Czech: Between Rules and Statistics)
- Rozpoznávání jmenných entit (Named Entity Recognition)
- Tvorba jazykových zdrojů z webu (effective crawling, boilerplate removal, tokenisation, near duplicates identification)
- Jazykové modelování (Language modelling)
- Identifikace tématu, modelování tématu (Topic identification, topic modelling)
- Extrakce strukturovaných informací z textu
- Automatická extrakce relací (hypernyms, synonyms, ...)
- Adaptivní elektronické slovníky
- Identifikace terminologie (keywords, key phrases)
- Rozpoznávání anaforických výrazů (Anaphora resolution)
- Stylometrie
- Automatické jazykové korekce
- Literatura
- JURAFSKY, Dan a James H. MARTIN. Speech and language processing : an introduction to natural language processing, computational linguistics and speech recognition. 2nd ed. New Jersey: Pearson, 2009, 1024 s. ISBN 9780135041963. info
- MANNING, Christopher D. a Hinrich SCHÜTZE. Foundations of statistical natural language processing. Cambridge, Mass.: MIT Press, 1999, xxxvii, 68. ISBN 9780262133609. info
- MERLO, Paola, Harry BUNT a Joakim NIVRE. Trends in Parsing Technology: Dependency Parsing, Domain Adaptation, and Deep Parsing. Springer Netherlands, 2011, 297 s. Text, Speech and Language Technology, Vol. 43. ISBN 978-90-481-9351-6. URL info
- https://www.aclweb.org/anthology/
- Výukové metody
- Každá přednáška se skládá z hodinového představení teorie a řešení vybraného problému zpracování přirozeného jazyka a hodinové praktické práce u počítače zaměřené na implementaci, úpravy a vyhodnocení prezentovaných technik na běžných datech.
- Metody hodnocení
- Řešení úkolů v praktické části přednášky případně domácí úkoly.
- Informace učitele
- http://nlp.fi.muni.cz/AdvancedNlpCourse
- Další komentáře
- Studijní materiály
Předmět je vyučován každoročně.
- Statistika zápisu (podzim 2015, nejnovější)
- Permalink: https://is.muni.cz/predmet/fi/podzim2015/IA161