FI:PA164 Učení a přirozený jazyk - Informace o předmětu
PA164 Strojové učení a přirozený jazyk
Fakulta informatikypodzim 2021
- Rozsah
- 2/1/0. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: z.
- Vyučující
- doc. RNDr. Lubomír Popelínský, Ph.D. (přednášející)
doc. Mgr. Bc. Vít Nováček, PhD (přednášející) - Garance
- doc. RNDr. Lubomír Popelínský, Ph.D.
Katedra strojového učení a zpracování dat – Fakulta informatiky
Dodavatelské pracoviště: Katedra strojového učení a zpracování dat – Fakulta informatiky - Rozvrh
- Čt 16. 9. až Čt 9. 12. Čt 12:00–13:50 A318
- Rozvrh seminárních/paralelních skupin:
- Předpoklady
- Předpokládá se základní znalost strojového učení v rozsahu předmětu IB031, počítačové lingvistiky v rozsahu PA153 a neuronových sítí v rozsahu PV021. Výuka probíhá v angličitně (v češtině jen pokud s tím studující souhlasí). Výstupy studentů mohou být anglicky, česky nebo slovensky (v jiném jazyce jen pokud s tím vyučující souhlasí).
- Omezení zápisu do předmětu
- Předmět je nabízen i studentům mimo mateřské obory.
- Mateřské obory/plány
- předmět má 54 mateřských oborů, zobrazit
- Cíle předmětu
- Student získá přehled o metodách a nástrojích strojového učení pro analýzy přirozeného jazyka (text mining, natural language learning). Na konci tohoto kurzu bude student schopen použít získané znalosti pro vytvoření systémů pro analýzu textu pomocí metod strojového učení. Bude schopen porozumět vědeckým pracem z tohoto oboru.
- Výstupy z učení
- Student bude schopen
- předzpracovat textová data pro text mining;
- vytvořit systém pro analýzu textu pomocí metod strojového učení;
- porozumět vědeckým pracem z tohoto oboru;
- napsat technickou zprávu z této oblasti. - Osnova
- Zpracování přirozeného jazyka. Korpusy. Nástroje.
- Přehled metod strojového učení
- Desambiguace. Morfologická desambiguace a desambiguace významu slov
- Mělká syntaktická analýza a strojové učení
- Kategorizace dokumentů
- Extrakce informace z textu
- Sumarizace,analýza sentimentu a další metody pro dolování v textu
- Detekce anomálií v textu. Novelty detection
- Keyness. Detekce klíčových slov
- Shlukování dokumentů a termů
- Web mining
- Literatura
- doporučená literatura
- Charu C. Aggarwal, Machine Learning for Text. Springer 2018
- MANNING, Christopher D. a Hinrich SCHÜTZE. Foundations of statistical natural language processing. Cambridge: MIT Press, 1999, xxxvii, 68. ISBN 0-262-13360-1. info
- LIU, Bing. Web data mining : exploring hyperlinks, contents, and usage data. Berlin: Springer, 2007, xix, 532. ISBN 9783540378815. info
- neurčeno
- Mining text data. Edited by Charu C. Aggarwal - ChengXiang Zhai. New York: Springer Science+Business Media, 2012, xi, 522. ISBN 9781461432227. info
- Výukové metody
- přednáška následovaná praktickými ukázkami a řešením projektu
- Metody hodnocení
- Písemná příprava na zkoušku, ústní zkouška. Součástí ukončení je obhajoba projektu.
- Vyučovací jazyk
- Angličtina
- Informace učitele
- http://www.fi.muni.cz/~popel/lectures/ll/
- Další komentáře
- Studijní materiály
Předmět je vyučován každoročně.
- Statistika zápisu (podzim 2021, nejnovější)
- Permalink: https://is.muni.cz/predmet/fi/podzim2021/PA164