FF:PLIN037 Sémantika a počítače - Informace o předmětu
PLIN037 Sémantika a počítače
Filozofická fakultajaro 2024
- Rozsah
- 0/2/0. 4 kr. Ukončení: z.
- Vyučující
- RNDr. Zuzana Nevěřilová, Ph.D. (přednášející)
- Garance
- RNDr. Zuzana Nevěřilová, Ph.D.
Katedra strojového učení a zpracování dat – Fakulta informatiky
Dodavatelské pracoviště: Katedra strojového učení a zpracování dat – Fakulta informatiky - Rozvrh
- Čt 10:00–11:40 G13, kromě Čt 18. 4.
- Omezení zápisu do předmětu
- Předmět je nabízen i studentům mimo mateřské obory.
Předmět si smí zapsat nejvýše 30 stud.
Momentální stav registrace a zápisu: zapsáno: 6/30, pouze zareg.: 0/30, pouze zareg. s předností (mateřské obory): 0/30 - Mateřské obory/plány
- Digitální lingvistika (program FI, N-DL)
- Počítačová lingvistika (program FF, N-PLIN_) (3)
- Cíle předmětu
- Na konci tohoto kurzu bude student schopen porozumět termínům z oblasti formálního a počítačového zpracování sémantické roviny jazyka; použít existující znalostní báze a znát jejich výhody a nevýhody; rozumět termínu linked open data (LOD); používat technologie sémantického webu; porozumět sémantickým sítím; vysvětlit principy odvozování v sémantických sítích; interpretovat pravděpodobnostní modely významu; rozumět modelování významu pomocí word embeddings; porozumět a vysvětlit anaforické vztahy a algoritmy pro jejich automatickou detekci; porozumět tomu, jak je sémantika obsažena ve velkých jazykových modelech; základně porozumět problematice vyhodnocení modelů
- Výstupy z učení
- Student bude po absolvování předmětu schopen:
- identifikovat problém počítačového zpracování přirozeného jazyka jako problém sémantického zpracování,
- vyjmenovat tradiční přístupy k sémantice přirozeného jazyka,
- vyjmenovat a popsat znalostní báze,
- aplikovat znalostní bázi na konkrétní úlohu,
- aplikovat předtrénovaný jazykový model na konkrétní úlohu,
- aplikovat velký jazykový model na konkrétní úlohu,
- porozumět základním metodám vyhodnocení modelů. - Osnova
- 1. Hledání významu: vývoj sémantiky jako vědy o významu.
- 2. Strukturalistická sémantika: logika, sémantické relace, komponentová analýza.
- 3. Znalost jazyka a znalost světa: Sémantické a lexikální sítě, ontologie.
- 4. Sémantické relace v existujících datových zdrojích, odvozování.
- 5. Formální jazyky pro reprezentaci znalostí: RDF, OWL. Linked open data.
- 6. Pravděpodobnostní modely.
- 7. Word embeddings. Předtrénované modely.
- 8. Transformery. Velké jazykové modely. Generativní modely.
- 9. Analýza diskurzu, rozpoznávání anafor. Směrem k pragmatice.
- 10. Úvod k vyhodnocení modelů.
- Literatura
- doporučená literatura
- GODDARD, Cliff. Semantic Analysis : a practical introduction. Oxford: Oxford University Press, 1998, xv, 411 s. ISBN 0-19-870017-2. info
- Výukové metody
- Přednáška, výukové materiály v ISu (prezentace, videa). Cvičení na počítači, nejčastěji formou Jupyter Notebooku v prostředí Colab (není nutná žádná instalace software).
- Metody hodnocení
- Prezentace aktuálního vědeckého článku nebo aktuálního tématu z oblasti (podle vlastního výběru).
- Informace učitele
- Studijní literatura a studijní pomůcky:
J. ALLEN: Natural Language Understanding, 2nd. ed. Benjamin-Cummings Publishing Co., Inc., 1995.
CH. FELLBAUM: WordNet: An Electronic Lexical Database (Language, Speech, and Communication), The MIT Press, May 1998.
C. J. FILLMORE: The Case for Case, The Ohio State University, 1967.
K. K. SCHULER: VerbNet: A Broad-Coverage, Comprehensive Verb Lexicon, PhD Thesis, Faculties of the University of Pennsylvania, 2005.
N. SHADBOLT, W. HALL, T. BERNERS-LEE: The Semantic Web Revisited. IEEE Intelligent Systems, 2006. http://eprints.ecs.soton.ac.uk/12614/1/Semantic_Web_Revisted.pdf
https://www.deeplearning.ai/resources/natural-language-processing/
Dirk Geeraerts: Theories of Lexical Semantics. Oxford University Press. 2010. ISBN 978–0–19–870030–2. https://wwwling.arts.kuleuven.be/qlvl/prints/Geeraerts_2009draft_Theories_of_Lexical_Semantics.pdf
Prezentace z minulých let
https://nlp.fi.muni.cz/cs/OCemSeMluvi - Další komentáře
- Studijní materiály
- Statistika zápisu (nejnovější)
- Permalink: https://is.muni.cz/predmet/phil/jaro2024/PLIN037