PLIN037 Sémantika a počítače

Filozofická fakulta
jaro 2024
Rozsah
0/2/0. 4 kr. Ukončení: z.
Vyučující
RNDr. Zuzana Nevěřilová, Ph.D. (přednášející)
Garance
RNDr. Zuzana Nevěřilová, Ph.D.
Katedra strojového učení a zpracování dat – Fakulta informatiky
Dodavatelské pracoviště: Katedra strojového učení a zpracování dat – Fakulta informatiky
Rozvrh
Čt 10:00–11:40 G13, kromě Čt 18. 4.
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Předmět si smí zapsat nejvýše 30 stud.
Momentální stav registrace a zápisu: zapsáno: 6/30, pouze zareg.: 0/30, pouze zareg. s předností (mateřské obory): 0/30
Mateřské obory/plány
Cíle předmětu
Na konci tohoto kurzu bude student schopen porozumět termínům z oblasti formálního a počítačového zpracování sémantické roviny jazyka; použít existující znalostní báze a znát jejich výhody a nevýhody; rozumět termínu linked open data (LOD); používat technologie sémantického webu; porozumět sémantickým sítím; vysvětlit principy odvozování v sémantických sítích; interpretovat pravděpodobnostní modely významu; rozumět modelování významu pomocí word embeddings; porozumět a vysvětlit anaforické vztahy a algoritmy pro jejich automatickou detekci; porozumět tomu, jak je sémantika obsažena ve velkých jazykových modelech; základně porozumět problematice vyhodnocení modelů
Výstupy z učení
Student bude po absolvování předmětu schopen:
- identifikovat problém počítačového zpracování přirozeného jazyka jako problém sémantického zpracování,
- vyjmenovat tradiční přístupy k sémantice přirozeného jazyka,
- vyjmenovat a popsat znalostní báze,
- aplikovat znalostní bázi na konkrétní úlohu,
- aplikovat předtrénovaný jazykový model na konkrétní úlohu,
- aplikovat velký jazykový model na konkrétní úlohu,
- porozumět základním metodám vyhodnocení modelů.
Osnova
  • 1. Hledání významu: vývoj sémantiky jako vědy o významu.
  • 2. Strukturalistická sémantika: logika, sémantické relace, komponentová analýza.
  • 3. Znalost jazyka a znalost světa: Sémantické a lexikální sítě, ontologie.
  • 4. Sémantické relace v existujících datových zdrojích, odvozování.
  • 5. Formální jazyky pro reprezentaci znalostí: RDF, OWL. Linked open data.
  • 6. Pravděpodobnostní modely.
  • 7. Word embeddings. Předtrénované modely.
  • 8. Transformery. Velké jazykové modely. Generativní modely.
  • 9. Analýza diskurzu, rozpoznávání anafor. Směrem k pragmatice.
  • 10. Úvod k vyhodnocení modelů.
Literatura
    doporučená literatura
  • GODDARD, Cliff. Semantic Analysis : a practical introduction. Oxford: Oxford University Press, 1998, xv, 411 s. ISBN 0-19-870017-2. info
Výukové metody
Přednáška, výukové materiály v ISu (prezentace, videa). Cvičení na počítači, nejčastěji formou Jupyter Notebooku v prostředí Colab (není nutná žádná instalace software).
Metody hodnocení
Prezentace aktuálního vědeckého článku nebo aktuálního tématu z oblasti (podle vlastního výběru).
Informace učitele
Studijní literatura a studijní pomůcky:
J. ALLEN: Natural Language Understanding, 2nd. ed. Benjamin-Cummings Publishing Co., Inc., 1995.


CH. FELLBAUM: WordNet: An Electronic Lexical Database (Language, Speech, and Communication), The MIT Press, May 1998.


C. J. FILLMORE: The Case for Case, The Ohio State University, 1967.


K. K. SCHULER: VerbNet: A Broad-Coverage, Comprehensive Verb Lexicon, PhD Thesis, Faculties of the University of Pennsylvania, 2005.


N. SHADBOLT, W. HALL, T. BERNERS-LEE: The Semantic Web Revisited. IEEE Intelligent Systems, 2006. http://eprints.ecs.soton.ac.uk/12614/1/Semantic_Web_Revisted.pdf


https://www.deeplearning.ai/resources/natural-language-processing/


Dirk Geeraerts: Theories of Lexical Semantics. Oxford University Press. 2010. ISBN 978–0–19–870030–2. https://wwwling.arts.kuleuven.be/qlvl/prints/Geeraerts_2009draft_Theories_of_Lexical_Semantics.pdf


Prezentace z minulých let


https://nlp.fi.muni.cz/cs/OCemSeMluvi

Další komentáře
Studijní materiály
Předmět je zařazen také v obdobích podzim 2013, jaro 2014, podzim 2014, jaro 2015, jaro 2016, jaro 2017, jaro 2018, jaro 2019, jaro 2021, jaro 2022, jaro 2023.
  • Statistika zápisu (nejnovější)
  • Permalink: https://is.muni.cz/predmet/phil/jaro2024/PLIN037