PLIN021 Sémantická analýza v praxi

Filozofická fakulta
podzim 2023
Rozsah
0/2/0. 3 kr. Ukončení: z.
Vyučující
RNDr. Zuzana Nevěřilová, Ph.D. (přednášející)
Garance
RNDr. Zuzana Nevěřilová, Ph.D.
Ústav českého jazyka – Filozofická fakulta
Kontaktní osoba: Jaroslava Vybíralová
Dodavatelské pracoviště: Ústav českého jazyka – Filozofická fakulta
Rozvrh
Čt 12:00–13:40 G13, kromě Čt 16. 11.
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Předmět si smí zapsat nejvýše 20 stud.
Momentální stav registrace a zápisu: zapsáno: 6/20, pouze zareg.: 0/20, pouze zareg. s předností (mateřské obory): 0/20
Mateřské obory/plány
Cíle předmětu
Na konci tohoto kurzu bude student schopen: porozumět pojmu význam a jednotlivým druhům významu; porozumět víceznačnosti a jejímu zachycení v současných počítačových programech; pochopit rozlišování významů v tradičních slovnících i v počítačovém zpracování; vysvětlit roli kontextu v určování významu; porozumět formalismům pro zachycení významu; porozumět současným přístupům a počítačovým programům pro sémantickou analýzu
Výstupy z učení
Student bude po absolvování předmětu schopen: - identifikovat problém počítačového zpracování přirozeného jazyka jako problém sémantického zpracování,
- určit granularitu jazykového zdroje v porovnání s jinými,
- určit velikost a typ kontextu relevantního pro sémantickou disambiguaci,
- aplikovat statistické metody pro určování klíčových slov
Osnova
  • 1. Úvod ke studiu významu. Významy a znaky. Různé typy významu slova.
  • 2. Homonymie a polysémie. Jsou významy diskrétní? Je víceznačnost problém? Kdy je potřeba významy rozlišovat?
  • 3. Zachycení významu ve slovnících (číslování významu), rozpoznávání významu v textu, předpoklad “one-sense per collocation”, přístupy strojového učení, rozpoznávání podle definic.
  • 4. Word sense disambiguation (WSD), soutěž SENSEVAL, algoritmy WSD, kdy WSD funguje? Problémy s rozlišováním významu, granularita, subjektivita.
  • 5. Formalismy pro zachycení významu: sémantické rysy, výběrová omezení, taxonomie, sémantické rámce a skripty, asociativní a sémantické sítě, valenční slovníky. WordNet a další zdroje.
  • 6. Role kontextu pro zachycení významu, formalismy pro zachycení kontextu, domény, významové potenciály, propojení významů pomocí relací, kontextové vektory.
  • 7. Matematický model významu a kontextu.
  • 8. Význam a emoce, emotional computing. Od významu slov k významu promluvy
  • 9. Konkrétní aplikace dosud představených postupů.
Literatura
    doporučená literatura
  • GODDARD, Cliff. Semantic Analysis : a practical introduction. Oxford: Oxford University Press, 1998, xv, 411 s. ISBN 0-19-870017-2. info
  • ALLEN, James. Natural language understanding. 2nd ed. Redwood City: Benjamin/Cummings Publishing Company, 1995, xv, 654 s. ISBN 0-8053-0334-0. info
Výukové metody
Přednáška, práce se softwarovými nástroj pro zpracování přirozeného jazyka: vyhledávání v korpusu a jiných jazykových zdrojích.
Metody hodnocení
Zpracovat projekt (písemný referát na 2-6 stran na jednoho studenta) nebo závěrečný písemný test sestávající z 6 otázek zaměřených na základní i pokročilé pojmy.
Další komentáře
Studijní materiály
Předmět je zařazen také v obdobích jaro 2012, podzim 2012, jaro 2013, podzim 2013, jaro 2014, podzim 2014, podzim 2015, podzim 2017, podzim 2020, podzim 2021, podzim 2022, podzim 2024.