PLIN021 SÉMANTICKÁ ANALÝZA V PRAXI ZUZANA NEVĚŘILOVÁ 2020/21 A bowl of oranges LEXIKÁLNÍ DESAMBIGUACE OPAKOVÁNÍ ¡Lexikální desambiguace je přirazení slova v daném kontextu významu v určitém repozitáři významů (např. Slovníku). ¡Leskův algoritmus řeší úlohu porovnáním kontextu slova se slovy z definice významu. ¡V definici nutně nemusejí být slova, která se vůbec kdy s hledaným slovem vyskytují. ¡Úspěch algorimu silně závisí na použitém slovníku. ¡Slovníky nebyly napsány s cílem být zdrojem pro algoritmus WSD. ¡Je tedy třeba se porozhlédnout po jiných algoritmech. LEXIKÁLNÍ DESAMBIGUACE (YAROWSKI, 1995) LEXIKÁLNÍ DESAMBIGUACE (YAROWSKI, 1995) Text Description automatically generated LEXIKÁLNÍ DESAMBIGUACE (YAROWSKI, 1995) 2.pro každý možný význam slova, vytvoř malou sadu příkladů (buď ručně, nebo pomocí kolokací) A picture containing text Description automatically generated LEXIKÁLNÍ DESAMBIGUACE (YAROWSKI, 1995) 2.pro každý možný význam slova, vytvoř malou sadu příkladů (buď ručně, nebo pomocí kolokací) Text Description automatically generated LEXIKÁLNÍ DESAMBIGUACE (YAROWSKI, 1995) 3.vytvoř rozhodovací seznam s pravděpodobnostmi pro další slova, která se vyskytují v kontextech a aplikuj tento seznam na celý korpus (s prahem pro pravděpodobnost) if ('pes' in context(w)) then s(w,A)=1 if ('vlasy' in context(w)) then s(w,B)=1 if ('prase' in context(w)) then s(w,A)=0.9 if ('prsa' in context(w)) then s(w,B)=1 if ('oči' in context(w)) then s(w,B)=0.6 if ('člověk' in context(w)) then s(w,A)=0.8 LEXIKÁLNÍ DESAMBIGUACE (YAROWSKI, 1995) 4.nově zařazená slova obsahují další slova v kontextech pes → majitel, žrát vlasy → pohledná LEXIKÁLNÍ DESAMBIGUACE (YAROWSKI, 1995) LEXIKÁLNÍ DESAMBIGUACE (YAROWSKI, 1995) A picture containing text Description automatically generated LEXIKÁLNÍ DESAMBIGUACE (YAROWSKI, 1995) A picture containing text Description automatically generated LEXIKÁLNÍ DESAMBIGUACE (YAROWSKI, 1995) Text Description automatically generated Jakmile množiny zařazených slov přestanou narůstat, zastav. ONE SENSE PER DISCOURSE ¡... if a polysemous word such as sentence appears two or more times in a well-written discourse, it is extremely likely that they will all share the same sense. LITERATURA ¡ ¡Wikipedia contributors. Yarowsky algorithm. Wikipedia, The Free Encyclopedia. August 20, 2020, 19:47 UTC. Available at: https://en.wikipedia.org/w/index.php?title=Yarowsky_algorithm&oldid=974046729. Accessed November 2, 2020. ¡William A. Gale, Kenneth W. Church, and David Yarowsky. One sense per discourse. In Proceedings of the workshop on Speech and Natural Language (HLT '91). Association for Computational Linguistics, USA, 233–237. 1992. DOI: https://doi.org/10.3115/1075527.1075579