Proseminář z počítačové lingvistiky Podzim 2019 Markéta Masopustová Sémantická analýza Termíny • Sémantika; • Hyponyma; • Hyperonyma; • Kohyponyma; • Meronyma; • Synset. ? Termíny • Sémantika – nauka o významu; • Hyponyma – podřazená slova; • Hyperonyma – nadřazená slova; • Kohyponyma – významově shodná slova; • Meronyma – označuje část celku; • Synset – synonymická řada. ? Sémantická analýza • Snaží se o formální popis významu. • Měla by být jazykově nezávislá. • Počátky v ontologiích. Tokenizace Morfologická analýza Syntaktická analýza Sémantická analýza NER • Rozpoznání pojmenovaných entit (Named Entity Recognition). • Cílem je najít předem definované kategorie v nestrukturovaném textu. • https://nlp.fi.muni.cz/projekty/ ner/v2/ • http://ufal.mff.cuni.cz/cnec/cn ec2.0 V rámci ÚFALu • PDT: • Prague Dependency Treebank; • Nejedná se o význam, ale o významovou roli ve větě. • Semantic Pattern Recognition; • SEANCe – značkování sentimentu. Sémantické sítě • FrameNet • https://framenet.icsi.berkeley. edu/fndrupal/ • VerbNet • https://verbs.colorado.edu/~ mpalmer/projects/verbnet.ht ml • ConceptNet • http://conceptnet.io/ WordNet • G. A. Miller (Princeton University) – psycholog a psycholingvista. • Základním je Princeton WordNet (1985), postupně vytvářeny národní Wordnety. • http://wordnet.princeton.edu • http://globalwordnet.org/reso urces/wordnets-in-the-world/ WordNet prakticky • Přístup: demo/demo; read/read. • DebVisDic 2: • https://deb.fi.muni.cz/proj_debvis dic-cs.php • RAW viewer: • https://deb.fi.muni.cz/raw- viewer/rawviewer.html Děkuji za pozornost.