PA153 Počítačové zpracování přirozeného jazyka 04 - Sémantika I (reprezentace lexikálního významu) Karel Pala, Zuzana NevěTilová Centrum ZPJ, Fl MU, Brno 18. listopadu 2013 Q Lexikální význam Ql Slovníkové heslo Ql Nalezení významu v kontextu Q Popis lexikálních významu pro ZPJ • Sémantické primitivy • Sémantické třídy • Teorie prototypu O Sh rnuti Lexikální význam lexikální význam (lexical meaning): izolovaný význam slova [Oxford Dictionaries, 2013] • bez ohledu na význam věty, ve které se slovo nacház • bez ohledu na gramatické kategorie Lexikální význam lexikální význam (lexical meaning): izolovaný význam slova [Oxford Dictionaries, 2013] a bez ohledu na význam věty, ve které se slovo nachází • bez ohledu na gramatické kategorie jiné významy: gramatický význam, význam slov a význam vět Lexikální význam lexikální význam (lexical meaning): izolovaný význam slova [Oxford Dictionaries, 2013] a bez ohledu na význam věty, ve které se slovo nachází • bez ohledu na gramatické kategorie jiné významy: gramatický význam, význam slov a význam vět • kuře - kuřata • frekvence - kmitočet • Pan profesor běží na tramvaj. Gepard běží za kořistí. PA153 Zpracování přirozeného jazyka '—Lexikální význam -Lexikální význam slova kuře a kuřata mají tentýž lexikální význam, ale rozdílný gramatický (singulár, plurál) frekvence a kmitočet jsou různá slova, která mají tentýž lexikální (i gramatický a dokonce i další) význam běžet má stejný význam, přestože si představíme celkem jinou činnost (styl, rychlost, terén) Lexikální forma a lexikální význam Lexikální jednotka (lexical unit, LU) [Ziková, 2003]: • reprezentována lexikální formou • asociována s určitým lexikálním významem • má určité gramatické vlastnosti (např. tranzitivní sloveso) • může mít určité pragmatické vlastnosti (např. já je pokaždé někdo jiný) Lexikální forma a lexikální význam Lexikální jednotka (lexical unit, LU) [Ziková, 2003]: • reprezentována lexikální formou • asociována s určitým lexikálním významem • má určité gramatické vlastnosti (např. tranzitivní sloveso) • může mít určité pragmatické vlastnosti (např. já je pokaždé někdo jiný) • LU se stejným významem, ale jinou formou Lexikální forma a lexikální význam Lexikální jednotka (lexical unit, LU) [Ziková, 2003]: • reprezentována lexikální formou • asociována s určitým lexikálním významem • má určité gramatické vlastnosti (např. tranzitivní sloveso) • může mít určité pragmatické vlastnosti (např. já je pokaždé někdo jiný) • LU se stejným významem, ale jinou formou synonymie (např. šalina, tramvaj, šmirgl) • LU se stejnou formou, ale jiným významem Lexikální forma a lexikální význam Lexikální jednotka (lexical unit, LU) [Ziková, 2003]: • reprezentována lexikální formou • asociována s určitým lexikálním významem • má určité gramatické vlastnosti (např. tranzitivní sloveso) • může mít určité pragmatické vlastnosti (např. já je pokaždé někdo jiný) • LU se stejným významem, ale jinou formou synonymie (např. šalina, tramvaj, šmirgl) • LU se stejnou formou, ale jiným významem homonymie (např. kolej) Kde najít informace o lexikálním významu? Slovník/lexikon/lexikální databáze = soubor lexikálních jednotek (LU) PA153 Zpracování přirozeného jazyka Kde najít informace o lexikálním významu? Slovník/lexikon/lexikální databáze = soubor lexikálních jednotek (LU) Slovníky: • jednojazyčné výkladové • překladové • současného jazyka (synonym, zkratek, rýmů ...) • terminologické • historické • etymologické • speciální (frekvenční, retrográdní, valenční) «... strojově čitelné slovníky = machine readable dictionaries (MRD) |bez -U m. (6. j. -u) 11. šeřík (bot.): modrý, bílý b.; kytice bezu 12. vysoký keř s kvétenstvim drobných nažloutlých květů, které dozrávají na podzim v drobné černě I bobulky (bezinky); bez černý (bot.): třást bez(em); [x] zůstat pod bezem neprovdat se; ob. scpr. jdi mi s tím na Ib. daj pokoj; t rod Sambucus: b. černý; b, hroznatý 13. ob. květ černého bezu: vařit čaj z bezu; přen. odvar z bezového květu: pít teplý b. (Jir.) lexikální forma gramatické vlastnosti definice kolokace příklady užití odvozené lexikální formy (hnízdování) Karel Pala, Zuzana Nevěřilová PA153 Zpracování přirozeného jazyka 04 - Sémantika I 6/32 PA153 Zpracování přirozeného jazyka '—Slovníkové heslo -Struktura slovníkového hesla Ukázka je ze SSJČ, kde není žádná odvozená forma, ale v SSČ je bezový a bezinka. Pro jiná slova je v SSČ mnohem více odvozených forem: květ, květen, květena, květák, květenství, květina, květináč, květinářka, květinářství Kolokace jako slovníkové heslo pevné kolokace: zakopaný pes, devítiocasá kočka, slaměný vdovec, New York, křížem krážem, ad hoc porušují princip kompozicionality samostatná slovníková hesla? Kolokace jako slovníkové heslo pevné kolokace: zakopaný pes, devítiocasá kočka, slaměný vdovec, New York, křížem krážem, ad hoc porušují princip kompozicionality samostatná slovníková hesla? v NLP se používá termín multiword expresion (MWE) je důležité MWE identifikovat, např. pro strojový překlad: • pevné MWE: zakopaný pes • vzory: vzít na hůl bez -U m. (6. j. -u) 1. šeřík (bot.): modrý, bílý b.; kytice bezu 2. vysoký keř s kvétenstvim drobných nažloutlých květů, které dozrávají na podzim v drobné černě bobulky (bezinky); bez černý (bot.): třást bez(em); [x] zůstat pod bezem neprovdat se; ob. scpr. jdi mi s tím na b. dej pokoj; : rod Sambucus: b. černý; b, hroznatý 3. ob. květ černého bezu: vařit čaj z bezu; přen. odvar z bezového květu: pít teplý b. (Jir.) Definice pomocí bez = šeřík nonym bez -U m. (6. j. -u) 1. šeřík (bot.): modrý, bílý b.; kytice bezu 2. vysoký keř s kvétenstvim drobných nažloutlých květů, které dozrávají na podzim v drobné černě bobulky (bezinky); bez černý (bot.): třást bez(em); [x] zůstat pod bezem neprovdat se; ob. scpr. jdi mi s tím na b. dej pokoj; : rod Sambucus: b. černý; b, hroznatý 3. ob. květ černého bezu: vařit čaj z bezu; přen. odvar z bezového květu: pít teplý b. (Jir.) Definice pomocí bez = šeřík Definice klasická: bez = vysoký keř s květenstvím drobných nažloutlých květů.. . [Havránek et al., 1960] differentia specifica (druhové rozdíly) bez -U m. (6. j. -u) 1. šeřík (bot.): modrý, bílý b.; kytice bezu 2. vysoký keř s kvétenstvim drobných nažloutlých květů, které dozrávají na podzim v drobné černě bobulky (bezinky); bez černý (bot.): třást bez(em); [x] zůstat pod bezem neprovdat se; ob. scpr. jdi mi s tím na b. dej pokoj; : rod Sambucus: b. černý; b, hroznatý 3. ob. květ černého bezu: vařit čaj z bezu; přen. odvar z bezového květu: pít teplý b. (Jir.) Definice pomocí bez = šeřík Definice klasická: bez = nažloutlých květů s květenstvím drobných . [Havránek et al., 1960] differentia specifica (druhové rozdíly) bez -U m. (6. j. -u) 1. šeřík (bot.): modrý, bílý b.; kytice bezu 2. vysoký keř s kvétenstvim drobných nažloutlých květů, které dozrávají na podzim v drobné černě bobulky (bezinky); bez černý (bot.): třást bez(em); [x] zůstat pod bezem neprovdat se; ob. scpr. jdi mi s tím na b. dej pokoj; : rod Sambucus: b. černý; b, hroznatý 3. ob. květ černého bezu: vařit čaj z bezu; přen. odvar z bezového květu: pít teplý b. (Jir.) Definice klasická: bez = vysoký keř Definice pomocí bez = šeřík [Havránek et al., 1960] bez -U m. (6. j. -u) 1. šeřík (bot.): modrý, bílý b.; kytice bezu 2. vysoký keř s kvétenstvim drobných nažloutlých květů, které dozrávají na podzim v drobné černě bobulky (bezinky); bez černý (bot.): třást bez(em); [x] zůstat pod bezem neprovdat se; ob. scpr. jdi mi s tím na b. dej pokoj; : rod Sambucus: b. černý; b, hroznatý 3. ob. květ černého bezu: vařit čaj z bezu; přen. odvar z bezového květu: pít teplý b. (Jir.) Definice pomocí bez = šeřík Definice klasická: bez = vysoký keř s květenstvím drobných nažloutlých květů.. . [Havránek et al., 1960] differentia specifica (druhové rozdíly) bez -U m. (6. j. -u) 1. šeřík (bot.): modrý, bílý b.; kytice bezu 2. vysoký keř s kvétenstvim drobných nažloutlých květů, které dozrávají na podzim v drobné černě bobulky (bezinky); bez černý (bot.): třást bez(em); [x] zůstat pod bezem neprovdat se; ob. scpr. jdi mi s tím na b. dej pokoj; : rod Sambucus: b. černý; b, hroznatý 3. ob. květ černého bezu: vařit čaj z bezu; přen. odvar z bezového květu: pít teplý b. (Jir.) Definice pomocí bez = šeřík Definice klasická: bez = vysoký keř s květenstvím drobných nažloutlých květů.. . [Havránek et al., 1960] genus proximum (nejbližší rod) differentia specifica (druhové rozdíly) kulhati ned_ (1 j_ -álll, iozk. -ej, prech. přít. -aje) 1. chodit takr že váha těla se nepřenáší stejnoměrně na obě nohy, Levou nohu troponymie PO o PA153 Zpracování přirozeného jazyka '—Slovníkové heslo '—Slovníkové definice a hyperonymie klasické slovníkové heslo vyžaduje pro porozumění aspoň nějakou znalost jazyka, tudíž je pro počítačové zpracování neúplné Nalezení významu v kontextu někdy (ve skutečnosti velmi často) jen se znalostí lexikálního významu nevystačíme =4> je třeba znát kontext Nalezení významu v kontextu někdy (ve skutečnosti velmi často) jen se znalostí lexikálního významu nevystačíme =4> je třeba znát kontext lexikální desambiguace (Word Sense Disambiguation) funkce: (w, c) —> s • m/ £ W - množina slov • c G C - množina kontextů • s G s - množina významů Naivní Leskův algoritmus: kočka (SSJČ) [Lesk, 1986] O malá kočkovitá šelma, chovaná v domácnostech, na venkově zvi. pro hubení myší; kočka domáci (zool.); šedivá, černá, tříbarevná k.; hladká srst kočky; k. mňouká, přede; k. číhá na myš; k. chytá ptáky; angorská k.; být falešný, úlisný jako k.; přen. expr. je to k. falešník; to děvče je k. lichotné, úlisné; [x] jsou na sebe jako pes a k. nenávidí se.. . O malá n. středně velká šelma s hustým kožichem; zool. rod Felis: k. plavá; k. divoká; k. domáci O samice kočkovité šelmy vůbec; rysí k.; lví k.; expr. každá kočkovitá šelma vůbec (tygr, levhart aj.) O ob. kožišina na límci, kolem krku n. ramen O kocovina (Haš.) 0 věc připomínající někt. vlastnost u kočky: bot. velký trs ostřic vystupující z rašeliniště (na blatech); tech. pojízdný vozík jeřábu se zdvihacím ústrojím O druh důtek; devítiocasá k. Naivní Leskův algoritmus: vstup Aminokyselina DL-methionin okyseluje moč, čímž chrání močové ústrojí psů i koček (důležitá vlastnost zvláště u kastrovaných jedinců). 04 - Sémantika I 11/32 Naivní Leskův algoritmus: vstup Aminokyselina DL-methionin okyseluje moč, čímž chrání močové ústrojí psů i koček (důležitá vlastnost zvláště u kastrovaných jedinců). {aminokyselina, DL-methionin, okyselovat, moč, čímž, chránit, močový, ústrojí, pes, i, důležitý, vlastnost, zvláště, u, kastrovaný, jedinec} Naivní Leskův algoritmus: vstup Aminokyselina DL-methionin okyseluje moč, čímž chrání močové ústrojí psů i koček (důležitá vlastnost zvláště u kastrovaných jedinců). {aminokyselina, DL-methionin, okyselovat, moč, čímž, chránit, močový, ústrojí, pes, i, důležitý, vlastnost, zvláště, u, kastrovaný, jedinec} {aminokyselina, což, DL-methionin, důležitý, chránit, i, jedinec, kastrovaný, moč, močový, okyselovat, pes, u, ústrojí, vlastnost, zvláště} Naivní Leskův algoritmus {aminokyselina, což, DL-methionin, důležitý, chránit, i, jedinec, kastrovaný, moč, močový, okyselovat, pes, u, ústrojí, vlastnost, zvláště} 1: {a, angorský, být, černý, číhat, děvče, domácí, domácnost, expresívne, falešník, falešný, hladký, hubení, chovaný, chytat, jako, kočkovitý, lichotný, malý, mňoukat, myš, na, nenávidět, pes, pro, přeneseně, příst, pták, se, srst, šedivý, šelma, to, tříbarevný, úlisný, v, venkov, zoologicky, zvláště} 2: {divoký, domácí, Felis, hustý, kožich, malý, nebo, plavý, rod, s, středně, šelma, velký, zoologicky} 6: {bláto, botanicky, jeřáb, na, některý, ostřice, pojízdný, připomínající, rašeliniště, s, technicky, trs, u, ústrojí, věc, velký, vozík, vlastnost, vystupující, z, zdvihací} 7: {devítiocasá, druh, důtky} Naivní Leskův algoritmus {aminokyselina, což, DL-methionin, důležitý, chránit, i, jedinec, kastrovaný, moč, močový, okyselovat, pes, u, ústrojí, vlastnost, zvláště} 1: {a, angorský, být, černý, číhat, děvče, domácí, domácnost, expresívne, falešník, falešný, hladký, hubení, chovaný, chytat, jako, kočkovitý, lichotný, malý, mňoukat, myš, na, nenávidět, pes, pro, přeneseně, příst, pták, se, srst, šedivý, šelma, to, tříbarevný, úlisný, v, venkov, zoologicky, zvláště} 2: {divoký, domácí, Felis, hustý, kožich, malý, nebo, plavý, rod, s, středně, šelma, velký, zoologicky} 6: {bláto, botanicky, jeřáb, na, některý, ostřice, pojízdný, připomínající, rašeliniště, s, technicky, trs, u, ústrojí, věc, velký, vozík, vlastnost, vystupující, z, zdvihací} 7: {devítiocasá, druh, důtky} Naivní Leskův algoritmus {aminokyselina, což, DL-methionin, důležitý, chránit, i, jedinec, kastrovaný, moč, močový, okyselovat, pes, u, ústrojí, vlastnost, zvláště} 1: {a, angorský, být, černý, číhat, děvče, domácí, domácnost, expresívne, falešník, falešný, hladký, hubení, chovaný, chytat, jako, kočkovitý, lichotný, malý, mňoukat, myš, na, nenávidět, pes, pro, přeneseně, příst, pták, se, srst, šedivý, šelma, to, tříbarevný, úlisný, v, venkov, zoologicky, zvláště} 2: {divoký, domácí, Felis, hustý, kožich, malý, nebo, plavý, rod, s, středně, šelma, velký, zoologicky} 6: {bláto, botanicky, jeřáb, na, některý, ostřice, pojízdný, připomínající, rašeliniště, s, technicky, trs, u, ústrojí, věc, velký, vozík, vlastnost, vystupující, z, zdvihací} 7: {devítiocasá, druh, důtky} Naivní Leskův algoritmus {aminokyselina, což, DL-methionin, důležitý, chránit, i, jedinec, kastrovaný, moč, močový, okyselovat, pes, u, ústrojí, vlastnost, zvláště} 1: {a, angorský, být, černý, číhat, děvče, domácí, domácnost, expresívne, falešník, falešný, hladký, hubení, chovaný, chytat, jako, kočkovitý, lichotný, malý, mňoukat, myš, na, nenávidět, pes, pro, přeneseně, příst, pták, se, srst, šedivý, šelma, to, tříbarevný, úlisný, v, venkov, zoologicky, zvláště} 2: {divoký, domácí, Felis, hustý, kožich, malý, nebo, plavý, rod, s, středně, šelma, velký, zoologicky} 6: {bláto, botanicky, jeřáb, na, některý, ostřice, pojízdný, připomínající, rašeliniště, s, technicky, trs, u, ústrojí, věc, velký, vozík, vlastnost, vystupující, z, zdvihací} 7: {devítiocasá, druh, důtky} Naivní Leskův algoritmus {aminokyselina, což, DL-methionin, důležitý, chránit, i, jedinec, kastrovaný, moč, močový, okyselovat, pes, u, ústrojí, vlastnost, zvláště} 1: {a, angorský, být, černý, číhat, děvče, domácí, domácnost, expresívne, falešník, falešný, hladký, hubení, chovaný, chytat, jako, kočkovitý, lichotný, malý, mňoukat, myš, na, nenávidět, pes, pro, přeneseně, příst, pták, se, srst, šedivý, šelma, to, tříbarevný, úlisný, v, venkov, zoologicky, zvláště} 2: {divoký, domácí, Felis, hustý, kožich, malý, nebo, plavý, rod, s, středně, šelma, velký, zoologicky} 6: {bláto, botanicky, jeřáb, na, některý, ostřice, pojízdný, připomínající, rašeliniště, s, technicky, trs, u, ústrojí, věc, velký, vozík, vlastnost, vystupující, z, zdvihací} 7: {devítiocasá, druh, důtky} Naivní Leskův algoritmus {aminokyselina, což, DL-methionin, důležitý, chránit, i, jedinec, kastrovaný, moč, močový, okyselovat, pes, u, ústrojí, vlastnost, zvláště} Di = {pes,zvláště} D2 = {} Ds = {} D4 = {} Ds = {} Dq = {u,ústrojí,vlastnost} Di = {} Naivní Leskův algoritmus {aminokyselina, což, DL-methionin, důležitý, chránit, i, jedinec, kastrovaný, moč, močový, okyselovat, pes, u, ústrojí, vlastnost, zvláště} Di = {pes,zvláště} D2 = {} Ds = {} D4 = {} Ds = {} = {u,ústrojí,vlastnost} Di = {} Naivní Leskův algoritmus {aminokyselina, což, DL-methionin, důležitý, chránit, i, jedinec, kastrovaný, moč, močový, okyselovat, pes, u, ústrojí, vlastnost, zvláště} Di = {pes,zvláště} D2 = {} Ds = {} D4 = {} Ds = {} Dq = {u,ústrojí,vlastnost} Di = {} věc připomínající někt. vlastnost u kočky: bot. velký trs ostřic vystupující z rašeliniště (na blatech); tech. pojízdný vozík jeřábu se zdvihacím ústrojím PO o PA153 Zpracování přirozeného jazyka '—Nalezení významu v kontextu '—Naivní Leskův algoritmus Naivní L. algoritmus určil, že význam slova kočka v uvedené větě je 6. Je to spíš náhoda podpořená tím, že u významů 1 a 6 v SSJC také nejvíc textu. Vylepšené verze L. algoritmu některá slova nepočítají, přidávají slovům váhy (např. pomocí TF-IDF), zohledňují vzdálenost od desambiguovaného slova labiny WSD w,c) —r s • 1/1/ G W — množina slov • c G C - množina kontextů • s G s - množina významů Slabiny WSD (w, c) —> s • 1/1/ G W — množina slov • c G C - množina kontextů • s G s - množina významů Všechny algoritmy WSD závisejí na inventári a popisu významů. Slabiny WSD (w, c) —> s • 1/1/ G W — množina slov • c G C - množina kontextů • s G s - množina významů Všechny algoritmy WSD závisejí na inventári a popisu významů. Kolik významů má slovo kočka? • SSJČ: 7 a SSČ: 2 • PSJČ:10 • Slovník českých synonym: 4 • Český WordNet: 3 PA153 Zpracování přirozeného jazyka '—Nalezení významu v kontextu PO o L-Slabiny WSD Leskův a. je jednoduchý i ve svých pokročilejších verzích, zajímavý algoritmus nabídl [Yarowsky, 1995]. Jde o a. strojového učení, kdy se v prvním průchodu určí kolokace, které naprosto jistě souvisejí s konkrétním významem slova. V dalších průchodech se vypočítávají další slova, která signalizují konkrétní význam slova. Algoritmy, které nepočítají s pevným inventářem významů, jen s kontextem: Word Sense Discrimination Algoritmy, které nepočítají s pevným inventářem významů, jen s kontextem: Word Sense Discrimination production tqulpc [Véronis, 2004] Komponentová analýza (Componential analysis) = popis významů slov pomoci množiny sémantických rysů (primitiv), které jsou buď přítomny, nebo nepřítomny, nebo irelevantní pro daný význam: • muž = +HUMAN +ADULT +MALE • žena = +HUMAN +ADULT -MALE • chlapec = +HUMAN -ADULT +MALE • batole = +HUMAN -ADULT ±MALE [Katz and Fodor, 1963] a [Bierwisch, 1971] Komponentová analýza (Componential analysis) I označení popis příklad T tempus, čas den, rok, leden, soumrak L locus, místo dům, chrám, světadíl, břeh BYT bytost víla HUM člověk strejda, rada, bača ANIM zvíře pes, slon, velbloud PLANT rostlina strom, kosatec QUA vlastnost nespokojenec, povýšenec + HUM FEN fenomén úkaz, zázrak ENT entita protiklad, argument OBJ objekt, předmět stůl, krb, ale i dům (OBJ + L) Komponentová analýza (Componential analysis) II označení popis příklad INF informace telefonát, článek, vzkaz EMO emoce cit, radost, strach, neklid, úsměv INS instrument, nástroj nůž, šíp hřeben MACH stroj, aparát, zařízení počítač PROC proces zážeh, postup, pokrok MOT pohyb běh, let, pád AKT aktivita, činnost boj, odboj, příchod MAT materiál hlína, dřevo BP část těla (body part) prst, krk ORG organizace, instituce vláda Sémantické třídy = skupiny slov, která sdílejí určitý sémantický rys Sémantické třídy = skupiny slov, která sdílejí určitý sémantický rys obratlovec - savec - šelma - psovitá šelma - pes - pudl - trpasličí pudl Sémantické třídy = skupiny slov, která sdílejí určitý sémantický rys obratlovec - savec - šelma - psovitá šelma - pes - pudl - trpasličí pudl taxonomie, hierarchie tříd Sémantické tfídy, Porfyriúv strom Supreme genus: Substance^ Differentiae: material immaterial Suhardmaie genera: Body Spirit Differentiae: animate^^ inanimate Subordinate genera: Living Mineral Differentiae: sensitive^ insensitive Proximate genera: Animal Plant Differentiae: rational^^ Irrational Species: Human Beast Im/iviiltiali: Socrates Plato Aristotle etc. Sémantické třídy, sémantické sítě, odvozování Sémantické třídy, sémantické sítě, odvozování Sémantické sítě WordNet (Princeton WordNet, PWN) - lexikální síť • původně nástroj k ověření teorie o uspořádání lidské paměti (G. A. Miller, od r. 1985) • počítačově dobře zpracovatelný zdroj informací o významech slov a vztazích mezi významy [Fellbaum, 1998] • jednotkou je synonymická řada (synonymical set, synset) • synsety jsou spojeny relacemi: ► hyperonymie/hyponymie: vůz, automobil - dodávka ► holonymie/meronymie (part of, member of): vůz, automobil - tlumič; orchestr - houslista ► troponymie: šeptat - mluvit ► near-antonym: den - noc ► odvození: velikost - velký • slovní druhy: substantiva, adjektiva, verba, adverbia Word Net anglictina: PWN (117 tis. synsetü) Word Net angličtina: PWN (117 tis. synsetů) projekty EuroWordNet (angličtina + holandština, italština, španělština, němčina, francouzština, čeština, estonština) • ILI - InterLingual Index • Top Ontology (63 kategorií) • Base Concepts Word Net angličtina: PWN (117 tis. synsetů) projekty EuroWordNet (angličtina + holandština, italština, španělština, němčina, francouzština, čeština, estonština) • ILI - InterLingual Index • Top Ontology (63 kategorií) • Base Concepts projekty (BalkaNet: bulharština, čeština, rumunština, řečtina, srbština, turečtina), při kterých vznikají wordnety pro další jazyky, koordinátorem databází je Global WordNet Association (GWA) Word Net angličtina: PWN (117 tis. synsetů) projekty Euro Word Net (angličtina + holandština, italština, španělština, němčina, francouzština, čeština, estonština) • ILI - InterLingual Index • Top Ontology (63 kategorií) • Base Concepts projekty (BalkaNet: bulharština, čeština, rumunština, řečtina, srbština, turečtina), při kterých vznikají wordnety pro další jazyky, koordinátorem databází je Global WordNet Association (GWA) současný český W.: 28 tis. synsetů WordNet není jediný Ontológie = explicitní specifikace sdílené konceptualizace • firemní o. • všeobecné o. SUMO/MILO (Suggested Upper Merged Ontology, Mid-Level Ontology) • common sense o. ConceptNet Ontológie a datové formáty (ontologické jazyky) a predikátová logika 1. řádu a rozšíření • Rodina KIF (Knowledge Interchange Format) • Rodina RDF (Resource Description Framework), , jazyky sémantického webu": RDF, RDFS, OWL, DAM L Teorie prototypů E. Rosen dokázala, že lidé uvažují o vlastnostech třídy jako o vlastnostech typického zástupce třídy. Teorie prototypů E. Rosen dokázala, že lidé uvažují o vlastnostech třídy jako o vlastnostech typického zástupce třídy. t. prototypů se uplatňuje v popisu typických situací (rámce, skripty) Teorie prototypů E. Rosen dokázala, že lidé uvažují o vlastnostech třídy jako o vlastnostech typického zástupce třídy. t. prototypů se uplatňuje v popisu typických situací (rámce, skripty) vzdálenost mezi koncepty: židle je víc nábytek než sporák Shrnutí gramatika slovní druh, gramatické kategorie syntax větný člen sémantika sémantická třída Shrnutí gramatika syntax slovní druh, gramatické kategorie větný člen sémantika sémantická třída popis lexikálního významu: • pro uživatele jazyka: slovníky • pro počítačové programy: specializované zdroje (sém. rysy, ontológie, prototypy) Shrnutí gramatika syntax slovní druh, gramatické kategorie větný člen sémantika sémantická třída popis lexikálního významu: • pro uživatele jazyka: slovníky • pro počítačové programy: specializované zdroje (sém. rysy, ontológie, prototypy) rozlišení lexikálního významu: • pro uživatele jazyka: číslo významu • pro počítačové programy: WSD, vzdálenost mezi koncepty Odkazy I □ Bierwisch, M. (1971). On classifying semantic features. In M. Bierwisch, K. E. H., editor, Progress in Linguistics, pages 27-50. Mouton. 1 Fellbaum, C. (1998). WordNet: An Electronic Lexical Database (Language, Speech, and Communication ). The MIT Press. Published: Hardcover. Q Goddard, C. (2011). Semantic Analysis: A Practical Introduction. Oxford Textbooks in Linguistics. Oxford University Press. Odkazy II H Havránek, B. et al. (1960). Slovník spisovného jazyka českého (Dictionary of Written Czech, SSJČ). Academia, Praha, 1st edition. electronic version, created in the Institute of Czech Language, Czech Academy of Sciences Prague in cooperation with Faculty of Informatics, Masaryk University Brno. □ Katz, J. and Fodor, J. (1963). The structure of a semantic theory. Language, (39):170-210. Odkazy III 1 Lesk, M. (1986). Automatic sense disambiguation using machine readable dictionaries: how to tell a pine cone from an ice cream cone. In Proceedings of the 5th annual international conference on Systems documentation, SIGDOC '86, pages 24-26, New York, NY, USA. ACM. 13 Oxford Dictionaries (2013). lexical meaning. Oxford Dictionaries, online. http://oxforddictionaries.com/definition/english/ lexical-meaning (accessed October 03, 2013). 1 Veronis, J. (2004). Hyperlex: Lexical cartography for information retrieval. In Computer Speech and Language: Special Issue on Word Sense Disambiguation, page 23. Odkazy IV H Yarowsky, D. (1995). Unsupervised word sense disambiguation rivaling supervised methods. In Proceedings of the 33rd annual meeting on Association for Computational Linguistics, ACL '95, pages 189-196, Stroudsburg, PA, USA. Association for Computational Linguistics. 1 Ziková, M. (2003). Současný český jazyk: Tvoření slov. online. http://www.phil.muni.cz/cest/lide/zikova/CJA009_l.rtf (accessed October 03, 2013).