Zkoumání kontextu Formalismy Domény Významové potenciály PLIN021 Sémantická analýza v praxi OP VK Mezi bohemistikou a informatikou www. p roj e kt- i n o va. cz Zuzana Nevěřilová xpopelkOfi.muni.cz Centrum zpracování přirozeného jazyka, B203 Fakulta informatiky, Masarykova univerzita 23. dubna 2012 Zkoumání kontextu Formalismy Domény Významové potenciály Zkoumání kontextu Formalismy Domény Významové potenciály Zkoumání kontextu Formalismy Domény Významové potenciály Kontext The context of a piece of language (...) is its surrounding environment. But this can include as little as the articulatory movements immediately before and after it, or as much as the whole universe, with its past and future. (Werth, 1999 in [Requejo, 2007]) PLIN021 Sémantická analýza v praxi n CN '—Zkoumání kontextu ■Ňj-o i (Wuth, l«í Ír. /RarjuBjI 2007]) CN 1—Kontext O CN Kontext už jsme zmiňovali. Bohužel jsme jej zatím přesně nevymezili. Proč? Protože je to těžké. Zdá se, že každé slovo má v promluvě jinou váhu. Podobně i „váha" kontextu nijak zvlášť nesouvisí s jeho „velikostí'. Zkoumání kontextu Formalismy Domény Významové potenciály Kontext v kontextu kognitivní lingvistiky • klasický přístup = začneme zkoumat kontext, teprve až selžou všechny ostatní pokusy • „nový" přístup = kontext určuje význam, začněme tedy kontextem... • existence kontextu je důvod, proč nelze zcela oddělit sémantiku od pragmatiky [Requejo, 2007] • porozumění promluvě závisí na jazykové znalosti, ale také na znalosti světa (Bransford et Johnson, 1972) PLIN021 Sémantická analýza v praxi cn '—Zkoumání kontextu .^ŕZľtl,.*,. O I antiku =d prútiky [R«u.,ai^07] ^ cŇ 1—Kontext v kontextu kognitivní lingvistiky ,..i.«,«.(B,,.»d.j.;2.,„„ 3 cn Klasický přístup je silně ovlivněný Chomského generativní gramatikou. Ch. zkoumal různé jazykové roviny odděleně. Zkoumání kontextu Formalismy Domény Významové potenciály Kontext: rozdělení • jazykový • situační (objektivní i subjektivní) PLIN021 Sémantická analýza v praxi cn '—Zkoumání kontextu ° I cn —Kontext: rozdělení i—i o cn Jazykový kontext: co bylo/bude řečeno, odkazování v promluvě (anafora, antecedent, katafora). Situační kontext: kdo/co se vyskytuje v místě a čase promluvy, např. kdo je já, kde je tady? Subjektivní jazykový kontext je hůř postižitelný než objektivní, jsou to naše nálady, ale i temperament. Příklad: ta samá zpráva u nás může vyvolat rozdílnou reakci podle našeho vnitřního rozpoložení. Ano, je řeč o emocích. Vrátíme se k nim v závěru kurzu. Zkoumání kontextu Formalismy Domény Významové potenciály Kontext a kognitivní lingvistika • slova nenesou významy, naopak slova jsou instrukce k výstavbě významu jazykového výrazu • význam promluvy není funkcí významu jednotlivých částí • víceznačnost je norma • nemá cenu zkoumat menší jednotky (slova, izolované věty) bez znalosti kontextu PLIN021 Sémantická analýza v praxi '—Zkoumání kontextu CN i—I O CN l_ Kontext a kognitivní lingvistika Kognitivní I. nemá na naši problematiku vysloveně revoluční pohled (nic starého neplatí), dívá se spíš „z druhé strany" (to staré platí, ale dosud jsme se dívali ze špatného úhlu). Ona druhá strana vychází z hypotéz 0 naši mysli. Nezajímá nás jen výsledek (jazyková analýza promluvy), ale 1 cesta k němu. Modely k. I. mají (snad) blízko k tomu, jak zpracováváme jazykové vstupy my, lidé. Klasický přístup se studuje déle, a proto má víc a známějších formalismů. Na druhou stranu kognitivním lingvistům je jasné, že bez nějaké formalizace se dál nedostanou. Proto formální modely existují a podíváme se na ně... Zkoumání kontextu Formalismy Domény Významové potenciály Kontext: formalismy a studium • sémantické a asociativní sítě, rámce (Fillmore, 1985), skripty (Abelson), domény (Langacker 1987), mentální prostory (Fauconnier, 1994) • významové potenciály (Hanks) • kontextové vektory PLIN021 Sémantická analýza v praxi cn '—Formalismy ° I cn —Kontext: formalismy a studium O cn 0 sém. sítích, rámcích a skriptech jsme už mluvili. Domény a mentální prostory zmíníme dnes. Jsou to novější formalismy, které se v praxi spíš nepoužívají (možná jen v prototypech). Inspirativní otázka je, jestli s tím nemáme začít. Zkoumání kontextu Formalismy Domény Významové potenciály Kontext: formalismy sémantické a asociativní sítě, rámce (Fillmore, 1985), skripty (Abelson) • zachycení kontextu pomocí relací: isa, has a, located in .. . • typický (mnohdy nezmíněný) kontext • částečně kulturně a geograficky závislé • některé části jsou nezávislé, ale nevíme, které to jsou • jak reagovat na změny stereotypů (např. telefonování)? 0 01 O CN PLIN021 Sémantická analýza v praxi '—Formalismy '—Kontext: formalismy Kulturní závislost rámců či skriptů by byla dobrým tématem BP nebo aspoň referátu. Dalším zajímavým tématem může být rychlost změny stereotypů - zatímco obchod je víceméně stejný jako před 100 lety (snad kromě platebních karet), telefonování se změnilo, telegramy zanikly, sociální sítě se rozmohly ... Zkoumání kontextu Formalismy Domény Významové potenciály Mentální prostory (Fauconnier, 1994) pracují s rámci, ale umožňují zrcadlení Petr si myslí, že Alice šla nakupovat. x nakupovať Zkoumání kontextu Formalismy Domény Významové potenciály Domény (Langacker 1987) What one finds in language depends in large measure on what one expects to find. [Langacker, 1987] Zkoumání kontextu Formalismy Domény Významové potenciály Domény (Langacker 1987) význam je kognitivní jev cognitive grammar - vychází z lingvistiky, ale inspiruje se v kognitivní psychologii a umělé inteligenci 1. sémantika není univerzální, ale jazykově závislá 2. nelze oddělit syntax a sémantiku 3. nelze oddělit syntax a lexikon Zkoumání kontextu Formalismy Domény Významové potenciály Domény (Langacker 1987) Každá jazyková jednotka je v určité míře závislá na kontextu. Kontext, který charakterizuje sémanickou jednotku, nazýváme doména. Základní domény vs. abstraktní domény Koncept NEHET předpokládá existenci konceptu PRST. Koncept PRST předpokládá existenci konceptu RUKA... předpokládá existenci konceptu TĚLO. TĚLO je základní doména, předpokládá sice existenci trojrozměrného prostoru, není tím ale nijak zvláštní. Doménu, která není základní, nazýváme abstraktní. Význam slova odpovídá konfiguraci (umístění) v jedné nebo více doménách. Zkoumání kontextu Formalismy Domény Významové potenciály Domény (Langacker 1987) Domény mají dimenze, např. TEPLOTA je jednorozměrná. Díky dimenzím je možné významy uspořádat. Domény jsou uzavřené (konečný rozsah BAREV, které můžeme rozeznat), nebo otevřené (ČAS). Hodnoty rozměru v doménách mohou být spojité nebo diskrétní, základní jsou většinou spojité, abstraktní jsou někdy diskrétní (RODINNÉ VAZBY). Většina významů je definovaných ve více doménách zároveň: např. BANÁN je definovaný v doménách BARVA, TVAR, JÍDLO, STROM, CHUŤ. Domény (Langacker 1987) PLIN021 Sémantická analýza v praxi KRSÄS cn '—Domény ° I cn —Domény (Langacker 1987) o cn Trochu to připomíná sémantické rysy. Na rozdíl od nich (rys u pojmu bud' je, nebo není přítomen) je však definován rozsah hodnot (např. teplota živého těla). Domény rozhodně stojí za prozkoumání a jsou dobrým námětem pro referát nebo BP. V BP by mohlo být zajímavé např. určit domény slovesným rámcům z VerbaLexu. Zkoumání kontextu Formalismy Domény Významové potenciály Významové potenciály (Hanks) • slovníky pro lidi jsou pro počítače nevyhovující • slovníky kombinované a hierarchické (WordNet) mají lepší výsledky v počítačovém zpracování (Nirenburg 2007) • význam není jedno políčko v „kontrolním seznamu" • významy lze nejlépe interpretovat pomocí pravděpodobnosti, s jakou se užití blíží prototypu (Fillmore) • významy jsou spojeny se vzory (patterns, Hunston a Francis, 2000), konstrukcemi (Goldberg) či „frazémy" (Melčuk), ale i se slovy - korpusová lingvistika dokáže tyto vzory (preference užití) zjistit a studovat • významy vně kontextu neexistují, existují jen významové potenciály, které se kontextem aktivují [Hanks, 2000] Zkoumání kontextu Formalismy Domény Významové potenciály Významové potenciály (Hanks) Corpus Patterns Analysis PATTERN: [[Human]] translate ([[Document]]) (from [[Language 1]]) (into [[Language 2]]) IMPLICATURE: [[Human]] expresses the meaning of [[Document]] in [[Language 1]] in the words and phraseology of [[Language 2]] PLIN021 Sémantická analýza v praxi cn '—Významové potenciály ° I cn —Významové potenciály (Hanks) o cn Patrick Hanks je korpusový lingvista, který v letech 2005-2008 působil na Fl, teď působí na Karlově univerzitě. Jeho přístup je velmi blízký přístupu kognitivní lingvistiky, i když myslím, že k. I. není příliš v jeho oblasti zájmu. Korpusová lingvistika se rozvíjí s tím, jak nám rostou korpusy a také software pro jejich zpracování. Zkoumání kontextu Formalismy Domény Významové potenciály Významové potenciály (Hanks): normy (norm) [Hanks, 2010] • norma = užití slova podle určitého syntagmatického vzoru • slova se užívají jednak v souladu s normou (očekáváním), jednak mluvčí normu porušují • vzory se skládají z užitého slova a z lexikálních množin, se kterými se slovo užívá • lexikální množiny mohou být obrovské, např. [[Human]] • čím menší lexikální množina, tím silnější je její vliv na význam vzoru PLIN021 Sémantická analýza v praxi '—Významové potenciály -Významové potenciály (Hanks): normy (norm) [Hanks, 2010] Konečně se dostáváme k nějakému tvrzení, které se vyjadřuje k velikosti kontextu. Zpočátku to vypadalo, že prostě kontext uchopit nemůžeme (přestože s konkrétní situací se dokážeme vyrovnat). Zkoumání kontextu Formalismy Domény Významové potenciály Významové potenciály (Hanks): porušení normy (exploitation) • kreativní užití jazyka • porušení normy nepřesahuje 10 % případů v korpusu • pokud ano, je to nejspíš dosud neobjevená norma • i porušení normy má jistá pravidla „dvojitá šroubovice" systémů pravidel: pravidla, jak slova používat normálně, a pravidla, jak normu porušit • často studovaným vzorem je valence Zkoumání kontextu Formalismy Domény Významové potenciály Významové potenciály (Hanks): valence ,,,možná bych prodloužila poslední verš... nesedí mi tam nejen vizuálnej že je pnliš krátký Whitesun a stále nedokončeným C-3PO. Cliegg sedí na létajícím kresle, protože mu chybí jedna atraktivní módní přehlídce. Tvůrkyně ošacení seděla na premiére v první radě v atraktivní róbě zablokovali oba směry magistrály. Někteří sedí na schodech k opere. Mávají rudými vlajkami centrem byl zdemolován vůz TV Nova. Jinak zde sedí ještě menší skupina demonstrantů. Jde většinou hráli v sále hospody a hodně Udí zůstalo sedět venku, protože tentokrát počasí přálo, jsem byl naprosto unesena.Jsou perfekní. Sedí jako ulite.Jen dálka ,ale tu jsem za 15 psala, dorazil a věcičky jsou nádherný Vše sedí tak jak má a já jsem moooc spokojená Moc dnes mi s podprsenkami dorazil... Skvěle sedí . Jsem moc spokojená! Budu se těšit zase moc děkuji, těhotenskě rifle jsou super - sedí úplně perfektnělll A taky děkuju za dáreček [[Human | Group of Humans]] sedět [[Location]] [[Garment]] sedět [[Human, dative]] [[Manner]] [[Art]] sedět [[Human, dative]] [[Location]] [[Manner]] Zkoumání kontextu Formalismy Domény Významové potenciály Významové potenciály (Hanks): elipsa ,,,možná bych prodloužila poslední verš... nesedí mi tam nejen vizuálnej že je pnliš krátký Whitesun a stále nedokončeným C-3PO. Cliegg sedí na létajícím kresle, protože mu chybí jedna atraktivní módní přehlídce. Tvůrkyně ošacení seděla na premiére v první radě v atraktivní róbě zablokovali oba směry magistrály. Někteří sedí na schodech k opere. Mávají rudými vlajkami centrem byl zdemolován vůz TV Nova. Jinak zde sedí ještě menší skupina demonstrantů. Jde většinou hráli v sále hospody a hodně Udí zůstalo sedět venku, protože tentokrát počasí přálo, jsem byl naprosto unesena.Jsou perfekní. Sedí jako ulite.Jen dálka ,ale tu jsem za 15 psala, dorazil a věcičky jsou nádherný Vše sedí tak jak má a já jsem moooc spokojená Moc dnes mi s podprsenkami dorazil... Skvěle sedí . Jsem moc spokojená! Budu se těšit zase moc děkuji, těhotenskě rifle jsou super - sedí úplně perfektnělll A taky děkuju za dáreček [[Human | Group of Humans]] sedět [[Location]] [[Garment]] sedět [[Human, dative]] [[Manner]] [[Art]] sedět [[Human, dative]] [[Location]] [[Manner]] Zkoumání kontextu Formalismy Domény Významové potenciály Významové potenciály (Hanks): elipsa Elipsy mají také svá pravidla. Co může být vypuštěno? • podmět • předmět • příslovečné určení Za jakých okolností se může vyskytnout elipsa? Vypuštěno může být jen to, co je zřejmé. Elipsa jako porušení normy? Je to otázka frekvence. PLIN021 Sémantická analýza v praxi '—Významové potenciály '—Významové potenciály (Hanks): elipsa Elipsa jako porušení normy: svíčková na smetaně je dnes nepochybně normou, původně jde o elipsu. Existence a pravidla elipsy jsou dobrý námět pro referát nebo BP. Zkoumání kontextu Formalismy Domény Významové potenciály □I Hanks, P. (2000). Do word meanings exist? Computers and the Humanities, 34:205-215. 10.1023/A:1002471322828. § Hanks, P. (2010). Elliptical arguments: a problem in relating meaning to use. In Paquot, M. and Granger, S., editors, eLexicography in the 21st century : New challenges, new applications. Proceedings ofeLex2009, Louvain-la-Neuve, 22-24 October 2009, volume 7 of Cahiers du Cental, pages 109-124, Louvain-la-Neuve, Belgium. Universitě Catholique de Louvain, Presses universita i res de Louvain. 1 Langacker, R. W. (1987). Foundations of cognitive grammar: Theoretical Prerequisites. Stanford University Press, Stanford, CA. Vol 1, 1987(Hardcover), 1999(Paperback). kontextu Formalismy Domény Významové potenciály Requejo, M. D. P. (2007). The role of context in word meaning construction: A case study. International Journal of English Studies, 7.