P114_6 ‹#› P114_6 1 P114 Sémantika a její role zaostření pozornosti 6 P114_6 ‹#› P114_6 2 Témata •Sémantika •informace •logické vyplývání •informační schopnost •zaostření pozornosti •sortalizace •báze sort •definice jednoduchých typů P114_6 ‹#› P114_6 3 sémantika •vše o čem hovoří matematická logika i celá matematika, lze vybudovat pohodlně nad B = {Bool, Univ, Tim} ... •... ale sémantika sdělení, používaných v přirozeném jazyce při popisu reálného světa, chybí •sémantiku lze zahrnout do teorie podporující naše komunikace právě nad epistémickou bází EB = {Bool, Univ, Tim, Wrd} •je to tzv. sémantika možných světů •ta je základem pro náš přístup k DM ... P114_6 ‹#› P114_6 4 sémantika a DM •běžný názor: sémantiku nelze rozumně zachytit, proto se snažíme použít takové syntaktické prostředky, abychom na základě nich mohli alespoň vytušit sémantiku skrytou za našimi modely autoři UML, specialisti na DB, DWH, ... •proti tomu stavíme Datové Modelování metodou HIT a základní tezi: „DM bez sémantiky je jako láska bez soulože ...“ P114_6 ‹#› P114_6 5 HIT-atribut: záznam sémantiky DOD ZBOZI ODB kterým daný dodává dané OdbDodZbozi 0,M .. 0,M propozice, které generuje, nesou adekvátní informaci, jež nás zajímá - kvůli které vyrábíme IS P114_6 ‹#› P114_6 6 Proč vyrábíme IS: •chceme odpovědi na otázky typu: –kdo dodává jaké zboží do kterého obchodního řetězce? –komu co dodává daný dodavatel? –komu daný dodavatel dodává dané zboží? –... •Následující (1) a (2) jsou příklady propozic „generovaných“ atributem OdbDodZbozi: –(1) Kostelecké uzeniny dodávají jemné párky do prodejen Tesco a Makro. –(2) Dodavatel (MPK) dodává výrobek (Selský salám) do prodejen odběratele (Delvita). •... jsou to odpovědi na uvedené otázky P114_6 ‹#› P114_6 7 diagram bez sémantiky: DOD ZBOZI ODB OdbDodZbozi 0,M .. 0,M generuje propozice tvaru: odběratelé (libovolným způsobem, resp. z libovolného důvodu) přiřazení ke dvojici dodavatel a zboží to není dostatečný důvod pro tvorbu IS !!! P114_6 ‹#› P114_6 8 sémantika a informace Plat ? Vitální kapacita plic ? alimenty ? P114_6 ‹#› P114_6 9 data, propozice, sémantika •propozice explikují význam dat: •zaměstnanec Novák platí alimenty 3 600 Kč •zaměstnanec Horák má vitální kapacitu plic 4 200 •Tyto propozice dávají informaci, neboť snižují stupeň neurčitosti poznání reálného světa •R. Carnap: informace obsažená v dané propozici je měřitelná počtem možných světů, které jsou touto propozicí vyloučeny (ve kterých nabývá pravdivostní hodnotu N) P114_6 ‹#› P114_6 10 Co je to informace - základní přístupy •Carnapovská informace: množství informace v propozici obsažené je dáno počtem možných světů pravdivostí dané propozice vyloučených •Shanonovská informace: informace je míra snížení entropie (neurčitosti) •čím více možných světů vyloučíme, tím více snížíme neurčitost P114_6 ‹#› P114_6 11 Carnapovská informace •Nechť P je množina propozic a R1 Í Tim je časový interval, q je nějaká propozice: Wrd(P,R1) = {wÎWrd | [[qw]t]=Pravda Ù q ÎP Ù t ÎR1} = {wÎWrd | "qÎP "tÎR1 ([[qw]t]=Pravda)} Wrd(P,R1) se nazývá přípustný logický prostor množiny propozic P vzhledem k časovému intervalu R1. •Čím je Wrd(P,R1) menší, tím více informace je v Carnapově smyslu podáno. •Wrd(P,R1) = Wrd ... P nedává žádnou informaci P114_6 ‹#› P114_6 12 Carnapovská informace - pokračování •Je-li R1 = Tim, hovoříme o přípustném logickém prostoru vzhledem k množině propozic P a značíme Wrd(P). •Jestliže Wrd(P) ¹ Wrd, pak Wrd(P) je vlastní podmnožina Wrd, a říkáme, že množina propozic P dává (poskytuje) informaci. •Jestliže Wrd(P,R1) ¹ Wrd, pak Wrd(P,R1) je vlastní podmnožina Wrd, a říkáme, že množina propozic P dává (poskytuje) informaci v časovém intervalu R1. P114_6 ‹#› P114_6 13 logické vyplývání P114_6 ‹#› P114_6 14 uspořádání podle množství podávané informace P114_6 ‹#› P114_6 15 Funkce Cn - důsledek •P je množina propozic (((Wrd, Tim) ® Bool) ® Bool) - objekt označme ((Wrd, Tim) ® Bool) = Pr, pak P/(Pr ® Bool) •Cn / (Pr ® Bool) ® (Pr ® Bool) definovaná Cn = lp [È lq(q Ði p)] kde p, q :: (Pr ® Bool). •Cn se nazývá funkce „důsledek“ a dává na každé množině propozic P množinu všech možných jejich logických důsledků P114_6 ‹#› P114_6 16 Tvrzení o Cn •Tvrzení 1: Operace (funkce) Cn je idempotentní: [Cn[Cn P]] = [Cn P] •Proveďte důkaz! •Tvrzení 2: Q Ði P právě když [Cn Q] Í [Cn P] •Proveďte důkaz! •Důsledek: Množinu tříd propozic {[Cn P] | P je libovolná množina propozic} lze částečně uspořádat. •Proveďte důkaz! P114_6 ‹#› P114_6 17 ... více o Cn •Pi třída propozic, i = 1,..,n •Pi Í [Cn Pi] •„obrácená trojúhelníková nerovnost“: Èi=1n [Cn Pi] Í [Cn (Èi=1n Pi)] Proveďte důkaz! •... abychom věděli co to znamená, když říkáme „... to je přece logické, když ...“ P114_6 ‹#› P114_6 18 Informační schopnost IS •CO se má udělat = specifikace provedení –jaké informace bude IS poskytovat = vymezení třídy dotazů nad daným IS zodpověditelných •jak zadat třídu dotazů, které mají být daným IS zodpověditelné •vytvořit seznam všech takových dotazů? NE! •určit „bázi“ prostoru dotazů, které mají být zodpověditelné •Najít konstrukce, které generují propozice dávající právě požadované odpovědi • P114_6 ‹#› P114_6 19 konstrukce generující množiny propozic ZAM PLAT daného PlatZam • typ hodnoty funkce • typ argumentů • typ samotné funkce • role argumentů • sémantika přiřazení P114_6 ‹#› P114_6 20 •W::Wrd, t::Tim, z::ZAM, x::PLAT •lwltlzlx([[[PlatZam(w)]t]z]=x) (x je ale jediné - nutno použít singularizátor) •lwltlzix([[[PlatZam(w)]t]z]=x) (k) • •Konstrukce (k) generuje všechny možné propozice tvaru : „Zaměstnanec Novák má plat 15 000,-Kč“ „Zaměstnanec Mach má plat 17 500,-Kč“ .... „Existuje zaměstnanec s platem nad 16 000,-Kč.“ P114_6 ‹#› P114_6 21 ? jaké propozice generuje atribut: DOD ZBOZI ODB kterým daný dodává dané OdbDodZbozi 0,M .. 0,M P114_6 ‹#› P114_6 22 ? jaké propozice generuje atribut: MNOZSTVI ZBOZI DOD ODB MnoZboDodOdbCas daného druhu dodané daným danému 0,M .. 0,1 CAS v daném CAS = (DATUM, HODINA) tzv. n-ticový popisný typ P114_6 ‹#› P114_6 23 Bázové propozice generované atributem •A je atribut, A / ((Wrd, Tim) ® (T ® S)) nebo A / ((Wrd, Tim) ® (T ® (S ® Bool))) T, S jsou entity nebo deskripce, resp. jejich n-tice -- viz přednáška 3 •Množina bázových propozic generovaná atributem A ve stavu světa W /(Wrd, Tim) je definována takto: BP(A)W = lp ($x ($y ([[A W] x] = y Ù Ù p = (lw [[A w] x] = y)))), kde p::Pr, w::(Wrd, Tim), x::T, y::S nebo y::(S ® Bool) P114_6 ‹#› P114_6 24 Informační kapacita atributu •Informační kapacitou atributu A ve stavu světa W nazýváme množinu všech propozic generovaných atributem A ve W, tj. množinu P(A)W všech logických důsledků bázových propozic generovaných atributem A ve W: P(A)W = [Cn BP(A)W] •Informační kapacita množiny atributů {A1,...,An} ve W je dána množinou všech logických důsledků propozic generovaných atributy Ai: P(A1,...,An)W = [Cn Èi=1n P(Ai)W] P114_6 ‹#› P114_6 25 Důsledky •Informační kapacity (množin) atributů lze částečně uspořádat. -- proveďte důkaz! •... jsme schopni porovnávat informační schopnosti databází a IS P114_6 ‹#› P114_6 26 ... zpět k propozicím generovaným PlatZam: •Zaměstnanec Novák má plat 15 000,-Kč./ ((BoolTim)Wrd) (propozice) •Zaměstnanec / (((BoolUniv)Tim)Wrd) (vlastnost individuí) •Novák / Univ (jméno individua jako nálepka) •má plat / (((TimUniv)Tim)Wrd) (fce z individuí do reálných čísel v závislosti na možném světě a čase) •Propozice říká –1) že Novák je zaměstnanec a –2) že má plat a –3) že ten plat je 15 000,- •... stavět konstrukce přímo nad epistémickou bází je pragmaticky neúnosné ! • P114_6 ‹#› P114_6 27 „Zaostření“ pozornosti •proces modelování (zájmové části) světa se podobá zaostřování při fotografování: před našim objektivem je vše, my ale snímkem zobrazíme jasně pouze to, na co jsme zaostřili •To znamená: –nad EB vybereme určité typy a na ty zaostříme pozornost –modely pak obsahují pouze konstrukce těchto „zaostřených“ typů •Zaostřené typy jsou: funkce tzv. jednoduchých typů (viz přednáška 3) a funkce definující tzv. sorty (viz dále) P114_6 ‹#› P114_6 28 příklady sort P114_6 ‹#› P114_6 29 definice deskriptivní sorty P114_6 ‹#› P114_6 30 definice entitní sorty •Nechť R Í Tim je rozumné časové okolí (bylo-je-bude) přítomnosti. Nechť rÎR je časový okamžik a wa je aktuální svět. •Nechť T1, …, Tm jsou ne nutně různé typy nad EB. •Nechť Pi / (((BoolTi)Tim)Wrd) jsou konkrétní vlastnosti přisouditelné Ti-objektům. •Označme C(Pi,r,wa) třídu Ti-objektů generovanou vlastností Pi v daném časovém okamžiku r a aktuálním světě wa. •Potom: •ÈrÎR C(Pi,r,wa) je entitní sorta definovaná vlastností Pi. •Èi=1..m ÈrÎR C(Pi,r,wa) je entitní sorta definovaná disjunkcí vlastností Pi, i=1,...,m. •Çi=1..m ÈrÎR C(Pi,r,wa) je entitní sorta definovaná konjunkcí vlastností Pi, i=1,...,m. • P114_6 ‹#› P114_6 31 sortalizace •výběr vhodných entitních a deskriptivních sort pro popis zájmového výseku reality •definice entitních sort •popis hodnot deskriptivních sort •sortalizace je to co jiní autoři nazývají klasifikací, tj. výběr základních tříd, nad nimiž budeme operovat : jak při modelování, tak při práci s databázovým systémem • •Uvědomme si, že entitní sorty jsou extenze! •…stejně jako prvky každé báze P114_6 ‹#› P114_6 32 Jednoduché typy, HIT-atributy •HIT-atributy (funkční závislosti) jsou objekty tzv. jednoduchých typů (a) ((((S1,..., Sm)(T1,..., Tn))Tim)Wrd) (b) ((((Bool(S1,..., Sm))(T1,...,Tn))Tim)Wrd) pokud platí, že alespoň jedna ze sort Si nebo Ti je entitní sorta. •číslo m+n se nazývá složitost HIT-atributu •HIT-atributy konstruujeme nad tzv. bází sort BS. Sorty viz definice entitních a deskriptivních sort. BS je určena tak, že pragmaticky odpovídá našemu konkrétnímu zájmu. P114_6 ‹#› P114_6 33 vztah sort k modelování •entitní a deskriptivní sorty jsou objekty zájmu, o kterých hovoří uživatelé IS, a ze kterých bereme hodnoty funkcí a jejich argumentů při popisu výseku reálného světa •jejich podmnožiny jsou definiční obory a obory hodnot funkcí uložených formou tabulek v databázích •v modelech nás zajímají konstrukce těch typů (tj. funkcí nad EB), které „v rozumném časovém okolí přítomnosti“ a v aktuálním světě poskytují tyto sorty (pro případ entitních sort), resp. poskytují tyto sorty nezávisle na stavu světa (pro případ deskriptivních sort) P114_6 ‹#› P114_6 34 Příklady k procvičení P114_6 ‹#› P114_6 35 Porovnejte informační kapacitu: které bázové propozice generují? které propozice generují? ZBOZI DOD dodávající dané DodZbozi ZBOZI DOD dodávající dané DodZbozi P114_6 ‹#› P114_6 36 které bázové propozice generuje? které propozice generuje? DOD ZBOZI ODB kterým daný dodává dané OdbDodZbozi 0,M .. 0,M P114_6 ‹#› P114_6 37 které bázové propozice generuje? které propozice generuje? MNOZSTVI ZBOZI DOD ODB MnoZboDodOdb daného druhu dodané daným danému 0,M .. 0,1 P114_6 ‹#› P114_6 38 které bázové propozice generuje? které propozice generuje? MNOZSTVI ZBOZI DOD ODB MnoZboDodOdbCas daného druhu dodané daným danému 0,M .. 0,1 CAS v daném Napište definice v atributu uvedených sort !