VIKMA05 Organizace znalostí 15. 4. 2016: Formální struktura dokumentu, reprezentace dokumentu (P7) FF MU, jaro 2016 Mgr. Josef Schwarz 126172@mail.muni.cz Osnova ¢Přehled (minulých a budoucích) témat ¢Praktická část ¢Teoretická část lSGML lprávní texty – struktura ¢Zadání 7. dílčího kroku DA PŘEHLED TÉMAT ¢ Přehled (minulých) témat ¢Témata ¢Úvod ¢Přístupy ke KO, doménová analýza ¢Ontologie, epistemologie, teleologie (pojem, metafora) ¢Kategorie, kategorizace, klasifikace (tradiční vs kognitivistický přístup: prototypy, bázové kategorie) ¢Termíny a terminologie ¢Notace a notační systém ¢ ¢Úkoly ¢ ¢Volba domény, zdroje ¢ ¢Metafory ¢ ¢Prototypy a bázové kategorie ¢ ¢ ¢Reprezentace pojmu ¢Návrh notačního systému ¢ ¢ Přehled (budoucích) témat ¢Formální struktura dokumentu, reprezentace dokumentu ¢Procesy organizace znalostí ¢Ontologie ¢Univerzální klasifikační systémy ¢Systémy založené na přirozeném jazyce ¢Reprezentace a vizualizace znalostí ¢Závěrečná hodina - test Praktická část DA krok č. 6 • STRUKTURA DOKUMENTU ¢ Formální struktura dokumentu ¢Tradiční lObsah •Příklad1, příklad2 ¢Elektronická lSGML (ISO 8879:1986) •Obecná struktura dokumentu a další atributy •Odvozené jazyky: např. HTML, XML •Pro základní informace o SGML a jeho struktuře viz web W3.org SGML – příklad 1 ¢PhDr. Rostislav Kaprál ¢Dělnická 356/5 ¢280 02 Kolín II SGML – příklad 1 ¢ lPhDr. RostislavKaprálDělnická <číslo_popisné>356/<číslo_orientační>5280 02 Kolín II l ¢ SGML – příklad 1 ¢ lPhDr. RostislavKaprálDělnická <číslo_popisné>356/<číslo_orientační>5280 02 Kolín II l ¢ SGML – příklad 2 ¢Není známo, kdo přesně radil voličům Úsvitu přímé demokracie Tomia Okamury, nicméně stalo se, že Úsvit získal dost hlasů na to, aby se dostal do parlamentu, a tudíž aby dostal nárok na příspěvek ze státní kasy. To už nezjistíme, kdo radil voličům. Nicméně některé záhady objasněny byly. Ten, kdo radí Úsvitu, je Tomio Okamura a bere za to mega měsíčně. Jeho hnutí má členů míň, než měl Ježíš učedníků. Jakpak se jim asi četl Reflex, kde se o tom píše? Asi si řekli to, co si asi řeknou voliči Tomia Okamury. Reflex je hnusný štvavý plátek, který pomlouvá a lže. Vždyť přece Tomio Okamura je ztělesnění té pravé demokracie, má to i v názvu svého podniku. Jak by mohl udělat něco tak hnusného? Možná, že se v příští etapě Okamura zachová podobně jako Zeman. Ten nechal své jméno odstranit z názvu své politické strany. Okamura by mohl nechat z názvu odstranit slovo demokracie. V obou případech to budí smích. ¢Zdroj: Neviditelný pes, 4. 4. 2014 ¢ SGML – příklad 2 ¢ Není známo, kdo přesně radil voličům Úsvitu přímé demokracie Tomia Okamury , nicméně stalo se, že Úsvit získal dost hlasů na to, aby se dostal do parlamentu, a tudíž aby dostal nárok na příspěvek ze státní kasy . To už nezjistíme, kdo radil voličům. Nicméně některé záhady objasněny byly. Ten, kdo radí Úsvitu , je Tomio Okamura a bere za to mega měsíčně. Jeho hnutí má členů míň, než měl Ježíš učedníků. Jakpak se jim asi četl Reflex, kde se o tom píše? Asi si řekli to, co si asi řeknou voliči Tomia Okamury . Reflex je hnusný štvavý plátek, který pomlouvá a lže. Vždyť přece Tomio Okamura je ztělesnění té pravé demokracie, má to i v názvu svého podniku. Jak by mohl udělat něco tak hnusného? Možná, že se v příští etapě Okamura zachová podobně jako Zeman . Ten nechal své jméno odstranit z názvu své politické strany. Okamura by mohl nechat z názvu odstranit slovo demokracie. V obou případech to budí smích. ¢ Analýza právních textů Kořenský – Cvrček – Novák: Juristická a lingvistická analýza právních textů. Praha: Academia, 1999 ¢A. Typologie dokumentů l1. podle druhu •právní předpisy •soudní rozhodnutí •individuální rozhodnutí a normativní instrukce státní správy •důvodové zprávy •návrhy a projekty zákonů a dalších předpisů •záznamy parlamentních debat •výsledky připomínkových řízení •komentáře •učebnice, skripta a odborné monografie •odborné články •expertizy •přehledy platných právních předpis ¢ Analýza právních textů ¢A. Typologie dokumentů l2. Podle formy publikace •oficiální sbírky •neoficiální sbírky •knihy •odborné časopisy •jednotlivé dokumenty uložené v archivech institucí l3. Podle vztahu k původnímu znění •původní •upravené •obohacené •metadokumenty nebo adresy ¢ Analýza právních textů ¢B. Struktura položek v základním slovníku (LEMMA) l1. Základní slovní tvar l2. Typ •Speciální znaky •Číslice, římské číslice •Zkratky s tečkou (Sb.), zkratky bez tečky (ČR) •Pomocné znaky (§) •Slovenská slova •Cizí slova (ne chemické vzorce, ne názvy nemocí apod.) l3. Slovní druh l4. Rod l5. Životnost l6. Příslušnost ke kmenové sémantické skupině (daně, zdanění, danit) l7. Typy právních významů l8. Četnost l9. Číslo základního slovního tvaru l ¢ Analýza právních textů ¢C. Sémantika morfologicko-syntagmatických typů lPříklad – škoda •A – S: případná / věcná / hrozící •S – S: velkého rozsahu / značného rozsahu •S – praep S: na zdraví / na majetku / na pozemku •S – VF: vznikla / přesahuje / hrozí •VF – S: zavinil / způsobil / zabránil (škodu/škodě) •VF – praep S: dochází (ke škodám) / odpovídá (za škodu) •S – (praep) S: zjišťování / náhrada / úhrada (škody) / odpovědnost (za škodu) •INF – S: zabránit (škodě) / nahradit (škodu) •INF – praep S: odpovídat (za škodu) l lSémantické hodnocení vazeb: •Ad A - S •Věcná povaha škody •Vyjádření původu a příčiny škody •Kvantitativní hodnocení škody •Společenské hodnocení škody lModel morfologicko-syntagmatické struktury ¢ Analýza právních textů ¢D. Výrazová segmentace textu ¢E. Vztah mezi formální větou a textovou strukturací ¢F. Výskyt vyhledávaných syntagmat v segmentech textu ¢G. Distinktivní vlastnosti spojovacích prostředků (spojky a obdobné výrazy) ¢H. Morfologie, gramatika, sémantika právních textů ¢I. Struktura právních textů a jejich formální vztahy ¢J. Využití: l1. Tvorba právních předpisů •Formulace koncepčního záměru •Koncepce konkrétní legislativní úpravy •Zjišťování kontextových souvislostí •Právnělingvistická podpora legislativní činnosti •Vytváření úplných znění právních předpisů •Zpracování důvodových zpráv •Příprava legislativních výzkumů l2. Tvorba právní terminologie l3. Tvorba oborových klasifikací a tezaurů l4. Vyhledávání v oborových databázích l l ¢ ¢ ¢