VIKMA05 Organizace znalostí 6. 5. 2016: Univerzální klasifikační systémy – DDT, MDT, Bliss, Ranganathan; systémy organizace znalostí založené na přirozeném jazyce (P10) FF MU, jaro 2016 Mgr. Josef Schwarz 126172@mail.muni.cz Osnova ¢Praktická část ¢Teoretická část lUniverzální klasifikační systémy •DDT, MDT, Bliss, Ranganathan lSystémy organizace znalostí založené na přirozeném jazyce •klíčová slova, unitermy, předmětová hesla, tezaury ¢Zadání 10. dílčího kroku DA, část a) a b) ¢Praktická část (9. krok DA – ontologie) Teoretická část Univerzální klasifikační systémy ¢ Bibliografické třídění (Bliss) Základní charakteristika lHenry Evelyn Bliss (1870-1955) l1. vyd. 1935 lÚplné vydání 1940-1953 lZkrácená verze 1967 lPoužívá se hlavně na území Commonwealthu ¢ Bibliografické třídění (Bliss) Základní principy lKolokace (Collocation) •Propojování souvisejících tříd lSoulad (Consensus) •Řád přírody (Order of Nature) •Řád (přírodních) věd lStupňování (Gradation) •Komplexnost věd •Subordinace •Koordinace ¢ Bibliografické třídění (Bliss) Základní principy lAdaptabilita (Adaptibility) •Zohlednění relativity poznání a třídění lNotace (Notation) •Hlavně písmena A-Z, dále a-z, 1-9 •Čárka = fazetový indikátor, pomlčka spojuje témata z různých tematických oblastí •Složené notace •Syntéze notace •Omezená délka notace •Hlavní tabulky ¢ Bibliografické třídění (Bliss) Základní kategorie lFilozofie, logika, matematika lPřírodní vědy •Fyzika •Chemie •Astronomie •Země lBiologické vědy •Botanika •Zoologie •Člověk: Vědy o člověku •Fyzická antropologie •Sociální antropologie • Sociální vědy • Umění • Bibliografické třídění (Bliss) Základní kategorie • •Ukázka Dvojtečkové třídění Základní charakteristiky lShiyali Ramamrita Ranganathan (1892-1972) lPrvní vyd. 1933 (návrh 1924) l7. vyd. 1987 lVerze 1: 1933-1950 (striktní fazetace, pouze dvojtečky) lVerze 2: 1950-1963 (analyticko-syntetický přístup, PMEST) lVerze 3: 1963-1987 (komplexní systém) Dvojtečkové třídění Základní principy lTři základní úrovně •Sféra idejí (idea plane) •Rovina jazyka (language plane) •Notační sféra (notational plane) lFokus •Komplexní termín ve všech třech úrovních lIzolát •Jeden z dílčích projevů fokusu • l Dvojtečkové třídění Základní principy lObecná formule PMEST •Osobnost (Personality), indikátor (,) •Hmota (Matter), indikátor (;) •Energie (Energy), indikátor (:) •Prostor (Space), indikátor (.) •Čas (Time), indikátor (‘) • •Určuje pořadí fazet při analýze a syntéze lSpecifické formule pro každou třídu • l Dvojtečkové třídění Základní principy lSpecifické skupiny izolátů •Časové izoláty (time isolates) •Izoláty místa (space isolates) •Jazykové izoláty (language isolates) •Obecné izoláty (common isolates) l Dvojtečkové třídění Základní principy lSpecifické skupiny izolátů •Příklady izoláty času: izoláty místa: izoláty jazyka: A Před 9999 BC 42 Japonsko 12 románské A3 Druhohory 421 Honšů 121 italština M 1800-1899 AD 19A podle orientace 128 keltština W 2700-2799 AD 19B východ (sv. strana) 15 sanskrt e soumrak 14 ostrov 152 hindština Dvojtečkové třídění Základní principy lSpecifické skupiny izolátů •Obecné izoláty - příklad izolát aplikovatelný před fasetou místa: izolát aplikovatelný po fasetě osobnosti a bibliografie b profese f atlas e vzdělání n seriál e4 vyšší vzdělání w biografie f2 pokus, experiment Dvojtečkové třídění Základní principy lPostuláty •Postulát základních kategorií •Postulát základní fazety •Postulát izolátu •Postulát řad projevu pro energii •…atd. lPrincipy fazetové sekvence •Jsou podřízeny postulátům Dvojtečkové třídění Základní principy lVztahy •Fázový vztah (mezi dvěma třídami) •Intrafazetový vztah (mezi dvěma izoláty v rámci jedné fazety) •Vztah mezi dvěma izoláty (vztah uvnitř řetězce) Dvojtečkové třídění Základní principy lVztahy vztah uvnitř řetězce (mezi po sobě jdoucími izoláty) intrafasetový vztah fázový vztah typ vztahu t j a obecný u k b zaujatost v m c srovnání w n d rozdíl y r g vliv Dvojtečkové třídění Základní principy lVztahy •Příklad Q60r4 vliv buddhismu na křesťanství O111,2M560rJ64 vliv Shakespeara na J.B. Shawa S0bL psychologie pro lékaře C0aG vztah mezi fyzikou a biologii C53;30bL82;47:7 spektrum rentgenového paprsku v ortopedické chirurgii Y320w5 rozdíl mezi lidmi na vesnici a ve městě Dvojtečkové třídění Základní kategorie lUkázka l Literatura ¢Všechny systémy: lFOS96, Part III. ¢Bliss lMILLS, Jack. Bibliographic Classification First Edition. In BATES, Marcia J., ed. a MAACK, Mary Niles, ed. Encyclopedia of library and information sciences. 3rd ed. Boca Raton: CRC Press, 2010, 1. sv., s. 642-649 lBROUHTON, Vanda. Bliss Bibliographic Classification Second Edition. In BATES, Marcia J., ed. a MAACK, Mary Niles, ed. Encyclopedia of library and information sciences. 3rd ed. Boca Raton: CRC Press, 2010, 1. sv., s. 650-659 ¢Ranganathan: lŠkopík, Pavel: Život a dílo S. R. Ranganathan. Ikaros, 2004, č. 10, 11, 12, dostupné z: http://www.ikaros.cz/node/1788, http://www.ikaros.cz/node/1809, http://www.ikaros.cz/node/1819 Systémy organizace znalostí založené na přirozeném jazyce ¢ Vybrané otázky ¢Zdroj/Původce ¢Účel ¢Otázky struktury a morfologie lPrekoordinace / postkoordinace lInverze l Klíčová slova ¢Původce lAutor textu •KS z názvu •přidaná KS •Tagování (folksonomie) • Tagová mračna lProgram lInformační profesionál • • l l Klíčová slova ¢Výhody lOtevřenost lUživatelská srozumitelnost ¢Nevýhody lNeřízenost lNestrukturovanost • • l l Předmětová hesla ¢Definice l„Prekoordinovaný selekční informační jazyk používaný pro strukturní zpracování dokumentů nebo dat pomocí abecedně uspořádaných termínů nebo jejich kombinací s cílem umožnit předmětový přístup. Jeho lexikum představuje heslář (příp. pouze předmětový katalog), tj. řízený soubor lexikálních jednotek vybraných z přirozeného jazyka a užívaných k vyjádření témat dokumentů. Lexikální jednotkou je předmětové heslo.“ (TDKIV) ¢Základní charakteristiky „klasického“ předmětového hesla lStrukturované (prekoordinované) lexikální jednotky lInverze sousloví l(Částečně) řízený slovník Předmětová hesla ¢Příklady: lmalotraktory - charakteristiky technické - malovýroba zemědělská – studie (NKP) lřízení vnitropodnikové - chozraščot - metody - podniky socialistické (NKP) lzabezpečení počítačových sítí + počítačová kriminalita + internet (NKP) lVnitropodnikové řízení – hospodárnost + Hospodárnost – vnitropodnikové řízení (MZK) lpodniky + podnikový management (JVK ČB) lprůmyslové podniky + vnitropodnikový chozrasčot (MVKO) l Unitermy ¢Uniterm = „nejmenší významový prvek selekčního jazyka použitý k vyjádření specifického pojmu v rámci systému koordinovaného indexování“ (ČSN ISO 5127-6/3.4.2-10) ¢První verze: 1951 (Mortimer Taube) (jednoslovné lexikální jednotky, žádné vztahy) ¢Rozšířená verze: 1955 ¢Konečná verze: přelom 50. a 60. let (částečně řízený slovník, gramatika, prekoordinace) ¢Důvody vzniku: překonání omezení MDT a PH Unitermy ¢Výhody lPrincip postkoordinace lUživatelská přívětivost (ve srovnání s MDT a PH) ¢Nevýhody lNeřízený slovník lSyntaktický rozklad lNestrukturovanost ¢ Tezaury ¢Definice l„ Řízený a měnitelný slovník deskriptorového selekčního jazyka uspořádaný tak, že explicitně zachycuje apriorní (paradigmatické) vztahy mezi lexikálními jednotkami. Podle jazykového zaměření se rozlišuje jednojazyčný a vícejazyčný tezaurus, podle šíře tematického zaměření speciální, polytematický a univerzální tezaurus, podle struktury fasetový a tematický tezaurus, podle funkce tradiční, indexační a vyhledávací tezaurus. Dále se vyčleňuje cílový a zdrojový tezaurus.“ Tezaury ¢Základní charakteristika ¢Výhody X nevýhody