Úvod do věcných SJ Předmět: Selekční jazyky 1. 10. 2010 Přednášející: Mgr. Silvie Kořínková Presová http://kisk.phil.muni.cz/mgr-silvie-korinkova-presova-dis Termíny a témata přednášek Kombinovaní studenti 1. 10. Úvod do problematiky selekčních jazyků (SJ) 22. 10. Systematické SJ, Mezinárodní desetinné třídění 12. 11. Předmětové SJ, věcné autority ČR 3. 12. Indexování 17. 12. Věcné vyhledávání pomocí selekčních jazyků Místo a čas konání: učebna A:11, 13:20 - 14:55 Termíny a témata přednášek Prezenční studenti 8. 10. Systematické SJ 15. 10. Mezinárodní desetinné třídění 29. 10. Předmětové SJ, 5. 11. Věcné autority ČR 19. 11. Indexování 26. 11. Indexování 10. 12 Věcné vyhledávání pomocí selekčních jazyků Místo a čas konání: učebna A:11, 13:20 - 14:55 Ukončení předmětu èzpůsob ukončení– písemná zkouška – test èuzavřené otázky, počet otázek – 21 èklasifikační stupnice A 21-20 B 19-18 C 17-16 D 15-14 E 13-12 F 11 - 0 Selekční jazyk lSelekční jazyk (SJ) (výklad z TDKIV) - Umělý informační jazyk používaný k vyjádření identifikačních nebo obsahových selekčních údajů za účelem pořádání, ukládání a vyhledávání dokumentů. lDoplnění (Kovář, 1984, s. 14) - Selekční jazyk - Soustava znaků přirozeného, formalizovaného nebo umělého jazyka vytvořená pro účely pořádání, ukládání, vyhledávání, popř. i distribuce jak dokumentů samých, tak záznamů o nich. Selekční jazyk Identifikační SJ (výklad z TDKIV) - Selekční informační jazyk sloužící pro popis formálních charakteristik dokumentu používaný v bibliografickém popisu a jmenné katalogizaci. Více viz Kovář,1984, 9-18 např. jmenné autority NK ČR, nakladatelské údaje Věcný SJ (výklad z TDKIV) - Selekční jazyk používaný pro zpracování dokumentů pomocí věcných údajů s cílem umožnit vyhledávání dokumentů podle obsahu. lang. ekv. - indexing language, subject retrieval language Příklady dalších výkladů věcného SJ lAn indexing language is a "language" used for subject classification or indexing of documents. (Not used about systems for descriptive cataloging or indexing). (Hjørland, 2006) lVěcný SJ - Selekční jazyk používaný při realizaci procesu věcného pořádání informací jako jeho výrazový a vyjadřovací prostředek. (Kovář, 1984, 15) -Věcné pořádání vychází z obsahové analýzy, informace jsou při něm pořádány podle obsahových údajů získaných inf. analýzou. (Kovář, 1984, s. 11) Co nás bude zajímat? èvěcný selekční jazyk ! Zkráceně ho budeme nazývat pouze selekční jazyk, SJ. ale nejen to ètéž věcné pořádání informací Ukázky věcných SJ různých typů Č Í M Z A Č Í T ? autoritou nejvyšší Selekčními jazyky v katalogu Národní knihovny ČR (NK ČR) NEBOLI Jaké druhy selekčních jazyků používá při indexaci NK ČR ? Příklad Hledáme knihu o drahokamech (nerost) pomocí klíčového slova z názvu - drahokamy Pojednává kniha s tímto názvem o problematice, která nás zajímá? Záznam v katalogu NK ČR (cit. 2008-16-4) Záznam v katalogu AV ČR (cit. 2008-16-4) Nezjistíme, že jde o knihu s odlišnou tematikou. Záznam obsahuje pouze identifikační údaje. Selekční jazyky používané NK ČR mystici - Česko - 20. stol. duchovní cesta PHNK předmětový SJ (předmětová hesla Národní knihovny) 2-587-051 159.923.5 133.2 MDT systematický SJ (437.3) (Mezinárodní desetinné třídění) (0:82-94) lUkázka slovníků PHNK a MDT (soubor pdf Srovnání PSJ a SSJ) 133 - Okultismus skupina Konspektu hybridní SJ blížící se k SSJ 159.9 (Psychologie) 159.92 (Duševní vývoj a schopnosti. Srovnávací psychologie) 159.923 (Psychologie typu. Individuální psychologie. Osobnost... ) 159.923.5 (Pěstování osobnosti) Příklady dalších možností uplatnění SJ ltematický rozcestník http://www.jib.cz/ lCatalog NCSU http://www.lib.ncsu.edu/catalog/ lkomerční databáze, např. LISTA with Fulltext http://library.muni.cz/ezdroje/ lkategorizační schémata v předmětových katalozích, portálech např.: http://bubl.ac.uk/ lUkázka webového indexu pro webové sídlo PeopleSoft.com (v současné době již nefunkční) Seznamy různých druhů SJ lTaxonomy Warehouse http://www.taxonomywarehouse.com/ lBeyond Bookmarkshttp://www.public.iastate.edu/~CYBERSTACKS/CTW.htm Věcné pořádání informací lVěcný SJ je nástrojem procesu věcného pořádání informací, je jeho výrazový a vyjadřovací prostředek. lVěcné pořádání informací (termín z TDKIV) ekv věcný popis, věcné zpracování, věcné zpracování informací, angl. ekv subject control Specifický proces pořádání informací, při kterém jsou informace získané obsahovou analýzou dokumentu vyjádřeny pořádacími znaky věcných selekčních jazyků. systematické poř. inf. předmětové poř. inf. Systematické pořádání informací lProces, při kterém jsou dokumenty, záznamy o nich nebo záznamy o jednotlivých informacích vřazovány na příslušné místo v rámci systematicky uspořádaného systému lidského poznání, kde se jejich postavení řídí v podstatě rodo-druhovými vztahy a slovní formulace obsahu dokumentu bývá většinou nahrazena znaky umělého jazyka (notacemi). (volně podle Kovář, 1984, s. 13) èekv třídění, klasifikace, systematické zpracování, systematická katalogizace èvyjadřovacím prostředkem je systematický SJ Předmětové pořádání informací lProces, při kterém slovně vyjádřený obsah, téma či předmět dokumentu, jeho částí nebo jednotlivých v něm obsažených informací je převáděn do jednou více, jindy méně normalizovaných a formalizovaných hesel (deskriptorů), která jsou ve slovnících uspořádána abecedně. (volně podle Kovář, 1984, s. 13) èekv. heslování, předmětové zpracování, indexace, někdy nevhodně předmětové třídění, předmětová klasifikace èvyjadřovacím prostředkem je předmětový SJ Účel věcného pořádání informací (Taylor, 2004, s. 242) èPoskytnutí věcného přístupu k informačním objektům prostřednictvím vyhledávacího nástroje. èSeskupení obsahově stejných nebo podobných informačních objektů. èLogická lokace podobných informačních objektů. èŠetří čas uživatele. Oblast věcného pořádání informací a selekčních jazyků patří do širší problematiky pořádání informací a informačních jazyků (více viz Kovář, 1984, s. 9-18). Pořádání informací v zahraniční problematika označující se jako knowledge organization, organization of knowledge, information organization, organization of information, organizing information české ekv organizace znalostí, organizace poznání pořádání znalostí Pořádání informací Pořádání informací (termín z TDKIV) ekv pořádání znalostí, termín anglicky knowledge organization Organizace a reprezentace zaznamenaných znalostí s cílem zajistit efektivní využívání údajů, informací a poznatků obsažených v informačních zdrojích. Pořádání informací zahrnuje vytváření organizovaných souborů identifikačních a obsahových informací získaných informační analýzou dokumentu podle předem stanoveného systému. Podle typu vstupních informací se vyčleňuje identifikační pořádání informací a věcné pořádání informací. SJ v procesu reprezentace a vyhledávání informací (Chu, 2007) SJ v procesu reprezentace a vyhledávání informací (Chu, 2007) lVedle přirozeného jazyka patří SJ mezi důležité složky tohoto procesu. lJe výhodnější užít přirozený jazyk či SJ? èObojí výhody i nevýhody (viz přednáška Věcné vyhledávání pomocí SJ). Charakter SJ z hlediska lingvistiky lPřirozený jazyk (výklad z TDKIV) - Jazyk, který se vyvíjí, jehož pravidla vyplývají z úzu (nejsou definována formálně) a jenž je užíván konkrétním jazykovým společenstvím (např. národní jazyky). lUmělý jazyk (výklad z TDKIV) - Jazyk vytvořený nebo řízený pomocí souboru předem stanovených pravidel s přesně definovanou syntaxí a sémantikou vytvořený pro určité praktické účely. Typem umělého jazyky je např. informační jazyk. èSJ patří mezi informační jazyky, tj. umělé jazyky používané v rámci informačního systému. Charakter SJ z hlediska lingvistiky Přirozený jazyk (dále PJ) má dvě základní složky: lslovník (lexikum) lpravidla, jak s tímto slovníkem nakládat, tedy gramatiku -morfologie: nauka o tom, jak se slova ohýbají (flexe) nebo tvoří (slovotvorba) -syntax: způsob, jakým se slova spojují do vět (zjednodušeně řečeno). Podobně i SJ má tyto tři složky: lslovník, morfologii a syntax Srovnání tří základních složek SJ a PJ: slovník lSlovníku (lexiku) PJ odpovídají u SJ řízený slovník nebo (PSJ) klasifikační tabulky (SSJ). příklad: èdatabáze národních autorit NK ČR http://aleph.nkp.cz/F/ è tezaurus AGROVOC http://aims.fao.org/website/AGROVOC-Thesaurus/sub èsoubor MDT MRF online http://aip.nkp.cz/mdt/ Srovnání tří základních složek SJ a PJ: slovník Pořádací znak lSlovu nebo slovnímu spojení u PJ odpovídá u SJ pořádací znak. lPředmětový SJ lexikální jednotka mystici duchovní cesta lSystematický SJ klasifikační znak 2-587-051 2-584.5 Srovnání tří základních složek SJ a PJ: morfologie lMorfologii (přesněji její části, slovotvorbě, protože flexi nelze u SJ uplatnit) PJ odpovídají u SJ pravidla pro tvorbu pořádacích znaků. ènapř. u SSJ typ notačního systému - MDT - desetinná notace Srovnání tří základních složek SJ a PJ: syntax lSyntaxi (skladbě) PJ odpovídají u SJ pravidla pro indexaci (klasifikaci) a formulaci dotazu při vyhledávání (tedy pravidla pro spojování a kombinaci pořádacích znaků) lVětě v PJ odpovídá v SJ selekční obraz dokumentu nebo selekční obraz dotazu. Záznam v katalogu NK ČR (cit. 2008-16-4) jednotlivé selekční obrazy dokumentu Typy SJ Nejčastější dělení: podle uspořádání slovníku, podle charakteru pořádacích znaků SJ, šířky tematického zaměření. lPořádací znaky lze ve slovníku SJ uspořádat abecedně, nebo tematicky, takže se SJ dělí na: èpředmětové SJ (více viz konkrétní přednáška) - abecední princip èsystematické SJ (více viz konkrétní přednáška)- tematický princip Šířka tematického zaměření lSelekční jazyk lze klasifikovat podle šíře univerza (oblasti), které popisují. èuniverzální selekční jazyk - univerzum selekčního jazyka pokrývá všechny oblasti lidského poznání a lidské činnosti èspeciální selekční jazyk - univerzum selekčního jazyka je omezeno na určitý obor (Pinkas, 2002) Typy SJ lCharakter pořádacích znaků SJ je určen mírou postkoordinace, resp. prekoordinace, takže se SJ dělí na: èpostkoordinované SJ èprekoordinované SJ Prekoordinace versus postkoordinace lPostkoordinace a prekoordinace jsou principy, které se uplatňují èpři tvorbě pořádacích znaků ve slovníku SJ (morfologie), èpři indexaci (klasifikaci) a vyhledávání (syntax). Neexistuje čistě postkoordinovaný nebo čistě prekoordinovaný SJ. Postkoordinace a prekoordinace se uplatňuje v každém SJ; podle toho, který princip v daném SJ převažuje, označujeme jej jako prekoordinovaný nebo jako postkoordinovaný SJ. Prekoordinace versus postkoordinace lNa úrovni slovníku postkoordinace/prekoordinace vyjadřuje míru složení pořádacího znaku. Pokud jsou jako pořádací znaky použity jednoduché pojmy, hovoří se o postkoordinaci. Pokud jsou použity složené pojmy, hovoří se o prekoordinaci. lpostkoordinovaný PSJ Dvořák, Antonín, 1841-1904 drama televizní inscenace bibliografie lprekoordinovaný PSJ Dvořák, Antonín – hry divadelní a televizní – bibliografie (dramatik) složené téma vyjádříme jednotlivými pořádacími znaky (deskriptory) složené téma vyjádříme jedním pořádacím znakem (předmětové heslo) Prekoordinace versus postkoordinace lPrekoordinovaný nebo postkoordinovaný charakter pořádacích znaků ovlivňuje samozřejmě i indexaci (klasifikaci) a vyhledávání. èU postkoordinovaného SJ je složený pojem popsán dílčími pořádacími znaky, které jsou k dokumentu přiřazovány samostatně a koordinovány (kombinovány) až při vyhledávání. èU prekoordinovaného SJ je naopak složený pojem vyjádřen jediným pořádacím znakem, který se použije jak pro indexaci, tak pro vyhledávání. Prekoordinace versus postkoordinace Příklad èpostkoordinovaná indexace v bibliogr. záznamu mořeplavci Itálie 18.-19. stol. studie èprekoordinovaná indexace v bibliogr. záznamu mořeplavci -- Itálie -- 18.-19. stol. - studie lPozn. Současné rešeršní systémy vyhledávají i v jednotlivých prvcích předmětového hesla. Rozdíl znatelný při prohlížení v rejstřících. Typy SJ lVýsledkem tohoto třídění jsou celkem čtyři typy SJ: èprekoordinované systematické SJ èpostkoordinované systematické SJ èprekoordinované předmětové SJ èpostkoordinované předmětové SJ Příklady typů SJ lprekoordinované SSJ èMezinárodní desetinné třídění, Deweyho desetinné třídění, Třídění Kongresové knihovny, Cutterova expanzivní klasifikace lpostkoordinované SSJ èDvojtečkové třídění (Ranghanatan), Blissovo bibliografické třídění lprekoordinované PSJ èpředmětová hesla lpostkoordinované PSJ èdeskriptorové SJ, volně tvořená klíčová slova, permutované (rotované) rejstříky (KWIC, KWOC) Použitá a povinná literatura lBalíková, M. 2001 Problematika věcného pořádání informací a jejich zpřístupnění. Národní knihovna, 2001, roč. 12, č. 3, s. 175-186. Dostupné z WWW: http://full.nkp.cz/nkkr/NKKR0103/0103175.html lHjørland, Birger. 2006. Indexing language [online]. Last edited: 19-10-2006 [cit. 2009-09-29]. Dostupné z WWW: http://www.db.dk/bh/lifeboat_ko/CONCEPTS/indexing_languages.htm lKovář, Blahoslav. 1984. Věcné pořádání informací a selekční jazyky. Praha : ÚVTEI, 1984. 1.1 Úvod do problematiky věcného pořádání informací a selekčních jazyků, s. 9-18. lPinkas, Otakar. 2002. Zpracování informačních fondů. Vyd. 1.V Praze : Vysoká škola ekonomická, 2002. Kap. 7 Selekční jazyky, s. 89-114. Použitá a doporučená literatura lChu, Heting. 2007. Information representation and retrieval in the digital age. Medford : Information Today, 2007. 248 s. lKTD : Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha : Národní knihovna České republiky, 2003. Dostupné z WWW: http://sigma.nkp.cz/cze/ktd lSchwarz, Josef. 2007. Selekční jazyky 1 : Úvod do problematiky [ppt]. Přednáška č. 2 (kombinované studium). 9.11.2007. lTaylor, Arlene G. 2004. The organization of information. Westport : Libraries Unlimited , 2004. 417 s. ISBN 1-56308-976-9