Předmět: Selekční jazyky 8. 10. 2010 Přednášející: Mgr. Silvie Kořínková Presová http://kisk.phil.muni.cz/mgr-silvie-korinkova-presova-dis Systematické selekční jazyky Varianty termínu èpoužívané české ekvivalenty - klasifikace, klasifikační systém, třídící systém, taxonomie, kategorizace èanglické ekv. - systems for categorization, systematic retrieval language, classification, bibliographic classification, classification scheme Výklad termínu Systematický selekční jazyk (výklad z TDKIV) èVěcný selekční jazyk založený na klasifikačním systému. èSlovník systematického selekčního jazyka je tvořen klasifikačními znaky, jeho struktura je prezentována nejčastěji hierarchickými vztahy mezi třídami, a to zejména vztahy generickými a partitivními. Klasifikační systém (výklad z TDKIV) èLogické uspořádání množiny klasifikovaných pojmů na základě vztahů a závislostí mezi charakteristickými znaky těchto pojmů... (více viz výklad TDKIV). Cvičení Vytvořte jednoduchou klasifikaci na základě charakteristik elektronických informačních zdrojů ze s. 1-2 v BRATKOVÁ, Eva. K otázkám pojmu, třídění a typologie internetových a webovských informačních zdrojů. Národní knihovna: Knihovnická revue. 1998, roč. 9, č. 5. ISSN 0862-7487. Dostupné též z http://eprints.rclis.org/3558/ Cvičení 1 elektronické informační zdroje 1.1 nesíťové informační zdroje 1.2 síťové informační zdroje 1.2.1 internetové informační zdroje 1.2.1.1 webovské informační zdroje Výklad termínu lSystematický selekční jazyk je SJ používaný při realizaci procesu systematického pořádání informací jako jeho výrazový a vyjadřovací prostředek. (Kovář, 1984, s. 15) lSystematické pořádání informací - Proces, při kterém jsou dokumenty, záznamy o nich nebo záznamy o jednotlivých informacích vřazovány na příslušné místo v rámci systematicky uspořádaného systému lidského poznání, kde se jejich postavení řídí v podstatě rodo-druhovými vztahy a slovní formulace obsahu dokumentu bývá většinou nahrazena znaky umělého jazyka (notacemi). (volně podle Kovář, 1984, s. 13) ekv. třídění, klasifikace, systematické zpracování, systematická katalogizace Výklad termínu lClassification scheme - Specification of a systematic organization of knowledge. (Taylor, 2004, s. 359) lClassification scheme - A tool for systematic organization of information resources. A class. scheme helps a classifier to represent the subject content of every document in a collection by appropriate notations. (Chowdhury, 2007, s. XVIII) Klasifikace èSSJ umožňují věcný přístup k dokumentům, jenž je založený na klasifikaci. lKlasifikace (výklad z TDKIV) - 1. Uspořádání pojmů nebo jiných entit do tříd a dalších skupin (podtříd apod.) za účelem vyjádření jejich sémantických vztahů. Třídy a další skupiny jsou obvykle vyjádřeny notací. - 2. Přidělování notací (znaků tříd) klasifikačního systému za účelem vyjádření obsahu dokumentu. Terminologická poznámka lV TDKIV jsou uváděny jako samostatné termíny: klasifikace a systematické pořádání informací. lV zahraniční literatuře jeden termín a dva významy. èclassification - 1. Umisťování předmětu do kategorií. 2. V oblasti organizace informací je klasifikace proces určování, kam inf. objekt spadá v dané hierarchii a často přiřazení notace. (Taylor, 2004, s. 359) Klasifikace lKlasifikace je v podstatě kategorizací. èV průběhu 20. stol. se propojení s kategorizací vytrácelo a klasifikace je chápána jako přiřazování notace dokumentům. èTradiční SSJ jsou založeny na klasické teorii kategorií - vychází z teorie Aristotela, že kategorie jsou tvořeny entitami mající společné vlastnosti. èTeorie prototypů (kognitivní psychologie) - Teorie, že kategorie mají prototypy. Více viz Sternberg, 2002, s. 289-291. Princip dělení/klasifikační kritérium (Pinkas, 2002, s. 81, Kovář, 1984) lMnožinu prvků lze rozdělit na podmnožiny (podtřídy) pomocí zvoleného principu dělení/principium divisionis. èPrincipem dělení může být nějaká vlastnost nebo vztah. èInkluze množin - Množina může být podmnožinou dané množiny jedině tehdy, jestliže všechny její prvky jsou také prvky dané množiny. lJe-li podmnožin více, pak každá z nich musí mít alespoň jednu vlastnost odlišnou od dalších podmnožin. lVzniklé podmnožiny prvků lze dále dělit podle dalšího klasifikačního kritéria. Na základě jakého principu vytvoříte dvě podmnožiny? klávesnice, monitory, tiskárny, ergonomické klávesnice, myši, tiskárny, LCD monitory, ergonomické myši, laserové tiskárny, světelná pera, bodové tiskárny, inkoustové tiskárny, laserové snímače, čtečky čárových kódů, kreslicí stoly, skenery klávesnice monitory ergonomické klávesnice LCD monitory myši bodové tiskárny ergonomické myši laserové tiskárny světelná pera inkoustové tiskárny laserové snímače kreslicí stoly čtečky čárových kódů skenery vstupní zařízení výstupní zařízení Princip dělení/klasifikační kritérium lV klasifikaci se množinám říká třídy, podmnožinám podtřídy. èPodtřída je ve vztahu podřazenosti ke své třídě. èTřída je ve vztahu nadřazenosti ke své podtřídě. èPodtřídy stejné třídy jsou ve vztahu souřadném. lJestliže jsou v systému tříd definovány vztahy nadřazenosti, podřazenosti a souřadnosti, pak je v systému určena hierarchie. èHierarchický třídicí systém vzniká na množině prvků tehdy, je-li v něm definována hierarchie. Příklad praktické klasifikace - Klasifikace ICT služeb -Klasifikace podle předmětu služby lInformační služby lAplikační služby lInfrastrukturní služby lVývojové služby lPodpůrné služby -Klasifikace podle způsobu spotřeby ICT služby lSlužby s jednorázovou spotřebou lSlužby s kontinuální spotřebou lSlužby s diskrétní spotřebou -Klasifikace podle typu příjemce (Jelínek, 2007) Účel SSJ lPůvodní smysl SSJ - pořádání a získávání informačních objektů, dnes též pořádání bibliogr. záznamů (Taylor, 2004, s. 301) lFunkce SSJ èvyužití pro tvorbu signatury èsdružuje obsahově stejné nebo podobné dokumenty (uživatelé mohou najít dokumenty o daném tématu na jednom místě) èspojuje dokumenty - z bibliogr. záznamu dokumentu navede klasif. znak na místo uložení dokumentu, pokud je využit pro vytvoření sign. èprohlížení - fyzické prohlížení fondu, prohlížení v online prostředí (Chowdhury, 2007, s. 72) Důležité komponenty SJ lTřídy a podtřídy - třída - Skupina klasifikovaných pojmů vzniklá na základě shodných charakteristik za účelem definování sémantických vztahů mezi nimi, která je označená notací. Tvoří základní prvek klasifikačního systému označující základní kategorii. (výklad z TDKIV) lNotace - Symbol vyjádřený posloupností znaků, který se používá k označení tříd klasifikačního schématu. (výklad z TDKIV) lKlasifikační tabulky - Klasifikační systém znázorněný formou tabulek, tj. systematické seskupení pojmů do tříd, podtříd, oddílů a pododdílů označených notacemi a opatřených slovním vyjádřením (slovními ekvivalenty). Klasifikační tabulky představují slovník SSJ. (klasifikačního systému). (více viz výklad z TDKIV) Úkazka schématu MDT - Základní třída 3 Společenské vědy 30 Teorie, metodologie a metody společenských věd všeobecně. Sociografie 31 Demografie. Sociologie. Statistika 32 Politika 321 Formy politické organizace. Státy jako politické síly 322 Vztahy mezi církví a státem. Politika a náboženství. Církevní politika 323 Vnitřní politika. Vnitřní záležitosti 323.1 Národnostní, lidová, etnická hnutí a problémy. Národnostní a etnické menšiny 323.2 Vztahy mezi obyvateli a státem. Vnitropolitické akce http://www.nkp.cz/pages/page.php3?page=fond_vseobec_pomzn1.htm notace slovní vyjádření Společné prvky SSJ lVerbální vyjádření klasifikovaných pojmů (témat reprezentovaných ve schématu). lUspořádání těchto slovních vyjádření do tříd nebo logickým způsobem tak, aby bylo zajištěno smysluplné pořádání témat. lNotace (objevuje se vedle slovního vyjádření), které reprezentují slovní vyjádření a skrze které jsou explicitně vyjádřeny vztahy mezi třídami. Notace se slovním vyjádřením tvoří hlavní část klasif. tabulek. lOdkazy uvnitř tabulek (poukazují na různé aspekty tématu nebo na jiné vztahující se témata). èPříklad Notace MDT: 025.4 http://aip.nkp.cz/mdt/ Společné prvky SSJ lAbecední seznam slovních vyjádření a synonym (odkazy na notace). lPravidla pro užití SSJ. Většinou všeobecná pravidla na začátku tabulek a uvnitř tabulek specifická pravidla pro jednotlivé části. Příklad: èspecifická pravidla Tabulka 1d. Všeobecné pomocné znaky formy http://aip.nkp.cz/mdt/ èObecná pravidla DDC http://www.oclc.org/dewey/versions/abridgededition14/intro.pdf lInstitucionální zázemí - udržování SSJ, revize, nové vydání. Příklad èMDT - UDC Consortium http://www.udcc.org/ èDDC - OCLC http://www.oclc.org/dewey/ Základní typy SSJ lEnumerativní SSJ - Vyjmenování všech možných tříd a podtříd klasifikačního schématu (klasifikátor přiděluje klasif. znak vyjadřující obsah dokumentu z předem vytvořeného schématu), příklad Library of Congress Classification (LCC), Dewey Decimal Classification (DDC) (dnes již má syntetizující prvky). èprekoordinované SSJ l Analyticko-syntetické SSJ - Při jejich aplikaci dochází k rozkladu složených témat na jednotlivé komponenty, pro jednotlivé komponenty jsou v tabulkách SSJ nalezeny notace, které jsou na základě daných pravidel spojeny v klasifikační znak, příklad Mezinárodní desetinné třídění (MDT). èmíra prekoordinovanosti je stále významná, při indexaci lze uplatnit princip postkoordinace Příklady MDT versus DDC lvyjádření složeného tématu stupně místní, oblastní a ústřední správy èklasifikační znak MDT 352/354 DDC 351 notace z hlavních tabulek symbol rozšíření lvyjádření složeného tématu Americká poezie èMDT 821.111(73)-1 DDC 811 notace notace z pomocných z hlavních tabulek tabulek Základní typy SSJ lFasetové SSJ - organizace pojmů do faset, klasifikační znak označující téma je vytvářen klasifikátorem s pomocí specifických pravidel pro syntézu, částečná hierarchie příklad Colon Classification (CC), Bliss Bibliographic Classification 2. vyd., 1977 (BC2) èFaseta (výklad z TDKIV) - Kategorie entit (množina podtříd) vytvořená uplatněním jedné klasifikační charakteristiky (principium divisionis), která je pro danou kategorii (třídu) podstatná, strukturální. Fasety vyjadřují vlastnosti použité pro seskupování pojmů podle jejich podstaty. lS. R. Ranganathan (Indický knihovník a matematik) - uvedl fasetovou analýzu do knihovnictví, autor CC. lCC je založeno na principu fasetové analýzy, podle které každý předmět může být analyzován na základě základních kategorií: èosobnost – hmota – energie – prostor – čas. lSled základních kategorií tvoří tzv. fasetovou formuli, PMEST, která určuje obecné pořadí faset při analýze a syntéze. Příklad klasifikační znak L 45:421:4 - (léčení tuberkulózy plic) označení hlavní třídy lékařství faseta orgány těla (osobnost) faseta problémy medicíny (hmota-vlastnost) faseta ošetřování a léčení (energie) Fasetové SSJ pokračování Faseta „orgány těla“ Faseta „problémy medicíny“ Faseta „ošetřování a léčení“ 1 Orgány v celku 1 Obecné problémy 1 Výživa 2 Zažívací orgány 2 Morfologie 2 Etiologie 23 Zažívací trubice 3 Fyziologie 3 Diagnostika 24 Žaludek 4 Nemoci 4 Léčení 25 Střevo 42 Infekční 3 Střevní systém 421 TBC 4 Dýchací orgány 45 Plíce Příklad faset třídy L lékařství L 45:421:4 - (léčení tuberkulózy plic) (diagnostika infekce střeva) Faseta „orgány těla“ Faseta „problémy medicíny“ Faseta „ošetřování a léčení“ 1 Orgány v celku 1 Obecné problémy 1 Výživa 2 Zažívací orgány 2 Morfologie 2 Etiologie 23 Zažívací trubice 3 Fyziologie 3 Diagnostika 24 Žaludek 4 Nemoci 4 Léčení 25 Střevo 42 Infekční 3 Střevní systém 421 TBC 4 Dýchací orgány 45 Plíce Příklad faset třídy L lékařství L 45:421:4 - (léčení tuberkulózy plic) L 25:42:3 - (diagnostika infekce střeva) Příklady faset pro třídu nápoje l[druh] [faseta] -pivo -víno -voda -mléko l[obsah alkoholu] -alkoholické nápoje -nealkoholické nápoje l[původ nápoje] l[původ nápoje - pivo] -Prazdroj -Velkopopovické l[původ nápoje - víno] -Velkopavlovická podoblast -Mělnická podoblast -Litoměřická podoblast l[typ nápoje] l[typ nápoje - pivo] -ležák -kvasnicové l[typ nápoje - víno] -bílá vína lMüller-Thurgau lTramín červený lSauvignon -červená vína lFrankovka lPortugal lDenis d’Or Ukázka z podřídy MDT 663.4 Pivo. Pivovarnictví. Sladování. Sledujte klasifikační kritéria/charakteristiky využité pro dělení na další podtřídy. http://aip.nkp.cz/mdt/ Samostatný úkol lIdentifikujte fasety z oblasti literární vědy a literatury pomocí témat charakterizující jednotlivá díla. U jednotlivých faset vyjmenujte pojmy z příkladu. lCharakteristika děl: èRomán ve francouzštině od belgického spisovatele. èBásně ve francouzštině od kanadského spisovatele. èLiterárněvědná studie o českém spisovateli. èZvuková nahrávka románu Zámek od F. Kafky. èVýbor z díla Milana Kundery. Určené fasety èFaseta jazyka (francouzština, čeština, němčina) èFaseta literárního žánru (román, poezie) èFaseta národnosti/etnické skupiny/státní občanství (Češi, Belgičané, Francouzi, Kanaďané, Židé) èFaseta formy dokumentu (patří i typ nosiče) (studie, zvuková nahrávka, výbory) èFaseta osob (spisovatel) lPomocí vytvořené fasetové klasifikace klasifikujte následující dílo: èRomán ve francouzštině od belgického spisovatele. lfasetová klasifikace viz přiložený soubor pdf EnumerativníSSJ_vers_fasetovéSSJ Pomocí vytvořené fasetové klasifikace klasifikujte následující dílo: Román ve francouzštině od belgického spisovatele. lfasetová klasifikace viz přiložený soubor pdf EnumerativníSSJ_vers_fasetovéSSJ èklasifikační znak: A1 B1.1 C2 PRINCIP POSTKOORDINACE Fasetový přístup na internetu lnavigace v portálech, webových sídlech èhttp://www.wine.com/ èhttp://shop.nordstrom.com/ SWEATERS Find new favorites, from comfy hoodies to elaborately draped statement-makers. SHOP BY ALL SWEATERS STYLE MATERIAL STORE DEPARTMENT SIZE COLOR PRICE BRAND Výhody a nevýhody jednotlivých typů SSJ lEnumerativní SSJ èvýhody - Struktura schématu se odráží v notaci, uživatel lehce rozpozná vztahy mezi pojmy (Podmínkou je hierarchická notace.). ènevýhody - Nové pojmy - pomalá aktualizace, nutné pravidelné revize. Stejný pojem se objevuje na více místech v systému (záleží za hledisku) - tabulky jsou příliš objemné. èklasifikace - Klasifikátor nemusí vytvářet klasifikační znak, na druhé straně jejich nevýhodou je, že jsou velmi neflexibilní a klasifikátor je omezen na třídy, které jsou vyjmenovány. (Chowdhury, 2007, s. 76 - 77) Výhody a nevýhody jednotlivých typů SSJ lAnalyticko-syntetické SSJ èvýhody - oproti enumerativním - Více druhů tabulek, schéma je menší - nemusí být vyjmenovány všechny třídy. Flexibilita v tvorbě specifických znaků (klasifikátor není tak omezen při vyjádření specifických témat). ènevýhody - Tvorba klasif. znaku je pro klasifikátora náročnější, různé způsoby aplikace - různé výsledné znaky pro stejné dokumenty v různých institucích. (Chowdhury, 2007, s. 77) Výhody a nevýhody jednotlivých typů SSJ lFasetové SSJ èvýhody - Podporují vícehlediskovou klasifikaci. Lze vyjádřit specifické pojmy. Aktualizace tabulek vyvolaná změnami v teorii a praxi oboru je poměrně snadná. ènevýhody - V praxi se fasetové klasifikace používají pro speciální třídění, hlavně v technice. Jejich většímu rozšíření brání poměrná složitost a náročnost tvorby klasif. znaku (Pinkas, 2002, s. 106). Z hlediska tvorby signatury je v mnoha případech nevýhodou dlouhá notace. Charakteristika SSJ z hlediska lingvistických pojmů Pořádací znak: lklasifikační znak èvyjádřen notací Klasifikační znak (výklad z TDKIV) - Lexikální jednotka (pořádací znak) systematického selekčního jazyka, která vyjadřuje tematiku klasifikovaného dokumentu a slouží jako selekční údaj při jeho zpětném vyhledávání. Rozlišují se znaky hlavní a pomocné, základní, rozvinuté a složené. Morfologie Morfologie (pravidla pro tvorbu pořádacích znaků) se u SSJ týká výstavby notačního systému a tvorby notací. Typy notace podle druhu použitých znaků lalfabetická notace (KK, Odee) lnumerická notace (III.V, 4.6) èdesetinná notace - pořadí notací:1, 11, 12, 121, 2 (před první číslicí si představíme„0.“) èceločíselná notace - pořadí notací: l, 2, 11, 12, 121. lalfanumerická notace (smíšená notace) (A65, ЖIII.X) Typy notace podle struktury lexpanzivní notace (pohostinnost notace) llineární notace (A11, A12, A13...) lhierarchická notace (A11, A11.1, A11.1.01...) èmnemotechničnost notace - např. A - Arts èVýhodou hierarchické notace je, že reflektuje hierarchii SSJ. èNevýhodou hierarchické notace je větší délka notace ve srovnání s lineární. V systémech třídění, které nepoužívají hierarchické notace, je pružnost notace obvykle větší. Charakteristika slovníku SSJ lZaložen na klasifikaci. lObvykle strukturován pomocí sémantických vztahů. lSlovník se nazývá - KLASIFIKAČNÍ TABULKY èhlavní část uspořádána systematicky (klasifikační schéma) èpomocná část uspořádána abecedně lStruktura slovníku SJ (vztahy mezi PZ) èsilná hierarchie - enumerické a analyt.-synt. SSJ èčástečná hierarchie - fasetové SSJ èasociace (viz též) Syntax lPravidla pro užívání slovníku SJ, pravidla pro klasifikci. lKe klasifikaci se neužívá slovní vyjádření, pouze klasifikační znak vyjádřený notací. lKaždý SSJ má své vlastní pravidla - Většinou všeobecná pravidla na začátku tabulek a uvnitř tabulek specifická pravidla pro jednotlivé části. např. Klasifikace na internetu lKategorizační schémata na internetu - umožňují setřídit informační zdroje podle obsahových charakteristik do tematických skupin – kategorií, které jsou většinou uspořádány do více hierarchických úrovní. èSlužby umožňující vyhledávání EIZ prohlížením kategorizačních schémat - předmětové adresáře - komerční (dnes spíše portály www.seznam.cz, http://dir.yahoo.com/ ), oborové brány/portály - l2 základní přístupy ke kategorizaci zdrojů: èaplikace tradičních SSJ (většinou uspořádání dle notací+ slovní vyjádření) èvytvoření vlastního schéma - (většinou abecední uspořádání kategorií stejné hierarchické úrovně) Tradiční SSJ na internetu lVyužití pro organizaci zdrojů zejména v digitálních knihovnách a oborových informačních branách (x komerční předmětové adresáře) lRozsáhlý výčet služeb (ne vždy se jedná o oborové informační brány) se schématy pro organizaci webových zdrojů založenými na klasifikačních systémech je dostupný z http://www.iastate.edu/~CYBERSTACKS/CTW.htm . lPříklad - brána BUBL http://bubl.ac.uk/ - využití DDC, schéma uspořádáno dle notací Výhody využití enumer. SSJ lProhlížení - Usnadňují prohlížení v online prostředí lRozšíření a zúžení rešerše - Hierarchický princip klasifikačních schémat umožňuje potřebné rozšíření dotazu nebo postupnou specifikaci prohledávané tematické oblasti. lKontext - Výraz užitý pro kategorii nabývá smyslu v kontextu okolních kategorií. lVícejazyčný přístup - Notace jsou nezávislé na přirozeném jazyce a slovní vyjádření je dostupné ve více jazycích. lInteroperabilita - Užití jednoho dohodnutého SSJ mezi jednotlivými službami může usnadnit paralelní prohlížení a vyhledávání. lDoménové rozdělení - např. při tematickém rozšíření sbírky, lze fond rozčlenit na nové menší logické části. (více viz Presová, 2005, 70-71) Nevýhody využití tradičních univerzálních SSJ lVycházejí z klasifikace poznatků v 19. stol. lPomalá aktualizace. lNejsou dostatečně specifické pro konkrétní obory. lNedůslednost v hierarchických strukturách, např. ve schématu DDC potraty 363.46, homosexualita 363.49, pornografie 363.47 seskupeny jako problémy vztahující se k veřejné morálce v nadřazené třídě 363.4 Controversies related to public morals and customs (Co když je téma v dokumentu v odlišném vztahu, než do kterého je uveden ve schématu?) lRoztříštěnost některých témat do různých podtříd. Např. v třídě pro literaturu nejsou v jedné skupině poetická díla, ale jsou rozdělena do jednotlivých podtříd. Použitá a povinná literatura lPinkas, Otakar. 2002. Zpracování informačních fondů. Vyd. 1.V Praze : Vysoká škola ekonomická, 2002. Kap. 6 Referování a indexování, s. 79-88, Kap. 7 Selekční jazyky, s. 89-114. lTaylor, Arlene G. 2004. The organization of information. Westport : Libraries Unlimited , 2004. Kap. 11 Systems for categorization, 297-307 s. ISBN 1-56308-976-9 Použitá a doporučená literatura lChowdhury, G. G. ; Chowdhury, S. 2007. Organizing information : from the shelf to the Web. London : Facet, 2007. 230 s. lJelínek, Petr. 2007. Kategorizace a architektury informatických služeb [online]. 2007 říjen [cit. 2009-10-04]. Dostupné z WWW: http://nb.vse.cz/~vorisek/texty.htm lKTD : Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha : Národní knihovna České republiky, 2003. Dostupné z WWW: http://sigma.nkp.cz/cze/ktd Presová, Silvie. 2005. Metoda Konspektu a její vztah k selekčním jazykům : současný stav a trendy se zaměřením na situaci v České republice. 1. vyd. V Brně : Masarykova univerzita v Brně, 2005. Kap. 4 Možnosti a omezení využití konspektového schématu při zpřístupnění elektronických informačních zdrojů se zaměřením na oborové informační brány, s. 67-72. ISBN 8021036850. Schwarz, Josef. 2007. Selekční jazyky 1 : Úvod do problematiky [ppt]. Přednáška č. 2 (kombinované studium). 9.11.2007. Sternberg, Robert J. 2002. Kognitivní psychologie. Vyd. 1. Praha : Portál, 2002. 636 s. ISBN 8071783765.