Knihovnické systémy a standardy (VIKBA10) Martin Krčál •KSS - kurz pro studenty KISK FF MU •Brno, 23. února 2018 •2. Standardy používané v knihovnách Kategorie standardů Standardy v knihovnách * protokoly pro přenos záznamů * formáty pro popis zdrojů * katalogizační pravidla * metadata a další standardy v digitálních knihovnách * ochrana a identifikace dokumentů * klasifikace zdrojů * * Protokoly Protokoly * k čemu slouží protokoly vpro přenos dat mezi prohlížečem a serverem (http, ftp,…) vpro přenos dat mezi službami (Z39.50) * jak protokoly fungují * Z39.50 * ANSI standard pro výměnu dat mezi systémy * Library of Congress * počátky v 70.letech vkomunikace LoC a OCLC * architektura client-server * Z-jazyk + kódování * nezávislý na platformě a systému vuniverzální použití * Z39.50 * vyhledávání, editace, získávání, předávání informací z/do vzdálených systémů vlze využít jen pro některou část * praxe vvyhledávání ve vzdálených knihovních systémech (metavyhledávače) vsdílená katalogizace vpřispívání do Souborného katalogu ČR * Z39.50 gateway OAI-PMH * protokol pro sklízení metadat vnesklízí se vše vpouze updatované záznamy * client-server * podporuje XML ve formátu Dublin Core * verze 2.0 (2008) * Herbert van de Sompel vprotokol pro sklízení dat z DL Herbert van de Sompel * * 20.3.1957 v Gentu * belgický knihovník a informatik * studia na Univerzitě v Gentu * působil jako vedoucí oddělení automatizace v univerzitní knihovně na UG * oblasti zájmu vautomatizace knihovních systémů, efektivní využívání EIZ a vyhledávání (SFX, openURL a principy linkování), volný přístup k informacím (projekt Open Archives Initiative, OAI-PMH, OAI-ORE, ), LTP * aktuálně vLos Alamos National Laboratory vprojekt Memento – výzkum nových možností archivace webu, podpora LoC Výsledek obrázku OAI-PMH * využití v praxi: vdigitální knihovny vrepozitáře a archivy vThesis.cz vdiscovery služby v Fungování OAI-PMH * http://www.jbi.hio.no/bibin/dill/summer_school/2010/oai_architecture.png Zdroj: http://www.jbi.hio.no/bibin/dill/summer_school/2011/xml-making_use.html Výstup v DC Příkazy * Identify = popis služby vhttp://arxiv.org/oai2?verb=Identify * ListMetadataFormats = seznam formátů vhttp://arxiv.org/oai2?verb=ListMetadataFormats * ListSets = seznam sestav (dle fakulty, oborů) vhttp://arxiv.org/oai2?verb=ListSets * ListIdentifiers = seznam všech identifikátorů vhttp://arxiv.org/oai2?verb=ListIdentifiers&metadataPrefix=oai_dc * ListRecords = seznam všech záznamů vhttp://export.arxiv.org/oai2?verb=ListRecords&metadataPrefix=oai_dc&set=stat * GetRecord = získat záznam vhttp://arxiv.org/oai2?verb=GetRecord&metadataPrefix=oai_dc&identifier=oai:arXiv.org:adap-org/93110 03 v v * * SRU/SRW * LoC * standard založený na XML * pro vyhledávání záznamů ve vzdálených systémech přes URL * jazyk CQL * server/báze?parametry vversion, operation, query, maximumRecords SRU/SRW * příklady: vhttp://knihomol.phil.muni.cz/adssru?version=1.1&operation=explain vhttp://knihomol.phil.muni.cz/adssru?version=1.1&operation=searchRetrieve&query=dc.identifier=19042 71189&maximumRecords=1 vhttp://knihomol.phil.muni.cz/adssru?version=1.1&operation=searchRetrieve&query=dinosaur&maximumRec ords=10 vhttp://opencontent.indexdata.com/wikipedia?version=1.1&operation=searchRetrieve&query=Einstein&max imumRecords=3 vdalší: http://www.loc.gov/standards/sru/misc/simple.html v v v * SOAP * Simple Object Access Protocol * výměna zpráv po internetu přes http * dotazování i výstup v XML * využití pro přenos dat mezi webovými službami * univerzální (na jazyku a platformě) * poměrně složitý * envelope, header, body * video SOAP * ukázka Zdroj: http://cs.wikipedia.org/wiki/SOAP SIP2 * Standard Interchange Protocol 2 * vyvinuto 3M * komunikace mezi knihovními systémy a výpůjčními zařízeními * využití vselfcheck * ukázka použití: vhttps://code.google.com/p/php-sip2/wiki/UsageExample Formáty pro popis zdrojů MARC21 * vyvinut v 60. letech (Henriette Avram) v1970 – standard v USA, 1973 . mezinárodní * Machine Readable Catalogue * formát pro popis dokumentů * v ČR podporovaný formát * definuje pole záznamu vjaké údaje do nich zapíšeme v100 – jmenné záhlaví v245 – názvové údaje vjak údaje zapisujeme a interpunkci řeší katalogizační pravidla!!! * vyvíjí LoC Další druhy MARCů * anglo-saské vUSMARC vUKMARC vCANMARC vOCLC-MARC * franko-italské vINTERMARC vPICAMARK * mezinárodní vUNIMARC Struktura MARC21 * MARCXML * LoC * MARC21 převedený do XML * pro výměnu a uchovávání dat * původně pro záznamy z KS, ale lze použít i pro DL * původně pouze pro potřeby knihoven * více info vhttp://www.loc.gov/standards/marcxml vukázka XML * * BIBFRAME * navržen jako nástupce MARCu * založen na XML * využívá strukturu RDF * 3 kategorie vyjádření díla vdílo, vyjádření, jednotka * univerzální vvhodné nejen pro texty, ale i pro audio a video, objekty, akce,… v Schéma BIBFRAME * BIBFRAME 2.0 Model Zdroj: Loc.gov Němcová, Božena. Babička. 5. vydání. Bratislava Mladé letá 1965 tištěné/PDF/e-pub/… Sign.: I 169977 Status: absenční Přír. č.: 123456789 MZK FRBR * Functional Requirements for Bibliographic Records * vytvořila IFLA v roce 1998 * model definuje entity, vztahy mezi nimi a atributy * abstraktní - dílo, vyjádření * hmotné – provedení, jednotka * článek o FRBR * Schéma FRBR http://www.inflow.cz/files/redakce/sch__ma_1.jpg Němcová, Božena. Babička. kniha film scénář divadelní hra vydání forma zveřejnění Zdroj: Inflow konkrétní provedení RIS - Research Information Systems * výměnný formát pro citace * textový formát * vyvinul Thomson Reuters pro EndNote * definovaná pole Ukázka RIS •TY - JOUR •AU - Shannon, Claude E. •PY - 1948/07// •TI - A Mathematical Theory of Communication •T2 - Bell System Technical Journal •SP - 379 •EP - 423 •VL - 27 •ER - BibTex * vznikl v roce 1985 * textový formát pro vkládání literatury do BibTex (LATEX) * jednoduchá struktura * lze aplikovat na šablonu citačního stylu Struktura BibTex •@Book{nemcova, • author = „Božena {Němcová} ", • title = „Babička", • publisher = „Mladé letá", • year = „ 1956", • address = „Bratislava", • edition = „5. vyd." •} Katalogizační pravidla AACR2 * angloamerická katalogizační pravidla * vznik v 60. letech * cíl: snaha sjednotit různá katalogizační pravidla (USA+GB) * později mezinárodní standard * 1978 – revize dokumentu (v.2) * další revize 1998, 2002 * nevyhovuje potřebám katalogizace vnové typy dokumentů, diverzifikace,… RDA (Resource Description and Access) * vyvíjeno od 1997 * 1. vydání v roce 2010 * nahradila AACR2 (v ČR 2015) * i mimo anglo-americké prostředí * cíl: usnadnit výměnu dokumentů * založeno na FRBR * hlavní změny proti AACR2 vstruktura FRBR, méně zkracování, zdrojem popisu celý dokument Metadatové formáty METS (Metadata Encoding & Transmission Standard) * standard pro metadata, XML * využití vv digitálních knihovnách vpro výměnu dokumentů mezi systémy vpro výměnu dat mezi DL a uživateli Struktura METS * hlavička * popisná metadata * administrativní metadata vtechnická (formát, velikost, datum), legislativní (práva, licence), zdrojová (info o původním dok.) * strukturální mapy a odkazy vnávaznost souborů, uzly (odkazy mezi částmi dokumentů = hyperlinky) * sekce souborů vpřehled souborů, jak na sebe navazují * MODS (Metadata Object Description Schema) * LoC standard * XML metadatový formát * kompromis mezi DC (jednoduchý) a MARC (příliš složitý) * MODS Lite = 15 prvků * využití: vkatalogy, archivy, muzea, digitální knihovny, popis webových stránek * pro různé druhy dokumentů vtištěné, digitální objekty, obrazy, videa,… RDF (Resource Description Framework) * vyvíjený W3C * metadatový formát, pro popis webových a digitálních objektů * využití vpopis dokumentů vvyhledávání (sémantický web) RDF na Wikipedii •@prefix rdf: . •@prefix foaf: . •@prefix dc: . • • • dc:publisher "Wikipedia" ; • dc:title „Albert Einstein" ; • foaf:primaryTopic [ • a foaf:Person ; • foaf:name „Albert Einstein" • ] . RDF – popis webových stránek • Dublin Core * soubor metadatových prvků * pro popis digitálních objektů (i HTML) * usnadňuje vyhledávání e-zdrojů * založen na XML * název odvozen od města Dublin (USA) * Generátor metadat Dublin Core * 16 základních prvků vTitle, Creator, Subject, Description, Publisher, Contributor, Date, Type, Format, Identifier, Source, Language, Relation, Coverage, Rights, Audience * výhody vjednoduchost vsémantická interoperabilita vmezinárodní podpora vrozšiřitelnost vmodifikovatelnost Ukázka Dublin Core • •… Další info o DC * http://www.dublincore.org * http://www.ics.muni.cz/dublin_core * http://www.ukoln.ac.uk/cgi-bin/dcdot.pl RSS * slouží ke sdílení obsahu * standardizovaný formát (XML) * pro weby s častou aktualizací * nejčastější uplatnění: vzpravodajské servery, blogy * nejpoužívanější verze RSS 0.91 a 2.0 * osobní RSS čtečky * agregátory RSS kanálů (mix info) * • Jak RSS funguje? * •Zpravodajský server • • •Nový článek • •RSS Kanál • • • •Osobní RSS čtečka •Agregátor •RSS kanálů •Agregátor •RSS kanálů clanek • • • Využití v RSS * EIZ vinformace o novinkách vaktuální číslo v RSS vvýběr článků na vybrané klíčové slovo nebo obor v * Agregace článků z odborných časopisů vhttp://www.tictocs.ac.uk Mikroformáty * nahrazuje složité XML * k popisu webových stránek * podpora sémantického webu * pro strojové zpracování informací primárně určených lidem vkontakty, akce v kalendáři, zeměpisné souřadnice, zprávy, produkty, ochranné známky, citace * příklady vCOinS, hCite, hCalendar, hCard, hNews, hProduct, hResume, hRecipe Proč mikroformáty? Využití COinS •Mabbett, Andy (2010). Pink Floyd - The Music and the Mystery. London: Omnibus,. ISBN 9781849383707. • • …a využití hCite •Mabbett, Andy (2010). Pink Floyd – The Music and the Mystery. London: Omnibus. ISBN 9781849383707. •Mabbett, Andy (2010). •Pink Floyd - The Music and the Mystery. London: •Omnibus. •ISBN 9781849383707. • Identifikátory Klasické identifikátory * ISBN – International Standard Book Number * ISSN - International Standard Serial Number * ISMN – International Standard Music Number for Printed Music * ISAN – International Standard Audiovisual Number * ISRN – International Standard Technical Report Number ISBN * vznik 1966 * agentura ISBN v Berlíně (1972) * v ČR NK v Praze * ISBN-10 a ISBN-13 (od 1.1.2007) * Info o ISBN v NK ČR * www.isbn-international.org ISBN Syntaxe * ISBN 80-00-01987-6 v videntifikátor skupiny videntifikátor nakladatele videntifikátor titulu vkontrolní číslice * ISSN * seriálové publikace * 60. léta * agentura ISSN v Paříži (1974) * v ČR NTK v Praze * ISSN-8 * www.issn.cz * www.issn.org * URN * Uniform Resource Name System * s obsahem směrovacího mechanismu * identifikace obsahu konkrétního objektu bez ohledu na jeho lokaci * globálně nepodporují www prohlížeče * systém není rozšířený na celém internetu * směrovací služby jsou za úplatu URN - syntaxe * URN:nid:nss v vNamespace Identifier- identifikátor určitého identifikačního systému (např. DOI) vNamespace-Specific String je konkrétní identifikátor v daném systému URI * Uniform Resource Identifier * obecný koncept * může popisovat identitu (URN), lokaci (URL) nebo oboje současně Výsledek obrázku Zdroj: https://danielmiessler.com/study/url-uri/ DOI * Digital Object Identifier * iniciativa komerčních vydavatelů * snaha o vybudování komplexního systému na správu a řízení vlastnických a autorských práv * centralizovaný, placený systém * využití např. v CrossRef vpro vytváření citačních vazeb v oblasti vědeckých publikací (citation-linking) vzpřístupňování plných textů DOI Syntaxe * doi:10.1006/123456 v vkonstanta 10 pro označení systému DOI vnumerický identifikační kód registrující organizace, vydavatele vjednoznačný identifikátor digitálního objektu v rámci dané registrující organizace * Ochrana a identifikace dokumentů Magnetické proužky * zabezpečení dokumentů http://www.lse.cz/images/TT_002.jpg http://www.3m.co.uk/intl/uk/library/LibrarySolutions/Tapes_and_Tagging/Applying-3M-Tattle-Tape-%281 %29.jpg Zdroj: 3M RFID * čipy do dokumentů * ochrana + identifikace * výpůjčky a vracení vvíce výpůjček najednou vnení potřeba knihy otevírat vjednodušší manipulace vautomatická deaktivace vautomatické třídění po vracení * revize a kontrola řazení na regálu * vyšší cena čipů 3M ISO RFID Tags Zařízení http://rfidproknihovny.cz/wp-content/uploads/2013/04/LibMaster_Pilar_240x300.png Smartstation smartgate100 smartstock200 smartreturn300 http://www.lse.cz/images/DLA_002.jpg http://www.lse.cz/images/SCH_V_002.jpg http://www.lse.cz/images/SCH_S_002.jpg Přechod na RFID * nákladné přečipování (větších) fondů * nutno dokoupit zařízení pro (de)aktivaci a brány * různé druhy čipů (standardy), kompatibilita * časová náročnost * dnes více producentů v3M, Cosmotron, ORIS,… * Využití v praxi * http://www.cdsol.com.my:8800/cdsol/images/newimage/3m/libraryEnvironment/tattleTapeRFID.jpg Zdroj: http://www.cdsol.com.my:8800/cdsol/index.php/menu3mlsp/libraryenviroment/tattletaperfid NFC (Near Field Communication) * rozšířená verze RFID * podpora v mobilních zařízeních * funguje na menší vzdálenosti než RFID (cca. 10cm) * výhodou větší bezpečnost * čipy s podporou RFID i NFC * půjčování přes mobil, podpora moderních služeb knihoven * ukázka fungování Klasifikace zdrojů MDT * Mezinárodní desetinné třídění * vznik poč. 20. století * Paul Otlet a Henri la Fontaine (BEL) * Spravuje Konzorcium pro MDT v Haagu * v ČR se obvykle užívá k řazení odborné literatury MDT – základní třídy Č. Skupina 0 Všeobecnosti 1 Filozofie 2 Náboženství 3 Společenské vědy 4 - - - 5 Přírodní vědy 6 Lékařství, technika, zemědělství, průmysl, zemědělství 7 Umění, zábava, sport 8 Jazykověda, literatura, písemnictví 9 Geografie, historie, životopisy DDT * Dewey Decimal Classification * 1876 – Melvil Dewey * revize po 7 letech * využití zejména v anglo-americkém prostředí • DDT – základní třídy Č. Skupina 000 Všeobecné 100 Filozofie 200 Náboženství 300 Sociologie 400 Filologie 500 Přírodní vědy 600 Užité vědy 700 Umění 800 Literatura, rétorika 900 Geografie, historie LCC * Library of Congress Classification * vznik pro potřeby LoC v 19. stol. * vychází z dokumentů, které jsou v LoC vna rozdíl od DDC a MDT – univerzální systémy LCC – základní třídy Kód Skupina A General Works B Philosophy, Psychology, and Religion C Auxiliary Sciences of History D General and Old World History E History of America F History of USA and British, Dutch, French, and Latin America G Geography, Anthropology, and Recreation H Social Sciences J Political Science K Law L Education M Music N Fine Arts LCC – základní třídy Kód Skupina P Language and Literature Q Science R Medicine S Agriculture T Technology U Military Science V Naval Science Z Bibliography, Library Science, and General Information Resources Závěr •Děkuji Vám za pozornost billboard •Martin Krčál •krcal@phil.muni.cz