Digitální knihovny Metadata I Miroslav Bartošek Ústav výpočetní techniky MU Knihovnicko-informační centrum MU FI MU 2020 M.Bartošek - Digitální knihovny 2 obecný rámec a architektura DL intelektuální vlastnictví & ekonomika vícejazyčný přístup k informacím metadata interoperabilita globální vyhledávání zdrojů zobecněný model dokumenu dlouhodobé uchovávání digitální informace budování sbírek digitalizace born digital harvesting Obsah přednášky FI MU 2020 M.Bartošek - Digitální knihovny 3 1. Úvod a přehled 2. Knihovnická metadata – MARC Síťová metadata 3. RFC 1807 4. DC – Dublin Core 5. Metadata Kongresové knihovny 1. Metadata – přehled FI MU 2020 M.Bartošek - Digitální knihovny 4 1. Metadata – definice FI MU 2020 M.Bartošek - Digitální knihovny 5 • Metadata = (strukturovaná) data o datech • popisují – OBSAH zdroje (o čem) – KONTEXT (kdo, kde, proč) – STRUKTURU zdroje (jak) – … další • Metadata consists of statements we make about resources to help us find, identify, use, manage, evaluate, and preserve them. Marty Kurth, tutorial on DC Semantics, http://dc2006.ucol.mx/program.htm • Metadata = VELMI široké téma ! 1. Příklady FI MU 2020 M.Bartošek - Digitální knihovny 6 Katalogizační lístek v knihovně • Popis knih – jmenný rejstřík, věcný rejstřík, … Katalog předmětů v IS MU • Popis vyučovaných kurzů Záhlaví webové stránky • Popis webové stránky ( … EXIF záznam v obrázku JPEG • Popis fotografie FI MU 2020 M.Bartošek - Digitální knihovny 7 https://commons.wikimedia.org/wiki/File:Fichier_reserve_Bibliotheque_Sainte-Genevieve_n2.jpg, CC-BY 2.5 1. Knihovnická x síťová metadata FI MU 2020 M.Bartošek - Digitální knihovny 8 Metadata z pohledu DL • dlouhá a „usazená“ tradice v knihovnách (katalogy, rejstříky, …) • bouřlivý (živelný?) vývoj v digitálním prostředí • klasická knihovnická metadata : kompletní popis • síťová metadata : specializovaná ! • příčiny odlišností – způsob tvorby centrální x různé nezávislé komunity ruční x automatizovaný – způsob přístupu ke zdroji nepřímý x přímý 1.1 Typologie metadat FI MU 2020 M.Bartošek - Digitální knihovny 9 a) Základní typy metadat – podle jejich účelu – popisná popis objektu – pro potřeby vyhledání, identifikace, výběru (název, autor, abstrakt, žánr, datum, …) standardy: MARC, Dublin Core, MODS – strukturální struktura objektu – pro potřeby uložení, zobrazování a navigace v rámci složitého/složeného objektu (části, hierarchie, strukturální mapa, pozice části v objektu, …) standardy: METS, RDF, MARC – administrativní správa objektu – technická metadata, archivační metadata, metadata pro popis práv k danému objektu (typ a velikost souboru, kontrolní součet, způsob komprese, držitelé práv k objektu, licenční podmínky, …) standardy: PREMIS Metadatový standard (metadatové schéma) vybraná sada metadatových prvků s přesně definovaným významem pro použití v určité oblasti (MARC, Dublin Core, TEI, MODS, MADS, RDF, Premis, …) 1.1 Typologie metadat FI MU 2020 M.Bartošek - Digitální knihovny 10 b) podle oblasti nasazení – popis/vyhledávání zdrojů (Dublin Core, MARC, MODS, RFC 1807, TEI) – identifikace (DOI metadata, BibTeX) – dlouhodobá archivace (PREMIS) – IPR, e-commerce (XrML, ODRL, INDECS, ONIX, MPEG-21) – content rating (PICS) – interoperabilita (METS, RDF, MPEG-21 DIDL) – formátově specializovaná (MPEG-7, TIFF, EXIF) – oborově specializovaná (fyzika, CSDGM – GIS, medicína…) – ... c) podle místa uložení – vložená přímo do zdroje (záhlaví HTML, JPEG-EXIF metadata, XML zdroje) – embedded – externí – asociovaná (databáze metadat těsně svázané se zdroji) – externí – třetí strana (v nezávislých DB, bez přímé kontroly zdroje, viz např. abstraktové databáze) – centralizovaná x distribuovaná Typů a druhů metadat pro různé oblasti nasazení existuje fakt hodně… FI MU 2020 M.Bartošek - Digitální knihovny 11 https://xkcd.com/927/ FI MU 2020 M.Bartošek - Digitální knihovny 12 http://jennriley.com/metadatamap/ Typologie metadat – podle oblastí a komunit (ilustrační obrázek) FI MU 2020 M.Bartošek - Digitální knihovny 13 Typologie metadat – podle funkce a účelu (ilustrační obrázek) http://jennriley.com/metadatamap/ 2. Knihovnická metadata MARC FI MU 2020 M.Bartošek - Digitální knihovny 14 2. Rodina standardů MARC FI MU 2020 M.Bartošek - Digitální knihovny 15 • MARC = MAchine Readable Cataloguing record (LoC, od 1965) • obecná struktura bibliografického záznamu – kódovací schéma pro prvky záznamu (markup) – výměnný formát pro přenos záznamů (transfer syntax) • velmi rozšířený - spolupráci mezi knihovnami a různými systémy – souborné katalogy (union catalogues) – výměna (bibliografických) záznamů • velmi bohatá struktura (stovky polí a podpolí !) + úsporný zápis • rodina formátů typu MARC: – USMARC, CANMARC, UKMARC, … -> MARC21 – UNIMARC (IFLA, 1977, nejprve jako převodní můstek) → UNIMARC-CZ (93) 2.1 Pole podpole MARC FI MU 2020 M.Bartošek - Digitální knihovny 16 • MARC záznam se skládá z polí proměnné délky • pole může být členěno do podpolí (opakování) 700 #1 $aNovák$bJan$f1953-pole podpole podpole podpole indentifikátor pole „Primární Intelektuální odpovědnost“ indikátory identifikátor podpole 2.2 UNIMARC – řádkový FI MU 2020 M.Bartošek - Digitální knihovny 17 001 CASLIN0000001 005 19960312 010 $a80-7050-237-1 100 $a19960305d1996####k##y0czey0103####ba 101 0# $acze 102 $aCZ 200 1# $aZáznam pro souborný katalog$eUNIMARC$iTištěné monografie $fPracovní skupina CASLIN pro standardizaci a jmenné ... 205 $a1. vyd. 210 $aPraha$cNárodní knihovna České republiky$d1996 215 $a31 s. 225 1# $aStandardizace$vč. 4 675 $a025.3$9v 711 02 $aCASLIN$bPracovní skupina pro standardizaci a ... 801 #0 $aCZ$bABA001$c19960312$gAACR2$91 801 #3 $aCZ$bABA001$c19960515 910 $aABA001 2.3 UNIMARC – přehled FI MU 2020 M.Bartošek - Digitální knihovny 18 • UNIMARC – bloky polí: – 0xx blok identifikačních čísel • 5xx souvisejících názvů – 1xx kódovaných informací • 6xx předmětové analýzy – 2xx popisných informací • 7xx intelekt. zodpovědnosti – 3xx poznámek • 8xx zdrojových informací – 4xx propojovacích polí • 9xx národního použití • marc-ovskou strukturu doplňují: – katalogizační pravidla - jak zapisovat data do polí a podpolí AACR2: Anglo-American Cataloging Rules , od 2015 RDA: Resource Descript. and Access – soubory autorit (národní, lokální) – další instrukce a systémy (klasifikační pravidla, LCSH, …) • MARC pro bibliografický záznam x MARC pro záznam autorit 2.4 Proč soubory autorit? FI MU 2020 M.Bartošek - Digitální knihovny 19 • 47 různých variant jednoho jména v dokumentech v LoC Qaddafi, Muammar Muammar al-Qadhafi Qathafi, Muammar Gadhafi, Mo ammar Mu ammar al-Qadhdhafi Gheddafi, Muammar Kaddafi, Muammar Qadafi, Mu ammar Muammar Gaddafy Qadhafi, Muammar El Kazzafi, Moamer Muammar Ghadafi El Kadhafi, Moammar Gaddafi, Moamar Muammar Ghaddafi Kadhafi, Moammar Al Qathafi, Mu ammar Muammar Al-Kaddafi Moammar Kadhafi Al Qathafi, Muammar Muammar Qathafi Gadafi, Muammar Qadhdhafi, Mu ammar Muammar Gheddafi Mu ammar al-Qadafi Kaddafi, Muammar Khadafy, Moammar Moamer El Kazzafi Muammar al-Khaddafi Qudhafi, Moammar Moamar al-Gaddafi Mu amar al-Kad’afi Qathafi, Mu’Ammar el Mu ammar Al Qathafi Kad’afi, Mu amar al- El Quathafi, Mu’Ammar Muammar Al Qathafi Gaddafy, Muammar Kadaffi, Momar Mo ammar el-Gadhafi Gadafi, Muammar Ed Gaddafi, Moammar Muammar Kaddafi Gaddafi, Muammar Moamar el Gaddafi Moamar El Kadhafi Kaddafi, Muamar 2.5 MARC a UNIMARC FI MU 2020 M.Bartošek - Digitální knihovny 20 MARC (Loc, 60.léta) UNIMARC (IFLA, 1977) USMARC, UKMARC, CANMARC, OCLCMARC UNIMARC-XX , UNIMARC-CZ MARC21 ??? MU-Aleph http://www.loc.gov/marc/ http://www.ifla.org/publications/unimarc-formats-and-related-documentation 2.5 MARC a UNIMARC FI MU 2020 M.Bartošek - Digitální knihovny 21 • Odchylky UNIMARC x MARC21 (granularita, interpunkce, vazební pole) UNIMARC: 700 $aNovák$bJan$f1953- MARC21: 100 $aNovák, Jan, $d1953• UNIMARC = modernější MARC21 = úspěšnější (podporovanější, LoC) – de-facto standard • => přechod na MARC21 (i v ČR - 2004) • 2 způsoby zobrazení/uložení marcovské struktury: – řádkový MACR (přehlednější, pro člověka) – výměnný formát – ISO2709 (pro přenosy a strojové zpracování) • jedna dlouhá „nudle“ (formát pro MGP) 2.6.1 Řádkový UNIMARC FI MU 2020 M.Bartošek - Digitální knihovny 22 001 CASLIN0000001 005 19960312 010 $a80-7050-237-1 100 $a19960305d1996####k##y0czey0103####ba 101 0# $acze 102 $aCZ 200 1# $aZáznam pro souborný katalog$eUNIMARC$iTištěné monografie $fPracovní skupina CASLIN pro standardizaci a jmenné ... 205 $a1. vyd. 210 $aPraha$cNárodní knihovna České republiky$d1996 215 $a31 s. 225 1# $aStandardizace$vč. 4 675 $a025.3$9v 711 02 $aCASLIN$bPracovní skupina pro standardizaci a ... 801 #0 $aCZ$bABA001$c19960312$gAACR2$91 801 #3 $aCZ$bABA001$c19960515 910 $aABA001 2.6.2 ISO 2709 UNIMARC • návěští (24 úvodních znaků) • adresář (12 znaků na každé pole): ident (3) + délka (4) + v.pozice (5) • tělo záznamu (hodnoty polí včetně identifikace podpolí) FI MU 2020 M.Bartošek - Digitální knihovny 23 2.7 MARC – shrnutí FI MU 2020 M.Bartošek - Digitální knihovny 24 Plus: - velmi kvalitní, podrobná metadata - MARCXML – revitalizace + oddělení datových prvků od struktury Mínus: - cena 50-110 USD / úplný bibliografický záznam - složitost tvorby (jen zaškolený katalogizátor) - vhodnost pro digitální dokumenty ?? • LoC: 300.000 bibliografických záznamů ročně • OCLC: 34 miliónů MARC-záznamů (30.000 člověkoroků práce) • tradeoff: cena metadat –versus- přínos pro vyhledávání • Digitální prostředí – změna ekonomického modelu: – přístup lze poskytnout i s malými investicemi do metadat – high-quality (drahá) metadata ospravedlnitelná pro velmi cenné zdroje Síťová popisná metadata 3. RFC 1807 FI MU 2020 M.Bartošek - Digitální knihovny 26 3.1 RFC 1807 – úvod FI MU 2020 M.Bartošek - Digitální knihovny 27 • první pragmatický pokus o jednoduchý Inet standard • RFC 1807 : „A Format for Bibliographic Records“ (June 1995) • Cornell – Dienst Protocol (NCSTRL) • 29 prvků (4 povinné) – každý prvek začíná tagem ukončeným dvojicí dvojteček :: – na pořadí prvků nezáleží – prvek se může lib. opakovat (pořadí opakování je významné) – pouze ASCII znaky • keep it simple ! dnes již spíš jen historická zajímavost 3.2 RFC 1807 – příklad FI MU 2020 M.Bartošek - Digitální knihovny 28 BIB-VERSION:: CS-TR-v2.1 ID:: OUKS//CS-TR-91-123 ENTRY:: January 15, 1992 ORGANIZATION:: Oceanview University, Kansas, Computer Science TYPE:: Technical Report REVISION:: January 5, 1995; FTP access information added TITLE:: Scientific Communication must be timely AUTHOR:: Finnegan, James A. CONTACT:: Prof. J. A. Finnegan, CS Dept, Oceanview Univ, Oceanview, KS 54321 Tel: 913-456-7890 COPYRIGHT:: Copyright for the report (c) 1991, by J. A. Finnegan. All rights reserved. Permission is … HANDLE:: hdl:oceanview.electr/CS-TR-91-123 OTHER_ACCESS:: url:http://electr.oceanview.edu/CS-TR-91-123 OTHER_ACCESS:: url:ftp://electr.oceanview.edu/CS-TR-91-123 RETRIEVAL:: send email to Finnegan@cs.ouks.edu with fax number KEYWORD:: Scientific Communication CR-CATEGORY:: C.2.2 Computer Sys Org, Communication nets, Net Protocols SERIES:: Communication FUNDING:: FAS CONTRACT:: FAS-91-C-1234 MONITORING:: FNBO LANGUAGE:: English NOTES:: This report is the full version of the paper with the same title in IEEE Trans ASSP Dec 1976 ABSTRACT:: Many alchemists in the country work on important fusion them…. END:: OUKS//CS-TR-91-123 4. Dublin Core FI MU 2020 M.Bartošek - Digitální knihovny 29 4. DC – motivace FI MU 2020 M.Bartošek - Digitální knihovny 30 Motto: • "The association of standardized descriptive metadata with networked objects has the potential for substantially improving resource discovery capabilities by enabling field-based (e.g., author, title) searches, permitting indexing of non-textual objects, and allowing access to the surrogate content that is distinct from access to the content of the resource itself." (Weibel and Lagoze, 1997) • MARC = maximalistický přístup • DC = minimalistický přístup 4.1 Dublin Core – požadavky FI MU 2020 M.Bartošek - Digitální knihovny 31 x klasická bibliografická metadata pro vyhledávání – příliš složitá x automaticky generovaná metadata vyhledávači – příliš jednoduchá • Dublin Core – kompromis : základní metadatové prvky (jádro) společné pro popis jakéhokoliv zdroje • Hlavní požadavky – jednoduchý pro autorskou samokatalogizaci – flexibilní rozšiřitelný, pokud je třeba – univerzální co nejširší spektrum oborů a aplikací – mezinárodní mezinárodní konsensus, národní verze – interoperabilita základ pro sémantickou interoperabilitu • nejčastější použití: popis el.zdrojů za účelem jejich efektivnějšího vyhledání na webu 4.2 Vznik Dublin Core FI MU 2020 M.Bartošek - Digitální knihovny 32 • 1995 – ustavující workshop (Dublin-Ohio, OCLC/NCSA) – webaři – knihovníci – návrháři informačních systémů, … • DCMI (Dublin Core Metadata Initiative) – koordinace rozvoje – pracovní skupiny – každoroční workshop („valná hromada“) • dvě verze DC: – jednoduchý („nekvalifikovaný“) – kvalifikovaný • Jednoduchý DC: 15 základních prvků 4.3 Jednoduchý DC FI MU 2020 M.Bartošek - Digitální knihovny 33 obsah vlastnictví instance Title Creator Identifier Subject Contributor Date Description Publisher Language Coverage Rights Format Type Source Relation Audience (Provenance, Rights Holder) • každý prvek nepovinný, opakovatelný, na pořadí prvků nezáleží • pro každý prvek je dána jeho přesná sémantika • syntaxi standard nedefinuje (záležitost doporučení, řízených slovníků) • tvůrci aplikací mohou rozšířit základní sadu o své specifické prvky • metadatový záznam buď vložen do zdroje nebo uložen externě • popis prvků: http://www.ics.muni.cz/dublin_core/terms.html 4.3.1 Prvky DC FI MU 2020 M.Bartošek - Digitální knihovny 34 • Title Def: Jméno dané zdroji. Komentář: Nejčastěji bude jméno tvořit název, pod nímž je zdroj oficiálně znám. • Creator Def: Entita primárně zodpovědná za vytvoření obsahu zdroje. Komemtář: Příkladem může být osoba, organizace nebo služba. • Contributor Def: Entita, která přispěla k obsahu zdroje. • Date Def: Datum události, která se vyskytla během existence zdroje. Komentář: Datum bude většinou spojeno s vytvořením nebo zpřístupněním zdroje. • Coverage Def: Rozsah nebo záběr obsahu zdroje. Komentář: Většinou bude obsahovat prostorové umístění (jméno místa nebo zeměpisné souřadnice), časové období (označení období) nebo jurisdikci (např. jméno správní jednotky). 4.3.1 Prvky DC – příklad definice FI MU 2020 M.Bartošek - Digitální knihovny 35 • Description – Popis Definice: Vysvětlení obsahu zdroje. Komentář: Může obsahovat abstrakt, obsah odkaz na grafické nebo textové vyjádření obsahu. • Subject – Předmět Definice: Předmět a klíčová slova. Komentář: Nejčastěji klíčová slova nebo klasifikační znaky z řízeného slovníku. • Source – Zdroj Definice: Odkaz na zdroj, ze kterého je odvozen metadatový záznam. • Relation – Vztah Definice: Odkaz na příbuzný zdroj. Komentář: Příkladem je odkaz na starou nebo novou verze zdroje, část zdroje apod. • Rights – Práva Definice: Informace o právech vztahujících s k danému zdroji. Komentář: Většinou obsahuje ustanovení o vlastnických či autorských právech ke zdroji nebo odkaz na službu poskytující takové informace. 4.3.1 Prvky DC – příklad definice FI MU 2020 M.Bartošek - Digitální knihovny 36 • Publisher – Vydavatel Definice: Entita zodpovědná za zpřístupnění zdroje. Komentář: Příkladem může být osoba, organizace nebo služba. • Language – Jazyk Definice: Jazyk intelektuálního obsahu zdroje. Komentář: Doporučuje se použít RFC 3066, která ve spojení s ISO639 definuje kódy jazyků. • Type – Typ Definice: Povaha nebo druh (žánr) obsahu zdroje. Komentář: Termíny popisující obecné kategorie či funkce obsahu. • Format – Formát Definice: Fyzické nebo digitální provedení zdroje. Komentář: Většinou obsahuje souborový formát, typ média nebo rozměry zdroje. • Identifier – Identifikátor Definice: Identifikátor zdrojei. Komentář: Slouží k identifikaci zdroje znakovým řetězem nebo číslem z nějakého formálního identifikačního systému (URL, DOI, ISBN apod). 4.4 Kvalifikovaný DC FI MU 2020 M.Bartošek - Digitální knihovny 37 • Jak zpřesnit popis zdroje pomocí DC ? • Kvalifikovaný DC : – kvalifikátor prvku (zužuje sémantiku: Creator.Author, Creator.Illustrator) – kvalifikátor hodnoty (interpretace hodnoty: Datum=1994-04-12:ISO8601) • dumb-down principle • DCMI Terms = 15 základních prvků DC + 40 kvalifikátorů http://dublincore.org/documents/dcmi-terms/ • Možnost definovat vlastní kvalifikátory (interoperabilita?) 4.4.1 Kvalifikátory FI MU 2020 M.Bartošek - Digitální knihovny 38 prvek kvalifikátor prvku kvalifikátor hodnoty Title Alternative -- Subject -- LCSH, MeSH, DDC, LCC, UDC Description Table of Contents -- Abstract Date Created, Valid, Issued DCMI Period, W3C-DTF Type -- DCMI Type Format Extent, Medium -- Identifier -- URI Source -- URI Language -- ISO 639-2, RFC 1766 Relation Is Version Of URI Has Version Is Replaced By, … Coverage Spatial DCMI Point, ISO 3166, DCMI Box Temporal DCMI Period, W3C-DTF 4.5 Kvalifikovaný DC - příklad FI MU 2020 M.Bartošek - Digitální knihovny 39 IDENTIFIER = http://www.ukoln.ac.uk/metadata/resources/dc/datamodel/WD-dc-rdf : URL TITLE = Guidance on expressing the Dublin Core within the RDF TITLE = Dublin Core in RDF: Eine Anleitung CREATOR = Eric Miller CREATOR = Paul Miller CREATOR.Illustrator = Dan Brickley DESCRIPTION.Abstract = This paper describes work carried out by … SUBJECT.Keywords = Dublin Core; DC; Resource Description Framework; RDF; XML PUBLISHER = Dublin Core Metadata Initiative CONTRIBUTOR = Dublin Core Data Model Working Group DATE.Created = 1999-07-01 : ISO8601 DATE.Revised = 1999-11-10 : ISO8601 LANGUAGE = en : RFC1766 TYPE = Working Draft FORMAT.Medium = text/html : IMT MYELEMENT.Checksum = 123456 : XYZ 4.5.1 Zápis v HTML FI MU 2020 M.Bartošek - Digitální knihovny 40 Guidance on expressing the Dublin Core within the RDF … 4.5.2 Zápis v XML FI MU 2020 M.Bartošek - Digitální knihovny 41 Expressing Simple Dublin Core in RDF/XML This document explains how to encode the DCES in … 2001-09-20 Dave Beckett Eric Miller Dan Brickley text/html en Dublin Core Metadata Initiative 4.6 DC – aktuální stav FI MU 2020 M.Bartošek - Digitální knihovny 42 • DCMI (Dublin Core Metadata Initiative) – koordinace rozvoje • Každoroční konference International Conference on Dublin Core and Metadata Applications • Internetovské doporučení – RFC 5013-2007 • de-facto standard přeložený do desítek jazyků • český překlad http://www.ics.muni.cz/dublin_core • standardizace: NISO Z39.85-2007 ISO 15836:2009 • využití DC v OAI • nástroje pro generování DC-záznamů, … • http://dublincore.org 4.7 Zkušenosti z praxe FI MU 2020 M.Bartošek - Digitální knihovny 43 • "Developing a metadata scheme requires balancing richness and complexity against simplicity and ease of application. If it is too simple, the resulting description may not support desired functionality, but if it is too complex, few will apply it accurately or use it at all.“ David Ruddy, DML 2010 • Zkušenosti z EuDML x DML-CZ (články) – název: podnázev? Více jazykových variant – originální název? – autor: pořadí autorů? – bibliografické údaje článku? (časopis, ročník, stránkování) – citované články? – dostupnost plného textu? – nadstandardní typy údaju? tagovaný nekvalifikovaný DC FI MU 2020 M.Bartošek - Digitální knihovny 44 pořadí! 4.8 DC – zhodnocení FI MU 2020 M.Bartošek - Digitální knihovny 45 Dublin Core • velký úspěch – rozšíření – DC – stavební kámen pro další technologie (OAI-PMH) • nenaplněná očekávání – rozpor mezi jednoduchostí a použitelností – pro řadu aplikací DC nepoužitelný • Nový favorit = MODS ? 5. Metadatové schéma LC FI MU 2020 M.Bartošek - Digitální knihovny 46 5. LoC – Core Metadata Elements FI MU 2020 M.Bartošek - Digitální knihovny 47 • Historický „firemní standard“ pro National DL Program, LoC • strukturální, administrativní, částečně i popisná metadata pro podporu všech funkcí DL (řízení přístupu, vyhledávání, prezentace, administrace, identifikace, archivace) • 5-stupňová úroveň metadat: – set jedna digitální sbírka; tvoří ji jeden či více agregátů – agregát skupina DO stejného typu (text,video) či správy – primární objekt ekvivalent fyzické položky - kniha, zvuková nahrávka – meziobjekt různý pohled, komponenta primárního objektu (kniha: 1. naskenované obrázky jednotl. stran, 2. prohledávatelné texty stran) – terminální objekt soubor/y s digitální informací • 77 metadat. prvků http://lcweb.loc.gov/standards/metadata.html 5.1 Příklad FI MU 2020 M.Bartošek - Digitální knihovny 48 • Fyzická sbírka Alexander Graham Bell Family Papers • Digitální sbírka AM, The A.G.Bell Family Papers, 1862-1939 http://memory.loc.gov/ammem/bellhtml/bellhome.html • Artefakt Dopis od A.M.Bella → A.G.Bellovi z 2.3.1864 • Popis jeden list oboustranně psaného rukopisu, plus přepis na psacím stroji (2 stránky) • celkem 4 různé obrázky plus textový přepis • náhledová stránka obsahuje náhled jednoho obrázku (96 dpi), navigační odkazy na další/předchozí navigační stránku, odkaz na referenční obrázek v plném rozlišení, na domovskou stránku, … • referenční archivní obrázky jsou v rozlišení 300 dpi • metadata pro tento 1 artefakt tvoří 16 metadatových záznamů 5.2 A.G.Bell Family Papers FI MU 2020 M.Bartošek - Digitální knihovny 49 5.2 A.G.Bell Family Papers FI MU 2020 M.Bartošek - Digitální knihovny 50 5.2 A.G.Bell Family Papers FI MU 2020 M.Bartošek - Digitální knihovny 51 5.2 A.G.Bell Family Papers FI MU 2020 M.Bartošek - Digitální knihovny 52 struktura metadatových záznamů pro dopis A.M.Bella • Set Alexander Graham Bell Family Papers • Agregate 1 záznam: jediný typ dokumentů • PrimaryO dopis AMB z 2.3.1864 • Meziobjekt SGML verze náhled.stránky ref.arch.obrázky • TerminalO SGML soubor 1.str rukopisu 1.str rukopisu linky na obr. 2.str rukopisu 2.str rukopisu linky na SGML syst.soub 1.str strojopisu 1.str strojopisu podpora pro SGML browser 2.str strojopisu 2.str strojopisu • 16 metadatových záznamů pro 1 objekt sbírky ! Literatura FI MU 2020 M.Bartošek - Digitální knihovny 53 Doplňková literatura FI MU 2020 M.Bartošek - Digitální knihovny 54 • NISO 2017: Understanding metadata. https://www.niso.org/publications/understanding-metadata-2017 • Dublin Core Metadata Initiative – Metadata Basics http://dublincore.org/metadata-basics/