Digitální knihovny
Metadata I
Miroslav Bartošek
Ústav výpočetní techniky MU
Knihovnicko-informační centrum MU
FI MU 2020 M.Bartošek - Digitální knihovny 2
obecný rámec a architektura DL
intelektuální vlastnictví
& ekonomika
vícejazyčný přístup k
informacím
metadata interoperabilita
globální vyhledávání zdrojů
zobecněný model dokumenu
dlouhodobé uchovávání digitální informace
budování sbírek
digitalizace born digital harvesting
Obsah přednášky
FI MU 2020 M.Bartošek - Digitální knihovny 3
1. Úvod a přehled
2. Knihovnická metadata – MARC
Síťová metadata
3. RFC 1807
4. DC – Dublin Core
5. Metadata Kongresové knihovny
1. Metadata – přehled
FI MU 2020 M.Bartošek - Digitální knihovny 4
1. Metadata – definice
FI MU 2020 M.Bartošek - Digitální knihovny 5
• Metadata = (strukturovaná) data o datech
• popisují
– OBSAH zdroje (o čem)
– KONTEXT (kdo, kde, proč)
– STRUKTURU zdroje (jak)
– … další
• Metadata consists of statements we make about resources to help us
find, identify, use, manage, evaluate, and preserve them.
Marty Kurth, tutorial on DC Semantics,
http://dc2006.ucol.mx/program.htm
• Metadata = VELMI široké téma !
1. Příklady
FI MU 2020 M.Bartošek - Digitální knihovny 6
Katalogizační lístek v knihovně
• Popis knih – jmenný rejstřík,
věcný rejstřík, …
Katalog předmětů v IS MU
• Popis vyučovaných kurzů
Záhlaví webové stránky
• Popis webové stránky (
…
EXIF záznam v obrázku JPEG
• Popis fotografie
FI MU 2020 M.Bartošek - Digitální knihovny 7
https://commons.wikimedia.org/wiki/File:Fichier_reserve_Bibliotheque_Sainte-Genevieve_n2.jpg, CC-BY 2.5
1. Knihovnická x síťová metadata
FI MU 2020 M.Bartošek - Digitální knihovny 8
Metadata z pohledu DL
• dlouhá a „usazená“ tradice v knihovnách (katalogy, rejstříky, …)
• bouřlivý (živelný?) vývoj v digitálním prostředí
• klasická knihovnická metadata : kompletní popis
• síťová metadata : specializovaná !
• příčiny odlišností
– způsob tvorby
centrální x různé nezávislé komunity
ruční x automatizovaný
– způsob přístupu ke zdroji
nepřímý x přímý
1.1 Typologie metadat
FI MU 2020 M.Bartošek - Digitální knihovny 9
a) Základní typy metadat – podle jejich účelu
– popisná popis objektu – pro potřeby vyhledání, identifikace, výběru
(název, autor, abstrakt, žánr, datum, …)
standardy: MARC, Dublin Core, MODS
– strukturální struktura objektu – pro potřeby uložení, zobrazování a navigace
v rámci složitého/složeného objektu
(části, hierarchie, strukturální mapa, pozice části v objektu, …)
standardy: METS, RDF, MARC
– administrativní správa objektu – technická metadata, archivační metadata,
metadata pro popis práv k danému objektu
(typ a velikost souboru, kontrolní součet, způsob komprese,
držitelé práv k objektu, licenční podmínky, …)
standardy: PREMIS
Metadatový standard (metadatové schéma)
vybraná sada metadatových prvků s přesně definovaným významem pro použití v určité
oblasti (MARC, Dublin Core, TEI, MODS, MADS, RDF, Premis, …)
1.1 Typologie metadat
FI MU 2020 M.Bartošek - Digitální knihovny 10
b) podle oblasti nasazení
– popis/vyhledávání zdrojů (Dublin Core, MARC, MODS, RFC 1807, TEI)
– identifikace (DOI metadata, BibTeX)
– dlouhodobá archivace (PREMIS)
– IPR, e-commerce (XrML, ODRL, INDECS, ONIX, MPEG-21)
– content rating (PICS)
– interoperabilita (METS, RDF, MPEG-21 DIDL)
– formátově specializovaná (MPEG-7, TIFF, EXIF)
– oborově specializovaná (fyzika, CSDGM – GIS, medicína…)
– ...
c) podle místa uložení
– vložená přímo do zdroje (záhlaví HTML, JPEG-EXIF metadata, XML zdroje) – embedded
– externí – asociovaná (databáze metadat těsně svázané se zdroji)
– externí – třetí strana (v nezávislých DB, bez přímé kontroly zdroje, viz např.
abstraktové databáze)
– centralizovaná x distribuovaná
Typů a druhů metadat pro různé oblasti nasazení existuje fakt hodně…
FI MU 2020 M.Bartošek - Digitální knihovny 11
https://xkcd.com/927/
FI MU 2020 M.Bartošek - Digitální knihovny 12
http://jennriley.com/metadatamap/
Typologie metadat – podle oblastí a komunit (ilustrační obrázek)
FI MU 2020 M.Bartošek - Digitální knihovny 13
Typologie metadat – podle funkce a účelu (ilustrační obrázek)
http://jennriley.com/metadatamap/
2. Knihovnická metadata MARC
FI MU 2020 M.Bartošek - Digitální knihovny 14
2. Rodina standardů MARC
FI MU 2020 M.Bartošek - Digitální knihovny 15
• MARC = MAchine Readable Cataloguing record (LoC, od 1965)
• obecná struktura bibliografického záznamu
– kódovací schéma pro prvky záznamu (markup)
– výměnný formát pro přenos záznamů (transfer syntax)
• velmi rozšířený - spolupráci mezi knihovnami a různými systémy
– souborné katalogy (union catalogues)
– výměna (bibliografických) záznamů
• velmi bohatá struktura (stovky polí a podpolí !) + úsporný zápis
• rodina formátů typu MARC:
– USMARC, CANMARC, UKMARC, … -> MARC21
– UNIMARC (IFLA, 1977, nejprve jako převodní můstek) → UNIMARC-CZ (93)
2.1 Pole podpole MARC
FI MU 2020 M.Bartošek - Digitální knihovny 16
• MARC záznam se skládá z polí proměnné délky
• pole může být členěno do podpolí (opakování)
700 #1 $aNovák$bJan$f1953-pole
podpole podpole podpole
indentifikátor
pole
„Primární
Intelektuální
odpovědnost“
indikátory identifikátor
podpole
2.2 UNIMARC – řádkový
FI MU 2020 M.Bartošek - Digitální knihovny 17
001 CASLIN0000001
005 19960312
010 $a80-7050-237-1
100 $a19960305d1996####k##y0czey0103####ba
101 0# $acze
102 $aCZ
200 1# $aZáznam pro souborný katalog$eUNIMARC$iTištěné monografie
$fPracovní skupina CASLIN pro standardizaci a jmenné ...
205 $a1. vyd.
210 $aPraha$cNárodní knihovna České republiky$d1996
215 $a31 s.
225 1# $aStandardizace$vč. 4
675 $a025.3$9v
711 02 $aCASLIN$bPracovní skupina pro standardizaci a ...
801 #0 $aCZ$bABA001$c19960312$gAACR2$91
801 #3 $aCZ$bABA001$c19960515
910 $aABA001
2.3 UNIMARC – přehled
FI MU 2020 M.Bartošek - Digitální knihovny 18
• UNIMARC – bloky polí:
– 0xx blok identifikačních čísel • 5xx souvisejících názvů
– 1xx kódovaných informací • 6xx předmětové analýzy
– 2xx popisných informací • 7xx intelekt. zodpovědnosti
– 3xx poznámek • 8xx zdrojových informací
– 4xx propojovacích polí • 9xx národního použití
• marc-ovskou strukturu doplňují:
– katalogizační pravidla - jak zapisovat data do polí a podpolí
AACR2: Anglo-American Cataloging Rules , od 2015 RDA: Resource Descript. and Access
– soubory autorit (národní, lokální)
– další instrukce a systémy
(klasifikační pravidla, LCSH, …)
• MARC pro bibliografický záznam x MARC pro záznam autorit
2.4 Proč soubory autorit?
FI MU 2020 M.Bartošek - Digitální knihovny 19
• 47 různých variant jednoho jména v dokumentech v LoC
Qaddafi, Muammar Muammar al-Qadhafi Qathafi, Muammar
Gadhafi, Mo ammar Mu ammar al-Qadhdhafi Gheddafi, Muammar
Kaddafi, Muammar Qadafi, Mu ammar Muammar Gaddafy
Qadhafi, Muammar El Kazzafi, Moamer Muammar Ghadafi
El Kadhafi, Moammar Gaddafi, Moamar Muammar Ghaddafi
Kadhafi, Moammar Al Qathafi, Mu ammar Muammar Al-Kaddafi
Moammar Kadhafi Al Qathafi, Muammar Muammar Qathafi
Gadafi, Muammar Qadhdhafi, Mu ammar Muammar Gheddafi
Mu ammar al-Qadafi Kaddafi, Muammar Khadafy, Moammar
Moamer El Kazzafi Muammar al-Khaddafi Qudhafi, Moammar
Moamar al-Gaddafi Mu amar al-Kad’afi Qathafi, Mu’Ammar el
Mu ammar Al Qathafi Kad’afi, Mu amar al- El Quathafi, Mu’Ammar
Muammar Al Qathafi Gaddafy, Muammar Kadaffi, Momar
Mo ammar el-Gadhafi Gadafi, Muammar Ed Gaddafi, Moammar
Muammar Kaddafi Gaddafi, Muammar Moamar el Gaddafi
Moamar El Kadhafi Kaddafi, Muamar
2.5 MARC a UNIMARC
FI MU 2020 M.Bartošek - Digitální knihovny 20
MARC (Loc, 60.léta)
UNIMARC (IFLA, 1977)
USMARC, UKMARC, CANMARC, OCLCMARC
UNIMARC-XX , UNIMARC-CZ
MARC21 ???
MU-Aleph
http://www.loc.gov/marc/
http://www.ifla.org/publications/unimarc-formats-and-related-documentation
2.5 MARC a UNIMARC
FI MU 2020 M.Bartošek - Digitální knihovny 21
• Odchylky UNIMARC x MARC21 (granularita, interpunkce, vazební pole)
UNIMARC: 700 $aNovák$bJan$f1953- MARC21: 100 $aNovák, Jan, $d1953•
UNIMARC = modernější
MARC21 = úspěšnější (podporovanější, LoC) – de-facto standard
• => přechod na MARC21 (i v ČR - 2004)
• 2 způsoby zobrazení/uložení marcovské struktury:
– řádkový MACR (přehlednější, pro člověka)
– výměnný formát – ISO2709 (pro přenosy a strojové zpracování)
• jedna dlouhá „nudle“ (formát pro MGP)
2.6.1 Řádkový UNIMARC
FI MU 2020 M.Bartošek - Digitální knihovny 22
001 CASLIN0000001
005 19960312
010 $a80-7050-237-1
100 $a19960305d1996####k##y0czey0103####ba
101 0# $acze
102 $aCZ
200 1# $aZáznam pro souborný katalog$eUNIMARC$iTištěné monografie
$fPracovní skupina CASLIN pro standardizaci a jmenné ...
205 $a1. vyd.
210 $aPraha$cNárodní knihovna České republiky$d1996
215 $a31 s.
225 1# $aStandardizace$vč. 4
675 $a025.3$9v
711 02 $aCASLIN$bPracovní skupina pro standardizaci a ...
801 #0 $aCZ$bABA001$c19960312$gAACR2$91
801 #3 $aCZ$bABA001$c19960515
910 $aABA001
2.6.2 ISO 2709 UNIMARC
• návěští (24 úvodních znaků)
• adresář (12 znaků na každé pole): ident (3) + délka (4) + v.pozice (5)
• tělo záznamu (hodnoty polí včetně identifikace podpolí)
FI MU 2020 M.Bartošek - Digitální knihovny 23
2.7 MARC – shrnutí
FI MU 2020 M.Bartošek - Digitální knihovny 24
Plus: - velmi kvalitní, podrobná metadata
- MARCXML – revitalizace + oddělení datových prvků od struktury
Mínus: - cena 50-110 USD / úplný bibliografický záznam
- složitost tvorby (jen zaškolený katalogizátor)
- vhodnost pro digitální dokumenty ??
• LoC: 300.000 bibliografických záznamů ročně
• OCLC: 34 miliónů MARC-záznamů (30.000 člověkoroků práce)
• tradeoff: cena metadat –versus- přínos pro vyhledávání
• Digitální prostředí – změna ekonomického modelu:
– přístup lze poskytnout i s malými investicemi do metadat
– high-quality (drahá) metadata ospravedlnitelná pro velmi cenné zdroje
Síťová popisná metadata
3. RFC 1807
FI MU 2020 M.Bartošek - Digitální knihovny 26
3.1 RFC 1807 – úvod
FI MU 2020 M.Bartošek - Digitální knihovny 27
• první pragmatický pokus o jednoduchý Inet standard
• RFC 1807 : „A Format for Bibliographic Records“ (June 1995)
• Cornell – Dienst Protocol (NCSTRL)
• 29 prvků (4 povinné)
– každý prvek začíná tagem ukončeným dvojicí dvojteček ::
– na pořadí prvků nezáleží
– prvek se může lib. opakovat (pořadí opakování je významné)
– pouze ASCII znaky
• keep it simple !
dnes již spíš jen historická zajímavost
3.2 RFC 1807 – příklad
FI MU 2020 M.Bartošek - Digitální knihovny 28
BIB-VERSION:: CS-TR-v2.1
ID:: OUKS//CS-TR-91-123
ENTRY:: January 15, 1992
ORGANIZATION:: Oceanview University, Kansas, Computer Science
TYPE:: Technical Report
REVISION:: January 5, 1995; FTP access information added
TITLE:: Scientific Communication must be timely
AUTHOR:: Finnegan, James A.
CONTACT:: Prof. J. A. Finnegan, CS Dept, Oceanview Univ, Oceanview, KS 54321 Tel: 913-456-7890
COPYRIGHT:: Copyright for the report (c) 1991, by J. A. Finnegan. All rights reserved. Permission is …
HANDLE:: hdl:oceanview.electr/CS-TR-91-123
OTHER_ACCESS:: url:http://electr.oceanview.edu/CS-TR-91-123
OTHER_ACCESS:: url:ftp://electr.oceanview.edu/CS-TR-91-123
RETRIEVAL:: send email to Finnegan@cs.ouks.edu with fax number
KEYWORD:: Scientific Communication
CR-CATEGORY:: C.2.2 Computer Sys Org, Communication nets, Net Protocols
SERIES:: Communication
FUNDING:: FAS
CONTRACT:: FAS-91-C-1234
MONITORING:: FNBO
LANGUAGE:: English
NOTES:: This report is the full version of the paper with the same title in IEEE Trans ASSP Dec 1976
ABSTRACT:: Many alchemists in the country work on important fusion them….
END:: OUKS//CS-TR-91-123
4. Dublin Core
FI MU 2020 M.Bartošek - Digitální knihovny 29
4. DC – motivace
FI MU 2020 M.Bartošek - Digitální knihovny 30
Motto:
• "The association of standardized descriptive metadata with networked objects has the
potential for substantially improving resource discovery capabilities by enabling field-based
(e.g., author, title) searches, permitting indexing of non-textual objects, and allowing access
to the surrogate content that is distinct from access to the content of the resource itself."
(Weibel and Lagoze, 1997)
• MARC = maximalistický přístup
• DC = minimalistický přístup
4.1 Dublin Core – požadavky
FI MU 2020 M.Bartošek - Digitální knihovny 31
x klasická bibliografická metadata pro vyhledávání – příliš složitá
x automaticky generovaná metadata vyhledávači – příliš jednoduchá
• Dublin Core – kompromis : základní metadatové prvky (jádro) společné
pro popis jakéhokoliv zdroje
• Hlavní požadavky
– jednoduchý pro autorskou samokatalogizaci
– flexibilní rozšiřitelný, pokud je třeba
– univerzální co nejširší spektrum oborů a aplikací
– mezinárodní mezinárodní konsensus, národní verze
– interoperabilita základ pro sémantickou interoperabilitu
• nejčastější použití:
popis el.zdrojů za účelem jejich efektivnějšího vyhledání na webu
4.2 Vznik Dublin Core
FI MU 2020 M.Bartošek - Digitální knihovny 32
• 1995 – ustavující workshop (Dublin-Ohio, OCLC/NCSA)
– webaři
– knihovníci
– návrháři informačních systémů, …
• DCMI (Dublin Core Metadata Initiative) – koordinace rozvoje
– pracovní skupiny
– každoroční workshop („valná hromada“)
• dvě verze DC:
– jednoduchý („nekvalifikovaný“)
– kvalifikovaný
• Jednoduchý DC: 15 základních prvků
4.3 Jednoduchý DC
FI MU 2020 M.Bartošek - Digitální knihovny 33
obsah vlastnictví instance
Title Creator Identifier
Subject Contributor Date
Description Publisher Language
Coverage Rights Format
Type
Source
Relation
Audience (Provenance, Rights Holder)
• každý prvek nepovinný, opakovatelný, na pořadí prvků nezáleží
• pro každý prvek je dána jeho přesná sémantika
• syntaxi standard nedefinuje (záležitost doporučení, řízených slovníků)
• tvůrci aplikací mohou rozšířit základní sadu o své specifické prvky
• metadatový záznam buď vložen do zdroje nebo uložen externě
• popis prvků: http://www.ics.muni.cz/dublin_core/terms.html
4.3.1 Prvky DC
FI MU 2020 M.Bartošek - Digitální knihovny 34
• Title
Def: Jméno dané zdroji.
Komentář: Nejčastěji bude jméno tvořit název, pod nímž je zdroj oficiálně znám.
• Creator
Def: Entita primárně zodpovědná za vytvoření obsahu zdroje.
Komemtář: Příkladem může být osoba, organizace nebo služba.
• Contributor
Def: Entita, která přispěla k obsahu zdroje.
• Date
Def: Datum události, která se vyskytla během existence zdroje.
Komentář: Datum bude většinou spojeno s vytvořením nebo zpřístupněním zdroje.
• Coverage
Def: Rozsah nebo záběr obsahu zdroje.
Komentář: Většinou bude obsahovat prostorové umístění (jméno místa nebo zeměpisné
souřadnice), časové období (označení období) nebo jurisdikci (např. jméno správní jednotky).
4.3.1 Prvky DC – příklad definice
FI MU 2020 M.Bartošek - Digitální knihovny 35
• Description – Popis
Definice: Vysvětlení obsahu zdroje.
Komentář: Může obsahovat abstrakt, obsah odkaz na grafické nebo textové vyjádření obsahu.
• Subject – Předmět
Definice: Předmět a klíčová slova.
Komentář: Nejčastěji klíčová slova nebo klasifikační znaky z řízeného slovníku.
• Source – Zdroj
Definice: Odkaz na zdroj, ze kterého je odvozen metadatový záznam.
• Relation – Vztah
Definice: Odkaz na příbuzný zdroj.
Komentář: Příkladem je odkaz na starou nebo novou verze zdroje, část zdroje apod.
• Rights – Práva
Definice: Informace o právech vztahujících s k danému zdroji.
Komentář: Většinou obsahuje ustanovení o vlastnických či autorských právech ke zdroji nebo
odkaz na službu poskytující takové informace.
4.3.1 Prvky DC – příklad definice
FI MU 2020 M.Bartošek - Digitální knihovny 36
• Publisher – Vydavatel
Definice: Entita zodpovědná za zpřístupnění zdroje.
Komentář: Příkladem může být osoba, organizace nebo služba.
• Language – Jazyk
Definice: Jazyk intelektuálního obsahu zdroje.
Komentář: Doporučuje se použít RFC 3066, která ve spojení s ISO639 definuje kódy jazyků.
• Type – Typ
Definice: Povaha nebo druh (žánr) obsahu zdroje.
Komentář: Termíny popisující obecné kategorie či funkce obsahu.
• Format – Formát
Definice: Fyzické nebo digitální provedení zdroje.
Komentář: Většinou obsahuje souborový formát, typ média nebo rozměry zdroje.
• Identifier – Identifikátor
Definice: Identifikátor zdrojei.
Komentář: Slouží k identifikaci zdroje znakovým řetězem nebo číslem z nějakého formálního
identifikačního systému (URL, DOI, ISBN apod).
4.4 Kvalifikovaný DC
FI MU 2020 M.Bartošek - Digitální knihovny 37
• Jak zpřesnit popis zdroje pomocí DC ?
• Kvalifikovaný DC :
– kvalifikátor prvku
(zužuje sémantiku: Creator.Author, Creator.Illustrator)
– kvalifikátor hodnoty
(interpretace hodnoty: Datum=1994-04-12:ISO8601)
• dumb-down principle
• DCMI Terms = 15 základních prvků DC + 40 kvalifikátorů
http://dublincore.org/documents/dcmi-terms/
• Možnost definovat vlastní kvalifikátory (interoperabilita?)
4.4.1 Kvalifikátory
FI MU 2020 M.Bartošek - Digitální knihovny 38
prvek kvalifikátor prvku kvalifikátor hodnoty
Title Alternative --
Subject -- LCSH, MeSH, DDC, LCC, UDC
Description Table of Contents --
Abstract
Date Created, Valid, Issued DCMI Period, W3C-DTF
Type -- DCMI Type
Format Extent, Medium --
Identifier -- URI
Source -- URI
Language -- ISO 639-2, RFC 1766
Relation Is Version Of URI
Has Version
Is Replaced By, …
Coverage Spatial DCMI Point, ISO 3166, DCMI Box
Temporal DCMI Period, W3C-DTF
4.5 Kvalifikovaný DC - příklad
FI MU 2020 M.Bartošek - Digitální knihovny 39
IDENTIFIER = http://www.ukoln.ac.uk/metadata/resources/dc/datamodel/WD-dc-rdf : URL
TITLE = Guidance on expressing the Dublin Core within the RDF
TITLE = Dublin Core in RDF: Eine Anleitung
CREATOR = Eric Miller
CREATOR = Paul Miller
CREATOR.Illustrator = Dan Brickley
DESCRIPTION.Abstract = This paper describes work carried out by …
SUBJECT.Keywords = Dublin Core; DC; Resource Description Framework; RDF; XML
PUBLISHER = Dublin Core Metadata Initiative
CONTRIBUTOR = Dublin Core Data Model Working Group
DATE.Created = 1999-07-01 : ISO8601
DATE.Revised = 1999-11-10 : ISO8601
LANGUAGE = en : RFC1766
TYPE = Working Draft
FORMAT.Medium = text/html : IMT
MYELEMENT.Checksum = 123456 : XYZ
4.5.1 Zápis v HTML
FI MU 2020 M.Bartošek - Digitální knihovny 40
Guidance on expressing the Dublin Core within the RDF
…
4.5.2 Zápis v XML
FI MU 2020 M.Bartošek - Digitální knihovny 41
Expressing Simple Dublin Core in RDF/XMLThis document explains how to encode the DCES in … 2001-09-20Dave BeckettEric MillerDan Brickleytext/htmlenDublin Core Metadata Initiative
4.6 DC – aktuální stav
FI MU 2020 M.Bartošek - Digitální knihovny 42
• DCMI (Dublin Core Metadata Initiative) – koordinace rozvoje
• Každoroční konference
International Conference on Dublin Core and Metadata Applications
• Internetovské doporučení – RFC 5013-2007
• de-facto standard přeložený do desítek jazyků
• český překlad http://www.ics.muni.cz/dublin_core
• standardizace: NISO Z39.85-2007
ISO 15836:2009
• využití DC v OAI
• nástroje pro generování DC-záznamů, …
• http://dublincore.org
4.7 Zkušenosti z praxe
FI MU 2020 M.Bartošek - Digitální knihovny 43
• "Developing a metadata scheme requires balancing richness and
complexity against simplicity and ease of application.
If it is too simple, the resulting description may not support desired
functionality, but if it is too complex, few will apply it accurately or
use it at all.“
David Ruddy, DML 2010
• Zkušenosti z EuDML x DML-CZ (články)
– název: podnázev? Více jazykových variant – originální název?
– autor: pořadí autorů?
– bibliografické údaje článku? (časopis, ročník, stránkování)
– citované články?
– dostupnost plného textu?
– nadstandardní typy údaju?
tagovaný
nekvalifikovaný DC
FI MU 2020 M.Bartošek - Digitální knihovny 44
pořadí!
4.8 DC – zhodnocení
FI MU 2020 M.Bartošek - Digitální knihovny 45
Dublin Core
• velký úspěch
– rozšíření
– DC – stavební kámen pro další technologie (OAI-PMH)
• nenaplněná očekávání
– rozpor mezi jednoduchostí a použitelností
– pro řadu aplikací DC nepoužitelný
• Nový favorit = MODS ?
5. Metadatové schéma LC
FI MU 2020 M.Bartošek - Digitální knihovny 46
5. LoC – Core Metadata Elements
FI MU 2020 M.Bartošek - Digitální knihovny 47
• Historický „firemní standard“ pro National DL Program, LoC
• strukturální, administrativní, částečně i popisná metadata
pro podporu všech funkcí DL
(řízení přístupu, vyhledávání, prezentace, administrace, identifikace, archivace)
• 5-stupňová úroveň metadat:
– set jedna digitální sbírka; tvoří ji jeden či více agregátů
– agregát skupina DO stejného typu (text,video) či správy
– primární objekt ekvivalent fyzické položky - kniha, zvuková nahrávka
– meziobjekt různý pohled, komponenta primárního objektu
(kniha: 1. naskenované obrázky jednotl. stran,
2. prohledávatelné texty stran)
– terminální objekt soubor/y s digitální informací
• 77 metadat. prvků http://lcweb.loc.gov/standards/metadata.html
5.1 Příklad
FI MU 2020 M.Bartošek - Digitální knihovny 48
• Fyzická sbírka Alexander Graham Bell Family Papers
• Digitální sbírka AM, The A.G.Bell Family Papers, 1862-1939
http://memory.loc.gov/ammem/bellhtml/bellhome.html
• Artefakt Dopis od A.M.Bella → A.G.Bellovi z 2.3.1864
• Popis jeden list oboustranně psaného rukopisu,
plus přepis na psacím stroji (2 stránky)
• celkem 4 různé obrázky plus textový přepis
• náhledová stránka obsahuje náhled jednoho obrázku (96 dpi), navigační odkazy na
další/předchozí navigační stránku, odkaz na referenční obrázek v plném rozlišení,
na domovskou stránku, …
• referenční archivní obrázky jsou v rozlišení 300 dpi
• metadata pro tento 1 artefakt tvoří 16 metadatových záznamů
5.2 A.G.Bell Family Papers
FI MU 2020 M.Bartošek - Digitální knihovny 49
5.2 A.G.Bell Family Papers
FI MU 2020 M.Bartošek - Digitální knihovny 50
5.2 A.G.Bell Family Papers
FI MU 2020 M.Bartošek - Digitální knihovny 51
5.2 A.G.Bell Family Papers
FI MU 2020 M.Bartošek - Digitální knihovny 52
struktura metadatových záznamů pro dopis A.M.Bella
• Set Alexander Graham Bell Family Papers
• Agregate 1 záznam: jediný typ dokumentů
• PrimaryO dopis AMB z 2.3.1864
• Meziobjekt SGML verze náhled.stránky ref.arch.obrázky
• TerminalO SGML soubor 1.str rukopisu 1.str rukopisu
linky na obr. 2.str rukopisu 2.str rukopisu
linky na SGML syst.soub 1.str strojopisu 1.str strojopisu
podpora pro SGML browser 2.str strojopisu 2.str strojopisu
• 16 metadatových záznamů pro 1 objekt sbírky !
Literatura
FI MU 2020 M.Bartošek - Digitální knihovny 53
Doplňková literatura
FI MU 2020 M.Bartošek - Digitální knihovny 54
• NISO 2017: Understanding metadata.
https://www.niso.org/publications/understanding-metadata-2017
• Dublin Core Metadata Initiative – Metadata Basics
http://dublincore.org/metadata-basics/