Digitální kurátorství

Informační model OAIS

Informační model OAIS je založen na konceptu informačního balíčku: popisuje uspořádání informací při pohybu archivačním systémem, při vstupu do něj, průchodem a výstupu z něj.

  • Submission Information Package vstupuje do archivačního systému
  • Archival Information Package je předmětem dlouhodobého uchovávání
  • Dissemination Information Package je určen koncovým uživatelům

Balíčky SIP, AIP a DIP jsou informačními objekty, které jsou vkládány, spravovány a zveřejňovány archivem odpovídajícím OAIS. Předmětem dlouhodobého uchovávání je však AIP – Archivní Informační Balíček.  

AIP ztělesňuje přísnější výklad pojmu informační balíček, protože musí obsahovat kompletní soubor metadat nutných k zajištění dlouhodobého uchování a zpřístupňování obsahu Určené Skupině. Referenční model popisuje jednotlivé typy metadat, která by měla být součástí archivované informace.

Informační balíček se skládá z objektu, který je předmětem ochrany a z metadat nutných pro zajištění dlouhodobého uchovávání, zpřístupnění, včetně srozumitelnosti.

Informační objekt je tvořen kombinací Datového objektu (bit-stream) a Vysvětlující informace, která umožňuje jeho interpretaci a použití.

Vysvětlující informaci můžeme rozdělit na dva typy:

  1. Informace o Uspořádání (Structure Information) je v kontextu digitálních objektů snadno pochopitelná, odkazuje na mapování mezi digitálními bity a různými koncepty a datovými strukturami, které umožňují načíst bity do srozumitelné informace – například jako obrázek, text nebo interaktivní program. Obecně řečeno, Informace o Uspořádání popisuje formát digitálního objektu.
  2. Informace o Významu (Semantic Information) na druhou stranu objasňuje význam nebo poskytuje odpovídající interpretaci Datového Objektu s Obsahem. Příkladem Informací o Významu jsou glosář, datový slovník nebo dokumentace k softwarové aplikaci.
  3. Referenční model také definuje zbytkovou kategorii Ostatní Vysvětlující Informace (Other Representation Information), která zahrnuje Vysvětlující Informace, jež nejsou snadno definovatelné jako Informace o Uspořádání nebo Informace o Významu

Vysvětlující Informace je nezbytná pro zobrazení a porozumění bitům, které tvoří Datový Objekt s Obsahem. Vysvětlující Informace může obsahovat popis hardwarového a softwarového prostředí potřebného k zobrazení Datového Objektu s Obsahem nebo k zpřístupnění jeho obsahu. Může také shrnovat postup interpretace Datového Objektu s Obsahem.

Sítě Vysvětlujících Informací jsou vnořené řetězy informací tvořící kontext, který Určené Skupině postačuje k porozumění Datovému Objektu s Obsahem a jeho doprovodným Vysvětlujícím Informacím. Teoreticky mohou Sítě Vysvětlujících Informací obsahovat nekonečnou regresi vedoucí k absurdním koncům.

V praxi pochopitelně OAIS archiv Sítě Vysvětlujících Informací v nějakém bodě zastaví. Tam, kde je možné předpokládat rozumnou míru znalosti u Určené Skupiny. Lze například předpokládat, že členové Určené Skupiny rozumí anglicky. Referenční model OAIS popisuje tuto předpokládanou znalost Určené Skupiny jako Znalostní Základnu (Knowledge Base).

Formáty informačního balíčků

Jednotlivé platformy digitálních archivů (ve smyslu kombinace hardware a software) mohou pro dlouhodobé uchovávání AIP používat různé formáty AIP. Pro zjednodušení interoperability archivů byly vytvořeny univerzální formáty, z nichž ty nejznámější jsou METS a Bagit.

METS měl usnadnit výměnu digitálních objektů a podpořit interoperabilitu mezi systémy digitálních knihoven a podporovat dlouhodobou archivaci objektů v digitálních knihovnách. Byl zamýšlen jako standard pro kódování potenciálních Vstupních Informačních Balíčků (SIP), Archivních Informačních Balíčků (AIP) a Výstupních Informačních Balíčků (DIP) z referenčního modelu OAIS.“

Dokument METS pro digitální objekt obsahuje sebepopisující hlavičku, popisná metadata k objektu, administrativní metadata (přesněji řečeno technická metadata, metadata přístupových práv, metadata o analogové předloze digitálního objektu, metadata o původu objektu), seznam souborů tvořících objekt, strukturální mapu všech komponentů digitálního objektu, seznam odkazů, které vyjadřují vztahy mezi komponenty strukturální mapy a seznam „chování“, která mohou s digitálními objekty souviset. 

Bagit je formát archivního balíčku vytvořený společným úsilím americké Kongresové knihovny a Digitální knihovny Kalifornie. Jedná se o hierarchický souborový archivační formát určený pro výměnu obecného digitálního obsahu. „Bag“ obsahuje pouze nezbytnou strukturu zahrnující vlastní digitální obsah, tzv. „payload“ a „tagy“ které jej popisují. 

Pro větší efektivitu při přenosu dat mohou být fyzické soubory v payloadu nahrazeny referencemi na internetové úložiště.