1
Mikroformáty. Metadata, RDF.
Obsah
Úvod ................................................................................................................................ 2
Obsah ....................................................................................................................... 2
Co to jsou mikroformáty? ............................................................................................ 2
Ukázka mikroformátu .................................................................................................. 2
Proč se mikroformáty používají? ................................................................................... 3
Čím lze mikroformáty nahradit? .................................................................................... 3
Standardizované mikroformáty ...................................................................................... 3
Vyvíjené mikroformáty ................................................................................................ 4
hCalendar .......................................................................................................................... 4
Úvod ........................................................................................................................ 4
Ukázka události ve formátu iCalendar ............................................................................ 5
Ukázka odpovídající události ve formátu hCalendar .......................................................... 5
Tvorba a publikování událostí a kalendářů ve formátu hCalendar ......................................... 5
hCard ............................................................................................................................... 5
Úvod ........................................................................................................................ 5
Ukázka vCard ............................................................................................................ 6
Odpovídající hCard ..................................................................................................... 6
Nástroje pro tvorbu a manipulaci s hCard ....................................................................... 6
XOXO .............................................................................................................................. 6
Úvod ........................................................................................................................ 6
Ukázkové XOXO značkování ....................................................................................... 7
Možný CSS pro vizualizaci ukázky ............................................................................... 7
Tvorba XOXO dokumentů ........................................................................................... 7
hResume ........................................................................................................................... 7
Popis ........................................................................................................................ 7
Návrhové vzory používané s mikroformáty ............................................................................. 8
Úvod ........................................................................................................................ 8
Abbr-design-pattern .................................................................................................... 8
Class-design-pattern .................................................................................................... 9
Datetime-design-pattern ............................................................................................... 9
Atomické mikroformáty ............................................................................................... 9
Složené mikroformáty ................................................................................................. 9
Další zdroje informací ............................................................................................... 10
Rámce pro metadata popisující XML a jiné datové zdroje ........................................................ 10
Rámec RDF ............................................................................................................. 10
RDF Model ............................................................................................................. 10
RDF Schema ............................................................................................................ 11
RDF reprezentace užívaných metadatových schémat - Z39.50, Dublin Core atd. .................... 11
Dublin Core - příklad konkrétního metadatového schématu ....................................................... 11
Co je Dublin Core? ................................................................................................... 11
Jednoduchý (Simple) Dublin Core ............................................................................... 11
Dublin Core - elementy ............................................................................................. 12
DC - příklad metadatového popisu ............................................................................... 12
Kvalifikovaný Dublin Core ......................................................................................... 12
Kódování DC v XML ................................................................................................ 12
Nástroje pro práci s RDF ........................................................................................... 12
Příklady praktického použití metadat - veřejná správa .............................................................. 13
Mikroformáty. Metadata, RDF.
2
Rámec pro metadata ISVS ČR .................................................................................... 13
Adaptace Dublin Core pro potřeby veřejné správy .......................................................... 13
Aplikační profil NMS ................................................................................................ 13
Ontologie ........................................................................................................................ 14
Co jsou ontologie? .................................................................................................... 14
Aplikace ontologií (Use Cases) ................................................................................... 14
XML Topic Maps ..................................................................................................... 14
Úvod
Obsah
• Co to jsou mikroformáty?
• Proč se používají?
• Čím se dají nahradit?
• Jejich výhody před vlastním značkováním.
• Jejich nevýhody.
• Nejběžnější používané mikroformáty
• Návrhové vzory používané s mikroformáty
• Další zdroje informací
Co to jsou mikroformáty?
• Mikroformáty jsou způsob, jak přidat jednoduché značkování do lidsky čitelných údajů tak, aby je bylo
možné programově zpracovávat.
• získání dat z dokumentů
• indexace
• prohledávání
• ukládání
• vzájemné odkazování
• Mikroformáty jsou prvky sémantického značkování využívající staré dobré sémantické (X)HTML [?
http://microformats.org/wiki/POSH] (Plain Old Semantic (X)HTML)
• Proč vzniklo v CERNu (Conseil Européen pour la Recherche Nucléaire [http://dg-rpc.web.cern.ch/
dg-rpc/Scale.html]) v roce 1991 HTML?
Ukázka mikroformátu
První bod
Podbod a
Mikroformáty. Metadata, RDF.
3
Podbod b
Druhý bod
Podbod c
Podbod d
Proč se mikroformáty používají?
Mikroformáty spojují řadu trendů:
• logický další krok ve vývoji webového designu a informační architektury
• způsob jak mohou lidé a organizace publikovat bohatší obsah bez závislosti na centralizovaných
službách
• "souhlas" s tím, že přínos "tradičních" metadat buď selhal a nebo jejich adopce trvala tak dlouho, že
bylo zapotřebí nalézt jiné řešení (nevhodně používaná metadata)
• mikroformáty opět využívají metadata. :-)
• využití (X)HTML pro data.
Čím lze mikroformáty nahradit?
• Vložením dat ve vlastním formátování v jiném jmenném prostoru
• XHTML + Voice Profile [http://www.voicexml.org/specs/multimodal/x+v/12/]
• (X)HTML + SVG
• XLink
• XHTML+RDF
• ...
• Výhody:
• Snadná vizualizace (přímá podpora v prohlížečích, např. pomocí CSS);
• nezávislé na centralizovaných službách.
• Nevýhody:
• Jsou závislé na hostitelském značkování.
• Mohou být obtížněji strojově zpracovatelné.
Standardizované mikroformáty
• hCalendar - značkování událostí v kalendářích
Mikroformáty. Metadata, RDF.
4
• hCard - značkování pro elektronické vizitky
• rel-license - značkování licenčních informací u cíle odkazu
• rel-nofollow - cíl nemá být zpracován při analýze odkazů
• rel-tag - umožňuje přiřadit uživatelskou značku k hypertextovému odkazu.
• VoteLinks - umožňuje přiřadit doporučení/nedoporučení k hypertextovému odkazu.
• XFN - the Xhtml Friends Network - jednoduchý způsob reprezentace mezilidských vztahů pomocí
hypertextových odkazů
• XMDP - značkování pro definici metadatových profilů, které jsou snadno čitelné pro uživatele i aplikace
(využívány ostatními mikroformáty k definici značek)
• XOXO - mikroformát pro psaní bodových scénářů.
Vyvíjené mikroformáty
• adr - značkování adres v dokumentech
• geo - značkování geografických souřadnic v dokumentech
• hAtom - značkování pro sdružování obsahu
• hProduct - mikroformát pro publikování a vkládání dat o produktech do (X)HTML stránek.
• hReceipe -mikroformát pro publikování a vkládání dat o receptech do (X)HTML stránek.
• hResume - mikroformát pro publikování a vkládání životopisu do (X)HTML stránek.
• hReview - mikroformát pro publikování a vkládání recenzí produktů, služeb, ... do (X)HTML stránek.
• ... (více viz microformats.org/Wiki [http://microformats.org/wiki/Main_Page])
hCalendar
Úvod
• jednoduchý, otevřený, distribuovaný formát pro kalendáře a události
• vychází ze standardu iCalendar (RFC2445 [http://www.ietf.org/rfc/rfc2445.txt])
• využívá se např. pro synchronizaci kalendářů v organizérech, mobilních telefonech, PDA, ... s
počítačem, výměnu informací časové povahy mezi uvedenými zařízeními, ...
• hCalendar odpovídá 1:1 standardu iCalendar
• Definován XMDP profilem na http://microformats.org/profile/hcalendar
• Odkaz by měl být vložen do (X)HTML souboru, který ho používá:
Mikroformáty. Metadata, RDF.
5
Tento obsah používá
hCalendar.
Ukázka události ve formátu iCalendar
BEGIN:VCALENDAR
BEGIN:VEVENT
UID:guid-1.host1.com
DTSTAMP:19980309T231000Z
DESCRIPTION:Project XYZ Review Meeting
SUMMARY:XYZ Project Review
DTSTART:19980312T133000Z
DTEND:19980312T143000Z
LOCATION:1CP Conference Room 4350
END:VEVENT
END:VCALENDAR
Ukázka odpovídající události ve formátu hCalendar
XYZ Project Review
Project XYZ Review Meeting
To be held on 12 March 1
until 9:30am EST
Location: 1CP Conference Room 4350
Booked by: guid-1.host1.com on
9 Mar 1998 6:00pm
Tvorba a publikování událostí a kalendářů ve formátu
hCalendar
• hCalendar Creator [http://microformats.org/code/hcalendar/creator]
• Midgard CMS [http://www.midgard-project.org/documentation/net-nemein-calendar/]
• Firefox Greasemonkey [http://www.decafbad.com/blog/2005/06/08/greasemonkey_magic]
• Event plugin pro Windows Live! Writer [http://gallery.live.com/liveItemDetail.aspx?
li=9751e563-1408-4fc3-8028-bd4351edb1fb&l=8]
• ... (viz hCalendar implementation [http://microformats.org/wiki/hcalendar-implementations])
hCard
Úvod
• Jednoduchý, otevřený, distribuovaný formát pro reprezentaci lidí, společnosti a míst.
• Obsahově odpovídá standardu vCard (RFC2426 [http://www.ietf.org/rfc/rfc2426.txt]).
Mikroformáty. Metadata, RDF.
6
• (X)HTML dokumentu, který ho používá je vhodné přiřadit odpovídající profil:
Tento obsah používá
hCard.
Ukázka vCard
BEGIN:VCARD
VERSION:3.0
N:Bártek;Luděk
FN:Luděk Bártek
URL:http://www.fi.muni.cz/~bar
END:VCARD
Odpovídající hCard
Nástroje pro tvorbu a manipulaci s hCard
• hCard creator [http://microformats.org/code/hcard/creator]
• Wordpress Addressbook plugin [http://wordpress.org/extend/plugins/addressbook/]
XOXO
Úvod
• Slouží k zapisování bodových scénářů a tvorbě online prezentací
• Sestává se z následujících XHTML modulů:
• Strukturní modul (elementy body, head, html, title)
• hypertextový modul (a)
• modul seznamů (dl, dt, dd, ol, ul, li)
• modul metainformací (meta)
• modul stylu (element style)
• modul atributu styl (atribut style)
Mikroformáty. Metadata, RDF.
7
• modul linku (link)
• modul zastaralých uzlů (atribut compact u ol a ul)
• Pokud dokument používá tento mikroformát je vhodné ho propojit s odpovídajícím profilem:
Ukázkové XOXO značkování
Subject 1
subpoint a
subpoint b
Subject 2
subpoint c
subpoint d
Subject 3
subpoint e
Možný CSS pro vizualizaci ukázky
ol.xoxo { list-style:decimal; }
ol.xoxo ol { list-style:lower-latin; }
ol[compact="compact"] { display:none; }
Tvorba XOXO dokumentů
• Online nástroj [http://www.s5easy.com/] pro tvorbu slideshow
• Slimey [http://sourceforge.net/projects/slimey/]
• ...
hResume
Popis
• Slouží k publikování životopisů.
Mikroformáty. Metadata, RDF.
8
• Využívá další microformáty:
• hCard
• hCalendar
• rel-tag
• Pokud dokument používá hResume je vhodné ho propojit s odpovídajícími profily:
• pro hResume
• hCard
• hCalendar
• popř. geo, ...
• Ukázka viz příklady z přednášky.
Návrhové vzory používané s mikroformáty
Úvod
• Dávají autorovi slovník pro vyjádření myšlenek v souladu s tím, co již bylo vytvořeno.
• Základní návrhové vzory:
• abbr-design-pattern
• class-design-pattern
• datetime-design-pattern, date-design-pattern
• jména tříd definovaných ve všech návrhových vzorech
• include-pattern, include-pattern-feedback
• rel-design-pattern
• atomické mikroformáty
• složené mikroformáty
Abbr-design-pattern
• Používá se k tomu, aby lidsky čitelný text byl také strojově čitelný
• Obaluje lidsky čitelný text pomocí elementu abbr, který obsahuje strojově čitelný ekvivalent příslušné
hodnoty.
• Danny
Mikroformáty. Metadata, RDF.
9
• Nemusí být vhodný, pokud má být dokument přístupný pro screenreadery
• we have a party in
March 12, 2007 at 5 PM
Class-design-pattern
• Vždy by se měl používat nejvhodnější sémantický (X)HTML element.
• Sémantika se elementům přidává pomocí názvů sémantických tříd.
•
Datetime-design-pattern
• Slouží k tomu, aby lidsky čitelný časový údaj byl i strojově čitelný.
• Lidsky čitelný čas je uzavřen do elementu abbr
• Strojový ekvivalent je zadán pomocí atributu title ve formátu odpovídajícím standardu ISO8601
•
10 o'clock on the 10th
Atomické mikroformáty
• Jedná se o nejmenší řešení konkrétního problému.
• Skládají se ze standardních (X)HTML elementů.
• Slouží jako základ pro složené mikroformáty.
• Obvykle používají jeden atribut class resp. rel.
• Atomické mikroformáty jsou např.:
• rel-license
• XOXO
• ...
Složené mikroformáty
• Složené mikroformáty se skládají z atomických mikroformátů a/nebo standardních (X)HTML elementů.
• Jsou navrženy tak, aby mohly být přímo začleněny do webových stránek.
• Obvykle používají kombinaci několika class resp. rel atributů.
Mikroformáty. Metadata, RDF.
10
• Patří sem např.:
• hCalendar
• hCard
• hResume
• ...
Další zdroje informací
• microformats.org [http://microformats.org]
• What are microformats [http://www.xml.com/pub/a/2005/03/23/deviant.html] na xml.com
• Microformats in Context [http://www.xml.com/pub/a/2006/04/26/microformats-grddl-rdfa-nvdl.html]
na xml.com
• ...
Rámce pro metadata popisující XML a jiné
datové zdroje
Rámec RDF
RDF Model a RDf Schema jsou doporučeními W3C
Specifikace a další informace pracovní skupiny - http://www.w3.org/RDF
RDF Model
RDF je obecný mechanizmus pro specifikaci metadat
je použitelný slibovolnými (i ne-digitálními) zdroji
základem modelu jsou trojice:
• zdroj (resource) - např. http://www.fi.muni.cz/~tomp/xml
• vlastnost (property) - např. popis
• hodnota (value) - např. Domovská stránka předmětu P138 na FI MU
Trojice je možné znázornit
• graficky,
• jako trojice (r, p, v) nebo
• XML syntaxí
Blíže viz
Mikroformáty. Metadata, RDF.
11
• Dobrý úvodní článek na xml.com: What is RDF? [http://www.xml.com/pub/a/2001/01/24/rdf.html]
• RDF Tutoriál - Zvon RDF Tutorial [http://www.zvon.org/xxl/RDFTutorial/General/book.html]
• RDF Tutoriál - W3Schools RDF Tutoriál [http://www.w3schools.com/rdf/default.asp]
• RDF Tutorial http://www710.univ-lyon1.fr/~champin/rdf-tutorial/node1.html
• Další RDF Tutorial (.ppt) [http://www.aifb.uni-karlsruhe.de/WBS/sst/Teaching/Intelligente%20System
%20im%20WWW%20SS%202000/RDF-Tutorial.pdf]
RDF Schema
• Specifikuje omezení na množiny vlastností, jejich definičních oborů a oborů hodnot
• Modeluje se opět v RDF
RDF reprezentace užívaných metadatových schémat Z39.50,
Dublin Core atd.
• RDF je obecný rámec pro modelování metadat, pro konkrétní použití je obvykle nutné definovat schéma
přípustných vlastností, jejich domén a množin (přípustných) hodnot.
• Tím se vytvoří RDF reprezentace daného metadatového schématu.
• Reprezentace může mít podobu RDF Schematu.
Dublin Core - příklad konkrétního
metadatového schématu
Co je Dublin Core?
• je generické metadatové schéma s univerzální použitelností
• vznikl původně jako iniciativa knihovníků pro popis bibliografických informací
• dnes univerzálně používán - např. pro metadatový popis informací ve veřejné správě (e-Government)
• tvoří jej 15 základních elementů s rámcově definovanou sémantikou
• elementy je možné rozšiřovat - rozkladem na (obvykle disjunktní) podmnožiny (vždy to musí být
podmnožiny některého z původních elementů)
Jednoduchý (Simple) Dublin Core
"Jednoduchý" nebo "základní" Dublin Core (angl. Simple Dublin Core nebo Unqualified Dublin Core,
dále jen "jednoduchý DC") představuje základní soubor patnácti prvků, který vyvinula a podporuje
• Iniciativa pro metadata Dublin Core (Dublin Core Metadata Initiative, DCMI, http://dublincore.org).
• Momentálně je aktuální verzí Dublin Core 1.1.
Mikroformáty. Metadata, RDF.
12
• je přijat konsorciem IETF [http://ietf.org] jako tzv. dokument RFC (Request For Comment) 2431rovněž
od 2003 jako ISO Standard 15836-2003
Dublin Core - elementy
Název Jméno dané zdroji Tvůrce Entita primárně odpovědná za
vytvoření obsahu zdroje Předmět a klíčová slova Téma obsahu zdroje Popis
Vysvětlení obsahu zdroje Vydavatel Entita odpovědná za zpřístupnění
zdroje Přispěvatel Entita, která přispěla k vytvoření obsahu zdroje
Datum Datum spojené s určitou událostí během existence zdroje Typ zdroje
Povaha nebo druh obsahu zdroje Formát Fyzická nebo digitální
reprezentace zdroje Identifikátor zdroje Jednoznačný odkaz na zdroj v
rámci daného kontextu Zdroj Odkaz na zdroj, z něhož je popisovaný zdroj
odvozen Jazyk Jazyk intelektuálního obsahu zdroje Vztah Odkaz na
příbuzný zdroj Pokrytí Rozsah nebo záběr obsahu zdroje Správa autorských
práv Informace o právech vztahujících se k popisovanému zdroji
DC - příklad metadatového popisu
Název Zelená kniha o elektronickém obchodu Tvůrce Úřad pro
veřejné informační systémy, Úřad vlády Předmět Elektronický obchod,
elektronický podpis, bezpečnost, správa Popis Vládní návrh podpory
elektronického obchodu v České republice Datum vytvoření 2001-09-20
Datum zveřejnění 2001-10-17 Identifikátor ISBN:?????
Kvalifikovaný Dublin Core
• (Qualified Dublin Core) obsahuje stejný soubor prvků jako jednoduchý DC a doporučuje další upřesnění
a omezení každého prvku.
• Typicky se tak děje na základě formálního nebo de-facto mezinárodního standardu, např. může
požadovat, aby prvek "jazyk" byl vyplněn v souladu se seznamem ISO pro jazyky (ISO 639).
Kódování DC v XML
DTD - http://dublincore.org/documents/2001/11/28/dcmes-xml/dcmes-xml-dtd.dtd [http://dublincore.org/
documents/2001/11/28/dcmes-xml/dcmes-xml-dtd.dtd]
XML Schema - http://dublincore.org/documents/2001/11/28/dcmes-xml/dcmes-xml-xsd.xsd [http://
dublincore.org/documents/2001/11/28/dcmes-xml/dcmes-xml-xsd.xsd]
RDF Schema - rdf/dc-rdf-schema-cz.rdf [/~tomp/xml/rdf/dc-rdf-schema-cz.rdf]
RDF Schema pro slovník typů (Type Vocabulary) - /~tomp/xml/rdf/dc-tv-rdf-schema-cz.rdf [/~tomp/xml/
rdf/dc-tv-rdf-schema-cz.rdf]
Nástroje pro práci s RDF
Jena Java RDF API and toolkit http://www.hpl.hp.com/semweb/
The ICS-FORTH RDFSuite [http://139.91.183.30:9090/RDF/]
další viz http://www.w3.org/RDF [http://www.w3.org/RDF/]
Mikroformáty. Metadata, RDF.
13
Příklady praktického použití metadat - veřejná
správa
Rámec pro metadata ISVS ČR
Kroky budování
• Přijmout doporučení Dublin Core a osvojit jej jako Národní metadatový standard (NMS).
• Rozšířit tento standard tak, aby vyhovoval potřebám veřejné správy jak pro snadné vyhledávání
informací, tak pro správu informačních zdrojů.
• Vyvinout Aplikační profil NMS, který bude obsahovat předepsaná kódovací schémata a závazný
výklad jednotlivých metadatových prvků.
• Připravit Tezaurus veřejné správy.
Adaptace Dublin Core pro potřeby veřejné správy
pro potřeby veřejné správy v zemích Evropské Unie, Austrálie, Kanady a Nového Zélandu je
rozpracováván specifický aplikační profil Dublin Core.
Cílem MIReG je vytvořit metadatový rámec (metadata framework), příslušné referenční softwarové
nástroje a soubor osvědčených postupů (best practice) pro implementaci rámce v jednotlivých zemích
a sektorech. Přitom spolupracuje také s evropskou standardizační autoritou CEN, což dává předpoklad
celoevropského respektování vzniklého doporučení.
• proces zahájen na sérii pracovních seminářů Managing information resources for e-government
(MIReG) a stal se součástí programu Interchange of Data between Administrations (IDA) Evropské
Unie.
• Dalším partnerem při vytváření evropského metadatového rámce je též projekt ParlML, zaměřený na
zpřístupňování informací Evropského parlamentu.
• Příslušná pracovní skupina připravuje doporučení DC-Gov Application Profile
Aplikační profil NMS
zahrnuje:
• Upřesnění (zjemnění, kvalifikaci, specializaci angl. element refinement) metadatových prvků, které
přesněji určuje sémantiku daného prvku a tím jej rozděluje na jemněji (přesněji) určené podprvky např.
obecné datum lze kvalifikací rozdělit na menší části, a místo "datum" uvádět přesněji např. "datum
vytvoření", "datum zveřejnění", "datum platnosti", "nástupnické datum".
• Kvalifikovaný prvek lze však i nadále zpracovávat nástroji, které příslušné kvalifikaci "nerozumějí" tyto
nástroje potom chápou prvek jako by zůstal nekvalifikovaný (všeobecnější), tj. "datum zveřejnění"
mohou chápat jako prosté "datum", čímž je sice část sémantiky ztracena, ale prvek může být stále
užitečný např. pro vyhledávání.
• Kódovací schémata (též kvalifikace hodnoty, angl. encoding scheme nebo value qualification)
specifikující formát, ve kterém bude uložena hodnota pro příslušný metadatový prvek, např. "datum"
vždy bude uváděno ve formátu rrrr-mm-dd (rok-měsíc-den), což definuje standard ISO 8601.
Mikroformáty. Metadata, RDF.
14
• Kromě formátu může být kvalifikací hodnoty též např. specifikace měrné jednotky, v níž bude hodnota
uváděna.
Ontologie
Co jsou ontologie?
prostředek jak popisovat znalosti
množina pojmů a konstruktů, jak je odvozovat, spojovat atd.
základní kategorie ontologií jsou
• Classes (general things) in the many domains of interest
• The relationships that can exist among things
• The properties (or attributes) those things may have
používá metadatové rámce (např. RDF), ale je
bohatší s přesnější sémantikou
jsou vybudovány obecné rámce pro tvorbu ontologií pro specifické domény
Aplikace ontologií (Use Cases)
• Webové portály, integrace dat na webu
• Multimediální kolekce
• Správa velkých webů
• Dokumentace návrhu
• Inteligentní agenti
• "Všudypřítomné počítání"
Pracovní skupina při W3C [http://www.w3.org/2001/sw/WebOnt/]
XML Topic Maps
Další návrh pracovní skupině WebOnt - http://www.topicmaps.org/xtm/1.0 [http://www.topicmaps.org/
xtm/1.0/]