Obsah
Mikroformáty jsou způsob, jak přidat jednoduché značkování do lidsky čitelných údajů tak, aby je bylo možné programově zpracovávat.
získání dat z dokumentů
indexace
prohledávání
ukládání
vzájemné odkazování
Mikroformáty jsou prvky sémantického značkování využívající staré dobré sémantické (X)HTML (Plain Old Semantic (X)HTML)
Proč vzniklo v CERNu (Conseil Européen pour la Recherche Nucléaire) v roce 1991 HTML?
<ol class='xoxo'> <li>První bod <ol> <li>Podbod a</li> <li>Podbod b</li> </ol> </li> <li>Druhý bod <ol compact="compact"> <li>Podbod c</li> <li>Podbod d</li> </ol> </li> </ol>
Mikroformáty spojují řadu trendů:
logický další krok ve vývoji webového designu a informační architektury
způsob jak mohou lidé a organizace publikovat bohatší obsah bez závislosti na centralizovaných službách
"souhlas" s tím, že přínos "tradičních" metadat buď selhal a nebo jejich adopce trvala tak dlouho, že bylo zapotřebí nalézt jiné řešení (nevhodně používaná metadata)
mikroformáty opět využívají metadata. :-)
využití (X)HTML pro data.
Vložením dat ve vlastním formátování v jiném jmenném prostoru
(X)HTML + SVG
XLink
XHTML+RDF
...
Výhody:
Snadná vizualizace (přímá podpora v prohlížečích, např. pomocí CSS);
nezávislé na centralizovaných službách.
Nevýhody:
Jsou závislé na hostitelském značkování.
Mohou být obtížněji strojově zpracovatelné.
hCalendar - značkování událostí v kalendářích
hCard - značkování pro elektronické vizitky
rel-license - značkování licenčních informací u cíle odkazu
rel-nofollow - cíl nemá být zpracován při analýze odkazů
rel-tag - umožňuje přiřadit uživatelskou značku k hypertextovému odkazu.
VoteLinks - umožňuje přiřadit doporučení/nedoporučení k hypertextovému odkazu.
XFN - the Xhtml Friends Network - jednoduchý způsob reprezentace mezilidských vztahů pomocí hypertextových odkazů
XMDP - značkování pro definici metadatových profilů, které jsou snadno čitelné pro uživatele i aplikace (využívány ostatními mikroformáty k definici značek)
XOXO - mikroformát pro psaní bodových scénářů.
adr - značkování adres v dokumentech
geo - značkování geografických souřadnic v dokumentech
hAtom - značkování pro sdružování obsahu
hProduct - mikroformát pro publikování a vkládání dat o produktech do (X)HTML stránek.
hReceipe -mikroformát pro publikování a vkládání dat o receptech do (X)HTML stránek.
hResume - mikroformát pro publikování a vkládání životopisu do (X)HTML stránek.
hReview - mikroformát pro publikování a vkládání recenzí produktů, služeb, ... do (X)HTML stránek.
... (více viz microformats.org/Wiki)
jednoduchý, otevřený, distribuovaný formát pro kalendáře a události
vychází ze standardu iCalendar (RFC2445)
využívá se např. pro synchronizaci kalendářů v organizérech, mobilních telefonech, PDA, ... s počítačem, výměnu informací časové povahy mezi uvedenými zařízeními, ...
hCalendar odpovídá 1:1 standardu iCalendar
Definován XMDP profilem na http://microformats.org/profile/hcalendar
Odkaz by měl být vložen do (X)HTML souboru, který ho používá:
<head profile="http://microformats.org/profile/hcalendar">
<link rel="profile" href="http://microformats.org/profile/hcalendar">
Tento obsah používá <a rel="profile" href="http://microformats.org/profile/hcalendar">hCalendar</a>.
BEGIN:VCALENDAR BEGIN:VEVENT UID:guid-1.host1.com DTSTAMP:19980309T231000Z DESCRIPTION:Project XYZ Review Meeting SUMMARY:XYZ Project Review DTSTART:19980312T133000Z DTEND:19980312T143000Z LOCATION:1CP Conference Room 4350 END:VEVENT END:VCALENDAR
<div class="vevent"> <h3 class="summary">XYZ Project Review</h3> <p class="description">Project XYZ Review Meeting</p> <p>To be held on <abbr class="dtstart" title="1998-03-12T08:30:00-05:00">12 March 1998 from 8:30am EST</abbr> until <abbr class="dtend" title="1998-03-12T09:30:00-05:00">9:30am EST</abbr></p> <p>Location: <span class="location">1CP Conference Room 4350</span></p> <small>Booked by: <span class="uid">guid-1.host1.com</span> on <abbr class="dtstamp" title="19980309T231000Z">9 Mar 1998 6:00pm</abbr></small> </div>
Event plugin pro Windows Live! Writer
... (viz hCalendar implementation)
Jednoduchý, otevřený, distribuovaný formát pro reprezentaci lidí, společnosti a míst.
Obsahově odpovídá standardu vCard (RFC2426).
(X)HTML dokumentu, který ho používá je vhodné přiřadit odpovídající profil:
<head profile="http://microformats.org/profile/hcard">
<link rel="profile" href="http://microformats.org/profile/hcard">
Tento obsah používá <a rel="profile" href="http://microformats.org/profile/hcard">hCard</a>.
<div class="vcard"> <a class="url" href="http://www.fi.muni.cz/~bar/"> <span class="fn n"> <span class="given-name">Luděk</span> <span class="family-name">Bártek</span> </span> </a> </div>
Slouží k zapisování bodových scénářů a tvorbě online prezentací
Sestává se z následujících XHTML modulů:
Strukturní modul (elementy body, head, html, title)
hypertextový modul (a)
modul seznamů (dl, dt, dd, ol, ul, li)
modul metainformací (meta)
modul stylu (element style)
modul atributu styl (atribut style)
modul linku (link)
modul zastaralých uzlů (atribut compact u ol a ul)
Pokud dokument používá tento mikroformát je vhodné ho propojit s odpovídajícím profilem:
<head profile="http://microformats.org/profile/xoxo">
<link rel="profile" href="http://microformats.org/profile/xoxo">
<ol class='xoxo'> <li>Subject 1 <ol> <li>subpoint a</li> <li>subpoint b</li> </ol> </li> <li>Subject 2 <ol compact="compact"> <li>subpoint c</li> <li>subpoint d</li> </ol> </li> <li>Subject 3 <ol> <li>subpoint e</li> </ol> </li> </ol>
ol.xoxo { list-style:decimal; } ol.xoxo ol { list-style:lower-latin; } ol[compact="compact"] { display:none; }
Online nástroj pro tvorbu slideshow
...
Dávají autorovi slovník pro vyjádření myšlenek v souladu s tím, co již bylo vytvořeno.
Základní návrhové vzory:
abbr-design-pattern
class-design-pattern
datetime-design-pattern, date-design-pattern
jména tříd definovaných ve všech návrhových vzorech
include-pattern, include-pattern-feedback
rel-design-pattern
atomické mikroformáty
složené mikroformáty
Používá se k tomu, aby lidsky čitelný text byl také strojově čitelný
Obaluje lidsky čitelný text pomocí elementu abbr, který obsahuje strojově čitelný ekvivalent příslušné hodnoty.
<abbr class="author" title="Danny Ayers">Danny</abbr>
Nemusí být vhodný, pokud má být dokument přístupný pro screenreadery
we have a party in <abbr class="dtstart" title="20070312T1700-06"> March 12, 2007 at 5 PM </abbr>
What are microformats na xml.com
Microformats in Context na xml.com
...
RDF Model a RDf Schema jsou doporučeními W3C
Specifikace a další informace pracovní skupiny - http://www.w3.org/RDF
RDF je obecný mechanizmus pro specifikaci metadat
je použitelný slibovolnými (i ne-digitálními) zdroji
zdroj (resource) - např.
http://www.fi.muni.cz/~tomp/xml
vlastnost (property) - např. popis
hodnota (value) - např. Domovská stránka předmětu
P138 na FI MU
Dobrý úvodní článek na xml.com
: What is
RDF?
RDF Tutoriál - Zvon RDF Tutorial
RDF Tutoriál - W3Schools RDF Tutoriál
RDF Tutorial http://www710.univ-lyon1.fr/~champin/rdf-tutorial/node1.html
Další RDF Tutorial (.ppt)
je generické metadatové schéma s univerzální použitelností
vznikl původně jako iniciativa knihovníků pro popis bibliografických informací
dnes univerzálně používán - např. pro metadatový popis informací ve veřejné správě (e-Government)
tvoří jej 15 základních elementů s rámcově definovanou sémantikou
elementy je možné rozšiřovat - rozkladem na (obvykle disjunktní) podmnožiny (vždy to musí být podmnožiny některého z původních elementů)
"Jednoduchý" nebo "základní" Dublin Core (angl. Simple Dublin Core nebo Unqualified Dublin Core, dále jen "jednoduchý DC") představuje základní soubor patnácti prvků, který vyvinula a podporuje
Iniciativa pro metadata Dublin Core (Dublin Core Metadata Initiative, DCMI, http://dublincore.org).
Momentálně je aktuální verzí Dublin Core 1.1.
je přijat konsorciem IETF jako tzv. dokument RFC (Request For Comment) 2431rovněž od 2003 jako ISO Standard 15836-2003
Název Jméno dané zdroji Tvůrce Entita primárně odpovědná za vytvoření obsahu zdroje Předmět a klíčová slova Téma obsahu zdroje Popis Vysvětlení obsahu zdroje Vydavatel Entita odpovědná za zpřístupnění zdroje Přispěvatel Entita, která přispěla k vytvoření obsahu zdroje Datum Datum spojené s určitou událostí během existence zdroje Typ zdroje Povaha nebo druh obsahu zdroje Formát Fyzická nebo digitální reprezentace zdroje Identifikátor zdroje Jednoznačný odkaz na zdroj v rámci daného kontextu Zdroj Odkaz na zdroj, z něhož je popisovaný zdroj odvozen Jazyk Jazyk intelektuálního obsahu zdroje Vztah Odkaz na příbuzný zdroj Pokrytí Rozsah nebo záběr obsahu zdroje Správa autorských práv Informace o právech vztahujících se k popisovanému zdroji
Název Zelená kniha o elektronickém obchodu Tvůrce Úřad pro veřejné informační systémy, Úřad vlády Předmět Elektronický obchod, elektronický podpis, bezpečnost, správa Popis Vládní návrh podpory elektronického obchodu v České republice Datum vytvoření 2001-09-20 Datum zveřejnění 2001-10-17 Identifikátor ISBN:?????
(Qualified Dublin Core) obsahuje stejný soubor prvků jako jednoduchý DC a doporučuje další upřesnění a omezení každého prvku.
Typicky se tak děje na základě formálního nebo de-facto mezinárodního standardu, např. může požadovat, aby prvek "jazyk" byl vyplněn v souladu se seznamem ISO pro jazyky (ISO 639).
DTD - http://dublincore.org/documents/2001/11/28/dcmes-xml/dcmes-xml-dtd.dtd
XML Schema - http://dublincore.org/documents/2001/11/28/dcmes-xml/dcmes-xml-xsd.xsd
RDF Schema - rdf/dc-rdf-schema-cz.rdf
RDF Schema pro slovník typů (Type Vocabulary) - /~tomp/xml/rdf/dc-tv-rdf-schema-cz.rdf
Jena Java RDF API and toolkit http://www.hpl.hp.com/semweb/
další viz http://www.w3.org/RDF
Přijmout doporučení Dublin Core a osvojit jej jako Národní metadatový standard (NMS).
Rozšířit tento standard tak, aby vyhovoval potřebám veřejné správy jak pro snadné vyhledávání informací, tak pro správu informačních zdrojů.
Vyvinout Aplikační profil NMS, který bude obsahovat předepsaná kódovací schémata a závazný výklad jednotlivých metadatových prvků.
Připravit Tezaurus veřejné správy.
pro potřeby veřejné správy v zemích Evropské Unie, Austrálie, Kanady a Nového Zélandu je rozpracováván specifický aplikační profil Dublin Core.
Cílem MIReG je vytvořit metadatový rámec (metadata framework), příslušné referenční softwarové nástroje a soubor osvědčených postupů (best practice) pro implementaci rámce v jednotlivých zemích a sektorech. Přitom spolupracuje také s evropskou standardizační autoritou CEN, což dává předpoklad celoevropského respektování vzniklého doporučení.
proces zahájen na sérii pracovních seminářů Managing information resources for e-government (MIReG) a stal se součástí programu Interchange of Data between Administrations (IDA) Evropské Unie.
Dalším partnerem při vytváření evropského metadatového rámce je též projekt ParlML, zaměřený na zpřístupňování informací Evropského parlamentu.
Příslušná pracovní skupina připravuje doporučení DC-Gov Application Profile
Upřesnění (zjemnění, kvalifikaci, specializaci angl. element refinement) metadatových prvků, které přesněji určuje sémantiku daného prvku a tím jej rozděluje na jemněji (přesněji) určené podprvky - např. obecné datum lze kvalifikací rozdělit na menší části, a místo "datum" uvádět přesněji např. "datum vytvoření", "datum zveřejnění", "datum platnosti", "nástupnické datum".
Kvalifikovaný prvek lze však i nadále zpracovávat nástroji, které příslušné kvalifikaci "nerozumějí" - tyto nástroje potom chápou prvek jako by zůstal nekvalifikovaný (všeobecnější), tj. "datum zveřejnění" mohou chápat jako prosté "datum", čímž je sice část sémantiky ztracena, ale prvek může být stále užitečný např. pro vyhledávání.
Kódovací schémata (též kvalifikace hodnoty, angl. encoding scheme nebo value qualification) specifikující formát, ve kterém bude uložena hodnota pro příslušný metadatový prvek, např. "datum" vždy bude uváděno ve formátu rrrr-mm-dd (rok-měsíc-den), což definuje standard ISO 8601.
Kromě formátu může být kvalifikací hodnoty též např. specifikace měrné jednotky, v níž bude hodnota uváděna.
prostředek jak popisovat znalosti
množina pojmů a konstruktů, jak je odvozovat, spojovat atd.
základní kategorie ontologií jsou
Classes (general things) in the many domains of interest
The relationships that can exist among things
The properties (or attributes) those things may have
používá metadatové rámce (např. RDF), ale je
bohatší s přesnější sémantikou
jsou vybudovány obecné rámce pro tvorbu ontologií pro specifické domény
Další návrh pracovní skupině WebOnt - http://www.topicmaps.org/xtm/1.0