Obsah
XPath je syntaxe pro specifikaci částí XML dokumentů (uzly, množiny uzlů, sekvence uzlů; nelze specifikovat části textových uzlů).
XPath používá syntaxi obdobnou jako cesty v souborovém systému.
XPath používá knihovnu standardních funkcí (evt. uživatelsky definovaných - v XPath 2.0 nebo i XPath 1.x, ale proprietárně - podle procesorů)
XPath je od v 1.0 základem pro XSLT, od 2.0 i pro XQuery
XPath syntaxe není XML (bylo by příliš "upovídané")
XPath 1.0 i 2.0 jsou doporučeními W3C (W3C Recommendation) - http://www.w3.org/TR/xpath
Transformace (XSLT)
slouží k výběru uzlů, které se mají zpracovávat
V "selekční části" XML dotazovacích jazyků (XQuery)
V některých modelovacích jazycích (Schematron, XML Schema)
...
Cesta (path) určuje (tj. „naviguje nás na“) lokaci v dokumentu. Cesty jsou konstruovány podobně jako cesty v systému souborů, tj. jako
[20] PathExpr ::= AbsolutePathExpr | RelativePathExpr [22] AbsolutePathExpr ::= ("/" RelativePathExpr?) | ("//" RelativePathExpr) [23] RelativePathExpr ::= StepExpr (("/" | "//") StepExpr)* [24] StepExpr ::= AxisStep | GeneralStep [25] AxisStep ::= (Axis? NodeTest StepQualifiers) | AbbreviatedStep
Osy (jedn. číslo axis, množné axes) jsou množiny prvků dokumentu, vymezené (obvykle relativně) vůči kontextu.
Kontext je tvořen především dokumentem a aktuálním (kontextovým) uzlem (KU).
obsahuje dceřinné uzly kontextového (aktuálního) uzlu
obsahuje všechny potomky kontextového (aktuálního) uzlu (dále jen KU). Nepočítají se mezi ně atributy!!!
obsahuje rodičovský uzel KU (existuje-li)
obsahuje všechny předky - rodiče, "prarodiče", atd. až kořenový element (pokud KU není sám kořenový)
obsahuje všechny následující sourozence KU (pro NS a atributy je tato osa prázdná)
dtto, ale obsahuje předchozí sourozence
obsahuje všechny uzly nacházející se po KU (mimo atributů, potomků a NS uzlů
dtto, ale obsahuje předchozí uzly (ale mimo předky, attributy, NS!)
obsahuje atributy (jen pro uzly - elementy)
obsahuje všechny NS uzly KU (jen pro uzly - elementy)
obsahuje samotný KU
obsahuje sjednocení os descendant
a
self
obsahuje sjednocení os ancestor
a
self
Určeny k selekci (výběru) z uzlů specifikovaných např. cestou
př.: /article/para[3]
- vybere třetí odstavec v
článku
Nejjednodušším výrazem v predikátu je specifikace pozice (blízkosti) (proximity position) - viz výše
para
vybere všechny dceřinné
elementy kontextového uzlu jmenující se para
*
selects all element children of
the context node
text()
selects all text node
children of the context node
@name
selects the name attribute
of the context node
@*
selects all the attributes of
the context node
para[1]
selects the first para
child of the context node
para[last()]
selects the last
para child of the context node
*/para
selects all para
grandchildren of the context node
/doc/chapter[5]/section[2]
selects the second section of the fifth chapter of the
doc
chapter//para
vybere všechny
element para, jež jsou následníky chapter
//para
vybere všechny elementy
para z dokumentu
//olist/item
vybere všechny
elementy item, které mají za rodiče olist.
vybere kontextový uzel
.//para
vybere všechny
elementy-potomky kontextového uzlu, které nesou značku
para
..
vybere rodičovský uzel od
kontextového
../@lang
vybere atribut lang
rodičovského uzlu od kontextového
XPath na W3C: http://www.w3.org/TR/xpath
Zvon XPath Tutorial: http://zvon.org/xxl/XPathTutorial/Output/index.html
XPath Tutorial na W3Schools: http://www.w3schools.com/xpath/xpath_intro.asp
Již finální specifikace - http://www.w3.org/TR/xpath20/
Změna pohledu na hodnoty vrácené XPath výrazem: vše jsou sekvence (byť jednoprvkové)
->odstraňuje problémy s "pořadím" uzlů v množině
Zavádí podmíněné výrazy a cykly
Zavádí možnost uživatelských funkcí (psaných jako dynamicky vyhodnocované výrazy v XPath)
Lze použít existenční a obecné kvantifikátory, např.
exist student/name="Fred"
nebo all
student/@id
Dále viz např. http://www.saxonica.com/, kde nalezneme i XPath/XSLT/XQuery procesor Saxon.
W3C Recommendation 27 July 2001
Obecný mechanismus na propojování XML zdrojů (=dokumentů a jejich částí)
Inspirován zejména std. HyTime (http://www.hytime.org/)
Ortogonální k entitám (lze použít současně oboje)
mnohem bohatší sémantika než u entit,
entity se vyhodnocují (resolve) při parsingu,
XLink odkazy většinou až v aplikaci
Vychází z pokročilých hypertextových technik -
HyTime
(pro SGML - viz http://info.admin.kth.se/SGML/Anvardarforening/Arbetsgrupper/HyTime/Reports/tr1v1.html),
TEI
...
Konstruován tak, že rozšiřuje a upřesňuje syntaxi i sémantiku HTML odkazů
Na rozdíl od SGML linků (např. v HyTime) můžeme v XML využívat jmenné prostory. Nenutí nás to upravovat DTD při použití odkazů.
Infrastruktura odkazů může existovat (v jiném NS) nezávisle na schématu (struktuře) XML dokumentů, v nichž se odkazy vyskytují.
Odkazy mohou být fyzicky mimo soubory s odkazovanými lokacemi.
Atributy a elementy XLink
u mají vlastní
jmenný prostor
Jako prefix NS se obvykle používá
xlink
Příslušnost k XLinku je dána deklarací daného elementu/atributu v XLink NS
to umožňuje flexibilní integraci stávajících schémat (modelů) a XLinku (nemusíme měnit jména "linkovacích" elementů)
XLink odkaz "dovnitř" dokumentů používají standard
XPointer
(http://www.w3.org/TR/xptr).
Váže jeden lokální zdroj na jeden vzdálený (single local -> single remote entity);
Je vyznačen atributem
xlink:type="simple"
;
Váže jeden nebo více lokálních a jeden nebo více vzdálených zdrojů
Může mít přesněji definovanou sémantiku (nad rámec výše uvedených možností)
Odkazy mohou být uloženy mimo odkazující zdroj(e)
je vyznačen atributem
xlink:type="extended"
extended
odkaz se může odkazovat na
lokální zdroje - vyznačené atributem
xlink:resource
nebo
vzdálené zdroje - vyznačené atributem
xlink:locator
Směr odkazu a role participujících zdrojů mohou být upřesněny (nad rámec výše uvedených možností):
Co má aplikace udělat s
odkazovaným dokumentem/prvkem dokumentu je specifikováno atributem
xlink:show
"kdy to má udělat" -
specifikováno atributem xlink:actuate
roli odkazu lze upřesnit v podobě srozumitelné aplikacím:
atributem xlink:role
- u
simple
i extended
odkazu
atributem xlink:arcrole
- u elementu
arc
v extended
odkazu
Lze upřesnit roli odkazu v podobě srozumitelné člověku:
atributem xlink:title
- u
simple
i extended
odkazu i
u elementu arc
v extended
odkazu
Zatím nepříliš rozšířené (řádově jednotky aplikací). Nejznámějšími procesory jsou:
Fujitsu XLink Processor (XLiP) - http://www.labs.fujitsu.com/free/xlip/en/
Open source projekt xlinkit
- http://www.xlinkit.com/xtoox/index.html
X2X (komerční, velmi drahý produkt) podporuje XLink - http://www.stepuk.com/products/prod_X2X.asp
Vývoj trval dlouho (cca 5 let), mezitím aplikace začaly používat vlastní řešení
Sémantika XLinku je:
příliš obecná (aplikace raději používaly vlastní, na míru šitý odkazovací jazyk, viz (X)HTML) a současně
málo obecná (např. RDF metadata popíší vztahy mezi zdroji podrobněji, s typovou kontrolou přes RDF Schemata, atd.)
XLink je také nahrazován aktivitou směřující ke specifikaci XML Topic Maps
Cílem je adaptovat XLink pro potřeby XHTML, kde "nelze použít přímo XLink"
viz HLink - Link recognition for the XHTML Family - W3C Working Draft 13 September 2002
specifikace je navržena W3C Working Group, jí oponovala W3C Technical Architecture Group (TAG)
Princip: mapuje vybrané atributy na jejich přesně dané XLink protějšky
tzn. i to, co normálně nemůže být XLinkem, se na XLink může "automaticky" mapovat
Tento standard je kritizován jako "hybrid, který jedině dokazuje praktickou nevhodnost XLinku"
dále viz např. diskuse na xmlhack.com
Nezávislá alternativa Simona St. Laurenta
viz Very Extensible Linking Language Unafraid of Markup (VELLUM)
Nevýhodou je poněkud rozvleklejší ("upovídaný", verbose) zápis, než u XLink
VELLUM is aimed exclusively at "external" or out-of-line linking. This frees VELLUM from the constraints imposed by developer expectations for inline linking.
VELLUM accepts the cost of a verbose form in exchange for the extensibility and precision that element forms and indirection can offer.
VELLUM does permit the use of existing abbreviations (like URIs and URI references), but simultaneously allows developers to specify more information than is carried in those identifiers.
VELLUM also looks forward to the prospect of VELLUM processors which maintain state across multiple traversals and permit the creation of interactive hypertexts, not just collections of connections.
VELLUM attempts to provide a general-purpose solution to linking which addresses the complexities raised by the W3C's XPointer and XLink specifications by taking a very different approach. VELLUM does not assume that URIs and URI references are adequate to the task of identifying resources, representations, and fragments of representations, and strives to put XML hyperlinking on firmer but still approachable foundations. VELLUM supports and uses URIs and URI references, but offers options that extend those capabilities.
VELLUM is not a general-purpose solution to hypertext linking. VELLUM is intended to be used in cases where precision is important and verbosity is not a problem. While VELLUM could conceivably be mixed with other vocabularies and used to define links within them, it is not designed explicitly for such use. VELLUM is more appropriate for use in cases like external links and linkbases, where the links are stored separately from the resources they connect. (VELLUM's designer hopes that a simpler mechanism for in-line linking will emerge to complement VELLUM.)
VELLUM both builds on the URI framework and goes beyond the URI framework. URIs and URI references may be used within the VELLUM framework if the level of precision they provide is adequate, but developers can specify more information about issues like content-negotiation within the VELLUM framework if they choose. VELLUM also makes it possible to explicitly specify whether a connection involves an abstract resource or a particular concrete representation.
VELLUM also makes it possible for developers to create metadata which applies to their links in a local context. While XLink uses URIs for everything from href to arcrole, VELLUM lets developers use more intelligible identifiers whose meaning is defined within a particular VELLUM context. While VELLUM may be more verbose than a comparable XLink linkbase, it should (if designed thoughtfully) be more readable.
<piece xmlns="http://simonstl.com/ns/vellum" > <connections> <traverse> <from href="http://www.w3.org/TR/REC-xml#sec-common-syn" /> <to href="http://www.w3.org/TR/REC-xml-names/#ns-qualnames" /> </traverse> <traverse> <from href="http://www.w3.org/TR/REC-xml-names/#ns-qualnames" /> <to href="http://www.w3.org/TR/REC-xml#sec-common-syn" /> </traverse> </connections> </piece>
<piece xmlns="http://simonstl.com/ns/vellum"> <connections> <set id="namespaceUses" > <member href="http://www.w3.org/TR/REC-xml#sec-common-syn" /> <member href="http://www.w3.org/TR/xmlschema-2/#QName" /> </set> <traverse> <from ref="namespaceUses"/> <to href="http://www.w3.org/TR/REC-xml-names/#ns-qualnames" /> </traverse> </connections> </piece>
<piece xmlns="http://simonstl.com/ns/vellum"> <targets> <target id="_xml-names" representation= "http://www.w3.org/TR/REC-xml#sec-common-syn" /> <target id="_xml-schema-qnames" representation= "http://www.w3.org/TR/xmlschema-2/#QName"> <target id="_xmlns-qual-names" representation= "http://www.w3.org/TR/REC-xml-names/#ns-qualnames" /> </targets> <connections> <set id="namespaceUses" > <member ref="_xml-names" /> <member ref="_xml-schema-qnames" /> </set> <traverse> <from ref="namespaceUses" /> <to ref="_xmlns-qual-names" /> </traverse> </connections> </piece>
koncept VELLUM out-of-line odkazů je podobný metadatům podle rámce RDF (odkazy jsou také metadata...)
XLink Tutoriál na Zvonu (http://zvon.org)
Specifikace XLink (http://www.w3.org/TR/xlink)
IBM Developerworks/XML
Portál XML.COM (např. článek What is XLink? http://www.xml.com/lpt/a/2000/09/xlink/index.html)
Aktuálně W3C Recommendation, zveřejněno 25. března 2003
Definuje mechanizmus adresování (tj. "pointing" - ne odkazování!) v rámci XML dokumentu
Rozšiřuje koncept kotvy (anchor) známé z HTML - #jménoKotvy
Umožňuje explicitní adresování navigací i implicitní adresování dotazováním
Umožňuji adresování i v rámci textových uzlů
Umožňuje rozlišit adresu bodu (point) a úseku (range) v XML dokumentu
Jako základ pro specifikaci adresy bere jazyk
XPath
Pracovní skupina W3C Linking řešící XLink, XPointer (+ částečně XML Base) splnila svůj úkol a ukončila činnost.
POZOR - specifikace XPointer se v současnosti rozpadla na 4 následovníky:
XPointer Framework - This specification defines the XML Pointer Language (XPointer) Framework, an extensible system for XML addressing that underlies additional XPointer scheme specifications. The framework is intended to be used as a basis for fragment identifiers for any resource whose Internet media type is one of text/xml, application/xml, text/xml-external-parsed-entity, or application/xml-external-parsed-entity. Other XML-based media types are also encouraged to use this framework in defining their own fragment identifier languages.
XPointer
element() Scheme - The XPointer
element()
scheme is intended to be used with
the XPointer Framework to allow basic
addressing of XML elements.
XPointer xmlns() Scheme - The XPointer xmlns() scheme is intended to be used with the XPointer Framework to allow correct interpretation of namespace prefixes in pointers, for instance, namespace-qualified scheme names and namespace-qualified element or attribute names appearing within scheme data.
point
- bod, daný svým kontejnerem
(container
) a celočíselným indexem (pozicí) v rámci
kontejneru
bod může mít explicitní nebo implicitní hranici
může být typu node-point
nebo
character-point
dále viz specifikace - typ Point
viz také tutoriál node-point
range
- je obsah mezi dvěma body V RÁMCI
jednoho dokumentu nebo jedné externí analyzované entity
dále viz specifikace - typ Range
<link xmlns:xlink="http://www.w3.org/2000/xlink" xlink:type="simple" xlink:href="mydocument.xml#xpointer(//AAA/BBB[1])"/>
Xpointer výraz b2/3
nebo
xpointer(id('b2')/*[3])
vybere z následujícího
dokumentu
<AAA> <BBB myid="b1" bbb="111"> Text in the first element BBB.</BBB> <BBB myid="b2" bbb="222"> Text in another element BBB. <DDD ddd="999"> Text in more nested element.</DDD> <DDD ddd="888"> Text in more nested element.</DDD> <DDD ddd="777"> Text in more nested element.</DDD> </BBB> <CCC ccc="123" xxx="321"> Again some text in some element.</CCC> </AAA>
Zvon XPointer Tutorial - http://www.zvon.org/xxl/xpointer/tutorial/OutputExamples/xpointer_tut.html