Počítačová lexikografie XML, standardy Adam Rambousek eXtensible Markup Language ‑ značkovací (meta)jazyk➢ pravidla, jak má vypadat správně vytvořený dokument ‑ snadné strojové zpracování a výměna informací ➢ konkrétní názvy značek určuje uživatel (standardy, vlastní)➢ elementy obsah➢ bez obsahu lze zkrátit na ➢ atributy ➢ XML správné zanoření značek➢ správně: text➢ špatně: text➢ speciální znaky se přepisují na entity (např. <)➢ <, >, &o XML popis a kontrola obsahu➢ DTD (Document Type Definition)➢ seznam elementů a atributů a vztahy mezi nimio nekontroluje obsaho o o XML XML Schema (XSD, XML Schema Definition)➢ popis obsahu a struktury XML dokumentu, schéma samotné je XML dokument o elementy, atributy, strukturao možnost určit vlastní typy obsahu (např. opakující se adresa)o kontrola obsahu (např. číselný rozsah, regulární výrazy, povolené hodnoty) o o XML web: XHTML➢ matematika: MathML➢ knihy: EPUB➢ grafika: SVG➢ dialogové systémy: VoiceXML➢ metadata, sémantický web: RDF➢ text: TEI➢ Standardy založené na XML eXtensible Stylesheet Language (Transformations)➢ převod XML na jiné formáty➢ jiné XML značkování, text, HTML, LaTeX, PDFo šablony pro části XML dokumentu, postupné procházení dokumentu ➢ (funkcionální programovací jazyk)➢ XSL(T) ukládají se přímo XML dokumenty➢ vyhledávání ‑ XPath, XQuery➢ např. eXist, BaseX, Sedna➢ XML databáze Text Encoding Initiative➢ http://www.tei‑c.org/o TEI Guidelines (aktuálně verze 5 z roku 2007)➢ XML formát pro sémantický popis textových dokumentůo velký rozsah značeko TEI Lite ‑ osekaná verze, "90 % potřeb 90 % uživatelů"o romány, poezie, divadelní hry, dokumentace, slovníky, korpusy, grafy, rukopisy, zarovnání, odkazy, změny textu, notové zápisy... o nástroje ‑ sada XSLT pro převod na LaTeX, docx, EPUB, HTMLo TEI Adventures of Sherlock Holmes Adventure II. — The Red‑Headed League By A. Conan Doyle.

I had called upon my friend, Mr. Sherlock Holmes, one day in the autumn of last year and found him in deep conversation with a very stout, florid‑faced, elderly gentleman with fiery red hair …

➢ TEI
ACT I
SCENE I Enter Barnardo and Francisco, two Sentinels, at several doors Barn Who's there? Fran Nay, answer me. Stand and unfold yourself. ➢ TEI My dear Mr. Bennet, said his lady to him one day, have you heard that Netherfield Park is let at last? Marley was dead : to begin with . ➢ TEI podoba hesla➢
competitor com|peti|tor k@m"petit@(r)
n person who competes.
➢ TEI, slovníky významy➢ VP6A turn (a ship) on one side for cleaning, repairing, etc. VP6A VP2A (cause to) tilt, lean over to one side. ➢ TEI, slovníky překlady➢
dresser
Theat habilleur m ➢ TEI, slovníky příklady➢ the multiplex eye of the fly. elle était horrifiée par la dépense she was horrified at the expense. ➢ TEI, slovníky příznaky➢
colour U.S. color
aube de roueConstr➢ TEI, slovníky Oxford Text Archive➢ British National Corpus➢ FreeDict➢ Cambridge University Press➢ Chinese Buddhist Electronic Text Association➢ Deutsches Textarchiv➢ Europeana Regia➢ TEI, projekty lov ‑u m 1 lovení zvěře a ryb lov koroptví lov na zajíce liška vyšla na lov 2 úloveksyno kořistsyno mít bohatý lov ➢ přepis➢ Ukázka, SSČ lov ‑u m. ( 6. j. ‑u) 1. stíhání a zmocňování se zvěře ( nejč. odstřelem); chytání ryb: l. jelenů, divokých kachen, velryb; l. lososů; l. perel; doba lovu; uspořádat l. na medvědy; vyjet na l.; právo lovu; l. odstřelem, chytáním, lapáním; l. lesní, polní, vodní; hromadný l. ➢ skenováno, OCR ➢ Ukázka, SSJČ lov lov, ‑u m. honba n. lapání zvěře n. chytání ryb. Vrchnost na lovu byla. Něm. D Expr. chytání, krádež, získávání, shánění čehokoliv. Netopýr na lovu kmitl se kolem. Baar. ➢ skenováno, OCR, lepší struktura➢ Ukázka, PSJČ různé XML formáty, stejný vzhled (XSLT)➢