W3C Voice Browser Activity VoiceXML
Standardy W3C Voice Browser Activity
Luděk Bártek
Fakulta informatiky Masarykova univerzita Brno
podzim 2019
Luděk Bártek
Standardy W3C Voice Browser Activity
Q W3C Voice Browser Activity O VoiceXML
Luděk Bártek
Standardy W3C Voice Browser Activity
W3C Voice Browser Activity VoiceXML
• 1876 - udělen patent na telefon A. G. Bellovi
• WWW
• 1989 - článek HyperText and CERN (Tim Burns Lee) koloval po CERNu k připomínkám
• Vánoce 1990 - demonstrován řádkový webový prohlížeč a editor
• 1991 - všeobecná dostupnost WWW na počítačích v CERNu
• 1994 - první setkání W3 konsorcia (www. w3 . org)
Luděk Bártek
Standardy W3C Voice Browser Activity
W3C Voice Browser Activity VoiceXML
o W3C Voice Browser Working Group
• založena 1999
a cíl - návrh standardů umožňujících přístup k WWW pomocí hlasu a telefonu
• zastoupeny firmy jako:
o HP
• Nuance Communications
• Lucent Technologies
• Motorola
• ScanSoft a IBM
• Telíme Networks
• Vocalocity
Luděk Bártek
Standardy W3C Voice Browser Activity
W3C Voice Browser Activity VoiceXML
Standardy W3C Voice Browser Activity
• VoiceXML
o Speech Recognition Grammar Specification (SRGS)
• Speech Synthesis Markup Language (SSML)
• Semantic Interpretation for Speech Recognition (SISR) a Pronunciation Lexicon Specification (PLS)
• slouží k popisu fonetických informací pro rozpoznávání a syntézu řeči
• výslovnost zkratek, místních jmen, ...
• Call Control XML (CCXML)
• State Chart XML (SCXML)
Luděk Bártek
Standardy W3C Voice Browser Activity
• Jazyk pro popis dialogových rozhraní
• Cíl - přinést výhody webového vývoje a doručování obsahu do interaktivních hlasových aplikací
• vývoj započat 1995 - AT&T Phone Markup Language
• 1998 - konference hostovaná W3C na téma hlasového procházení WWW - předvedeny jazyky PML, VoxML, SpeechML, TalkML, VoiceHTML, ...
• 1999 - založeno VoiceXML Fórum - spojení sil při vývoji jazyka pro značkování dialogů
• 2000 - VoiceXML 1.0, krátce na to přijato jako standard W3C
• Aktuální verze:
o doporučení 2.1 (červen 2007)
* pracovní návrh 3.0 (prosinec 2010) - zahrnuje podporu pro multimodalitu, čeká se na implementaci.
Luděk Bártek
Standardy W3C Voice Browser Activity
W3C Voice Browser Activity VoiceXML
ikaci
Document Server
Request
]
Document
VoiceXML Interpreter C ontext
VoiceXML Interpreter
Implementation Platform
Figure: Převzato ze specifikace VoiceXML 2.0
Luděk Bártek
Standardy W3C Voice Browser Activity
W3C Voice Browser Activity VoiceXML
• VoiceXML dokument(y)
9 formuláře - konečně stavové automaty.
• Uživatel se nachází v jednom z konverzačních stavů.
• Přechody definovány pomocí URI - odkazují na další krok dialogu.
• URI - Uniform Resource Identifier
• jednoznačná identifikace zdroje (souboru, obrázku,...) na Internetu
• rozšíření URL (URL je odkaz na soubor, cíl URI nemusí existovat).
• Dialog končí, pokud tento přechod není definován.
• Dva druhy dialogů:
• formuláře - definuje proces pro získání hodnot sady položek
• menu - poskytuje uživateli sadu možností a odkazů na pokračování dialogu
Luděk Bártek
Standardy W3C Voice Browser Activity
W3C Voice Browser Activity VoiceXML
CÍ
• Subdialogy
• obdoba funkcí
© slouží k opětovnému provádění jisté části dialogu a vrácení získaných hodnot.
• Sezení - začíná v okamžiku, kdy uživatel zahájí interakci s VoiceXML interpretrem a končí, když je komunikace ukončena buď uživatelem, VoiceXML dokumentem nebo kontextem dialogu.
• Aplikace - sada dokumentů, které sdílejí kořenový dokument
Luděk Bártek
Standardy W3C Voice Browser Activity
• Základní komponenta VoiceXML dokumentů.
• Obsahuje:
• sadu položek
• deklarace proměnných nepatřících položkám
• ošetření událostí.
• Základní atribut - id
• název formuláře
9 lze se pomocí něj na formulář odkazovat o musí být unikátní.
Luděk Bártek
Standardy W3C Voice Browser Activity
W3C Voice Browser Activity VoiceXML
Řízení průběhu dialogů Form Interpretation Algorithm - FIA
• Zpracování formuláře - FIA
O Výběr 1. nezadaného vstupního pole formuláře a jeho zpracování
O Výběr a přehrání výzev u tohoto vstupního pole (elementy prompt).
O Získání uživatelských odpovědí, které naplní jednu nebo více položek a nebo vyvolání a zpracování události(žádost o nápovědu, nesrozumitelný vstup, nezadaný vstup,...).
O Zpracování sekcí filledu všech zadaných položek.
Q Pokud existuje nezadané vstupní pole pokračování krokem 1, jinak zpracování události filled u formuláře.
Luděk Bártek
Standardy W3C Voice Browser Activity
W3C Voice Browser Activity VoiceXML
lář
< f orm id="he11o">
Welcome to the VoiceXML!.
Hello.
Tell mi something nice, like hello, hi,
good day.
Luděk Bártek
Standardy W3C Voice Browser Activity
W3C Voice Browser Activity VoiceXML
r
j Pokračování
I didn't understand you, but thanks
anyway.
You don't want to speek to me. Good bye.
Luděk Bártek
Standardy W3C Voice Browser Activity
Ukážke
Dokončení
W3C Voice Browser Activity VoiceXML
You said
Luděk Bártek
Standardy W3C Voice Browser Activity
• Vstupní položky
• field
• record transfer
• object
• subdialog.
• Vstupním položkám odpovídají proměnné s názvem odpovídajícím hodnotě atributu name příslušné vstupní položky.
• Řídící položky
o block o initial.
• Provádění položky lze omezit pomocí atributu cond.
• pravdivostní výraz v jazyce ECMAScript s podmínku pro zpracování pole/provádění bloku.
Luděk Bártek
Standardy W3C Voice Browser Activity
W3C Voice Browser Activity VoiceXML
Představuje vstup od uživatele.
Atributy:
• name - jméno pole
• přístup k výsledné hodnotě pomocí stínové proměnné s tímto jménem.
• expr - případná počáteční hodnota, lze použít výrazy jazyka ECMAScript
• cond - podmínka nutná pro zpracování vstupu
• více viz specifikace.
Luděk Bártek
Standardy W3C Voice Browser Activity
Dokončení
W3C Voice Browser Activity VoiceXML
• Obsah:
• případná výzva s popisem vstupu (element prompt)
• gramatika - popisuje množinu akceptovatelných vstupů 9 ošetření událostí
9 noinput • nomatch 9 filled
Luděk Bártek
Standardy W3C Voice Browser Activity
W3C Voice Browser Activity VoiceXML
U ká .z ka B použil tí el let TI lei nt u fi íeld
Zadejte Vaše jméno
Zadejte prosím Vaše křestní jméno.
Je mi líto, ale zadané jméno není v kalendári.
Luděk Bártek
Standardy W3C Voice Browser Activity
W3C Voice Browser Activity VoiceXML
Ukázka použití elementu field
Dokončení
Luděk Bártek
Standardy W3C Voice Browser Activity
W3C Voice Browser Activity VoiceXML
• Umožňuje systému nahrát zprávu.
• Lze využít např. pro dialogový záznamník.
• Atributy:
o name
• expr
• cond
• beep - má-li se před začátkem nahrávání přehrát zvukový signál
• maxtime - maximální délka nahrávky
• type - mime-type výsledné nahrávky; musí být podporována VoiceXML platformou
Obsah:
případná výzva s popisem vstupu o ošetření událostí
• noinput
• connection.disconnect.hangup (použití elementu catch).
Luděk Bártek
Standardy W3C Voice Browser Activity
W3C Voice Browser Activity VoiceXML
Ukázka použití elementu re cord
Luděk Bártek
Standardy W3C Voice Browser Activity
W3C Voice Browser Activity VoiceXML
• Slouží k vyvolání dialogu, řešícího dílčí problém.
• Element subdialog.
• Jeden a tentýž subdialog lze volat opakovaně.
• Elementy:
• subdialog - volání dílčího dialogu
• parám - definice hodnoty parametru
filled - kód, který se má provést po návratu z dílčího dialogu.
• Atributy
• name - jméno volaného dílčího dialogu
9 src - URI dokumentu, který obsahuje kód dialogu.
a Kód subdialogu - formulář, ukončený elementem return.
Luděk Bártek
Standardy W3C Voice Browser Activity
W3C Voice Browser Activity VoiceXML
< f o rm i d="demo"> Hodnota subdialogu je
Řekl jste
Luděk Bártek
Standardy W3C Voice Browser Activity
W3C Voice Browser Activity VoiceXML
< form id="s ay_he11o">
Na pozdrav jste mi neodpověděl. Nashledanou.
Luděk Bártek
Standardy W3C Voice Browser Activity
W3C Voice Browser Activity VoiceXML
Dokončení
Bohužel jsem Vám nerozuměl, ale stejn Nashledanou.
Luděk Bártek
Standardy W3C Voice Browser Activity
W3C Voice Browser Activity VoiceXML
• Obsahuje proveditelný obsah.
• Provádí se pokud:
• má hodnotu 'undefined' (nebyl dosud navštíven)
• atribut cond se vyhodnotí jako true.
• Struktura - viz předchozí příklady.
• Atributy:
• name - jméno bloku
• expr - iniciální hodnota proměnné formuláře
• cond - podmínka omezující provádění bloku.
Luděk Bártek
Standardy W3C Voice Browser Activity
• Typické využití - dialogové strategie se smíšenou iniciativou.
• Umožňuje uživateli zadat více informací naráz.
• Na rozdíl od ostatních vstupních elementů nemůže obsahovat:
• gramatiku - využívá se gramatika formuláře (viz ukázka na dalším slidu)
• pokud je uživatelova odpověď gramatikou formuláře rozpoznána, je nutno nastavit hodnotu elementu initial -většinou se používá true
o filled.
• Dceřiné elementy:
• výzvy (prompt)
o ošetření událostí (catch, nomatch, noinput).
Luděk Bártek
Standardy W3C Voice Browser Activity
W3C Voice Browser Activity VoiceXML
Luděk Bártek
Standardy W3C Voice Browser Activity
W3C Voice Browser Activity VoiceXML
Další informace o VoiceXML
• Popis na W3C Voice Browser Activity
(http : //www. w3 . org/TR/voicexml20/ doplnění změn na http://www.w3.org/TR/voicexml21)
• WWW.VOicexml.org (http://www.voicexml.org)
• Šimek, Richard - Tutoriál jazyka VoiceXML (bakalářská práce Fl), 2005
• ...
Luděk Bártek
Standardy W3C Voice Browser Activity