W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activity Standardy W3C Voice Browser Activity Luděk Bártek Fakulta informatiky Masarykova univerzita Brno podzim 2023 Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activity sal Q W3C Voice Browser Activity O VoiceXML O Speech Recognition Grammar Specification Q Semantic Intepretation for Speech Recognition O PLS Q Ostatní standardy W3C VoiceBrowser Activity Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activit • 1876 - udělen patent na telefon A. G. Bellovi o WWW • 1989 - článek HyperText and CERN (Tim Burns Lee) koloval po CERNu k připomínkám • Vánoce 1990 - demonstrován řádkový webový prohlížeč a editor • 1991 - všeobecná dostupnost WWW na počítačích v CERNu • 1994 - první setkání W3 konsorcia (www. w3 . org) Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activity H isl tori ie o W3C Voice Browser Working Group • založena 1999 o cíl - návrh standardů umožňujících přístup k WWW pomocí hlasu a telefonu • zastoupeny firmy jako: o HP • Nuance Communications • Lucent Technologies • Motorola • ScanSoft o IBM • Telíme Networks • Vocalocity Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activity Standardy W3C Voice Browser Activity • VoiceXML o Speech Recognition Grammar Specification (SRGS) • Speech Synthesis Markup Language (SSML) • Semantic Interpretation for Speech Recognition (SISR) • Pronunciation Lexicon Specification (PLS) • slouží k popisu fonetických informací pro rozpoznávání syntézu řeči • výslovnost zkratek, místních jmen, ... • Call Control XML (CCXML) • State Chart XML (SCXML) Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C Voice Browser Activity Zá kl lad n 1 1 n fo n nr íace • Jazyk pro popis dialogových rozhraní • Cíl - přinést výhody webového vývoje a doručování obsahu do interaktivních hlasových aplikací 9 vývoj započat 1995 - AT&T Phone Markup Language • 1998 - konference hostovaná W3C na téma hlasového procházení WWW - předvedeny jazyky PML, VoxML, SpeechML, TalkML, VoiceHTML, ... • 1999 - založeno VoiceXML Fórum - spojení sil při vývoji jazyka pro značkování dialogů • 2000 - VoiceXML 1.0, krátce na to přijato jako standard W3C • Aktuální verze: * doporučení 2.1 (červen 2007) 9 pracovní návrh 3.0 (prosinec 2010) - zahrnuje podporu pro Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activity rchitektura VoiceXML aplikací Document Server 1 Request Document VoiceXML Interpreter C ontext VoiceXML Interpreter Implementation Platform Figure: Převzato ze specifikace VoiceXML 2.0 Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activity Struktura VoiceXML aplikací • VoiceXML dokument(y) • formuláře - konečně stavové automaty. • Uživatel se nachází v jednom z konverzačních stavů. • Přechody definovány pomocí URI - odkazují na další krok dialogu. • URI - Uniform Resource Identifier • jednoznačná identifikace zdroje (souboru, obrázku,...) na Internetu • rozšíření URL (URL je odkaz na soubor, cíl URI nemusí existovat). • Dialog končí, pokud tento přechod není definován. • Dva druhy dialogů: 9 formuláře - definuje proces pro získání hodnot sady položek • menu - poskytuje uživateli sadu možností a odkazů na pokračování dialogu Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activity Struktura VoiceXML aplikací • Subdialogy • obdoba funkcí © slouží k opětovnému provádění jisté části dialogu a vrácení získaných hodnot. • Sezení - začíná v okamžiku, kdy uživatel zahájí interakci s VoiceXML interpretrem a končí, když je komunikace ukončena buď uživatelem, VoiceXML dokumentem nebo kontextem dialogu. • Aplikace - sada dokumentů, které sdílejí kořenový dokument Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activity VoiceXM r • Základní komponenta VoiceXML dokumentů. • Obsahuje: o sadu položek 9 deklarace proměnných nepatřících položkám • ošetření událostí. • Základní atribut - id • název formuláře • lze se pomocí něj na formulář odkazovat o musí být unikátní. Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activity ní ter pr pret o U at IU ( gorit i hi ial m - lo Fl gů IA • Zpracování formuláře - FIA O Výběr 1. nezadaného vstupního pole formuláře a jeho zpracování O Výběr a přehrání výzev u tohoto vstupního pole (elementy prompt). O Získání uživatelských odpovědí, které naplní jednu nebo více položek a nebo vyvolání a zpracování události(žádost o nápovědu, nesrozumitelný vstup, nezadaný vstup,...). O Zpracování sekcí filledu všech zadaných položek. Q Pokud existuje nezadané vstupní pole pokračování krokem 1, jinak zpracování události filled u formuláře. Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activity Ukázkový VoiceXML formu lář < f orm id="he11o"> Welcome to the VoiceXML!. Hello. Tell mi something nice, like hello, hi, good day. Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activity I 1 I didn't understand you, but thanks anyway. You don't want to speek to me. Good bye. Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activity 12 1 You said Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activity Položky formuláře • Vstupní položky • field • record transfer • object • subdialog. • Vstupním položkám odpovídají proměnné s názvem odpovídajícím hodnotě atributu name příslušné vstupní položky. • Řídící položky • block o initial. • Provádění položky lze omezit pomocí atributu cond. • pravdivostní výraz v jazyce ECMAScript s podmínku pro zpracování pole/provádění bloku. Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activity Element field Představuje vstup od uživatele. Atributy: • name - jméno pole • přístup k výsledné hodnotě pomocí stínové proměnné s tímto jménem. • expr - případná počáteční hodnota, lze použít výrazy jazyka ECMAScript • cond - podmínka nutná pro zpracování vstupu • více viz specifikace. Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activity • Obsah: případná výzva s popisem vstupu (element prompt) • gramatika - popisuje množinu akceptovatelných vstupů • ošetření událostí a noinput • nomatch • filled • ... • ... Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activity Ukázka použití elementu fi eld Zadejte Vaše jméno Zadejte prosím Vaše křestní jméno. Je mi líto, ale zadané jméno není v kalendáři. Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activity Ukázka použití elementu field Dokončení Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activity Ele nr íei n 11 recoi rd a Umožňuje systému nahrát zprávu. • Lze využít např. pro dialogový záznamník. • Atributy: o name • expr • cond • beep - má-li se před začátkem nahrávání přehrát zvukový signál • maxtime - maximální délka nahrávky • type - mime-type výsledné nahrávky; musí být podporována VoiceXML platformou • ... • Obsah: případná výzva s popisem vstupu • ošetření událostí Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activity Ukázka použití elementu n ecord
Bohužel zde nikdo není. Po zaznění signálu můžete zanechat vzkaz. Bohužel nic neslyším. Zkuste to znovu. Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activity Ele 1^2 USE • Slouží k vyvolání dialogu, řešícího dílčí problém. • Element subdialog. • Jeden a tentýž subdialog lze volat opakovaně. • Elementy: • subdialog - volání dílčího dialogu • parám - definice hodnoty parametru filled - kód, který se má provést po návratu z dílčího dialogu. • Atributy • name - jméno volaného dílčího dialogu 9 src - URI dokumentu, který obsahuje kód dialogu. a Kód subdialogu - formulář, ukončený elementem return. Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activity J < f o rm i d="demo"> Hodnota subdialogu je Řekl jste Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activity J < form id="s ay_he11o"> Na pozdrav jste mi neodpověděl. Nashledanou. Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activity Ukázka subdialogu Dokončení Bohužel jsem Vám nerozuměl, ale stejně dekuji. Nashledanou. Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activity Ele 1 • Obsahuje proveditelný obsah. • Provádí se pokud: • má hodnotu 'undefined' (nebyl dosud navštíven) • atribut cond se vyhodnotí jako true. • Struktura - viz předchozí příklady. • Atributy: • name - jméno bloku • expr - iniciální hodnota proměnné formuláře • cond - podmínka omezující provádění bloku. Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activity Ele 1 • Typické využití - dialogové strategie se smíšenou iniciativou. a Umožňuje uživateli zadat více informací naráz. • Na rozdíl od ostatních vstupních elementů nemůže obsahovat: • gramatiku - využívá se gramatika formuláře (viz ukázka na dalším slidu) • pokud je uživatelova odpověď gramatikou formuláře rozpoznána, je nutno nastavit hodnotu elementu initial -většinou se používá true o filled. • Dceřiné elementy: • výzvy (prompt) o ošetření událostí (catch, nomatch, noinput). Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activity Ukázka použití elementu ir "litial
Vítejte v registraci předmětů na FI Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activit Pokračování Zde můžete zadat, jaké předměty s jakým ukončením si chcete zaregistrovat Řekněte něco jako Předmět PB095 na zkouš Dobře zkusíme to postupně. Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activit Pokračování Dobře zkusíme to postupně. Zadejte kód předmětu Zatím si lze zaregistrovat předměty PB162, PB095, PB125. Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activity Ukázka použití elementu ir Pokračování "litial Bohužel se nám zadávání nedaří. Nashledanou. Jelikož jste nic nezadal, tak se s Vámi loučím. Zadejte požadované ukončení. Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activit Pokračování Předměty lze ukončit zkouškou nebo zápočtem. Bohužel se Vám zadávání nedaří, zkuste to klasicky na adrese is.muni.cz. Nashledanou. Zadejte, zda chcete předmět ukončit zkouškou nebo zápočtem. ... Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activit Dokončení Provádím registraci předmětu s kódem a ukončením .
Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activity Další informace o VoiceXML • Popis na W3C Voice Browser Activity (http : //www. w3 . org/TR/voicexml20/ doplnění změn na http://www.w3.org/TR/voicexml21) • WWW.VOicexml.org (http://www.voicexml.org) • Šimek, Richard - Tutoriál jazyka VoiceXML (bakalářská práce Fl), 2005 Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activity SRGS • W3C specifikace jazyka pro zápis bezkontextových gramatik pro podporu rozpoznávání řeči. • Aktuální verze 1.0 (březen 2004). • Nahrazuje původně používaný standard JSGF - i nadále používán některými systémy pro rozpoznávání řeči. • Dvě varianty zápisu gramatiky: • XML 9 Augmented Backus-Naur Form (ABNF). • Liší se pouze zápis nikoliv vyjadřovací síla. • Možnost použití způsobu zápisu závisí na použité platformě. • Vetší podpora XML formátu SRGS. Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activity G íat o UZ ASA lích Jazyků) • Gramatika G = (A/, Z, P, S) • N - množina neterminálních symbolů • Z - abeceda • P - množina pravidel • S - kořenový neterminál. • Bezkontextová gramatika • gramatika G = (A/, Z, P, S) 9 pravidla ve tvaru: A/—^{A/uZ}*. Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activity XML Formát G ram atiky • XML prolog. • Kořenový element - grammar. • Atributy: • root - pravidlo odpovídající kořenovému neterminálnímu symbolu • xmklang - jazyk gramatiky • version - použitá verze SRGS (aktuálně pouze 1.0) • mode • dtmf • voice - implicitní hodnota 9 ... • Element grammar - obsahuje množinu pravidel (elementů rule). Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activity BNF Gramatika • ABNF hlavička • #ABNF verze [kódování] #ABNF 1.0 ISO-8859-2 9 root $ jméno pravidla; - kořenový neterminální symbol • language jazyk; o mode voice|dtmf; #ABNF 1.0 UTF-8 root $pozdrav; language cs-CZ; mode voice; Luděk Bártek Standardy W3C Voice Browser Activity Levá strana pravidla: o XML formát • element rule 9 atribut id - jednoznačný identifikátor pravidla • obsah - pravá strana pravidla ahoj • ABNF • $pozdrav = ahoj; Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activity Zá Pi is pi ravi id la • Pravá strana pravidla • může obsahovat terminálni a neterminální symboly: sekvenci • varianty o XML formát • tělo elementu rule Proved s parametry . • ABNF • $ = $vstup = Proved $ s parametry $ nebo Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activity Sekvence o Posloupnost terminálních a neterminálních symbolů. • X^YZa • Lze ji rozdělit na logické části. • XML zápis: • zapsat přímo Chci jet z • dělení na logické části • využitelnost * počet opakování dané části (atribut repeat) • sémantická interpretace Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activity Ukázky • XML Formát: Chci jet z do v • ABNF zápis: $spojeni = Chci jet z $misto do $misto $druh $datum Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activity Va ri la n ty • umožňují uživateli zadat jeden z možných vstupů • Y\Z\a • XML zápis: cervena zelena modra • ABNF zápis $barvy = (červena|zelena|modra) Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activity E pa 1 • Umožňuje specifikaci: • nepovinných částí promluvy * opakovaných částí promluvy • XML zápis © pomocí atributu repeat u elementu item www tečka tečka Luděk Bártek Standardy W3C Voice Browser Activity Opakovaní W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activity ABNF zápis • za prvek uvedeme počet opakování uzavřený do o $adresa = www $castAdresy $tld $castAdresy = tečka $text počet opakování • číslo - číslo krát o číslol- číslo2 - číslol - číslo2 krát • číslo- - číslo - oo krát Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activity Zvláštní pravidla • GARBAGE - odpovídá libovolné promluvě až po následující blíže specifikovanou část • VOID - pravidlo, které nelze vyslovit (zakázaní určité promluvy) • NULL - pravidlo, které je vždy rozpoznáno (může být i prázdné) • XML formát: • ABNF: $pravidlo Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activity U káz ky o XML formát: z do • ABNF formát: $spojeni = $GARBAGE z $misto do $misto $prostredek Luděk Bártek Standardy W3C Voice Browser Activity Specifikace W3C. Příklady použité na přednášce (viz složka data ve studijních materiálech v ISu). Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activity SISR o Sémantika - přiřazuje význam slovům a promluvám. o Sémantika v dialogových systémech - přiřazuje význam promluvám a jejich částem • SISR - standard W3C pro zpracování sémantiky promluvy. • aktuální verze 1.0 • publikován - duben 2007 • úzce spjat se standardy • ECMAScript • SRGS • Umožňuje přiřazení základních interpretací částem promluvy a vytváření odvozených interpretací pro nadřazená tvrzení • přiřazení interpretace částem promluvy 9 odvozování interpretace na základech dílčích interpretací • přiřazení interpretace vstupním polím dialogu Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activity Prii ra zei n 1 1 n ter pi rel ta ce části promluvy • Sémantická interpretace bývá součástí pravidla SRGS. o K pravidlu přiřazena pomocí elementu/atributu tag. • XML formát SRGS gramatiky: • element tag {out='ano'} • atribut tag elementu item jo • ABNF tvar: o uveden za interpretovanou část promluvy • tvar: {interpretace} $souhlas = jo {ano} Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activity Odvozování interpretace n interpretací a základě dílčích o Zápis pomocí výrazů v jazyce ECMAScript. • Přiřazeno k pravidlům pomocí elementu tag. • Interpretace reprezentována pomocí objektů jazyka ECMAScript. • Stínové proměnné: pro pravidla - objekt rules • výstup - objekt out Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activity Odvozování interpretace n interpretací XML formát SRGS gramatiky a základě dílčích Mám {out = rules.barva + ';' + rules.prostředek;} Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activity Odvozování interpretace n interpretací ABNF gramatika a základě dílčích $vlastnictvi = mam $barva <0-l> $prostredek {out = rules.barva + ';' + rules.prostředek; }; $barva = (červenou {červena} |červene{červena} |zelenou{zelena} |zelene{zelena}) ; $prostredek = (auto{auto} | kolobežku{kolobežka}); Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activity Přiřazení interpretace vstu formuláře ipním polím VoiceXML • Využívají se atributy stínového objektu out • XML formát: Mám { out.barva = rules.barva; out.prostředek = rules.prostředek; } Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activity Přiřazení interpretace vstu formuláře ipním polím VoiceXML • ABNF gramatika: $vlastnictvi = mam $barva <0-l> $prostredek { out.barva = rules.barva; out.prostředek = rules.prostředek; }; $barva = (červenou {červenali červene{červena} zelenou{zelena}| zelene{zelena}); $prostredek = (auto{auto} | kolobežku{kolobežka}); Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activity • Specifikace SISR • ECMAScript • Příklady použité na přednášce. Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activity Pronunciation Lexicon Specification (PLS) • Standard W3C • Aktuální verze 1.0 (říjen 2008) • Definuje značkování pro specifikaci slovníků výslovnosti pro podporu syntézy a rozpoznávání řeči. • Specifikace na stránkách W3C Specifikace na stránkách W3C Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activity m Sa elementy PLS • Kořenový element - lexicon • atributy - xmlns - specifikace jmenného prostoru (http://www.w3.org/2005/01/pronunciation-lexicon) • xmklang - jazyk dokumentu • version - verze dokument (1.0) o alphabet - abeceda použitá pro fonetický přepis o lexeme - obsahuje popis pro jednu lexikálni jednotku (slovo, zkratku,... • musí obsahovat aspoň jeden dceřiný element grapheme • phoneme - obsahuje fonetický přepis dané lexikálni jednotky (většinou se používá IPA). Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activity U kázl kal lexi koi n u i color k' Al9 _ Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activity a gramatiky • XML formát SRGS • • • Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activit ex i a gramatiky • ABNF format SRGS #ABNF VI.0 ISO-8859-1; language en-US; lexicon ; lexicon ; Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS _Ostatní standardy W3C VoiceBrowser Activity Ukázka použití lexikonu v SSML tokens here are looked up in lexicon.pis tokens here are looked up first in strange-words.file and then, if not found, in lexicon.pis tokens here are looked up in lexicon.pis tokens here are not looked up in lexicon documents Luděk Bártek Standardy W3C Voice Browser Activity W3C Voice Browser Activity VoiceXML Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition PLS Ostatní standardy W3C VoiceBrowser Activity Další standardy W3C VoiceBrowser Activity • SSML - viz přednáška o syntéze řeči • Call Control XML - bude probrán příští týden • State Chart XML - bude probrán příští týden Luděk Bártek Standardy W3C Voice Browser Activity