VoiceXML SRGS SISR Řečová interakce a sociální sítě Luděk Bártek Fakulta informatiky Masarykova univerzita podzim 2014 O VoiceXML 0 SRGS 0 SISR VoiceXML SRGS SISR Tvorba dialogového rozhraní se smíšenou iniciativou • Formulář obsahuje element initial: • Definuje 1. krok dialogu, kdy je iniciativa na straně uživatele. • Pokusí se pomocí gramatiky formuláře získat tolik hodnot vstupních polí, kolik uživatel zadá a odpovídajícím vstupním polím formuláře se přiřadí získaná hodnota. • Promluvy rozpoznávané v elementu initial jsou popsány gramatikou přiřazenou formuláři. • Vstupy, které bud uživatel nezadal a nebo nebyly rozpoznány, se získají pomocí vstupních polí formuláře (viz algoritmus FIA). • Detaily viz příklad (http://www.fi.muni.cz/~bar/pb095/dialog.xml) (možnost bezplatně otestovat přes Skype: +990009369996160530 nebo SIP: 9996160530@sip.voxeo.net , komunikace v angličtině). VoiceXML SRGS SISR Gramatiky pro podporu rozpoznávání řeči (SRGS) • Standard (http://www.w3.org/TR/speech-grammar/) W3C Voice Browser Activity • Aktuální verze 1.0 (březen 2004) • Náhrada za JSGF (http://www.w3.org/TR/jsgf/) - stále využíván některými platformami. • Textový popis bezkontextové gramatiky pomocí: o XML formátu • ABNF formátu VoiceXML SRGS SISR Struktura XML formátu gramatiky • Kořenový element - grammar • povinné atributy - version (verze SRGS), xmhlang (přirozený jazyk použitý v gramatice), root (odkaz na kořenové pravidlo gramatiky) o obsahuje seznam pravidel gramatiky. • Pravidla gramatiky - rule • povinný atribut - id - slouží k identifikaci pravidla v gramatice -hodnota musí být jedinečná. • Více viz příklady (http://www.fi.muni.cz/~bar/pb095/pizza.grxml). VoiceXML SRGS SISR Element grammar Obsah Obsahuje: • sekvenci - posloupnost elementů item, které obsahují jednotlivé části rozpoznávané sekvence. • volbu - element one-of - skládá se z několika elementů item, které obsahují jednotlivé možnosti. • elementy tag - slouží k popisu sémantické interpretace promluvy. Mohou se vyskytovat na začátku elementu (inicializace, před tím než započne analýza podle tohoto pravidla) nebo na konci elementu (dokončení interpretace pravidla). • V jednotlivých položkách (elementy item) - interpretace položky. • V elementu item může být nahrazen atributem tag se stejným významem. VoiceXML SRGS SISR Sémantická interpretace pro rozpoznávání řeči • Standard (http://www.w3.org/TR/semantic-interpretation/) W3C Voice Browser Activity. • Umožňuje přiřadit sémantickou interpretaci (význam) promluvě rozpoznané pomocí SRGS - definuje možný obsah elementu tag v SRGS. • Postaven na výrazech jazyka ECMAScript • Sémantická interpretace se přiřazuje pomocí výrazů, které jsou součástí: • SRGS elementu tag • SRGS atributu tag (element item, ...) VoiceXML SRGS SISR Přenesení výsledku sémantické interpretace do VoiceXML dokumentu • SISR umožňuje přiřadit výsledek interpretace: • pravidlu SRGS • vstupnímu poli VoiceXML formuláře. • Stínové proměnné pro přenos sémantické informace: • out - výstup pravidla • out.name - vstupní pole name • rules - pro zpřístupnění neterminálních symbolů na pravé straně pravidla. o rules.city - sémantická interpretace neterminálního symbolu city • Viz ukázka dialogu se smíšenou iniciativou.