Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition Ostatní standardy W3C VoiceBrowser Activity
Dialogové systémy
Luděk Bártek
Fakulta informatiku Masarykova univerzita
podzim 2014
Luděk Bártek Dialogové systémy
Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition Ostatní standardy W3C VoiceBrowser Activity
Q| Speech Recognition Grammar Specification Q Semantic Intepretation for Speech Recognition Ql Ostatní standardy W3C VoiceBrowser Activity
Luděk Bártek Dialogové systémy
SRG
Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition Ostatní standardy W3C VoiceBrowser Activity
• W3C specifikace jazyka pro zápis bez kontextových gramatik pro podporu rozpoznávání řeči.
• Aktuální verze 1.0 (březen 2004).
» Nahradil původně používaný standard JSGF.
• Dvě varianty zápisu gramatiky:
• XML
o Augmented Backus-Naur Form (ABNF).
• Liší se pouze zápis nikoliv vyjadřovací síla.
• Možnost použití způsobu zápisu závisí na použité platformě.
• Vetší podpora pro XML formát.
Luděk Bártek Dialogové systémy
Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition Ostatní standardy W3C VoiceBrowser Activity
Gramatiky (Teorie Formálních Jazyků)
• Gramatika G = (N, Z, P, S)
• N - množina neterminálních symbolu
• Y. - abeceda
• P - množina pravidel
• S - kořenový neterminál.
• Bezkontextová gramatika
• gramatika G — (N, T, P, S)
• pravidla ve tvaru: N —>• {N U Y.}*.
Luděk Bártek Dialogové systémy
Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition Ostatní standardy W3C VoiceBrowser Activity
XML Formát Gramati
• XML prolog.
• Kořenový element - grammar.
• Atributy:
• root - pravidlo odpovídající kořenovému neterminálnímu symbolu
o xmhlang - jazyk gramatiky
• version - použitá verze SRGS (aktuálně pouze 1.0)
• mode
• dtmf
• voice - implicitní hodnota
• ...
• Element grammar - obsahuje množinu pravidel (elementů rule).
Luděk Bártek Dialogové systémy
Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition Ostatní standardy W3C VoiceBrowser Activity
ABNF Gramatika
• ABNF hlavička
• #ABNF verze [kódováni] #ABNF 1.0 ISO-8859-2
• root $ jméno pravidla; - kořenový neterminální symbol
• language jazyk;
• mode voice|dtmf;
#ABNF 1.0 UTF-8 root $pozdrav; language cs-CZ; mode voice;
Luděk Bártek Dialogové systémy
Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition Ostatní standardy W3C VoiceBrowser Activity
ápis pravi
• Levá strana pravidla:
• X M L formát
• element rule
• atribut id - jednoznačný identifikátor pravidla
• obsah - pravá strana pravidla
ahoj
• ABNF
•
$pozdrav = ahoj;
Luděk Bártek Dialogové systémy
Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition Ostatní štandardy W3C VoiceBrowser Activity
Zápis pravidla
• Pravá strana pravidla
• může obsahovat terminálni a neterminální symboly:
• sekvenci
• varianty
9 XML formát
• tělo elementu rule
Proved s parametry .
• ABNF
• $ = $vstup =
Proveď $
s parametry $
nebo
$vstup = Proved $prikazy s parametry $parametry
Luděk Bártek Dialogové systémy
Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition Ostatní standardy W3C VoiceBrowser Activity
Sekvence
• Posloupnost terminálních a neterminálních symbolů.
• X^YZa
• Lze ji rozdělit na logické části.
• XML zápis:
• zapsat přímo
Chci jet z .
dělení na logické části využitelnost
• počet opakování dané části (atribut repeat
• sémantická interpretace
Luděk Bártek Dialogové systémy
Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition Ostatní standardy W3C VoiceBrowser Activity
Sekvence
Ukázky
• XML Formát:
Chci jet - z
- do
-
-
- v
• ABNF zápis:
$spojeni = Chci jet z $misto do $misto $druh $datum v $cas.
Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition Ostatní standardy W3C VoiceBrowser Activity
• umožňují uživateli zadat jeden z možných vstupů
• X Y\Z\a
• XML zápis:
- cervena
- zelena
< it em>modra it em>
• ABNF zápis
$barvy = (červenal zelenal modra)
Luděk Bártek Dialogové systémy
Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition Ostatní standardy W3C VoiceBrowser Activity
Opakov,
• Umožňuje specifikaci:
• nepovinných částí promluvy
• opakovaných částí promluvy
• XML zápis
• pomocí atributu repeat u elementu item
www
•Citem repeat="l-2">
tečka
tečka
Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition Ostatní standardy W3C VoiceBrowser Activity
Opakov,
• ABNF zápis
• za prvek uvedeme počet opakování uzavřený do <>
$adresa = www $castAdresy $tld $castAdresy = tečka $text
• počet opakování
• číslo - číslo krát
• číslol- číslo2 - číslol - číslo2 krát
• číslo- - číslo - oo krát
Luděk Bártek Dialogové systémy
Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition Ostatní standardy W3C VoiceBrowser Activity
Zvláštní pravidla
• GARBAGE - odpovídá libovolné promluvě až po následující blíže specifikovanou část
• VOID - pravidlo, které nelze vyslovit (zakázaní určité promluvy)
• NULL - pravidlo, které je vždy rozpoznáno (může být i prázdné)
• XML formát:
•
•Cruleref special="GARBAGE"/>
z do •Cruleref uri="#prostredek"/>
• ABNF
• $ pravidlo
$spojeni = $GARBAGE z $misto do $misto $prostredek
Luděk Bártek Dialogové systémy
Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition Ostatní standardy W3C VoiceBrowser Activity
• Specifikace W3C.
• Příklady použité na přednášce (viz složka data ve studijních materiálech v ISu).
Luděk Bártek Dialogové systémy
Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition Ostatní standardy W3C VoiceBrowser Activity
• Sémantika - přiřazuje význam slovům a promluvám.
• Sémantika v dialogových systémech - přiřazuje význam promluvám a jejich částem
• SISR - standard W3C pro zpracování sémantiky promluvy.
• aktuální verze 1.0
• publikován - duben 2007
• úzce spjat se standardy
• ECMAScript
• SRGS
• Umožňuje přiřazení základních interpretací částem promluvy a vytváření odvozených interpretací pro nadřazená tvrzen
• přiřazení interpretace částem promluvy
• odvozování interpretace na základech dílčích interpretací
• přiřazení interpretace vstupním polím dialogu
Luděk Bártek Dialogové systémy
Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition Ostatní standardy W3C VoiceBrowser Activity
Přiřazení interpretace části promluvy
• Sémantická interpretace bývá součástí pravidla SRGS.
• K pravidlu přiřazena pomocí elementu/atributu tag.
• XML formát SRGS gramatiky:
• element tag
-
•Cruleref uri="souhlas"/>{out='ano'}
• atribut tag elementu item
•Citem tag="ano">jo
• ABNF tvar:
• uveden za interpretovanou část promluvy
• tvar: interpretace $souhlas = jo {ano}
Luděk Bártek Dialogové systémy
Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition Ostatní standardy W3C VoiceBrowser Activity
Odvozování interpretace na základě dílčích interpretací
• Zápis pomocí výrazů v jazyce ECMAScript.
• Přiřazeno k pravidlům pomocí elementu tag.
• Interpretace reprezentována pomocí objektů jazyka ECMAScript.
• Stínové proměnné:
• pro pravidla - objekt rules
• výstup - objekt out
Luděk Bártek Dialogové systémy
Speech Recognition Gramn iar Specification
Semantic Intepretation for Spe !ech Recognition
Ostatní standardy W3C Voice Browser Activity
Odvozování interpretace na základě dílčích interpretací
XML formát SRGS gramatiky
- Mám
-
{out = rules.barva + + rules.prostředek;}
Luděk Bártek Dialogové systémy
Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition Ostatní standardy W3C VoiceBrowser Activity
Odvozování interpretace na základě dílčích interpretací
ABNF gramatika
$vlastnictvi = mam $barva <0-l> $prostredek
{out = rules.barva + ;;; + rules.prostředek;}; $barva = (červenou {červena}
Ičervené{cervena}
Izelenou{zelena}
Izelene{zelena}); $prostredek = (auto{auto} | kolobezku{kolobezka});
Luděk Bártek Dialogové systémy
Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition Ostatní standardy W3C VoiceBrowser Activity
Přiřazení interpretace vstupním polím VoiceXML formuláře
• Využívají se atributy stínového objektu out
• XML formát:
-
Mám
- {
out.barva = rules.barva;
out.prostředek = rules.prostředek;
}
Luděk Bártek Dialogové systémy
Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition Ostatní standardy W3C VoiceBrowser Activity
Přiřazení interpretace vstupním polím VoiceXML formuláře
• ABNF gramatika:
$vlastnictvi = mam $barva <0-l> $prostredek {
out.barva = rules.barva; out.prostředek = rules.prostředek; >;
$barva = (červenou {červena}|
cervene{cervena}|
zelenou{zelena}|
zelene{zelena}); $prostredek = (auto{auto} | kolobezku{kolobezka});
Luděk Bártek Dialogové systémy
Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition Ostatní standardy W3C VoiceBrowser Activity
• Specifikace SISR
• ECMAScript
• Příklady použité na přednášce.
Luděk Bártek Dialogové systémy
Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition Ostatní standardy W3C VoiceBrowser Activity
Další standardy W3C VoiceBrowser Activity
• SSML
• Pronunciation Lexicon Specification
• Call Control XML
• State Chart XML
Luděk Bártek Dialogové systémy
Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition Ostatní standardy W3C VoiceBrowser Activity
Speech Synthesis Markup Language
• Značkovací jazyk pro podporu syntetizované řeči ve webových aplikacích.
• Standard W3C
• Aktuální verze 1.0 (září 2004)
• Vychází z JSGF/JSML (JSpeech Markup Language)
• Cíle:
• musí umožňovat konzistentní ovládání hlasového výstupu řečovým syntetizérem.
• musí dovolovat TTS pro co nejširší škálu aplikací a domén
• musí být internacionalizovaný
• musí být snadno použitelný pro psaní dokumentů
• musí být implementovatelný pomocí stávajících technologií
• JSML dokumenty musí být lidsky čitelné.
• Zbytek viz syntéza řeči.
Luděk Bártek Dialogové systémy
Speech Recognition Grammar Specification Semantic Intepretation for Speech Recognition Ostatní standardy W3C VoiceBrowser Activity
Pronunciation Lexicon Specification (PLS)
• Standard W3C
• Aktuální verze 1.0 (říjen 2008)
• Definuje značkování pro specifikaci slovníků výslovnosti pro podporu syntézy a rozpoznávání řeči.
• Specifikace W3C
Luděk Bártek Dialogové systémy
Speech Recognition Gramn iar Specification 1
Semantic Intepretation for Spe :ech Recognition 1
Ostatní standardy W3C Voicel Browser Activity 1
Call Control XML
• Standard W3C
• Aktuální verze 1.0 (červenec 2011)
• navržen pro ovládání telefonních hovorů z dialogových systémů
• Specifikace W3C « Umožňuje:
• sestavení a ovládání konferenčních hovorů
• přesměrování hovoru o ...
Luděk Bártek Dialogové systémy