M u Iti modálni dialogové systémy Dialogové systémy a emoce PB095 - Uvod do počítačového zpracování řeči Luděk Bártek Fakulta Informatiky Masarykova univerzita podzim 2021 Luděk Bártek PB095 - Úvod do počítačového zpracování řeči Multimodální dialogové systémy Q Dialogové systémy a emoce Luděk Bártek PB095 - Úvod do počítačového zpracování řeči Multimodální dialogové systémy Dialogové systémy a emoce • Mimo mluvenou řeč umožňuje alternativní způsoby komunikace člověk - počítač: • textová komunikace • grafická komunikace • ... • Výhoda - lepší přístupnost. • uživatelé s poruchami sluchu, • uživatelé s poruchami řeči, • ... Luděk Bártek PB095 - Úvod do počítačového zpracování řeči Multimodální dialogové systémy Dialogové systémy a emoce )citac - c ovek • Textová: • Mimo hlasový výstup je navíc zobrazen i odpovídající textový výstup. • Lze využít prostředky pro IM, SMS, ... • Grafická: • Talking Heads - mimo hlasový výstup je navíc zobrazena tvář (hlava, celý člověk, ...), jejíž pohyby, zejména úst, odpovídají mluvené řeči. • Komunikace znakovou řečí - mluvené slovo je překládáno na znakovou řeč (viz Guimeraes, K., Antunes, D. R., Guilhermino, de F. Guilhermino, D., Lopes da Silva, R. A., Garcia, L. S -Structure of the Brazilian Sign Language (Libras) for Computational Tools: Citizenship and Social, in Organizational, Busines, and Technological Aspects of the Knowledge Society, CCIS vol. 112, Springer, Heidelberg, 2010, pp. 365 - 370. ) • Znaková řeč prezentována pomocí rukou nebo avatara. Luděk Bártek PB095 - Úvod do počítačového zpracování řeči Multimodální dialogové systémy Dialogové systémy a emoce ověk - počítač Široké spektrum možností zadávání vstupu uživatelem jinak než hlasem: • klávesnice (počítač, DTMF, SMS, ...) • rukou psaný vstup - dotyková obrazovka + pero, ... • ústy ovládaná zařízení • ovládání pomocí pohybů očí a víček • rozpoznávání řeči pomocí sond detekujících činnost svalů a mozku (viz Schultz, T. - Silent and Weak Speech Based on Elektromyography, in Proceedings of 12th Internation Conference ICCHP 2010 Part 1, Wien, Springer, Heidelberg, pp. 595 - 604, 2010. ) • rozpoznávání znakové řeči • ... Často jako doplněk řečového vstupu. Luděk Bártek PB095 - Úvod do počítačového zpracování řeči Multimodální dialogové systémy Dialogové systémy a emoce 9 Proprietami řešení: • Součást CSLU Toolkitu. (ukázka multimodálního dialogového rozhraní (demos/support .rad)pomocí CSLU Toolkitu) • Projekt August • Otevřená řešení: • Návrhy a doporučení W3C týkající se multimodálního přístupu • Využívají a propojují i další standardy W3C (CCXML, XHTML), VoiceXML, SVG), SMIL,... • Výstup W3C Multimodal Interaction WG Luděk Bártek PB095 - Úvod do počítačového zpracování řeči Multimodální dialogové systémy Dialogové systémy a emoce aplikací Vstup Výstup + Správce Interakcí Aplikační funkce Komponenta sezení Systém a prostředí Luděk Bártek PB095 - Úvod do počítačového zpracování řeči Multimodální dialogové systémy Dialogové systémy a emoce Komponenty multimodálních i aplikací • vstup/výstup - různé vstupní komponenty (viz 4). • Správce interakcí - logická komponenta, která řídí a synchronizuje komunikaci prostřednictvím různých vstupních a výstupních kanálů. • Aplikační funkce - funkce poskytované aplikační logikou systému. 9 Komponenta sezení - poskytuje správci interakcí rozhraní pro správu stavu spojení a aplikace. • Komponenta systému a prostředí - poskytuje správci interakcí způsob jak zjistit a reagovat na změny v prostředí, v němž aplikace běží (dostupná l/O zařízení a jejich možnosti, uživatelské preference, ...) Luděk Bártek PB095 - Úvod do počítačového zpracování řeči Multimodální dialogové systémy Dialogové systémy a emoce Ukázka multimodální syntetizované řeči data / avatar-demo. mpg Figuře: Ukázka multimodálního grafického výstupu Luděk Bártek PB095 - Úvod do počítačového zpracování řeči Multimodální dialogové systémy Dialogové systémy a emoce Star id a rd ly W3C MMI WG • Emotion Markup Language (Emotion M L) 1.0 - slouží ke značkování (automatickému/ručnímu) emocí v dalších dokumentech (viz demos/emotional.ssml) • Multimodal Architecture and Interfaces - popisuje architekturu rámce pro MMI a rozhraní mezi jeho složkami (např. zpracování CCXML - implementační platforma, SCXML - dokument popisující řízení interakce, HTML -modalita, VoiceXML - modalita, SVG - modalita) • Ink Markup Language (InkML) - popisuje vstupy od elektronických per a stylusů (zadávání psaného textu, obrázků, .. .) o EMMA: Extensible MultiModal Annotation markup language - reprezentace informací získaných od uživatele libovolným kanálem. Luděk Bártek PB095 - Úvod do počítačového zpracování řeči Multimodální dialogové systémy Dialogové systémy a emoce Standard Dokončení ly W3C MMI WG • EmotionML - jazyk pro reprezentaci emocí a odpovídajících stavů pro aplikace. Vyžití: • manuální anotace dat - ruční doplnění průběhu emocí u komunikace • automatické rozpoznávání emočního stavu z chování uživatele (očekávané přechody lze modelovat pomocí SCXML) • generování emocí na straně systému • popis slovníků pro použití s EmotionML - definice emocí (viz příklad na stránkách W3C MMI WG) Luděk Bártek PB095 - Úvod do počítačového zpracování řeči Multimodální dialogové systémy Dialogové systémy a emoce Standardy W3C M Ml WG Implementace 9 MMI Architecture - multimodální uživatelské rozhráni pro budoucí telekomunikační služby od Deutsche Telekom, multimodální uživatelské rozhraní pro mobilní zařízeni od France Telecom, JVoiceXML (využití různých komponent pro modality (text, hlas)),..., více viz zpráva o implementaci 9 EMMA - prototyp multimodálního DS od společnosti Avaya, NLWorkbench (EMMA producent) a prohlížeč EMMA dokumentů od Conversational Technologies, řada multimodálních aplikací od Deutsche Telekom, SmartWeb (multimodální přistup k sémantickému webu) a OMDIP (Interaction of Dialog Management Components) od DFKI, . .., více viz zpráva o implementaci 9 InkML - interakce s OS od firmy Microsoft, InkChat od University of Western Ontario, Cue-me od Openstream lne, . .., více viz zpráva o implementaci Luděk Bártek PB095 - Úvod do počítačového zpracování řeči Multimodální dialogové systémy Dialogové systémy a emoce ly W3C MMI WG 5 - dokončení 9 Implementace EmotionML: • knihovna LORIA/SYNALP z University of Lorraine • knihovna pro C# z Chemnitz University of Technology, • podpora pro EmotionML v Mary TTS, • . .. (více viz zpráva o implementaci) Luděk Bártek PB095 - Úvod do počítačového zpracování řeči Multimodální dialogové systémy Dialogové systémy a emoce •alší standardy použitelné pro tvorbu multimodálních rozhraní Standardy použitelné pro popis jednotlivých kanálů: • GUI - HTML • dialogové rozhraní - VoiceXML + další standardy W3C Voice Browser WG • Grafika/video - SVG, SVG + SMIL, SVG + JavaScript, ... Luděk Bártek PB095 - Úvod do počítačového zpracování řeči 9 "This is a very tough question, that has produced significant amounts of headaches to scientists in the past "... many researchers have to opted to study systematically phenomena that most consider emotional." (Laval University of Quebec) • "Only mathematics is certain, so all must be based on mathematics." (R. Descartes) • Dělení emocí: • Primární (základní) - vyskytují se u všech lidí a u části vyšších v ■ v ■ I o živočichu. • Sekundární (vyšší) - mohou být intelektuální, morální a estetické. Mohou se lišit mezi jednotlivými kulturami. o Velkých šest: • hněv • zklamání Luděk Bártek PB095 - Úvod do počítačového zpracování řeči • Velkých šest (R. Descartes): • hněv • zklamání • smutek • strach • překvapení • Další autoři: • Arnold - hněv, averze, odvaha, sklíčenost, touha, zoufalství, strach, nenávist, láska, smutek. • Ekman, Friesen, Ellsworth - hněv, odpor strach, radost, smutek, překvapení. o Frijda — touha, štěstí, zájem, překvapení, údiv, zármutek, Luděk Bártek PB095 - Úvod do počítačového zpracování řeči M u Iti modálni dialogové systémy Dialogové systémy a emoce Detekce emocí Lze provádět pomocí detekce změn různých biometrických vlastností. • Změny galvanických vlastností kůže. Změny tlaku krve a pulsu Luděk Bártek PB095 - Úvod do počítačového zpracování řeči Mu Itimodální dialogové systémy Dialogové systémy a emoce Detel kce emo c 1 • Použitelné biometrické charakteristiky: • změny dýchání • změny elektrické aktivity mozku změny charakteristik řeči • výraz tváře (Yale Face Database). • ... Luděk Bártek PB095 - Úvod do počítačového zpracování řeči M u Iti modálni dialogové systémy Dialogové systémy a emoce Luděk Bártek PB095 - Úvod do počítačového zpracování řeči Multimodální dialogové systémy Dialogové systémy a emoce se • Ospalost Překvapení Luděk Bártek PB095 - Úvod do počítačového zpracování řeči M ultimodální dialogové systémy Dialogové systémy a emoce v e ik pro smutek a hněv Luděk Bártek PB095 - Úvod do počítačového zpracování řeči M u Iti modálni dialogové systémy Dialogové systémy a emoce Využití emocí v dialogovém rozhraní • Dialogová rozhraní informačních systémů • uzpůsobení dialogové strategie emočnímu stavu uživatele (klid, stres, hněv, ...) • přepojení uživatele na lidského operátora. • emoce lze použít ve vnitřních stavech Mealyho automatu pro ovlivnění chování přechodové funkce. 9 Výukové DS: • uzpůsobení dialogové strategie koncentraci uživatele. • ... Luděk Bártek PB095 - Úvod do počítačového zpracování řeči