Multimodálni dialogové systémy Dialogové systémy a emoce PB095 - Úvod do počítačového zpracování řeči Luděk Bártek Fakulta Informatiky Masarykova univerzita podzim 2014 Luděk Bártek PB095 - Úvod do počítačového zpracování řeči Multimodálni dialogové systémy Dialogové systémy a emoce Obsah Q M ulti modál n í dialogové systémy £ Dialogové systémy a emoce Luděk Bártek PB095 - Úvod do počítačového zpracování řeči I ul ti modálni dialogové systémy Dialogové systémy a emoce Multimodální dialogová rozhraní • Mimo mluvenou řeč umožňuje alternativní způsoby komunikace člověk - počítač: • textová komunikace • grafická komunikace • ... • Výhoda - lepší přístupnost. • uživatelé s poruchami sluchu, • uživatelé s poruchami řeči, Luděk Bártek PB095 - Úvod do počítačového zpracování řeči Multimodálni dialogové systémy Dialogové systémy a emoce Multimodální komunikace počítač - člověk • Textová: • Mimo hlasový výstup je navíc zobrazen i odpovídající textový výstup. • Lze využít prostředky pro IM, SMS, ... • Grafická: • Talking Heads - mimo hlasový výstup je navíc zobrazena tvář (hlava, celý člověk, ...), jejíž pohyby, zejména úst, odpovídají mluvené řeči. • Komunikace znakovou řečí - mluvené slovo je překládáno na znakovou řeč (viz Guimeraes, K., Antunes, D. R., Guilhermino, de F. Guilhermino, D., Lopes da Silva, R. A., Garcia, L. S -Structure of the Brazilian Sign Language (Libras) for Computational Tools: Citizenship and Social, in Organizational, Busines, and Technological Aspects of the Knowledge Society, CCIS vol. 112, Springer, Heidelberg, 2010, pp. 365 - 370. ) • Znaková řeč prezentována pomocí rukou nebo avatara. Luděk Bártek PB095 - Úvod do počítačového zpracování řeči Multimodálni dialogové systémy Dialogové systémy a emoce Multimodální komunikace člověk - počítač • Široké spektrum možností zadávaní vstupu uživatelem jinak než hlasem: • klávesnice (počítač, DTMF, SMS, ...) • rukou psaný vstup - dotyková obrazovka + pero, ... a ústy ovládaná zařízení • ovládání pomocí pohybů očí a víček a rozpoznávání řeči pomocí sond detekujících činnost svalů a mozku (viz Schultz, T. - Silent and Weak Speech Based on Elektromyography, in Proceedings of 12th Internation Conference ICCHP 2010 Part 1, Wien, Springer, Heidelberg, pp. 595 - 604, 2010. ) a rozpoznávání znakové řeči a ... • Často jako doplněk řečového vstupu. Luděk Bártek PB095 - Úvod do počítačového zpracování řeči Multimodálni dialogové systémy Dialogové systémy a emoce Existující nástroje a standardy • Proprietami řešení: • Součást CSLU Toolkitu. (ukázka multimodálního dialogového rozhraní (demos/support.rad)pomocí CSLU Toolkitu) • Projekt August • Otevřená řešení: • Návrhy a doporučení W3C týkající se multimodálního přístupu. • Využívají a propojují i další standardy W3C (CCXML, XHTML), VoiceXML, SVG), SMIL,... » Výstup W3C Multimodal Interaction WG Luděk Bártek PB095 - Úvod do počítačového zpracování řeči M ulti modálni dialogové systémy Dialogové systémy a emoce Architektura multimodálních aplikací Luděk Bártek PB095 - Úvod do počítačového zpracování řeči Multimodálni dialogové systémy Dialogové systémy a emoce Komponenty multimodálních aplikací • vstup/výstup - různé vstupní komponenty (viz 4). • Správce interakcí - logická komponenta, která řídí a synchronizuje komunikaci prostřednictvím různých vstupních a výstupních kanálů. • Aplikační funkce - funkce poskytované aplikační logikou systému. • Komponenta sezení - poskytuje správci interakcí rozhraní pro správu stavu spojení a aplikace. • Komponenta systému a prostředí - poskytuje správci interakcí způsob jak zjistit a reagovat na změny v prostředí, v němž aplikace běží (dostupná l/O zařízení a jejich možnosti, uživatelské preference, ...) Luděk Bártek PB095 - Úvod do počítačového zpracování řeči Multimodálni dialogové systémy Dialogové systémy a emoce Ukázka multimodální syntetizované řeči Figure: Ukázka multimodálního grafického výstupu Luděk Bártek PB095 - Úvod do počítačového zpracování řeči Multimodálni dialogové systémy Dialogové systémy a emoce Standardy W3C MMI WG • Emotion Markup Language (EmotionM L) 1.0 - slouží ke značkování (automatickému/ručnímu) emocí v dalších dokumentech (viz demos/emotional.ssml) • Multimodal Architecture and Interfaces - popisuje architekturu rámce pro MMI a rozhraní mezi jeho složkami (např. zpracování CCXML - implementační platforma, SCXML - dokument popisující řízení interakce, HTML -modalita, VoiceXML - modalita, SVG - modalita) • Ink Markup Language (InkML) - popisuje vstupy od elektronických per a stylusů (zadávání psaného textu, obrázků, ...) • EMMA: Extensible MultiModal Annotation markup language - reprezentace informací získaných od uživatele libovolným kanálem. Luděk Bártek PB095 - Úvod do počítačového zpracování řeči Multimodální dialogové systémy Dialogové systémy a emoce Co jsou to emoce? • "This is a very tough question, that has produced significant amounts of headaches to scientists in the past "... many researchers have to opted to study systematically phenomena that most consider emotional." (Laval University of Quebec) • "Only mathematics is certain, so all must be based on mathematics." (R. Descartes) • Dělení emocí: • Primární (základní) - vyskytují se u všech lidí a u části vyšších živočichů. • Sekundární (vyšší) - mohou být intelektuální, morální a estetické. Mohou se lišit mezi jednotlivými kulturami. • Velkých šest: • hněv • zklamání o Luděk Bártek PB095 - Úvod do počítačového zpracování řeči Multimodálni dialogové systémy Dialogové systémy a emoce Základní emoce • Velkých šest (R. Descartes): • hněv • zklamání • smutek • strach • překvapení • Další autoři: • Arnold - hněv, averze, odvaha, sklíčenost, touha, zoufalství, strach, nenávist, láska, smutek. • Ekman, Friesen, Ellsworth - hněv, odpor strach, radost, smutek, překvapení. • Frijda —touha, štěstí, zájem, překvapení, údiv, zármutek, Luděk Bártek PB095 - Úvod do počítačového zpracování řeči Multimodální dialogové systémy Dialogové systémy a emoce Detekce emocí • Lze provádět pomocí detekce změn různých biometrických vlastností. • Změny galvanických vlastností kůže. • Změny tlaku krve a pulsu. Multimodálni dialogové systémy Dialogové systémy a emoce Detekce emocí • Použitelné biometrické charakteristiky: • změny dýchání • změny elektrické aktivity mozku • změny charakteristik řeči • výraz tváře (Yale Face Database). Luděk Bártek PB095 - Úvod do počítačového zpracování řeči Multimodálni dialogové systémy Dialogové systémy a emoce Ukázky z Yale Face Database • Radost • Smutek Luděk Bártek PB095 - Úvod do počítačového zpracování řeči M ulti modálni dialogové systémy Dialogové systémy a emoce Luděk Bártek PB095 - Úvod do počítačového zpracování řeči Multimodální dialogové systémy Dialogové systémy a emoce Luděk Bártek PB095 - Úvod do počítačového zpracování řeči Multimodální dialogové systémy Dialogové systémy a emoce Využití emocí v dialogovém rozhraní • Dialogová rozhraní informačních systémů » uzpůsobení dialogové strategie emočnímu stavu uživatele (klid, stres, hněv, ...) • přepojení uživatele na lidského operátora. • Výukové DS: • uzpůsobení dialogové strategie koncentraci uživatele. Luděk Bártek PB095 - Úvod do počítačového zpracování řeči