PB125 Řečová komunikace a dialogové systémy

Fakulta informatiky
jaro 2003
Rozsah
0/2. 3 kr. (plus ukončení). Doporučované ukončení: k. Jiná možná ukončení: z.
Vyučující
Mgr. Robert Batůšek (přednášející)
doc. RNDr. Ivan Kopeček, CSc. (přednášející)
Garance
prof. PhDr. Karel Pala, CSc.
Katedra strojového učení a zpracování dat – Fakulta informatiky
Kontaktní osoba: doc. RNDr. Ivan Kopeček, CSc.
Rozvrh
Čt 8:00–9:50 B411
Předpoklady
! P125 Řeč. kom. a dialogové systémy
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
Cíle předmětu
Náplní předmětu je práce na aktuálních problémech z oblasti řečové komunikace mezi člověkem a počítačem. Předmět je veden formou semináře. Studenti si na začátku vyberou problém (buď přijdou sami s nějakým návrhem nebo si vyberou jeden z nabídnutých) a do konce semestru vypracují jeho řešení. Na konci semestru proběhnou krátké prezentace všech projektů.
Osnova
  • Předmět tématicky pokrývá tato témata: Syntéza řeči - zpracování textu pro syntézu řeči, fonetický přepis, modelování prozodie, výběr segmentů, akustické modelování, vyhodnocení kvality Rozpoznávání řeči - akustické modelování, rozpoznávání izolovaných slov, rozpoznávání plynulé řeči, identifikace řečníka, jazykové modelování Dialogové systémy - VoiceXML, tvorba dialogových systémů, dialogové systémy pro získávání informací, nástroje pro návrh dialogových systémů, dialogové strategie, modelování uživatele Zpracování řečových dat - řečové korpusy, značkování řečových korpusů, poslechové a řečové experimenty Aplikace pro zdravotně postižené - dialogové systémy pro nevidomé, řečově orientované hry Programování řečově orientovaných aplikací - spolupráce na probíhajících projektech, implementace standardů, připojování řečových rozhraní Prezentace laboratoře - tvorba www stránek Další témata související s řečovou komunikací mezi člověkem a počítačem - zpracování zvuku na počítači obecně
Literatura
  • DUTOIT, Thierry. An introduction to text-to-speech synthesis. Dordrecht: Kluwer Academic Publishers, 1997, vii, 285 s. ISBN 0-7923-4498-7. info
  • RABINER, Lawrence R. a Biing-Hwang JUANG. Fundamentals of speech recognition. Englewood Cliffs: Prentice Hall PTR, 1993, xxxv, 507. ISBN 0-13-015157-2. info
Navazující předměty
Další komentáře
Předmět je vyučován každoročně.
Předmět je zařazen také v obdobích jaro 2004, jaro 2005, jaro 2007, jaro 2008, jaro 2009, jaro 2010, jaro 2011, jaro 2012.