Dialogové systémy Luděk Bártek Dialogové systémy Luděk Bártek Laboratoř vyhledávání a dialogu, Fakulta Informatiky Masarykovy Univerzity, Brno jaro 2020 Historie zpracování a napodobování řeči Dialogové systémy Luděk Bártek před 3 milióny let - Australopitekus - schopnost artikulované řeči starověk - budování mluvících soch bůžků 1779 - Kratzenstein - systém rezonátorů pro napodobení samohlásek a, e, i, o, u. mm Historie zpracování a napodobování řeči Dialogové systémy Luděk Bártek 1791 - Wolfgang von Kempelen - mechanický mluvící stroj 1835 - zrekonstruován a upraven Wheatstonem v Dublinu - měl navíc pružnou „ústní dutinu" 1846 - J. Faber - mluvící stroj Euphonia Historie zpracování a napodobování řeči Dialogové systémy Luděk Bártek 1937 - R. R. Riesz - mechanický mluvící stroj napodobující lidské řečové ústrojí NOSTRIL y,/,/ y 'y /■/ >/>a i>y,!/! ■7T- í -í PITCH MOUTH VELUM LIPS TEETH PHARYNX AIR FROM TANK 1939 - H. Dudley - VODER (elektromechanický rečový syntetizér), VOCODER (elektrické zařízení kódování a přenos řeči) 50. léta 20. století - syntéza ve frekvenční oblasti, později syntéza v časové oblasti Historie zpracování a napodobování řeči Dokončení Dialogové systémy Luděk Bártek cca 1970 - počítače 1966 - J. Weizenbaum - Eliza (Communications of the ACM, leden). Základy moderní analýzy reči Dialogové systémy Luděk Bártek ■ 19. století Historie zpracování zvuku ■ J.B. Fourier - Fourierova věta - využívá se při spektrální analýze zvuku ■ H. Helmholtz - zabýval se fyziologií vnímání hudby, Základní technologie Helmholtzův rezonátor ■ J. R. Ewald - fyziologie sluchu ■ 1924 - spektrální analýza řeči na bázi formantové analýzy samohlásek ■ 1939 - vokodér - zařízení pro kompresi řeči pro účely přenosu hlasu rádiem a transkontinentálním kabelem ■ 1946 - 1947 - zařízení pro grafický záznam řeči ■ 2. polovina 20. století - intenzivní vývoj jak teorie, tak počítačových aplikací. Základní řečové technologie Dialogové systémy Luděk Bártek syntéza řeči rozpoznávání řeči související oblasti - zpracování jak v časové tak frekvenční oblasti rozpoznávání řečníka detekce emocí word spotting