PLIN041 Vývoj počítačové lingvistiky Strojový překlad Mgr. Dana Hlaváčková, Ph.D. 40.–70. léta 20. století Strojový překlad (od 50. let 20. st.) • první písemná zmínka 1947 – dopis W. Weavera N. Wienerovi: „… I have wondered if it were unthinkable to design a computer which could translate.“ „This is really written in English, but it has been coded in some strange symbols“ (při pohledu na článek v ruštině, kryptografie) 1949 – Weaver – memorandum Translation 1952 – The first machine translation conference (MIT, Bar-Hillel) 1954 – Mechanical Translation (journal) 1955 – Machine Translation of Languages: Fourteen Esays • strojový překlad je záležitost kryptografie • snaha o formalizaci jazyka pro strojové zpracování, vytvoření „převodního jazyka“ = formalizace významové struktury vět (nevyřešeno) • americký vědec, matematik, „pionýr“ strojového překladu, organizátor vědy • vystudoval univerzitu ve Wisconsinu, profesor matematiky v Kalifornii • sloužil v 1. sv. v. u letecké služby • 1932–1955 byl ředitelem oddělení přírodních věd Rockefellerovy nadace (Division of Natural Sciences Rockefeller Foundation), přidělování grantů v přírodních vědách • za 2. sv. v. – řídil operace matematiků, zabýval se počítacími stroji a kryptografií • iniciátor strojového překladu • nadační činnost – podpora řady vědeckých projektů • sběratel Alenky v říši divů Warren Weaver 1894–1978 Strojový překlad (od 50. let 20. st.) • 1) nadšení a velké investice • motivace – studená válka (pol. 50. – poč. 60. let) • chybovost – malý rozsah paměti, slovo za slovo, mimojazykové skutečnosti • 1954 v centrále IBM Georgetown-IBM experiment • 49 vět z RJ do AJ, 250 slov, 6 gramatických pravidel, IBM 701 • University of Washington, od 1956, Erwin Reifler • původem Rakušan, profesor čínštiny, „pionýr“ strojového překladu, série článků Studies in Mechanical Translation • The Machine Translation Project, sponzorován letectvem, angličtina – ruština, angličtina – čínština • 2) rozčarování (pol. 60. – poč. 70. let) • zpráva ALPAC (Automatic Language Processing Advisory Committee) 1966, skepse k MT • velké investice a zklamání • zrušení investic i výzkumu • soustředění pozornosti na budování slovníků a výzkum jazyka (gramatika, sémantika) • později se vyplatil bližší výzkum jazyků Strojový překlad (od 50. let 20. st.) Strojový překlad (od 50. let 20. st.) • 3) umírněný optimismus a částečné úspěchy (70. a 80. léta) • Kanada, Montreal 1975 – systém TAUM-METEO (John Chandioux) – překlad anglických meteorologických zpráv do francouzštiny (jednoduchá slovní zásoba i gramatika, 10–20 % svěřeno překladateli, jazyk Q) • Francie, Grenoble – RJ – FrJ, jazyk ALGOL • SSSR • Moskva – V. J. Rozencvejg (AJ), J. D. Apresjan (RJ), O. S. Kulagina (RJ – FrJ) • Leningrad (Petrohrad) – G. S. Cejtin Strojový překlad (od 50. let 20. st.) • ČSSR – od r. 1957 • Oddělení teorie strojového překladu FF UK (P. Sgall, P. Novák, B. Palek) • r. 1960 překlad AJ – ČJ na čs. počítači SAPO • několik desítek slov, odborné texty, ustálená slovní zásoba • lingvisté z UK Petr Sgall, Eva Hajičová, Jarmila Panevová, Petr Piťha, Zdeněk Kirschner, Výzkumný ústav matematických strojů – projekt APAČ, 70. léta, ČJ – AJ – projekt RUSLAN, 80. léta, ČJ – RJ Yehoshua Bar-Hillel • 1915 Vídeň – 1975 Jeruzalém • izraelský filozof, logik, matematik, lingvista • předmět zájmu – algebraická lingvistika, strojový překlad, získávání informací, logické aspekty přirozených jazyků • 1933 emigroval do Palestiny, žil v kibucu, usadil se v Jeruzalémě • za 2. sv. v. bojoval v Židovské brigádě britské armády, potom v Izraelské válce o nezávislost (přišel o oko) • Hebrew University v Jeruzalémě střídá s Research Laboratory of Electronic na MIT (strojový překlad) • snaha o sblížení logiky a lingvistiky (sémantiky) • spolupráce s R. Carnapem, formální popis sémantiky, článek Semantic Information, 1953 • kategoriální gramatika (vliv Chomského) • od poč. 50. let ovlivněn kybernetikou (N. Wiener), práce na MIT v oblasti strojového překladu • 1952 vede první konferenci o strojovém překladu • velké nadšení, ale zdůrazňuje podíl lidské práce při překladech • konec 50. let – skepse a silná kritika využití statistických metod a hledání mezijazyka, ani rozsáhlá data nevyřeší všechny víceznačnosti Yehoshua Bar-Hillel Yehoshua Bar-Hillel • 1960 zpráva sponzorům o neúspěšnosti MT (bývala citována jako důkaz nemožnosti MT) • Language and Information, 1964 • Aspects of Language, 1970 • (vnučka Gili Bar-Hillel přeložila Harryho Pottera do hebrejštiny) Andrew Donald Booth • 1918–2009 • matematický fyzik, elektroinženýr, • za 2. sv. v. – krystalografie (výbušnin) – mechanické a elektromechanické kalkulátory (pro triviální aritmetické výpočty) • po 2. sv. v. – 4 skupiny v Británii – budování počítačů • Booth – Birkbeck College University of London (musí být dost levný, levné komponenty) • 1946 Rockefellerova nadace – cesta po USA za návrháři prvních počítačů (John von Neumann, Princeton) – návrh počítače s von Neumanovou architekturou • návrh paměti – magnetický buben • 1947 setkání s Weaverem – financování výzkumu krystalografie (electronic computer), strojový překlad • počítač Automatic Relay Computer (ARC)