Memorandum 1949 Warren Weaver Toto dílo se snažilo podpořit statistickou sémantiku a snažilo se inspirovat ostatní, aby se jejímu studiu věnovali. Autorem díla je Warren Weaver, který se o své úvahy dělil s kybernetikem Norbertem Wienerem. Sám autor v úvodu píše: Toto dílo, které je o překladu z jedné řeči do druhé a o možnosti, že se na něm budou podílet počítače, bylo napsáno s jedinou nadějí: že toto dílo inspiruje někoho, aby se tím zabýval. Byl jsem nervózní, že mé ideje jsou naivní. Ale protože mi toto téma přijde velmi důležité, jsem ochoten vystavit svou ignoranci na odiv doufajíc, že má snaha tuto ignoranci zastíní. V memorandu jsou zmíněny čtyři hlavní problémy, kterými se Weaver zabýval. Těmi problémy je mnohoznačnost slov, kryptografická metoda, existence “základního jazyka” a logika jazyka. Kryptografická metoda Vše začalo válečnou příhodou, kterou vyprávěl Weaverovi jeden známý. Jeho kolega prý rozluštil kód, který byl vytvořen v turečtině. A přitom ten kolega turecky neuměl a dokonce ani nevěděl, v jakém jazyce je kód vytvořen. Tato příhoda přivedla Weavera k myšlence, že kryptografie je nezávislá na jazyce, ze kterého překládá. Z toho vyvodil, že existuje něco společného pro všechny jazyky. Weaver došel k přesvědčení, že je možné, že jazyk je jen kryptografie. Podrobně to rozvádí v dopise, který napsal kryptografovi Norbertu Wienerovi. Píše: Přemýšlel jsi někdy o tom, že jazyk je vlastně kryptografie? Že text v ruštině je vlastně napsán v angličtině, jen je zakódován zvláštními symboly? (Tím naráží na azbuku.) Kdybychom měli nějaký odborný text, u kterého nezáleží na slohu a eleganci, mohl by být přeložen jen nějakým počítačem. Wiener jeho nadšení zmírňuje a upozorňuje ho na různé problémy. Například v angličtině slovo get má mnoho forem a my je musíme rozlišovat. Kryptografickou metodou se zabýval také Claude Shannon. Ten publikoval svou matematickou teorii komunikace, ve které se zmiňuje mim jiné i o kryptografii. Uvažuje takto: Člověk velmi touží říct, že čínský text je jen zakódovaný v angličtině. A vzhledem k tomu, že máme metody, které rozluští téměř jakýkoliv kryptografický problém, pak nemáme už zároveň i metodu na překlad? Avšak kryptografickou metodou nikdo k žádným konkrétním výsledkům zatím nedošel. Existence “základního jazyka” Ze všeobecného hlediska je pravděpodobné, že všechny jazyky vznikly podobným vývojem. Přece všechny byly vytvořeny člověkem- stejným živočišným druhem. Weaver uvádí srovnání se stromem. Přece všechny stromy na světě jsou různé a přesto mají stejné kvality (treeness= “stromovství”). Tyto kvality jsou shodné pro stromy v Polsku i na Cejlonu. A co je důležité: i jihoameričan nemá problém s tím, aby řekl, že norský strom je strom. Je tedy možné, že abychom si všichni rozuměli, musíme “klesnout” ze své řeči na nějakou základní úroveň. Pro lepší představivost přirovnává jazyky k věžím. Bydlíme na vrcholcích věží. S okolními věžmi se domlouváme pouze křikem. Domluva je omezena vzdálenotí. Některé věže nás už nemají šanci slyšet. Všechny věže ale mají společný sklep. Abychom se mohli domluvit se všemi obyvateli věží, musíme sejít do samotných základů budovy (= k základům jazyka). Problém je, že zatím nemáme tušení, jak se k tomu základnímu jazyku dostat. Mnohoznačnost Problémem všech jazyků jsou vícevýznamová slova. Ta dělají překladu největší potíže. Touto mnohoznačností se zabývali doktor Andrew Booth a doktor Richens (křesní jsem nenašla). Andrew Booth dokonce napsal v roce 1948 své memorandum, ve kterém se zabýval strojovým překladem. Chtěl, aby stroj zacházel se slovem, které má přeložit, jinak než dosud. 1. Strojový překlad Navrhoval tento postup: Stroj prve zjistí, jestli jeho pamět obsahuje to slovo, které má přeložit. Pokud ne, oddělá poslední písmeno slova a znovu hledá v paměti. Poslední písmena oddělá tolikrát, dokud se mu vzniklé slovo nenajde v paměti. Poté vezme tu část slova, kterou vypustil, a vyhledá ji ve slovníku přípon. Tam zjistí, co přípona znamená a spojí ji se slovem. Pro představu slovo running. Stroj oddělá g,n,i,n a dojde ke slovu run. To už má v paměti. Poté vezme –ning a hledá to ve slovníku přípon. Jak stroj pozná, že je ve slově zdvojené n a že ho má z koncovky vypustit, již popsáno nebylo. Obecně se tento způsob překládání nedá využít u literárních děl, kde je důležitý styl a najdeme zde idiomy a mnohovýznamová slova. 2. Vyřešení mnohoznačnosti Na strojový překlad navázalo pracování s kontextem. Pokud by správně pracoval strojový překlad, nebyl by problém ho rozšířit. Tedy aby stroj nebral jen slovo, které má přeložit, ale i N slov z obou stran slova. Kdyby měl stroj blízký kontext slova, lépe by se určoval jeho význam. Avšak otázka je: Kolik je N? Víme, že záleží na typu článku, například v odborném textu by stroj nepotřeboval tak veliký kontext, jako například v článku zabývajícím se sociologií. Dalším problémem je, že i kdybychom věděli, jaké N slov musíme brát, dostali bychom se k obrovskému počtu souborů slov/ frází, které by musely být někde uloženy. Mnohoznačnost ale je do budoucna řešitelná. Využívání nějakého mikrokontextu je pravděpodobné. Logika jazyka V řeči jsou určité prvky, které nejdou jednoduše přeložit. Důležitou roli v řeči hrají totiž kromě faktů i emoce a styl promluvy. Lidská řeč není tak logická, jako například jazyk matematiky. Avšak svým způsobem trochu logická je. Perfektního překladu dosáhnout nelze. Ale proces, při kterém by se dosáhlo překladu, který obsahuje jen pár procent chyb, je možný. Memorandum 1949 bylo unikátní v tom, že popisovalo metody a cíle strojového překladu v době, kdy lidé ještě netušili, čeho všeho jsou počítače schopny.