FI:PV061 Úvod do strojového překladu - Informace o předmětu
PV061 Úvod do strojového překladu
Fakulta informatikypodzim 2008
- Rozsah
- 2/0. 2 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: k, z.
- Vyučující
- prof. PhDr. Karel Pala, CSc. (přednášející)
- Garance
- prof. Ing. Václav Přenosil, CSc.
Katedra strojového učení a zpracování dat – Fakulta informatiky
Kontaktní osoba: prof. PhDr. Karel Pala, CSc. - Rozvrh
- Út 15:00–16:50 B203
- Předpoklady
- Je doporučeno absolvovat PA153 a Logické programování I
- Omezení zápisu do předmětu
- Předmět je nabízen i studentům mimo mateřské obory.
- Mateřské obory/plány
- Aplikovaná informatika (program FI, B-AP)
- Aplikovaná informatika (program FI, N-AP)
- Bezpečnost informačních technologií (program FI, N-IN)
- Bioinformatika (program FI, B-AP)
- Bioinformatika (program FI, N-AP)
- Český jazyk a literatura (program FF, M-FI) (2)
- Český jazyk a literatura (program FF, M-HS)
- Informační systémy (program FI, N-IN)
- Informatika a druhý obor (program FI, B-BI)
- Informatika a druhý obor (program FI, B-FY)
- Informatika a druhý obor (program FI, B-GE)
- Informatika a druhý obor (program FI, B-GK)
- Informatika a druhý obor (program FI, B-CH)
- Informatika a druhý obor (program FI, B-IO)
- Informatika a druhý obor (program FI, B-MA)
- Informatika a druhý obor (program FI, B-SO)
- Informatika a druhý obor (program FI, B-TV)
- Informatika (program FI, B-IN)
- Informatika (program FI, M-IN)
- Informatika (program FI, N-IN)
- Matematická informatika (program FI, B-IN)
- Paralelní a distribuované systémy (program FI, B-IN)
- Paralelní a distribuované systémy (program FI, N-IN)
- Počítačová grafika a zpracování obrazu (program FI, B-IN)
- Počítačová grafika (program FI, N-IN)
- Počítačové sítě a komunikace (program FI, B-IN)
- Počítačové sítě a komunikace (program FI, N-IN)
- Počítačové systémy a zpracování dat (program FI, B-IN)
- Počítačové systémy (program FI, N-IN)
- Programovatelné technické struktury (angl.) (program FI, N-IN)
- Programovatelné technické struktury (program FI, B-IN)
- Teoretická informatika (program FI, N-IN)
- Učitelství výpočetní techniky pro střední školy (program FI, M-SS)
- Učitelství výpočetní techniky pro střední školy (program FI, M-TV)
- Učitelství výpočetní techniky pro střední školy (program FI, N-SS) (2)
- Umělá inteligence a zpracování přirozeného jazyka (program FI, B-IN)
- Umělá inteligence a zpracování přirozeného jazyka (program FI, N-IN)
- Zdravotní vědy (program LF, N-SZ, směr Pedagogická specializace optometrie)
- Zpracování obrazu (program FI, N-AP)
- Cíle předmětu
- Cílem kursu je seznámit studenty:
- s principy strojového překladu, jeho hlavními fázemi při strojovém překládání;
- s přehledem hlavních překladových systémů.;
- s problematikou víceznačnosti;
- se vztahy k reprezentaci znalosti a reprezentaci významu. - s teorií překladu a typy překladů, vztah k umělé inteligenci (AI);
Studenti porozumí: historii strojového překladu a jeho současnému stavu;
- hlavním typům strojového překladu: jsou to binární překlady, překlady na bázi převodního jazyka, techniky překladové paměti využívající paralelních korpusů, statistický překlad, faktorovaný překlad;
- fázím překladu: lexikální analýze a strojovým slovníkům, morfologické a syntaktické analýze a reprezentaci větných struktur, transferu, reprezentaci významu, syntéze;
Dále budou předmětem výkladu: sémantické otázky strojového překladu, typy víceznačnosti a jejich řešení, význam slov a slovních spojení, terminologie, znalosti o světě;
Budou probrány některé úspěšné systémy strojového překladu, např. METEO, TAUM, SYSTRAN, EUROTRA, TRADOS, DeJavu, Google Translator aj. a také systémy pro češtinu - PC Translator, SKIK2, TRANSEN, Matrix; a rovněž techniky evaluace systémů SP a systémy SP na bázi mluvené řeči (Verbmobil);
Cílem kursu jsou rovněž experimenty s jednoduchým překladovým systémem pro češtinu a angličtinu na bázi Prologu; - Osnova
- Teorie překladu a typy překladů, vztah k AI.
- Vznik strojového překladu (SP) a současný stav;
- Koncepce strojového překladu: binární překlady, překlady na bázi převodního jazyka, techniky překladové paměti využívající paralelních korpusů.
- Proces překladu: lexikální analýza a strojové slovníky, morfologická a syntaktická analýza a reprezentace větných struktur, transferová pravidla, reprezentace významu, syntéza;
- Klíčové otázky strojového překladu, problém víceznačnosti, reprezentace znalostí, vztah k umělé inteligenci (AI);
- SP s mluveným vstupem a výstupem;
- význam slov a slovních spojení, terminologie;
- Přehled významných systémů SP: METEO, TAUM, SYSTRAN, EUROTRA, TRADOS, Dejavu, Rosetta, Google Translator aj.;
- Překladové systémy pro češtinu - PC Translator, SKIK2, TRANSEN; Matrix;
- Příklady a experimenty: malý překladový systém v Prologu - čeština - angličtina;
- Techniky evaluace systémů SP;
- SP a vztahy k reprezentaci znalostí a umělé inteligenci;
- Literatura
- HUTCHINS, W. John a Harold L. SOMERS. An introduction to machine translation. London: Academic Press, 1992, xxi, 362 s. ISBN 0-12-362830-X. info
- Metody hodnocení
- ústní zkouška, písemný test
- Další komentáře
- Předmět je vyučován každoročně.
- Statistika zápisu (podzim 2008, nejnovější)
- Permalink: https://is.muni.cz/predmet/fi/podzim2008/PV061