FI:PV061 Strojový překlad - Informace o předmětu
PV061 Úvod do strojového překladu
Fakulta informatikypodzim 2021
- Rozsah
- 2/0/0. 2 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: k, z.
- Vyučující
- doc. Mgr. Pavel Rychlý, Ph.D. (přednášející)
prof. PhDr. Karel Pala, CSc. (náhr. zkoušející) - Garance
- doc. RNDr. Aleš Horák, Ph.D.
Katedra strojového učení a zpracování dat – Fakulta informatiky
Kontaktní osoba: doc. Mgr. Pavel Rychlý, Ph.D.
Dodavatelské pracoviště: Katedra strojového učení a zpracování dat – Fakulta informatiky - Rozvrh
- Út 14. 9. až Út 7. 12. Út 12:00–13:50 B411
- Omezení zápisu do předmětu
- Předmět je nabízen i studentům mimo mateřské obory.
- Mateřské obory/plány
- Analýza a zpracování obrazu (program FI, N-VIZ)
- Aplikovaná informatika (program FI, B-AP)
- Aplikovaná informatika (program FI, N-AP)
- Bezpečnost informačních technologií (angl.) (program FI, N-IN)
- Bezpečnost informačních technologií (program FI, N-IN)
- Bioinformatika a systémová biologie (program FI, N-UIZD)
- Bioinformatika (program FI, B-AP)
- Bioinformatika (program FI, N-AP)
- Computer Games Development (program FI, N-VIZ_A)
- Computer Graphics and Visualisation (program FI, N-VIZ_A)
- Computer Networks and Communications (program FI, N-PSKB_A)
- Cybersecurity Management (program FI, N-RSSS_A)
- Český jazyk se specializací počítačová lingvistika (program FF, B-FI)
- Formální analýza počítačových systémů (program FI, N-TEI)
- Grafický design (program FI, N-VIZ)
- Graphic Design (program FI, N-VIZ_A)
- Hardware Systems (program FI, N-PSKB_A)
- Hardwarové systémy (program FI, N-PSKB)
- Image Processing and Analysis (program FI, N-VIZ_A)
- Informační bezpečnost (program FI, N-PSKB)
- Informační systémy (program FI, N-IN)
- Informatika a druhý obor (program FI, B-EB)
- Informatika a druhý obor (program FI, B-FY)
- Informatika a druhý obor (program FI, B-GE)
- Informatika a druhý obor (program FI, B-GK)
- Informatika a druhý obor (program FI, B-CH)
- Informatika a druhý obor (program FI, B-IO)
- Informatika a druhý obor (program FI, B-MA)
- Informatika a druhý obor (program FI, B-TV)
- Informatika (angl.) (program FI, D-IN4)
- Informatika (program FI, B-INF) (2)
- Informatika (program FI, D-IN4)
- Informatika ve veřejné správě (program FI, B-AP)
- Informatika ve vzdělávání (program FI, B-IVV) (2)
- Information Security (program FI, N-PSKB_A)
- Kvantové a jiné neklasické výpočetní modely (program FI, N-TEI)
- Matematická informatika (program FI, B-IN)
- Paralelní a distribuované systémy (program FI, B-IN)
- Paralelní a distribuované systémy (program FI, N-IN)
- Počítačová grafika a vizualizace (program FI, N-VIZ)
- Počítačová grafika a zpracování obrazu (program FI, B-IN)
- Počítačová grafika (program FI, N-IN)
- Počítačové sítě a komunikace (program FI, B-IN)
- Počítačové sítě a komunikace (program FI, N-IN)
- Počítačové sítě a komunikace (program FI, N-PSKB)
- Počítačové systémy a technologie (angl.) (program FI, D-IN4)
- Počítačové systémy a technologie (program FI, D-IN4)
- Počítačové systémy a zpracování dat (program FI, B-IN)
- Počítačové systémy (program FI, N-IN)
- Principy programovacích jazyků (program FI, N-TEI)
- Programování a vývoj aplikací (program FI, B-PVA)
- Programovatelné technické struktury (angl.) (program FI, N-IN)
- Programovatelné technické struktury (program FI, B-IN)
- Programovatelné technické struktury (program FI, N-IN)
- Řízení kyberbezpečnosti (program FI, N-RSSS)
- Řízení vývoje služeb (program FI, N-RSSS)
- Řízení vývoje softwarových systémů (program FI, N-RSSS)
- Services Development Management (program FI, N-RSSS_A)
- Služby - výzkum, řízení a inovace (angl.) (program FI, N-AP)
- Služby - výzkum, řízení a inovace (program FI, N-AP)
- Sociální informatika (program FI, B-AP)
- Software Systems Development Management (program FI, N-RSSS_A)
- Software Systems (program FI, N-PSKB_A)
- Softwarové systémy (program FI, N-PSKB)
- Strojové učení a umělá inteligence (program FI, N-UIZD)
- Teoretická informatika (program FI, N-IN)
- Učitel informatiky a správce sítě (program FI, N-UCI)
- Učitelství informatiky pro střední školy (program FI, N-UCI) (2)
- Učitelství výpočetní techniky pro střední školy (program FI, N-SS) (2)
- Umělá inteligence a zpracování přirozeného jazyka (program FI, B-IN)
- Umělá inteligence a zpracování přirozeného jazyka (program FI, N-IN)
- Vývoj počítačových her (program FI, N-VIZ)
- Zdravotní vědy (program LF, N-SZ, směr Pedagogická specializace optometrie)
- Zpracování a analýza rozsáhlých dat (program FI, N-UIZD)
- Zpracování obrazu (program FI, N-AP)
- Zpracování přirozeného jazyka (program FI, N-UIZD)
- Cíle předmětu
- Strojový překlad je jednou z praktických aplikací zpracování přirozeného jazyka.
Na jeho historii můžeme dobře ilustrovat přístupy ke zpracování textů i umělé inteligence obecně od pravidlových systémů ke strojovému učení pomocí neuronových sítí.
Cílem kursu je seznámit studenty:- s principy strojového překladu, používanými technikami pro jeho řešení;
- s přehledem hlavních překladových směrů v minulosti;
- s problematikou víceznačnosti;
- se vztahy k reprezentaci znalosti a reprezentaci významu;
- s přípravou dat pro učení strojového překladu;
- s technikami vyhodnocení kvality překladu.
Pro moderní techniky hlubokého učení budou prezentovány části kódu v Pythonu i příklady použití dostupných systémů.
Součástí kursu jsou rovněž experimenty s jednoduchým překladovým systémem pro češtinu a angličtinu na bázi neuronových sítí. - Výstupy z učení
- Student bude po absolvování předmětu schopen:
- klasifikovat systémy strojového překladu a uvést jejich podstatu;
- popsat komponenty neuronových sítí pro překlad;
- porozumět postupu učení neuronových sítí;
- pochopit metody vytváření pro učení systémů strojového překladu;
- vytvořit jednoduchý systém strojového překadu;
- vyhodnotit kvalitu překladu.
- Osnova
- Úvod, historie strojového překladu
- Struktura jazyka, základy pravděpodobnosti
- Jazykové modely, modely založené na frázích
- Dekódování, hodnocení
- Úvod do neuronových sítí, výpočetní grafy
- Neuronové jazykové modely, neuronový strojový překlad
- Dekódování v neuronovém strojovém překladu
- Reprezentace slov, morfologie
- Syntaxe a sémantika
- Paralelní texty, získávání korpusů z internetu
- Učení bez paralelních dat
- Aktuální výzvy
- Literatura
- doporučená literatura
- KOEHN, Philipp. Neural machine translation. Cambridge: Cambridge University Press, 2020, xiv, 393. ISBN 9781108497329. info
- KOEHN, Philipp. Statistical machine translation. First published. Cambridge: Cambridge University Press, 2010, xii, 433. ISBN 9780521874151. info
- neurčeno
- POIBEAU, Thierry. Machine translation. Cambridge, Massachusetts: The MIT Press, 2017, vi, 285. ISBN 9780262534215. info
- Výukové metody
- Výuka probíhá formou ústních přednášek a seminářů, v nichž se kombinuje použití slidů a ukázek relevantních softwarových nástrojů.
- Metody hodnocení
- Písemný test: zhruba 10 otázek, za které je možné získat maximálně 50 bodů. K úspěšnému zvládnutí je potřeba dosáhnout alespoň 25 bodů. V průběhu semestru je možné získat dalších až 20 bodů za práci v semestru (dobrovolné domácí úkoly, projekty).
- Vyučovací jazyk
- Angličtina
- Další komentáře
- Studijní materiály
Předmět je vyučován jednou za dva roky.
- Statistika zápisu (podzim 2021, nejnovější)
- Permalink: https://is.muni.cz/predmet/fi/podzim2021/PV061