FF:PLIN011 Transkripce mluv. češtiny - Informace o předmětu
PLIN011 Transkripce mluvené češtiny
Filozofická fakultajaro 2025
- Rozsah
- 0/2/0. 4 kr. Ukončení: z.
Vyučováno kontaktně - Vyučující
- Mgr. Dana Hlaváčková, Ph.D. (přednášející)
- Garance
- Mgr. Dana Hlaváčková, Ph.D.
Ústav českého jazyka – Filozofická fakulta
Kontaktní osoba: Bc. Silvie Hulewicz, DiS.
Dodavatelské pracoviště: Ústav českého jazyka – Filozofická fakulta - Rozvrh
- Út 10:00–11:40 C42, kromě Po 21. 4. až Ne 27. 4.
- Předpoklady
- Studenti budou potřebovat vlastní notebook.
- Omezení zápisu do předmětu
- Předmět je nabízen i studentům mimo mateřské obory.
Předmět si smí zapsat nejvýše 15 stud.
Momentální stav registrace a zápisu: zapsáno: 0/15, pouze zareg.: 15/15, pouze zareg. s předností (mateřské obory): 14/15 - Mateřské obory/plány
- předmět má 6 mateřských oborů, zobrazit
- Cíle předmětu
- Studenti se naučí, jak postupovat při zpracování mluveného jazyka. Předpokladem bude pořízení nahrávky spontánní mluvené češtiny a její transkripce. Cílem je naučit studenty postupům při pořizování nahrávek a možnostem při jejich transkripci. Studenti pořídí jednu ortografickou transkripci své nahrávky v nástroji Transcriber. Současně otestují nástroje s umělou inteligencí pro přepis mluvené češtiny (pravděpodobně s následnou editací). Nahrávky a jejich přepisy budou sloužit pro budování nového mluveného korpusu pod manažerem Sketch Engine. Pro tyto potřeby bude nutné data ještě anotovat.
- Výstupy z učení
- Student bude po absolvování předmětu schopen:
– porozumět problematice pořizování a transkripce mluvených dat;
– pracovat s automatickými nástroji pro přepis češtiny;
– pořídit nahrávku a následnou transkripci dle stanovených pravidel přepisu;
– pracovat s nástrojem Transcriber;
- připravit jazyková data pro vytvoření mluveného korpusu. - Osnova
- 1. Úvod do problematiky zpracování mluvených dat.
- 2. Instrukce k pořízení nahrávky mluvené češtiny.
- 3. Seznámení s nástrojem Transcriber a instrukce k ortografické transkripci nahrávek.
- 4. Úprava zvukové nahrávky a její přepis.
- 5. Testování AI nástrojů pro automatickou transkripci češtiny.
- 6. Práce na transkripci a editaci automaticky generovaných dat.
- 7. Anotace dat pro vytvoření prevertikálu do Sketch Engine.
- 8. Závěrečné vyhodnocení anotačního procesu.
- Výukové metody
- Frontální výuka (předání informací a instrukcí), výuka formou workshopu (transkripce, editace, anotace), samostatná práce (pořízení nahrávek), diskuze a konzultace.
- Metody hodnocení
- Aktivní účast na seminářích. Pořízení kvalitní nahrávky a její ortografická transkripce. Otestování minimálně jednoho nástroje pro automatickou transkripci mluvené češtiny, následná editace textu. Anotace dat pro potřeby budování mluveného korpusu.
- Další komentáře
- Předmět je vyučován každoročně.
- Statistika zápisu (nejnovější)
- Permalink: https://is.muni.cz/predmet/phil/jaro2025/PLIN011