PLIN011 Transkripce mluvené češtiny

Filozofická fakulta
jaro 2025
Rozsah
0/2/0. 4 kr. Ukončení: z.
Vyučováno kontaktně
Vyučující
Mgr. Dana Hlaváčková, Ph.D. (přednášející)
Garance
Mgr. Dana Hlaváčková, Ph.D.
Ústav českého jazyka – Filozofická fakulta
Kontaktní osoba: Bc. Silvie Hulewicz, DiS.
Dodavatelské pracoviště: Ústav českého jazyka – Filozofická fakulta
Rozvrh
Út 10:00–11:40 C42, kromě Po 21. 4. až Ne 27. 4.
Předpoklady
Studenti budou potřebovat vlastní notebook.
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Předmět si smí zapsat nejvýše 15 stud.
Momentální stav registrace a zápisu: zapsáno: 0/15, pouze zareg.: 15/15, pouze zareg. s předností (mateřské obory): 14/15
Mateřské obory/plány
předmět má 6 mateřských oborů, zobrazit
Cíle předmětu
Studenti se naučí, jak postupovat při zpracování mluveného jazyka. Předpokladem bude pořízení nahrávky spontánní mluvené češtiny a její transkripce. Cílem je naučit studenty postupům při pořizování nahrávek a možnostem při jejich transkripci. Studenti pořídí jednu ortografickou transkripci své nahrávky v nástroji Transcriber. Současně otestují nástroje s umělou inteligencí pro přepis mluvené češtiny (pravděpodobně s následnou editací). Nahrávky a jejich přepisy budou sloužit pro budování nového mluveného korpusu pod manažerem Sketch Engine. Pro tyto potřeby bude nutné data ještě anotovat.
Výstupy z učení
Student bude po absolvování předmětu schopen:
– porozumět problematice pořizování a transkripce mluvených dat;
– pracovat s automatickými nástroji pro přepis češtiny;
– pořídit nahrávku a následnou transkripci dle stanovených pravidel přepisu;
– pracovat s nástrojem Transcriber;
- připravit jazyková data pro vytvoření mluveného korpusu.
Osnova
  • 1. Úvod do problematiky zpracování mluvených dat.
  • 2. Instrukce k pořízení nahrávky mluvené češtiny.
  • 3. Seznámení s nástrojem Transcriber a instrukce k ortografické transkripci nahrávek.
  • 4. Úprava zvukové nahrávky a její přepis.
  • 5. Testování AI nástrojů pro automatickou transkripci češtiny.
  • 6. Práce na transkripci a editaci automaticky generovaných dat.
  • 7. Anotace dat pro vytvoření prevertikálu do Sketch Engine.
  • 8. Závěrečné vyhodnocení anotačního procesu.
Výukové metody
Frontální výuka (předání informací a instrukcí), výuka formou workshopu (transkripce, editace, anotace), samostatná práce (pořízení nahrávek), diskuze a konzultace.
Metody hodnocení
Aktivní účast na seminářích. Pořízení kvalitní nahrávky a její ortografická transkripce. Otestování minimálně jednoho nástroje pro automatickou transkripci mluvené češtiny, následná editace textu. Anotace dat pro potřeby budování mluveného korpusu.
Další komentáře
Předmět je vyučován každoročně.
Předmět je zařazen také v obdobích jaro 2011, jaro 2012, jaro 2013, jaro 2018, jaro 2020, jaro 2021, podzim 2021.
  • Statistika zápisu (nejnovější)
  • Permalink: https://is.muni.cz/predmet/phil/jaro2025/PLIN011