Jazykové modely

  • Posloupnost slov (promluva) W = (w(1)w(2)...w(n)).

  • Posloupnost akustických vektorů - O = O(o(1)o(2)...o(t)).

  • Chceme nalézt W* (množinu všech promluv) maximalizující P(W|O).

  • Dle Bayesova pravidla platí:

    P(W*|O) = max P(W|O) = max P(W)*P(O|W)/P(O)

  • Pro nalezení maxima potřebujeme znát:

    • model řečníka P(O|W)

    • jazykový model P(W)

  • Model řečníka se nahrazuje pravděpodobností generování W odpovídajícím Markovovým modelem.

  • Trigramový model:

    • Platí

      P(w(n)|w(1)..w(n-1)) ≅ P(w(n)|w(n-2)w(n-1))