Statische Sprachmodellierung Training Sprachmodellen in SLM-Toolkit Buyu Xiao 24.Maerze.2010
Sprachmodell – Uebersicht und Anwendungsbereich eines Sprachmodell – M-Gramme – Discounting – Back-off Example beim SLM-Toolkit Zusammenfassung
Sprachmodell Aufbau eines Spracherkennungssystem
Sprachmodell Durch die Wahrscheinlichkeit Woeter oder Wortfolgen Awendungsbereich – Vereinfachen eines Spracherkenner – Texte-Komprimierung – Extraktion von Schluessewoertern aus Texten – etc...
Sprachmodell:M-Gramme Komplete Sprachmodell
Sprachmodell:M-Gramme Uigramm(m=1) Bigramm(m=2) Trigramm(m=3)
Perplexitaet
Discounting Absolute discounting Add-One Smoothing Witten-Bell Good-Turing
Discounting Absolutes Discounting
Discounting Absolutes Discounting – d auswahlen
Schaetzung der Sprachmodellparameter
Maximu-Liklihood schaetzwerte :absoulte Haeufigkeit der Wortfolge w(n),w(n-1)(n-m+1) in Trainingskorpus :absoulte Haeufigkeit der Wortfolge w(n-1)(n-m+1) in Trainingskorpus
Add-One Smoothing Unigramme Bigramme
Witten-Bell Discounting uigramm
Witten-Bell Discounting bigramm
Witten-Bell Discounting M-Gramm
Good-Turing Discounting M-Gramm count
Backing-off Trigramm
Kombination von Backing-off mit Discounting M-gramm – X:binaeren Indikatorfunktion – P(*):gelättete Wahrscheinlichkeit Trigramm
Sprachmodell – Uebersicht und Anwendungsbereich eines Sprachmodell – M-Gramme – Discounting – Back-off Example beim SLM-Toolkit Zusammenfassung