Präsentation herunterladen
Die Präsentation wird geladen. Bitte warten
Veröffentlicht von:Loreley Langager Geändert vor über 10 Jahren
1
NADIA Workshop Folien MMK
2
Übersicht Modelle Dekodertechnologie Modellerzeugung Vorversuch Stand eigener Erkenner TODOs
3
Spracherkennung akust. Mod. Lexikon Sprachmod. Dekoder Sprachsignal Wortkette
4
Modelle Sprachmodell: beschreibt Wortübergänge Lexikon beschreibt Phonemübergänge akustische Modelle beschreiben physikalische Parameter der Phoneme
5
Dekodierung bedeutet optimale Zuordnung über alle Ebenen ich will Ix vIl Sprachsignal ak. Modell Lexikon Sprachmod.
6
Erkennungsergebnis 1-best: eine einzige optimale Zuordnung N-best-sentences: Liste der N besten Äußerungen N-best-words: Worthypothesengraph durch Betrachtung der N besten Möglichkeiten an jedem Wortübergang
7
Modellgewinnung Sprachmodell: aus der Korpusorthographie, z.B. bei N-Gramm Wortfolge Lexikon: aus Wortliste der Korpus- orthographie + Aussprache-Varianten akust. Modelle: aus Phonemfolgen aller Korpusäußerungen (rekonstruierbar aus Orthographie + Lex. mit Ausspr.-Var.)
8
Vorversuch Göteburgverschriftung orthogr. Korpus (mit trans.pl) Korpuswortliste Lexikon orthogr. Korpus Bigrammsprachmodell zusammen mit akust. Modellen aus Verbmobil Worthyp.-Graphen Test Adaption der akust. Modelle
9
Stand Erkenner hierarchische Sprachmodelle keine Aussprachevarianten 1-best Dekodierung nicht optimiert bis jetzt mit ca. 4000 Kodezeilen überschaubar
10
TODOs Architektur –N-best-words Algorithmus implementieren –Aussprachevarianten –Performance-Optimierung –Testsuite aufbauen –Programmierschnittstelle zu CLT Modellerstellung –optimierte akustischer Modelle –Sprachmodelle für Sprachverstehen
Ähnliche Präsentationen
© 2024 SlidePlayer.org Inc.
All rights reserved.