Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Multimedia Retrieval SS 2007 Speech Recognition

Ähnliche Präsentationen


Präsentation zum Thema: "Multimedia Retrieval SS 2007 Speech Recognition"—  Präsentation transkript:

1 Multimedia Retrieval SS 2007 Speech Recognition
Arne Kuhlmann, Björn Reistel, Oliver Marx

2 Rückblick: Projektziel
Entwicklung einer Applikation, der eine Audiodatei übergeben wird und Sprache in ein Textformat konvertiert

3 Rückblick: Ausblick 2. Meilenstein
Teilziel: Erstellen einer kommandozeilen-basierenden Software, die mit Hilfe von Sphinx4 eine kompatible Audiodatei einliest und die Ergebnisse ausgibt Herausforderung: Finden geeigneter Modelle ggf. manuelle Neu-Kodierung einzulesender Audio-Dateien Externe Abhängigkeiten: Dozenten müssen Audio-Dateien und wenn möglich dazugehörende Texte bereitstellen

4 Verwendetes Modell für Sphinx4
HUB4, enthält Dictionary von Wörtern Konfiguration über xml-File, jedoch wenig Dokumentation über die zahlreichen Parameter Kaum komplette Beispielkonfigurationen im Internet erhältlich

5 Audioformate Sphinx verlangt speziell codierte Audiodateien:
<property name="sampleRate" value="16000"/> <property name="bitsPerSample" value="16"/> <property name="bigEndianData" value="false"/> <property name="signedData" value="true"/> <property name="bytesPerRead" value="320"/> Bei Nichteinhaltung schlechtere Ergebnisse Ergebnis bei Einhaltung Codierung: „i had forgotten he exclaimed“ Ergebnis bei Nichteinhaltung: „“

6 Testkorpus: Korpus von http://www.voxforge.org/
Sammlung von Sprachdateien zur Verwendung mit Speech-Recognition-Engines Verwendete Audiodateien Sphinx4 kompatibel

7 Ergebnisse Testläufe (1):
Gesagt: Erkannt: SHE WAS HIS NOW FOREVER she was his now HOW MUCH WAS IT helmut twas attack WASH YOUR HANDS OF ME washer hands of me IT WAS MORE LIKE SUGAR i twist mortally chachi MY NAME'S FERGUSON findings ferguson THAT'S WHAT CARNEGIE DID up i get to t MAB SHE SAID now but chee said WITHOUT A DOUBT SOME OF THEM HAVE DINNER ENGAGEMENTS withheld attached I'LL ONLY BE IN THE WAY culpa leapt eon to wait YOU HAVE ALL THE ADVANTAGE

8 Ergebnisse Testläufe (2):
Teilweise akzeptable Ergebnisse, teilweise unbrauchbare Ergebnisse  Versuch, Ergebnisse zu verbessern


Herunterladen ppt "Multimedia Retrieval SS 2007 Speech Recognition"

Ähnliche Präsentationen


Google-Anzeigen