Erzeugung von Sprecherklassifikations-modulen für multiple Plattformen

Slides:

Advertisements

Ähnliche Präsentationen

E-Commerce Shop System

Advertisements

Anbindung mobiler Endgeräte über den Terminal Service

PADLR Submodul Modular Content Archives Ein Content Browser für Lehr- materialien aus der Elektrotechnik Dipl.-Ing. Mark Painter Institut für Nachrichtentechnik.

Basis-Architekturen für Web-Anwendungen

Was ist J2EE Die Vorteile von J2EE J2EE Modell Die Komponente von J2EE

Übung 5 Mehrstufige Client/Server-Systeme mit Enterprise Java Beans

Datenbankzugriff im WWW (Kommerzielle Systeme)

Microsoft Windows 2000 Terminal Services

Java: Grundlagen der Sprache

Technik Gestaltung Navigation Daten. Übersicht Client Webbrowser InternetServer.

Projekt A4: Alignment of Situation Models Gert Rickheit Sven Wachsmuth Constanze Vorwerg Agnes Swadzba SFB-Kolloqium,

Introducing the .NET Framework

Dzomo Prudence Christelle1 Anwendung von Bilder im Telemedizin und Telematik Bereich.

PHP Pakete und Beispiele Webengineering Robert Lemke.

Die Bank von morgen - eine neue Welt für IT und Kunden? 23. Oktober 2001.

Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme

Entwurf und Realisierung einer digitalen Bibliothek zur Verwaltung von Notenhandschriften Dipl.-Ing. Temenushka Ignatova Datenbank- und Informationssysteme,

die DREHSCHEIBE für Informationen, Dokumente und Vorgänge

1 Alexander Arimond, University of Kaiserslautern, Germany Entwicklung und Evaluation eines Raytracing-Dienstes für das Venice Service Grid Alexander Arimond.

Minh Bui 14. März 2013 Mobile Visualization in SenseDroid Diplomarbeit Minh Bui, # 1 of 16 Aufgabensteller: Prof. Dr. Andreas Butz Betreuer:

Xenario IES Information Enterprise Server. Xenario Information Enterprise Server (IES) Die neue Architektur des Sitepark Information Enterprise Servers.

Erstellen einer Webseitenstatistik mithilfe eines OLAP-Servers

Volumenorientierte Modellierung als Grundlage einer vernetzt- kooperativen Planung im konstruktiven Ingenieurbau Antragsteller: Prof. E. Rank, Prof. H.-J.

Quellen: Internet INTRANET Ausarbeitung von Sven Strasser und Sascha Aufderheide im Modul Netzwerktechnik, Klasse INBS Mai 2003.

Untersuchungen zur Erstellung eines

ATLAS2000 Modellintegration in digitalen Atlanten Konzepte und Lösungsvorschläge am Beispiel ATLAS2000.

WIR LÖSEN DAS PROBLEM FÜR SIE

JABBA: Flexibles Web - Interface Semesterarbeit von Thomas Zwicker, Thomas Moser und Lukas Karrer Prof. L. Thiele Betreuung: J. Greutert TIK ETH Zürich.

Datenbanken im Web 1.

J2EE-Motivation(I) Anforderungen an heutige Software u.a.:

Projekt A4: „Alignment of Situation Models“ Dr. Gerd Rickheit Dr. Sven Wachsmuth Dr. Constanze Vorwerg Agnes Swadzba SFB-Kolloqium,

NiederwangenWinterthurBaselMünchenFrankfurt Ralf Fachet Das M2M Kochbuch Fernzugriff mit Mobilfunk.

Mönchengladbach Tchibo Filial-Manager Erste Ideen.

Optimierung von Geschäftsprozessen durch Webformulare und Webworkflow Rainer Driesen Account Manager.

Seminararbeit Release Management von Web-Systemen Minh Tran Lehrstuhl für Software Engineering RWTH Aachen

Workflowsysteme und Datenbanksysteme Gliederung Motivation Basis- funktionalitäten Klassifikations- merkmale Referenz-Modell MQ Workflow Zusammenfassung.

© WZL/Fraunhofer IPT Entwicklung einer Profilbörse für Konfigurationen von Smartphones Vortrag der Seminararbeit von Patrick Posor Aachen, den

Mainframe und WebServices bei der W. KAPFERER KG Einfache Internet-Lösungen in Verbindung mit vorhandenen Host-Programm-Strukturen.

© 2008 TravelTainment The Amadeus Leisure Group Webanwendungen mit Java - HttpServlets 17.Dezember 2010 Sebastian Olscher Erstprüfer: Hon.-Prof. Dr. H.

Erzeugung von hoch skalierbaren virtuellen Welten Seminar Algorithmen zur Unterstützung von Immersive Gaming Philip Mildner, 8. Oktober 2008.

LINUX II Unit 7 LAMP Server. LAMP ● Linux – Apache - MySQL – PHP ● Leistungsfähiges und kostenloses System zur Genrierung von dynamischen Webseiten und.

Seminar Softwareproduktlinien Domänenspezifische Sprachen Sascha Draffehn von.

AUTONOME PROVINZ BOZEN - SÜDTIROLPROVINCIA AUTONOMA DI BOLZANO – ALTO ADIGE Ripartizione 9 – InformaticaAbteilung 9 - Informationstechnik Amt 9.6 – Amt.

AUTONOME PROVINZ BOZEN - SÜDTIROLPROVINCIA AUTONOMA DI BOLZANO – ALTO ADIGE “WEGE” goes gvSIG Autonome Provinz Bozen - Südtirol GvSIG als Client für die.

2012 Mapbender3 – INTERGEO 2012 Hannover Astrid Emde Mapbender3 Astrid Emde INTERGEO 2012 Hannover.

Source Talk Tage 2008 NetBeans Rich Client Platform NetBeans RCP NetBeans Rich Client Platform Anton Epple Göttingen, Source Talk Tage.

Einführung in AspectJ ● Inhalt: 1)Überblick 2)Elemente des crosscuttings in AspectJ 3)„Hello World“ in AspectJ 4)Wie Aspekte in Java verwoben werden 5)Join.

Verteilte Anwendungen: J2EE

CMIP6-DICAD – FU Berlin Thomas Schartner

Martin Heerling netzwerk-aktiv GmbH Januar 2013

Zugriff-Analyse mit WebTrends

Google App Engine - Technische Stärken und Schwächen

D-SQL SQLization – endlich Client/Server!

Web-Interface for Multi-FPGA Board Pamette

Context-Awareness: aktuelle Projekte

Spracherkennung mit dynamisch geladenen, spezifischen Akustikmodellen

Wesentliche Bestandteile:

Ein kleiner (Ein|Über)blick

VIVO im Überblick Christian Hauschke FAG Technische Infrastruktur

Prüfer: Prof. Dr. rer. nat. Volker Sander David Scheuren

Fachberatertreffen 2017 Informationen und Update zu Schild-NRW

AIT Austrian Institute of Technology

Daten als Basis für Entscheidungen

Ich brauche eine Web-Seite vom Server im Internet

Basiskomponente Bibliothek Informationsveranstaltung

Bearbeiter: Andre Lutz & Michael Lubitz Betreuer: Cedric Mössner

Objektorientierte Programmierung

Devops David Jaroš

SOFTWARE- UND WEB-LÖSUNGEN

Präsentation transkript:

Erzeugung von Sprecherklassifikations-modulen für multiple Plattformen Diplomarbeit-Abschlussvortrag 21.06.06 Michael Feld

Übersicht Motivation Sprecherklassifikations-Grundlagen Anforderungen Architektur und Konzepte Anwendungen Ausblick

Motivation m3i / Agender Sprecherklassifikation Ausgangsbasis: (Müller 2005) Sprecherklassifikation (Vorgang der Zuweisung eines Sprechers zu einer diskreten Klasse basierend auf einem Vektor von Sprachmerkmalen)

Motivation – Beispielszenarien Benutzeradaption auf mobilen Geräten Benutzeradaption an öffentlichen Terminals Telefon-basierte Dienste

Motivation Vorhanden Benötigt Demonstrator m3i-Server /-Client m3i-CAT, Quellcode Feste Konfiguration Fokus auf flexibler Erweiterbarkeit Feste Plattform Real-World-Application Komponente / API Werkzeuge zur Entwurfszeit-unterstützung Modulare Konfiguration Fokus auf hoher Laufzeitperformanz Multiple Plattformen

Motivation Lösung: NEUE Architektur basierend auf VORHANDENEN Werkzeugen

Grundlagen

Grundlagen AGENDER: Mustererkennungssystem Sprachmerkmale zur Unterscheidung von Alter und Geschlecht Erfassung Segmentierung Merkmals- extraktion Klassifizierung Nach- verarbeitung Mustererkennungssystem Duda, Hart und Stork (2000)

Grundlagen - Agender Aufnahme (Mikrofon) Digitalisierung Erfassung Segmentierung Merkmals- extraktion Klassifizierung Nach- verarbeitung Aufnahme (Mikrofon) Digitalisierung

Grundlagen - Agender Anpassung der Abtastfrequenz Rauschfilter Segmentierung Merkmals- extraktion Klassifizierung Nach- verarbeitung Anpassung der Abtastfrequenz Rauschfilter Entfernen von Pausen am Anfang und Ende …

Grundlagen - Agender Pitch Jitter Shimmer und weitere Segmentierung Merkmals- extraktion Klassifizierung Nach- verarbeitung Extraktion aus digitalem Audiosignal Praat Pitch Jitter und weitere Shimmer

Grundlagen - Agender Klassifizierung eines Merkmalsvektors Segmentierung Merkmals- extraktion 1. Ebene Klassifizierung Nach- verarbeitung Klassifizierung eines Merkmalsvektors Kriterien von Klassifizierungsverfahren: Entscheidungsgrenzen  Genauigkeit Komplexität  Laufzeit Speicherverbrauch Trainingsdauer

Grundlagen - Agender Segmentierung Merkmals- extraktion 1. Ebene Nach- verarbeitung

Grundlagen - Agender DBN Segmentierung Merkmals- extraktion 1. Ebene Nach- verarbeitung 2. Ebene DBN Dynamische Bayessche Netze

Grundlagen - Agender Fusion mehrerer Klassifikationsergebnisse Segmentierung Merkmals- extraktion 1. Ebene 2. Ebene Fusion mehrerer Klassifikationsergebnisse Klassifikationsinhärente Unsicherheiten Expertenwissen, Kosten der Fehlklassifikation

Grundlagen - Agender Entwurf Ausführung Sammlung + Analyse von Daten Verwendung von Agender berührt 2 Phasen: Entwurf Ausführung Sammlung + Analyse von Daten Auswahl der Klassifizierer Entwurf eines DBN für die 2. Ebene Pre-Processing Merkmalsextraktion 1. Ebene 2. Ebene

Anforderungen Hohe Performanz Modularität Unterstützung multipler Plattformen Skalierbarkeit Ressourcenadaptivität Integrierbarkeit Robustheit Unterstützung der Entwicklung

Architektur und Konzepte Entwicklungsumgebung Laufzeitumgebung webbasiertes Evaluierungsmodul Applikation Evaluierung KM KM Entwicklungs- plattform Klassifikations- modul(e) Hugin, JavaDBN Applikation Funknetzwerk Sprachkorpus Client-Bibliothek MySQL-Datenbank KM Cluster m3i CAT SBC-Server Cluster

Architektur und Konzepte Entwicklungsumgebung Laufzeitumgebung webbasiertes Evaluierungsmodul Applikation Evaluierung KM KM Entwicklungs- plattform Klassifikations- modul(e) Hugin, JavaDBN Applikation Funknetzwerk Sprachkorpus Client-Bibliothek MySQL-Datenbank KM m3i CAT SBC-Server Cluster Cluster

Klassifikationsmodule Implementieren Agender-Mustererkennung Enthalten je nach Anwendungsszenario bestimmte Klassifizierer und DBN

Klassifikationsmodule Vorkompilierter Code Werden statisch integriert in Applikation (static linking) Verwendung als Bibliothek

Klassifikationsmodule Zentrales Konzept: Pipeline-Architektur Merkmalsextraktion Erste Ebene Zweite Ebene gut parallelisierbar

Klassifikationsmodule Weitere Merkmale: Schnelle (optimierte) Merkmalsextraktion Integriertes Tracing Multithreading-fähig Klassifizierer-Cache

Architektur und Konzepte Entwicklungsumgebung Laufzeitumgebung webbasiertes Evaluierungsmodul Applikation Evaluierung KM KM Entwicklungs- plattform Klassifikations- modul(e) Hugin, JavaDBN Applikation Funknetzwerk Sprachkorpus Client-Bibliothek MySQL-Datenbank KM m3i CAT SBC-Server Cluster Cluster

Entwicklungsplattform

Entwicklungsplattform Tool zur Zusammenstellung von Klassifikationsmodulen Möglichkeiten zur Evaluierung Geschrieben in Java Basiert auf dem m3i Server

Entwicklungsplattform Entwurf eines Klassifikationsmoduls Auswahl der Klassifizierer Training der Klassifizierer Erstellen der 2. Ebene (externe Tools: Hugin, JavaDBN) Exportieren des Modul-Quellcodes Erzeugen des Moduls Build-Vorgang

Architektur und Konzepte Entwicklungsumgebung Laufzeitumgebung webbasiertes Evaluierungsmodul Applikation Evaluierung KM KM Entwicklungs- plattform Klassifikations- modul(e) Hugin, JavaDBN Applikation Funknetzwerk Sprachkorpus Client-Bibliothek MySQL-Datenbank KM m3i CAT SBC-Server Cluster Cluster

Client/Server-Szenario SBC Client-Bibliothek Applikation m3i-Architektur SBC-Server Client

Client-Bibliothek Verfügbar für Anwendungen als DLL Implementiert SBC-Klassifikationsmodul Fallback-Mechanismus Heartbeat-Mechanismus SBC-Protokoll (TCP-basiert)

SBC-Server Basiert auf dem m3i-Server Verwaltung von Benutzerprofile für Clients Klassifizierung auf Anfrage Senden von Klassifizierern an den Client Zukünftige Alternative: SBC WebService

Anwendungen

Anwendungen – Beispiel 1 Wie viele Megapixel hat diese Kamera?

Anwendungen – Beispiel 1 Merkmale: Client/Server-Topologie Ein exklusiver Sprecher Begrenze Ressourcen (PocketPC) Nicht zeitkritisch

Anwendungen – Beispiel 2 SBC

Anwendungen – Beispiel 2 Merkmale: Integrierte Plattform Viele parallele Benutzer Gute Ressourcenverfügbarkeit Zeitkritisch

ca. 3% der Äußerungslänge Leistungsdaten Klass.zeit [s] ca. 3% der Äußerungslänge

Ausblick: Multilingual Agender Inwieweit ist der Agender-Ansatz sprachunabhängig? Gibt es relevante sprach- / kulturspezifische Unterschiede?  Sprachenerkennung (LID) Phonotactic Model: Phonerkennung n-Gramm Sprachmodell

Zusammenfassung Motivation Sprecherklassifikations-Grundlagen Anforderungen Architektur und Konzepte Anwendungen Ausblick