Erzeugung von Sprecherklassifikations-modulen für multiple Plattformen

Slides:



Advertisements
Ähnliche Präsentationen
E-Commerce Shop System
Advertisements

Anbindung mobiler Endgeräte über den Terminal Service
PADLR Submodul Modular Content Archives Ein Content Browser für Lehr- materialien aus der Elektrotechnik Dipl.-Ing. Mark Painter Institut für Nachrichtentechnik.
Basis-Architekturen für Web-Anwendungen
Was ist J2EE Die Vorteile von J2EE J2EE Modell Die Komponente von J2EE
Übung 5 Mehrstufige Client/Server-Systeme mit Enterprise Java Beans
Datenbankzugriff im WWW (Kommerzielle Systeme)
Microsoft Windows 2000 Terminal Services
Java: Grundlagen der Sprache
Technik Gestaltung Navigation Daten. Übersicht Client Webbrowser InternetServer.
Projekt A4: Alignment of Situation Models Gert Rickheit Sven Wachsmuth Constanze Vorwerg Agnes Swadzba SFB-Kolloqium,
Introducing the .NET Framework
Dzomo Prudence Christelle1 Anwendung von Bilder im Telemedizin und Telematik Bereich.
PHP Pakete und Beispiele Webengineering Robert Lemke.
Die Bank von morgen - eine neue Welt für IT und Kunden? 23. Oktober 2001.
Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme
Entwurf und Realisierung einer digitalen Bibliothek zur Verwaltung von Notenhandschriften Dipl.-Ing. Temenushka Ignatova Datenbank- und Informationssysteme,
die DREHSCHEIBE für Informationen, Dokumente und Vorgänge
1 Alexander Arimond, University of Kaiserslautern, Germany Entwicklung und Evaluation eines Raytracing-Dienstes für das Venice Service Grid Alexander Arimond.
Minh Bui 14. März 2013 Mobile Visualization in SenseDroid Diplomarbeit Minh Bui, # 1 of 16 Aufgabensteller: Prof. Dr. Andreas Butz Betreuer:
Xenario IES Information Enterprise Server. Xenario Information Enterprise Server (IES) Die neue Architektur des Sitepark Information Enterprise Servers.
Erstellen einer Webseitenstatistik mithilfe eines OLAP-Servers
Volumenorientierte Modellierung als Grundlage einer vernetzt- kooperativen Planung im konstruktiven Ingenieurbau Antragsteller: Prof. E. Rank, Prof. H.-J.
Quellen: Internet INTRANET Ausarbeitung von Sven Strasser und Sascha Aufderheide im Modul Netzwerktechnik, Klasse INBS Mai 2003.
Untersuchungen zur Erstellung eines
ATLAS2000 Modellintegration in digitalen Atlanten Konzepte und Lösungsvorschläge am Beispiel ATLAS2000.
WIR LÖSEN DAS PROBLEM FÜR SIE
JABBA: Flexibles Web - Interface Semesterarbeit von Thomas Zwicker, Thomas Moser und Lukas Karrer Prof. L. Thiele Betreuung: J. Greutert TIK ETH Zürich.
Datenbanken im Web 1.
J2EE-Motivation(I) Anforderungen an heutige Software u.a.:
Projekt A4: „Alignment of Situation Models“ Dr. Gerd Rickheit Dr. Sven Wachsmuth Dr. Constanze Vorwerg Agnes Swadzba SFB-Kolloqium,
NiederwangenWinterthurBaselMünchenFrankfurt Ralf Fachet Das M2M Kochbuch Fernzugriff mit Mobilfunk.
Mönchengladbach Tchibo Filial-Manager Erste Ideen.
Optimierung von Geschäftsprozessen durch Webformulare und Webworkflow Rainer Driesen Account Manager.
Seminararbeit Release Management von Web-Systemen Minh Tran Lehrstuhl für Software Engineering RWTH Aachen
Workflowsysteme und Datenbanksysteme Gliederung Motivation Basis- funktionalitäten Klassifikations- merkmale Referenz-Modell MQ Workflow Zusammenfassung.
© WZL/Fraunhofer IPT Entwicklung einer Profilbörse für Konfigurationen von Smartphones Vortrag der Seminararbeit von Patrick Posor Aachen, den
Mainframe und WebServices bei der W. KAPFERER KG Einfache Internet-Lösungen in Verbindung mit vorhandenen Host-Programm-Strukturen.
© 2008 TravelTainment The Amadeus Leisure Group Webanwendungen mit Java - HttpServlets 17.Dezember 2010 Sebastian Olscher Erstprüfer: Hon.-Prof. Dr. H.
Erzeugung von hoch skalierbaren virtuellen Welten Seminar Algorithmen zur Unterstützung von Immersive Gaming Philip Mildner, 8. Oktober 2008.
LINUX II Unit 7 LAMP Server. LAMP ● Linux – Apache - MySQL – PHP ● Leistungsfähiges und kostenloses System zur Genrierung von dynamischen Webseiten und.
Seminar Softwareproduktlinien Domänenspezifische Sprachen Sascha Draffehn von.
AUTONOME PROVINZ BOZEN - SÜDTIROLPROVINCIA AUTONOMA DI BOLZANO – ALTO ADIGE Ripartizione 9 – InformaticaAbteilung 9 - Informationstechnik Amt 9.6 – Amt.
AUTONOME PROVINZ BOZEN - SÜDTIROLPROVINCIA AUTONOMA DI BOLZANO – ALTO ADIGE “WEGE” goes gvSIG Autonome Provinz Bozen - Südtirol GvSIG als Client für die.
2012 Mapbender3 – INTERGEO 2012 Hannover Astrid Emde Mapbender3 Astrid Emde INTERGEO 2012 Hannover.
Source Talk Tage 2008 NetBeans Rich Client Platform NetBeans RCP NetBeans Rich Client Platform Anton Epple Göttingen, Source Talk Tage.
Einführung in AspectJ ● Inhalt: 1)Überblick 2)Elemente des crosscuttings in AspectJ 3)„Hello World“ in AspectJ 4)Wie Aspekte in Java verwoben werden 5)Join.
Verteilte Anwendungen: J2EE
CMIP6-DICAD – FU Berlin Thomas Schartner
Martin Heerling netzwerk-aktiv GmbH Januar 2013
Zugriff-Analyse mit WebTrends
Google App Engine - Technische Stärken und Schwächen
D-SQL SQLization – endlich Client/Server!
Web-Interface for Multi-FPGA Board Pamette
Context-Awareness: aktuelle Projekte
Spracherkennung mit dynamisch geladenen, spezifischen Akustikmodellen
Wesentliche Bestandteile:
Ein kleiner (Ein|Über)blick
VIVO im Überblick Christian Hauschke FAG Technische Infrastruktur
Prüfer: Prof. Dr. rer. nat. Volker Sander David Scheuren
Fachberatertreffen 2017 Informationen und Update zu Schild-NRW
AIT Austrian Institute of Technology
Daten als Basis für Entscheidungen
Ich brauche eine Web-Seite vom Server im Internet
Basiskomponente Bibliothek Informationsveranstaltung
Bearbeiter: Andre Lutz & Michael Lubitz Betreuer: Cedric Mössner
Objektorientierte Programmierung
Devops David Jaroš
SOFTWARE- UND WEB-LÖSUNGEN
Datenbanken
 Präsentation transkript:

Erzeugung von Sprecherklassifikations-modulen für multiple Plattformen Diplomarbeit-Abschlussvortrag 21.06.06 Michael Feld

Übersicht Motivation Sprecherklassifikations-Grundlagen Anforderungen Architektur und Konzepte Anwendungen Ausblick

Motivation m3i / Agender Sprecherklassifikation Ausgangsbasis: (Müller 2005) Sprecherklassifikation (Vorgang der Zuweisung eines Sprechers zu einer diskreten Klasse basierend auf einem Vektor von Sprachmerkmalen)

Motivation – Beispielszenarien Benutzeradaption auf mobilen Geräten Benutzeradaption an öffentlichen Terminals Telefon-basierte Dienste

Motivation Vorhanden Benötigt Demonstrator m3i-Server /-Client m3i-CAT, Quellcode Feste Konfiguration Fokus auf flexibler Erweiterbarkeit Feste Plattform Real-World-Application Komponente / API Werkzeuge zur Entwurfszeit-unterstützung Modulare Konfiguration Fokus auf hoher Laufzeitperformanz Multiple Plattformen

Motivation Lösung: NEUE Architektur basierend auf VORHANDENEN Werkzeugen

Grundlagen

Grundlagen AGENDER: Mustererkennungssystem Sprachmerkmale zur Unterscheidung von Alter und Geschlecht Erfassung Segmentierung Merkmals- extraktion Klassifizierung Nach- verarbeitung Mustererkennungssystem Duda, Hart und Stork (2000)

Grundlagen - Agender Aufnahme (Mikrofon) Digitalisierung Erfassung Segmentierung Merkmals- extraktion Klassifizierung Nach- verarbeitung Aufnahme (Mikrofon) Digitalisierung

Grundlagen - Agender Anpassung der Abtastfrequenz Rauschfilter Segmentierung Merkmals- extraktion Klassifizierung Nach- verarbeitung Anpassung der Abtastfrequenz Rauschfilter Entfernen von Pausen am Anfang und Ende …

Grundlagen - Agender Pitch Jitter Shimmer und weitere Segmentierung Merkmals- extraktion Klassifizierung Nach- verarbeitung Extraktion aus digitalem Audiosignal Praat Pitch Jitter und weitere Shimmer

Grundlagen - Agender Klassifizierung eines Merkmalsvektors Segmentierung Merkmals- extraktion 1. Ebene Klassifizierung Nach- verarbeitung Klassifizierung eines Merkmalsvektors Kriterien von Klassifizierungsverfahren: Entscheidungsgrenzen  Genauigkeit Komplexität  Laufzeit Speicherverbrauch Trainingsdauer

Grundlagen - Agender Segmentierung Merkmals- extraktion 1. Ebene Nach- verarbeitung

Grundlagen - Agender DBN Segmentierung Merkmals- extraktion 1. Ebene Nach- verarbeitung 2. Ebene DBN Dynamische Bayessche Netze

Grundlagen - Agender Fusion mehrerer Klassifikationsergebnisse Segmentierung Merkmals- extraktion 1. Ebene 2. Ebene Fusion mehrerer Klassifikationsergebnisse Klassifikationsinhärente Unsicherheiten Expertenwissen, Kosten der Fehlklassifikation

Grundlagen - Agender Entwurf Ausführung Sammlung + Analyse von Daten Verwendung von Agender berührt 2 Phasen: Entwurf Ausführung Sammlung + Analyse von Daten Auswahl der Klassifizierer Entwurf eines DBN für die 2. Ebene Pre-Processing Merkmalsextraktion 1. Ebene 2. Ebene

Anforderungen Hohe Performanz Modularität Unterstützung multipler Plattformen Skalierbarkeit Ressourcenadaptivität Integrierbarkeit Robustheit Unterstützung der Entwicklung

Architektur und Konzepte Entwicklungsumgebung Laufzeitumgebung webbasiertes Evaluierungsmodul Applikation Evaluierung KM KM Entwicklungs- plattform Klassifikations- modul(e) Hugin, JavaDBN Applikation Funknetzwerk Sprachkorpus Client-Bibliothek MySQL-Datenbank KM Cluster m3i CAT SBC-Server Cluster

Architektur und Konzepte Entwicklungsumgebung Laufzeitumgebung webbasiertes Evaluierungsmodul Applikation Evaluierung KM KM Entwicklungs- plattform Klassifikations- modul(e) Hugin, JavaDBN Applikation Funknetzwerk Sprachkorpus Client-Bibliothek MySQL-Datenbank KM m3i CAT SBC-Server Cluster Cluster

Klassifikationsmodule Implementieren Agender-Mustererkennung Enthalten je nach Anwendungsszenario bestimmte Klassifizierer und DBN

Klassifikationsmodule Vorkompilierter Code Werden statisch integriert in Applikation (static linking) Verwendung als Bibliothek

Klassifikationsmodule Zentrales Konzept: Pipeline-Architektur Merkmalsextraktion Erste Ebene Zweite Ebene gut parallelisierbar

Klassifikationsmodule Weitere Merkmale: Schnelle (optimierte) Merkmalsextraktion Integriertes Tracing Multithreading-fähig Klassifizierer-Cache

Architektur und Konzepte Entwicklungsumgebung Laufzeitumgebung webbasiertes Evaluierungsmodul Applikation Evaluierung KM KM Entwicklungs- plattform Klassifikations- modul(e) Hugin, JavaDBN Applikation Funknetzwerk Sprachkorpus Client-Bibliothek MySQL-Datenbank KM m3i CAT SBC-Server Cluster Cluster

Entwicklungsplattform

Entwicklungsplattform Tool zur Zusammenstellung von Klassifikationsmodulen Möglichkeiten zur Evaluierung Geschrieben in Java Basiert auf dem m3i Server

Entwicklungsplattform Entwurf eines Klassifikationsmoduls Auswahl der Klassifizierer Training der Klassifizierer Erstellen der 2. Ebene (externe Tools: Hugin, JavaDBN) Exportieren des Modul-Quellcodes Erzeugen des Moduls Build-Vorgang

Architektur und Konzepte Entwicklungsumgebung Laufzeitumgebung webbasiertes Evaluierungsmodul Applikation Evaluierung KM KM Entwicklungs- plattform Klassifikations- modul(e) Hugin, JavaDBN Applikation Funknetzwerk Sprachkorpus Client-Bibliothek MySQL-Datenbank KM m3i CAT SBC-Server Cluster Cluster

Client/Server-Szenario SBC Client-Bibliothek Applikation m3i-Architektur SBC-Server Client

Client-Bibliothek Verfügbar für Anwendungen als DLL Implementiert SBC-Klassifikationsmodul Fallback-Mechanismus Heartbeat-Mechanismus SBC-Protokoll (TCP-basiert)

SBC-Server Basiert auf dem m3i-Server Verwaltung von Benutzerprofile für Clients Klassifizierung auf Anfrage Senden von Klassifizierern an den Client Zukünftige Alternative: SBC WebService

Anwendungen

Anwendungen – Beispiel 1 Wie viele Megapixel hat diese Kamera?

Anwendungen – Beispiel 1 Merkmale: Client/Server-Topologie Ein exklusiver Sprecher Begrenze Ressourcen (PocketPC) Nicht zeitkritisch

Anwendungen – Beispiel 2 SBC

Anwendungen – Beispiel 2 Merkmale: Integrierte Plattform Viele parallele Benutzer Gute Ressourcenverfügbarkeit Zeitkritisch

ca. 3% der Äußerungslänge Leistungsdaten Klass.zeit [s] ca. 3% der Äußerungslänge

Ausblick: Multilingual Agender Inwieweit ist der Agender-Ansatz sprachunabhängig? Gibt es relevante sprach- / kulturspezifische Unterschiede?  Sprachenerkennung (LID) Phonotactic Model: Phonerkennung n-Gramm Sprachmodell

Zusammenfassung Motivation Sprecherklassifikations-Grundlagen Anforderungen Architektur und Konzepte Anwendungen Ausblick