Präsentation von: Ghamdan Atef. Motivation Datensammlung Vorgeschichte Radio Oranje Collection Projekt Experimente Erstellung von Transkriptionen Akustische.

Slides:



Advertisements
Ähnliche Präsentationen
Algorithmen und Datenstrukturen
Advertisements

Aufgabe 17 Thema: Redesign eines Webauftritts 2
Die neue Sulzer Website Internet Core Team | Juli 2012.
Benutzerorientierte Designprinzipien für die Microsoft-Guidelines
Kohonennetze für Information Retrieval mit User Feedback
Telekooperation / RBG University of Technology Darmstadt Motivation AblaufThemenvorstellung Ausklang Audio-Timeshift Synchronisation 1 Audio-Timeshift.
BGG Definition Barrierefrei
Seminar Textmining WS 06/07 Themen Übung 11 unsupervised vs. supervised Symbolfolgen, Kunstsprachen Page Rank.
Digitalisierung und Aufbereitung von Sprachdaten
MS Office-Paket: Access
Einführung in Berechenbarkeit und Formale Sprachen
EXPLOIT - Verbreitung und Verwertung der Ergebnisse des EU-Bibliotheksprogramms Ehemaliges Deutsches Bibliotheksinstitut Berlin EXPLOIT 1 Elektronische.
Wissensmanagement mit semantischen Netzen – Analyse und Vergleich verschiedener Softwarelösungen Autor: Holger Wilhelm Referentin: Prof. Dr. Uta Störl.
Klaus J. Kohler IPDS, Kiel
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/8 Thesauren In gewisser Weise bilden Thesauren (Singular Thesaurus, Plural auch Thesauri)
Grundlagen der Analyse von Sprachdatenbanken
Was ist die artikulatorische Grundlage von Locus-Gleichungen? Hauptseminar: Modelle der Sprachproduktion & - perzeption Dozent: Prof. Dr. Jonathan Harrington.
Wie passt unser Projekt in die Entwicklung des Paradigmas der Digitalen Bibliothek? Referat von Lukas Jörgens.
Computerkurs: Quantitative Auswertung biochemischer Experimente Tag 8 Einführung in die numerische Integration Aufgabe 18: Simulation einer Assoziationskinetik.
Der Umgang mit qualitativ erhobenen Daten: Strategien der Datenanalyse
Unterrichtsbeispiel Buchstabeneinführung
Access 2000 Datenbanken.
Wie funktionieren Suchmaschinen?
Spree SoSe 2007 Titel Lexikographie und Metalexikographie Lexikonproduktion und Lexikontheorie Dank an Franziskus Geeb, der mir seine Unterrichtsmaterialien.
© by TMND GmbH TMspeak Automatisierte Vertonung strukturierter Textinformationen TMND GmbH Vortrag von der.
Hörbilderbuch Ein Baustein zur Medienbildung
Hot Potatoes - Einführung Rätsel und Grundwissentraining am Computer Schulinterne Lehrerfortbildung xx.yy.zz _______________________________________________________________.
Maschinelles Lernen und automatische Textklassifikation
Entitäten Extraktion Einführung
Schnelles und effizientes Suchen. Was ist MPEG 7? Wie funktioniert MPEG? Was bietet MPEG 7? Wo wird MPEG 7 verwendet?
BEWÄHRT seit 2011: AV4m+ AV4ms
Studie Einfluss der Sitzposition in den Vorlesungsräumen auf die studentische Leistung Jochen Jung, Larry Maus und Steffen Brünske.
AGENDA Abgrenzung SEO zu SEA Suchmaschinenwerbung (SEA)
Vortrag D. Braun, Praktikum. Übersicht Pleopatra API Pleopatra Tools Twitter Demonstration Ausblick.
1 Nutzen Sie diese Powerpoint-Präsentation beim Selbstlernen oder in Veranstaltungen zur Einführung in das jeweilige Thema. Einführung Lernmodul Nutzungsbedingungen:
1 Nutzen Sie diese Powerpoint-Präsentation beim Selbstlernen oder in Veranstaltungen zur Einführung in das jeweilige Thema. Einführung Lernmodul Nutzungsbedingungen:
Audiobearbeitung mit dem PC Andreas Glöckl, MiB Eichstätt
1 Nutzen Sie diese Powerpoint-Präsentation beim Selbstlernen oder in Veranstaltungen zur Einführung in das jeweilige Thema. Einführung Lernmodul Nutzungsbedingungen:
Project Perseus Der volle Projektname lautet Perseus Digital Library Project. Das Projekt begann in 1985 als Experiment zur Digitalisierung von Bibliotheken.
CGI (Common Gateway Interface)
Allgemeines zu Datenbanken
NDK Enterprise Technologien Informationen Infrastruktur und Fallstudie Daniel Nydegger Studienleiter Enterprise System Entwicklung.
CRM TimeLog… TimeLog … Wie gross ist der Anteil der Lohnkosten in Ihrem Unternehmen?
Visualisierung als Unterstützung des Denkens Visualisierung semantischer Information
19/05/00Science Week Austria 2000 © ftw speech & more Existierende und zukünftige Sprachdialogsysteme.
Übung zu Einführung in die LDV I
Power Point Präsentation
Using latent semantic analysis to find different names for the same entity in free text Präsentation und Diskussion des Papers Im Rahmen des PS Web-Information.
Institut für C omputer G raphik, TU Braunschweig BioBrowser Interaktive Molekülmodelle als zentrales Zugangs- und Dokumentationswerkzeug für biologische.
Die Computertradition. Die ersten Anfänge von Informationsorganisation liegen bereits Jahrhunderte zurück: Philosophie: Übersicht über das Weltwissen.
Information Retrieval, Vektorraummodell
EUR-Lex heute und morgen IRIS 2007 Salzburg 23. Februar 2007 Pascale Berteloot Amt für Veröffentlichungen der EU.
Die Geschichte der Entwicklung der Informations-Technologie
Stundenplanung Programm zur Stunden- und Zimmerplanung auf der Basis von Datenbanken und unter Berücksichtigung von Mehrfachnutzung im (lokalen) Netz (Internet.
Methoden Die klassische Methode der Psycholinguistik (genauso wie der experimentellen Psychologie im Allgemeinen) ist die Messung von Reaktionszeiten.
Hörbilderbuch Ein Baustein zur Medienbildung
Topic Maps: Personal Brain
Die Präsentation des Lehrers der 21- allgemeinbildenden Schule des Bezirks Peschkö in Gebiet Buchara von Alijor Jahjojev.
© Fraunhofer-Institut für Angewandte Informationstechnik FIT Social Search.
1/31 Vorträge halten Teil 1 - Einführung Timo Pauli.
MS Word 2010 Word Texte eingeben und bearbeiten automatische und manuelle Korrekturen Text bearbeiten Word Texte eingeben und bearbeiten automatische und.
Lösung komplexer Problemstellungen Susanne Längle & Lukas Matt.
Digital Repository Auffindbare Publikationen. Was sind Repositorien ? Als Repositorium bezeichnet man eine Struktur in der Dokumente Organisiert abgelegt.
1 Suchprofile erstellen und verwalten. 2 Suchprofile bei Registrierung Hier können Sie bis zu drei Suchprofile einrichten. Diese finden Sie später unter.
Peter Kaufmann Stud Sek I 06 FHNW Aarau, Posterdesign © Maria Spychiger Jasmin KlauserStud Sek I 06 FHNW Aarau,
Lernmodul Einführung Nutzen Sie diese Powerpoint-Präsentation beim Selbstlernen oder in Veranstaltungen zur Einführung in das jeweilige Thema. Nutzungsbedingungen:
EPortfolio FI Mag. Günther Schwarz.
Wissenschaftliches Projekt
 Präsentation transkript:

Präsentation von: Ghamdan Atef

Motivation Datensammlung Vorgeschichte Radio Oranje Collection Projekt Experimente Erstellung von Transkriptionen Akustische Modelle Segment-Länge Ergebnisse Fazit Live Demonstration Zukünftige Arbeit 2

Problem: Beschränkung der Zugänglichkeit von historischen Audio-Ansammlungen Folge: Erschwerte Suche nach bestimmten Inhalten in historischen Reden Lösung: Digitalisierung der Tonaufnahmen Erstellung eines Zeitstempel-Index Einführung von Such-Technologien 3 MotivationProjekt ErgebnisseFazitDemoZukünftige Arbeit

Radio Oranje Collection: Sammlung von im Radio ausgestrahlten Reden, die Königin Wilhelmina ( ) während des Zweiten Weltkriegs an das niederländische Volk richtete. 4 MotivationProjekt ErgebnisseFazitDemoZukünftige Arbeit

Unzugänglichkeit von Audio-Sammlungen des kulturellen Erbes (z. B. Radio Oranje Collection) durch: I. Speicherung auf analoge Datenträger Verschlechterung der Aufnahmequalität II. Verwendung veralteter Wiedergabe-Geräte Schwierigkeit zu einer schnellen und einfachen Zugriff auf bestimmten Inhalten Frühere Digitalisierungs-Projekte: EU IST PrestoSpace Dutch Beelden Voor De Toekomst 5 MotivationProjekt ErgebnisseFazitDemoZukünftige Arbeit

Digitalisierung der Bewahrten Aufnahmen und deren Original- Transkriptionen Bedarf einer schriftlichen Transkription für die Stichwortsuche: Eine Reihe von Stichwörtern z. B. aus einer Redeepisode Generierung von automatischen Zeitstempel- Transkriptionen 6 MotivationProjekt ErgebnisseFazitDemoZukünftige Arbeit

Spracherkennung: (was wird gesagt?) Transkriptionen durch vollautomatische Spracherkennung Suboptimal wegen schlechter Tonqualität Alignment: (wo wird etwas gesagt?) Modell: Verwendung einer bereits vollständig transkribierten Sammlung Daten: Angleichung (Alignment) der phonetischen Darstellung des Gesprochenen mit der des Modells. Drei Experimente zur Auswertung von Alignments zwischen Text und Rede 7 MotivationProjekt ErgebnisseFazitDemoZukünftige Arbeit

Verwendung derselben Modelle für Alignment und Spracherkennung: geschlechtsunabhängig sprecherunabhängig Verwendete Modelle / Nachrichtensendungen: triphone (kontextabhängige) monophone (kontextunabhängig) Ergebnis: neue sprecherabhängige Modelle Generierung und Evaluierung der letzten akustischen Wilhelmina Modelle 8 MotivationProjekt ErgebnisseFazitDemoZukünftige Arbeit

Bei gegebenem Ton das passende akustischen Modell-Segment finden Pruning-Verfahren Ankerpunkte: Verknüpfung Tonband und Transkription an zwei gleichen Positionen Mehr Ankerpunkte: Alignment wird leichter Pruning-Verfahren wird weniger angewendet Einfluss der Segment-Länge auf die Qualität des Alignment 9 MotivationProjekt ErgebnisseFazitDemoZukünftige Arbeit

Indirekte Text-Rede-Alignment über phonemischer Darstellung des Textes Orthographische Transkription in phon. Darstellung Phonem auf dem Tonband Sequenz von ak. Modellen Konverter: Background-Wörterbuch Regelbasiertes System Entsprechende Schreibweise und Aussprache Einfluss der Konvertierung aufs Alignment: Vollautomatische Konvertierung Konvertierung mit Referenztext Manuelle phonetische Konvertierung 10 MotivationProjekt ErgebnisseFazitDemoZukünftige Arbeit

11 Ak. Modelle aus monophonen Sendungen um 60% besser als solche aus triphone Sendungen Datenspezifische Modelle sind besser als gewöhnliche Nachrichtensendung en Für jedes der drei ak. Modelle wird die Datenmenge im Hinblick auf die entsp. Divergenz von der Referenztranskription gezeigt. MotivationProjekt ErgebnisseFazitDemoZukünftige Arbeit

12 Gleichgültigkeit der Länge der Segmente beim Wilhelmina- Modell Bei längeren Segmenten aus triphoner N- Sendungen war die benötigte Zeit länger (Reduzierung des Pruning-Verfahren) Alignment Performance als Funktion von Segmentlängen für triphone Nachrichtensendungen Models und die Sprecher-spezifischen Wilhelmina Models. MotivationProjekt ErgebnisseFazitDemoZukünftige Arbeit

13 Modelle aus monophonen Nachrichten- Sendungen Niedriger Einfluss veralteter Schreibweise auf Alignment- Performance Schreib- weise Veränderte Phone (%) Divergenz- Mittelwert (ms) Original055 Modern156 Manuelle Konv. 554 Die Auswirkung von der Grafem-zu-Phonem Konvertierungsmethode auf die Alignment Performance. MotivationProjekt ErgebnisseFazitDemoZukünftige Arbeit

Alignment-Performance ist adäquat für Indezierungsarbeiten Monophone Modelle ergeben bessere Alignment- Performance als triphone Modelle Mit dem richtigen Modell ist die Länge der Segmente relativ belanglos Bei Abweichung des Tonbands vom Modell wurde mehr Zeit beansprucht für ein akzeptables Alignment Graphem-zu-Phomen hat keinen Einfluss aufs Lokalisieren von Wortgrenzen 14 MotivationProjekt ErgebnisseFazitDemoZukünftige Arbeit

15 MotivationProjekt ErgebnisseFazitDemoZukünftige Arbeit

Abfrage in moderner Sprache durch den Benutzer Übersetzung von Abfragen in Niederländisch der 1940er Jahre Interaktiven Visualisierung des Audio-Inhalts basierend auf den Zeitstemple-Index Überblick des gesamten Dokuments Detaillierte Überblick über das gerade abgespielte Segment Abspielung ab dem angeklickten Punkt Anzeige der gesprochenen Worte als Untertitel Unterschiedliche Markierung der Suchworte im Untertitel 16 MotivationProjekt ErgebnisseFazitDemoZukünftige Arbeit

Fortschritt in der Digitalisierung von historischen Texten, Bildern und Pamphleten Automatische Verlinkung zwischen Dokumenten Anzeige verwandter Dokumente in einer Präsentation Verknüpfung der Inhalte von Medien über die semantische Darstellung jedes Medientyps: Direkt Über ein Lexikon Über eine Ontologie Keine automatische Verlinkung von Radio Oranje Aufnahmen und den entsprechenden Bilder Manuelle Erstellung der Semantische Darstellung von Reden 17 MotivationProjekt ErgebnisseFazitDemoZukünftige Arbeit

18 MotivationProjekt ErgebnisseFazitDemoZukünftige Arbeit

Bessere Erforschung der semantischen Übereinstimmung der gesprochenen Worte mit dem Thema. Reduktion der Stichwörter auf ein kontrolliertes Vokabular Verwendung eines Lexikon- oder Ontology- Systems (z. B. Wordnet) Einsatz von Expertenwissen bei bestimmten geschichtlichen Ereignissen 19 MotivationProjekt ErgebnisseFazitDemoZukünftige Arbeit

Radio Oranje: Enhanced Access to a Historical Spoken Word Collection Laurens van der Werff, Willemijn Heeren, Roeland Ordelman & Franciska de Jong University of Twente anje.html 20

Vielen Dank für die Aufmerksamkeit! Fragen? 21