Sprachaufnahmen und automatische (Vor-)Segmentierung

Slides:

Advertisements

Ähnliche Präsentationen

Willkommen auf der neuen Electrical Power Website Überblick über die neuen Features und die erweiterte Funktionalität unserer Website.

Advertisements

Support.ebsco.com Lernprogramm zum Erstellen einer lokalen Sammlung.

Webinar für [Name der Gruppe] [Name des Institutes]

Mit dieser Methode vergleichen Sie sehr einfach zwei oder mehr Präsentationen Herbert Manthei

Partitur-Editor: Transkribieren

1 Sprachressourcen-Gipfel IDS Mannheim Mai 2009 Bayerisches Archiv für Sprachsignale Florian Schiel & Christoph Draxler schiel |

Softwareverteilung.

IrfanView starten Doppelklick Es erscheint dieses Fenster.

GRASS - Anwendungsbeispiel

Anschließen des Rekorders n Anschließen des Kassetten- oder DAT -Recorders: n Die beiden Ausgänge (line out) des Rekorders werden mit den Eingängen (line.

Starten von Multi-Speech Starten des Systems: n PC einschalten n Icon für Multi-Speech auf dem Desktop anklicken n Multi-Speech Main Program wählen Sitzung.

Übung Akustische Phonetik

Abfragen aus einer Sprachdatenbank Jonathan Harrington.

SQL als Abfragesprache

Benutzen von Internetseiten

By Monika Krolak & Christian Meschke

Installationsanleitung 1.02 Hausverwaltung.

ExKurs Recherchieren 1/7 Dr. Barbara Hoffmann LiteraturKompetenz Recherchieren aus citavi heraus Eine integrierte Recherche ermöglicht Ihnen.

Briefkopfbogen anpassen

Anmeldung bei Stud.IP Stud.IP ist ein Lern-, Informations- und Projekt-Management- System, das von Hochschulen, Bildungseinrichtungen, Behörden und Unternehmen.

Bezirksregierung Detmold Hier könnte ein schmales Bild eingefügt werden Online-Beteiligungsverfahren zum Entwurf von Bewirtschaftungsplan und den Maßnahmenprogrammen.

Tipps und Tricks für Word 2000 Aytac, Felix, Steffen 04/05.

Welche Funktion hat die php.ini? -Beinhaltet wichtige Einstellungen für PHP. Genannt seien hier u.a. der Speicherort von Cookies, Parameter der Kompilierung,

Neuer Aufbau, neue Elemente Schubladen In unseren neuen Schubladenelementen hat viel Information auf wenig Raum Platz. Sie öffnen eine Schublade durch.

Outlook_03 - Freigabe von Postfächern für Kollegen

MMSSTV Einstellung FSK ID , sowie Bild und Slant Grundeinstellungen

Automatische Übersetzungen mit Google

Eine Bewerbung schreiben

Anlegen von Ordnern, speichern und Öffnen von Bildern und Briefen

Eine Bewerbung schreiben

Herzlich Willkommen zu „Einführung in die Programmierung mit Java“

Druckerinstallation HP1050C

6 Mit dem Internet Explorer im WWW arbeiten

Wie man eine einfache Präsentation erstellt...

Hallo! Ich zeige dir, wie du eine eigene Präsentation gestalten kannst! Beginne eine neue Präsentation mit einer leeren Folie. Wie das geht, steht auf.

Kostenlose Alternative zu Microsoft Office

12. Das Arbeiten mit DokumentvorlagenInhaltsverzeichnis 12. Das Arbeiten mit Dokumentvorlagen 12.1 Grundlagen 12.2 Dokumentvorlagen erstellen 12.3 Dokumentvorlagen.

Developer Day Office APPs entwicklen Simon Amrein Trivadis AG Die ersten Schritte in eine neue Office-Welt.

Ganzheitliches Projekt-, Ressourcen- und Qualitätsmanagement 1 Reports und AddOns Auf den folgenden Seiten wird Ihnen die Funktionsweise der Reports und.

Skype Christina & Tobias.

Anhand der Bildergalerie Phoca Gallery v

Hast du deinen Ordner oder deine Datei im PC verloren?

Torque in Turbine Team 4 Josef Bohninger Thomas Lindenhofer

Allgemeine Funktionalitätsbeschreibung

Saia Service an PCD's Datensicherung

Allgemeine Funktionalitätsbeschreibung

Erste Schritte in DELPHI

Datei hochladen Um Mit der Dateiverwaltung zu beginnen klicken Sie zunächst auf den Wiki verwalten Button. Dann klicken Sie auf Dateien.

Benutzer und Gruppen In Windows 2000 Server Benutzer anlegen Gruppen anlegen Verschiedene Rechtevergabe Diese Präsentation wurde erstellt von, Kaspar Chrisitian.

Einführungstutorial: Linux Konsole

 exx1.fit in IRIS laden. 167 Bilder  Dies sind Bilder, die bereits gestacked sind.

Anleitung zum Arbeiten mit verschiedenen Ebenen

Die einfachste Variante! Anlegen, ausfüllen und senden !

Erstelle deine eigene Timeline

Bienert EDV Software für das 21. Jahrhundert Der Vermieter ist eine universelle Lösung für jeden Vermieter. Durch reichhaltige Anpassungsmöglichkeiten.

Die Vereinsverwaltung unter Windows 2000 Anhand der folgenden Präsentation werden Sie mit der Verwaltung des Vereins unter Windows 2000 vertraut gemacht.

Typo 3 // Templa Voila * Was? * Warum? * Wie? - Praktische Übung.

In die weisse Infofläche kann beliebiger Text oder Grafiken eingefügt werden. Die blauen Aufzählungspfeile sind beliebig kopier-, lösch- und verschiebbar.

© Zentrale Planungsgruppe Netze am Kultusministerium Baden-Württemberg (ZPN) Musterlösung H. Bechtold, E. Dietrich, G. Ehmann, K.Gutjahr,

Termin Festlegung Einführung MySQL Runterladen MySQL, Pentaho Design Studio Betrachtung Pentaho

Pool Informatik 5 GZG FN Sj. 11/12

TemplaVoilá. Allgemeines Dient nicht der Erweiterung der Funktionalität bestehender TYPO3-Sites, sondern der Erhöhung der Produktivität und der Vereinfachung.

Pool Informatik, Sj 11/12 GZG FN W.Seyboldt 1 Pool Informatik 5 GZG FN Sj. 11/12 Kopieren, Daten, Programme.

MS Word 2010 Word Texte eingeben und bearbeiten automatische und manuelle Korrekturen Text bearbeiten Word Texte eingeben und bearbeiten automatische und.

1 Prozesse im Studierendenmanagement Kontext: Studierenden anlegen Sonstige Aktivitäten: Suchfunktion, s verschicken, diverse Auswertungen.

1 Prozesse im Studierendenmanagement Kontext: Studierenden anlegen Sonstige Aktivitäten: Suchfunktion, s verschicken, diverse Auswertungen.

Installation und Nutzung des Eyeblaster Workshops und Hochladen in MediaMind.

LESEN SIE ZUERST DIESE FOLIE (Diese Folie ist ausgeblendet

OFFICE 365 FOCUS SESSION SHAREPOINT ONLINE 101:LERNE DIE BASICS 19. März 2018 Höhr-Grenzhausen.

Präsentation transkript:

Sprachaufnahmen und automatische (Vor-)Segmentierung Erste Schritte mit Speechrecorder und MAuS Ulrich Reubold

Sprachaufnahmen Angenommen, Sie wollen aufnehmen: „Herr Lahnerer will malen“ „Herr Lannerer will malen“ „Herr Lehnerer will malen“ „Herr Lennerer will malen“ …usw… …und davon wollen Sie mehrere Wiederholungen haben…

Sprachaufnahmen …so ist SpeechRecorder … Draxler, Christoph & Klaus Jänsch. 2004. SpeechRecorder - A universal platform independent multichannel audio recording software. In, Proceedings of the Fourth International Conference on Language Resources and Evaluation, Lisbon, Portugal, 559–562. …eine sehr praktische Software, dies zu tun, denn:

SpeechRecorder ist plattformunabhängig erlaubt beaufsichtigte und unbeaufsichtigte Aufnahmen erlaubt Aufnahmen vor Ort und via Web erlaubt prompts in Text- (Unicode, also für praktisch alle Schriftsprachen), Bild- oder Audio-Form

Textprompt:

Bildprompt:

…oder ein MAP TASK: Erklären Sie einem Freund, wie er auf dem vorgegebenen Weg von seinem Ausgangspunkt (START) zum Ziel (FINISH) kommt!

Audioprompts … sind praktisch, wenn etwas nachgesprochen (z.B. imitiert) werden soll … oder wenn die Sprecher (noch) nicht lesen können (z.B. kleine Kinder)

Installation Dokumentation von Von http://www.phonetik.uni-muenchen.de/Bas/software/speechrecorder/ Dokumentation Von http://www.phonetik.uni-muenchen.de/ Bas/software/speechrecorder/manual/2.2.8/UserManual.pdf

Demo-Projekt nutzen Öffnen Sie Speechrecorder (shell öffnen  speechrecorder eintippen) File  New PROJEKTNAME eingeben In Ihrem homesverzeichnis entsteht: /speechrecorder/PROJEKTNAME/ Im Speaker data –Fenster mit Add einen Sprecher hinzufügen  Select

Demo-Projekt Ampel: Steuert den Sprecher Promp Zeigt, welcher Prompt schon aufgenommen ist Kontrolle des Aufnahmepegels (darf nicht rot sein) Signal: hier zwei Mal Klatschen in Stereo bei niedrigem Pegel

Demo als Vorlage nutzen Schließen Sie nun das Projekt In/homes/USER/speechrecorder/ PROJEKTNAME/ finden Sie ein XML-Skript  jedit NAME.xml Passen Sie das Skript nach Ihren Vorstellungen an (siehe Folie 2); Hierachie nicht verändern: <script>  <metadata>/<recordingscript>  <section>  <recording> …öffnende Tags müssen wieder geschlossen werden z.B.: <script> … </script>

Beispiel (für einen(!) Prompt) <script> <recordingscript> <section name="Recording Session01" order="random" speakerdisplay="yes" mode="autoprogress" promptphase="idle"> <recording prerecdelay="2000" recduration="4000" postrecdelay="500" itemcode="Target_A_T_01"> <recinstructions mimetype="text/ISO-8859-1"> Bitte lesen Sie... </recinstructions> Ein Prompt/ eine Aufnahme <recprompt> <mediaitem mimetype="text/UTF-8"> Herr Lahnerer will malen! </mediaitem> </recprompt> </recording> </section> </recordingscript> </script> Siehe auch XML-Script auf der Website

Aufnahme gespeichertes Projekt laden: File  Open Sprecher hinzufügen/wählen Audiosetting auf mono stellen: Settings  Project  Recording (channels: 1) Mit der Testaufnahme („Barbara…“) Pegel des Mikrophons überprüfen…

Nach der Aufnahme /homes/USER/speechrecorder/PROJEKTNAME/RECS/0001 Alle Target-Aufnahmen kopieren, z.B.: mkdir Targets cp /speechrecorder/RECS/0001/*Target*.wav Target/ Für jedes wav-file ein par-file („Partitur“-File)erzeugen; d.h. für jedes .wav-file muss ein .par-file gleichen Namens vorhanden sein:

Partitur-Files (Orthographisch) ORT: 0 herr ORT: 1 lennerer ORT: 2 will ORT: 3 malen

Partitur-Files (Kanonische Aussprache) KAN: 0 hE6 KAN: 1 lEn@R6 KAN: 2 vIl KAN: 3 ma:l@n

Partitur-Files (KAN+ORT) So nicht: KAN: 0 hE6 ORT: 0 herr KAN: 1 lEn@R6 ORT: 1 lennerer KAN: 2 vIl ORT: 2 will KAN: 3 ma:l@n ORT: 3 malen

Partitur-Files (KAN+ORT) Sondern so: KAN: 0 hE6 KAN: 1 lEn@R6 KAN: 2 vIl KAN: 3 ma:l@n ORT: 0 herr ORT: 1 lennerer ORT: 2 will ORT: 3 malen …oder so: ORT: 0 herr ORT: 1 lennerer ORT: 2 will ORT: 3 malen KAN: 0 hE6 KAN: 1 lEn@R6 KAN: 2 vIl KAN: 3 ma:l@n

Partitur-Files (KAN+ORT) KAN: 0 hE6 KAN: 1 lEn@R6 KAN: 2 vIl KAN: 3 ma:l@n ORT: 0 herr ORT: 1 lennerer ORT: 2 will ORT: 3 malen Beruhigende Nebenbemerkung: Es gibt von Erik Lukac ein Skript, das Partitur-Files aus SpeechRecorder-XML-files automatisch erzeugen kann, zumindest für Deutsche Daten

MAuS Wir brauchen eine Liste der wav-Dateien: MAuS (für Korpora): In der shell: maus.corpus eintippen  gibt dem Benutzer einen Hilfetext aus Wir brauchen eine Liste der wav-Dateien: ls *.wav>Corpus.slist (wenn Sie die Target-Daten in einen eigenen Ordner verschoben haben (s. Folie 15), oder:) ls *Target*.wav>Corpus.slist MAuS (für Korpora): maus.corpus SLIST=Corpus.slist OUTFORMAT=TextGrid allowresamp=yes #Eine TextGrid-Tier: MAU Weitere Optionen (z.B. INSKANTEXTGRID=yes (erzeugt eine KAN-tier im TextGrid)) siehe Hilfetext (maus.corpus eintippen) maus.corpus SLIST=Corpus.slist allowresamp=yes OUTFORMAT=TextGrid INSKANTEXTGRID=yes INSORTTEXTGRID=yes  Drei tiers werden erzeugt: MAU, KAN, ORT

Vielen Dank für Ihre Aufmerksamkeit!