BAS: Infrastrukturen für Technische Sprachsignalverarbeitung (BITS)

Slides:



Advertisements
Ähnliche Präsentationen
 ZIEL Infoblatt Indikatoren Schwerpunkt WIRAM
Advertisements

Prof. Dr. Liggesmeyer, 1 Software Engineering: Dependability Prof. Dr.-Ing. Peter Liggesmeyer.
V-Modell XT - Ein Überblick
IuK2003, Osnabrück Th. Severiens, ViFaPhys Virtuelle Fachbibliothek Physik Ein kooperatives Dienstleistungsangebot für die Physik.
Empirische Forschung Empirisch = eine wissenschaftliche Vorgehensweise betreffend, die nicht auf theoretischen Begründungen, sondern auf nachvollziehbaren.
1 Sprachressourcen-Gipfel IDS Mannheim Mai 2009 Bayerisches Archiv für Sprachsignale Florian Schiel & Christoph Draxler schiel |
eine Plattform für annotierte Korpora in XML
Der Stimulus Kommentar scheint einen Einfluss auf die Bewertung sportlicher Leistungen durch die Rezipienten zu haben. Die Unterschiede zwischen den beiden.
Arbeits- und Präsentationstechniken 1 Teil A: Wissenschaftstheoretische Grundlagen Prof. Dr. Richard Roth WS 2011/2012 APT 1 Prof. Dr. Richard Roth.
Einführung in die romanische Sprachwissenschaft VIa
Digitalisierung und Aufbereitung von Sprachdaten
Eine RDF Konvention für die Beschreibung phonetischer Ressourcen im Semantic Web Hauptseminar: Historisch-Kulturwissenschaftliche Objekte im Semantic Web.
C.M. Presents D.A.R. und Ein Bisschen dies und das!
Konzeption und Realisierung eines Text- Analysesystems zur Automatisierung der Bewerberauswahl von diesem Datenformat jede beliebige Anwendung adaptieren.
Erschließen von semantischen Referenzen mit Ontology-Reasoning-Werkzeugen Das Ziel dieser Masterarbeit war die Erweiterung des ORBI Systems um ein Inferenz-System.
Nutzung und Bedeutung von Business Intelligence und Business Intelligence Methoden und -Werkzeugen Durch die Analyse des BI mit dem Fokus der Managementunterstützung.
„Wissenschaftliches Arbeiten“ Was soll denn das sein?
Universität Stuttgart Institut für Kernenergetik und Energiesysteme LE 3.2- LM 8 - LO 9 Definitionen zu LM 8.
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/8 Thesauren In gewisser Weise bilden Thesauren (Singular Thesaurus, Plural auch Thesauri)
Gestufte Studiengänge im Institut für Phonetik und Sprachverarbeitung
Die Phonetik und Sprachverarbeitung
Grundlagen der Analyse von Sprachdatenbanken
Aufbau, Abfrage, Analyse von Sprachdatenbanken ErstellungAnalyse Abfrage Digitale Zeitsignale akustisch, artikulatorisch Etikettieren Verknüpfung mit Symbolen.
Was ist die artikulatorische Grundlage von Locus-Gleichungen? Hauptseminar: Modelle der Sprachproduktion & - perzeption Dozent: Prof. Dr. Jonathan Harrington.
Ziele und Strategien des KOBV
Grundkurs Linguistik Programm der Vorlesung Oktober
„Arbeit“ als Thema des Lehrplans AWT von 2004
Qualitative Forschung
Vorlesung Datenschutz, FB Informatik, Universität Dortmund, SoSe Übung/Hausaufgabe Cookies – Betrachtung aus der Sicht des Datenschutzes Was geht.
Wissensdienste Detailkonzept.
Kategoriale Wahrnehmung
www.gdi-sachsen.de1 Unterstützung der Entwicklung einer Geodateninfrastruktur im Freistaat Sachsen Inhaltliche Ziele des GDI-Sachsen e.V. Beschlossen.
Gradierte Grammatikalität SS 2003 Einheit 1. Quelle des Übels Klassische Linguistik Korpusorientiert (Tote Sprachen/ Literatur- sprachliche Norm) Dialektforschung.
Simulation komplexer technischer Anlagen
Diplomarbeit | Dlesk Peter | Juni 2008
Duo- und Quad Prozessor-Architektur
Deutsche einsprachige Korpora немецкие одноязычные корпуса Institut für Slawistik Seminar: Slawische Korpuslinguistik SS 2006 O. Prof. Dr. Branko Tošović
Workshop 2 Praktische Instrumente für den Gemeinsamen europäischen Referenzrahmen Dirk Klein:
1 Semiautomatische Medienresonanz- und Diffusions-Analyse Waltraud Wiedermann, GF APA-DeFacto und APA-MediaWatch Michael Granitzer, Know-Center.
© Wortstellung im Deutschen Norbert Fries.
Die synchronen Grundlagen des Lautwandels Jonathan Harrington.
- 1 Förderprogramm eTEN Call Mai bis 10. September 2003.
Kompetenz -, Lern - und Prüfungsbereiche Anforderungsbereiche
Dienstleistungen für Ihren Fortschritt. Neigungsprofil für Servicetechniker More than psychology structures.
CRM TimeLog… TimeLog … Wie gross ist der Anteil der Lohnkosten in Ihrem Unternehmen?
Verbundprojekt OUTSHORE Studie und Methodikentwicklung zur Beurteilung der Erfolgsfaktoren bei der Vergabe von Softwareprojekten an Niedriglohnländer.
Malcolm – 1. Teil Malcolm interpretiert Descartes mit Blick auf die Frage nach der Natur des Denkens (dem cogito) folgendermaßen: Jeder mentale oder bewusste.
Die Kompetenzwerkstatt - Ich und meine Zukunft -
Dieser nicht Fehler finden Algorithmus enthält einfach einen gravierenden welcher zu ist.
Elternabend der Schule … vom …
Friday Lectures, 23. Nov. 2007, W. Grossmann, K. Schinagl Ziele Content Blended Learning Szenario Besonderheiten Implementierung Evaluation.
Der ultimative Stress-Test
Lehrplan Technik GOSt.
Eike Schallehn, Martin Endig
Paul Stöhr Tanja Djordjevic Joel Neukom
Grammatikalische Begriffe im Unterricht
Semantic Web.
Studieneinstiegstest – Motivation, Hintergrund und Aufbau
Herzlich willkommen zum Informationsabend von Eltern sowie Schülerinnen und Schülern des jetzigen Jahrgangs 9 am Gymnasium Groß Ilsede
Fachtagung der Bundesvereinigung Lebenshilfe: Migration und Behinderung: Zugangsbarrieren erkennen – Teilhabe ermöglichen 29.–30. September 2015 in Berlin.
Einführung in die Phonetik und Phonologie
Die vier Stufen der Lern- thera pie. Monika Brunsting, Dr. phil.
Vo#1:Semantik als Wissenschaft Semantik I Matej-Bel-Universität in Banská Bystrica Zuzana Tuhárska.
Kommunikation zur Klimawandelanpassung ME3, 25. Februar 2016, Andrea Prutsch 1 Andrea Prutsch, Bern, 8. Juni 2016 Klimawandelanpassung kommunizieren: Praxisbeispiele.
Einführung in die Phonetik und Phonologie SS 2010 Bistra Andreeva Sitzung 1: Einführender Überblick.
PROGRAMM der Gestaltung der Stützuniversität auf der Basis der Orjoler staatlichen Universität namens I.S.Turgenew und der Priokski staatlichen Universität.
 Präsentation transkript:

BAS: Infrastrukturen für Technische Sprachsignalverarbeitung (BITS) LT-Summit Saarbrücken 11.05.2004 Hans G. Tillmann (Einleitung) Florian Schiel et. al. (Arbeitsbericht) H.-G- Tillmann & Florian Schiel: Sprachressourcen – Dienstleistungen BITS

Hans G. Tillmann Warum man bei der Entwicklung von SLP-Technologien auf phonetisch aufbereitete Sprachressourcen nicht verzichten kann (Über den wissenschaftlichen Hintergrund und die praktischen Zielsetzungen der Kooperation mit der Industrie) H.-G- Tillmann & Florian Schiel: Sprachressourcen – Dienstleistungen BITS

  Skizze der wissenschaftlichen Grundlagen   Um das tatsächliche Funktionieren der gesprochenen Sprache aufdecken zu können, müssen genau vier Zusammenhänge durch die phonetische Forschung theoretisch geklärt werden: 1.      Sprechakt und Äußerung 2.      Äußerung und Bedeutung 3.      Phonetische Variabilität und kategoriale Konstanz 4.      Zwei Zielsetzungen der Kooperation mit der Industrie H.-G- Tillmann & Florian Schiel: Sprachressourcen – Dienstleistungen BITS

1. Sprechakt und Äußerung (i) Dieser Zusammenhang ist streng: es gibt keinen natürlichen Sprachakt ohne die lautsprachlichen Äußerung eines Sprecher (ii) An der phonetischen Form der Äußerung lässt sich erkennen, um welche Art von Sprachakt es sich handelt:     - in welcher Sprache sich ein Sprecher äußert (chinesisch, deutsch, französisch)     - ob es sich um einen L1- oder L2-Sprecher handelt (wie z.B. gesprochenes Deutsch mit englischem, französischen, chinesischen u.s.w. Akzent) H.-G- Tillmann & Florian Schiel: Sprachressourcen – Dienstleistungen BITS

(1. Sprechakt und Äußerung, cont.)  - in welcher Sprache sich ein Sprecher äußert (chinesisch deutsch, französisch) - ob es sich um einen L1- oder L2-Sprecher handelt (wie z.B. gesprochenes Deutsch mit englischem, französischen, chinesischen u.s.w. Akzent) - ob wir z.B. den angerufenen Sprecher selbst am Telefon haben oder ob wir nur seine Stimme vom Anrufbeantworter hören - ob laut gerufen, geflüstert, gefragt, befohlen, gebetet, gepredigt, im Gericht ein Urteil oder auf einem wissenschaftlichen Workshop ein Vortrag gehalten wird - ob es sich z.B. auch um ein typisches Produkt der heutigen Sprachsynthese handelt (in unterschiedlichster Qualität) H.-G- Tillmann & Florian Schiel: Sprachressourcen – Dienstleistungen BITS

(1. Sprechakt und Äußerung, cont.) (iii) Dieser kategoriale Reichtum ist für das tatsächliche Funktionieren von lautsprachlichen Kommunikationsprozessen auf grundlegende und auf maßgebende Weise relevant (iv) Der kategoriale Reichtum wird durch die phonetischen Tatsachen zum Ausdruck gebracht, die ein Sprecher schon allein mit seiner lautlichen Äußerung in die Welt setzt Kurz: Der kategoriale Reichtum der unterschiedlichsten Sprechakttypen bestimmt die extrem große Variabilität in den phonetischen Sprachdaten H.-G- Tillmann & Florian Schiel: Sprachressourcen – Dienstleistungen BITS

2. Äußerung und Bedeutung (i) Für das tatsächliche Funktionieren von Sprechakten sind die phonetischen Tatsachen, die ein sprechendes Nervensystem an seiner Peripherie durch den Ablauf einzelsprachlich geregelter Sprechbewegungen (auf selbst- und fremdbeobachtbare Weise) präsentiert, zwar absolut notwendig, aber bei weitem nicht hinreichend: - nicht jede lautliche Äußerung ist ein Sprechakt - die Wahrnehmung der mit jeder konkreten Äußerung gegebenen regulären phonetischen Tatsachen ist automatisiert H.-G- Tillmann & Florian Schiel: Sprachressourcen – Dienstleistungen BITS

2. Äußerung und Bedeutung (ii) Um das tatsächliche Funktionieren von Sprechakten wissenschaftlich erklären zu können, muss man das kognitive Bild der Äußerung, das beim Ablauf von lautsprachlichen Kommunikationsprozessen auf der Hirnrinde von Sprechern und Hörern entsteht, auf der semantischen Seite mit dem übrigen kortikal repräsentierten Weltwissen der betreffenden Individuen in Beziehung setzen können H.-G- Tillmann & Florian Schiel: Sprachressourcen – Dienstleistungen BITS

(2. Äußerung und Bedeutung, cont.) (ii) Rein logisch muss im Bereich der Semantik zwischen zwei grundlegenden Typen von Sprechakten unterschieden werden. - Im ersten Fall werden Äußerungen autonym produziert (hierbei steht die Äußerung selbst steht im Zentrum der Aufmerksamkeit von Sprecher und Hörer) - Im zweiten Fall werden die Äußerungen heteronym verwen- det (Sprecher und Hörer transzendieren die wahrgenomme- ne Äußerung in die abstrakten und konkreten Situationen, die mit der Äußerung quasi automatisch beherrscht werden (iii) Im Hinblick auf die resultierenden phonetischen Sprach-daten ist der hier eingeführte Unterschied gravierend (s.u. 4.) H.-G- Tillmann & Florian Schiel: Sprachressourcen – Dienstleistungen BITS

3. Phonetische Variabilität und kategoriale Konstanz (i) Der Begriff der lautsprachlichen Äußerung ist mehrdeutig - wir ersetzen ihn durch den Begriff der phonetischen Tatsache (vgl. dazu Tillmann auf der letzten Heidelberger VERBMOBIL-Sitzung) Die als Sprachressourcen in die Datenbank aufzuneh-menden phonetischen Tatsachen bestehen aus digitalisierten Zeitfunktionen (Sprachsignalen) mit der symbolisch annotierten Kategorie der wahrgenommen Äußerung Der Zusammenhang zwischen Signal und Symbol ist kein analytischer, sondern logisch kontingent, also rein empirisch gegeben H.-G- Tillmann & Florian Schiel: Sprachressourcen – Dienstleistungen BITS

(Phonetische Variabilität und Kategoriale Konstanz,) Der Zusammenhang zwischen Signal und Symbol ist kein analytischer, sondern logisch kontingent (also durch empirische Koinzidenz gegeben) Für menschliche Nervensysteme erweist sich die empirisch gegebene Zuordnungsrelation zwischen digitalisierbarem Signal und annotierbarer Kategorie als sogar experimentell reproduzierbar Auf dieser Basis lässt sich die Zuordnungsrelation durch eine empirisch verifizierbare Zuordnungstheorie explizit machen H.-G- Tillmann & Florian Schiel: Sprachressourcen – Dienstleistungen BITS

4. Zwei Zielsetzungen der Kooperation mit der Industrie Rein wissenschaftlich kommt es darauf an, die lexikalisierten und die prosodischen Formen von Wörtern der deutschen Sprache durch konkret gegebene phonetische Tatsachen als Ressourcen für Industrie und Wissenschaft verfügbar zu machen Ziel 1: Schrittweise Verbesserung der industriellen Sprach-Technologie H.-G- Tillmann & Florian Schiel: Sprachressourcen – Dienstleistungen BITS

4. Zwei Zielsetzungen der Kooperation mit der Industrie Ziel 2: Anwendung dieser verbesserten Sprachtechnologie für die theoretische Beherrschbarmachung der phonetischen Variation der prosodischen, kategorial gesteuerten Wortrealisierungen im Deutschen Hier stehen wir erst am Anfang einer langen Entwicklung. Doch müssen wir hier heute schon, durch das Verfolgen dieser beiden Ziele, die Grundlagen schaffen für die Erfolge der Zukunft. H.-G- Tillmann & Florian Schiel: Sprachressourcen – Dienstleistungen BITS

Projekt-Rahmeninformation [BITS] - BAS Infrastrukturen für Technische Sprachverarbeitung ist eine Infrastrukturmaßnahme zur Schaffung einer wissenschaftlich und ingenieurtechnisch fundierten und allgemein zugänglichen Plattform für Ressourcen gesprochener deutscher Sprache innerhalb des Kompetenznetzwerkes für Sprachtechnologie unter der Federführung von COLLATE. H.-G- Tillmann & Florian Schiel: Sprachressourcen – Dienstleistungen BITS

Projekt-Rahmeninformation Bayerisches Archiv für Sprachsignale (BAS): - Initiative der Ludwig-Maximilians-Universität - Forschung auf dem Sektor der Sprachverarbeitung BITS: - BMBF Förderung unter Federführung von COLLATE - Laufzeit: 48 Monate (Beginn 4/2002) - 9 thematisch abgeschlossene Teilprojekte H.-G- Tillmann & Florian Schiel: Sprachressourcen – Dienstleistungen BITS

TP 1 und 2 Zielsetzung: Methodologie zur Produktion von wiederverwendbaren Korpora & Methodologie zur technischen und inhaltlichen Validierung Status: abgeschlossen Ergebniss: Buch ISBN: 3-8330-0700-1 Ausblick LREC 2004 Workshop "Speech Corpus Production and Validation" H.-G- Tillmann & Florian Schiel: Sprachressourcen – Dienstleistungen BITS

TP 3 Zielsetzung: Entwicklung von Software zur Durchführung von Annotationen dezentral über das Internet Status: WebTranscribe ist abgeschlossen und wird auf der LREC 2004 vorgestellt Ergebnisse: Public-Domain-Software WebTranscribe (www.bas.uni-muenchen.de/Bas) H.-G- Tillmann & Florian Schiel: Sprachressourcen – Dienstleistungen BITS

Public-Domain-Software: WebTranscribe H.-G- Tillmann & Florian Schiel: Sprachressourcen – Dienstleistungen BITS

TP 4 Zielsetzung: Neue Methode zur flächendeckenden Erhebung von direkten Aufnahmen durch Client-Software am privaten Rechner Status: fertig gestellt, wird auf der LREC 2004 vorgestellt Ergebnisse: Public-Domain-Software SpeechRecorder (www.bas.uni-muenchen.de/Bas) H.-G- Tillmann & Florian Schiel: Sprachressourcen – Dienstleistungen BITS

TP 4 H.-G- Tillmann & Florian Schiel: Sprachressourcen – Dienstleistungen BITS

TP 5 Zielsetzung: Revalidierung aller Korpora des BAS-Katalogs nach Ergebnissen aus TP2 Status: wird bearbeitet Ergebnisse: Revalidierungsprotokolle publiziert in BAS-Katalog Zusatzleistung: IMDI-Metadaten H.-G- Tillmann & Florian Schiel: Sprachressourcen – Dienstleistungen BITS

TP 5 Abgeschlossen: - PhonDat 1 -PD1 - PhonDat 2 -PD2 - Strange Corpus 1 - SC1 - Siemens 100 - SI100 - Regional Variants of German J - RVG-J Noch zu validierende Corpora: 13 H.-G- Tillmann & Florian Schiel: Sprachressourcen – Dienstleistungen BITS

TP 6 Zielsetzung: Automatische Analyse von Sprachkorpora Status: wird bearbeitet Munich AUtomatic Segmentation (MAUS): Erweiterung auf iteratives Verfahren (LREC 2004 Vortrag) Konkrete Anwendung: Automatische Segmentierung des Satzkorpus TP8 H.-G- Tillmann & Florian Schiel: Sprachressourcen – Dienstleistungen BITS

TP 7 Zielsetzung: Bedarfsstudie für Sprachressourcen und technische Sprachanwendungen Status: Befragungen (online) abgeschlossen Erst Fokus-, dann Hauptgruppenbefragung Publikation in Arbeit H.-G- Tillmann & Florian Schiel: Sprachressourcen – Dienstleistungen BITS

TP 7 Expertenbefragung: 31 Teilnehmer Bedarf an Sprachressourcen in 5 bis 15 Jahren: - Korpora mit Fehlern in der Spontansprache (wichtig 30/ unwichtig 1) - Generationenkorpora für unterschiedliche Lebensalter (23/5) - Stellenwert von Emotionen (21/9) - Korpora mit gemischt-sprachlichen Ressourcen (18/3) - Korpora mit Zweitsprach-Ressourcen (18/6) - Sprachinhalte für Kinderdatenbank (diverse) H.-G- Tillmann & Florian Schiel: Sprachressourcen – Dienstleistungen BITS

TP 8 Zielsetzung: Frei verfügbare Korpora für Sprachsynthese Status: wird bearbeitet Ergebnisse: 4 Sprecher/innen, Diphon + Unit-Selection Profi-Sprecher nach Auswahlverfahren (45 Kandidaten) ausgewählt H.-G- Tillmann & Florian Schiel: Sprachressourcen – Dienstleistungen BITS

TP 8 Pro Sprecher: 2783 Logatome / 1683 Sätze Abgeschlossen: Sprecher 2 und 3 In Bearbeitung: Sprecher 1 und 4 Manuelle Segmentierung Prosodische Annotation H.-G- Tillmann & Florian Schiel: Sprachressourcen – Dienstleistungen BITS

TP 9 Zielsetzung: Sprache von Jugendlichen wird an Grundschulen erhoben zwei Altersklassen: 12-18 und 6-12 Jahre Inhalte: gelesene Sprache, Spontansprache (Beschreiben von Bildern/Video-Sequenzen) Aufnahme unter Verwendung des SpeechRecorders (TP 4) Annotation mit Hilfe des Tools aus TP 3 (WebTranscribe) Status: wird bearbeitet H.-G- Tillmann & Florian Schiel: Sprachressourcen – Dienstleistungen BITS

BITS Service Firmenberatung Inland: 9 Firmenberatung Ausland: 3 Universitäten/FH Inland: 13 Universitäten Ausland: 5 Präsenz auf SYSTEMS 2002 H.-G- Tillmann & Florian Schiel: Sprachressourcen – Dienstleistungen BITS

Herzlichen Dank für Ihre Aufmerksamkeit H.-G- Tillmann & Florian Schiel: Sprachressourcen – Dienstleistungen BITS