Artikulatorische Synthese

Slides:

Advertisements

Ähnliche Präsentationen

Claudio Moraga; Gisbert Dittrich

Advertisements

Quellen-Filter Theorie der Sprachproduktion

Spektra von periodischen Signalen. Resonanz.

Dynamik komplexer Systeme

Java: Objektorientierte Programmierung

FRIKATIVE Sitzung 9 Welche Konsonanten sind für sich alleine identifizierbar? -Alle Konsonanten ausser [pt] in tippt, weil das [p] nicht gelöst wird und.

Gliederung Vertrauensintervalle Arten von Hypothesen

Spektrogramm Das Spektrogramm stellt 3 Dimensionen dar:

Aligning pitch targets in speech synthesis: effects of syllable structure T. Rietveld and C. Gussenhoven Präsentiert von Anja Moos.

Phonetische Dauermessungen n c:\daten\instrpho\ip006rb.001 in Fenster A laden Die Lallphase dauert nicht lange c:\daten\instrpho\ip001rb.001 in Fenster.

Perzeptuelle Kompensation von Koartikulation bei japanischen Wachteln A. J. Lotto, K. R. Kluender, L. L. Holt. Perceptual compensation for coarticulation.

Wie wird die koartikulatorische Nasalisierung im Signal wahrgenommen?

Die Varianzanalyse Jonathan Harrington.

Mixed Models Jonathan Harrington library(ez) library(lme4)

Anwendung von Emu-TCL Jonathan Harrington.

Sprachproduktion- und Sprachperzeption

Vokale und die Quantaltheorie

Die Prosodie Jonathan Harrington Felicitas Kleber.

Dissimilation und ihre Bedeutung für den diachronen Lautwandel

Abfragen aus einer Sprachdatenbank Jonathan Harrington.

Grundlagen der Analyse von Sprachdatenbanken

Artikulationsstelle, F2-Locus, Locusgleichungen Jonathan Harrington.

Etikettierungsebenen Jonathan Harrington. Das Ziel Etikettierungen verschiedener Ebenen aufzubauen, und miteinander zu verlinken.

Aufbau, Abfrage, Analyse von Sprachdatenbanken ErstellungAnalyse Abfrage Digitale Zeitsignale akustisch, artikulatorisch Etikettieren Verknüpfung mit Symbolen.

Was ist die artikulatorische Grundlage von Locus-Gleichungen? Hauptseminar: Modelle der Sprachproduktion & - perzeption Dozent: Prof. Dr. Jonathan Harrington.

Was ist laut Stevens die Beziehung zwischen dem akustischen Signal, distinktiven Merkmalen und dem Lexikon?

Forschungsstatistik II

ARRAY oder FELD oder VEKTOR

Polymorphie (Vielgestaltigkeit)

Demoprogramm: Clustering Eine graphische Demonstration verschiedener Clusteringalgorithmen anhand des Clusterings von Punkten im zweidimensionalen Raum.

Internet facts 2008-II Graphiken zu dem Berichtsband AGOF e.V. September 2008.

EINI-I Einführung in die Informatik für Naturwissenschaftler und Ingenieure I Vorlesung 2 SWS WS 99/00 Gisbert Dittrich FBI Unido

Grundkurs Linguistik Programm der Vorlesung Oktober

Hypothesen testen: Grundidee

Zahlen geschickt addieren

Messwerte: Was sagen sie eigentlich aus?

Univariate Statistik M. Kresken.

Kategoriale Wahrnehmung

Kontrollfragen zu Kapitel 1

Vorlesung: Biometrie für Studierende der Veterinärmedizin

Welche Funktion hat die php.ini? -Beinhaltet wichtige Einstellungen für PHP. Genannt seien hier u.a. der Speicherort von Cookies, Parameter der Kompilierung,

Einführung in die Physik für LAK

Histogramm/empirische Verteilung Verteilungen

HLSyn – eine Kurzeinführung

Performance-Steigerung durch schnelle Festplatten Ulrich Dinger.

Eine Einführung in die CD-ROM

Gaben – Fähigkeiten entdecken und anwenden

by Chrissi Bruckner & Chrissi Lipp

Gaben – Fähigkeiten entdecken und anwenden

Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS

Varianzanalyse mit Messwiederholungen

Die synchronen Grundlagen des Lautwandels Jonathan Harrington.

EMA in Emu-R Jonathan Harrington

Peter Grzybek Projekt # (FWF) Projekt # 43s9 (OEAD/SAIA) Graphem-Häufigkeiten.

Exponentielles Wachstum

Wahrscheinlichkeitsrechnung

Verbindung der 4 Grundrechnungsarten

Sprachproduktion und Sprachwahrnehmung

MINDREADER Ein magisch - interaktives Erlebnis mit ENZO PAOLO

Wer wird Millionär Start.

Plosive [a d a] [a t a] [a th a]

Reelle Zahlen Grundrechenarten √2, √3, √5, … V 0.1.

1 Medienpädagogischer Forschungsverbund Südwest KIM-Studie 2014 Landesanstalt für Kommunikation Baden-Württemberg (LFK) Landeszentrale für Medien und Kommunikation.

Oro-nasalerProzess Einführung in die Phonetik und Phonologie   Oro-nasaler Prozess.

Einführung in die Phonetik und Phonologie  Grundbegriffe.

Spärliche Kodierung von Videos natürlicher Szenen Vortragender: Christian Fischer.

Präsentation transkript:

Artikulatorische Synthese TaDA

Zur Erinnerung: 50 Kontrollfragen zu Herrn Reichels Teil: http://www.phonetik.uni-muenchen.de/~reichelu/kurse/p6_2_synthese/synthese_fragen.pdf

Exkurs: Artikulatorische Phonologie Sogenannte „Gesten“, definiert über eine Menge an verwandten Traktvariablen (z.B. TT constriction location und TT constriction degree), sind die Basiseinheiten phonologischer Kontraste (Browman & Goldstein, 1992)

Gestenpartituren Grundannahme: Zwei lexikalische Einheiten unterscheiden sich dann, wenn sie sich in ihrer gestischen Zusammensetzung (gestural composition) unterscheiden d.h. Wortforminformation ist in Form von ‚gestural compositions‘ gespeichert.

„add“ Nicht spezifiziert: geschlossen Nicht spezifiziert: offen Nicht spezifiziert: richtige Einstellungen für Stimmhaftigkeit

„had“

„bad“

„pad“

„Dad“

„pan“

„span“ CD CD CD CL CL CD Constriction Degree: (unspezifiziert) wide narrow crit(ical) clo(sure) CL CD

„bad“ (phonologische Gesten) CD: wide CD: closure „Tasks“ CD: closure -Gesten überlappen einander -Artikulatoren können nicht unendlich schnell ihre Zielkonfiguration („Task“) erreichen, sondern sich nur graduell annähern und entfernen (=Schwingung wie bei Masse und Feder) -die Geschwindigkeit hierbei variiert (Vokalgesten sind langsamer als Konsonantgesten, Kröger, 1993) „Task Dynamics“

Relatives Timing von realisierten Gesten: man weiß außerdem, dass das relative Timing von Gesten sich am Silbenanfang und –ende unterscheidet: Am Silbenanfang in Phase (synchronisiert), am Silbenende nicht; d.h. die Gesten des Silbenonsets und des –nucleus starten (in etwa) gleichzeitig, während die Silbennucleusgeste i.d.R. früher endet als die Gesten, die der Silbencoda zugeordnet werden können

Task Dynamics und Kopplungsrelationen führen zu phonetischen Gestenpartituren wie hier: Geschwindigkeits- unterschied des Ein- und Ausschwingens Onset und Nucleus in Phase (Kopplung) Coda nicht in Phase mit Nucleus

Gesten phonologisch vs. phonetisch Die Gesten im Lexikon sind diskret und kategorial (Kästchen in der Darstellung) In der phonetischen Realisierung können mindestens zwei Parameter variieren: Grad der Überlappung Grad der zeitlichen Ausdehnung Phonologische Prozesse wie jene in /haːbən//haːbn//haːbm/ usw. sind (zumindest oft) nicht kategorial (qualitative Variation), sondern manche Gesten sind nur durch große Überlappung verdeckt (quantitative Variation), also noch vorhanden, aber nicht wahrnehmbar

Task Dynamics Application (TaDA) TaDA ist die Software-Implementierung zu den vorgenannten Theorien

(engl.) Orthographie („ten“) oder phon. string

Runengl. Orthographie eingeben

Im Lexikon nachschauen (pdict.txt-Ausschnitt): neck (N-EH1_K) necked (N-EH1_K T) necker (N-EH1_)(K-ER0_) necklace (N-EH1_)(K L-AH0_S) necklaces (N-EH1_)(K L-AH0_)(S-IH0_Z) necklacing (N-EH1_)(K L-AH0_)(S-IH0_NX) In sog. ARPABET sind hier Phonemfolgen und Syllabifizierung gespeichert

Gestenlexikon Seg2gest.txt: Gestenplanung für „N“: Für “EH” ARPA Organ Osc TV Constr .................................................................. N TT clo TTCL ALV N TT clo TTCD CLO N TT rel TTCL REL N TT rel TTCD REL N Velum n VEL WIDE Für “EH” EH TB v TBCL PAL EH TB v TBCD V … und für “K”: K TB clo TBCL VEL K TB clo TBCD CLO K TB rel TBCD REL K Glottis h GLO WIDE K Velum clo VEL CLO

-Aufteilung in Onset, Nucleus, Coda TVneck.O: % Input string: <neck> % Word 1: neck % arpabet: (N-EH1_K) % syllable 1: N-EH1_K % % onset cluster = <N> % segment 1 [N]: 'TTCD' 'ons1_rel1' 11 8 1 JA=512,CL=512,CA=512,TL=1,TA=1 1 1 'TTCL' 'ons1_rel1' 24 8 1 JA=512,CL=512,CA=512,TL=1,TA=1 1 1 'TTCL' 'ons1_clo1' 56 8 1 JA=32,CL=32,CA=32,TL=1,TA=1 1 1 'VEL' 'ons1_n1' 0.2 8 1 NA=1 1 1 'TTCD' 'ons1_clo1' -2 8 1 JA=32,CL=32,CA=32,TL=1,TA=1 100 0.01 % nucleus cluster = <EH1> % segment 1 [EH]: 'TBCL' 'v1' 95 3 1 JA=10,CL=1,CA=1 1 1 'TBCD' 'v1' 11.5 4 1 JA=1,CL=1,CA=1 1 1 % coda cluster = <K> % segment 1 [K]: 'TBCD' 'cod1_rel1' 6 8 1 JA=10,CL=1,CA=1 1 1 'TBCD' 'cod1_clo1' -2 8 1 JA=100,CL=1,CA=1 100 0.01 'GLO' 'cod1_h1' 0.4 16 1 GW=1 0 0 'TBCL' 'cod1_clo1' 110 8 1 JA=10,CL=1,CA=1 10 0.1 'VEL' 'cod1_clo1' -0.1 8 1 NA=1 0 0 -Aufteilung in Onset, Nucleus, Coda -Aufteilung dieser Einheiten (die immer ‚cluster‘ genannt werden, auch wenn sie nur aus einem Element bestehen) in Phoneme -Spezifikation dieser Phoneme durch Positions- und Anzahl-spezifische artikulatorische Parameter

Gestural Control Regimes Constriction Location in Grad: 0° LABIAL, 90° PALATAL, 180° PHARYNGAL Constriction Degree in mm: Abstand zur Artikulationsstelle; (bei „CLO“ (Verschluss) etwas überschießend, mit leicht negativen Werten)

Gestural Control Regimes (2) Gewichtung bei Konflikt mit adjazenten Lauten, die den gleichen Artikulator betreffen

Gestural Control Regimes (3) Gewichtung der Artikulatoren: Höhere Zahl  „schwererer“ Artikulator („Masse“)  weniger, langsamere Bewegung (bei gleicher „Feder“)

Kopplung (definiert in coupling.ph) % onset coupling relationships ONS_OBS ONS_CNS 1 1 90 % onset clusters: 90 degree phase ONS_CNS ONS_REL 1 1 65 % REL is sequential with respect to constr. ONS_VOC ONS_NAR 1 1 0 % VOC gesture of /r/,/l/ sychronous with primary NAR constr. ONS_CRT ONS_H 1 1 20 % GLO gesture is synchronous with frics ONS_CLO ONS_H 1 1 20 % and also with stops ONS_CLO ONS_N 1 1 0 % VEL gesture synchronous wih oral constr. ONS_CNS* V 1 1 0 % all CNS gestures synchronous with V ONS_H V 1 1 0 % GLO synchronous with V, if not coupled to CNS Letzte Zahl definiert die Kopplung in Grad

Kopplung (definiert in coupling.ph) % vocalic coupling relationships V_RND V 1 1 0 %rounding synchronous with V tongue constr.

Kopplung (definiert in coupling.ph) % coda coupling relationships COD_C COD_C 1 1 45 % coda clusters: 45 degrees COD_CNS COD_REL 1 1 60 % REL is sequential with respect to constr. COD_CRT COD_H 1 1 20 % GLO gesture is synchronous with frics COD_CLO COD_H 1 1 20 % and with stops COD_N COD_CNS 1 1 45 % VEL gesture anti-phase to oral constr. V COD_C 1 1 180 % first coda CNS anti-phase to V % COD_VOC COD_NAR 1 1 45 % VOC gesture sequential to NAR constr.

Kopplung (definiert in coupling.ph) /cross-syllable/ COD_C ONS_CNS 1 1 45 % applies if boundary is C$C V ONS_CNS 1 1 180 % applies if boundary is V$C COD_C V 1 1 0 % applies if boundary is C$V V V 1 1 180 % applies if boundary is V$V

Kopplung (definiert in coupling.ph) /cross-word/ COD_REL ONS_CNS 1 1 0 % applies if boundary is C#C V ONS_CNS 1 1 180 % applies if boundary is V#C COD_C V 1 1 0 % applies if boundary is C#V V V 1 1 180 % applies if boundary is V#V

Generiere „tract variable articulator time function“ Gestenpartitur

PHneck.O: %'OSC_ID' NatFreq m,n escap amp_init phase_init / riseramp plateau fallramp 'v1' 2 1 4 1 NaN/ 10 200 210 'ons1_clo1' 2 1 4 1 NaN/ 5 60 65 'ons1_rel1' 2 1 4 1 NaN/ 5 20 25 'cod1_clo1' 2 1 4 1 NaN/ 5 55 60 'cod1_rel1' 2 1 4 1 NaN/ 5 20 25 'cod1_h1' 2 1 4 1 NaN/ 5 55 60 'ons1_n1' 2 1 4 1 NaN/ 5 60 65 /coupling/ %'OSC_ID1' 'OSC_ID2' strength1(to OSC1) strength2(to OSC2) TargetRelPhase 'ons1_clo1' 'ons1_rel1' 1 1 65 'ons1_clo1' 'ons1_n1' 1 1 0 'ons1_clo1' 'v1' 1 1 0 'cod1_clo1' 'cod1_rel1' 1 1 60 'cod1_clo1' 'cod1_h1' 1 1 20 'v1' 'cod1_clo1' 1 1 180 Drei letzte Spalten: ‚interne Gestenuhr‘, mit Anstiegsphase der Geste, Haltephase (Plateau) sowie Abstiegsphase Letzte Spalte zeigt Kopplungsrelationen der Gesten untereinander in Grad

Tvneck.G: 10 0 #die Zeit wird in Frames angegeben, wobei 1 Frame = 10 ms 'TBCL' 0 0 30 0 95 3 1 JA=10,CL=1,CA=1 1 1 'TBCL' 0 25 34 0 110 8 1 JA=10,CL=1,CA=1 10 0.1 'TBCD' 0 0 30 0 11.5 4 1 JA=1,CL=1,CA=1 1 1 'TBCD' 0 34 37 0 6 8 1 JA=10,CL=1,CA=1 1 1 'TBCD' 0 25 34 0 -2 8 1 JA=100,CL=1,CA=1 100 0.01 'VEL' 0 0 9 0 0.2 8 1 NA=1 1 1 'VEL' 0 25 34 0 -0.1 8 1 NA=1 0 0 'GLO' 0 28 37 0 0.4 16 1 GW=1 0 0 'TTCL' 0 9 13 0 24 8 1 JA=512,CL=512,CA=512,TL=1,TA=1 1 1 'TTCL' 0 0 9 0 56 8 1 JA=32,CL=32,CA=32,TL=1,TA=1 1 1 'TTCD' 0 9 13 0 11 8 1 JA=512,CL=512,CA=512,TL=1,TA=1 1 1 'TTCD' 0 0 9 0 -2 8 1 JA=32,CL=32,CA=32,TL=1,TA=1 100 0.01

Tvneck.G: 10 0 'TBCL' 0 0 30 0 95 3 1 JA=10,CL=1,CA=1 1 1 'TBCL' 0 25 34 0 110 8 1 JA=10,CL=1,CA=1 10 0.1 'TBCD' 0 0 30 0 11.5 4 1 JA=1,CL=1,CA=1 1 1 'TBCD' 0 34 37 0 6 8 1 JA=10,CL=1,CA=1 1 1 'TBCD' 0 25 34 0 -2 8 1 JA=100,CL=1,CA=1 100 0.01 'VEL' 0 0 9 0 0.2 8 1 NA=1 1 1 'VEL' 0 25 34 0 -0.1 8 1 NA=1 0 0 'GLO' 0 28 37 0 0.4 16 1 GW=1 0 0 'TTCL' 0 9 13 0 24 8 1 JA=512,CL=512,CA=512,TL=1,TA=1 1 1 'TTCL' 0 0 9 0 56 8 1 JA=32,CL=32,CA=32,TL=1,TA=1 1 1 'TTCD' 0 9 13 0 11 8 1 JA=512,CL=512,CA=512,TL=1,TA=1 1 1 'TTCD' 0 0 9 0 -2 8 1 JA=32,CL=32,CA=32,TL=1,TA=1 100 0.01 Startframe Endframe (und damit Zeitangabe)

Tvneck.G: 10 0 'TBCL' 0 0 30 0 95 3 1 JA=10,CL=1,CA=1 1 1 'TBCL' 0 25 34 0 110 8 1 JA=10,CL=1,CA=1 10 0.1 'TBCD' 0 0 30 0 11.5 4 1 JA=1,CL=1,CA=1 1 1 'TBCD' 0 34 37 0 6 8 1 JA=10,CL=1,CA=1 1 1 'TBCD' 0 25 34 0 -2 8 1 JA=100,CL=1,CA=1 100 0.01 'VEL' 0 0 9 0 0.2 8 1 NA=1 1 1 'VEL' 0 25 34 0 -0.1 8 1 NA=1 0 0 'GLO' 0 28 37 0 0.4 16 1 GW=1 0 0 'TTCL' 0 9 13 0 24 8 1 JA=512,CL=512,CA=512,TL=1,TA=1 1 1 'TTCL' 0 0 9 0 56 8 1 JA=32,CL=32,CA=32,TL=1,TA=1 1 1 'TTCD' 0 9 13 0 11 8 1 JA=512,CL=512,CA=512,TL=1,TA=1 1 1 'TTCD' 0 0 9 0 -2 8 1 JA=32,CL=32,CA=32,TL=1,TA=1 100 0.01 Zur Erinnerung: Hintergrund ist ein Masse-Feder-Modell Target (in mm), Abstand zum Artikulationsort Dämpfung (kann bei hohen Werten zu ‚undershoot‘ führen, d.h. das Ziel wird nicht erreicht) Steifigkeit (je höher, desto schneller kann die Bewegung sein)

Tvneck.G: 10 0 'TBCL' 0 0 30 0 95 3 1 JA=10,CL=1,CA=1 1 1 'TBCL' 0 25 34 0 110 8 1 JA=10,CL=1,CA=1 10 0.1 'TBCD' 0 0 30 0 11.5 4 1 JA=1,CL=1,CA=1 1 1 'TBCD' 0 34 37 0 6 8 1 JA=10,CL=1,CA=1 1 1 'TBCD' 0 25 34 0 -2 8 1 JA=100,CL=1,CA=1 100 0.01 'VEL' 0 0 9 0 0.2 8 1 NA=1 1 1 'VEL' 0 25 34 0 -0.1 8 1 NA=1 0 0 'GLO' 0 28 37 0 0.4 16 1 GW=1 0 0 'TTCL' 0 9 13 0 24 8 1 JA=512,CL=512,CA=512,TL=1,TA=1 1 1 'TTCL' 0 0 9 0 56 8 1 JA=32,CL=32,CA=32,TL=1,TA=1 1 1 'TTCD' 0 9 13 0 11 8 1 JA=512,CL=512,CA=512,TL=1,TA=1 1 1 'TTCD' 0 0 9 0 -2 8 1 JA=32,CL=32,CA=32,TL=1,TA=1 100 0.01 „Schwere“ des Artikulators

Tvneck.G: 10 0 'TBCL' 0 0 30 0 95 3 1 JA=10,CL=1,CA=1 1 1 'TBCL' 0 25 34 0 110 8 1 JA=10,CL=1,CA=1 10 0.1 'TBCD' 0 0 30 0 11.5 4 1 JA=1,CL=1,CA=1 1 1 'TBCD' 0 34 37 0 6 8 1 JA=10,CL=1,CA=1 1 1 'TBCD' 0 25 34 0 -2 8 1 JA=100,CL=1,CA=1 100 0.01 'VEL' 0 0 9 0 0.2 8 1 NA=1 1 1 'VEL' 0 25 34 0 -0.1 8 1 NA=1 0 0 'GLO' 0 28 37 0 0.4 16 1 GW=1 0 0 'TTCL' 0 9 13 0 24 8 1 JA=512,CL=512,CA=512,TL=1,TA=1 1 1 'TTCL' 0 0 9 0 56 8 1 JA=32,CL=32,CA=32,TL=1,TA=1 1 1 'TTCD' 0 9 13 0 11 8 1 JA=512,CL=512,CA=512,TL=1,TA=1 1 1 'TTCD' 0 0 9 0 -2 8 1 JA=32,CL=32,CA=32,TL=1,TA=1 100 0.01 Gewichtung bei Konflikt (= wenn der gleiche Artikulator in eine adjazente Andere Geste involviert ist)

Berechnetes Ansatzrohr zu einen Zeitpunkt t Gestenplanung Gestenrealisierung

über HLSyn = Querschnitts“flächen“ im Ansatzrohr (eigentlich nur 2D) Daraus können HLSyn-Parameter abgeleitet werden

Durch Trick (Schwa nach „neck“ (eigentlich nicht statthaft, da dadurch die Kopplungsrelationen beeinflusst werden)) Klingt eher wie /ənε/, weil die systeminterne Synthese vom Schwa (der Ausgangslage aller Artikulatoren) ausgeht und die Verschlusslösung abgeschnitten wurde (bug im gegenwärtigen System)

Auch in HLSyn muss aber von Hand nacheditiert werden, da immer noch der initiale Schwa da ist

Phonemreihenfolge umkehren: Ken statt neck

Ohne Schwa:

Zum direkten Vergleich nochmals „neck“

Vergleich „neck“ vs. „Ken“ Tvneck.G: 10 0 'TBCL' 0 0 30 0 95 3 1 JA=10,CL=1,CA=1 1 1 'TBCL' 0 25 34 0 110 8 1 JA=10,CL=1,CA=1 10 0.1 'TBCD' 0 0 30 0 11.5 4 1 JA=1,CL=1,CA=1 1 1 'TBCD' 0 34 37 0 6 8 1 JA=10,CL=1,CA=1 1 1 'TBCD' 0 25 34 0 -2 8 1 JA=100,CL=1,CA=1 100 0.01 'VEL' 0 0 9 0 0.2 8 1 NA=1 1 1 'VEL' 0 25 34 0 -0.1 8 1 NA=1 0 0 'GLO' 0 28 37 0 0.4 16 1 GW=1 0 0 'TTCL' 0 9 13 0 24 8 1 JA=512,CL=512,CA=512,TL=1,TA=1 1 1 'TTCL' 0 0 9 0 56 8 1 JA=32,CL=32,CA=32,TL=1,TA=1 1 1 'TTCD' 0 9 13 0 11 8 1 JA=512,CL=512,CA=512,TL=1,TA=1 1 1 'TTCD' 0 0 9 0 -2 8 1 JA=32,CL=32,CA=32,TL=1,TA=1 100 0.01 TVken.G 10 0 'TBCL' 0 0 9 0 110 8 1 JA=10,CL=1,CA=1 10 0.1 'TBCL' 0 0 30 0 95 3 1 JA=10,CL=1,CA=1 1 1 'TBCD' 0 9 13 0 6 8 1 JA=10,CL=1,CA=1 1 1 'TBCD' 0 0 9 0 -2 8 1 JA=100,CL=1,CA=1 100 0.01 'TBCD' 0 0 30 0 11.5 4 1 JA=1,CL=1,CA=1 1 1 'VEL' 0 0 9 0 -0.1 8 1 NA=1 0 0 'VEL' 0 19 31 0 0.2 8 1 NA=1 1 1 'GLO' 0 3 12 0 0.4 16 1 GW=1 0 0 'TTCL' 0 33 37 0 24 8 1 JA=512,CL=512,CA=512,TL=1,TA=1 1 1 'TTCL' 0 25 34 0 56 8 1 JA=32,CL=32,CA=32,TL=1,TA=1 1 1 'TTCD' 0 33 37 0 11 8 1 JA=512,CL=512,CA=512,TL=1,TA=1 1 1 'TTCD' 0 25 34 0 -2 8 1 JA=32,CL=32,CA=32,TL=1,TA=1 100 0.01

Vergleich „neck“ vs. „Ken“ Tvneck.G: 10 0 'TBCL' 0 0 30 0 95 3 1 JA=10,CL=1,CA=1 1 1 'TBCL' 0 25 34 0 110 8 1 JA=10,CL=1,CA=1 10 0.1 'TBCD' 0 0 30 0 11.5 4 1 JA=1,CL=1,CA=1 1 1 'TBCD' 0 34 37 0 6 8 1 JA=10,CL=1,CA=1 1 1 'TBCD' 0 25 34 0 -2 8 1 JA=100,CL=1,CA=1 100 0.01 'VEL' 0 0 9 0 0.2 8 1 NA=1 1 1 'VEL' 0 25 34 0 -0.1 8 1 NA=1 0 0 'GLO' 0 28 37 0 0.4 16 1 GW=1 0 0 'TTCL' 0 9 13 0 24 8 1 JA=512,CL=512,CA=512,TL=1,TA=1 1 1 'TTCL' 0 0 9 0 56 8 1 JA=32,CL=32,CA=32,TL=1,TA=1 1 1 'TTCD' 0 9 13 0 11 8 1 JA=512,CL=512,CA=512,TL=1,TA=1 1 1 'TTCD' 0 0 9 0 -2 8 1 JA=32,CL=32,CA=32,TL=1,TA=1 100 0.01 TVken.G 10 0 'TBCL' 0 0 9 0 110 8 1 JA=10,CL=1,CA=1 10 0.1 'TBCL' 0 0 30 0 95 3 1 JA=10,CL=1,CA=1 1 1 'TBCD' 0 9 13 0 6 8 1 JA=10,CL=1,CA=1 1 1 'TBCD' 0 0 9 0 -2 8 1 JA=100,CL=1,CA=1 100 0.01 'TBCD' 0 0 30 0 11.5 4 1 JA=1,CL=1,CA=1 1 1 'VEL' 0 0 9 0 -0.1 8 1 NA=1 0 0 'VEL' 0 19 31 0 0.2 8 1 NA=1 1 1 'GLO' 0 3 12 0 0.4 16 1 GW=1 0 0 'TTCL' 0 33 37 0 24 8 1 JA=512,CL=512,CA=512,TL=1,TA=1 1 1 'TTCL' 0 25 34 0 56 8 1 JA=32,CL=32,CA=32,TL=1,TA=1 1 1 'TTCD' 0 33 37 0 11 8 1 JA=512,CL=512,CA=512,TL=1,TA=1 1 1 'TTCD' 0 25 34 0 -2 8 1 JA=32,CL=32,CA=32,TL=1,TA=1 100 0.01 Trivialerweise unterscheiden sich die timing-Verhältnisse

Vergleich „neck“ vs. „Ken“ TVneck.G: 10 0 'TBCL' 0 0 30 0 95 3 1 JA=10,CL=1,CA=1 1 1 'TBCL' 0 25 34 0 110 8 1 JA=10,CL=1,CA=1 10 0.1 'TBCD' 0 0 30 0 11.5 4 1 JA=1,CL=1,CA=1 1 1 'TBCD' 0 34 37 0 6 8 1 JA=10,CL=1,CA=1 1 1 'TBCD' 0 25 34 0 -2 8 1 JA=100,CL=1,CA=1 100 0.01 'VEL' 0 0 9 0 0.2 8 1 NA=1 1 1 'VEL' 0 25 34 0 -0.1 8 1 NA=1 0 0 'GLO' 0 28 37 0 0.4 16 1 GW=1 0 0 'TTCL' 0 9 13 0 24 8 1 JA=512,CL=512,CA=512,TL=1,TA=1 1 1 'TTCL' 0 0 9 0 56 8 1 JA=32,CL=32,CA=32,TL=1,TA=1 1 1 'TTCD' 0 9 13 0 11 8 1 JA=512,CL=512,CA=512,TL=1,TA=1 1 1 'TTCD' 0 0 9 0 -2 8 1 JA=32,CL=32,CA=32,TL=1,TA=1 100 0.01 TVken.G 10 0 'TBCL' 0 0 9 0 110 8 1 JA=10,CL=1,CA=1 10 0.1 'TBCL' 0 0 30 0 95 3 1 JA=10,CL=1,CA=1 1 1 'TBCD' 0 9 13 0 6 8 1 JA=10,CL=1,CA=1 1 1 'TBCD' 0 0 9 0 -2 8 1 JA=100,CL=1,CA=1 100 0.01 'TBCD' 0 0 30 0 11.5 4 1 JA=1,CL=1,CA=1 1 1 'VEL' 0 0 9 0 -0.1 8 1 NA=1 0 0 'VEL' 0 19 31 0 0.2 8 1 NA=1 1 1 'GLO' 0 3 12 0 0.4 16 1 GW=1 0 0 'TTCL' 0 33 37 0 24 8 1 JA=512,CL=512,CA=512,TL=1,TA=1 1 1 'TTCL' 0 25 34 0 56 8 1 JA=32,CL=32,CA=32,TL=1,TA=1 1 1 'TTCD' 0 33 37 0 11 8 1 JA=512,CL=512,CA=512,TL=1,TA=1 1 1 'TTCD' 0 25 34 0 -2 8 1 JA=32,CL=32,CA=32,TL=1,TA=1 100 0.01 „verrutscht“ Anderes „Ziel“ Es ändern sich aber auch die Target-, Steifigkeits- und Dämpfungswerte, was auch, aber eben nicht nur, an den Timingunterschieden liegt

Manipulationen in TaDA ... können in den erwähnten Textdateien vorgenommen werden In der phonetischen Realisierung (.G-Dateien), z.B. die Änderung eines Konstriktionstargets Grundlegender: bereits im Gestenlexikon (muss sogar gemacht werden, wenn man nicht amerik. Englisch untersucht) Vielleicht am interessantesten: coupling.ph manipulieren (z.B. Lasse Bombiens Experiment zu /kl/ und /kn/ mit Kopplungsvariation  ab wann wird Verdeckung relevant)

Beispiel /kl/-/kn/-Experiment Bombien Wie Onset-Cluster-Gesten meistens (und konform mit Theorie), überlappen /k/- und /l/-Gesten bei /kl/ stark; in /kn/ weniger Überlappung! /kn/ also ‚schlechteres‘ Cluster (auch oft von Lautwandel betroffen, z.B. im Englischen, „knight“, „knee“ etc.)? Mögliche Gründe hierfür testen durch Variation der Gestenüberlappung vom /kn/-Wert zum /kl/-Wert  hauptsächlich: wird /kn/ bei /kl/-ähnlicher Überlappung überhaupt noch als Cluster wahrgenommen, oder wegen des Konflikts des velaren Verschlusses und der Velumsöffnung, der eine Plosivbildung unmöglich macht, als singleton-Onset /n/?

TaDA ist... Theoriegetrieben (Articulatory Phonology, u.a. Browman & Goldstein, 1992, Task Dynamics, u.a. Saltzman & Kelso, 1976) Dadurch ist es auch abhängig von den Theorien, d.h. es können eigentlich nur Hypothesen, die sich aus diesen Theorien ableiten lassen, getestet werden

TaDA ist... Sprachabhängig: auch articulatory phonology trifft natürlich nur Aussagen über Einzelsprachen; die Gestenpartituren sind somit sprachabhängig zu modellieren Beispiel: VOT-timingunterschiede zwischen Englisch und Spanisch sind schon im Gesten-Lexikon bzw. im Coupling-Lexikon vorgegeben Bedarf an Gesten- und couplinglexika für jede zu untersuchende Sprache (im Moment nur amerik. Englisch und mex. Spanisch implementiert; Manfred Pastätter erarbeitet zur Zeit eine standarddeutsche Version)

TaDA ist... Eigentlich nur zweidimensional, d.h. es gibt ähnlich Probleme z.B. bei der Erzeugung von /z/ und /l/ wie bei HLSyn (gemeinsames Merkmal: kleine Konstriktion)

Alternative: VocalTractLab (VTL, von P. Birkholz) Eher daten- statt theoriegetriebene artikulatorische Sprachsynthese Dient auch der Visualisierung der Mechanismen der Artikulation und deren Zusammenhang zur Akustik Erlaubt freie Beeinflussung auch der zeitlichen Kontrolle der Artikulatoren in einer Gestenpartitur

VTL „wirklich“ dreidimensional 22 Freiheitsgrade bzw. Kontrollparameter, die die Position und Form der Artikulatoren variierbar halten 3 verschiedene Modelle für die Stimmlippenschwingung (hat TaDA nicht) „klassisches“ Zwei-Massen-Modell von Ishizaka und Flanagan (1972), geometrisches Modell (Titze, 1989) Ein modifiziertes Zwei-Massen-Modell (Birkholz et al. 2011 a, b)

VTL Vokaltrakt modelliert nach echten Daten (Computertomographie) austauschbar durch Daten anderer Sprecher Artikulatorenbewegung entweder fei wählbar, oder auf Grundlage der Artikulationen des Modellsprechers, oder durch Übernahme artikulatorischer Daten (z.B. EMA-Daten) eines anderen Sprechers Original Resynthese der gleichen Artikulatorenbewegungen im Ansatzrohr des Modellsprechers