Thema: Finite State Transducer (FST)

Slides:



Advertisements
Ähnliche Präsentationen
Algorithmen und Datenstrukturen (EI)
Advertisements

Transkription in der Sprachsythese und –erkennung SS 2004 Regelgesteuerte automatische Transkription auf der Basis von Expertenwissen Referent: Freshta.
Christian Schindelhauer
Statistische Aspekte der PSG
Constraint Satisfaction Problems
Prof. Dr. Holger Schlingloff
Suche in Texten (Stringsuche )
Seminar „Extrapolationsmethoden für zufällige Felder“
Christian Schindelhauer
Spielbäume Richard Göbel.
FH-Hof Grammatiken Richard Göbel. FH-Hof Begriffe Eine Grammatik definiert die Struktur (Syntax) einer Zeichenkette Eine Grammatik definiert nicht die.
Parser für CH3-Sprachen
Stoyan Mutafchiev Betreuer: Ilhan, Tim
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/4 Manuelle Verfahren Klassifizierung Hier werden Dokumente in ein fest vorgegebenes System.
Algorithmentheorie 04 –Hashing
Vorlesung Informatik 3 Einführung in die Theoretische Informatik (04 – Automaten mit ε-Transitionen) Prof. Dr. Th. Ottmann.
Vorlesung Informatik 3 Einführung in die Theoretische Informatik (03 – Nichtdeterminierte endliche Automaten) Prof. Dr. Th. Ottmann.
Genetische Algorithmen
Kapitel 5 Stetigkeit.
© Karin Haenelt 2006, Operationen auf Akzeptoren und Transduktoren, ( ) 1 Operationen auf endlichen Akzeptoren und Transduktoren.
Sprachwissenschaftliches Institut Einführung in die HPSG Grammatiktheorie 4./11. Mai 2004.
PKJ 2005/1 Stefan Dissmann Zusammenfassung Vorwoche Programm besteht aus mehreren Bestandteilen: Schlüsselwörter Sonderzeichen Bezeichner Kommentare Texte.
High Performance = Innovative Computer Systems + Efficient Algorithms Friedhelm Meyer auf der Heide 1 HEINZ NIXDORF INSTITUT Universität Paderborn Algorithmen.
Bit Commitment mit quadratischen Resten Vortrag von Josef Pozny
Christian Schindelhauer
Christian Schindelhauer
Christian Schindelhauer
Einführung in Berechenbarkeit, Formale Sprachen und Komplexitätstheorie Wintersemester 2005/ Vorlesung Dominic Dumrauf.
Christian Schindelhauer
Intelligentes Crawling im WWW mit Hilfe intuitiver Suchbedingungen
Theoretische Informatik 2
Themenfeld „Daten und Zufall“ – arithmetisches Mittel – Klassenstufe 5/6 Ariane Dubiel, Azida Shahabuddin, Sandra Mense.
Handlungsplanung und Allgemeines Spiel „Game Description Language (GDL)“ Peter Kissmann.
Vortrag über Graphen Von Jörg Hendricks.
Endliche Automaten Informatik JgSt. 13, Abitur 2009
Grenzen der Regularität
Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS
Effiziente Algorithmen
Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS
Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS
Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS
Effiziente Algorithmen
Beweissysteme Hartmut Klauck Universität Frankfurt WS 06/
Hartmut Klauck Universität Frankfurt WS 06/
Information und Kommunikation Hartmut Klauck Universität Frankfurt SS
Information und Kommunikation
Formale Sprachen Reguläre Sprachen Rudolf FREUND, Marian KOGLER.
Übung zu Einführung in die LDV I
Automaten, formale Sprachen und Berechenbarkeit II SoSe 2004 Prof. W. Brauer Teil 1: Wiederholung (Vor allem Folien von Priv.-Doz. Dr. Kindler vom WS 2001/02.
Beispiele: KFG 2.Teil Beispiel 1: Sei G eine Grammatik mit den folgenden Regeln: S  Ac | Bd A  aAb | ab B  aBbb | abb Definieren Sie.
Petrinetze 1. Einführung Informatik : wesentlich Modellierung von
1 Albert-Ludwigs-Universität Freiburg Rechnernetze und Telematik Prof. Dr. Christian Schindelhauer Informatik III Christian Schindelhauer Wintersemester.
Informatik III Christian Schindelhauer Wintersemester 2006/07
Christian Schindelhauer Wintersemester 2006/07 3. Vorlesung
1 Albert-Ludwigs-Universität Freiburg Rechnernetze und Telematik Prof. Dr. Christian Schindelhauer Informatik III Christian Schindelhauer Wintersemester.
Arne Vater Wintersemester 2006/ Vorlesung
Christian Schindelhauer Wintersemester 2006/07 2. Vorlesung
1 Albert-Ludwigs-Universität Freiburg Rechnernetze und Telematik Prof. Dr. Christian Schindelhauer Informatik III Christian Schindelhauer Wintersemester.
Softwareengineering Endliche Automaten
Analyse der Laufzeit von Algorithmen
Institut für Softwarewissenschaft – Universität WienP.Brezany 1 Beispiele (Frist: ) Beispiel 1: Sei  = {a, b} ein Alphabet und Q = {q 0, q 1 } eine.
7. Formale Sprachen und Grammatiken
Inhalt Einordnung und Funktion der lexikalische Analyse Grundlagen
Funktionale Unifikations-Grammatik (FUG)   Hauptmerkmale der FUG.
Funktionale Unifikations-Grammatik (FUG)  Hauptmerkmale der FUG.
Wann ist eine Funktion (über den natürlichen Zahlen) berechenbar?
Der A*-Algorithmus.
Programmiersprachen II Fortsetzung Datenstrukturen Balancierte Bäume 2 Prof. Dr. Reiner Güttler Fachbereich GIS HTW.
Laufzeitverhalten beim Sortieren
 Präsentation transkript:

Thema: Finite State Transducer (FST) Siamak Mehraghdam

Überblick Einführung: TTS-System TTS-System kann charakterisiert werden als Analyse-Prozess TTS-System ist modular aufgebaut  wir betrachten hier nur die Textanalysekomponente (TAC) TAC ist in einem einheitlichem Rahmen implementiert, der auf gewichtete endliche Automaten beruht (WFST)

Einschub: Was sind WFST´s ? WFST´s sind FTS´s mit Gewichtungen an den Pfaden Durch die Gewichtungen lassen sich linguistische Alternationen beschreiben und vorhersagen Gewichte werden aufgrund linguistischer Kenntnisse oder auch Intuition zugewiesen

Aufbau der linguistischen Textanalyekomponente Eingabetext wird in einem finite-state-akzeptor konvertiert Dann mit Hilfe von FST´s kompiliert  liefert alle möglichen legalen lexikalischen und morphologischen Analysen Disambiguierung der Alternativen erfolgt durch eine andere Komponente

Aufbau der linguistischen Textanalyekomponente (2) Diese Komponente filtert die wahrscheinlichste Analyse unter Berücksichtigung des wortübergreifenden Kontextes heraus Die beste Analyse wird dann mit phonolgischer Komponente kombiniert

Finite-state-transducer (FST) Einführung: Wie kommen wir auf FST´s ??? Stellen eine Annahme auf: Der einzige Weg um mit Morphemen Wörter zu bilden ist die Konkenation  naheliegendste Annahme: Vorangehendes Morphem entscheidet über nachfolgendes Morphem

Finite-state-transducer (FST) Einführung: (2) Beispiel: Betrachtung des Wortes „hospitalization“ Morphologische Struktur: Hospital + ize + ation Da Hospital = Substantiv  „ize“ darf folgen  wir haben ein Verb „ation“ macht aus einem Verb ein Substantiv ize + ation ist erlaubt  hospital ize ation ist erlaubt

Finite-state-transducer (FST) Einführung: (3) Realisierung mit Hilfe eine finite-state-machines Definition des FSM: Maschine M mit Sprache L M = ( Q, ,q1 , F) mit: Q = Anzahl der Zustände = endliches Alphabet der Morphem der Sprache L = Funktion Q x  Q: qi Q v L : qj Q mit (qi , ) = qj F = Menge der Endzustände q1 ist der Startwert

Finite-state-transducer (FST) Einführung: (4) Noun i -al -ize -ation 1 2 3 Adj i Dieses Bsp. ist ein winziges Fragment aus der Morphembildung des Englischen

Finite-state-transducer (FST) FST´s werden in Textanalyse jeglicher Art verwendet Unterschied FSM und FST: FSM akzeptiert Sprache aus einem endlichem Alphabet einzelner Symbole ( z.B. A={a, b, c}) FST akzeptiert hingegen Sprachen mit paarweisen Symbolen ( z.B. A= {a:a , b:b , c:c , a:Ø , Ø:c} )

Finite-state-transducer (FST) (2) Alphabet wird getrennt auf 2 „Bänder“ Linkes Symbol = 1.Band = oberes Band = „lexikal tape“ Rechtes Symbol = 2.Band = unteres Band = „surface tape“ z.B. bei (a:a) muss ein a vom 1.Band einem a vom 2.Band entsprechen Um alles besser zu verstehen betrachten wir ein Beispiel

FST Beispiel 1: Alphabet A={a:Ø , a:a , b:b} Regulärer Ausdruck: a:a* a:Ø b:b* R erlaubt z.B. : <aaabbb , aabbb> , <a , Ø> , <abb , bb> R verwirft z.B. : <aaabbb , aaabbb> , <a , a> , <bbb , bbb>

FST Beispiel 1: (2) a : a b : b a : Ø 1 2 Darstellung von FST´s oder FSM´s auch mit Hilfe von „state transition“ Tabellen möglich: a b State: Ø 1: 1 2 2:

FST Beispiel 2: Beispiel einer phonologischen Regel aus dem Sanskrit Dentales /n/ wird in ein retroflexes /ņ/ umgewandelt wenn: Irgendwo im Wort vorher ein retroflexer Konsonant /ş, r/ existiert. uşnataraanaam  uşņataraaņaam

FST Beispiel 2: (2) Ohne FST´s müsste die Regel sukzessive von links nach rechts angewendet werden Aber ein FST einmal angewendet auf dem ganzen String löst das Problem Der reguläre Ausdruck zu dieser Regel lautet: ( =:=* R:= [-cor]:=* -[+son]:= =:=*)*

FST Beispiel 2: (3) R bezeichnet die retroflexen Konsonanten /ş, r/ ( =:=* R:= [-cor]:=* -[+son]:= =:=*)* R bezeichnet die retroflexen Konsonanten /ş, r/ = bedeutet „irgendetwas“ Die state transition Tabelle sieht wie folgt aus: ş r t n [+son] = State: ņ 1: 2 1 2: 3 3:

FST Beispiel 2: (4) n:n n:ņ r:= ş:= t:= ş:= n:n =:= t:= [+son]:= n:n n:n n:ņ r:= ş:= t:= ş:= n:n =:= t:= [+son]:= n:n =:= [+son]:= r:= ş:= 1 2 t:= =:= [+son]:= r:= n:ņ 3 n:ņ

Mehrere FST´s Bis jetzt: Implementation einer einzigen phonologischen Regel mit FST Um weitere phonologische Regel zu implementieren muss man die FST´s hintereinanderschalten Stellen wir uns vor: Sanskrit hat die Regel:

Mehrere FST´s (2) Stellen wir uns vor: Sanskrit hat die Regel: Intervocalisches /r/ muss in ein nonretroflexes /l/ umgewandelt werden Jetzt bauen wir ein FST, der dies erfüllt r V = State: l 1: 2 1 2: 3 3:

Mehrere FST´s (3) Nun kann man auf dem 1.Band des 1.FST „uşnataraanaam“ laufen lassen Auf dem 2.Band des 1.FST erhält man dann „uşņataraaņaam” Den String vom 2.Band des 1.FST lässt man jetzt auf dem 1.Band des 2.FST laufen Und auf dem 2.Band des 2.FST hat man jetzt „uşņatalaaņaam”

Mehrere FST´s (4) Allgemein: n Regel mit n FST´s + (n+1) Bänder implemetierbar wobei: n-1 Bänder sind Zwischenbänder Bei n FST´s können die n-1 Zwischenbänder exponentiell steigen !!!

Parallele FST´s Aus diesem Grund ist es besser die FST´s parallel laufen zu lassen. d.h. Jedes FST sieht die gleichen 2 Bänder Die Ergebnisse müssen dann mit einem entsprechendem Algorithmus durch Alignment zusammengeführt werden

Namensanalyse in TTS-Systemen Die korrekte Aussprache von Namen ist eine der größten Herausforderungen für ein TTS-System. Einige Probleme der Namensanalyse: Namen können sehr viele verschiedene etymologische Ursprünge haben Namen können ohne Anpassung an das neue phonologische System in eine Sprache einfliesen Es gibt eine sehr grosse Anzahl verschiedener Namen

Namensanalyse in TTS-Systemen (2) Strassennamen aus zusammengesetzte Wörter (Rheinstraße, Kennedyallee) Viele Namensaussprechungen wiedersprechen den jeweiligen phonologischen Mustern Fazit: Die große Anzahl an Namen mit einer eingeschränkten morphologischen Struktur sind ein grosses Problem

Namensanalyse in TTS-Systemen (3) Einige weitere Probleme: z.B Graphem <e> wird normalerweise auch [e:] ausgesrochen  Melanie, Stefan <chem>  Chemie , Chemnitz Korrekte Analyse von unbekannten orthographischen Strings muss durchgeführt werden

Namensanalyse in TTS-Systemen (4) Motivation für Bern Möbius: Entwicklung einer Namensanalyse und Aussprachekomponente für GerTTS mit Hilfe von WFST´s FST´s erlauben dynamische Kombination und Rekombination von lexikalischen und Morphologischen Substrings

Namensanalyse in TTS-Systemen (5) Trainingsmaterial D-Info 1995 Städtenamen: 3837 Städtenamen ( 15% aller Städte) Graphemstrings mit 3-7 Grapheme wurden aus den Städtenamen entnommen 295 nützliche Graphemstrings (bilden 2969 Städtenamen)

Namensanalyse in TTS-Systemen (6) Vornamen und Strassennamen wurden den 4 Städten Berlin, Hamburg, Köln und München entnommen Vornamen: Alle Vornamen deren Anzahl > 100 wurden genommen 10 beliebtesten Jungen und Mädchennamen neugeborener Kinder von 95/96 754 Vornamen insgesamt

Namensanalyse in TTS-Systemen (7) Strassennamen: Alle Strassennamen aus den 4 Städten Komponenten der Strassennamen wurden seperat gespeichert (Konrad-Adenauer-Platz) 3124 Strassennamenkomponenten Wir betrachten jetzt einen FST für Strassennamen

FST für Strassennamen Jede Strasse wird mit Hilfe von bestimmten lexikalischen Morpheme identifiziert z.B. Strasse, Weg, Platz, Gasse, Allee, ... Die vorher gesammelten Information werden in einer kombinierten Liste von 4173 Komponenten + „Identifier“ gespeichert

FST für Strassennamen (2) Silbenmodell / 10 Start # / 0 Wort aus DB / 0.2 # [Streetname] / 0 Root First End [+] / 0.1 Komponentenverbindung / 0.2 [+] / 0.5 Fuge

FST für Strassennamen (3) Beispiel an: „Dachsteinhohenheckenalleenplatz“ Silbenmodel / 10 d´ach / 0.2 st´ein / 0.2 h´ecke / 0.2 all´ee / 0.2 # / 0 # [Streetname] / 0 Start Root platz / 0 First End [+] / 0.1 n / 0.2 [+] / 0.5 Fuge

FST für Strassennamen (4) System wurde getestet Modul in GerTTS eingefügt Ausprache des GerTTS mit Namensanalysekomponente wurde mit GerTTS ohne Namensanalysekomponente getestet Trainingsmaterial und Testmaterial

FST für Strassennamen (5) Trainingsmaterial: Strassennamen wurden zufällig aus den 4 Städten entnommen Testmaterial: Strassennamen wurden aus Frankfurt und Dresden entnommen Trainingsdaten Testdaten New system correct && old system wrong 84.7 % 70 % New system wrong && old system correct 15.3 % 30 %