Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Transkription in der Sprachsythese und –erkennung SS 2004 Regelgesteuerte automatische Transkription auf der Basis von Expertenwissen Referent: Freshta.

Ähnliche Präsentationen


Präsentation zum Thema: "Transkription in der Sprachsythese und –erkennung SS 2004 Regelgesteuerte automatische Transkription auf der Basis von Expertenwissen Referent: Freshta."—  Präsentation transkript:

1 Transkription in der Sprachsythese und –erkennung SS 2004 Regelgesteuerte automatische Transkription auf der Basis von Expertenwissen Referent: Freshta Khairi

2 Gliederung 1. Einleitung 2. Allgemeines über P-Tra 3. Sprachelemente von P-Tra 4. Sonderzeichen 5. Klassen 6. Operatoren

3 Gliederung 7. Schreibweise 8. Regelapparat 9. Ausführung 10. Probleme 11. Praktische Anwendung

4 Einleitung - keine direkte Phonem – Graphem – Beziehung - Bestimmung des Lautes erst bei der Betrachtung der Umgebung -Entwicklung von Regelsystemen für verschiedene Sprachen -Diese sind meistens kontextsensitiv und basieren auf dem Ansatz von Chomsky und Halle (1968) E A / L_R Eine Symbolkette E (Graphem) geht in eine Symbolkette A (Phonem), wenn die linke Kontextbedingung L und die rechte Kontextbedingung R hinsichtlich E erfüllt sind.

5 Allgemeines über P-Tra -Programmiersprache zur phonetischen Transkription -Mit einer Erweiterung durch die Grundelemente der formalen Aussagenlogik -Strikte Trennung zwischen dem Regelapparat und dem Interpreter -Zur Formulierung von Regeln für eine computergestützte phonetisch – allophonische Transkription von Schrifttexten -P-Tra ist kontextsensitiv und somit Berücksichtigung von umgebenden Buchstaben und Allophonen

6 Sprachelemente von P-Tra -Wortanfang und Wortende stellen die Kontextgrenzen dar -Überprüfung von einem Graphem bzw. einer Graphemsequenz mit Hilfe von logischen Aussagen und die Erstellung einer Transkription -Abarbeitung von links nach rechts Buchstabe für Buchstabe -Eine Menge logischer Aussagen d.h eine Gruppe von Regeln -Filterungsprozess mit großem Einfluss der Hierarchie auf die Entscheidung

7 Sprachelemente von P-Tra Linke Seite der Regel: Suchstring, bestehend aus einem oder mehreren Graphemen, fakultative Kontextbedingung Rechte Seite der Regel: das resultierende Transkript -(A,O,U) CH & #, Ä,E,I = Ç linke Suchstringrechteresult. Kontextbed.KontextbedTranskript

8 Sprachelemente von P-Tra Jede logische Aussage beansprucht eine eigene Zeile mit Präkontext, Suchstring, Postkontext und Ergebnisstring. Präkontext: - linksseitige Kontextbedingung - graphematisch / allophonisch - graphematisch steht in (…) Beispiel: -(A, O, U) - allophonisch ([…]) oder (/…/) Beispiel: [l,, h, gr, tr] Suchstring: graphematisch Beispiel: CH

9 Sprachelemente von P-Tra Postkontext: - rechtsseitige Kontextbedingung - graphematisch - benötigt keine Klammern u.ä. Beispiel: #, Ä,E,I Ergebnisstring: - wird von einem Gleichheitszeichen (=) eingeleitet - allophonisch Beispiel: … = Ç

10 Sprachelemente von P-Tra Die logischen Aussagen bzw. die Regeln können zu einer Gruppe zusammengefasst werden. Erkannt wird diese Gruppe durch einen Punkt und das dazugehörige Graphem. Beispiel:.k Die letzt Regel einer Gruppe ist eine direkte Zuordnung Beispiel: Z= ts oder auch HOTEL = hotεl

11 Sonderzeichen Doppelkreuz (#): - Im Prä- oder Postkontext bedeutet Wortanfang oder Wortende - Am Ende des Suchstrings Markierung von Morphemen, insbesondere Präfixen Beispiel: # VIER & # = fi:r # AUS & -TRAL = aos# Dollerzeichen ($): - steht als Platzhalter (wildcard) für ein beliebiges Graphem im Prä- oder Postkontext Leerzeichen: - Zur besseren Gliederung können beliebig viele verwendet werden Sternsymbol (*): - folgende Zeile als Kommentar

12 Klassen Zusammenfassung der Einzelgrapheme bzw. –allophone zu einer Klasse Beispiel: eine Klasse der Vokale > eine Klasse von Konsonanten mit doppeltem Vorkommen Definiert wird eine Klasse durch ein (!). Beispiel: !K5 bdg ptk !K5 b,d,g, p, t, k

13 Operatoren -Disjunktion (logisches ODER) symbolisiert durch ein Komma (,) -*Beispiel: [r, b, f] Uß = u:s -Konjunktion (logisches UND) hat kein Symbol *Beispiel: E & (N,R,L) S = ə -Antivalenz (logisches EXKLUSIV – ODER) symbolisiert durch ein Semikolon (;) *Beispiel: G & = k

14 Operatoren -Negation (logisches NICHT) mit den Symbolen (@) und (-) -@ bei Graphem oder Allophon -(-) bei Graphem- oder Allophonstring bzw. nachfolgendem Klammer- oder Klassenausdruck * Beispiel: # ERZ & #, E @ U = e:rts Verschachtelung logisch äquivalenter Aussagen und Verknüpfung dieser (sowohl im Prä- als auch Postkontext) Beispiel: E & (, T) (E(N; R; S) #, U (M, N), (H, K) EI) = ə

15 Schreibweise Präkontext: Erlaubt ist hier sowohl Groß- als auch Kleinschreibung Wörter, deren Bedeutung davon abhängig sind, können durch eine geeignete Regel berücksichtigt werden. Beispiel: WEG = ve:k weg = vεk Suchstring: Sowohl Groß- als auch Kleinschreibung, wobei Großschreibung alle Arten von Eingabetexten und Kleinschreibung nur Kleingeschriebenes berücksichtigt Postkontext: Hier ist die Großschreibung obligatorisch

16 Ausführung Interpreterprogramm: - Übertragung der logischen Aussagen in die Maschinensprache des PC - sofortige Ausgabe des Transkriptionsergebnisses Trace – Modus - Darstellung untereinander - rechts neben jedem Allophonstring steht die Regel

17 Ausführung Beispiel: Demonstration de/#/ DE ( ), (STR, SKR, ST, SP, CH, FR, ) <V0) = de mM = m oO = o nN = n st/on, In, εn/ ST & #, IT, RU, RA, RÖ, AN, IG = st rR = r atsio:n ATION & #, EN, S = atsio:n

18 Regelapparat Ca. 1000 Einzelregeln Keine systematische Morphemanalyse Mit Ausnahme von Präfixen, da sichere Auffindung und wichtige Hilfsfunktion bei der Transkription nachfolgender Grapheme sowie Akzentuierung

19 Regelapparat Das Prinzip bei der Formulierung der Regeln: – Man sollte aus der Umgebung des Suchstrings soviel wie möglich berücksichtigen, aber möglichst wenig Kontext. – Optimierung von Allgemeingültigkeit der Regeln und verkürzte Arbeitszeit

20

21 Probleme Fremdwörter – Inwieweit dürfen diese sowie auch Eigennamen in den Regelapparat aufgenommen werden? Zusammengesetzte Wörter, da keine Morphemanalyse – Typische Fehlinterpretation bei Fugen- S Akzetuierung – Bisher nur da, wo die Auflistung des vollständigen Wortes oder eines geeigneten Wortteils dies erlaubt

22 Praktische Anwendung


Herunterladen ppt "Transkription in der Sprachsythese und –erkennung SS 2004 Regelgesteuerte automatische Transkription auf der Basis von Expertenwissen Referent: Freshta."

Ähnliche Präsentationen


Google-Anzeigen