© Karin Haenelt, Modellierung Menschlicher.Sprachen mit Regulären Ausdrücken, 10.11.2008 1 Modellierung menschlicher Sprachen mit Regulären Ausdrücken.

Slides:



Advertisements
Ähnliche Präsentationen
Algorithmentheorie 08 – Dynamische Programmierung (1)
Advertisements

Baumautomaten Christian Klein Betreuer : Tim Priesnitz
Christian Schindelhauer
8. Formale Sprachen und Grammatiken
Fortbildungsprogramm für höhere Bedienstete aus der Europäischen Union und höhere Ministerialbeamte aus neuen EU-Mitgliedsstaaten sowie für hohe Beamte.
Vorstellung von PaderWAVE Generierung von Web-Anwendungen aus visuellen Spezifikationen, SS04 Projektgruppe der AG Kastens.
FH-Hof Formale Sprachen - Maschinenmodelle Richard Göbel.
Formale Sprachen – Mächtigkeit von Maschinenmodellen
Automatentheorie „Berechnungsmodell für logische Sprachen“
Vorlesung Informatik 3 Einführung in die Theoretische Informatik (02 – Endliche Automaten) Prof. Dr. Th. Ottmann.
Vorlesung Informatik 3 Einführung in die Theoretische Informatik (05 – Reguläre Ausdrücke) Prof. Dr. Th. Ottmann.
Vorlesung Informatik 3 Einführung in die Theoretische Informatik (06 – Reduktion endlicher Automaten) Prof. Dr. Th. Ottmann.
Vorlesung Informatik 3 Einführung in die Theoretische Informatik (04 – Automaten mit ε-Transitionen) Prof. Dr. Th. Ottmann.
Grundkurs Theoretische Informatik, Folie 3.1 © 2004 G. Vossen,K.-U. Witt Grundkurs Theoretische Informatik Kapitel 3 Gottfried Vossen Kurt-Ulrich Witt.
Prolog Grundkurs WS 98/99 Christof Rumpf
Endliche Automaten Einführung in den Themenbereich
Reguläre Sprachen Karin Haenelt.
Endliche Automaten Akzeptoren
Transduktoren für die Sprachverarbeitung
Endliche Automaten in der Sprachverarbeitung Eine kleine Einführung
1 Endliche Automaten in der Sprachtechnologie Einführung Karin Haenelt
Formale Grundlagen der Faktenextraktion mit endlichen Automaten
Endliche Automaten Überführung regulärer Ausdrücke in endliche Automaten Karin Haenelt
Reguläre Ausdrücke Karin Haenelt
© Karin Haenelt 2006, Äquivalenzen Reg.Ausdrücke, Reg.Sprachen, EA ( ) 1 Reguläre Sprachen Karin Haenelt.
Informationsextraktion mit endlichen Automaten
1 Endliche Automaten in der Sprachtechnologie Kursthemen Karin Haenelt
Parsing regulärer Ausdrücke
© Karin Haenelt 2006, Operationen auf Akzeptoren und Transduktoren, ( ) 1 Operationen auf endlichen Akzeptoren und Transduktoren.
Erweiterte Fassung Karin Haenelt, IR-Evaluierung Evaluierung von Information Retrieval Systemen Kursfolien Karin Haenelt.
Endliche Automaten in der Sprachtechnologie
1 Komplexität menschlicher Sprachen Karin Haenelt
© Karin Haenelt 2005, Endliche Automaten: Alphabet, Zeichenreihe, Sprache, Endliche Automaten Grundlagen: Alphabet, Zeichenreihe, Sprache.
Mathematische Grundlagen
© Karin Haenelt, Transduktoren, Transduktoren für die Sprachverarbeitung Vereinigung von Transduktoren Karin Haenelt Karin Haenelt, Transduktoren,
Flaches Parsing mit endlichen Automaten Referat und Implementierung Jutta Jäger
Java – Werkzeuge zur Entwicklung endlicher Automaten
Sprachwissenschaftliches Institut Einführung in die HPSG Grammatiktheorie 4./11. Mai 2004.
Christian Schindelhauer
Christian Schindelhauer
Christian Schindelhauer
Matthias Spohrer · TU München 8. Präsenzveranstaltung – TU Stammgelände Innenstadt Nachqualifizierungskurs für Informatiklehrkräfte.
Ralf KüstersDagstuhl 2008/11/30 2 Ralf KüstersDagstuhl 2008/11/30 3.
Subject Pronouns I You (Iinformal) He She it We You all (informal pl)
Formale Sprachen Grundbegriffe für formale Sprachen
Überführung regulärer Ausdrücke in endliche Automaten Der Algorithmus von Glushkov und McNaughton/Yamada Karin Haenelt
DYNTEST –Control Systems -Probleme beim Auslesen-
Deutsche Verben.
Formale Sprachen Reguläre Sprachen Rudolf FREUND, Marian KOGLER.
Entwurf und Implementierung eines Scanner-Generatorsystems
Automaten, formale Sprachen und Berechenbarkeit II SoSe 2004 Prof. W. Brauer Teil 1: Wiederholung (Vor allem Folien von Priv.-Doz. Dr. Kindler vom WS 2001/02.
Das Übergangsverfahren für die auf die Grundschule aufbauenden Schularten.
Städtisches Gymnasium Beverungen Friedel Berlage
Dieser nicht Fehler finden Algorithmus enthält einfach einen gravierenden welcher zu ist.
Kolloquium „Bilingualer Unterricht“
21. November 2007 Autor: Alain Jeanneret / Rade Hajdin
Beispiele: KFG 2.Teil Beispiel 1: Sei G eine Grammatik mit den folgenden Regeln: S  Ac | Bd A  aAb | ab B  aBbb | abb Definieren Sie.
Ich bau nicht mit Ihr.. Ich bau mit Ihr. Ich bau nicht mit Ihr.
Christian Schindelhauer Wintersemester 2006/07 3. Vorlesung
Christian Schindelhauer Wintersemester 2006/07 2. Vorlesung
1 Albert-Ludwigs-Universität Freiburg Rechnernetze und Telematik Prof. Dr. Christian Schindelhauer Informatik III Christian Schindelhauer Wintersemester.
Der formelle Imperativ – the Imperative
Institut für Softwarewissenschaft – Universität WienP.Brezany 1 Beispiele (Frist: ) Beispiel 1: Sei  = {a, b} ein Alphabet und Q = {q 0, q 1 } eine.
7. Formale Sprachen und Grammatiken
Inhalt Einordnung und Funktion der lexikalische Analyse Grundlagen
Test 1 Test 2 Test 3. Test 4 Test 5 Test 6 Test 7 Test 8 Test 9.
13.Dezember 2006–1Elektronisches Publizieren: Schemasprachen — Relax NG Schemasprachen für XML — Relax NG — Anne Brüggemann-Klein TU München.
Gliederung 0. Motivation und Einordnung 1. Endliche Automaten
Die Farben Welche Farbe hat das?.
Test.
 Präsentation transkript:

© Karin Haenelt, Modellierung Menschlicher.Sprachen mit Regulären Ausdrücken, Modellierung menschlicher Sprachen mit Regulären Ausdrücken Kursfolien Karin Haenelt

© Karin Haenelt, Modellierung Menschlicher.Sprachen mit Regulären Ausdrücken, Modellierung mit regulären Ausdrücken Reguläre Ausdrücke als Spezifikationssprache für endliche Automaten Modellierungsfälle –reguläre Teilausdrücke (Morphologie, lokale Syntagmen) –Approximation mit regulären Ausdrücken 2

© Karin Haenelt, Modellierung Menschlicher.Sprachen mit Regulären Ausdrücken, Reguläre Ausdrücke, endliche Akzeptoren, reguläre Sprachen L(e)= { (dete,adje,nomn), (dete,nomn), (adje, nomn), (nomn) } L(A)= { (dete,adje,nomn), (dete,nomn), (adje, nomn), (nomn) } e = (dete,adje,nomn) | (dete,nomn) | (adje,nomn) | (nomn) e = (dete|ε) (adje|ε) nomn e = dete? adje? nomn beschreibenerkennen 0 dete 1 adje 2 nomn 3 adje A

© Karin Haenelt, Modellierung Menschlicher.Sprachen mit Regulären Ausdrücken, Ziel Entwicklung einer formalen Sprache, die der menschlichen Sprache möglichst gut entspricht, d.h. –weder übergenieriert –noch untergeneriert

© Karin Haenelt, Modellierung Menschlicher.Sprachen mit Regulären Ausdrücken, Morphologie - weitgehend regulär - Ausnahmen: ge-mach-t, um-zu-bau-en - Ergänzung endlicher Automaten

© Karin Haenelt, Modellierung Menschlicher.Sprachen mit Regulären Ausdrücken, lokale Syntagmen - regulär L(e)= { (dete,adje,nomn), (dete,nomn), (adje, nomn), (nomn) } L(A)= { (dete,adje,nomn), (dete,nomn), (adje, nomn), (nomn) } e = (dete,adje,nomn) | (dete,nomn) | (adje,nomn) | (nomn) e = (dete|ε) (adje|ε) nomn e = dete? adje? nomn beschreibenerkennen 0 dete 1 adje 2 nomn 3 adje A

© Karin Haenelt, Modellierung Menschlicher.Sprachen mit Regulären Ausdrücken, concatenations beyond regular languages centre embedding (S a S b) obligatorily paired correspondences either... or, if... then can be nested inside each other Zentrale Einbettung nicht regulär

© Karin Haenelt, Modellierung Menschlicher.Sprachen mit Regulären Ausdrücken, Approximierte Modellierung: Vorgehensweise: schrittweise Annäherung Aufzählung (bei endlichen Mengen): {Asche, Ascheregen, Aschewolken, Aschefontänen, Vulkanasche} regelhafte Beschreibung, 1. Ansatz [Aa]sche[^ ]* Zyklen –Test –Evaluierung Asche, Ascheregen, Aschewolken, Aschefontänen, rasche, Flasche, Vulkanasche, Aschring –Verfeinerung Erhöhung der Abdeckung:Minimierung der fehlenden Ausdrücke Erhöhung der Präzision:Minimierung der überflüssigen Ausdrücke

© Karin Haenelt, Modellierung Menschlicher.Sprachen mit Regulären Ausdrücken, Logische Einteilung der Datenbasis R R nicht-relevante nicht ausgeg. Zeichenreihen nicht-relevante ausgegebene Zeichenreihen relevante nicht ausgeg. Zeichenreihen relevante ausgegebene Zeichenreihen Flasche Aschewolke Aschring auch, Auto, und, ….

© Karin Haenelt, Modellierung Menschlicher.Sprachen mit Regulären Ausdrücken, Logische Einteilung der Datenbasis R R nicht-relevante nicht ausgeg. Zeichenreihen nicht-relevante ausgegebene Zeichenreihen relevante nicht ausgeg. Zeichenreihen relevante ausgegebene Zeichenreihen

© Karin Haenelt, Modellierung Menschlicher.Sprachen mit Regulären Ausdrücken, Standardmaße zur Evaluierung PrecisionGenauigkeit des Suchprozesses RecallVollständigkeit des Suchprozesses FalloutEffektivität des Suchprozesses

© Karin Haenelt, Modellierung Menschlicher.Sprachen mit Regulären Ausdrücken, Vielen Dank Für das Aufspüren von Fehlern in früheren Versionen und für Verbesserungsvorschläge danke ich Christine Neupert, Christian Roth Versionen: , , ,