© Karin Haenelt, Modellierung Menschlicher.Sprachen mit Regulären Ausdrücken, Modellierung menschlicher Sprachen mit Regulären Ausdrücken Kursfolien Karin Haenelt
© Karin Haenelt, Modellierung Menschlicher.Sprachen mit Regulären Ausdrücken, Modellierung mit regulären Ausdrücken Reguläre Ausdrücke als Spezifikationssprache für endliche Automaten Modellierungsfälle –reguläre Teilausdrücke (Morphologie, lokale Syntagmen) –Approximation mit regulären Ausdrücken 2
© Karin Haenelt, Modellierung Menschlicher.Sprachen mit Regulären Ausdrücken, Reguläre Ausdrücke, endliche Akzeptoren, reguläre Sprachen L(e)= { (dete,adje,nomn), (dete,nomn), (adje, nomn), (nomn) } L(A)= { (dete,adje,nomn), (dete,nomn), (adje, nomn), (nomn) } e = (dete,adje,nomn) | (dete,nomn) | (adje,nomn) | (nomn) e = (dete|ε) (adje|ε) nomn e = dete? adje? nomn beschreibenerkennen 0 dete 1 adje 2 nomn 3 adje A
© Karin Haenelt, Modellierung Menschlicher.Sprachen mit Regulären Ausdrücken, Ziel Entwicklung einer formalen Sprache, die der menschlichen Sprache möglichst gut entspricht, d.h. –weder übergenieriert –noch untergeneriert
© Karin Haenelt, Modellierung Menschlicher.Sprachen mit Regulären Ausdrücken, Morphologie - weitgehend regulär - Ausnahmen: ge-mach-t, um-zu-bau-en - Ergänzung endlicher Automaten
© Karin Haenelt, Modellierung Menschlicher.Sprachen mit Regulären Ausdrücken, lokale Syntagmen - regulär L(e)= { (dete,adje,nomn), (dete,nomn), (adje, nomn), (nomn) } L(A)= { (dete,adje,nomn), (dete,nomn), (adje, nomn), (nomn) } e = (dete,adje,nomn) | (dete,nomn) | (adje,nomn) | (nomn) e = (dete|ε) (adje|ε) nomn e = dete? adje? nomn beschreibenerkennen 0 dete 1 adje 2 nomn 3 adje A
© Karin Haenelt, Modellierung Menschlicher.Sprachen mit Regulären Ausdrücken, concatenations beyond regular languages centre embedding (S a S b) obligatorily paired correspondences either... or, if... then can be nested inside each other Zentrale Einbettung nicht regulär
© Karin Haenelt, Modellierung Menschlicher.Sprachen mit Regulären Ausdrücken, Approximierte Modellierung: Vorgehensweise: schrittweise Annäherung Aufzählung (bei endlichen Mengen): {Asche, Ascheregen, Aschewolken, Aschefontänen, Vulkanasche} regelhafte Beschreibung, 1. Ansatz [Aa]sche[^ ]* Zyklen –Test –Evaluierung Asche, Ascheregen, Aschewolken, Aschefontänen, rasche, Flasche, Vulkanasche, Aschring –Verfeinerung Erhöhung der Abdeckung:Minimierung der fehlenden Ausdrücke Erhöhung der Präzision:Minimierung der überflüssigen Ausdrücke
© Karin Haenelt, Modellierung Menschlicher.Sprachen mit Regulären Ausdrücken, Logische Einteilung der Datenbasis R R nicht-relevante nicht ausgeg. Zeichenreihen nicht-relevante ausgegebene Zeichenreihen relevante nicht ausgeg. Zeichenreihen relevante ausgegebene Zeichenreihen Flasche Aschewolke Aschring auch, Auto, und, ….
© Karin Haenelt, Modellierung Menschlicher.Sprachen mit Regulären Ausdrücken, Logische Einteilung der Datenbasis R R nicht-relevante nicht ausgeg. Zeichenreihen nicht-relevante ausgegebene Zeichenreihen relevante nicht ausgeg. Zeichenreihen relevante ausgegebene Zeichenreihen
© Karin Haenelt, Modellierung Menschlicher.Sprachen mit Regulären Ausdrücken, Standardmaße zur Evaluierung PrecisionGenauigkeit des Suchprozesses RecallVollständigkeit des Suchprozesses FalloutEffektivität des Suchprozesses
© Karin Haenelt, Modellierung Menschlicher.Sprachen mit Regulären Ausdrücken, Vielen Dank Für das Aufspüren von Fehlern in früheren Versionen und für Verbesserungsvorschläge danke ich Christine Neupert, Christian Roth Versionen: , , ,