Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

1 Knowledge Discovery mit Wordnet und Alembic Workbench (Julia Faion) (Markus Reiter)

Ähnliche Präsentationen


Präsentation zum Thema: "1 Knowledge Discovery mit Wordnet und Alembic Workbench (Julia Faion) (Markus Reiter)"—  Präsentation transkript:

1 1 Knowledge Discovery mit Wordnet und Alembic Workbench (Julia Faion) (Markus Reiter)

2 2 Wordnet Tool zur Unterstützung des Knowledge Discovery-Prozesses erweitertes Lexikon Informationen über Beziehungen zwischen Wörtern (z.B Hyponyme / Hypernyme)

3 3 Alembic Workbench Toolsammlung zur Wissensextraktion aus unbekannten Texten automatisches tagging der Texte mittels Process-Doc-Utility (z.B. house )

4 4 Yellowstone National Park the oldest, one of the largest, and probably the best-known national park in the United States. process-doc the oldest, one of the largest, and Yellowstone National Park

5 5 Ziel Zusammenführung von Wordnet und Alembic Workbench Assoziationsregeln aus Texten gewinnen

6 6 Idee Alembic extrahiert alle Nomen aus unbekannten Texten Wordnet filtert alle Tiere und Pflanzen heraus Assoziationsregeln (z.B Fleischfresser Pflanzenfresser)

7 7 Input- Texte AlembicWordnet annotierter Text TierePflanzen

8 8 Programmaufbau ausgabe.java Alembic.java WordnetAnalyse.java Textanalyse.javaHierarchie.java Sense-Analyse Hyponym-Suche

9 9 Textanalyse.java enthält Methode main() importiert die anderen Klassen

10 10 Alembic.java unbekannten Text mittels process-doc annotieren Tags unterscheiden zwischen Wortarten (Nomen, Verben,...) und Satzzeichen alle Nomen extrahieren –Plural in Singular umwandeln (Ansatz) –doppeltes Auftreten verhindern

11 11 WordnetAnalyse.java Aufruf von Wordnet Hypernyme eines Begriffs Hypernyme nach plant und animal durchsuchen Tiere und Pflanzen separat speichern Zähler für Anzahl der Tiere und Pflanzen

12 12 ausgabe.java erzeugt Dokument in XML-Format kombiniert jeweils zwei Tiere bzw. Pflanzen in allen Variationen

13 13 Beispiel cat dog

14 14 hierarchie.java extrahiert Hierarchien aus Wordnet verarbeitet alle Hyponyme von animal und plant erzeugt Datei der Form cat::animal dog::animal terrier::dog

15 15 Probleme Hyponym von Tier kann gleichzeitig auch Hyponym eines anderen Begriffs sein Lösung jedes Hyponym nach Hypernym plant bzw. animal überprüfen

16 16 allgemeine Probleme Alembic nicht vollständig lauffähig (Rule Learner, process-doc) Aufruf von Programmen aus Java heraus

17 17 Ergebnisse Test mit 20 Texten über Nationalparks automatisches Extrahieren der Nomen Stichprobe mit 7 Texten: Anzahl Tiere und Pflanzen : 34 davon korrekt erkannt : 32 falsch als Tier oder Pflanze interpretiert : 5

18 18 Gründe für Fehler ein aus mehrerern Wörtern bestehender Ausdruck wird von Alembic nicht erkannt –z.B. mountain lion keine Interpretation der Bedeutungen –orange coloured rocks

19 19 Ausblick XML-Dokument und Datei mit Informationen über die Hierarchien als Input für weiteres Analysetool verwenden, um Assoziationsregeln zu erhalten


Herunterladen ppt "1 Knowledge Discovery mit Wordnet und Alembic Workbench (Julia Faion) (Markus Reiter)"

Ähnliche Präsentationen


Google-Anzeigen