Präsentation herunterladen
Die Präsentation wird geladen. Bitte warten
Veröffentlicht von:Heino Gernand Geändert vor über 11 Jahren
1
1 Knowledge Discovery mit Wordnet und Alembic Workbench (Julia Faion) (Markus Reiter)
2
2 Wordnet Tool zur Unterstützung des Knowledge Discovery-Prozesses erweitertes Lexikon Informationen über Beziehungen zwischen Wörtern (z.B Hyponyme / Hypernyme)
3
3 Alembic Workbench Toolsammlung zur Wissensextraktion aus unbekannten Texten automatisches tagging der Texte mittels Process-Doc-Utility (z.B. house )
4
4 Yellowstone National Park the oldest, one of the largest, and probably the best-known national park in the United States. process-doc the oldest, one of the largest, and Yellowstone National Park
5
5 Ziel Zusammenführung von Wordnet und Alembic Workbench Assoziationsregeln aus Texten gewinnen
6
6 Idee Alembic extrahiert alle Nomen aus unbekannten Texten Wordnet filtert alle Tiere und Pflanzen heraus Assoziationsregeln (z.B Fleischfresser Pflanzenfresser)
7
7 Input- Texte AlembicWordnet annotierter Text TierePflanzen
8
8 Programmaufbau ausgabe.java Alembic.java WordnetAnalyse.java Textanalyse.javaHierarchie.java Sense-Analyse Hyponym-Suche
9
9 Textanalyse.java enthält Methode main() importiert die anderen Klassen
10
10 Alembic.java unbekannten Text mittels process-doc annotieren Tags unterscheiden zwischen Wortarten (Nomen, Verben,...) und Satzzeichen alle Nomen extrahieren –Plural in Singular umwandeln (Ansatz) –doppeltes Auftreten verhindern
11
11 WordnetAnalyse.java Aufruf von Wordnet Hypernyme eines Begriffs Hypernyme nach plant und animal durchsuchen Tiere und Pflanzen separat speichern Zähler für Anzahl der Tiere und Pflanzen
12
12 ausgabe.java erzeugt Dokument in XML-Format kombiniert jeweils zwei Tiere bzw. Pflanzen in allen Variationen
13
13 Beispiel cat dog
14
14 hierarchie.java extrahiert Hierarchien aus Wordnet verarbeitet alle Hyponyme von animal und plant erzeugt Datei der Form cat::animal dog::animal terrier::dog
15
15 Probleme Hyponym von Tier kann gleichzeitig auch Hyponym eines anderen Begriffs sein Lösung jedes Hyponym nach Hypernym plant bzw. animal überprüfen
16
16 allgemeine Probleme Alembic nicht vollständig lauffähig (Rule Learner, process-doc) Aufruf von Programmen aus Java heraus
17
17 Ergebnisse Test mit 20 Texten über Nationalparks automatisches Extrahieren der Nomen Stichprobe mit 7 Texten: Anzahl Tiere und Pflanzen : 34 davon korrekt erkannt : 32 falsch als Tier oder Pflanze interpretiert : 5
18
18 Gründe für Fehler ein aus mehrerern Wörtern bestehender Ausdruck wird von Alembic nicht erkannt –z.B. mountain lion keine Interpretation der Bedeutungen –orange coloured rocks
19
19 Ausblick XML-Dokument und Datei mit Informationen über die Hierarchien als Input für weiteres Analysetool verwenden, um Assoziationsregeln zu erhalten
Ähnliche Präsentationen
© 2025 SlidePlayer.org Inc.
All rights reserved.