Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

am Beispiel “Goethe-Tour”

Ähnliche Präsentationen


Präsentation zum Thema: "am Beispiel “Goethe-Tour”"—  Präsentation transkript:

1 am Beispiel “Goethe-Tour”
Wissenstechnologien am Beispiel “Goethe-Tour” Dr.-Ing. Katja Hose Steffen Metzger PD Dr.-Ing. Ralf Schenkel Max-Planck-Institut für Informatik 1

2 Tourismus-Projekt „Goethe-Tour“
Use-Case unter Einbeziehung von Umwelt-Community und Text-Grid Ziel: Wirkungsstätten Goethes in Sachsen zu einer Reiseroute zusammenstellen Erste Teilaufgabe: alle relevanten Orte finden Später weitere Informationen über Orte sammeln

3 Aufwendige Suche Problematische Aspekte:
Verschiedene Quellen mit verschiedenen Such-Interfaces Diverse Schreibweisen z.B. „Goethe“, „Johann Wolfgang von Goethe“ Eingrenzung der Suche schwierig zusätzliches Schlüsselwort „Aufenthalt“, „Reise“ ,… ? Relevante Ergebnisse könnten ausgeschlossen werden Dokumente müssen alle gelesen werden zur Extraktion des interessanten Wissens: Orte, an denen Goethe war Weitere Informationen zu den Orten, z.B. Befindet sich der Ort in Sachsen? Gibt es dort interessante Sehenswürdigkeiten? zum Abschluß einleiten: „WisNetGrid versucht diesen Aufwand mit verschiedenen Diensten zu minimieren“

4 Föderierte Suche: WisNetGrid als Vermittler
Automatische Anfrageerweiterung: „Goethe“→ „Johann Wolfgang von Goethe“ ? Keywordsuche (z.B. „Goethe Dresden“) Metadatensuche (z.B. nach „Autor=Goethe“) ? ? ? ? Community Grids WisNetGrid ist Vermittler zwischen User und vielen verschiedenen Quellen (Grid-Communitys, Internet) mit heterogenen Interfaces Eine Anfrage an WisNetGrid – WisNetGrid leitet weiter an alle angebundenen Quellen und liefert Ergebnis Allgemeine globale Suche unter Anbindung existierender Suchmaschinen Alternative genauere Suche auf lokaler Community Suchmaschine sobald potentielle Ergebnisse auf einige Communitys eingegrenzt ? Öffentliche Daten WWW

5 Anbindung neuer Quellen
Einheitliche Schnittstelle für Datenzugriff Siehe Vortrag zur Datenanbindung Kenntnis über lokale Metadatenschemata zur Umwandlung bei Metadatensuche z.B. Autor → owner; Erstellungsdatum → date 2 Möglichkeiten: Sicherstellung der Kompatibilität lokaler Suchkomponenten (in Kooperation mit Community) Installation von WisNetGrid bereit gestellter Komponenten → Einfache Anbindung Zur föderierten Suche müssen lokale Quellen angebunden werden (gegebenenfalls ein Interface implementiert werden) D.h. vorhandene Suchmaschinen müssen angesprochen werden oder falls nicht vorhanden muss lokal die WisNetGrid Suchmaschine installiert werden Metadatenschemata müssen uns bekannt sein, entsprechende AP1 Komponenten installiert werden Daten müssen angeschlossen werden über einheitliche Schnittstelle (übernächster Vortrag)

6 Manuelle Textanalyse → Querlesen! → Hervorherbung wichtiger Entitäten
Durch die Suche erhaltene Daten müssen manuell verarbeitet werden → Zeit- und damit kostenintensiv Weite Teile des Textes für eigentliche Suche uninteressant Lässt sich manuelle Textanalyse beschleunigen? → Querlesen! Ist das Auffinden wichtiger Passagen automatisch unterstützbar? → Hervorherbung wichtiger Entitäten Kernproblem bei manueller Dokumentauswertung: wichtige Stellen finden, unsere Hilfe: Named Entity Recognition und highlighting (Slide kann raus, dann auf (5) überleiten "Aber immer noch großer manueller Aufwand beim Auswerten der erhaltenen Daten; Problem: wichtige Stellen finden")

7 Beispiel Entitätserkennung
Im April 1770 setzte Goethe sein Studium in Straßburg fort. Diesmal widmete er sich zielstrebiger den juristischen Studien, fand aber auch Zeit, eine ganze Reihe persönlicher Bekanntschaften anzuknüpfen. Die wichtigste davon war die mit dem Theologen, Kunst- und Literaturtheoretiker Johann Gottfried Herder. Der Ältere öffnete ihm die Augen für die ursprüngliche Sprachgewalt von Autoren wie Homer, Shakespeare und Ossion sowie der Volkspoesie und gab so entscheidende Impulse für Goethes dichterische Entwicklung. Später sollte er auf Goethes Fürsprache hin in weimarische Dienste berufen werden. Auf einem Ausritt in die Umgebung lernte Goethe in Sesenheim die Pfarrerstochter Friederike Brion kennen und lieben. Bei seiner Abreise aus Straßburg beendete der bindungsscheue junge Goethe die Beziehung; die an Friederike gerichteten Gedichte, waren in ihrer Ausdruckskraft „der revolutionäre Beginn einer neuen lyrischen Epoche“. Highlighting von Goethe und Orten Oder auch Daten bzw. weitere Personen könnten von Interesse sein; viele weitere Möglichkeiten bestimmte Entitäten zu erkennen (basierend auf gegebener Ontologie) = Orte = Daten = Goethe = Personen

8 Redundanz und Heterogenität
Goethe verließ Dresden… Bei einem Besuch in Dresden… Anschließend reiste Goethe nach Dresden …am 25. war Goethe wieder in Dresden… Goethe besuchte Dresden mehrmals… Allerdings viele Daten enthalten Redundante Infos, man findet x-mal das gleiche in verschiedener Form

9 „Goethe war_in Dresden“
Faktensuche Bei einem Besuch in Dresden… Goethe verließ Dresden… …am 25. war Goethe wieder in Dresden… Goethe besuchte Dresden mehrmals… Anschließend reiste Goethe nach Dresden Abstrakter Fakt: „Goethe war_in Dresden“ Suche nach abstrakten Fakten Was suchen wir eigentlich? -> Fakten eine Instanz dieses abstrakten Fakts mit X=Dresden ausreichend Im Grunde wollen wir solche Fakten mit verschiedenen Instanzen suchen

10 Suche auf Fakten Anfrage: „Goethe war_in X“ Ergebnisliste: … …
Quelldokumente Ergebnisliste: 50 Dokumente „Goethe war_in Frankfurt“ 46 Dokumente „Goethe war_in Dresden“ „Goethe war_in Dresden“ 42 Dokumente „Goethe war_in Straßburg“ 1 Anfrage in abstrakter Form basierend auf bestimmten Relationen liefert alle entsprechenden Fakten Fakten abstrahieren durch Mustererkennung verschiedene Ausdrucksformen desselben Sachverhalts Weitergehende Infos zu einzelnen Fakten können aus Quelldokumenten manuelle gelesen werden 22 Dokumente „Goethe war_in Sesenheim“

11 Wissensextraktion Fakt extrahieren Textmustererkennung
„Goethe war_in Frankfurt“ Im April 1770 verließ Goethe Frankfurt, um dem Wunsch seines Vaters entsprechend sein Studium zu beenden. Hinzulernen Vor der Suche müssen wir die Fakten erst extrahieren Extraktion über Mustererkennung Muster müssen zuvor vorgegeben/erlernt werden (siehe später) Erwähnen: Abgleich mit bestehendem Wissen beim Einfügen Wissensverwaltung (Ontologie) Bekannte Muster verließ X Y Musterbedeutung erkennen „X war_in Y“

12 Wissensextraktion 1771 kehrte Goethe nach Frankfurt zurück,
Bekannter Fakt 1771 kehrte Goethe nach Frankfurt zurück, um dort eine kleine Anwaltskanzlei zu eröffnen. „Goethe war_in Frankfurt“ Vor der Suche müssen wir die Fakten erst extrahieren Extraktion über Mustererkennung Muster müssen zuvor vorgegeben/erlernt werden (siehe später) Erwähnen: Abgleich mit bestehendem Wissen beim Einfügen Musterbedeutung ableiten Wissensverwaltung (Ontologie) kehrte X nach Y zurück Hinzulernen „X war_in Y“

13 Ontologien Ontologien sind eine Repräsentationsform von Wissen
Unterteilung in Konzepte, Instanzen von Konzepten und Beziehungen zwischen diesen Modellierung als Tripel der Form (Goethe,war_in,Dresden) Person Stadt ist_Instanz_von ist_Instanz_von war_in Goethe Dresden 13

14 Ontologien Welche Ontologie? Woher Basiswissen nehmen?
Stellt Mappings zur gemeinsamen Nutzung zur Verfügung Ontologievermittlung Historische Reiserouten- ontologie von Community 2 Landschafts- ontologie von Community 1 Basis-Ontologie (Musterverwaltung ...) Ontologiesuche Die „Ontologie“ kann völlig neu erstellt werden, sinnvollerweise kann jedoch schon existentes Vorwissen eingebaut werden: a) als Extraktionsinformationen wie Muster als Ontologie b) thematisches Vorwissen in Form von Ontologien Kombination mehrerer Ontologien durch Ontologievermittlung, indem Mappings gleicher Entitäten (mit manueller Hilfe) gefunden werden 2) Ontologien können manuell angepasst werden über Ontologieverwaltung – so könenn auch Mappings zwischen Ontologien angepasst werden 3) Um gezielt spezielle Ontologien zu finden gibt es zudem die Ontologiesuche Nur ein Beispielsetup; Extraktionsdaten (wie Muster) können auch fachspezifisch getrennt abgelegt werden. Ontologieverwaltung Erlaubt Verwaltung und Anpassung von Ontologien

15 Schlussfolgerungen Anfrage: „Goethe war_in Sachsen“? Antwort: ja
Antwort: nein Ontologieschlussfolgerung „Goethe war_in Sachsen“ „Goethe war_in Dresden“ „Dresden gehört_zu Sachsen“ Ontologie

16 Community-spezifische Lösungen
Sehr heterogene Daten in Communitys → Extraktionskomponenten modular und generisch → Anpassbarkeit über Parameter → Austausch einzelner Komponenten möglich → u.U. Vorverarbeitung von Daten sinnvoll Wiederverwendung von Anpassungen Ontologiesuche, um existente Ontologien mit Themenwissen einzubinden Dienstesuche siehe Vortrag zu Diensten Existierende Dienste suchen/verwalten/koppeln z.B. zur Vorverarbeitung der Daten Die Daten sind heterogen, d.h. Anpassungen müssen vorgenommen werden Es ist sinnvoll Anpassungen von anderen Communitys wiederzuverwenden Hier kommt die Ontologiesuche bzw. Dienstsuche ins Spiel

17 WisNetGrid-Dienste zur Wissenssuche
Föderierte Suche über angebundenen Quellen Automatische semantische Anpassung bzw. Erweiterung von Suchanfragen Entitätenerkennung (Named-Entity-Recognition) Ontologieverwaltung und -suche sowie automatische Ontologieerweiterung Wissensextraktion, um in Daten enthaltenes Wissen abstrakt zusammengefasst in Ontologien abzulegen Suche auf den extrahierten Fakten Zusammenfassung was wir hier besprochen haben/zur Verfügung stellen


Herunterladen ppt "am Beispiel “Goethe-Tour”"

Ähnliche Präsentationen


Google-Anzeigen