am Beispiel “Goethe-Tour”

Slides:



Advertisements
Ähnliche Präsentationen
Wir sollten fordern, dass…
Advertisements

PG Intelligence Service
Heterogene Informationssysteme
Es schlug mein Herz. Geschwind zu Pferd! Ausgabe 1771
EconBiz – Ergebnisse der Umfrage zu Informationskompetenz und EconBiz und der GENICUS-Studie Tamara Pianos, Thorsten Meyer Hamburg, 11. September.
Basis-Architekturen für Web-Anwendungen
Inhaltlich orientierter Zugriff auf unstrukturierte Daten
Einführung in das Komplexpraktikum Rechnernetze Wintersemester 2009 Fakultät Informatik Institut für Systemarchitektur, Professur für Rechnernetze Dresden,
Konzeption und Realisierung eines Text- Analysesystems zur Automatisierung der Bewerberauswahl von diesem Datenformat jede beliebige Anwendung adaptieren.
Erschließen von semantischen Referenzen mit Ontology-Reasoning-Werkzeugen Das Ziel dieser Masterarbeit war die Erweiterung des ORBI Systems um ein Inferenz-System.
Navigieren / Suchen 12.Oktober Kann ein Browser das? 12.Oktober Bei findet man für das Wort browsehttp://dict.leo.org.
Sebastian Grahn Sebastian Kühn
Support.ebsco.com Lernprogramm zur erweiterten Suche und zu Feldern zur gelenkten Suche.
AWI externer WWW-Server interner WWW-Server Ausgangssituation www.
Intelligentes Crawling im WWW mit Hilfe intuitiver Suchbedingungen
Arbeitsgruppe Wissensmanagement
Grundbegriffe der Schulgeometrie
Entitäten Extraktion Einführung
SEO für Kleinbetriebe mit Google Places
JOHAN WOLFGANG von GOETHE
Entwurf und Realisierung einer digitalen Bibliothek zur Verwaltung von Notenhandschriften Dipl.-Ing. Temenushka Ignatova Datenbank- und Informationssysteme,
Johann Wolfgang von Goethe
Die Geschichte einer Priest. Lunaas Geschichte begann im Juni 2004 Als einer meiner ersten Charaktere, wuchs sie mir schnell ans Herz und hatte von.
Eine Klammer um alle für Berufs- und Studienorientierung
Präsentiert Informationen auf den Punkt gebracht.
Geschäfts- und Koordinierungsstelle LeiKaPlus / BFD
Gottfried Wilhelm Leibniz
Autor: Peter Pfeiffer Seite: Peter Pfeiffer Memeler Str Bad Oeynhausen Hilfe und Tipps Zu dem Eingabemodul und den Exceldateien Bitte.
Sie gehen gerne auf Reisen und besuchen gerne andere Städte? Wir tun das auch! Sie gehen gerne auf Reisen und besuchen gerne andere Städte? Wir tun das.
Die Tränen der Frauen.
Johann Wolfgang von Goethe von Christina Papakitsu-Jujopulu
Deutsche Literatur Friedrich Schiller, Johann Gottfried Herder und Johann Wolfgang Goethe waren die Schöpfer der Bewegung Sturm und Drang. Sie setzten.
Johann Wolfgang von Goethe
KIT – Universität des Landes Baden-Württemberg und nationales Forschungszentrum in der Helmholtz-Gemeinschaft Steinbuch Centre for Computing (SCC)
Paradigmenwechsel in der Unternehmensmodellierung Prof. Dr. Wolfgang Voigt Dipl.-Ing. Päd. Alexander Huwaldt UML Extrakt UML Seminar, Chemnitz
Autor: Peter Pfeiffer Seite: Peter Pfeiffer Memeler Str Bad Oeynhausen Datentransfer Zwischen dem Eingabemodul und den mitgelieferten.
Durch die Städte der BRD
PARTENARIAT ÉDUCATIF GRUNDTVIG PARTENARIAT ÉDUCATIF GRUNDTVIG REPERES KULTURELLER ZUSAMMENHALT UND AUSDEHNUNG DER IDEEN AUF EUROPÄISCHEM.
Die Berufung der Gemeinde Teil 1
DEUTSCHE SCHRIFTSTELLER
Johann Wolfang von Goethe
Trust and context using the RDF- Source related Storage System (RDF‑S3) and easy RQL (eRQL) Karsten Tolle und Fabian Wleklinski.
Johann Wolfgang Goethe
Johann Wolfgang von Goethe
Выполнила учитель МОУ "СОШ 25" Резник Т. И.. Mit dem Zug Mit dem Zug Mit dem Schiff Mit dem Schiff Mit dem Flugzeug Mit dem Flugzeug Mit dem Auto Mit.
Liebe KollegInnen, Anbei finden Sie eine PowerPoint-Vorlage zur Erarbeitung eines kurzen Zwischenberichts Ihrer Gruppe für das nächste Treffen. Bitte befüllen.
Willkommen zum Seminar
Работу выполнила ученица 10 класса Ширяева Наталья.
Johann Wolfgang von Goethe wurde in Frankfurt am Main geboren 28
Klassen und Klassenstruktur
Eike Schallehn, Martin Endig
Johann Wolfgang von Goethe
Der Sturm und Drang ► entsteht um 1770 innerhalb der Aufklärung
Albrecht Dürer wir entdecken einen deutschen Künstler.
Číslo projektuCZ.1.07/1.5.00/ Číslo materiáluVY_32_INOVACE_197 Název školyGymnázium, Tachov, Pionýrská 1370 AutorMgr. Jitka Klauberová PředmětNěmecký.
Gottes Freundschaft bewirkt Gehorsam!
Semantic Web.
KONTROLLFRAGEN zu „Des Lebens Überfluss“
Semantische Netze im Recht
die zu entscheiden hatten,
Dreamteam: Web 2.0 und der Katalog Anne Christensen und Thomas Hapke GBV-Verbundkonferenz
Johann Wolfgang von Goethe
Die Frauen im Schaffen von Johann Wolfgang Goethe
Die Geschichte vom Elefanten,der die Liebe erfuhr
Predigtreihe: Nebenrollen in der Apostelgeschichte Kaum bekannt und trotzdem nicht bedeutungslos.
Hervorragende Persönlichkeit
Wozu um alles in der Welt lebe ich überhaupt?
Inhalt Kap. 29: Defining Culture Kap. 30: Games as Cultural Rhetoric Kap. 31: Games as Open Culture.
Loučková, Hrabinová, Havránková, Čechák Johann Wolfgang von Goethe „Der Charakter ruht auf der Persönlichkeit, nicht auf den Talenten.“ J.W. Goethe.
Johann Wolfgang von Goethe (1749 – 1832)
 Präsentation transkript:

am Beispiel “Goethe-Tour” Wissenstechnologien am Beispiel “Goethe-Tour” Dr.-Ing. Katja Hose <hose@mpi-inf.mpg.de> Steffen Metzger <smetzger@mpi-inf.mpg.de> PD Dr.-Ing. Ralf Schenkel <schenkel@mpi-inf.mpg.de> Max-Planck-Institut für Informatik 1

Tourismus-Projekt „Goethe-Tour“ Use-Case unter Einbeziehung von Umwelt-Community und Text-Grid Ziel: Wirkungsstätten Goethes in Sachsen zu einer Reiseroute zusammenstellen Erste Teilaufgabe: alle relevanten Orte finden Später weitere Informationen über Orte sammeln

Aufwendige Suche Problematische Aspekte: Verschiedene Quellen mit verschiedenen Such-Interfaces Diverse Schreibweisen z.B. „Goethe“, „Johann Wolfgang von Goethe“ Eingrenzung der Suche schwierig zusätzliches Schlüsselwort „Aufenthalt“, „Reise“ ,… ? Relevante Ergebnisse könnten ausgeschlossen werden Dokumente müssen alle gelesen werden zur Extraktion des interessanten Wissens: Orte, an denen Goethe war Weitere Informationen zu den Orten, z.B. Befindet sich der Ort in Sachsen? Gibt es dort interessante Sehenswürdigkeiten? zum Abschluß einleiten: „WisNetGrid versucht diesen Aufwand mit verschiedenen Diensten zu minimieren“

Föderierte Suche: WisNetGrid als Vermittler Automatische Anfrageerweiterung: „Goethe“→ „Johann Wolfgang von Goethe“ ? Keywordsuche (z.B. „Goethe Dresden“) Metadatensuche (z.B. nach „Autor=Goethe“) ? ? ? ? Community Grids WisNetGrid ist Vermittler zwischen User und vielen verschiedenen Quellen (Grid-Communitys, Internet) mit heterogenen Interfaces Eine Anfrage an WisNetGrid – WisNetGrid leitet weiter an alle angebundenen Quellen und liefert Ergebnis Allgemeine globale Suche unter Anbindung existierender Suchmaschinen Alternative genauere Suche auf lokaler Community Suchmaschine sobald potentielle Ergebnisse auf einige Communitys eingegrenzt ? Öffentliche Daten WWW

Anbindung neuer Quellen Einheitliche Schnittstelle für Datenzugriff Siehe Vortrag zur Datenanbindung Kenntnis über lokale Metadatenschemata zur Umwandlung bei Metadatensuche z.B. Autor → owner; Erstellungsdatum → date 2 Möglichkeiten: Sicherstellung der Kompatibilität lokaler Suchkomponenten (in Kooperation mit Community) Installation von WisNetGrid bereit gestellter Komponenten → Einfache Anbindung Zur föderierten Suche müssen lokale Quellen angebunden werden (gegebenenfalls ein Interface implementiert werden) D.h. vorhandene Suchmaschinen müssen angesprochen werden oder falls nicht vorhanden muss lokal die WisNetGrid Suchmaschine installiert werden Metadatenschemata müssen uns bekannt sein, entsprechende AP1 Komponenten installiert werden Daten müssen angeschlossen werden über einheitliche Schnittstelle (übernächster Vortrag)

Manuelle Textanalyse → Querlesen! → Hervorherbung wichtiger Entitäten Durch die Suche erhaltene Daten müssen manuell verarbeitet werden → Zeit- und damit kostenintensiv Weite Teile des Textes für eigentliche Suche uninteressant Lässt sich manuelle Textanalyse beschleunigen? → Querlesen! Ist das Auffinden wichtiger Passagen automatisch unterstützbar? → Hervorherbung wichtiger Entitäten Kernproblem bei manueller Dokumentauswertung: wichtige Stellen finden, unsere Hilfe: Named Entity Recognition und highlighting (Slide kann raus, dann auf (5) überleiten "Aber immer noch großer manueller Aufwand beim Auswerten der erhaltenen Daten; Problem: wichtige Stellen finden")

Beispiel Entitätserkennung Im April 1770 setzte Goethe sein Studium in Straßburg fort. Diesmal widmete er sich zielstrebiger den juristischen Studien, fand aber auch Zeit, eine ganze Reihe persönlicher Bekanntschaften anzuknüpfen. Die wichtigste davon war die mit dem Theologen, Kunst- und Literaturtheoretiker Johann Gottfried Herder. Der Ältere öffnete ihm die Augen für die ursprüngliche Sprachgewalt von Autoren wie Homer, Shakespeare und Ossion sowie der Volkspoesie und gab so entscheidende Impulse für Goethes dichterische Entwicklung. Später sollte er auf Goethes Fürsprache hin in weimarische Dienste berufen werden. Auf einem Ausritt in die Umgebung lernte Goethe in Sesenheim die Pfarrerstochter Friederike Brion kennen und lieben. Bei seiner Abreise aus Straßburg beendete der bindungsscheue junge Goethe die Beziehung; die an Friederike gerichteten Gedichte, waren in ihrer Ausdruckskraft „der revolutionäre Beginn einer neuen lyrischen Epoche“. Highlighting von Goethe und Orten Oder auch Daten bzw. weitere Personen könnten von Interesse sein; viele weitere Möglichkeiten bestimmte Entitäten zu erkennen (basierend auf gegebener Ontologie) = Orte = Daten = Goethe = Personen

Redundanz und Heterogenität Goethe verließ Dresden… Bei einem Besuch in Dresden… Anschließend reiste Goethe nach Dresden …am 25. war Goethe wieder in Dresden… Goethe besuchte Dresden mehrmals… Allerdings viele Daten enthalten Redundante Infos, man findet x-mal das gleiche in verschiedener Form

„Goethe war_in Dresden“ Faktensuche Bei einem Besuch in Dresden… Goethe verließ Dresden… …am 25. war Goethe wieder in Dresden… Goethe besuchte Dresden mehrmals… Anschließend reiste Goethe nach Dresden Abstrakter Fakt: „Goethe war_in Dresden“ Suche nach abstrakten Fakten Was suchen wir eigentlich? -> Fakten eine Instanz dieses abstrakten Fakts mit X=Dresden ausreichend Im Grunde wollen wir solche Fakten mit verschiedenen Instanzen suchen

Suche auf Fakten Anfrage: „Goethe war_in X“ Ergebnisliste: … … Quelldokumente Ergebnisliste: 50 Dokumente „Goethe war_in Frankfurt“ 46 Dokumente „Goethe war_in Dresden“ „Goethe war_in Dresden“ 42 Dokumente „Goethe war_in Straßburg“ 1 Anfrage in abstrakter Form basierend auf bestimmten Relationen liefert alle entsprechenden Fakten Fakten abstrahieren durch Mustererkennung verschiedene Ausdrucksformen desselben Sachverhalts Weitergehende Infos zu einzelnen Fakten können aus Quelldokumenten manuelle gelesen werden … 22 Dokumente „Goethe war_in Sesenheim“ …

Wissensextraktion Fakt extrahieren Textmustererkennung „Goethe war_in Frankfurt“ Im April 1770 verließ Goethe Frankfurt, um dem Wunsch seines Vaters entsprechend sein Studium zu beenden. Hinzulernen Vor der Suche müssen wir die Fakten erst extrahieren Extraktion über Mustererkennung Muster müssen zuvor vorgegeben/erlernt werden (siehe später) Erwähnen: Abgleich mit bestehendem Wissen beim Einfügen Wissensverwaltung (Ontologie) Bekannte Muster verließ X Y Musterbedeutung erkennen „X war_in Y“

Wissensextraktion 1771 kehrte Goethe nach Frankfurt zurück, Bekannter Fakt 1771 kehrte Goethe nach Frankfurt zurück, um dort eine kleine Anwaltskanzlei zu eröffnen. „Goethe war_in Frankfurt“ Vor der Suche müssen wir die Fakten erst extrahieren Extraktion über Mustererkennung Muster müssen zuvor vorgegeben/erlernt werden (siehe später) Erwähnen: Abgleich mit bestehendem Wissen beim Einfügen Musterbedeutung ableiten Wissensverwaltung (Ontologie) kehrte X nach Y zurück Hinzulernen „X war_in Y“

Ontologien Ontologien sind eine Repräsentationsform von Wissen Unterteilung in Konzepte, Instanzen von Konzepten und Beziehungen zwischen diesen Modellierung als Tripel der Form (Goethe,war_in,Dresden) Person Stadt ist_Instanz_von ist_Instanz_von war_in Goethe Dresden 13

Ontologien Welche Ontologie? Woher Basiswissen nehmen? Stellt Mappings zur gemeinsamen Nutzung zur Verfügung Ontologievermittlung Historische Reiserouten- ontologie von Community 2 Landschafts- ontologie von Community 1 Basis-Ontologie (Musterverwaltung ...) Ontologiesuche Die „Ontologie“ kann völlig neu erstellt werden, sinnvollerweise kann jedoch schon existentes Vorwissen eingebaut werden: a) als Extraktionsinformationen wie Muster als Ontologie b) thematisches Vorwissen in Form von Ontologien Kombination mehrerer Ontologien durch Ontologievermittlung, indem Mappings gleicher Entitäten (mit manueller Hilfe) gefunden werden 2) Ontologien können manuell angepasst werden über Ontologieverwaltung – so könenn auch Mappings zwischen Ontologien angepasst werden 3) Um gezielt spezielle Ontologien zu finden gibt es zudem die Ontologiesuche Nur ein Beispielsetup; Extraktionsdaten (wie Muster) können auch fachspezifisch getrennt abgelegt werden. Ontologieverwaltung Erlaubt Verwaltung und Anpassung von Ontologien

Schlussfolgerungen Anfrage: „Goethe war_in Sachsen“? Antwort: ja Antwort: nein Ontologieschlussfolgerung „Goethe war_in Sachsen“ „Goethe war_in Dresden“ „Dresden gehört_zu Sachsen“ Ontologie

Community-spezifische Lösungen Sehr heterogene Daten in Communitys → Extraktionskomponenten modular und generisch → Anpassbarkeit über Parameter → Austausch einzelner Komponenten möglich → u.U. Vorverarbeitung von Daten sinnvoll Wiederverwendung von Anpassungen Ontologiesuche, um existente Ontologien mit Themenwissen einzubinden Dienstesuche siehe Vortrag zu Diensten Existierende Dienste suchen/verwalten/koppeln z.B. zur Vorverarbeitung der Daten Die Daten sind heterogen, d.h. Anpassungen müssen vorgenommen werden Es ist sinnvoll Anpassungen von anderen Communitys wiederzuverwenden Hier kommt die Ontologiesuche bzw. Dienstsuche ins Spiel

WisNetGrid-Dienste zur Wissenssuche Föderierte Suche über angebundenen Quellen Automatische semantische Anpassung bzw. Erweiterung von Suchanfragen Entitätenerkennung (Named-Entity-Recognition) Ontologieverwaltung und -suche sowie automatische Ontologieerweiterung Wissensextraktion, um in Daten enthaltenes Wissen abstrakt zusammengefasst in Ontologien abzulegen Suche auf den extrahierten Fakten Zusammenfassung was wir hier besprochen haben/zur Verfügung stellen