Ontologiebasierte Dokumentindizierung und -suche Oktober 2000 Jonny Newald.

Slides:



Advertisements
Ähnliche Präsentationen
Be.as WEB Technologie
Advertisements

Menüstruktur automatisch angepasste Menüstruktur auf der Internetseite = Neue Seite im Content – Management- System ergibt neuen.
Einer der Dienste im Internet
Datenbankdesign mit ACCESS.
Datenbanken Einführung.
Agenda DataAssist e.K. Probleme heutiger Ansätze der Netzwerkdokumentation Management der Netzwerkdokumentation Management von Rechnern Der NetDoc Server.
PADLR Submodul Modular Content Archives Ein Content Browser für Lehr- materialien aus der Elektrotechnik Dipl.-Ing. Mark Painter Institut für Nachrichtentechnik.
Inhaltlich orientierter Zugriff auf unstrukturierte Daten
Ontologien- Query 1 Teil2
Datenbankzugriff im WWW (Kommerzielle Systeme)
Projekt von Rechenzentrum und Universitätsbibliothek Erste Inhalte: Linguistik-Server Essen (LINSE), Semesterapparate Physik Ziel: Bereitstellung einer.
Konzeption und prototypische Implementierung eines zentralen Informationssystems für Systemmanagement Motivation Oft wird es schwierig, die benötigten.
Wissensmanagement mit semantischen Netzen – Analyse und Vergleich verschiedener Softwarelösungen Autor: Holger Wilhelm Referentin: Prof. Dr. Uta Störl.
Erschließen von semantischen Referenzen mit Ontology-Reasoning-Werkzeugen Das Ziel dieser Masterarbeit war die Erweiterung des ORBI Systems um ein Inferenz-System.
Intranet-Portal mit Microsoft SharePoint Portal Server
Microsoft Windows 2000 Terminal Services
HTML - Einführung Richard Göbel.
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/8 Thesauren In gewisser Weise bilden Thesauren (Singular Thesaurus, Plural auch Thesauri)
DOM (Document Object Model)
Navigieren / Suchen 12.Oktober Kann ein Browser das? 12.Oktober Bei findet man für das Wort browsehttp://dict.leo.org.
DNS – Domain Name System
Datenbankentwurf mit Hilfe des ER-Modells entwickeln
PKJ 2005/1 Stefan Dissmann Zusammenfassung Bisher im Kurs erarbeitete Konzepte(1): Umgang mit einfachen Datentypen Umgang mit Feldern Umgang mit Referenzen.
Rigi und Web2Rsf vorgestellt von Tobias Weigand. Inhalt Ziel von Web2Rsf und Rigi Vorstellung des Parsers Web2Rsf Vorstellung des Werkzeugs Rigi Analyse.
Access 2000 Datenbanken.
Datenbanken Einführung Merkmale dateiorientierte Datenverwaltung
Datenbankentwurfsprozess
Die Bank von morgen - eine neue Welt für IT und Kunden? 23. Oktober 2001.
Grundschutztools
FH-Hof HTML - Einführung Richard Göbel. FH-Hof Komponenten des World Wide Webs WWW Browser HyperText Transfer Protocol (HTTP) via Internet WWW Server.
Mobile Gebäudeservicesteuerung Optimierung des Datentransfers im
PHProjekt – eine open source Projektmanagementsoftware
Prof. Dr. Gerhard Schmidt pres. by H.-J. Steffens Software Engineering SS 2009Folie 1 Objektmodellierung Objekte und Klassen Ein Objekt ist ein Exemplar.
metacoon eLearning im Projekt E-Forum
Ganzheitliches Projekt-, Ressourcen- und Qualitätsmanagement 1 PQM Oberfläche Übersicht Auf den folgenden Seiten lernen Sie die Oberfläche von PQM kennen.
Entwurf und Realisierung einer digitalen Bibliothek zur Verwaltung von Notenhandschriften Dipl.-Ing. Temenushka Ignatova Datenbank- und Informationssysteme,
Formular- und Dokumentenarchivierung
Fotobuch: Case Study informare Consulting GmbH
SSV-Manager Internetpräsenz und Vereinsdatenbank für Stadtsportverbände.
Gliederung Einleitung eID-Infrastruktur und Komponenten
TWS/Graph HORIZONT Produkt-Präsentation Software für Rechenzentren
Präsentiert Informationen auf den Punkt gebracht.
INFORMATIONSSYSTEM ZUR STUDIERENDENVERWALTUNG OPUS-College.
Erzeugen von Karten, Layern und Legenden
Dipl.-Päd. Irene Tatzgern, MA
Allgemeines zu Datenbanken
HORIZONT 1 XINFO ® Das IT - Informationssystem PL/1 Scanner HORIZONT Software für Rechenzentren Garmischer Str. 8 D München Tel ++49(0)89 / 540.
NDK Enterprise Technologien Informationen Infrastruktur und Fallstudie Daniel Nydegger Studienleiter Enterprise System Entwicklung.
Replikation und Synchronisation
Vom Kontext zum Projekt V Carina Berning Sabrina Gursch Pierre Streicher Intelligente Dateisysteme.
7.3.1 Ein Modellierungsbeispiel (1|9)
Liske Informationsmanagementsysteme 2005 Informationen managen Strategisches Kalkül und technische Wirksamkeit.
ICT – Modul Dokumentenverwaltung
Whitepaper - Feb © mailways GmbH Menschen wollen von Menschen beraten werden. Mit Hilfe des Internet lassen sich kostenschonende Wege für jede Phase.
Dokumentenablage und -Flut im Griff - mit unternehmensweiten Suchmaschinen Fachvortrag auf der I+E Messe Freiburg ©Semantec 2007 Dokumentenablage.
Die Publikations- datenbank des AIT Karl Riedling.
Eike Schallehn, Martin Endig
Die Management-Tools von Z&H COACH beinhalten zentrale Hilfsmittel für ein Management-System. Sorgfältig angewendet führen diese Tools Ihr Unternehmen.
Stundenplanung Programm zur Stunden- und Zimmerplanung auf der Basis von Datenbanken und unter Berücksichtigung von Mehrfachnutzung im (lokalen) Netz (Internet.
Semantic Web.
Java-Kurs Übung Benutzeroberflächen und Graphik Frames (Fenster)
Datenbanken im Web 1.
Oracle Portal think fast. think simple. think smart. Dieter Lorenz, Christian Witt.
ARIS Web Publisher Schnelle und weltweite Informationsbereitstellung Additional Release.
Entwurf, Implementierung und Test eines Java – Web Services als Kommunikationsschnittstelle für Webapplikationen mit Funktionen.
Oracle IFS Die Brücke zwischen Content Management System und einer Produktpräsentation im Internet.
Comprehensive Information Base (CIB) – ein Prototyp zur semantischen Datenintegration Stefan Arts
Oracle Text bei sehr großen Datenmengen Referent Martin Augst Senior Project / Account Manager Semantec GmbH Benzstr.
1. Betreuer: Prof. Dr. Jörg Striegnitz 2. Betreuer: Dr. Martin Schindler Kontextsensitive Autocompletion für Klassendiagramme in der UML/P Florian Leppers.
Information Retrieval mit Oracle Text Erfahrungsbericht.
 Präsentation transkript:

Ontologiebasierte Dokumentindizierung und -suche Oktober 2000 Jonny Newald

Quelle: Forschungsgruppe WissensmanagementKaiserslautern Okt-2000Seite 2 Einführendes Beispiel: Information Retrieval Stellen Sie sich vor, Sie suchen im Internet Informationen über ein bestimmtes Thema. Suchmaschinen bieten Volltextsuche, Metadatensuche und eine hierarchische Kategorisierung. Dokumente über ein sehr spezielles Thema, wie z.B. „Fernsehen“, sind nur sehr schwer exakt auszumachen. Der Begriff „Fernsehen“ hat auch mehrere Bedeutungen und steht in einem gewissen Kontext. Meine ich „Fernsehgeräte“, das „Fernsehprogramm“ oder das Medium „Fernsehen“? Die Volltextsuche liefert zu viel, die Metadatensuche ist ungenau und nicht verläßlich, die Kategorisierung ist oft zu oberflächlich und semantisch nicht eindeutig. Die größte Dokumentenansammlang der Welt ist das Internet. Nicht nur im Internet stellt sich diese Problematik, auch in Unternehmen.

Quelle: Forschungsgruppe WissensmanagementKaiserslautern Okt-2000Seite 3 Ausgangsbasis Lotus Notes ist ein umfangreiches Dokumentenhaltungs- und Groupwaresystem unternehmensweit einsetzbar in das vorhandene Intranet integrierbar über WEB-Browser benutzbar. Die Grundlage jeglicher Dokumentation ist zum Beispiel Lotus Notes. Lotus Notes hält die gesamte Information in strukturierten Dokumenten, die sich in Dokumentendatenbanken befinden. Hohes Datenaufkommen bedingt das Problem der Wiederauffindbarkeit.

Quelle: Forschungsgruppe WissensmanagementKaiserslautern Okt-2000Seite 4 Ausgangsbasis (Fortsetzung) Das Produkt Knowledger ist eine spezialisierte Lotus Notes - Anwendung der Firma Knowledge Associates eine Reihe spezieller Datenbankschablonen, die der Haltung verschiedenster Arten von Wissensdokumenten dienen optimiert für die Benutzung über WEB-Browser. Knowledger bietet weitergehende Hilfsmittel. Knowledger´s Ansätze sind konventionell und einfach. Knowledger bietet Unterstützung bei der Bestimmung der Dokument-Metadaten und der Kategorie-Informationen.

Quelle: Forschungsgruppe WissensmanagementKaiserslautern Okt-2000Seite 5 Wissensmanagement unter Lotus Notes / Knowledger Knowledger ist ein einfaches Wissensmanagement-System. Eine effiziente inhaltsbezogene Suche bedarf ausgeklügelteren Ansätzen. Knowledger bietet verschiedene, thematisch getrennte Datenbanken Anwendergruppenorientierte Navigatoren (getrennt für Administratoren, Manager und normale Mitarbeiter) im Dokument abgelegte, frei editierbare Zusatzfelder zur inhaltlichen Kurzbeschreibung Lotus Notes bietet eine automatische Pflege der Standard-Metadaten gründsätzliche Möglichkeiten zur Definition spezifischer Ansichten auf Dokumentlisten (Views) eine Suchmöglichkeit über Volltextsuche (auch in File-Attachments)

Quelle: Forschungsgruppe WissensmanagementKaiserslautern Okt-2000Seite 6 Grundbefürfnisse effizienterer Lösungen Die Beschränkung auf ein kontrolliertes Vokabular beim Kategorisieren und Suchen vermeidet Inkonsistenzen und erhöht die Trefferquote. Eine Projektion des Dokumentinhalts in das Wissensmodell des Unternehmens läßt sich formalisieren und durch Computerverarbeitung unterstützen. Ansprechendere Benutzerschnittstellen fördern die Motivation der Mitarbeiter. Eine effiziente Recherche bedingt die Schaffung gewisser Voraussetzungen. Ein Lösungsansatz ist die Verwendung graphischer Wissensmodelle.

Quelle: Forschungsgruppe WissensmanagementKaiserslautern Okt-2000Seite 7 Einfache ontologische Modelle Eine abgegrenzte Wissensdomäne läßt sich formal und abstrakt durch eine Ontologie modellieren. Hierzu überlegt man sich relevante Konzepte und Begriffe, die eindeutig sind, und die man miteinander in Beziehung setzt. Die einfachsten Strukturen sind Hierarchien. In vielen Fällen genügt eine solche Struktur. Dokumente werden durch eine bestimmte Auswahl aus der Begriffsmenge indiziert und sind somit in das Wissensmodell des Unternehmens projiziert. Hierarchische Begriffsmodelle werden jedoch sehr schnell unübersichtlich. Streng hierarchische Begriffsmodelle bilden einfache graphische Ontologien.

Quelle: Forschungsgruppe WissensmanagementKaiserslautern Okt-2000Seite 8 Komplexe Begriffsmodelle Komplexe Modelle sind unter Umständen notwendig, ihre Unübersichtlichkeit kann jedoch gebrochen werden. Abhilfe bieten hypertextmäßig verschachtelte Teilmodelle. Ein solches Teilmodell wird dann nicht zusammen mit dem übergeordneten Modell dargestellt. Die Umsetzung des geschachtelten Modellansatzes erfordert neue Software. Zu komplexe Begriffshierarchien sollten in Teilmodelle unterteilt werden. Beispiel einer komplexen Ontologie ohne Schachtelung

Quelle: Forschungsgruppe WissensmanagementKaiserslautern Okt-2000Seite 9 Erforderliche Softwarekomponenten Eine Benutzerschnittstelle zur ontologiebasierten Indizierung und Suche bietet guten Bedienkomfort: das Index-Retrieval-Interface (IRI) Ein graphischer Editor für den komfortablen Entwurf der Ontologien: der Ontology Editor Beiden Komponenten arbeiten mit der selben zentral gehaltenen Ontologie. Zwei neue Softwarekomponenten unterstützen diese Verfahrensweise.

Quelle: Forschungsgruppe WissensmanagementKaiserslautern Okt-2000Seite 10 Das Index-Retrieval-Interface: Indizieren 1.Ein Lotus Notes - Dokument wird ganz normal im WEB- Browser präsentiert. 2.Nach Betätigung eines Buttons erfolgt die Indizierung über die graphische Selektion aus der durch einen JAVA-Frame dargestellten Ontologie. 3.Die Kategorisierungsinfor- mationen werden direkt in ein spezielles Feld übertragen. Das selbe Interface dient der Suche über die graphischen Modelle. Das IRI-Fenster, ein JAVA-Frame, kommuniziert im Indiziermodus mit dem Browser

Quelle: Forschungsgruppe WissensmanagementKaiserslautern Okt-2000Seite 11 Das Index-Retrieval-Interface: Suchen 1.Nach Selektion des Vater- konzepts für die graphischen Modelle im Suchapplet befindet sich das IRI im Suchmodus. 2.Jede einzelne Knoten-Selektion führt zu einer neuen Abfrage. 3.Das Abfrageergebnis wird sofort als Liste präsentiert, aus der einzelne Dokumente geöffnet werden können. Zu jeder Zeit existiert höchstens eine IRI-Instanz bzw. dessen JAVA-Frame. Im Suchmodus findet eine Kommunikation mit dem früheren Suchapplet statt

Quelle: Forschungsgruppe WissensmanagementKaiserslautern Okt-2000Seite 12 Merkmale des Index-Retrieval-Interface im Überblick reine Java-Komponente (in Knowledger eingebettet) komfortable Oberfläche durch Ver- wendung der JAVA-Klassenbibliothek SWING nahtloser Übergang zwischen Such- und Einstell-Anwendung: automatischer Moduswechsel einfache Navigation durch komplexe Ontologien mittels einer synchronisierten Baum- und Graph-Darstellung (1, 2) 11 22

Quelle: Forschungsgruppe WissensmanagementKaiserslautern Okt-2000Seite 13 Der Ontology Editor Der Editor erzeugt graphisch verschachtelte Teilmodelle, die über Linkbutton mitein- ander verbunden sind. Die Darstellung und Inter- aktion ist der des IRI iden- tisch. Er bietet die Möglichkeit der Definition beliebiger Quer- beziehungen und erklären- den Knotenkommentaren. Die Editor-Anwendung läßt sich auf jedem JAVA-fähigen Rechner starten. Der Entwurf der Modelle geschieht mittels des neuen Ontology Editors.

Quelle: Forschungsgruppe WissensmanagementKaiserslautern Okt-2000Seite 14 Der Ontologiefluß Eine im Editor erstellte Ontologie wird dem Knowledge Server übergeben, so daß er das Index-Retrieval-Interface mit den Modell- daten beliefern kann. Das Konzept der Knowledge Servers stammt aus dem KnowNet-Projekt. KnowNet-ProjektKnowNet-Projekt Das Konzept der Knowledge Servers stammt aus dem KnowNet-Projekt. KnowNet-ProjektKnowNet-Projekt Der Knowledge Server ist der zentrale Verwalter der Ontologiedaten.

Quelle: Forschungsgruppe WissensmanagementKaiserslautern Okt-2000Seite 15 Ausblick: Ontologiemodifikationen Im Editor umgesetzt ist bereits die Protokollierung der getätigten Änderungen. Nach der Speicherung einer geänderten Ontologie wird eine Änderungs- protokoll-Datei angelegt. Die Datei liefert einen Ansatzpunkt zur weiteren Verarbeitung, wie –automatische Unterrichtung der Autoren über die Ontologieänderungen –„intelligente“ Anpassung der Kategorisierungsinformationen der betroffenen Dokumente an die neue Situation Solche automatischen Reaktionen bedürfen weiterer konzeptioneller Überlegungen. Was passiert nach der Veränderung einer im Einsatz befindlichen Ontologie?

Quelle: Forschungsgruppe WissensmanagementKaiserslautern Okt-2000Seite 16 Ausblick: Beziehungssemantiken Beispiel: In einer IT-Beraterfirma existiert ein Teilmodell, das eine Beziehungsstruktur verschiedener Softwareprodukte bestimmt. Man könnte sich eine Beziehungsart „isIncompatible“ vorstellen, die beispielsweise zwischen dem Datenbankprodukt „Informix“ und der Betriebssystemgruppe „MS Windows“ definiert ist. Solche beliebige Beziehungen können im Editor zwar formal definiert werden, es fehlt jedoch noch eine entsprechende Verarbeitung einer zu definierenden Semantik der Beziehungen. So könnte eine Dokument-Abfrage, die aus der Selektion beider Produkte besteht, im Vorfeld abgewehrt werden mit dem Kommentar der Inkompatibilität. Die Einführung der Beziehungssemantiken ist für eine intelligente Suche unabdingbar. Beziehungen zwischen Begriffen haben natürlicherweise eine Bedeutung.

Quelle: Forschungsgruppe WissensmanagementKaiserslautern Okt-2000Seite 17 Essenz Umsetzung des Prinzips der hypertextmäßig verschachtelten Teilmodelle Vereinheitlichte Oberfläche in allen drei Anwendungen (Indizieren, Suchen, Editieren) generell vereinfachte Bedienung Einbettung der neuen Komponenten in das vorhandene Programmsystem von KnowNetKnowNet Die wesentlichen Aspekte dieser Arbeit zusammengefaßt...