Comprehensive Information Base (CIB) – ein Prototyp zur semantischen Datenintegration Stefan Arts
Name der Präsentation, Comprehensive Information Base, Motivation - Anlagenplanung
Name der Präsentation, Comprehensive Information Base, Motivation - Anlagenplanung Kernanlage
Name der Präsentation, Comprehensive Information Base, Motivation - Anlagenplanung Kernanlage Mess- und Regelungstechnik
Name der Präsentation, Comprehensive Information Base, Motivation - Anlagenplanung Kernanlage Mess. + Reg. Sicherheit
Name der Präsentation, Comprehensive Information Base, Kernanlage Mess. + Reg. Sicherheit Rohre Motivation - Anlagenplanung
Name der Präsentation, Comprehensive Information Base, Motivation - Anlagenplanung Folgen von Inkonsistenzen Umbau Beschädigungen Unfälle
Name der Präsentation, Comprehensive Information Base, Motivation - Anlagenplanung Inkonsistenzen sind teuer Anlagenplanung Vielzahl von Datenquellen paralleler Arbeitsprozess weltweit verteilte Teams automatische Datenintegration notwendig Verschmelzen der Daten verschiedener Werkzeuge Aufzeigen von Inkonsistenzen im parallelen und verteilten Arbeitsprozess Integrieren beliebiger Datenquellen paralleles Arbeiten verteiltes Arbeiten Aufgabe:
Name der Präsentation, Comprehensive Information Base, Motivation - Anlagenplanung vorhandene Software integriert nur einige Datenquellen prinzipiell Abgleich beliebiger Planungsdaten notwendig semantische Technologie kann dies durch Abstraktion von der Syntaktik leisten erzwingt komplexe Softwarearchitektur (Berechnungsaufwand) „Comprehensive Information Base“ ist prototypische Implementierung dieses Ansatzes
Name der Präsentation, Comprehensive Information Base, Gliederung Motivation: Anlagenplanung Semantische Datenintegration Begriffe Vorgehensweise Aufbau einer Wissensbasis Auswertung der Wissensbasis Comprehensive Information Base Zusammenfassung und Ausblick
Name der Präsentation, Comprehensive Information Base, Semantische Datenintegration - Begriffe Ontologie („Seinszusammenhang“) Definition: „explizite formale Spezifikation einer Konzeptualisierung“ (Gruber, 1993) abstrakt, wiederverwendbar enthält Klassen, Regeln, Axiome verbunden mit Rohr1 d Rohr = 200 mm Kessel1 d Ventil = Wissensbasis: Ontologie angereichert mit Instanzen von Klassen Inferenz: Das Schließen auf implizit vorhandenes Wissen verbunden mit Rohr d Rohr Kessel d Ventil d Ventil = d Rohr 200 mm Inferenzmaschine
Name der Präsentation, Comprehensive Information Base, Semantische Datenintegration - Vorgehensweise Erstellung einer Wissenbasis mit allen zu integrierenden Daten Adaption einer geeigneten Ontologie mit Klassen der Anlagenplanung Import der Daten in eine Ontologiesprache Zuordnung der Instanzen in den Daten zu den abstrakten Klassen Auswerten der Wissensbasis Formulierung geeigneter Anfragen Sicherstellung der Inferenzierbarkeit der Anfragen graphische Auswertung der Ergebnisse für Anlagenplaner
Name der Präsentation, Comprehensive Information Base, Semantische Datenintegration – 1. Schritt XML P&ID Process Data Sheets Mappings Globale Ontology (OntoCAPE) Import A Quellontologie Import B Quellontologie Import C Quellontologie Import D Quellontologie Anfragen
Name der Präsentation, Comprehensive Information Base, Semantische Datenintegration – 2. Schritt Formulierung einer Konsistenzbedingung auf Ontologieebene – unabhängig von der Datenherkunft! in einer Ontologiesprache „Bei welcher Verbindung zwischen Kessel und Rohr stimmen die Durchmesser nicht überein?“ graphische Auswertung Anzeige der Inkonsistenzen Klassifizierung nach Priorität und Aufgabenbereich Behebung durch den Anlagenplaner
Name der Präsentation, Comprehensive Information Base, Semantische Datenintegration - Grafik
Name der Präsentation, Comprehensive Information Base, Gliederung Motivation: Anlagenplanung Semantische Datenintegration Comprehensive Information Base Laufzeitumgebung Verifikation der Idee Auslagerung der Wissensbasis Caching Zusammenfassung und Ausblick
Name der Präsentation, Comprehensive Information Base, CIB – verwendete Technologien CIB bietet drei Perspektiven zur Datenintegration nutzt Ontobroker, um Ergebnisse gespeicherter Anfragen zu bestimmen CIB (Comprehensive Information Base) OntoStudio® IDE „Eclipse“ Ontostudio® Inferenzmaschine Ontobroker Datenbank zur Aufnahme der Wissensbasis Perspektiven/Sichten zur Einsicht und Bearbeitung
Name der Präsentation, Comprehensive Information Base, CIB – Verifikation der Entwurfsidee sehr lange Rechenzeiten Integrieren beliebiger Datenquellen paralleles Arbeiten verteiltes Arbeiten Aufgabe:
Name der Präsentation, Comprehensive Information Base, CIB - Inferenzkosten Echtzeitfähigkeit darf nicht gefordert sein für produktiven Einsatz ist ein leistungsfähiger Server notwendig Lösung: Die Wissensbasis auf einen Server auslagern
Name der Präsentation, Comprehensive Information Base, CIB – Auslagerung der Wissensbasis Wissensbasis und Inferenzmaschine liegen auf einem Server Übertragung der Anfragen und Ergebnisse per Streaming
Name der Präsentation, Comprehensive Information Base, CIB – Auslagerung der Wissensbasis Voraussetzung: Online Konkurrenz der Benutzer um Rechenzeit Beobachtung: die Anzahl verschiedener Anfragen ist gering einige Anfragen werden von mehreren Benutzern ausgeführt Integrieren beliebiger Datenquellen paralleles Arbeiten verteiltes Arbeiten Aufgabe:
Name der Präsentation, Comprehensive Information Base, CIB – Caching der Ergebnisse zusätzliche Serverkomponente: Middleware Proxy-Server: steuert den Zugriff auf den Ontobroker-Server cacht die Ergebnisse => keine Anfrage wird mehr als einmal ausgeführt SOAP Streaming
Name der Präsentation, Comprehensive Information Base, CIB – Middleware: Eigenschaften Möglichkeiten Rechteverwaltung Vorausberechnung bei „Leerlauf“ (Scheduling) Voraussetzung: Online minimaler Berechnungsaufwand erhöhte Komplexität Herausforderungen Cache-Kohärenz Fehlermodell bei Netzwerkproblemen Integrieren beliebiger Datenquellen paralleles Arbeiten verteiltes Arbeiten Aufgabe:
Name der Präsentation, Comprehensive Information Base, Gliederung Motivation: Anlagenplanung Semantische Datenintegration Comprehensive Information Base Zusammenfassung und Ausblick
Name der Präsentation, Comprehensive Information Base, Zusammenfassung Grundproblem kann mit semantischem Ansatz gelöst werden. Mit der Comprehensive Information Base samt Middleware steht der Prototyp einer Software zur Verfügung. Hohe Berechnungskosten bedingen die komplexe Softwarearchitektur. Es fehlt noch die programmtechnische Umsetzung von Cache-Kohärenz und Fehlermodell. Ein Scheduling soll implementiert werden, aber auf eine Rechteverwaltung wird verzichtet. Diese Aufgaben sollen im Rahmen einer Bachelor-Arbeit umgesetzt werden.
Danke für Ihre Aufmerksamkeit. Für Fragen stehe ich zur Verfügung.