„Abfrage heterogener Ressourcen durch Mediatoren“ Präsentation Lennart Reuther T-Systems MMS GmbH 15.März 2007
Abfrage heterogener Ressourcen durch Mediatoren Überblick Mediator Schichten der Datenintegration Datenschicht Ontologieschicht Inhaltsschicht Vorteile Anwendungsgebiete „Abfrage heterogener Ressourcen durch Mediatoren“ Präsentation Lennart Reuther T-Systems MMS GmbH 15.März 2007 19-10-17 Abfrage heterogener Resourcen durch Mediatoren 2
Datenbank / Internet abgrenzung deklarative Datenbanksprachen (Bsp.: SQL) erlauben gezielte Suche nach Information und liefern eine gefilterte Teilmenge des zugrundeliegenden Informationsbestandes. Webseiten Foren Präsentationsseiten Wissensbasen RSS-Feeds Podcast Live-Bookmarks SMIL-Präsentationen stellen Sichten auf die verteilten Datenquellen des WWW dar select owner from estateAgent where city=“Berlin“ and condition = „very good“; select * from events where date=now() and city=“dresden“ and style=“jazz“; select * from prescription where patient=“Th. Unglaub“ and medicine=“stimulant„ and date >= date_sub( now(), 14 days); 19-10-17 Abfrage heterogener Resourcen durch Mediatoren
Abfrage heterogener Resourcen durch Mediatoren förderatives DBMS mehrere lokale Datenhaltungssysteme durch homogene Software-Schicht vereint erlaubt integrierte, einheitliche Verwendung der verschiedenen heterogenen Datenbestände GUI 19-10-17 Abfrage heterogener Resourcen durch Mediatoren
Abfrage heterogener Resourcen durch Mediatoren mehrere Informationsquellen durch virtuelle Integration zusammengefasst GUI 19-10-17 Abfrage heterogener Resourcen durch Mediatoren
Abfrage heterogener Resourcen durch Mediatoren GUI 19-10-17 Abfrage heterogener Resourcen durch Mediatoren
Abfrage heterogener Resourcen durch Mediatoren GUI Anfrage Teilanfragen nimmt Anfragen entgegen, kommuniziert mit den untereinander heterogenen Quellen fasst deren Ergebnisse zusammen beantwortet die gestellte Anfrage Komposition Teilergebnisse 19-10-17 Abfrage heterogener Resourcen durch Mediatoren
DatenintegrationSchichtenmodell Inhaltsschicht Ontologieschicht Domänen- wissen Datenschicht Angleichen der Ergebnisse aus verschiedenen Quellen in struktureller Weise Vereinheitlichen der Wortwahl/Begriffsbedeutung konzeptionell inhaltlicher Vergleich des gewonnenen Wissen der voneinander unabhängigen Quellen 19-10-17 Abfrage heterogener Resourcen durch Mediatoren
Abfrage heterogener Resourcen durch Mediatoren Datenschicht Angleichen der Ergebnisse aus verschiedenen Quellen in struktureller Weise lokales Komponentenschema in integriertes Schema umwandeln relevante Daten erfassen redundante Bestandteile vernachlässigen 19-10-17 Abfrage heterogener Resourcen durch Mediatoren
Abfrage heterogener Resourcen durch Mediatoren Datenschicht Umsetzung: XSLT, XQuery für XML-Formate SPARQL für RDF Ansatz LMU München: Xcerpt 19-10-17 Abfrage heterogener Resourcen durch Mediatoren
DatenschichtMediator GUI Anfrage Teilanfragen Komposition Teilergebnisse 19-10-17 Abfrage heterogener Resourcen durch Mediatoren
DatenschichtMediator Teilanfragen Anfrage Dekomposition und Transformation in Teilanfragen GUI Integriertes Komponenten-schema Wrapper für lokales Komponenten-schema Komposition transformierte Teilergebnisse Teilergebnisse 19-10-17 Abfrage heterogener Resourcen durch Mediatoren
DatenintegrationSchichtenmodell Inhaltsschicht Ontologieschicht Domänen- wissen Datenschicht Vereinheitlichen der Wortwahl/Begriffsbedeutung konzeptionell 19-10-17 Abfrage heterogener Resourcen durch Mediatoren
Abfrage heterogener Resourcen durch Mediatoren Ontologieschicht konzeptionelles Vereinheitlichen Wortwahl/Begriffsbedeutung Ober-/Unterbegriffe Term beschreibt unterschiedliche Konzepte (Blume) Verneinung abweichende Modellierungsparadigmen, -konventionen abweichende Granularität verschiedene Abdeckung unterschiedliche Standpunkte abweichende Begriffstermini/ Relationsbezeichnungen ausgleichen 19-10-17 Abfrage heterogener Resourcen durch Mediatoren
Abfrage heterogener Resourcen durch Mediatoren Ontologieschicht Konzepte Instanzen technische Umsetzung RDF/RDF-S (Ressource Description Framework) OWL - Web Ontology Language Ontology-Alignment-Systeme 19-10-17 Abfrage heterogener Resourcen durch Mediatoren
OntologieschichtMediator Dekomposition und Transformation in Teilanfragen transformierte Teilergebnisse Anfrage Teilanfragen Komposition GUI 19-10-17 Abfrage heterogener Resourcen durch Mediatoren
OntologieschichtMediator Teilanfragen Anfrage Dekomposition und Transformation in Teilanfragen GUI Ontologie- Anpassung Konzept- wissen Komposition Teilergebnisse 19-10-17 Abfrage heterogener Resourcen durch Mediatoren
DatenintegrationSchichtenmodell Inhaltsschicht Ontologieschicht Domänen- wissen Datenschicht inhaltlicher Vergleich des gewonnenen Wissen der voneinander unabhängigen Quellen 19-10-17 Abfrage heterogener Resourcen durch Mediatoren
Abfrage heterogener Resourcen durch Mediatoren Inhaltsschicht vergleicht gewonnenes Wissen inhaltlich typographische Anpassung Standardisierung Datenaufnahme-Fehler Wortvertauschungen (Swapping) falsche Buchstabierung Identifizierung und Zuordnung von Duplikaten anhand inhaltlicher Informationen Verknüpfung von als identisch erkannten Klassen 19-10-17 Abfrage heterogener Resourcen durch Mediatoren
Abfrage heterogener Resourcen durch Mediatoren Inhaltsschicht Blockierungen Entfernen von Vergleichsdatensätzen, die auf keinen Fall zusammengehören Frequenzbasierte Anpassungen Gewichtung von Datensätzen aufgrund der Gesamthäufigkeit ihrer Subterme statische Zeichenketten-Vergleiche Untersuchung von Wortgruppen nach typographischen Abweichungen Klassifizierung Beschreibung 19-10-17 Abfrage heterogener Resourcen durch Mediatoren
InhaltsschichtMediator GUI Konzept- wissen 19-10-17 Abfrage heterogener Resourcen durch Mediatoren
InhaltsschichtMediator GUI Konzept- wissen 19-10-17 Abfrage heterogener Resourcen durch Mediatoren
Abfrage heterogener Resourcen durch Mediatoren Vorteile Zeit-Ersparnis Abfrage-Dauer = Dauer der langsamsten Quelle + Umwandlungsdauer Quellen-Abfrage von besser angebundenem System Nur „Essenz“ für den Kunden Übersichtlichkeit: homogene Sicht auf Gesamtergebnis, Sortierung möglich, Nutzung innerhalb weiterer Obersysteme Mehrwert für bestehende Suchmaschinen zentrale Kunden-Anlaufstelle Individualisierbar 19-10-17 Abfrage heterogener Resourcen durch Mediatoren
Abfrage heterogener Resourcen durch Mediatoren Anwendung individuelle Termin-Zusammenstellung – Preisabfragen Abgleich personenbezogener, medizinischer Daten 19-10-17 Abfrage heterogener Resourcen durch Mediatoren
Abfrage heterogener Resourcen durch Mediatoren Zusammenfassung Mediator Suchmaschine „on demand“ Interessantes Thema für die T-Systems MMS? 19-10-17 Abfrage heterogener Resourcen durch Mediatoren
Abfrage heterogener Resourcen durch Mediatoren Zusammenfassung 19-10-17 Abfrage heterogener Resourcen durch Mediatoren 26
„Abfrage heterogener Ressourcen durch Mediatoren“ Vielen Dank für Ihre Aufmerksamkeit…