1 Zahlreiche Transformationen - Achtung Hochspannung Meike Klettke
Zahlreiche TranformationenMeike Klettke 2 Aufgaben in Mefis Projektpartner: TU Berlin Aufgaben, Uni Rostock Dokumenttranformation –Structure Mining –Evolution von XML-Dokumenten Anfragetransformation
Zahlreiche TranformationenMeike Klettke 3 Dokumenttransformation Transformation von Daten und Informationen in verschiedenen Formaten ineinander nicht alle in gleichem Maße relevant Metadaten Volltext Daten- bank XML- Dokument Meta- daten Meta- daten Meta- daten
Zahlreiche TranformationenMeike Klettke 4 Betrachtung von Varianten Generell: Transformation nur nur zur strukturierteren Variante sinnvoll Evolution von XML- Dokumenten HTML XML DB HTMLXMLDB Als Dokumenttrans- formation nicht relevant Nicht realisierbar Abgeschlossen MEFIS Structure Mining
Zahlreiche TranformationenMeike Klettke 5 Dokumenttransformation Transformation von Volltext in XML Structure Mining Volltext Daten- bank XML- Dokument Meta- daten Meta- daten Meta- daten
Zahlreiche TranformationenMeike Klettke 6 Zum Begriff Structure Mining Structure Mining Analyse und Auswertung von Struktur (was wird analysiert) Ableitung von Strukturinformationen (was ist das Ziel der Analyse)
Zahlreiche TranformationenMeike Klettke 7 Structure Mining für MEFIS Wrapper Ontologie Domain- lexikon HTML-Dokument Einzelbestandteile des HTML-Dokumentes Strukturinformationen Metadaten Kombination von Wrappertechniken und wörterbuchbasierten Verfahren Abgeschlossene SA (Andreas Schulz) am Beispiel Geschichtsdaten M-V
Zahlreiche TranformationenMeike Klettke 8 Zusammenhang zu Metadaten Ableitung von Metadaten aus den Dokumenten von Art der gesuchten Metadaten ist die anzuwendende Methode abhängig anwendungsbezogene Lösungen (zugeschnitten auf spezielle Gebiete und Webseiten)
Zahlreiche TranformationenMeike Klettke 9 Transformation von HTML-Dokumenten und Metadaten Zusätzliche Metadaten DBS XML Schema Abgleich: - informationsreduzierend - kapazitäts- und informationserweiternd Mappingvorschriften, interaktive Komponente - begonnene Studienarbeit: Mathias Schulz - domänenunabhängig (außer Mapping) HTML-Dokument und Metadaten Zielformate
Zahlreiche TranformationenMeike Klettke 10 Dokumenttransformation Transformation von XML-Dokumenten in Datenbank- Informationen Volltext Daten- bank XML- Dokument Meta- daten Meta- daten Meta- daten
Zahlreiche TranformationenMeike Klettke 11 Volltextindex und XML-Index Volltextindex Als Clobs Speicherung von XML-Dokumenten in Datenbanken Speichung der Dokumentstruktur Strukturelle Speicherung in Datenbanken Vollständiges Mapping Individuelles Mapping Abbilden des DOM-Modells Abbildung der Graphstruktur Für dokument-zentrier- te XML-Dokumente Für daten-zentrierte XML-Dokumente Für semistrukturierte XML-Dokumente Rolle von Metadaten - teilweise Schema erforderlich: dazu können Metadaten herangezogen werden
Zahlreiche TranformationenMeike Klettke 12 Dokumenttransformation Transformation von Volltext in Datenbanken (Kombination der vorherigen Varianten) Volltext Daten- bank XML- Dokument Meta- daten Meta- daten Meta- daten
Zahlreiche TranformationenMeike Klettke 13 Dokumenttransformation Transformation von XML-Dokumenten in XML- Dokumente Volltext Daten- bank XML- Dokument Meta- daten Meta- daten Meta- daten
Zahlreiche TranformationenMeike Klettke 14 Motivation zur Evolution/ Adaption Standard (Idealfall ?) mehrere Formate (Normalfall) Point2Point Abbildungen nach Ingo Macherius Dynamik von Anwendungen, besonders von Daten im Web Evolution Adaption
Zahlreiche TranformationenMeike Klettke 15 Einsatzszenario: Evolution und Adaption von XML-Dokumenten DTD 1 XMLSchema 1 Dokument 1 Dokument 2 DTD 2 XMLSchema 1 DTD- änderung Dokument- anpassung
Zahlreiche TranformationenMeike Klettke 16 Aktueller Stand Zwei theoretische Arbeiten –Studienarbeit Andre Zeitz Beschreibung möglicher Änderungsoperationen Illustration durch OEM –Diplomarbeit Rasmus Faust Entwicklung einer eigenen Darstellung für das Schema von XML- Dokumenten Beschreibung von Änderungsoperationen auf dieser –Offen: Implementierung
Zahlreiche TranformationenMeike Klettke 17 Benötigte Tools Tool, das Änderungen auf Dokumentebene realisiert –Input: DTD1, DTD2, XML-Dokumentkollektion 1, Sprache zur Beschreibung der Änderungen –Output: XML-Dokumentkollektion 2, Infoverluste, kapazitätserweiternde Anteile DTD 1 XMLSchema 1 Dokument 1 Dokument 2 DTD 2 XMLSchema 1 DTD- änderung Dokument- anpassung
Zahlreiche TranformationenMeike Klettke 18 Zusammenfassung / Besonderheiten in Mefis Evolutionsfähige Architekturen für Informationssysteme dabei notwendig: Evolution von Daten und Dokumenten –HTML-Dokumente ? - wahrscheinlich nicht realisierbar –XML-Dokumente ? - zumindest teilweise möglich –Datenbankinhalte ?- realisierbar weiterhin: Transformation Einsatz von Metadaten –zur Anreicherung der Strukturinformationen –zur Bestimmung identischer Anteile –zur Auswertung in Anfragen
Zahlreiche TranformationenMeike Klettke 19 Zusammenfassung/ Aktueller Stand Transformation HTML - HTML+Metadaten Transformation HTML+Metadaten –DB/XML Transformation XML – DB Unter Fokus zusätzlicher Metadaten überlegen
Zahlreiche TranformationenMeike Klettke 20 Ausblick Transformation von Anfragen Anwendungsgetriebene Fortschritte bei allen Verfahren Beispielszenarien