Präsentation herunterladen
Die Präsentation wird geladen. Bitte warten
Veröffentlicht von:Christoph Langenberg Geändert vor über 8 Jahren
1
1 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Thomas Triebsees Thomas.Triebsees@unibw.de Neubiberg, 26. Juni 2007 Erhaltung digitaler Objekte: Ein Constraint-basierter Ansatz zur automatisierten Anwendung auf Migrationsprozesse in Digitalen Archiven
2
2 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Agenda I.Einführung in die Domäne II.Abgrenzung des Forschungsbreichs III.Technischer Part – Unser Ansatz IV.Spezifikation von "Erhaltung" V.Implementierung VI."Case Studies" VII.Zusammenfassung & Ausblick
3
3 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie I.Einführung in die Domäne
4
4 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Problem der digitalen Langzeitarchivierung Vorzüge der digitalen Form Automatisierbarkeit Komfortabler Zugriff per Internet weltweit Volltextsuche Weiterverarbeitung Perfekte, kompakte Kopien Probleme der Digitalen LZA Geringe Lebensdauer dig. Medien Was ist erhaltenswert? Rapide technologische Fortschritte Proprietäre Dokumentenformate Obsoletwerden von Dokumentformaten Notwendigkeit der Archivierung Bewahrung des kulturellen Erbes Bewahrung des "Weltwissens"; --> Internationaler Wissensaustausch mittels Bibliotheken, Archiven etc. digitale Archivierung
5
5 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Digitales Archiv Die institutionalisierte Lösung: heute 21?? (deutlich später als morgen) sehr viele also vor- zugsweise automati- siert
6
6 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Vertrauenswürdigkeit Vertrauenswürdigkeit –Einführung (Trustworthiness): Eigenschaft eines Systems, gemäß seinen Zielen und Spezifikationen zu operieren (d.h. es tut genau das, was es zu tun vorgibt) wohldefiniert DRM - Methoden und Prozesse "vertrauenswürdig" 1.Schritt: Rahmenmodell und Begriffsgerüst
7
7 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie OAIS Referenzmodell Formales: ISO-Standard Adressierte Problematik : Informationserhalt über lange Zeit Beschreibt: Informationsmodell Organisations- und Funktionsmodell einschl. Methoden Den Begriffsrahmen des vorgestellten Ansatzes Emulation: Emulation der Abspielumgebung + Digitales Objekt wird nicht verändert - sehr komplex Migration Transformation des Objektes von einer Technologie (Formate!) zur nächsten + Pot. handhabbarer durch Standardisierung der Formate - Iterierte Verfälschung des Objektes
8
8 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Ziel der Arbeit Ziel der Arbeit im Rahmen der Forschungstätigkeit der Gruppe Langzeitarchivierung Die Ergebnisse der Arbeit sollen aufbauend auf einem geeigneten Erhaltungsbegriff einen Beitrag zur verbesserten Automatisierung bei gleichzeitiger Berücksichtigung eines hohen Grades an Vertrauenswürdigkeit leisten. six?
9
9 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Einschräkung der Domäne II.Abgrenzung des Forschungsbreichs
10
10 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Notwendigkeit der Einschränkung OAIS-Begriffsgerüst Migration Digitale Archive Objekte Erhaltung Information Vertrauenswürdigkeit Prozesse Automatisierung Historien Repräsentation Diversizität: Audio, Video, DB, Das Web,... Unklarheit der Begriffe: Information? Vertrauenswürdigkeit? Erhaltung?
11
11 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Einschränkungen Einschränkung der digitalen Objekte: liegen in Repräsentation vor; diese ist: o nicht-proprietär o automatisiert verarbeitbar o nicht dynamisch o möglichst standardisiert o Spezifikation offen !Video, !Audio XML,HTML,PDF Tool-Support !MS Formate formalisierbar? formalisierbar! Einschränkung auf formalisierbare Aspekte Einschränkung auf formalisierbare Aspekte
12
12 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie OAIS Referenzmodell- Begriffswelten Migration Digitale Archive Objekte Erhaltung Information Semantik Vertrauenswürdigkeit Vor- und Nachbedingungen/Invarianten Transformation Objekte Homomorphie/Verfeinerung Prozesse OAIS-Begriffsgerüst Zustandsbasierte Systeme Automatisierung Software Begriffe der Informatik und Mathematik Historien Repräsentation Dateien Formate Typisierung Zeitlogiken Constraints formalisierbar
13
13 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie III.Technischer Part – Unser Ansatz
14
14 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Beitrag Unser Beitrag: - Auf Erhaltung fokussierte Spezifiktionssprache (Constraints) - Auswertung in einer zustandsbasierten Umgebung - Gruppierung semantischer Eigenschaften unterschdl. Impl. - Verfolgung (Tracing) anhand klar definierter Interfaces Vollständige Abstraktion von konkreter Implementierung Einbettung in Prozesse "Nur was schon da ist" - Tracing Beschränkung auf "signifikante" Eigenschaften Diversizität Aufzeigen von Ursachen für Constraint-Verletzung; Nachverfolgung über Objekthistorie hinweg
15
15 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Beispiel PStorage 1PStorage 2 PStorage m... Server 1... ArchiverBrowser Server 2Server n UICI INGEST REQUEST / RESPONSE EXPOSE BII Web-Archiv Produzent Konsument Permanent StorageWeb Storage storePerm extractMetadata store respond Web-Seite "Calculation" Speicherformat BWeb der Browser-Komponent Transformation
16
16 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Der Ansatz - Erhaltung Spezifikations-sprache Constraints Transform.-Algorithmen definiert "leiten" an bei Implementierung beachten Konzept (= sem. Eigenschaft) + Interface Kontext 1 Kontext n … Quellkontext Zielkontext implementiert … Erhaltung
17
17 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Grundmodell eines Archivs und Sicht auf Transformationen - Getypte Objekte - Attribute - Erw. möglich (Assoz., Funktionen, etc.) Modellierungselemente Archive State A Systemzustand A Archive State A' Systemzustand A' Basisoperation (Objekt erzeugen) Systemzustand A'' Basisoperation (Transformation) Transformationsalgorithmus = Sequenz von Basisop.
18
18 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Abstraktion durch Konzepte und Interfaces Website HTMLDoc Directory Doc PDFDoc HTMLElem eP 0..1 1 * 1 * *.html html resources.html Koncept Website … … … … … … … … … src trg Kontext AWebKontext BWeb φ (Lang1) ψ (Lang2) AWeb BWeb
19
19 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Konzeptspezifikation source calculation2005 overview calc.pdf doclist.html start.html Website eP 0..1.html html resources.html … … … … … … … … … AWeb ? ? HTMLDoc Directory 0..1 …… δ Konzept Website BWeb Calculation EXPOSE
20
20 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Beispiel - Dokumentinhalte name : String attrs : Seq content : Seq name : String attrs : Seq content : Seq HTMLElem … … … … start.html name : String location : String content : Tag name : String location : String content : Tag HTMLDoc start.html h:HTML e11 e111 e112 e1111 e1121
21
21 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie IV.Spezifikation von "Erhaltung"
22
22 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Erhaltung abstrakt Konzept Quell-Impl.Ziel-Impl.
23
23 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Erhaltungsschema a Beispielformulierung: Erhalte, sofern der Quellzustand transformiert wird, die Eigenschaft E. EE' a(E)a'(E') Im folgenden 2 Instantiierungen
24
24 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Beispiel Attributerhaltung: Erhalte, sofern das HTML-Dokument h transformiert wird, den Namen des HTML-Dokumentes. pres O (h→HTMLDoc, h[HTMLDoc-{ }] ) location, content a Erhaltungssprache – Object Preservation Constraints Tracing
25
25 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Beispiel Speicherformat für Webseiten: Erhalte, sofern die Web-Seite w transformiert wird und im Format AWeb vorlag, das Speicherformat in der Form BWeb pres K ( w→Website, K web (w, f, h), (AWeb, BWeb) ) a Erhaltungssprache – Concept Preservation Constraints Tracing
26
26 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie V.Implementierung
27
27 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Implementierung – 2- Layer-Architektur Syntaktische Ebene Implementierungsebene Signatur Typen Objekt-IDs Funktionssymbole Attributsymbole Konzeptsymbole Signatur Typen Objekt-IDs Funktionssymbole Attributsymbole Konzeptsymbole Zustand Objekt-IDs Funktionstabellen Attributtabellen Konzepttabellen Zustand Objekt-IDs Funktionstabellen Attributtabellen Konzepttabellen Java-Klassenspe- zifikationen Java-Klassenspe- zifikationen Java-Objekte Instantiierung bijektiv Konzeptgültigkeit/ Constraint-Prüfung syntaktische Entsprechung = Nahtstelle für beliebige JAVA-basierte Systeme
28
28 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Implementierung – Transformationen auf 2 Ebenen Syntaktische Ebene Implementierungsebene Quellzustand Zielzustand Zielobjekte MigrationEnvironment Tracing Constraint-Checking MigrationEnvironment Tracing Constraint-Checking Quellobjekte Benachrichtigung Constraints Konzepte 1. Transformation auf syntaktischer Ebene 2. Transformation auf Implementierungsebene
29
29 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie VI.Case Studies
30
30 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Beispiel 1 - Webarchivierung PStorage 1PStorage 2 PStorage m... Server 1... ArchiverBrowser Server 2Server n UICI INGEST REQUEST / RESPONSE EXPOSE BII Web-Archiv Produzent Konsument Permanent StorageWeb Storage storePerm extractMetadata store respond Web-Seite "Calculation" Speicherformat BWeb der Browser-Komponent
31
31 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Beispiel 1 - Webarchivierung
32
32 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Beispiel 2 – SW-Spezifikation Komponenten-Interaktion und Erhaltung von Kommunikationsflüssen
33
33 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Beispiel 2 – SW-Spezifikation
34
34 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie VI.Zusammenfassung & Ausblick
35
35 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Zusammenfassung Was bleibt zu tun?
36
36 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Zusammenfassung und Ausblick Statische Analyse – Implikationen unter Constraints Umfangreichere Beispiele (derzeit laufende Diplomarbeit) Spracherweiterungen Erhöhung der Effizienz der Implementierung Future Work
37
37 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Publikationen
38
38 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Thomas Triebsees Universität der Bundeswehr München Fakultät für Informatik Thomas.Triebsees@unibw.de
Ähnliche Präsentationen
© 2024 SlidePlayer.org Inc.
All rights reserved.