Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

1 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Thomas Triebsees Neubiberg, 26. Juni 2007 Erhaltung.

Ähnliche Präsentationen


Präsentation zum Thema: "1 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Thomas Triebsees Neubiberg, 26. Juni 2007 Erhaltung."—  Präsentation transkript:

1 1 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Thomas Triebsees Thomas.Triebsees@unibw.de Neubiberg, 26. Juni 2007 Erhaltung digitaler Objekte: Ein Constraint-basierter Ansatz zur automatisierten Anwendung auf Migrationsprozesse in Digitalen Archiven

2 2 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Agenda I.Einführung in die Domäne II.Abgrenzung des Forschungsbreichs III.Technischer Part – Unser Ansatz IV.Spezifikation von "Erhaltung" V.Implementierung VI."Case Studies" VII.Zusammenfassung & Ausblick

3 3 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie I.Einführung in die Domäne

4 4 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Problem der digitalen Langzeitarchivierung Vorzüge der digitalen Form  Automatisierbarkeit  Komfortabler Zugriff per Internet weltweit  Volltextsuche  Weiterverarbeitung  Perfekte, kompakte Kopien Probleme der Digitalen LZA  Geringe Lebensdauer dig. Medien  Was ist erhaltenswert?  Rapide technologische Fortschritte  Proprietäre Dokumentenformate  Obsoletwerden von Dokumentformaten Notwendigkeit der Archivierung  Bewahrung des kulturellen Erbes  Bewahrung des "Weltwissens"; --> Internationaler Wissensaustausch mittels Bibliotheken, Archiven etc. digitale Archivierung

5 5 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Digitales Archiv Die institutionalisierte Lösung: heute 21?? (deutlich später als morgen) sehr viele also vor- zugsweise automati- siert

6 6 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Vertrauenswürdigkeit Vertrauenswürdigkeit –Einführung (Trustworthiness): Eigenschaft eines Systems, gemäß seinen Zielen und Spezifikationen zu operieren (d.h. es tut genau das, was es zu tun vorgibt) wohldefiniert DRM - Methoden und Prozesse "vertrauenswürdig" 1.Schritt: Rahmenmodell und Begriffsgerüst

7 7 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie OAIS Referenzmodell Formales:  ISO-Standard Adressierte Problematik :  Informationserhalt über lange Zeit Beschreibt:  Informationsmodell  Organisations- und Funktionsmodell einschl. Methoden  Den Begriffsrahmen des vorgestellten Ansatzes Emulation:  Emulation der Abspielumgebung + Digitales Objekt wird nicht verändert - sehr komplex Migration  Transformation des Objektes von einer Technologie (Formate!) zur nächsten + Pot. handhabbarer durch Standardisierung der Formate - Iterierte Verfälschung des Objektes

8 8 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Ziel der Arbeit Ziel der Arbeit im Rahmen der Forschungstätigkeit der Gruppe Langzeitarchivierung Die Ergebnisse der Arbeit sollen aufbauend auf einem geeigneten Erhaltungsbegriff einen Beitrag zur verbesserten Automatisierung bei gleichzeitiger Berücksichtigung eines hohen Grades an Vertrauenswürdigkeit leisten. six?

9 9 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Einschräkung der Domäne II.Abgrenzung des Forschungsbreichs

10 10 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Notwendigkeit der Einschränkung OAIS-Begriffsgerüst Migration Digitale Archive Objekte Erhaltung Information Vertrauenswürdigkeit Prozesse Automatisierung Historien Repräsentation Diversizität: Audio, Video, DB, Das Web,... Unklarheit der Begriffe: Information? Vertrauenswürdigkeit? Erhaltung?

11 11 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Einschränkungen Einschränkung der digitalen Objekte:  liegen in Repräsentation vor; diese ist: o nicht-proprietär o automatisiert verarbeitbar o nicht dynamisch o möglichst standardisiert o Spezifikation offen !Video, !Audio XML,HTML,PDF Tool-Support !MS Formate formalisierbar? formalisierbar! Einschränkung auf formalisierbare Aspekte Einschränkung auf formalisierbare Aspekte

12 12 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie OAIS Referenzmodell- Begriffswelten Migration Digitale Archive Objekte Erhaltung Information Semantik Vertrauenswürdigkeit Vor- und Nachbedingungen/Invarianten Transformation Objekte Homomorphie/Verfeinerung Prozesse OAIS-Begriffsgerüst Zustandsbasierte Systeme Automatisierung Software Begriffe der Informatik und Mathematik Historien Repräsentation Dateien Formate Typisierung Zeitlogiken Constraints formalisierbar

13 13 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie III.Technischer Part – Unser Ansatz

14 14 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Beitrag Unser Beitrag: - Auf Erhaltung fokussierte Spezifiktionssprache (Constraints) - Auswertung in einer zustandsbasierten Umgebung - Gruppierung semantischer Eigenschaften unterschdl. Impl. - Verfolgung (Tracing) anhand klar definierter Interfaces Vollständige Abstraktion von konkreter Implementierung Einbettung in Prozesse "Nur was schon da ist" - Tracing Beschränkung auf "signifikante" Eigenschaften Diversizität Aufzeigen von Ursachen für Constraint-Verletzung; Nachverfolgung über Objekthistorie hinweg

15 15 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Beispiel PStorage 1PStorage 2 PStorage m... Server 1... ArchiverBrowser Server 2Server n UICI INGEST REQUEST / RESPONSE EXPOSE BII Web-Archiv Produzent Konsument Permanent StorageWeb Storage storePerm extractMetadata store respond Web-Seite "Calculation" Speicherformat BWeb der Browser-Komponent Transformation

16 16 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Der Ansatz - Erhaltung Spezifikations-sprache Constraints Transform.-Algorithmen definiert "leiten" an bei Implementierung beachten Konzept (= sem. Eigenschaft) + Interface Kontext 1 Kontext n … Quellkontext Zielkontext implementiert … Erhaltung

17 17 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Grundmodell eines Archivs und Sicht auf Transformationen - Getypte Objekte - Attribute - Erw. möglich (Assoz., Funktionen, etc.) Modellierungselemente Archive State A Systemzustand A Archive State A' Systemzustand A' Basisoperation (Objekt erzeugen) Systemzustand A'' Basisoperation (Transformation) Transformationsalgorithmus = Sequenz von Basisop.

18 18 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Abstraktion durch Konzepte und Interfaces Website HTMLDoc Directory Doc PDFDoc HTMLElem eP 0..1 1 * 1 * *.html html resources.html Koncept Website … … … … … … … … … src trg Kontext AWebKontext BWeb φ (Lang1) ψ (Lang2) AWeb BWeb

19 19 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Konzeptspezifikation source calculation2005 overview calc.pdf doclist.html start.html Website eP 0..1.html html resources.html … … … … … … … … … AWeb ? ? HTMLDoc Directory 0..1 …… δ Konzept Website BWeb Calculation EXPOSE

20 20 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Beispiel - Dokumentinhalte name : String attrs : Seq content : Seq name : String attrs : Seq content : Seq HTMLElem … … … … start.html name : String location : String content : Tag name : String location : String content : Tag HTMLDoc start.html h:HTML e11 e111 e112 e1111 e1121

21 21 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie IV.Spezifikation von "Erhaltung"

22 22 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Erhaltung abstrakt Konzept Quell-Impl.Ziel-Impl.

23 23 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Erhaltungsschema a Beispielformulierung: Erhalte, sofern der Quellzustand transformiert wird, die Eigenschaft E. EE' a(E)a'(E') Im folgenden 2 Instantiierungen

24 24 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Beispiel Attributerhaltung: Erhalte, sofern das HTML-Dokument h transformiert wird, den Namen des HTML-Dokumentes. pres O (h→HTMLDoc, h[HTMLDoc-{ }] ) location, content a Erhaltungssprache – Object Preservation Constraints Tracing

25 25 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Beispiel Speicherformat für Webseiten: Erhalte, sofern die Web-Seite w transformiert wird und im Format AWeb vorlag, das Speicherformat in der Form BWeb pres K ( w→Website, K web (w, f, h), (AWeb, BWeb) ) a Erhaltungssprache – Concept Preservation Constraints Tracing

26 26 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie V.Implementierung

27 27 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Implementierung – 2- Layer-Architektur Syntaktische Ebene Implementierungsebene Signatur Typen Objekt-IDs Funktionssymbole Attributsymbole Konzeptsymbole Signatur Typen Objekt-IDs Funktionssymbole Attributsymbole Konzeptsymbole Zustand Objekt-IDs Funktionstabellen Attributtabellen Konzepttabellen Zustand Objekt-IDs Funktionstabellen Attributtabellen Konzepttabellen Java-Klassenspe- zifikationen Java-Klassenspe- zifikationen Java-Objekte Instantiierung bijektiv Konzeptgültigkeit/ Constraint-Prüfung syntaktische Entsprechung = Nahtstelle für beliebige JAVA-basierte Systeme

28 28 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Implementierung – Transformationen auf 2 Ebenen Syntaktische Ebene Implementierungsebene Quellzustand Zielzustand Zielobjekte MigrationEnvironment Tracing Constraint-Checking MigrationEnvironment Tracing Constraint-Checking Quellobjekte Benachrichtigung Constraints Konzepte 1. Transformation auf syntaktischer Ebene 2. Transformation auf Implementierungsebene

29 29 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie VI.Case Studies

30 30 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Beispiel 1 - Webarchivierung PStorage 1PStorage 2 PStorage m... Server 1... ArchiverBrowser Server 2Server n UICI INGEST REQUEST / RESPONSE EXPOSE BII Web-Archiv Produzent Konsument Permanent StorageWeb Storage storePerm extractMetadata store respond Web-Seite "Calculation" Speicherformat BWeb der Browser-Komponent

31 31 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Beispiel 1 - Webarchivierung

32 32 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Beispiel 2 – SW-Spezifikation Komponenten-Interaktion und Erhaltung von Kommunikationsflüssen

33 33 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Beispiel 2 – SW-Spezifikation

34 34 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie VI.Zusammenfassung & Ausblick

35 35 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Zusammenfassung Was bleibt zu tun?

36 36 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Zusammenfassung und Ausblick  Statische Analyse – Implikationen unter Constraints  Umfangreichere Beispiele (derzeit laufende Diplomarbeit)  Spracherweiterungen  Erhöhung der Effizienz der Implementierung Future Work

37 37 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Publikationen

38 38 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Thomas Triebsees Universität der Bundeswehr München Fakultät für Informatik Thomas.Triebsees@unibw.de


Herunterladen ppt "1 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Thomas Triebsees Neubiberg, 26. Juni 2007 Erhaltung."

Ähnliche Präsentationen


Google-Anzeigen