1 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Thomas Triebsees Neubiberg, 26. Juni 2007 Erhaltung.

Slides:



Advertisements
Ähnliche Präsentationen
Web-Content-Management-Systeme
Advertisements

Blue J.
Frame-Logik Eine Einführung Andreas Glausch.
PADLR Submodul Modular Content Archives Ein Content Browser für Lehr- materialien aus der Elektrotechnik Dipl.-Ing. Mark Painter Institut für Nachrichtentechnik.
Gesellschaft für wissenschaftliche Datenverarbeitung mbH Göttingen Am Fassberg, Göttingen Fon: Fax:
Christian A. Kopf Institut für Informatik FU Berlin Episode Recognizer Framework - Rahmenwerk zur Episodenerkennung.
Gegen die Vergänglichkeit digitaler Informationen Susanne Kurz AWV Sitzung Daten- und Speichermanagement, Köln,
Das Depotsystem Digitaler Dokumente Workshop Langzeitverfügbarkeit Digitaler Dokumente 29./30. Oktober 2002 Hans Liegmann, Die Deutsche Bibliothek.
DOM (Document Object Model)
Praktikum Entwicklung und Einsatz von Geosoftware I - Sitzung 5 Polymorphismus Sommersemester 2003 Lars Bernard.
Informationen ü ber den Umbau des Schulnetzes Aufgrund der Umstellung unseres Schulnetzes auf ein neues Serversystem wird Ende Juni 2010 der Zugriff auf.
Technik Gestaltung Navigation Daten. Übersicht Client Webbrowser InternetServer.
Analyse (1) Oberstes Gebot: Typsicherheit muss in Sicht und Basis jeweils für sich gelten. Basisschema muss unverändert bleiben. Bei rein syntaktischer.
Dokumenten- und Archivsystem auf Basis kommerzieller Software Verband der Bibliotheken des Landes Dokumenten-
Langzeitarchivierung und Metadaten. NAA Preservation Strategy Link: ml.
Preservation Metadata. OAIS Reference Model Diese und folgende Quellen:
Visualisierung objektrelationaler Datenbanken
Digital Divide und seine Folgen
1 Thomas Triebsees Neubiberg, 25. Oktober 2007 Migration Digitaler Objekte Ein Rahmenwerk zur automatisierten Unterstützung "Kontrollierter.
Nestor Workshop im Rahmen der GES 2007 Digitale Langzeitarchivierung und Grid: Gemeinsam sind wir stärker? Synergiepotentiale zwischen GRID- und eScience-Technologien.
ArcGIS als WPS Server Aktueller Stand der Umsetzung
Mit 3 Schichte zum Erfolg
Nicolas Frings Maximilian Bernd Stefan Piernikarcyk
Als geeignetes Präservationsverfahren Migration gebräuchliche Strategie der digitalen Langzeitarchivierung zuverlässiger Weg, die wichtigsten Properties.
Evaluation von softwaregestützten Modellierungsmöglichkeiten innerhalb der Analysephase von Fortbildungsmaßnahmen Kolloquium - Thomas Vogt –
Beschreiben Sie das Szenario wenn ein ORB einen Server aktiviert und eine Objektimplementation aufruft. Activate Server impl_is_ready Activate Object (GetID.
EScience eScience ist die globale Zusammenarbeit in Schlüsselgebieten der Forschung und die nächste Generation Werkzeuge, um diese Art von Forschung zu.
EDV-Anwendungen im Archivwesen II KU 2WS WS07.
Kapitel A: Auswahl (Graf, Steinke, Huth) *A2 Definition: Das digitale Langzeitarchiv und der Produzent müssen die wesentlichen Eigenschaften (significant.
Expertise Grid und eScience Jens Klump nestor AG Grid/eScience DNB, Frankfurt (M),
Stand der Expertise Workshop am SUB Göttingen
Archiv Def: Siehe Digitales Langzeitarchiv.
Nestor Workshop im Rahmen der GES 2007 Digitale Langzeitarchivierung und Grid: Gemeinsam sind wir stärker? nestor und Grid Jens Ludwig Baden-Baden, 2.
Oliver Spritzendorfer Thomas Fekete
Zauberwort Metadaten Elementares Handwerkszeug des Content- und Wissensmanagement.
XML (Extensible Markup Language)
KOOP-LITERA Tagung 2003, 8. / 9. Mai 2003 Archivierung digitaler Dokumente Problemstellung - kooperative Lösungsansätze - Aktivitäten der Österreichischen.
Seminar: Virtuelle Forschungsumgebungen Dozent: Professor Manfred Thaller Referent: Peter Smits
Eike Schallehn, Martin Endig
Eike Schallehn, Martin Endig
Institut für C omputer G raphik, TU Braunschweig V 3 D 2 -Workshop München Fellner/Havemann/Müller1 Modellierung von und Navigation in großen 3D-Dokumenten.
Software Design Patterns
Vortrag - Diplomarbeiten (HS I)
Funktionsweise von CMS
Datenbanken im Web 1.
Vom Dokumentenserver MIAMI zum service-orientierten OAIS-konformen Archivsystem Burkard Rosenberger Universitäts- und Landesbibliothek Münster Düsseldorf,
1 Wolfgang Wiese, Regionales RechenZentrum Erlangen WCMS 3. August 2000 Wolfgang Wiese RRZE / Lehrstuhl für Informatik VII
Einführung in die Programmierung mit Java
Institut für Kartographie und Geoinformation Prof. Dr. Lutz Plümer, Dr. Thomas H. Kolbe Einführung in die Programmierung mit Java 9. Vorlesung WS 2001/2002.
Seminar Modellgetriebene Softwareentwicklung Thema 3: Metamodelle – MOF Michél Rieser Prof. Dr.-Ing. habil. Georg Paul
Die digitale Langzeitarchivierung Referentin: Marietta Steinhöfel Seminar: Digitale Langzeitarchivierung Prof. Dr. Manfred Thaller
Paul, Morten, Yannick Blue J. Entwicklungsumgebung  versteht Java Programmcode  Für die Entwicklung eigener Software  Durch die Programmierung.
Das OAIS Modell Manfred Thaller Universität zu Köln
Modul 6 Handy-Signatur: Anwendung. Anwendungsbereiche der Handy-Signatur „Eigenhändige Unterschrift“ Elektronische Behördenwege Rechtsgültiges Unterschreiben.
Igor Gorbunov Sebastian Tober Mobilkommunikation und Georeferenzierung Zwischenpräsentation zum Thema.
Wissensnetzwerk „Digitale Langzeitarchivierung“: 3. Arbeitssitzung , Österreichische Nationalbibliothek 1 Österreich Von der rechtlichen.
Einführung in PowerPoint Zum Seminar „Video und Multimedia im Unterricht DaF“ (Theorie und Praxis der Lehr- und Lernmittel) bei Prof. Dr. E. Tschirner.
Generic Enabler Felix Holzäpfel-Stein, Aachen Generische Komponenten im Cloudkontext.
Universität für Bodenkultur Wien, Institut für Siedlungswasserbau, Industriewasserwirtschaft und Gewässerschutz (SIG) Allgemeine Hinweise zum Masterseminar.
Comprehensive Information Base (CIB) – ein Prototyp zur semantischen Datenintegration Stefan Arts
Webdeployment auf Cluster Seminarvortrag von Lukas Bonzelett.
Application Performance Management Udo Brede.  Komplexe Umgebungen  Häufige Änderungen  Hohe Aktivität Database Servers Application Servers Web Servers.
WISSENSREPRÄSENTATION IN ACTIVEMATH Theoretische Grundlagen – Teil 1.
1 Das Dilemma des Architekten Ziel: ein gut designtes System, welches mit zukünftigen Anforderungen umgehen kann, ohne dass es zu Einschränkungen in der.
Strategien zur Bewahrung von Ton- und Videodokumenten
Lesen Sie alles darüber Microsoft SharePoint-News
Lesen Sie alles zu Microsoft SharePoint-News
Der nationale CULTIVATE-Knoten Österreich
PI Infrastruktur in der Max-Planck-Gesellschaft
Studiengang Informatik FHDW
 Präsentation transkript:

1 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Thomas Triebsees Neubiberg, 26. Juni 2007 Erhaltung digitaler Objekte: Ein Constraint-basierter Ansatz zur automatisierten Anwendung auf Migrationsprozesse in Digitalen Archiven

2 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Agenda I.Einführung in die Domäne II.Abgrenzung des Forschungsbreichs III.Technischer Part – Unser Ansatz IV.Spezifikation von "Erhaltung" V.Implementierung VI."Case Studies" VII.Zusammenfassung & Ausblick

3 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie I.Einführung in die Domäne

4 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Problem der digitalen Langzeitarchivierung Vorzüge der digitalen Form  Automatisierbarkeit  Komfortabler Zugriff per Internet weltweit  Volltextsuche  Weiterverarbeitung  Perfekte, kompakte Kopien Probleme der Digitalen LZA  Geringe Lebensdauer dig. Medien  Was ist erhaltenswert?  Rapide technologische Fortschritte  Proprietäre Dokumentenformate  Obsoletwerden von Dokumentformaten Notwendigkeit der Archivierung  Bewahrung des kulturellen Erbes  Bewahrung des "Weltwissens"; --> Internationaler Wissensaustausch mittels Bibliotheken, Archiven etc. digitale Archivierung

5 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Digitales Archiv Die institutionalisierte Lösung: heute 21?? (deutlich später als morgen) sehr viele also vor- zugsweise automati- siert

6 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Vertrauenswürdigkeit Vertrauenswürdigkeit –Einführung (Trustworthiness): Eigenschaft eines Systems, gemäß seinen Zielen und Spezifikationen zu operieren (d.h. es tut genau das, was es zu tun vorgibt) wohldefiniert DRM - Methoden und Prozesse "vertrauenswürdig" 1.Schritt: Rahmenmodell und Begriffsgerüst

7 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie OAIS Referenzmodell Formales:  ISO-Standard Adressierte Problematik :  Informationserhalt über lange Zeit Beschreibt:  Informationsmodell  Organisations- und Funktionsmodell einschl. Methoden  Den Begriffsrahmen des vorgestellten Ansatzes Emulation:  Emulation der Abspielumgebung + Digitales Objekt wird nicht verändert - sehr komplex Migration  Transformation des Objektes von einer Technologie (Formate!) zur nächsten + Pot. handhabbarer durch Standardisierung der Formate - Iterierte Verfälschung des Objektes

8 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Ziel der Arbeit Ziel der Arbeit im Rahmen der Forschungstätigkeit der Gruppe Langzeitarchivierung Die Ergebnisse der Arbeit sollen aufbauend auf einem geeigneten Erhaltungsbegriff einen Beitrag zur verbesserten Automatisierung bei gleichzeitiger Berücksichtigung eines hohen Grades an Vertrauenswürdigkeit leisten. six?

9 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Einschräkung der Domäne II.Abgrenzung des Forschungsbreichs

10 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Notwendigkeit der Einschränkung OAIS-Begriffsgerüst Migration Digitale Archive Objekte Erhaltung Information Vertrauenswürdigkeit Prozesse Automatisierung Historien Repräsentation Diversizität: Audio, Video, DB, Das Web,... Unklarheit der Begriffe: Information? Vertrauenswürdigkeit? Erhaltung?

11 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Einschränkungen Einschränkung der digitalen Objekte:  liegen in Repräsentation vor; diese ist: o nicht-proprietär o automatisiert verarbeitbar o nicht dynamisch o möglichst standardisiert o Spezifikation offen !Video, !Audio XML,HTML,PDF Tool-Support !MS Formate formalisierbar? formalisierbar! Einschränkung auf formalisierbare Aspekte Einschränkung auf formalisierbare Aspekte

12 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie OAIS Referenzmodell- Begriffswelten Migration Digitale Archive Objekte Erhaltung Information Semantik Vertrauenswürdigkeit Vor- und Nachbedingungen/Invarianten Transformation Objekte Homomorphie/Verfeinerung Prozesse OAIS-Begriffsgerüst Zustandsbasierte Systeme Automatisierung Software Begriffe der Informatik und Mathematik Historien Repräsentation Dateien Formate Typisierung Zeitlogiken Constraints formalisierbar

13 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie III.Technischer Part – Unser Ansatz

14 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Beitrag Unser Beitrag: - Auf Erhaltung fokussierte Spezifiktionssprache (Constraints) - Auswertung in einer zustandsbasierten Umgebung - Gruppierung semantischer Eigenschaften unterschdl. Impl. - Verfolgung (Tracing) anhand klar definierter Interfaces Vollständige Abstraktion von konkreter Implementierung Einbettung in Prozesse "Nur was schon da ist" - Tracing Beschränkung auf "signifikante" Eigenschaften Diversizität Aufzeigen von Ursachen für Constraint-Verletzung; Nachverfolgung über Objekthistorie hinweg

15 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Beispiel PStorage 1PStorage 2 PStorage m... Server 1... ArchiverBrowser Server 2Server n UICI INGEST REQUEST / RESPONSE EXPOSE BII Web-Archiv Produzent Konsument Permanent StorageWeb Storage storePerm extractMetadata store respond Web-Seite "Calculation" Speicherformat BWeb der Browser-Komponent Transformation

16 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Der Ansatz - Erhaltung Spezifikations-sprache Constraints Transform.-Algorithmen definiert "leiten" an bei Implementierung beachten Konzept (= sem. Eigenschaft) + Interface Kontext 1 Kontext n … Quellkontext Zielkontext implementiert … Erhaltung

17 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Grundmodell eines Archivs und Sicht auf Transformationen - Getypte Objekte - Attribute - Erw. möglich (Assoz., Funktionen, etc.) Modellierungselemente Archive State A Systemzustand A Archive State A' Systemzustand A' Basisoperation (Objekt erzeugen) Systemzustand A'' Basisoperation (Transformation) Transformationsalgorithmus = Sequenz von Basisop.

18 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Abstraktion durch Konzepte und Interfaces Website HTMLDoc Directory Doc PDFDoc HTMLElem eP * 1 * *.html html resources.html Koncept Website … … … … … … … … … src trg Kontext AWebKontext BWeb φ (Lang1) ψ (Lang2) AWeb BWeb

19 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Konzeptspezifikation source calculation2005 overview calc.pdf doclist.html start.html Website eP 0..1.html html resources.html … … … … … … … … … AWeb ? ? HTMLDoc Directory 0..1 …… δ Konzept Website BWeb Calculation EXPOSE

20 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Beispiel - Dokumentinhalte name : String attrs : Seq content : Seq name : String attrs : Seq content : Seq HTMLElem … … … … start.html name : String location : String content : Tag name : String location : String content : Tag HTMLDoc start.html h:HTML e11 e111 e112 e1111 e1121

21 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie IV.Spezifikation von "Erhaltung"

22 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Erhaltung abstrakt Konzept Quell-Impl.Ziel-Impl.

23 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Erhaltungsschema a Beispielformulierung: Erhalte, sofern der Quellzustand transformiert wird, die Eigenschaft E. EE' a(E)a'(E') Im folgenden 2 Instantiierungen

24 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Beispiel Attributerhaltung: Erhalte, sofern das HTML-Dokument h transformiert wird, den Namen des HTML-Dokumentes. pres O (h→HTMLDoc, h[HTMLDoc-{ }] ) location, content a Erhaltungssprache – Object Preservation Constraints Tracing

25 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Beispiel Speicherformat für Webseiten: Erhalte, sofern die Web-Seite w transformiert wird und im Format AWeb vorlag, das Speicherformat in der Form BWeb pres K ( w→Website, K web (w, f, h), (AWeb, BWeb) ) a Erhaltungssprache – Concept Preservation Constraints Tracing

26 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie V.Implementierung

27 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Implementierung – 2- Layer-Architektur Syntaktische Ebene Implementierungsebene Signatur Typen Objekt-IDs Funktionssymbole Attributsymbole Konzeptsymbole Signatur Typen Objekt-IDs Funktionssymbole Attributsymbole Konzeptsymbole Zustand Objekt-IDs Funktionstabellen Attributtabellen Konzepttabellen Zustand Objekt-IDs Funktionstabellen Attributtabellen Konzepttabellen Java-Klassenspe- zifikationen Java-Klassenspe- zifikationen Java-Objekte Instantiierung bijektiv Konzeptgültigkeit/ Constraint-Prüfung syntaktische Entsprechung = Nahtstelle für beliebige JAVA-basierte Systeme

28 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Implementierung – Transformationen auf 2 Ebenen Syntaktische Ebene Implementierungsebene Quellzustand Zielzustand Zielobjekte MigrationEnvironment Tracing Constraint-Checking MigrationEnvironment Tracing Constraint-Checking Quellobjekte Benachrichtigung Constraints Konzepte 1. Transformation auf syntaktischer Ebene 2. Transformation auf Implementierungsebene

29 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie VI.Case Studies

30 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Beispiel 1 - Webarchivierung PStorage 1PStorage 2 PStorage m... Server 1... ArchiverBrowser Server 2Server n UICI INGEST REQUEST / RESPONSE EXPOSE BII Web-Archiv Produzent Konsument Permanent StorageWeb Storage storePerm extractMetadata store respond Web-Seite "Calculation" Speicherformat BWeb der Browser-Komponent

31 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Beispiel 1 - Webarchivierung

32 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Beispiel 2 – SW-Spezifikation Komponenten-Interaktion und Erhaltung von Kommunikationsflüssen

33 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Beispiel 2 – SW-Spezifikation

34 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie VI.Zusammenfassung & Ausblick

35 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Zusammenfassung Was bleibt zu tun?

36 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Zusammenfassung und Ausblick  Statische Analyse – Implikationen unter Constraints  Umfangreichere Beispiele (derzeit laufende Diplomarbeit)  Spracherweiterungen  Erhöhung der Effizienz der Implementierung Future Work

37 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Publikationen

38 Thomas Triebsees, Fakultät für Informatik, Institut für Softwaretechnologie Thomas Triebsees Universität der Bundeswehr München Fakultät für Informatik