1 Peter Rödig Entwicklungen im Bereich Software-Architekturen und Software-Produkte langfristiger Informationserhalt.

Slides:



Advertisements
Ähnliche Präsentationen
Architektur eines Human-Task-Service
Advertisements

Beate Sturm (SUB/MPDL)
Arbeitsablauf basierte Grid Anwendungen
Zur SCORM-Fähigkeit konventioneller XML-unterstützender eLearning Developer Tools im Projekt I-can-EIB OFFIS Oldenburger Forschungs- und Entwicklungsinstitut.
Einfluss von Web Services Technologien auf organisatorische Strukturen Referent: Sergej Groß
Heterogene Informationssysteme
Deutsches Forschungsnetz. Zentren für Kommunikation und Informationstechnik in Lehre und Forschung Herbsttagung Technische Universität Ilmenau 12. September.
Rechnernetze und verteilte Systeme (BSRvS II)
Datenbanken Einführung.
Zum Stand und den Perspektiven des Kompetenznetzwerks Neue Dienste, Standardisierung, Metadaten (bmb+f) Rudi Schmiede Infrastrukturen für innovative Digital.
PADLR Submodul Modular Content Archives Ein Content Browser für Lehr- materialien aus der Elektrotechnik Dipl.-Ing. Mark Painter Institut für Nachrichtentechnik.
Dl-konzepte bmb+f-Projekt im Digital Library-Forum Rudi Schmiede Verteilte Informationsstrukturen in der Wissenschaft Digital Library Konzepte bmb+f Projekt.
Gesellschaft für wissenschaftliche Datenverarbeitung mbH Göttingen Am Fassberg, Göttingen Fon: Fax:
1 Allgemeine Fragestellung Suche nach wissenschaftlicher Information im Internet Quelle wird gefunden, aber… …Zugang nur gegen Passwort oder Zahlung Wiss.
Gegen die Vergänglichkeit digitaler Informationen Susanne Kurz AWV Sitzung Daten- und Speichermanagement, Köln,
Leistungszentren für Forschungsinformation II – Sicherung und Bereitstellung von Textquellen und Primärdaten DINI – AG Informationsmanagement Essen, 17.
Eigenschaften und Pflichten vertrauenswürdiger digitaler Archive
Das Depotsystem Digitaler Dokumente Workshop Langzeitverfügbarkeit Digitaler Dokumente 29./30. Oktober 2002 Hans Liegmann, Die Deutsche Bibliothek.
Web Services und Workflow-Steuerung
PinK Plattform für intelligente Kollaborationsportale Dr. Joachim Quantz, e.V. Berlin, 13. September 2005.
Rational Unified Process (RUP) - Definitionen
7th international Bielefeld Konferenz Thinking beyond Digital Libraries Designing the Information Strategy for the next Decade Dynamische Infrastrukturen.
Strukturänderungen Verteilte Anwendungen Wintersemester 06/07 © Wolfgang Schönfeld.
Überlegungen zur Architektur eines Fachinformations-Netzwerkes am Beispiel des CeGIM Mehrwert ist es nicht nur, Daten von ihren Quellen zu den Nutzern.
Dokumenten- und Archivsystem auf Basis kommerzieller Software Verband der Bibliotheken des Landes Dokumenten-
Langzeitarchivierung und Metadaten. NAA Preservation Strategy Link: ml.
Preservation Metadata. OAIS Reference Model Diese und folgende Quellen:
Entwurf und Realisierung einer digitalen Bibliothek zur Verwaltung von Notenhandschriften Dipl.-Ing. Temenushka Ignatova Datenbank- und Informationssysteme,
Nestor Workshop im Rahmen der GES 2007 Digitale Langzeitarchivierung und Grid: Gemeinsam sind wir stärker? Anforderungen von eScience und Grid-Technologie.
Nestor Workshop im Rahmen der GES 2007 Digitale Langzeitarchivierung und Grid: Gemeinsam sind wir stärker? Synergiepotentiale zwischen GRID- und eScience-Technologien.
1 Alexander Arimond, University of Kaiserslautern, Germany Entwicklung und Evaluation eines Raytracing-Dienstes für das Venice Service Grid Alexander Arimond.
Webservice Grundlagen
Synergiepotentiale zwischen GRID- und eScience-Technologien für die Langzeitarchivierung -Entwurf vom Prof. Dr. W. Schiffmann FernUniversität.
Nicolas Frings Maximilian Bernd Stefan Piernikarcyk
WissGrid AP3: LZA Dienste
EScience eScience ist die globale Zusammenarbeit in Schlüsselgebieten der Forschung und die nächste Generation Werkzeuge, um diese Art von Forschung zu.
Management- und Web Services- Architekturen
Expertise Grid und eScience Jens Klump nestor AG Grid/eScience DNB, Frankfurt (M),
Stand der Expertise Workshop am SUB Göttingen
Archiv Def: Siehe Digitales Langzeitarchiv.
Nestor Workshop im Rahmen der GES 2007 Digitale Langzeitarchivierung und Grid: Gemeinsam sind wir stärker? nestor und Grid Jens Ludwig Baden-Baden, 2.
Naturwissenschaft, bei der die neuen Technologien jede Phase der wissenschaftlichen Arbeit unterstützen: Die Informationsbeschaffung - Sensoren. Die Informationsverarbeitung.
Informationsdienste Torsten Rathmann (Deutsches Klimarechenzentrum, Hamburg) Workshop: Virtuelle Forschungsumgebungen aufbauen – mit D-Grid Abstract: Thema.
Wirtschaftsforum, 12. Oktober 2004 Die Technologieinitiative XML Condat AG Die Condat AG ist ein Software- und Systemhaus, das die Geschäftsprozesse seiner.
Integration existierender digitaler Bibliotheken in Lernumgebungen LEBONED (Learning Environment Based On Non Educational Digital Libraries) Dipl.-Inform.
KOOP-LITERA Tagung 2003, 8. / 9. Mai 2003 Archivierung digitaler Dokumente Problemstellung - kooperative Lösungsansätze - Aktivitäten der Österreichischen.
Deutsche Nationalbibliothek, Frankfurt am Main
Untersuchungen zur Erstellung eines
Eike Schallehn, Martin Endig
Eike Schallehn, Martin Endig
Ist das DANRW vertrauenswürdig? Manfred Thaller Universität zu Köln Köln, Die Herausforderung der Elektronischen Archivierung 16. Januar 2013.
An Approach to the Preservation of Digital Records National Archives of Australia Universität zu Köln Institut für Historisch-Kulturwissenschaftliche Informationsverarbeitung.
Digitale Langzeitarchivierung Sustainability of Digital Formats Universität zu Köln Historisch-kulturwissenschaftliche Informationsverarbeitung Hauptseminar.
Microsoft.NET InfoPoint 8. Juni 2005 Stefan Bühler.
Datenbanken im Web 1.
Vom Dokumentenserver MIAMI zum service-orientierten OAIS-konformen Archivsystem Burkard Rosenberger Universitäts- und Landesbibliothek Münster Düsseldorf,
Fedora by C. Göpfert.
Web Services Spezielle Methoden der SWT Liste V – WS 2008/2009 Christian Boryczewski.
Die digitale Langzeitarchivierung Referentin: Marietta Steinhöfel Seminar: Digitale Langzeitarchivierung Prof. Dr. Manfred Thaller
Dokumentname Folie 1 Das Virtuelle Labor des DLR – eine e-science Plattform für Wissenschaft und Industrie Jochen Wauer, DLR.
Interoperabilität in Digitalen
Projektantrag für die Umsetzung von ISO :2011 Untertitel oder Sprecher.
Das OAIS Modell Manfred Thaller Universität zu Köln
Open Archival Information System (OAIS) - Vorstellung des Referenzmodells für Langzeitarchivierung Ao.univ.Prof.
Technische Universität München, Informatik XI Angewandte Informatik / Kooperative Systeme Verteilte Anwendungen: Entwurf Dr. Wolfgang Wörndl
Patrick Richterich Lattwein GmbH Web Services Softwareentwicklung mit SOAP.
1 Lutz Ullrich SOA – serviceorientierte Architektur SOA – Was ist das?
Technische Universität München, Informatik XI Angewandte Informatik / Kooperative Systeme Verteilte Anwendungen: Web Services Dr. Wolfgang Wörndl
WebServices Vortrag zur Diplomarbeit WebServices Analyse und Einsatz von Thomas Graf FH Regensburg
UrMEL und Langzeitarchivierung mit KolibRi/Kopal-Dias
 Präsentation transkript:

1 Peter Rödig Entwicklungen im Bereich Software-Architekturen und Software-Produkte langfristiger Informationserhalt und Grid Architekturen Vascoda Informationsveranstaltung Fachliche Repositorien ZBW - Deutsche Zentralbibliothek für Weltwirtschaften - Kiel Fakultät für Informatik Institut für Softwaretechnologie Prof. Dr. Uwe M. Borghoff Tel.: 089/ Fax: 089/

2 Überblick  Kurze Vorstellung  Herausforderungen beim langfristigen Erhalt digitaler Information (LZA)  Architekturen  Serviceorientierte Architekturen  Grid Architekturen  Anwendungsarchitekturen  Gemeinsamkeiten zwischen LZA und Grid  Anwendungsszenarien  Entwicklungsstand

3 Vorstellung Aktivitäten des Instituts für Softwaretechnologie mit Bezug LZA Grundlagen:  Formalisierung der Migration (Erhalt relevanter Eigenschaften)  Erweiterung / Verfeinerung OAIS-Referenzmodell Bücher:  Langzeitarchivierung – Methoden zur Erhaltung digitaler Dokumente (dpunkt.verlag)  Long-Term Preservation of Digital Documents. Principles and Practices (Springer) Mitarbeit in nestor-AGs:  Vertrauenswürdige Archive – Zertifizierung  Grid / eScience und Langzeitarchivierung  LZA-Standards Projekte:  Langzeitarchivierung digitaler Medien (Medienmigration) (DFG/BSB)  Datenbankgestützte Langzeitarchivierung digitaler Objekte (DFG)  Vergleich bestehender Archivierungssysteme (nestor)  Mitentwicklung mediaTUM / integraTUM (Technische Universität München)  Standards und Standardisierung im Kontext von Grid-Technologien und Langzeitarchivierung (nestor)

4 Einführung in die Problemstellung der Erhaltung digitaler Information Herausforderungen beim Langzeiterhalt digitaler Information 1. Inhärente Komplexität digitaler Objekte  Logischer Abstand physisches Medium und Information „ vom Datenträger über die Bitsequenz zur Information “  Vielzahl möglicher interner (digitaler) Repräsentationsformen  Formatvielfalt  Virtualisierung  Vielzahl möglicher externer Repräsentationsformen („Sichten“) durch (parametrisierbare) Operationen (Interaktion) auf den digitalen Objekten z.B.:  Navigieren in Textdokumenten  Datenbankabfragen  Durchschreiten virtueller Museen

5 Einführung in die Problemstellung der Erhaltung digitaler Information Herausforderungen beim Langzeiterhalt digitaler Information 2. Langfristigkeit  Zeitlicher Abstand zwischen Konsument von Information und Produzent von Information (Verlust von Kontextwissen) z.B. Bedeutung von Symbolen zur Interaktion mit digitalen Objekten (Ablaufumgebung)  Zeitlicher Abstand zwischen Konsument von Information und Produzent / Nutzer von Werkzeugen (Verlust von technischem Interpretationswissen + Umsetzung in Form von HW und SW) kurz: Technische Überalterung  Integrität der physischen Medien

6 Strategien zur Erhaltung digitaler Information  Museumsansatz Aufbewahrung (Nachbau) und Betrieb der Hardware einschließlich Betriebssystem (= Computer-Plattform) plus Anwendungsprogramm (= Abspiel-/Ablauf-Umgebung)  Emulation Nachbildung der Hardware oder der Plattform oder der Umgebung in Form von Software Digitale Objekte bleiben unverändert ! Portierung: Migration der Software  Migration Überbegriff für unterschiedliche „Transformationen“ digitaler Objekte Mehr oder weniger starker Eingriff in jedes Objekt ! Schwer generalisierbarer Ansatz !

7 Serviceorientierte Architekturen (SOA) SOA: Paradigma zur Organisation und Nutzung verteilter Fähigkeiten, die auch im Besitz unterschiedlicher Organisationsbereiche sein können Kernkonzepte: Sichtbarkeit: gegenseitige Sichtbarkeit der Nachfrager und Anbieter von Fähigkeiten Interaktion: Aktivität zur Nutzung der Fähigkeiten Real-World-Effekt: Rückgabe von Information oder Zustandsänderungen an Entitäten, die an der Interaktion beteiligt sind Service: Mechanismus, um Nachfrage und Fähigkeit zusammenzubringen (umfasst Spezifikation der angebotenen Leistung und Angebot, die Leistung zu erbringen) Höherwertigere Services durch Komposition von Services Inhaltliche Unabhängigkeit von konkreten Anwendungen Bekannteste Ausprägung: Web Services (WSDL, SOAP, XML)

8 Grid Architekturen Grid: Wandlung vom HPC zur Middleware und weiter zu einer Serviceorientierten Architektur [OGSA: Open Grid Services Architecture] Kernkonzepte:  Bündelung von Ressourcen (Pooling)  Teilung von Ressourcen (Sharing)  Virtualisierung von Ressourcen Abstraktion von konkreten (Implementierungs-)Eigenschaften  Autonome (lokale) Verwaltung von Ressourcen Dafür: Definition einer Menge von Kernfähigkeiten (Diensten): Benamung von Objekten, Datendienste, Informationsdienste, Sicherheitsdienste, Job Management, Ressourcenmanagement, … Ressourcen: CPU-Leistung, Speicher, Bandbreiten, aber auch Dienste

9 Anwendungs-Architektur OAIS-Referenzmodell als Basis IP (Information Package) = Daten + beschreibende Information für LZA S: Submission A: Archival D: Dissemination Consumer Ingest AIP DIPSIP Data Management Access Archival Storage Producer AIP Preservation Planning Administration Descriptive Info Descriptive Info Hinweis: OAIS ist kein Design- oder Implementierungsmodell

10 Gemeinsamkeiten zwischen LZA und Grid  LZA: als verteilte und kooperative Aufgabe  Grids: zielen ab auf die Integration, Virtualisierung und Verwaltung von Ressourcen und Diensten innerhalb verteilter, heterogener virtueller Organisationen [OGF] Konzeptionelle und technische Anknüpfungspunkte zwischen LZA und Grids  Finden, Identifizieren und Interpretieren von Daten  Verwaltung und Publizieren von Diensten  Behandlung heterogener Datenbestände („Messy Data“)  Protokollierung von Bearbeitungsschritten („Provenancing“)  Identitäts- und Rechtemanagement  Abstraktion von technischen Eigenschaften (Migrationsfähigkeit der technischen Infrastruktur)  Sichere und konsistente Speicherung von Daten Datenreplikation und Synchronisation  Qualitätssicherung beim Ingest: Formatvalidierung, Formatkonvertierung (Inanspruchnahme Rechenleistung)  Unterstützung beim Access: Interpretation, Mining (Inanspruchnahme Rechenleistung)

11 Grid-Dienste im LZA- Kontext: Szenario 1 Producer Ressourcen Dienstleister Viren-Scan Format- Konvertierung Format- Validierung Ressourcen Transaktion Ressourcen z.B. temporärer Speicher für Rollback Ingest Pre-Ingest: technischer Prozess SIPAIP Dienste

12 Grid-Dienste im LZA- Kontext: Szenario 2 Consumer Ressourcen Suche Inhaltliche Auswertung Technische Interpretation Ressourcen Access technischer Prozess Daten + technische Interpretation = erfassbare Darstellung (Information Content) z.B. fachspez. Textmining Virtuelles AIP DIP Access Dienste

13 Grid-Architekturen Fragestellungen Langfristige Vertrauenswürdigkeit ??? Zuverlässigkeit und Verfügbarkeit von Diensten  Authentifizierung, Autorisierung  Auditing (Provenance)  Auffindbarkeit und Identifizierung von Objekten  Materialisierbarkeit virtueller Datenobjekte  Interpretierbarkeit von Bit-Sequenzen zur Erstellung von Informationsobjekten Voraussetzungen für Vertrauenswürdigkeit  Standardisierung  Organisatorische Nachhaltigkeit (Grenzen des Selbstmanagements)

14 Stand der Entwicklung grober Überblick SOA:  Anwendungen: in (LZA-)Standards und (LZA-)Produkten tw. zu finden  METS: Verknüpfung von digitalen Objekten mit Diensten  Produkte: FEDORA, DSpace, …, sowie Basisprodukte wie Datenbanksysteme  Standardisierung: immer noch in einer lebhaften Phase Keine Definition von Domänen-spezifischen Lösungen (auch nicht LZA) / Basis-Technologie Grid:  Anwendungen: Produkte verfügbar, Handhabung und Integration entwicklungsbedürftig, weitere Grundlagenarbeit und Testbeds erforderlich, LZA-Aspekte bisher untergeordnet  Standardisierung: eher am Anfang, Notwendigkeit erkannt, Abstützung auf vorhandene Standards (W3C, IETF, OASIS, …) Zur Vertiefung s. nestor-AG „Grid / eScience und LZA“, insbesondere Expertisen (Anfang 2008):  Anforderungen von eScience und Grid-Technologie an die Archivierung wissenschaftlicher Daten - Geoforschungszentrum Potsdam  Synergiepotentiale zwischen GRID- und eScience-Technologien für die Langzeitarchivierung - FernUniversität Hagen

15 ? ? ? Fragen Vielen Dank für Ihre Aufmerksamkeit!

16 Anhang HPCHigh Performance Computing OAISOpen Archival Information System -- Reference Model, ISO 14721:2003 OASISOrganization for the Advancement of Structured Information Standards OGFOpen Grid Forum IETFInternet Engineering Task Force METSMetadata Encoding and Transmission Standard SOAPProtokoll zum XML-basierten Austausch von Nachrichten, häufig auf Basis von HTTP/HTTPS (ursprünglich für Simple Object Access Protocol) WSDLWeb Services Description Language Transaktion Folge von Operationen, die entweder komplett oder gar nicht durchgeführt wird (Rollback im Fehlerfall) Virtuelles AIP In Szenario 2 wird aus den Daten mit Hilfe technischer Interpretation zum Abfragezeitpunkt ein Objekt zusammengebaut, das für den Endnutzer (Consumer) Information darstellt. Dieser Vorgang kann z.B. die Bereitstellung eines geeigneten Emulators umfassen, der ein obsoletes Format in der jeweils aktuellen Umgebung anzeigen kann. Bleibt der Vorgang für den Endnutzer verborgen, erscheint es, als sei tatsächlich ein fertiges Informationsobjekt vorhanden. Zu nestorwww.langzeitarchivierung.de