Präsentation herunterladen
Die Präsentation wird geladen. Bitte warten
Veröffentlicht von:Liesl Bolding Geändert vor über 10 Jahren
1
nestor Workshop im Rahmen der GES 2007 Digitale Langzeitarchivierung und Grid: Gemeinsam sind wir stärker? Synergiepotentiale zwischen GRID- und eScience-Technologien für die Langzeitarchivierung Prof. Dr. W. Schiffmann FernUniversität Hagen Baden-Baden, 2. Mai 2007
2
Ziele Langzeitarchivierung (LZA) bedeutet: Digitale Information (Daten, Texte, Multimedia, Software) langfristig speichern, wiederfinden und für die menschlichen Sinne zugänglich machen. Im Rahmen der Expertise sollen Ansatzpunkte für die Nutzung von Synergien zwischen existierenden F&E- Aktivitäten identifiziert, technische Integrationsmodelle abgeleitet und mögliche Kooperationsinfrastrukturen aufbereitet werden.
3
Vorgehen Phasen: -Potentialanalyse -Varianten für zukünftige Integration -Organisatorische Kooperationsinfrastrukturen
4
Grid-Ressourcen Der Zugriff auf die GRID-Ressourcen erfolgt über standardisierte Dienste (grid services), die mittels einer Middleware bereitgestellt werden. Im Wesentlichen können Compute- und Data- Grids unterschieden werden. Wichtige Funktionalitäten: Workflows und Scheduling RMS mit Advance Reservation Service Level Agreements (SLA)
5
eScience-Szenarien 1. Experimente oder Simulationen erzeugen Rohdaten 2. Kollaborative Interpretation von Ergebnissen 3. Wissen organisieren und vernetzen 4. Prozesse und Kontexte verwalten 5. Große Datenmengen visualisieren 6.....
6
Architektur/Schichtenmodell Verteilte Computersysteme Grid Grid-Middleware eScienceLZA
7
Prozessmodell
8
LZA-Referenzmodell OAIS-Referenzmodell (Open Archival Information System) klärt grundlegende Begriffe der Archivierung: Informationsmodell: Daten und deren Interpretation Prozessmodell: Erzeuger, Verbraucher, Management (DSEP=Deposit System for Electronic Publications)
9
LZA-Kernprobleme Persistente Speicherung der Bitfolgen Charakterisierung der gespeicherten Inhalte Wiedergabe der digital codierten Information
10
1. Persistente Speicherung der Bitfolgen Wahl der Codierung: Verhältnis Dokumentinhalt : Dokumentbeschreibung binäre vs. textuelle Formate (z.B. pdf vs. XML) Lesbarkeit vs. Overhead Auffrischung in regelmäßigen Abständen Synergiepotentiale: Data-GRID-Dienste können eingesetzt werden, um die Daten verteilt zu speichern. Durch Repliken erreicht man Redundanz/Fehlertoleranz.
11
2. Charakterisierung der gespeicherten Inhalte Charakterisierung mit Hilfe von Metadaten = Daten über Daten Semantische Beschreibung unterstützt den Suchprozess eingebettetes vs. externes Markup manuelle vs. maschinelle Erstellung URI (Uniform Resource Identifier): URN+URL (PURL, Resolutionsdienste) Synergiepotentiale: eScience kann Ontologien bereitstellen, die den manuellen Annotationsprozess unterstützen Compute-GRIDs erlauben rechenintensive Operationen wie Datamining
12
3. Wiedergabe der digital codierten Information Bei Wechsel der Hardware-/Software-Plattform ist entweder Migration der gespeicherten Inhalte oder Emulation der alten Plattform notwendig. Migration: Authentizität ist eventuell gefährdet – Aktuelle Plattformen optimal nutzbar Emulation: Erheblicher Aufwand zur Bereitstellung sämtlicher antiquierter Plattformen – Originale werden gespeichert. Synergiepotentiale: Migration bedeutet hohen Rechenaufwand zur Transformation großer Datenbestände. Hier bieten sich Compute-GRIDs an. Emulation mit Hochleistungsrechnern des GRIDs. Remote Desktops bieten Zugang zu virtuellen Lesesälen
13
Analyse existierender F&E- Projekte Prioritäten – National (22) – Europa (63) – Weltweit (8) Kategorien – Grid – LZA – eScience – Grid & eScience eScienceGrid LZA Synergiepotentiale
15
Zusammenfassung Kernprobleme der LZA Architektur/Schichtenmodell Prozessmodell Synergiepotentiale identifiziert DataGrid – Dienste zur Speicherung ComputeGrid – Dienste Migration Metadaten Abspielumgebungen
16
Vielen Dank für Ihre Aufmerksamkeit. Univ.-Prof. Dr.-Ing. Wolfram Schiffmann Fernuniversität Hagen Fakultät für Mathematik und Informatik Lehrgebiet Rechnerarchitektur Universitätsstrasse 1 D-58087 Hagen email: Wolfram.Schiffmann@FernUni-Hagen.de Telefon: +49-2231-987-325 Telefax: +49-2331-987-332
Ähnliche Präsentationen
© 2024 SlidePlayer.org Inc.
All rights reserved.