Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Das Pilotprojekt zur Langzeitarchvierung an der ETH Zürich

Ähnliche Präsentationen


Präsentation zum Thema: "Das Pilotprojekt zur Langzeitarchvierung an der ETH Zürich"—  Präsentation transkript:

1 Das Pilotprojekt zur Langzeitarchvierung an der ETH Zürich
Pascalia Boutsiouci, ETH-Bibliothek Deutscher Bibliothekartag 2007, nestor-Workshop, Leipzig, 21. März 2007

2 Ausgangslage Wissenschaftliche Prozesse an der ETH erzeugen:
digitale Messdaten (Primärdaten) elektronische Auswertungen / Ergebnisse (Sekundärdaten) ETH-Bibliothek: verfügt über Elektronische Zeitschriften, Datenbanken, E-Books (Sekundärdaten) traditionelle Aufgabe: Bereitstellung und dauerhafte Verfügbarkeit von Informationen umfassender Ansatz für langfristige Verfügbarkeit von Primär- und Sekundärdaten fehlte bisher

3 Projektziele Machbarkeit Pilotinstallation Empfehlungen
der Langzeitarchivierung von Primär- und Sekundärdaten prüfen Pilotinstallation mit relevanten Prozessen ausführen Empfehlungen für ein Nachfolgeprojekt/Hauptprojekt formulieren Entscheidungsgrundlagen für weiteres Vorgehen an der ETH Zürich schaffen Übertragbarkeit / Nachnutzung für weitere Schweizer Hochschulen bieten Primärdaten aus der Forschung Elektronische Zeitschrifen Ziel = Pilotinstallation – soll umfassen: Relevanten Prozesse für Set von Primärdaten Set von Sekundärdaten Repräsentativ sein! Pilotinstallation soll Aussagen ermöglichen, welche konkrete technische Umsetzung in einer produktiven Lösung erforderlich wäre! Sie kann noch nicht alle technischen Anforderungen erfüllen

4 Kooperation zwischen drei Partnern
Projektorganisation Kooperation zwischen drei Partnern Informatikdienste der ETH ETH-Bibliothek Konsortium der Schweizer Hochschulbibliotheken

5 Zeitplan Start – Ende – mit vorauss. Verlängerung 7 Monate + 2 Monate 9 Monate

6 Vorgehen (1) OAIS-Modell dient als Basis
3 Informationsobjekte, die sich aufeinander beziehen: SIP – Submisstion Information Package = Lieferinformationspaket, Informationen, die der Produzent d. Objektes zur Verfügung stellt. AIP – Archival Information Package = Archivierungsinformationspaket, enthält Infos über Inhalt, spez. Archivierungsinformationen (z.B. welche Programme, Konfigurationen zur Ansicht benötigt werden) – durch Metainformationen ergänzt! DIP – Dissimination Information Package = Informationspaket f. Verteilung, Paket enthält Teile von AIP, wird an Endnutzer ausgeliefert – nach Bedürfnisse generiert+zielgruppenorientiert 6 Module Ingest – Übernahme von SIPs (Lieferpaket), Qualitätssicherung, Erzeugung von AIPs Data Management – Modul f. Erstellung, Erhaltung+Zugang zur Information, die Archivbestände identifiziert+dokumentiert / Pflege d. Verwaltungsdaten Archival Storage (Aufbewahrung) – Teil, der f. Speichern + Wiederauffinden von AIP-Paketen verantwortlich ist. Administration (Systemverwaltung) – Teil, der Services + Funktionen beinhaltet, um Ablaufkontrolle f. jedes Objekt durchzuführen / Wartung d. Konfigurationen v. System-, Hard- Software + Funktionen Preservation Planning – vorausschauende digitale Bestandserhaltung / Bewertungen des Archivinhalts + Empfehlungen Archivstandards+Regeln Access (Zugang) – Teil, der Schnittstelle zum Konsumenten bildet / Kommunikation m.Endnutzer  DIPs, Ergebnislisten, Berichte

7 Vorgehen (2) OAIS-Module nestor
Übernahme in Projektorganisation und Strukturplan nestor „Kriterienkatalog vertrauenswürdige digitale Langzeitarchive“ Hat Wurzeln im Gebiet der Raumfahrt / 1997 vom Consultative Committee for Space Data Systems (CCSD) = AG NASA, ESA (European Space Agency), DLR (Deutsches Zentrum für Luft- und Raumfahrt e.V.) 2001 als ISO/DIS angenommen – als geeignetes Modell f. alle Arten von Archiven f. digitale Informationen OAIS Konzept = Standard in Form eines Rerferenzmodells für ein dynamisches erweiterungsfähiges Archivinformationssystem Nicht auf best. Datentypen, Datenformate o. Systemarichitekturen beschränkt Will anwendungsfähig und skalierbar sein f. untersch. Institutionen u. Bedürfnisse  modulare Aufteilung OAIS-Modell dient als Basis ISO-Standard 14721 Referenzmodell für digitale Archivinformationssysteme dynamisch, erweiterungsfähig

8 Kooperationen e-Helvetica (CH) Nestor (D) Kopal (D) KOSTPROBE (CH)
Projekt der Schweizerischen Nationalbibliothek Sammlung u. Archivierung elektronischer Publikationen (Helvetica) Ingest-Prozess in Produktion Nestor (D) Kompetenznetzwerk Langzeitarchivierung Kopal (D) Kooperativer Aufbau eines Langzeitarchivs digitaler Informationen KOSTPROBE (CH) Pilotprojekt der schweizerischen Koordinierungsstelle für die dauerhafte Archivierung elektronischer Unterlagen KOST Nutzung von Erfahrungen und Kompetenzen: E-Helvetica Archivierung von Sekundärdaten mit Bezug zur Schweiz. Ziel des Projekts e-Helvetica ist, die Voraussetzungen für die Sammlung, Erschliessung, Bereitstellung und Langzeiterhaltung elektronischer Helvetica zu schaffen und ein Archivierungssystem für elektronische Publikationen aufzubauen. Die Projektdauer wird auf 8 Jahre veranschlagt ( ). Anschliessend wird die Archivierung elektronischer Publikationen in die Betriebsphase überführt. Ingest ab / Bis Ende 2007 soll auch Access umgesetzt werden Elektronische Dissertationen, landeskundlich relevante Websites, amtliche Publikationen, Verlagsdaten Karger, Stämpfli Teilprojekt Archivierung Technische Umsetzung / Automatisierung / Basis auf OAIS  starr nach Referenzmodell / Module / Einbettung in Umgebung, wie sie ist / Umsetzung – Ingest Ziel  Abläufe möglichst weitläufig zu automatisieren / Normierung der Metadaten in frühen Prozessschritten / Ingest-Prozess als Toolbox aufbauen Auch bestehende Werkzeuge benutzen für Daten und Metadatenaufbereitung / Digitale Publikationen werden im Originalformat übernommen Automatisches System: Datenannahme  Daten auspacken  Metadaten umwandeln  Qualitätssicherung  Relationen, Versionsmanagement  Persistent Identifier  Kontrolle, Vervollständigung  Einspeisen in Systeme Geht ab in Produktion ( Karger-Daten) Metadaten-Modell der SLBMARC XMLPreservation Metadata Archiv-Server WTO-Ausschreibung / 2 Bandroboter ADIC, SpeichererweiterungssystemBARSLB DZ Bern HSMTape Roboter / BFS Neuenburg Tape Roboter 2. Tape Roboter in Neuenburg Daten werden redundant gespeichert (in Bern und Neuenburg) Katastrophenschutz 1 Archivpaket  vollständige Daten inkl. Metadaten werden eingespeist Roboter / 2 x 30 Terabyte Speicher / Ausbaubar auf 300 TB Access-Teil soll bis Ende 2007 realisiert werden / Zugriff beim Produzenten (Server Produzent) / Zugriff auf Cache Nestor Das Projekt "nestor - Kompetenznetzwerk Langzeitarchivierung" sieht eine seiner Aufgaben darin, Verbindungen zwischen den in Deutschland vorhandenen Kompetenzen und Aktivitäten im Bereich Langzeitarchivierung herzustellen. Unter der Überschrift "Wer Wo Was" machen wir allen interessierten Personen, Institutionen und Organisationen das Angebot, ihre Kompetenzen und Aktivitäten "öffentlich" und für andere Interessierte und Informationssuchende auffindbar zu machen - Network of Expertise in long-term Storage and availability of digital Resources in Germany Kopal Gemeinsam erarbeiten die Partner die Deutsche Nationalbibliothek, Niedersächsische Staats- und Universitätsbibliothek Göttingen, Gesellschaft für wissenschaftliche Datenverarbeitung mbH Göttingen (GWDG) und die IBM Deutschland GmbH eine technische Lösung zur Langzeitarchivierung, die neben der Bewahrung digitaler Dokumente vor allem deren zukünftige Verfügbarkeit zum Ziel hat. KOSTPROBEKOST (18 Staatsarchive) Unter dem Namen KOSTPROBE (KOST-PROjektBEgleitung) hat die KOST im September 2005 zwei Pilotprojekte gestartet. Beide werden voraussichtlich ein Jahr dauern und streben die dauerhafte Archivierung von Daten aus in den Verwaltungen eingesetzten Informationssystemen an. Eines der Projekte befasst sich mit Daten und Unterlagen des Handelsregisters, das andere mit solchen der Gebäudeversicherung. Gemeinsame Arbeitsgruppen beider Projekte untersuchen Fragen der Authentizität, der Metadaten, der Erschliessung, der Aufbewahrung und der Benutzung.

9 Datenpakete Primärdaten Departement Erdwissenschaften der ETH Zürich
Paket mit Daten aus 140 Messstationen des Schweizerischen Erdbebendienstes Projekt Multimedia-Portal System der ETH Video-Dateien (Vorlesungen) Sekundärdaten ETH-Bibliothek E-Journals (Elsevier) E-books (Springer) E-Pics (Bildarchiv) E-Collection (Dissertationen u. elektronische Publikationen von ETH-Angehörigen) Aufbau eines Portals zur automatisierten Annahme, Archivierung und Distribution von Multimediadaten

10 Metadaten Metadatenanalyse Standards
Möglichst bestehende Standards und offene Formate verwenden anwendbar für möglichst viele Objekttypen ohne Anpassungen Metadaten sollen aus Objekten möglichst automatisiert gewonnen werden können Metadatentyp Kategorie Dublin Core reine Beschreibung der Metadaten LMER / PREMIS administrative u. technische Metadaten METS Packaging XML Codierung Technische, administrative, rechtliche und beschreibende Metadaten Kriterien bei der Beschreibung der Datenpakete: Beschreibung des Datenbestandes Informationen zur produzierenden Einrichtung und zum Datenlieferanten Begründung zur Langzeitarchivierung Rechtliche Situation Sicherheit (Schutzfristen, Zugriffsbeschränkungen) Risiko bei Datenverlust / Konsequenzen Anzahl Zugriffe Mengengerüst Vernetzung / Abhängigkeit der Daten Metadaten Dateiformat des Einzelobjektes Dateigröße Datenträger Quellsystem Kopierschutz Passwortschutz Kompression Erzeugersoftware Besonderes

11 Preservation Levels Drei Stufen für das Pilotprojekt Servicelevel
Level C Dauerhafte Datenhaltung Preservation Level B Servicelevel Mittelfristige Datenhaltung Level A Kurzeitige Datenhaltung ohne weitere Datenpflege (keine Migration, kein Erfassung zusätzlicher Metadaten). Unmittelbarer online Zugriff durch Benutzende. Level B Mittelfristige Datenhaltung mit beschränkter Datenpflege. Nicht notwendiger weise Online-Zugriff. Level C Dauerhafte Datenhaltung mit umfassender Datenpflege (periodische Datenmigration, Aufnahme und Verwaltung der Metadaten). Zugriffsform nach Vereinbarung. Preservation Level A Kurzeitige Datenhaltung Aufbewahrungsdauer

12 Software und Pilotinstallation (1)
Auswahl der Software Anforderungskatalog als Grundlage für die Verhandlungen mit den Softwareanbietern technische und inhaltliche Anforderungen (Metadatenschemata, Standards etc.) Präsentationen hp / Opentext H & S (Heilig und Schubert Software AG, Wien) Es folgen: IBM / Kopal EMC Documentum / Benmark

13 Software und Pilotinstallation (2)
Bisherige Angebote entsprechen nicht unseren Anforderungen für ein „vertrauenswürdiges digitales Langzeitarchiv“ Zu lange Laufzeit, da entwicklungstechnische Anpassung der Systeme von Seiten der Anbieter erforderlich wäre Verschiebung der Testinstallation auf Nachfolgeprojekt im Anschluss an die Pilotprojekt-Phase Seriöse Tests inklusive Evaluation in der Tiefe und genaueren vertieften Ergebnissen

14 Online-Umfrage Bedarfsanalyse Kooperation mit SUB Göttingen Adressaten
LZA elektronischer Daten sowie zentral angebotenen Dienstleistungen Kooperation mit SUB Göttingen ETH Zürich Georg-August-Universität Göttingen Adressaten alle 15 Departemente der ETH Zürich Zentrale Dienste Rücklauf ETH  Mitte April 2007 Ergebnisse  Ende Mai 2007 Evtl. Detaillierte Umfrage im Rahmen des Hauptprojektes Bewusst auf technische detaillierte Fragen verzichtet Kurz und knapp Anforderungen der potentiellen Kunden AbkürzungDepartement AGRL Agrar- und Lebensmittelwissenschaften ARCH Architektur BAUG Bau, Umwelt und Geomatik BIOL Biologie BSSE Biosysteme CHAB Chemie und Angewandte Biowissenschaften ERDW Erdwissenschaften GESS Geistes-, Sozial- und Staatswissenschaften INFK Informatik ITET Informationstechnologie und Elektrotechnik MATH Mathematik MATL Materialwissenschaft MAVT Maschinenbau und Verfahrenstechnik MTEC Management, Technologie und Ökonomie PHYS Physik UWIS Umweltwissenschaften

15 Übergabe-Vereinbarung (1)

16 Übergabe-Vereinbarung (2)
Datenlieferant Art und Umfang der Lieferung Inhaltliche Umschreibung Umfang, Dateiformate, Übergabeverfahren IT-Umgebung, Metadaten etc. Verpflichtung des digitalen Archivs Preservation Levels Dauer der Archivierung und Dienstleistungsumfang Nutzungsbedingungen Zielgruppen Nutzungsrechte Schutzfristen Kosten

17 Persistent Identifier
Aufbau eines DOI-Services für die ETH Zürich Kooperation mit einer Registrierungsagentur Ein zweistufiges Verfahren wird geprüft Vergabe von Handles für alle digitalen Objekte Vergabe von DOIs für alle extern zu referenzierende Daten TIB Hannover – Registrierungsagentur für wissenschaftliche Primärdaten seit Vergabe von DOIs (zusätzlich) für alle extern zu referenzierende Daten ( mit einem Verweis auf den internen Handle)

18 Für Rückfragen stehen wir Ihnen gerne jederzeit zur Verfügung:
/ Telefon:


Herunterladen ppt "Das Pilotprojekt zur Langzeitarchvierung an der ETH Zürich"

Ähnliche Präsentationen


Google-Anzeigen