Das Pilotprojekt zur Langzeitarchvierung an der ETH Zürich

Slides:



Advertisements
Ähnliche Präsentationen
Empfehlungen Kurzfristig Mittelfristig Langfristig Prozesse
Advertisements

Beate Sturm (SUB/MPDL)
Zentrales Verzeichnis Digitalisierter Drucke
1 Retrodigitalisierung und Langzeitarchivierung Die Bedeutung internationaler Standards Die Idee der Verteilten Digitalen Forschungsbibliothek – Bericht.
RIMAX-Koordinierung Publikationsdatenbank Metadatenbank Datensätze mit DOI Sonderhefte in Zeitschriften (WaWi, NHESS) Präsentation für Entscheidungsträger.
Online Publikationsverbund der Universität Stuttgart (OPUS) Frank Scholze Universitätsbibliothek Stuttgart.
Organisations- und Geschäftsmodelle
TeXDocC Ein gemeinsames Projekt der SUB Göttingen und der Universität Duisburg-Essen geleitet von Elmar Mittler and Günter Törner.
12. Jahrestagung der IuK 28. September 2006, Göttingen
Texteingabe Überschrift
IuK2003, Osnabrück Th. Severiens, ViFaPhys Virtuelle Fachbibliothek Physik Ein kooperatives Dienstleistungsangebot für die Physik.
Zum Stand und den Perspektiven des Kompetenznetzwerks Neue Dienste, Standardisierung, Metadaten (bmb+f) Rudi Schmiede Infrastrukturen für innovative Digital.
PADLR Submodul Modular Content Archives Ein Content Browser für Lehr- materialien aus der Elektrotechnik Dipl.-Ing. Mark Painter Institut für Nachrichtentechnik.
Alliance for Permanent Access to the Records of Science - Eine Vision für die Langzeitarchivierung von Forschungsdaten in Europa Stefan Strathmann SUB.
Gesellschaft für wissenschaftliche Datenverarbeitung mbH Göttingen Am Fassberg, Göttingen Fon: Fax:
AP2: Erfassen & Kategorisieren von Datenbeständen
Ulrich Kähler, DFN-Verein
Angebote zur digitalen Langzeitarchivierung
Gegen die Vergänglichkeit digitaler Informationen Susanne Kurz AWV Sitzung Daten- und Speichermanagement, Köln,
Leistungszentren für Forschungsinformation II – Sicherung und Bereitstellung von Textquellen und Primärdaten DINI – AG Informationsmanagement Essen, 17.
Projekt von Rechenzentrum und Universitätsbibliothek Erste Inhalte: Linguistik-Server Essen (LINSE), Semesterapparate Physik Ziel: Bereitstellung einer.
Eigenschaften und Pflichten vertrauenswürdiger digitaler Archive
Welcome to MIAMI - dem digitalen Gedächtnis der WWU.
Welcome to MIAMI - dem digitalen Gedächtnis der WWU.
Der Geo-Guide als ein Modul für eine Virtuelle Fachbibliothek Virtuelle Fachbibliothek: Wofür & Was Zentrale Anlaufstelle für den Fachwissenschaftler zur.
Dokumenten- und Archivsystem auf Basis kommerzieller Software Verband der Bibliotheken des Landes Dokumenten-
Künftige Bezugsstrukturen für elektronische Fachinformation DFG-Projekt der StUB Frankfurt/Main und der UB Potsdam Projektpräsentation für den DFG- Unterausschuß
Langzeitarchivierung und Metadaten. NAA Preservation Strategy Link: ml.
1. Metadaten-Workshop der AfS / META-LIB-Abschluss-Workskop, 21./22. Oktober 2002 Metadaten an Der Deutschen Bibliothek: Ergebnisse des DFG-Projekts META-LIB.
Das Projekt Studierendenportal für die Universität Erlangen-Nürnberg Informationsveranstaltung für die FSIn 31. Januar 2008.
Zur Rolle der Universitätsbibliotheken im Kontext der digitalen Weltbibliothek Vortrag auf der 37. Jahrestagung der Gesellschaft für Informatik am
Barbara Magagna Johannes Peterseil
Entwurf und Realisierung einer digitalen Bibliothek zur Verwaltung von Notenhandschriften Dipl.-Ing. Temenushka Ignatova Datenbank- und Informationssysteme,
Nestor Workshop im Rahmen der GES 2007 Digitale Langzeitarchivierung und Grid: Gemeinsam sind wir stärker? Anforderungen von eScience und Grid-Technologie.
© ETH-Bibliothek Pascalia Boutsiouci, Dr. Jiri Pika – ETH-Bibliothek ISKO-Tagung Wissensorganisation 2008, Konstanz, 21. Februar 2008 Pilotprojekt.
Nestor Workshop im Rahmen der GES 2007 Digitale Langzeitarchivierung und Grid: Gemeinsam sind wir stärker? Synergiepotentiale zwischen GRID- und eScience-Technologien.
E-lib.ch im europäischen Kontext von Wolfram Neubauer, Zürich Digitale Medien und Infrastrukturen / 11. u
Rechtliche Aspekte des Konsortiums der Schweizer Hochschulbibliotheken
Strategien zur Sicherung der nationalen Informationsversorgung Das Konsortium der Schweizer Hochschulbibliotheken © Konsortium der Schweizer Hochschulbibliotheken.
Nicolas Frings Maximilian Bernd Stefan Piernikarcyk
ETH E-Citations Die Hochschulbibliographie der ETH Zürich 11. InetBib-Tagung, 15. April 2010 Arlette Piguet.
Archivrechte bei Datenbanken und eJournals. Zukunft der digitalen Bestandeserhaltung? Susanne Manz, Konsortium der Schweizer Hochschulbibliotheken © Konsortium.
Universität Zürich Informatikdienste GoKoordinatorenmeeting 27. April UZH Global Storage Projekt.
KIT – Universität des Landes Baden-Württemberg und nationales Forschungszentrum in der Helmholtz-Gemeinschaft Steinbuch Centre for Computing (SCC)
Tagesordnung für die nestor AG “Standards für Metadaten, Transfer von Objekten in digitale Langzeitarchive und Objektzugriff” , Göttingen.
Expertise Grid und eScience Jens Klump nestor AG Grid/eScience DNB, Frankfurt (M),
Archiv Def: Siehe Digitales Langzeitarchiv.
Nestor Workshop im Rahmen der GES 2007 Digitale Langzeitarchivierung und Grid: Gemeinsam sind wir stärker? nestor und Grid Jens Ludwig Baden-Baden, 2.
Zauberwort Metadaten Elementares Handwerkszeug des Content- und Wissensmanagement.
BIBFRAME Stand „DNB-BIBFRAME“ 1
Konsortium der Schweizer Hochschulbibliotheken - eine Chance für die Fachhochschulen ? lib.consortium.ch Jahresversammlung Fachkommission Fachhochschul-
Konsortium der Schweizer Hochschulbibliotheken
KOOP-LITERA Tagung 2003, 8. / 9. Mai 2003 Archivierung digitaler Dokumente Problemstellung - kooperative Lösungsansätze - Aktivitäten der Österreichischen.
Deutsche Nationalbibliothek, Frankfurt am Main
World Willkommen! ETH World Info-Lunch 12. Mai, Uhr Referenten: Prof. Bernhard Plattner, Programmleiter ETH World Ursula Jutzi und Roman Klingler,
M. Lautenschlager (M&D/MPIM)1 Beständige Indikatoren und Langzeitarchivierung Michael Lautenschlager Modelle und Daten Max-Planck-Institut für.
Konzeptstudie e-Archiving Präsentation Sitzung Lenkungsausschuss Konsortium der Schweizer Hochschulbibliotheken.
Eike Schallehn, Martin Endig
Ist das DANRW vertrauenswürdig? Manfred Thaller Universität zu Köln Köln, Die Herausforderung der Elektronischen Archivierung 16. Januar 2013.
Vom Dokumentenserver MIAMI zum service-orientierten OAIS-konformen Archivsystem Burkard Rosenberger Universitäts- und Landesbibliothek Münster Düsseldorf,
Virtuelle Forschungsumgebungen existierende Bausteine einer virtuellen Forschungsumgebung: Geschichte Universität zu Köln Historisch-Kulturwissenschaftliche.
Ziel - Konzept - Realisierung 28. August 2003 Ursula Jutzi.
Strategien für die digitale Bibliothek Andreas Kirstein Leiter IT-Dienste/Stv. Direktor ETH-Bibliothek Zürich 28. Österreichischer Bibliothekartag, Linz.
Die digitale Langzeitarchivierung Referentin: Marietta Steinhöfel Seminar: Digitale Langzeitarchivierung Prof. Dr. Manfred Thaller
Kooperative Digitalisierungsprojekte als Basis virtueller Zusammenführungen verstreuter Bestände Ein Erfahrungsbericht zu internationalen Kooperationen.
MAS IS1 Elektronische Bibliothek Schweiz – E-lib.ch Ein Innovations- und Kooperationsprojekt der Schweizerischen Universitätskonferenz Zeitraum.
Bücherhallen Hamburg Welt des Lernens eLearning in der eBUECHERHALLE Wolfgang Tiedtke Internet-Portal der Bücherhallen Hamburg Wolfgang Tiedtke Welt des.
Eidgenössisches Departement des Innern EDI Schweizerisches Bundesarchiv BAR Herausforderung digitale Unterlagen: Erfahrungen und Trends
1 Tobias Steinke Langzeitarchivierungs-Policy der Deutschen Nationalbibliothek: Theorie und Praxis | 18 | Langzeitarchivierungs-Policy der DNB: Theorie.
UrMEL und Langzeitarchivierung mit KolibRi/Kopal-Dias
 Präsentation transkript:

Das Pilotprojekt zur Langzeitarchvierung an der ETH Zürich Pascalia Boutsiouci, ETH-Bibliothek Deutscher Bibliothekartag 2007, nestor-Workshop, Leipzig, 21. März 2007

Ausgangslage Wissenschaftliche Prozesse an der ETH erzeugen: digitale Messdaten (Primärdaten) elektronische Auswertungen / Ergebnisse (Sekundärdaten) ETH-Bibliothek: verfügt über Elektronische Zeitschriften, Datenbanken, E-Books (Sekundärdaten) traditionelle Aufgabe: Bereitstellung und dauerhafte Verfügbarkeit von Informationen umfassender Ansatz für langfristige Verfügbarkeit von Primär- und Sekundärdaten fehlte bisher

Projektziele Machbarkeit Pilotinstallation Empfehlungen der Langzeitarchivierung von Primär- und Sekundärdaten prüfen Pilotinstallation mit relevanten Prozessen ausführen Empfehlungen für ein Nachfolgeprojekt/Hauptprojekt formulieren Entscheidungsgrundlagen für weiteres Vorgehen an der ETH Zürich schaffen Übertragbarkeit / Nachnutzung für weitere Schweizer Hochschulen bieten Primärdaten aus der Forschung Elektronische Zeitschrifen Ziel = Pilotinstallation – soll umfassen: Relevanten Prozesse für Set von Primärdaten Set von Sekundärdaten Repräsentativ sein! Pilotinstallation soll Aussagen ermöglichen, welche konkrete technische Umsetzung in einer produktiven Lösung erforderlich wäre! Sie kann noch nicht alle technischen Anforderungen erfüllen

Kooperation zwischen drei Partnern Projektorganisation Kooperation zwischen drei Partnern Informatikdienste der ETH ETH-Bibliothek Konsortium der Schweizer Hochschulbibliotheken

Zeitplan Start – 01.09.2006 Ende – 31.03.2007 mit vorauss. Verlängerung 7 Monate + 2 Monate 9 Monate

Vorgehen (1) OAIS-Modell dient als Basis 3 Informationsobjekte, die sich aufeinander beziehen: SIP – Submisstion Information Package = Lieferinformationspaket, Informationen, die der Produzent d. Objektes zur Verfügung stellt. AIP – Archival Information Package = Archivierungsinformationspaket, enthält Infos über Inhalt, spez. Archivierungsinformationen (z.B. welche Programme, Konfigurationen zur Ansicht benötigt werden) – durch Metainformationen ergänzt! DIP – Dissimination Information Package = Informationspaket f. Verteilung, Paket enthält Teile von AIP, wird an Endnutzer ausgeliefert – nach Bedürfnisse generiert+zielgruppenorientiert 6 Module Ingest – Übernahme von SIPs (Lieferpaket), Qualitätssicherung, Erzeugung von AIPs Data Management – Modul f. Erstellung, Erhaltung+Zugang zur Information, die Archivbestände identifiziert+dokumentiert / Pflege d. Verwaltungsdaten Archival Storage (Aufbewahrung) – Teil, der f. Speichern + Wiederauffinden von AIP-Paketen verantwortlich ist. Administration (Systemverwaltung) – Teil, der Services + Funktionen beinhaltet, um Ablaufkontrolle f. jedes Objekt durchzuführen / Wartung d. Konfigurationen v. System-, Hard- Software + Funktionen Preservation Planning – vorausschauende digitale Bestandserhaltung / Bewertungen des Archivinhalts + Empfehlungen Archivstandards+Regeln Access (Zugang) – Teil, der Schnittstelle zum Konsumenten bildet / Kommunikation m.Endnutzer  DIPs, Ergebnislisten, Berichte

Vorgehen (2) OAIS-Module nestor Übernahme in Projektorganisation und Strukturplan nestor „Kriterienkatalog vertrauenswürdige digitale Langzeitarchive“ Hat Wurzeln im Gebiet der Raumfahrt / 1997 vom Consultative Committee for Space Data Systems (CCSD) = AG NASA, ESA (European Space Agency), DLR (Deutsches Zentrum für Luft- und Raumfahrt e.V.) 2001 als ISO/DIS 14721 angenommen – als geeignetes Modell f. alle Arten von Archiven f. digitale Informationen OAIS Konzept = Standard in Form eines Rerferenzmodells für ein dynamisches erweiterungsfähiges Archivinformationssystem Nicht auf best. Datentypen, Datenformate o. Systemarichitekturen beschränkt Will anwendungsfähig und skalierbar sein f. untersch. Institutionen u. Bedürfnisse  modulare Aufteilung OAIS-Modell dient als Basis ISO-Standard 14721 Referenzmodell für digitale Archivinformationssysteme dynamisch, erweiterungsfähig

Kooperationen e-Helvetica (CH) Nestor (D) Kopal (D) KOSTPROBE (CH) Projekt der Schweizerischen Nationalbibliothek 2001-2008 Sammlung u. Archivierung elektronischer Publikationen (Helvetica) Ingest-Prozess in Produktion Nestor (D) Kompetenznetzwerk Langzeitarchivierung Kopal (D) Kooperativer Aufbau eines Langzeitarchivs digitaler Informationen KOSTPROBE (CH) Pilotprojekt der schweizerischen Koordinierungsstelle für die dauerhafte Archivierung elektronischer Unterlagen KOST Nutzung von Erfahrungen und Kompetenzen: E-Helvetica http://www.snl.admin.ch/slb/slb_professionnel/projektarbeit/00719/index.html Archivierung von Sekundärdaten mit Bezug zur Schweiz. Ziel des Projekts e-Helvetica ist, die Voraussetzungen für die Sammlung, Erschliessung, Bereitstellung und Langzeiterhaltung elektronischer Helvetica zu schaffen und ein Archivierungssystem für elektronische Publikationen aufzubauen. Die Projektdauer wird auf 8 Jahre veranschlagt (2001-2008). Anschliessend wird die Archivierung elektronischer Publikationen in die Betriebsphase überführt. Ingest ab 1.1.2007 / Bis Ende 2007 soll auch Access umgesetzt werden Elektronische Dissertationen, landeskundlich relevante Websites, amtliche Publikationen, Verlagsdaten Karger, Stämpfli Teilprojekt Archivierung Technische Umsetzung / Automatisierung / Basis auf OAIS  starr nach Referenzmodell / Module / Einbettung in Umgebung, wie sie ist / Umsetzung – Ingest Ziel  Abläufe möglichst weitläufig zu automatisieren / Normierung der Metadaten in frühen Prozessschritten / Ingest-Prozess als Toolbox aufbauen Auch bestehende Werkzeuge benutzen für Daten und Metadatenaufbereitung / Digitale Publikationen werden im Originalformat übernommen Automatisches System: Datenannahme  Daten auspacken  Metadaten umwandeln  Qualitätssicherung  Relationen, Versionsmanagement  Persistent Identifier  Kontrolle, Vervollständigung  Einspeisen in Systeme Geht ab 01.01.2007 in Produktion ( Karger-Daten) Metadaten-Modell der SLBMARC XMLPreservation Metadata Archiv-Server WTO-Ausschreibung / 2 Bandroboter ADIC, SpeichererweiterungssystemBARSLB DZ Bern HSMTape Roboter / BFS Neuenburg Tape Roboter 2. Tape Roboter in Neuenburg Daten werden redundant gespeichert (in Bern und Neuenburg) Katastrophenschutz 1 Archivpaket  vollständige Daten inkl. Metadaten werden eingespeist Roboter / 2 x 30 Terabyte Speicher / Ausbaubar auf 300 TB Access-Teil soll bis Ende 2007 realisiert werden / Zugriff beim Produzenten (Server Produzent) / Zugriff auf Cache Nestor Das Projekt "nestor - Kompetenznetzwerk Langzeitarchivierung" sieht eine seiner Aufgaben darin, Verbindungen zwischen den in Deutschland vorhandenen Kompetenzen und Aktivitäten im Bereich Langzeitarchivierung herzustellen. Unter der Überschrift "Wer Wo Was" machen wir allen interessierten Personen, Institutionen und Organisationen das Angebot, ihre Kompetenzen und Aktivitäten "öffentlich" und für andere Interessierte und Informationssuchende auffindbar zu machen - Network of Expertise in long-term Storage and availability of digital Resources in Germany Kopal Gemeinsam erarbeiten die Partner die Deutsche Nationalbibliothek, Niedersächsische Staats- und Universitätsbibliothek Göttingen, Gesellschaft für wissenschaftliche Datenverarbeitung mbH Göttingen (GWDG) und die IBM Deutschland GmbH eine technische Lösung zur Langzeitarchivierung, die neben der Bewahrung digitaler Dokumente vor allem deren zukünftige Verfügbarkeit zum Ziel hat. KOSTPROBEKOST (18 Staatsarchive) http://kost-ceco.ch/phpwcms_1.2.5-DEV/index.php?id=30,31,0,0,1,0 Unter dem Namen KOSTPROBE (KOST-PROjektBEgleitung) hat die KOST im September 2005 zwei Pilotprojekte gestartet. Beide werden voraussichtlich ein Jahr dauern und streben die dauerhafte Archivierung von Daten aus in den Verwaltungen eingesetzten Informationssystemen an. Eines der Projekte befasst sich mit Daten und Unterlagen des Handelsregisters, das andere mit solchen der Gebäudeversicherung. Gemeinsame Arbeitsgruppen beider Projekte untersuchen Fragen der Authentizität, der Metadaten, der Erschliessung, der Aufbewahrung und der Benutzung.

Datenpakete Primärdaten Departement Erdwissenschaften der ETH Zürich Paket mit Daten aus 140 Messstationen des Schweizerischen Erdbebendienstes Projekt Multimedia-Portal System der ETH Video-Dateien (Vorlesungen) Sekundärdaten ETH-Bibliothek E-Journals (Elsevier) E-books (Springer) E-Pics (Bildarchiv) E-Collection (Dissertationen u. elektronische Publikationen von ETH-Angehörigen) Aufbau eines Portals zur automatisierten Annahme, Archivierung und Distribution von Multimediadaten

Metadaten Metadatenanalyse Standards Möglichst bestehende Standards und offene Formate verwenden anwendbar für möglichst viele Objekttypen ohne Anpassungen Metadaten sollen aus Objekten möglichst automatisiert gewonnen werden können Metadatentyp Kategorie Dublin Core reine Beschreibung der Metadaten LMER / PREMIS administrative u. technische Metadaten METS Packaging XML Codierung Technische, administrative, rechtliche und beschreibende Metadaten Kriterien bei der Beschreibung der Datenpakete: Beschreibung des Datenbestandes Informationen zur produzierenden Einrichtung und zum Datenlieferanten Begründung zur Langzeitarchivierung Rechtliche Situation Sicherheit (Schutzfristen, Zugriffsbeschränkungen) Risiko bei Datenverlust / Konsequenzen Anzahl Zugriffe Mengengerüst Vernetzung / Abhängigkeit der Daten Metadaten Dateiformat des Einzelobjektes Dateigröße Datenträger Quellsystem Kopierschutz Passwortschutz Kompression Erzeugersoftware Besonderes

Preservation Levels Drei Stufen für das Pilotprojekt Servicelevel Level C Dauerhafte Datenhaltung Preservation Level B Servicelevel Mittelfristige Datenhaltung Level A Kurzeitige Datenhaltung ohne weitere Datenpflege (keine Migration, kein Erfassung zusätzlicher Metadaten). Unmittelbarer online Zugriff durch Benutzende. Level B Mittelfristige Datenhaltung mit beschränkter Datenpflege. Nicht notwendiger weise Online-Zugriff. Level C Dauerhafte Datenhaltung mit umfassender Datenpflege (periodische Datenmigration, Aufnahme und Verwaltung der Metadaten). Zugriffsform nach Vereinbarung. Preservation Level A Kurzeitige Datenhaltung Aufbewahrungsdauer

Software und Pilotinstallation (1) Auswahl der Software Anforderungskatalog als Grundlage für die Verhandlungen mit den Softwareanbietern technische und inhaltliche Anforderungen (Metadatenschemata, Standards etc.) Präsentationen hp / Opentext H & S (Heilig und Schubert Software AG, Wien) Es folgen: IBM / Kopal EMC Documentum / Benmark

Software und Pilotinstallation (2) Bisherige Angebote entsprechen nicht unseren Anforderungen für ein „vertrauenswürdiges digitales Langzeitarchiv“ Zu lange Laufzeit, da entwicklungstechnische Anpassung der Systeme von Seiten der Anbieter erforderlich wäre Verschiebung der Testinstallation auf Nachfolgeprojekt im Anschluss an die Pilotprojekt-Phase Seriöse Tests inklusive Evaluation in der Tiefe und genaueren vertieften Ergebnissen

Online-Umfrage Bedarfsanalyse Kooperation mit SUB Göttingen Adressaten LZA elektronischer Daten sowie zentral angebotenen Dienstleistungen Kooperation mit SUB Göttingen ETH Zürich Georg-August-Universität Göttingen Adressaten alle 15 Departemente der ETH Zürich Zentrale Dienste Rücklauf ETH  Mitte April 2007 Ergebnisse  Ende Mai 2007 Evtl. Detaillierte Umfrage im Rahmen des Hauptprojektes Bewusst auf technische detaillierte Fragen verzichtet Kurz und knapp Anforderungen der potentiellen Kunden AbkürzungDepartement AGRL Agrar- und Lebensmittelwissenschaften ARCH Architektur BAUG Bau, Umwelt und Geomatik BIOL Biologie BSSE Biosysteme CHAB Chemie und Angewandte Biowissenschaften ERDW Erdwissenschaften GESS Geistes-, Sozial- und Staatswissenschaften INFK Informatik ITET Informationstechnologie und Elektrotechnik MATH Mathematik MATL Materialwissenschaft MAVT Maschinenbau und Verfahrenstechnik MTEC Management, Technologie und Ökonomie PHYS Physik UWIS Umweltwissenschaften

Übergabe-Vereinbarung (1)

Übergabe-Vereinbarung (2) Datenlieferant Art und Umfang der Lieferung Inhaltliche Umschreibung Umfang, Dateiformate, Übergabeverfahren IT-Umgebung, Metadaten etc. Verpflichtung des digitalen Archivs Preservation Levels Dauer der Archivierung und Dienstleistungsumfang Nutzungsbedingungen Zielgruppen Nutzungsrechte Schutzfristen Kosten

Persistent Identifier Aufbau eines DOI-Services für die ETH Zürich Kooperation mit einer Registrierungsagentur Ein zweistufiges Verfahren wird geprüft Vergabe von Handles für alle digitalen Objekte Vergabe von DOIs für alle extern zu referenzierende Daten TIB Hannover – Registrierungsagentur für wissenschaftliche Primärdaten seit 01.05.2005 Vergabe von DOIs (zusätzlich) für alle extern zu referenzierende Daten ( mit einem Verweis auf den internen Handle)

Für Rückfragen stehen wir Ihnen gerne jederzeit zur Verfügung: E-Mail: pascalia.boutsiouci@library.ethz.ch / Telefon: +41 44 632 87 40