© ETH-Bibliothek Pascalia Boutsiouci, Dr. Jiri Pika – ETH-Bibliothek ISKO-Tagung Wissensorganisation 2008, Konstanz, 21. Februar 2008 Pilotprojekt Digitale Langzeitarchivierung
© ETH-Bibliothek Projektorganisation Kooperation zwischen drei Partnern Informatikdienste der ETH Zürich ETH-Bibliothek Konsortium der Schweizer Hochschulbibliotheken Phase 1: – Phase 2: – ca. Ende 2008
© ETH-Bibliothek Ausgangslage (1) Digitale Informationen an der ETH Zürich Aus der Forschung Primärdaten: digitale Messdaten Sekundärdaten: elektronische Auswertungen / Ergebnisse Aus der Verwaltung digitale Dokumente: Geschäftsdaten
© ETH-Bibliothek Ausgangslage (2) ETH-Bibliothek verfügt über vielfältige elektronische Publikationen: Zeitschriften, Datenbanken, E-Books, E-Pics etc. traditionelle Aufgabe Bereitstellung und dauerhafte Verfügbarkeit von Informationen (in gedruckter und digitaler Form) An der ETH Zürich fehlt: ein umfassender Ansatz für die langfristige Archivierung und Verfügbarkeit von digitalen Primär- und Sekundärdaten
© ETH-Bibliothek OAIS-Referenzmodell als Basis ISO-Standard seit 2001 Consultative Committee for Space Data Systems (CCSD) – NASA, ESA, DLR Referenzmodell für digitale Archivinformationssysteme, dynamisch, erweiterungsfähig Übernahme von Modulen in Projektorganisation und Strukturplan
© ETH-Bibliothek Nutzung von Erfahrungen und Kompetenzen Austausch international E-Helvetica kopal KB – Koninklijke Bibliotheek der Niederlande Kooperation mit nestor Gemeinsame Umfrage 2007 Nachnutzung: Kriterienkatalog vertrauenswürdige digitale Langzeitarchive
© ETH-Bibliothek Testdaten (1) Primärdaten Departement Erdwissenschaften der ETH Zürich Paket mit Daten aus 140 Messstationen des Schweizerischen Erdbebendienstes Projekt Replay – Multimedia-Portal System der ETH Zürich Video-Dateien (Vorlesungen)
© ETH-Bibliothek Testdaten (2) Sekundärdaten ETH-Bibliothek und Konsortium E-Journals Elsevier E-Books (Springer) E-Pics (Bildarchiv) E-Collection (Dissertationen und elektronische Publikationen der ETH- Angehörigen
© ETH-Bibliothek Metadatenanalyse (1) Standards Möglichst bestehende Standards und offene Formate verwenden Für möglichst viele Objekttypen ohne Anpassungen Metadatengewinnung Möglichst automatisierter Ablauf
© ETH-Bibliothek MetadatentypKategorie Dublin Corereine Beschreibung der Metadaten LMER / PREMISadministrative u. technische Metadaten METSPackaging XMLCodierung Metadatenanalyse (2) Metadatenstandards Geeignet für die Langzeitarchivierung
© ETH-Bibliothek Preservation Level A Preservation Level B Preservation Level C Servicelevel Aufbewahrungsdauer Kurzeitige Datenhaltung mit minimaler Serviceleistung Mittelfristige Datenhaltung mit geringer Serviceleistung Dauerhafte Datenhaltung mit umfassender Serviceleistung Definition von Preservation Levels (1) Definition für die ETH Zürich Drei Stufen und Kriterien für die Langzeitarchivierung
© ETH-Bibliothek Kriterien – Preservation Levels (2) Kriterien für die Archivierung nach den Preservation Levels Kriterien für die Speicherung gemäss Preservation Level A A.1Ein Objekt stellt kein Sicherheitsrisiko für das Archiv oder für archivierte Objekte dar. A.2Es ist eine Übergabevereinbarung mit der Archiveinrichtung zu schliessen. A.3Es ist erkennbar, wer das Objekt abliefert. Kriterien für die Speicherung gemäss Preservation Level B B.1Metadaten müssen so aufbereitet werden können, dass die Objekte für 5 bis 10 Jahre nutzbar bleiben. B.2Das Dateiformat entspricht einer Positivliste von Formaten. Kriterien für die Langzeitarchivierung gemäss Preservation Level C C.1 Umfassende inhaltliche, technische und administrative Metadaten sind vorhanden. Ein Mindeststandard der Metadaten muss definiert werden. C.2Der Objekttyp entspricht einer Positivliste von Typen. C.3Das Dateiformat entspricht einer Positivliste von Formaten (z.B. PDF/A, XML, etc.).
© ETH-Bibliothek
© ETH-Bibliothek Übergabevereinbarung Datenlieferant Art und Umfang der Lieferung Inhaltliche Umschreibung Umfang, Dateiformate, Übergabeverfahren IT-Umgebung, Metadaten etc. Verpflichtung des digitalen LZA Preservation Levels Dauer der Archivierung u. Dienstleistungsumfang Nutzungsbedingungen Zielgruppen, Nutzungsrechte Schutzfristen, Kosten etc.
© ETH-Bibliothek Online-Umfrage (1) Bedarfsanalyse April 2007 Klärung des Bedarfs an LZA digitaler Objekte an der ETH Zürich Kooperation mit Projekt nestor (SUB und Georg-August-Universität Göttingen) Adressaten Alle 15 Departemente der ETH Zürich Zentrale Dienste Rücklauf: 20%
© ETH-Bibliothek Online-Umfrage (2) Allgemeine Aussagen Über 80 % haben Interesse an einer zentralen Dienstleistung digitale Langzeitarchivierung
© ETH-Bibliothek Online-Umfrage (3) Vereinbarungen und Vorschriften ca. 80 % geben an, dass es in ihrer Organisationseinheit keine Vereinbarungen oder Vorschriften zur digitalen Langzeitarchivierung gibt.
© ETH-Bibliothek Online-Umfrage (4) Formate der zu archivierenden Daten und Objekte ASCII, CAD, DXF, EPS, FITS, EXCEL, JPEG, MATLAB, NETCDF, PDF, TIF, TXT, WORD, XML Teilweise proprietäre Formate 17 (18%)keine Antwort 29 (31%)Nein 48 (51%)Ja Liegen die dauerhaft zu archivierenden Daten in einem Standardformat vor, das in Ihrem Fach oder allgemein anerkannt und gut dokumentiert ist?
© ETH-Bibliothek Online-Umfrage (5) Gibt es in Ihrem Bereich Daten, die über den aktuellen Gebrauch hinweg erhalten bleiben sollen? <5 Jahre: 5-10 Jahre: dauerhaft: Einzeldateien (Textdateien, Bilder, PDFs etc.) Komplexe Objekte (z.B. Multimedia) DatenbankenFachspezifische Formate (GIS, CAD etc.) WebsitesAusführbare Objekte (Programme) Aufbewahrungsdauer
© ETH-Bibliothek Enthalten die betreffenden Daten eine standardisierte Beschreibung ihrer technischen Eigenschaften? Ja27 (29%) Nein48 (51%) keine Antwort19 (20%) Online-Umfrage (6) Technische Metadaten Daten und Objekte verfügen überwiegend über keine standardisierten Metadaten
© ETH-Bibliothek Enthalten die betreffenden Daten aussagekräftige deskriptive und administrative Beschreibungen, die es erlauben, diese zu einem anderen Zeitpunkt sachlich korrekt zu interpretieren? Ja50 (53%) Nein24 (26%) keine Antwort20 (21%) Inhaltliche Metadaten Rund die Hälfte der Antworten bejaht das Vorhandensein von inhaltlichen (deskriptiven und administrativen) Metadaten. Online-Umfrage (7)
© ETH-Bibliothek Entsprechen die technischen und inhaltlichen Beschreibungen einem Standard, der in Ihrem Fach oder allgemein anerkannt und dokumentiert ist? Ja39 (41%) Nein31 (33%) keine Antwort23 (26%) Online-Umfrage (8) Format der technischen u. inhaltlichen Metadaten 41 % antworten mit ja, aber nennen kein konkretes Format.
© ETH-Bibliothek Online-Umfrage (9) Aktuelle Massnahmen eine langfristige Datenhaltung ist nicht gegeben. Oft sind die Mitarbeiter selbst verantwortlich, klare Richtlinien diesbezüglich bestehen kaum. Durch welche Massnahme stellen Sie bzw. Ihre Mitarbeiter die Verfügbarkeit Ihrer Daten heute sicher? (Mehrfachnennungen erlaubt) Die Mitarbeiter sind dafür selber verantwortlich: 56 (60%) Beim Weggang von Mitarbeitenden müssen diese angeben, an welchem Ort und in welcher Form ihre Daten abgelegt sind: 49 (52%) Es gibt klare Richtlinien zur Aufbewahrung der Daten: 19 (20%) Wir haben dafür eine verantwortliche Person benannt, die sich um die Aufbewahrung langfristig relevanter Daten kümmert: 24 (26%) Ergänzungen und sonstige Vorgehensweisen: 18 (19%)
© ETH-Bibliothek Auswahl der Software und Pilot Präsentationen Lieferanten Schritt3 4 Test- Installationen Ziel: Vergleichende Pilotinstallation Vergleich zweier unterschiedlicher Ansätze
© ETH-Bibliothek Für Rückfragen stehen wir Ihnen gerne jederzeit zur Verfügung: / Telefon: