Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Sven Vlaeminck | SUB Göttingen Kooperative Langzeitarchivierung für Wissenschaftsstandorte AP2: Erfassen & Kategorisieren.

Ähnliche Präsentationen


Präsentation zum Thema: "Sven Vlaeminck | SUB Göttingen Kooperative Langzeitarchivierung für Wissenschaftsstandorte AP2: Erfassen & Kategorisieren."—  Präsentation transkript:

1 Sven Vlaeminck | SUB Göttingen Kooperative Langzeitarchivierung für Wissenschaftsstandorte AP2: Erfassen & Kategorisieren von Datenbeständen Expertenworkshop Göttingen Sven Vlaeminck Niedersächsische Staats- und Universitätsbibliothek (SUB) Göttingen Historisches Gebäude, Papendiek 14, Göttingen Fon: | Mail to:

2 Sven Vlaeminck | SUB Göttingen AP2 – Ziele & Methodik Ziele: Ermittlung von Eigenschaften der Datenbestände Ermittlung von Kriterien zur Kategorisierung Einbeziehen heterogener Datenbestände Methode: Evaluierung des Ist-Standes durch Nachnutzung des nestor- Online-Surveys 2007 (Bedarfsabklärung zur Langzeitarchivierung digitaler Daten an der Universität Göttingen) Literaturstudium

3 Sven Vlaeminck | SUB Göttingen = Ist-Stand Erfassung = = Ist-Stand Erfassung = Ergebnisse der Bedarfsabklärung zur Langzeitarchivierung digitaler Daten an der Universität Göttingen des nestor – Netzwerks [www.langzeitarchivierung.de] Kooperative Langzeitarchivierung für Wissenschaftsstandorte

4 Sven Vlaeminck | SUB Göttingen Gibt es Daten, die über den aktuellen Gebrauch hinweg erhalten bleiben sollen?

5 Sven Vlaeminck | SUB Göttingen Interesse an & Planung von Maßnahmen zur digitalen Langzeitarchivierung

6 Sven Vlaeminck | SUB Göttingen Die Verwendung von Metadaten…

7 Sven Vlaeminck | SUB Göttingen Metadatenstandards

8 Genutzte Formate Insgesamt wurden 96 (!) unterschiedliche Formate genannt. Schwerpunkte: Adobe PDF, Formate der MS-Office Familie, JPG, TIFF, Plain Text.

9 Sven Vlaeminck | SUB Göttingen Genutzte Formate II

10 Sven Vlaeminck | SUB Göttingen Datenmengen nach Fakultät

11 Sven Vlaeminck | SUB Göttingen Ergebnisse Großes Interesse & großer Bedarf Kaum konkrete Planungen Starke Divergenz bei Datenumfang Formate stark heterogen, häufig proprietär Geringe Metadatenimplementierung Kaum standardisierte Metadatenschemata Komplexe Ausgangslage für dLZA von Forschungsdaten

12 Sven Vlaeminck | SUB Göttingen Kooperative Langzeitarchivierung für Wissenschaftsstandorte = Kategorisierungsansätze =

13 Sven Vlaeminck | SUB Göttingen Wie lassen sich Forschungsdaten kategorisieren? Viele Ebenen der Kategorisierung denkbar: -Nach ihrer (fachwissenschaftlichen) Herkunft… -Nach MIME-Type o.ä. … -Nach ihrem Inhalt / Content… -Nach der Datengröße (z.B. in GB)… Vorschlag: -Kategorisierung anhand von Kriterien, die Auswirkungen (z.B. auf Kosten oder Policy) haben… -Daher: Kategorisierung anhand von Vorhaltezeiträumen & Formateignung für dLZA -Vorteile: Ausreichend generisch, quantifizierbar…

14 Sven Vlaeminck | SUB Göttingen Dimension I: Kategorisierung nach Vorhaltzeiträumen Kategorisierung nach geplanter Archivierungszeit Vier sinnvolle Vorhaltezeiträume: -bis zu 5 Jahren -bis zu 10 Jahren -bis zu 30 Jahren -mehr als 30 Jahre => Überführung in Service Level Vorhaltezeiträume (4 Kategorien) weniger als 5 Jahre bis 10 Jahre bis 30 Jahre mehr als 30 Jahre

15 Sven Vlaeminck | SUB Göttingen Dimension II: Format-Eignung Ermittlung & Bewertung der Format-Eignung für dLZA anhand von sieben Kriterien -Offenheit & Lizenzfreiheit -Verbreitungsgrad -Selbstdokumentation -Robustheit -Komplexität -Schutzmechanismen -Abhängigkeiten Diese Kriterien verfügen über unterschiedlich viele Ausprägungen: -z.B.: Kriterium: (geringe) Abhängigkeiten Ausprägung I: Unabhängigkeit von bestimmter Hardware Ausprägung II: Unabhängigkeit von bestimmten OS Ausprägung III: Unabhängigkeit von bestimmter Software Ausprägung VI: Unabhängigkeit von externen Ressourcen

16 Sven Vlaeminck | SUB Göttingen Beispiele:

17 Bewertung der Format-Eignung Bestimmen der Format-Eignung* durch a)Gewichtung der Relevanz verschiedener Kriterien- Ausprägungen (abhängig von Policy, z.B. zwischen 1 & 9) b)Vergabe von Punktwerten für bestimmte Formate ( z.B. Bedingung sehr gut erfüllt =2 Punkte, Kriterium mittelmäßig erfüllt = 1 Punkt, Kriterium nicht erfüllt = 0 Punkte) c)Multiplikation der Punktwerte für Gewicht der Kriterien-Ausprägung und dem vergebenen Wert d)Division durch die Anzahl der Ausprägungen eines Formats. Der Punkt-Gesamtwert bestimmt die Eignung des Formats – je höher er ausfällt, desto geeigneter ist ein Format * Nach: Rog, Judith / van Wijk, Caroline: Evaluating File Formats for Long-term Preservation. National Library of the Netherlands, Den Haag, 2008

18 Sven Vlaeminck | SUB Göttingen Die Kategorisierungsmatrix (I)

19 Sven Vlaeminck | SUB Göttingen Die Kategorisierungsmatrix (II)

20 Sven Vlaeminck | SUB Göttingen Die Kategorisierungsmatrix (III)

21 Sven Vlaeminck | SUB Göttingen Die Kategorisierungsmatrix (IV) Kategorisierungsdimension Vorhaltezeitraum noch nicht implementiert Bei einer Formatbewertung für alle Vorhaltezeitraum ergibt sich folgende Grafik (-> fiktive Werte!)

22 Sven Vlaeminck | SUB Göttingen Diagramm zur Format-Eignung

23 Sven Vlaeminck | SUB Göttingen Vielen Dank für Ihre Aufmerksamkeit! Nun ist Raum für Anmerkungen und zur Diskussion… Kooperative Langzeitarchivierung für Wissenschaftsstandorte

24 Sven Vlaeminck | SUB Göttingen = Leitfragen zur Diskussion = Ist diese Form der Kategorisierung zielführend? -Ist das vorgeschlagene Konzept ausreichend generisch UND ausreichend konkret? -Werden weitere Kriterien und Ausprägungen gesehen, die Eingang in eine Bewertung erhalten sollten? Sehen Sie andere sinnvolle Ebenen für eine Kategorisierung von Forschungsdaten? Fehlen Ihnen grundlegende Punkte, die Ihrer Meinung nach unbedingt Eingang in eine Kategorisierung finden müssten?


Herunterladen ppt "Sven Vlaeminck | SUB Göttingen Kooperative Langzeitarchivierung für Wissenschaftsstandorte AP2: Erfassen & Kategorisieren."

Ähnliche Präsentationen


Google-Anzeigen