AP2: Erfassen & Kategorisieren von Datenbeständen

Slides:



Advertisements
Ähnliche Präsentationen
Beate Sturm (SUB/MPDL)
Advertisements

Anwendung von Standards vor dem Hintergrund der Langzeitarchivierung
Organisations- und Geschäftsmodelle
Library of Labs Co-funded by the Community programme eContentplus Library of Labs WP 4: Metadaten Definition Universitätsbibliothek Stuttgart (UBS)
Vom Betriebsvergleich zum Qualitätsmanagement
Zum Stand und den Perspektiven des Kompetenznetzwerks Neue Dienste, Standardisierung, Metadaten (bmb+f) Rudi Schmiede Infrastrukturen für innovative Digital.
Dr. Carolin Schreiber Abteilung Handschriften und Alte Drucke Manuscripta Mediaevalia: Perspektiven.
DIPF - IZ Bildung - InfoWeb Weiterbildung (IWWB) - Marc Rittberger © DIPF Informationsqualität von Weiterbildungsdatenbanken des InfoWeb Weiterbildung.
Kooperative Langzeitarchivierung für Wissenschaftsstandorte
Alliance for Permanent Access to the Records of Science - Eine Vision für die Langzeitarchivierung von Forschungsdaten in Europa Stefan Strathmann SUB.
Gesellschaft für wissenschaftliche Datenverarbeitung mbH Göttingen Am Fassberg, Göttingen Fon: Fax:
Dr. Roland Keilhoff HIS GmbH
Angebote zur digitalen Langzeitarchivierung
Gegen die Vergänglichkeit digitaler Informationen Susanne Kurz AWV Sitzung Daten- und Speichermanagement, Köln,
Präsentation zum Thema Netzwerk Von Jan Metz.
Seminar “Kognitionspsychologie meets Ethnologie” SS 2007
METS / MODS. METS – Metadata Encoding and Transmission Standard – 2002 veröffentlicht – XML Schema – Reale Objekte digital abbilden – hierarchische Struktur.
Georg-August-Universität Göttingen Stiftung Öffentlichen Rechts Informationstage für Studieninteressierte 2006 Herzlich Willkommen an der.
Georg-August-Universität Göttingen Stiftung Öffentlichen Rechts Informationstage für Studieninteressierte 2007 Herzlich Willkommen an der.
15. Oktober 2007Einführungsveranstaltung Master MDM Einführungsveranstaltung zum Master-Studiengang in Marketing und Distributionsmanagement.
Einführungsveranstaltung zum Master-Studiengang in Marketing und Distributionsmanagement Einführungsveranstaltung Master MDM 14. April 2009.
Projekt LS Kultur /2007. In der Folgenden Präsentation stellen wir euch ein Projekt aus dem Schwerpunkt Kultur vor. Dies ist eine Kombination aus.
Stadt Frankfurt am Main – Der Magistrat / Bürgeramt, Statistik und Wahlen Ralf Gutfleisch Design und Umsetzungskonzept koordinierter kommunaler Umfragen.
Schriftliche Prüfung Voraussichtlich zwischen 6.8. und
Kurs Schreiben 1/12 Dr. Barbara Hoffmann LiteraturKompetenz Formatiertes wissenschaftliches Schreiben Der Kurs ist zur allgemeinen Information.
1 Letzte Aktualisierung: Spree WS 2005/2006 Feedback Arbeitsaufgabe - Regelwerk Viele interessante Einsendungen Ich glaube, Sie haben verstanden,
Extensible Characterisation Definition Language (XCDL) Volker Heydegger HKI Kolloquium, Köln,
Langzeitarchivierung und Metadaten. NAA Preservation Strategy Link: ml.
Plenum UB Bochum Integration von Literaturdaten aus Open Data Universitätsbibliothek Bochum.
Das Projekt Studierendenportal für die Universität Erlangen-Nürnberg Informationsveranstaltung für die FSIn 31. Januar 2008.
Das Wasserfallmodell - Überblick
L. Braeckman, M. Valcke, P.B.A. Smits, F.J.H. Van Dijk, J.F. Gehanno, E.A. Pauncu, F. Popescu, M. Hanna, P. Bulat, K. Radon AG Arbeits- und Umweltepidemiologie.
MS Excel, Open-/LibreOffice Calc Die Menüs I Office-Logo (Excel2007) bzw. Datei (andere): die Standard-Datei- und Druckoperationen; bei MS Excel hier auch.
Entwurf und Realisierung einer digitalen Bibliothek zur Verwaltung von Notenhandschriften Dipl.-Ing. Temenushka Ignatova Datenbank- und Informationssysteme,
Nestor Workshop im Rahmen der GES 2007 Digitale Langzeitarchivierung und Grid: Gemeinsam sind wir stärker? Anforderungen von eScience und Grid-Technologie.
Variation und Validität der Empfehlungen zum Darmkrebs-Screening
© ETH-Bibliothek Pascalia Boutsiouci, Dr. Jiri Pika – ETH-Bibliothek ISKO-Tagung Wissensorganisation 2008, Konstanz, 21. Februar 2008 Pilotprojekt.
Nestor Workshop im Rahmen der GES 2007 Digitale Langzeitarchivierung und Grid: Gemeinsam sind wir stärker? Synergiepotentiale zwischen GRID- und eScience-Technologien.
Anlass und Idee Die vielfältigen Einsatzmöglichkeiten von Hochdruckwasser(strahl)- technik mit den ökonomischen und ökologischen Vorteilen sind im Markt.
Abschlussvortrag zur Studienarbeit
Erstellung eines Research Proposals
mathe online und Medienvielfalt im Mathematikunterricht
Gefördert von: Wie kann die Langzeitarchivierung von Forschungsdaten finanziert werden? Göttingen, 27. Januar 2009.
Das Pilotprojekt zur Langzeitarchvierung an der ETH Zürich
KOMOD Konzeptstudie Mobilitätsdaten Österreich ways2go 1
Theoriereferat Indexes, Scales and Typologies The Logic of Sampling
1 // Offener Katalog - Nachnutzung von Metadaten über eine serviceorientierte Systemarchitektur Trad. & offener Katalog Metadatenexporte & Neuigkeiten.
ÖWAD Indikatoren, Ist- und Soll-Größen - DI Johannes Prem, BMLFUW 1.Waldforum des ÖWAD Indikatoren, Ist- und Soll-Größen Bericht über den aktuellen Stand.
EScience eScience ist die globale Zusammenarbeit in Schlüsselgebieten der Forschung und die nächste Generation Werkzeuge, um diese Art von Forschung zu.
Expertise Grid und eScience Jens Klump nestor AG Grid/eScience DNB, Frankfurt (M),
Archiv Def: Siehe Digitales Langzeitarchiv.
Statistik als Powerpoint-Graph
Projekt: Schüler verbessern ihren Unterricht
Jede Präsentation beginnt mit dieser Seite
Projekt: Schüler verbessern ihren Unterricht
EU-Netz Berlin-Brandenburg 25. September Inhalt I. Optimierung der Website II. Erweitung des EU-Netzes um vier polnische Wojewodschaften III. Aufbau.
Ist das DANRW vertrauenswürdig? Manfred Thaller Universität zu Köln Köln, Die Herausforderung der Elektronischen Archivierung 16. Januar 2013.
Daten- und Metadatenstandards SoSe 2009 IT-Zertifikat der Philosophischen Fakultät der Universität zu Köln Dozent: Patrick Sahle 26. Juni 2009: Dublin.
online Service-Management
Museumdat 1.0 XML-basiertes Schema zur Bereitstellung von Kerndaten in museumsübergreifenden Beständen Daten- und Metadatenstandards Dozent: Patrick Sahle.
Lakof in Bad Boll 59. LaKof in Bad Boll TOP 3 CEWS Hochschulranking nach Gleichstellungsaspekten Vom bis
Reality Check 2: Planen … Manfred Thaller Universität zu Köln Köln, Die Herausforderung der Elektronischen Archivierung 9. Januar 2013.
Kommunalpolitisches Forum 2. Juni 2015 Berücksichtigung kommunaler Bedarfe und Finanzen in der Gesetzgebung der Europäischen Union: das neue paket zur.
Einbindung in laufende und zukünftige Aufgaben Rainer Lehfeldt Bundesanstalt für Wasserbau Hamburg - Workshop Büsum Ziele für NOKIS++
CL Tree MW 31.1 Business Intelligence Wintersemester 2015 / 2016 Stanislav Prokupetz.
Wissensnetzwerk „Digitale Langzeitarchivierung“: 3. Arbeitssitzung , Österreichische Nationalbibliothek 1 Österreich Von der rechtlichen.
Gesellschaft für wissenschaftliche Datenverarbeitung mbH Göttingen Am Fassberg, Göttingen Fon: Fax:
1 Suchprofile erstellen und verwalten. 2 Suchprofile bei Registrierung Hier können Sie bis zu drei Suchprofile einrichten. Diese finden Sie später unter.
Physik für Mediziner : Die Rolle der Bibliothek Vortrag zum Workshop “Audiovisuelle Wissensmedien online“ am in Göttingen Projektidee Dr. Joachim.
Einbindung von *metrics in EconStor
 Präsentation transkript:

AP2: Erfassen & Kategorisieren von Datenbeständen „Kooperative Langzeitarchivierung für Wissenschaftsstandorte“ http://kolawiss.uni-goettingen.de AP2: Erfassen & Kategorisieren von Datenbeständen Expertenworkshop 09.12.2008 Göttingen Sven Vlaeminck Niedersächsische Staats- und Universitätsbibliothek (SUB) Göttingen Historisches Gebäude, Papendiek 14, 37073 Göttingen Fon: 0551 39-4773 | Mail to: vlaeminck@sub.uni-goettingen.de

AP2 – Ziele & Methodik Ziele: Methode: Ermittlung von Eigenschaften der Datenbestände Ermittlung von Kriterien zur Kategorisierung Einbeziehen heterogener Datenbestände Methode: Evaluierung des Ist-Standes durch Nachnutzung des nestor-Online-Surveys 2007 („Bedarfsabklärung zur Langzeitarchivierung digitaler Daten an der Universität Göttingen“) Literaturstudium

= Ist-Stand Erfassung = „Kooperative Langzeitarchivierung für Wissenschaftsstandorte“ http://kolawiss.uni-goettingen.de = Ist-Stand Erfassung = Ergebnisse der Bedarfsabklärung zur Langzeitarchivierung digitaler Daten an der Universität Göttingen des nestor – Netzwerks [www.langzeitarchivierung.de]

„Gibt es Daten, die über den aktuellen Gebrauch hinweg erhalten bleiben sollen?“

Interesse an & Planung von Maßnahmen zur digitalen Langzeitarchivierung

Die Verwendung von Metadaten…

Metadatenstandards

Genutzte Formate Insgesamt wurden 96 (!) unterschiedliche Formate genannt. Schwerpunkte: Adobe PDF, Formate der MS-Office Familie, JPG, TIFF, Plain Text.

Genutzte Formate II

Datenmengen nach Fakultät

Ergebnisse Großes Interesse & großer Bedarf Kaum konkrete Planungen Starke Divergenz bei Datenumfang Formate stark heterogen, häufig proprietär Geringe Metadatenimplementierung Kaum standardisierte Metadatenschemata Komplexe Ausgangslage für dLZA von Forschungsdaten

= Kategorisierungsansätze = „Kooperative Langzeitarchivierung für Wissenschaftsstandorte“ http://kolawiss.uni-goettingen.de = Kategorisierungsansätze =

Wie lassen sich Forschungsdaten kategorisieren? Viele Ebenen der Kategorisierung denkbar: Nach ihrer (fachwissenschaftlichen) Herkunft… Nach MIME-Type o.ä. … Nach ihrem Inhalt / Content… Nach der Datengröße (z.B. in GB)… Vorschlag: Kategorisierung anhand von Kriterien, die Auswirkungen (z.B. auf Kosten oder Policy) haben… Daher: Kategorisierung anhand von Vorhaltezeiträumen & Formateignung für dLZA Vorteile: Ausreichend generisch, quantifizierbar…

Dimension I: Kategorisierung nach Vorhaltzeiträumen Kategorisierung nach geplanter Archivierungszeit Vier sinnvolle Vorhaltezeiträume: bis zu 5 Jahren bis zu 10 Jahren bis zu 30 Jahren mehr als 30 Jahre => Überführung in Service Level

Dimension II: Format-Eignung Ermittlung & Bewertung der Format-Eignung für dLZA anhand von sieben Kriterien Offenheit & Lizenzfreiheit Verbreitungsgrad Selbstdokumentation Robustheit Komplexität Schutzmechanismen Abhängigkeiten Diese Kriterien verfügen über unterschiedlich viele Ausprägungen: z.B.: Kriterium: (geringe) Abhängigkeiten Ausprägung I: Unabhängigkeit von bestimmter Hardware Ausprägung II: Unabhängigkeit von bestimmten OS Ausprägung III: Unabhängigkeit von bestimmter Software Ausprägung VI: Unabhängigkeit von externen Ressourcen

Beispiele:

Bewertung der Format-Eignung Bestimmen der Format-Eignung* durch Gewichtung der Relevanz verschiedener Kriterien-Ausprägungen (abhängig von Policy, z.B. zwischen 1 & 9) Vergabe von Punktwerten für bestimmte Formate ( z.B. Bedingung sehr gut erfüllt =2 Punkte, Kriterium mittelmäßig erfüllt = 1 Punkt, Kriterium nicht erfüllt = 0 Punkte) Multiplikation der Punktwerte für Gewicht der Kriterien-Ausprägung und dem vergebenen Wert Division durch die Anzahl der Ausprägungen eines Formats. Der Punkt-Gesamtwert bestimmt die Eignung des Formats – je höher er ausfällt, desto geeigneter ist ein Format * Nach: Rog, Judith / van Wijk, Caroline: Evaluating File Formats for Long-term Preservation. National Library of the Netherlands, Den Haag, 2008

Die Kategorisierungsmatrix (I)

Die Kategorisierungsmatrix (II)

Die Kategorisierungsmatrix (III)

Die Kategorisierungsmatrix (IV) Kategorisierungsdimension „Vorhaltezeitraum“ noch nicht implementiert Bei einer Formatbewertung für alle „Vorhaltezeitraum“ ergibt sich folgende Grafik (-> fiktive Werte!)

Diagramm zur Format-Eignung

Vielen Dank für Ihre Aufmerksamkeit! „Kooperative Langzeitarchivierung für Wissenschaftsstandorte“ http://kolawiss.uni-goettingen.de Vielen Dank für Ihre Aufmerksamkeit! Nun ist Raum für Anmerkungen und zur Diskussion…

= Leitfragen zur Diskussion = Ist diese Form der Kategorisierung zielführend? Ist das vorgeschlagene Konzept ausreichend generisch UND ausreichend konkret? Werden weitere Kriterien und Ausprägungen gesehen, die Eingang in eine Bewertung erhalten sollten? Sehen Sie andere sinnvolle Ebenen für eine Kategorisierung von Forschungsdaten? Fehlen Ihnen grundlegende Punkte, die Ihrer Meinung nach unbedingt Eingang in eine Kategorisierung finden müssten?