WissGrid AP3: LZA Dienste

Slides:



Advertisements
Ähnliche Präsentationen
interaktiver Web Service Workflows
Advertisements

Beate Sturm (SUB/MPDL)
Anwendung von Standards vor dem Hintergrund der Langzeitarchivierung
Zum Stand und den Perspektiven des Kompetenznetzwerks Neue Dienste, Standardisierung, Metadaten (bmb+f) Rudi Schmiede Infrastrukturen für innovative Digital.
PADLR Submodul Modular Content Archives Ein Content Browser für Lehr- materialien aus der Elektrotechnik Dipl.-Ing. Mark Painter Institut für Nachrichtentechnik.
Gesellschaft für wissenschaftliche Datenverarbeitung mbH Göttingen Am Fassberg, Göttingen Fon: Fax:
DEPARTMENT FÜR INFORMATIK
Gegen die Vergänglichkeit digitaler Informationen Susanne Kurz AWV Sitzung Daten- und Speichermanagement, Köln,
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/7 Datenbanken werden als Anhäufung von Werten eines Wertebereiches aufgefasst und Datenbankabfragen.
M. Feindt, U.Kerzel, Th. Kuhr, M. Milnik, T. Müller, G. Quast Universität Karlsruhe Grid-computing bei CDF.
Das DANRW - Spezifika Manfred Thaller Universität zu Köln Köln, Die Herausforderung der Elektronischen Archivierung 16. Januar 2013.
METS/MODS Referat im Rahmen des IT-Zertifikats f ü r Geisteswissenschaftler Leitung: P. Sahle Referentin: C. Ottnad.
WIESEL – Integration von Wissensmanagement und E-Learning auf der Basis von Semantic Web Technologien Matthias Rust, XML-Tage 2004, Berlin WIESEL Integration.
PinK Plattform für intelligente Kollaborationsportale Dr. Joachim Quantz, e.V. Berlin, 13. September 2005.
Access 2000 Datenbanken.
Datenbanken Einführung Merkmale dateiorientierte Datenverwaltung
1 Grundlagen und Anwendung der Extensible Markup Language (XML ) Peter Buxmann Institut für Wirtschaftsinformatik Johann Wolfgang Goethe-Universität Frankfurt.
Langzeitarchivierung und Metadaten. NAA Preservation Strategy Link: ml.
METS (Metadata Encoding Transmission Standard). Wer und Was Digital Library Federation Vorgänger: MoA II (1997) Standard zur Beschreibung einer Teilmenge.
Fedora Repository.
1 Produktive ZDB-Schnittstellen : OAI Bernd Althaus / 10| Produktive ZDB-Schnittstellen: OAI| Althaus | 14. Oktober 2013.
Nestor Workshop im Rahmen der GES 2007 Digitale Langzeitarchivierung und Grid: Gemeinsam sind wir stärker? Anforderungen von eScience und Grid-Technologie.
Web Content Management mit SharePoint Fabian Moritz SharePoint MVP
© ETH-Bibliothek Pascalia Boutsiouci, Dr. Jiri Pika – ETH-Bibliothek ISKO-Tagung Wissensorganisation 2008, Konstanz, 21. Februar 2008 Pilotprojekt.
Nestor Workshop im Rahmen der GES 2007 Digitale Langzeitarchivierung und Grid: Gemeinsam sind wir stärker? Synergiepotentiale zwischen GRID- und eScience-Technologien.
Grid applications, environments and programming models Präsentiert von: Beikircher Wolfgang Schgaguler Evelyn.
Synergiepotentiale zwischen GRID- und eScience-Technologien für die Langzeitarchivierung -Entwurf vom Prof. Dr. W. Schiffmann FernUniversität.
Workflow - Diagnosetool -
Nicolas Frings Maximilian Bernd Stefan Piernikarcyk
Architekturen und Techniken für computergestützte Engineering Workbenches.
Einführung Modellgetriebene Softwareentwicklung, Metamodellierung Stephan Hildebrandt.
Das Pilotprojekt zur Langzeitarchvierung an der ETH Zürich
FME Server als multidimensionale Rasterdatendrehscheibe
KIT – Universität des Landes Baden-Württemberg und nationales Forschungszentrum in der Helmholtz-Gemeinschaft Steinbuch Centre for Computing (SCC)
Virtuelle Forschungsumgebungen
EScience eScience ist die globale Zusammenarbeit in Schlüsselgebieten der Forschung und die nächste Generation Werkzeuge, um diese Art von Forschung zu.
Kapitel A: Auswahl (Graf, Steinke, Huth) *A2 Definition: Das digitale Langzeitarchiv und der Produzent müssen die wesentlichen Eigenschaften (significant.
Expertise Grid und eScience Jens Klump nestor AG Grid/eScience DNB, Frankfurt (M),
Stand der Expertise Workshop am SUB Göttingen
Archiv Def: Siehe Digitales Langzeitarchiv.
Nestor Workshop im Rahmen der GES 2007 Digitale Langzeitarchivierung und Grid: Gemeinsam sind wir stärker? nestor und Grid Jens Ludwig Baden-Baden, 2.
Archivierung von Digitalisaten
M&D- Status Seminar Datenanfragen Verfügbare Datensätze Nachfrage zu den Datensätzen Metadaten Benutzer-Anfragen Information/Schulung Probleme To Do Liste.
M. Lautenschlager (M&D/MPIM)1 Beständige Indikatoren und Langzeitarchivierung Michael Lautenschlager Modelle und Daten Max-Planck-Institut für.
Informationsdienste Torsten Rathmann (Deutsches Klimarechenzentrum, Hamburg) Workshop: Virtuelle Forschungsumgebungen aufbauen – mit D-Grid Abstract: Thema.
Integration existierender digitaler Bibliotheken in Lernumgebungen LEBONED (Learning Environment Based On Non Educational Digital Libraries) Dipl.-Inform.
KOOP-LITERA Tagung 2003, 8. / 9. Mai 2003 Archivierung digitaler Dokumente Problemstellung - kooperative Lösungsansätze - Aktivitäten der Österreichischen.
Deutsche Nationalbibliothek, Frankfurt am Main
M. Lautenschlager (M&D/MPIM)1 Beständige Indikatoren und Langzeitarchivierung Michael Lautenschlager Modelle und Daten Max-Planck-Institut für.
Eike Schallehn, Martin Endig
Die Management-Tools von Z&H COACH beinhalten zentrale Hilfsmittel für ein Management-System. Sorgfältig angewendet führen diese Tools Ihr Unternehmen.
An Approach to the Preservation of Digital Records National Archives of Australia Universität zu Köln Institut für Historisch-Kulturwissenschaftliche Informationsverarbeitung.
Vom Dokumentenserver MIAMI zum service-orientierten OAIS-konformen Archivsystem Burkard Rosenberger Universitäts- und Landesbibliothek Münster Düsseldorf,
RDA, MARC und Co. | Österreichischer Bibliothekartag Sarah Hartmann RDA, MARC und Co. Von der Formalerschließung zum Metadatenmanagement II RDA,
Fedora by C. Göpfert.
Kosten der digitalen Langzeitarchivierung
Werkzeuge: ArcCatalog, ArcMap, ArcToolbox, ArcScene Birgit Abendroth
Die digitale Langzeitarchivierung Referentin: Marietta Steinhöfel Seminar: Digitale Langzeitarchivierung Prof. Dr. Manfred Thaller
OAISter wichtigste Verbundkatalog für digitale Ressourcen Open Access wissenschaftliche Literatur und Materialien im Internet frei zugänglich zu machen.
1 Peter Rödig Entwicklungen im Bereich Software-Architekturen und Software-Produkte langfristiger Informationserhalt.
Open Archival Information System (OAIS) - Vorstellung des Referenzmodells für Langzeitarchivierung Ao.univ.Prof.
Rechen- und Kommunikationszentrum (RZ) Entwicklung einer Web- Oberfläche mit Apache Wicket am Beispiel des IdentityAdmins Seminarvortrag Melanie.
Gesellschaft für wissenschaftliche Datenverarbeitung mbH Göttingen Am Fassberg, Göttingen Fon: Fax:
Workflowsysteme und Datenbanksysteme Gliederung Motivation Basis- funktionalitäten Klassifikations- merkmale Referenz-Modell MQ Workflow Zusammenfassung.
Max Kaiser, Das Planets Digital Preservation TestbedArbeitstreffen Wissensnetzwerk Digitale:Langzeitarchivierung, Das Planets Digital Preservation.
Digitale Langzeitarchivierung als Paradigmenwechsel? Chancen, Risiken und Herausforderungen der digitalen Langzeitarchivierung am Beispiel des Österreichischen.
Key-Value Paare (KVP) - Metadaten für Kanäle speichern und nach MDF4 exportieren PM (V1.0)
OAI Protocol for Metadata Harvesting
UrMEL und Langzeitarchivierung mit KolibRi/Kopal-Dias
Abschlusspräsentation Bern,
 Präsentation transkript:

WissGrid AP3: LZA Dienste Michael Lautenschlager (DKRZ) WissGrid AP3 Review, Potsdam 28.01.10

Inhalt: Hintergrund und Motivation Aktuelle Umsetzung Beispiel: Formatdienste in Klima-Community

Langzeitarchivierung (LZA): Sicherung der Nachnutzbarkeit Bitstream Preservation: Datenentitäten bleiben erhalten Content Preservation: Datenentitäten bleiben lesbar Data Curation: Datenentitäten bleiben interpretierbar Datenentitäten: Digitale Medien und wissenschaftliche Primärdaten WissGrid LZA Dienste

LZA-Dienste, LZA-Ebenen und Akteure WissGrid Dienste-Fokus: Content Preservation

Zentraler Aspekt in Content Preservation: Anpassung vorhandener Datenformate an sich verändernde SW-Werkzeuge Strategie: Veraltete Speicherformate in aktuelle Formate konvertieren (z.B. digitale Medien) SW-Werkzeuge zum Lesen der Speicherformate auf aktuelle Rechnerarchitekturen migrieren (z.B. hoch volumige Daten aus (Klima-)Modellierung und Erdbeobachtung) WissGrid Fokus für LZA-Dienste auf A): Transformation definierter Formate kann am ehesten automatisiert und als Grid-Dienst implementiert werden.

LZA-Dienste, die sich aus WissGrid Architektur ergeben: Repository: SW-System, das Daten mit Metadaten im Grid verwaltet Formatkonvertierung: Konvertierung in neue technische Form für dasselbe intellektuelle Objekt Formatcharakterisierung: Auslesen technischer Metadaten aus Dateien Formatvalidierung: Prüft Übereinstimmung von Objekten mit Definition bzw. Charakterisierung Provenienz-Service: Informationen um Entstehung und Modifikation von Daten sollen in LZA-Repositorien integriert werden, um Nachnutzung sicherzustellen WissGrid Dienste Framework (WDF): Stellt LZA-Dienste im Grid zur Verfügung

LZA-Dienste im OAIS-Ingest als Interface zum Forschungsdatenarchiv (LZA) Formatvalidierung: Prüfung auf Formatfehler beim Einfüllen in Forschungsdatenarchiv (OAIS „quality assurance“) Formatcharakterisierung: bietet Provenienzinformation. Übergang zu Data Curation und inhaltlichen Metadaten fließend (OAIS „general descriptve information“) Formatkonvertierung: unterschieden nach „migration on ingest“, migration on access“ und „migration on obsolence“ (verschiedene OAIS Referenzen, hier „generate AIP“) Provenienz-Service: Speicherung der Prozeßinformation, enthalten in OAIS Informationspaketen.

Umsetzung Formatcharakterisierung und –validierung Funktionaler Ablauf: Identifikation des Datenformats Identifikation des richtigen Formatmoduls Formatmodul parst Daten Anwendung der Validierungskriterien Serialisierung der gewonnenen Metadaten in Zielformat Technische Umsetzung: JHOVE2 wurde entwickelt für Standard-Medienformate, Erweiterung auf NetCDF in Klima-Community im Rahmen von C3-Grid (Details AWI, Bremerhaven)

Formatkonvertierung Funktionaler Ablauf: Identifikation des Datenformats (z.B. JHOVE) Evaluation der Abhängigkeiten und Entscheidung zur Aggregation in LZA Identifikation des richtigen Konvertermoduls Ausführung des Konvertermoduls und Validierung des Zielformats Generierung von Provenienzmetadaten Technische Umsetzung: CriB und kopal Migration Manager sind Frameworks zur Formatkonvertierung (Prototypen), eigentliche Konvertierung durch externe Dienste Klima-Community: Aggregation von Einzelfiles in Container-Format (tar) CMOR-2: Konvertierung von Modelloutput in NetCDF4 CDOs (Climate Data Operators): Konvertierung in NetCDF, GRIB, ASCII WDCC des DKRZ: Konvertierung NetCDF oder GRIB in ASCII

Provenienzdienst Funktionaler Ablauf: Metadaten aus Formatcharakterisierung und –validierung werden in XML-Contianer (z.B.OGF-Usage-Record) gespeichert und mit XSLT-Mapping auf Metadaten in LZA Repositorien der Forschungsdatenarchive abgebildet (z.B. PREMIS-Standard für preservation metadata, CERA-2 im WDCC/DKRZ, ISO19115 im C3-Grid)). Technische Umsetzung: (Graphik aus AeroGrid) C3-Grid: Metadaten werden in den einzelnen Datenbearbeitungsschritten der Workflows angepasst

WissGrid Dienst Framework (WDF) Ablauf einer LZA Aufgabe: Submit: Annahme der LZA-Aufgabe (z.B. Konvertiere TIFF Daten, die älter als zwei Jahre sind, in JPEG 2000) Extract: Filterung der gefragten Daten aus Repository Identify: Auswahl einer verfügbaren CE (computing element), auf der der gefragte Dienst installiert ist Stage-In: Transfer der Daten auf das CE Stage-Out: Annahme der konvertierten Daten, nach Ablauf des Jobs Re-Ingest: Rückführung der Daten in das Repository und Aktualisierung der Metadaten

Formatdienste in Klima-Community Klimadaten: Hoch volumige, homogene Datensätze von numerischen Modellen und Satelliten, aber auch heterogene Daten aus Instrumentenbeobachtungen Eintrag in Forschungsdatenarchive (LZA): Charakterisierung/Dokumentation (Metadaten) und Konvertierung in LZA-konformes Standardformat Selbstbeschreibendes Standardformat: NetCDF/CF enthält Metadaten zur Formatcharakterisierung und in Ansätzen zur Dateninterpretation Dienste in C3-Grid: Entwicklung von Werkzeugen zur automatischen Metadatenerzeugung aus NetCDF (JHOVE-2), CDO zur Formatvalidierung und –Konvertierung, DB des WDCC/DKRZ zur Formatkonvertierung beim Datenzugriff Dienste IPCC AR5: CMOR-2 (C-Programm) als LZA Schnittstelle zur Formatvalidierung, Charakterisierung und Konvertierung (Modelldatenformat in NetCDF4) und zur Extraktion von Metadaten für den Provenienz-Service