VR als Dienstanbieter Peter Wittenburg Max Planck Compute & Data Facility Dir. RDA Europe / TAB RDA Global Co-Chair of Data Foundation & Terminology Group.

Slides:



Advertisements
Ähnliche Präsentationen
Primary Data for Chemistry
Advertisements

Vernetzung von Repositorien : DRIVER Guidelines Dr Dale Peters, SUB Goettingen 4. Helmholtz Open Access Workshop Potsdam, 17 Juni 2008.
Persistente Domänenmodelle mit JPA 2.0 und Bean Validation
Zur SCORM-Fähigkeit konventioneller XML-unterstützender eLearning Developer Tools im Projekt I-can-EIB OFFIS Oldenburger Forschungs- und Entwicklungsinstitut.
DSpace IT-Zertifikat Dedizierte Systeme Dozentin: Susanne Kurz M.A.
Daten fließen lassen XML in Microsoft Office 2003 Lorenz Goebel Frank Fischer
© 2006 Open Grid Forum OGF26 - Chapel Hill, May 2009 Addressing Metadata Challenges OGF Digital Repositories RG.
PADLR Submodul Modular Content Archives Ein Content Browser für Lehr- materialien aus der Elektrotechnik Dipl.-Ing. Mark Painter Institut für Nachrichtentechnik.
Sebastian Peters TIB-Workshop zur DOI-Registrierung 3. November 2011 DataCite Technik Vertiefung.
Wissensbasierte Daten- interpretation für einen automatisierten und adaptiven Inhaltsintegrationsprozeß Lyndon J B Nixon
1 Geistes-, Natur-, Sozial- und Technikwissenschaften – gemeinsam unter einem Dach The Academic Information Domain DGI Top-Tech-Trends Panel 2010 Dr. Wolfram.
Explizite und editierbare Metainformationen für Software Muster.
Seminar: Verteilte Datenbanken
Überlegungen zur Architektur eines Fachinformations-Netzwerkes am Beispiel des CeGIM Mehrwert ist es nicht nur, Daten von ihren Quellen zu den Nutzern.
Der Supermarkt: Eine beispielhafte Erklärung für die fünf untersten Schichten des Semantic Web Protocol Stack Nicola Henze.
Fedora Repository.
SOMA Service-Oriented Mobile learning Architecture.
Kick-off PubMan Piloten Präsentation der grundlegenden Konzepte
Überblick Ingestion (Dateneingabe) (Web)formular Batch Upload Harvest
Aichinger Christian, Strasser Jürgen
Durch die Nacht “through the night” Silbermond
Don`t make me think! A Common Sense Approach to Web Usability
1 // E-LIB - Elektronische Bibliothek - Neue Suchmaschine Überwindung heterogener Sucheinstiege Erweiterung des Medienangebotes: 18.5 Mio. Datensätze Open.
Praxisbericht über den zielgerichteten Einsatz von Marketingsystemen
Institut AIFB, Universität Karlsruhe (TH) Forschungsuniversität gegründet 1825 Towards Automatic Composition of Processes based on Semantic.
Warum brauche ich ein CMS – Content Management System?
Webservice Grundlagen
SharePoint 2010 for Information Architects
GERMAN 1013 C Kapitel 3 5.
Präsentation von Lukas Sulzer
Vom Kontext zum Projekt V Carina Berning Sabrina Gursch Pierre Streicher Intelligente Dateisysteme.
Zauberwort Metadaten Elementares Handwerkszeug des Content- und Wissensmanagement.
Clean Code Software-Entwicklung als Handwerkskunst Thomas Nagel, November 2011.
1 von 7 ViS:AT BMUKK, IT – Systeme für Unterrichtszwecke 05/11 EZ, CR Social Networks – Soziale Netzwerke Virtuelle Science Cafes & Diskussionsforen für.
Wie.
Der Supermarkt: Eine beispielhafte Erklärung für die fünf untersten Schichten des Semantic Web Protocol Stack Nicola Henze.
An Approach to the Preservation of Digital Records National Archives of Australia Universität zu Köln Institut für Historisch-Kulturwissenschaftliche Informationsverarbeitung.
->Prinzip ->Systeme ->Peer – to – Peer
Seminar: Neue Ansätze der Künstlichen Intelligenz Seite 1Ulf Schneider02. Juli 2002 Ulf Schneider Neue Ansätze der Künstlichen Intelligenz: OIL Ontology.
Die Fragen Wörter Wer? Was? Wann?.
Oracle Portal think fast. think simple. think smart. Dieter Lorenz, Christian Witt.
WebComposition & WCML Ein Vortrag von Michael Capper & Lars Völker.
Digitale Annotationen. Grundlage: John Bradley “Towards a Richer Sense of Digital Annotation: Moving Beyond a Media Orientation of the Annotation of Digital.
Text Encoding Initiative Universität zu Köln Daten- und Metadatenstandards Seminarleitung: Patrick Sahle Seminarleitung: Patrick Sahle Referentin: Anna.
Fedora by C. Göpfert.
? What is Open PS? SAP Open PS based on EPS 4.0
Dreamteam: Web 2.0 und der Katalog Anne Christensen und Thomas Hapke GBV-Verbundkonferenz
Welcome to Web Services & Grid Computing Jens Mache
1 Linked Open Data Klaus Tochtermann ZBW – Leibniz Information Centre for Economics Hamburg/Kiel Christian-Albrechts-University Kiel Sept. 7, 2011.
Physik multimedial Lehr- und Lernmodule für das Studium der Physik als Nebenfach Julika Mimkes: Links to e-learning content for.
OAISter wichtigste Verbundkatalog für digitale Ressourcen Open Access wissenschaftliche Literatur und Materialien im Internet frei zugänglich zu machen.
Gregor Graf Oracle Portal (Part of the Oracle Application Server 9i) Gregor Graf (2001,2002)
Thomas Rau, Peter Brichzin Repositories zur Unterstützung von kollaborativen Arbeiten in Softwareprojekten.
EUROPÄISCHE GEMEINSCHAFT Europäischer Sozialfonds EUROPÄISCHE GEMEINSCHAFT Europäischer Fonds für Regionale Entwicklung Workpackage 5 – guidelines Tasks.
Berliner Elektronenspeicherring-Gesellschaft für Synchrotronstrahlung m.b.H., Albert-Einstein-Straße 15, Berlin frontend control at BESSY R. Fleischhauer.
1 Einführungskurs BORIS Submitter Medizin, Vetsuisse, Naturwissenschaften Datum Name e-Library UB Bern
Digital Repository Auffindbare Publikationen. Was sind Repositorien ? Als Repositorium bezeichnet man eine Struktur in der Dokumente Organisiert abgelegt.
Vertrauenswürdige Repositorien Take Away Botschaften I Repositorien sind Kern moderner Dateninfrastrukturen Repositorien müssen vielschichtige Vertrauensrelationen.
Key-Value Paare (KVP) - Metadaten für Kanäle speichern und nach MDF4 exportieren PM (V1.0)
Patrick Richterich Lattwein GmbH Web Services Softwareentwicklung mit SOAP.
Warum Data Science Ausbildung an einer Wirtschaftsuniversität? Axel Polleres, Institut für Informationswirtschaft, WU
LLP DE-COMENIUS-CMP Dieses Projekt wurde mit Unterstützung der Europäischen Kommission finanziert. Die Verantwortung für den Inhalt dieser.
Premiere Conferencing GmbH
OAuth 2.0 Ralf Hoffmann 03 / 2017
Metadata - Catalogues and Digitised works
Auf dem Campingplatz.
eSciDoc als Plattform für die Wissenschaft Anwendungen und Szenarien
PI Infrastruktur in der Max-Planck-Gesellschaft
OFFICE 365 FOCUS SESSION SHAREPOINT ONLINE 101:LERNE DIE BASICS 19. März 2018 Höhr-Grenzhausen.
 Präsentation transkript:

VR als Dienstanbieter Peter Wittenburg Max Planck Compute & Data Facility Dir. RDA Europe / TAB RDA Global Co-Chair of Data Foundation & Terminology Group Co-Chair of Data Fabric Group

Overview Repositorien sind Kern Beispiel im Detail Verändern Clouds die Welt? Welt der Metadaten was sonst noch?

 G8/FAIR/FORCE11/etc. – data should be  searchable/findable-> create useful/rich metadata  accessible -> deposit in trusted repository and use PIDs  interpretable-> create metadata, register schema and semantics  re-usable-> provide contextual metadata  persistent-> provide persistent repositories Repositorien sind essentiell Daten, PIDs, Metadaten müssen gespeichert, gepflegt und zugreifbar gemacht werden.

Scientists, Data Curators, End Users, Applications Enabling Technologies Discovery Access (ref. resolution, protocols, AAI) Interpretation Reuse Accessed via Repositories ID Datasets ID ID ID ID requires to look into the object and thus use content and contextual information Orthogonale Zugriffs-Schichten metadata domain PID

Data Managers Data Scientists Enabling Technologies Collections + Properties Access (ref. resolution, protocols, AAI) formalized policies workflow engine Assessment Accessed via Repositories ID Datasets ID ID ID ID can all be done based on properties stored in PID/Metadata attributes (in general external prop.) Typische Management Schichten PID

Enger Zusammenhang essentiell für Bibliothekare nicht Neues allerdings sind e- Kataloge (Meta daten) zentral aggregiert und wir brauchen nicht so viele Repositorien, da Zugriffskopien auch zentral gehalten werden können

what Persistente Identifikatoren sind Anker

Fast überall sind Repositorien der Kern Project-Infrastructures (NoMaD, DOBES, etc.) Domain-Infrastructures (DARIAH, CLARIN, ELIXIR, etc.) e-Infrastructures (EUDAT, OpenAIRE, EGI, etc.) Data Generators Data Users GLUE? Researcher defined IT defined Daten und Metadaten werden aggregiert in verschiedenen zertifizierten Zentren.

Overview Repositorien sind Kern Beispiel im Detail Verändern Clouds die Welt? Welt der Metadaten was sonst noch?

DOBES Beispiel weltweit verteilte Teams erzeugen Daten (im Prinzip Long Tail, insgesamt 20 TB) keine lokalen Repositorien zentrales Repositorium mit diversen Funktionen Klärung der Rechte (Copyright, Archiv-Recht, CoC) konsequenter Einsatz von PIDs

DOBES Beispiel Aufgaben des zentralen Repositoriums: web-basiertes Upload von Daten+Metadaten (insgesamt 600 Wiss. weltweit mit originär und abgeleiteten Daten) MD Vereinbarung (IMDI) und Editor (lokal, web) !!! eigene Gruppierung der Daten (mehrere möglich) manuelle Intervention wäre unmöglich Kuration der Daten und Metadaten syntaktische Checks durch Programme – alles XML Konsistenz des Repositoriums (stimmen alle Verweise etc.) bei Metadaten Histogramme um Fehler zu identifizieren und manuell zu korrigieren bei Daten (Annotationen) keine Einigung Persistenz automatische Distribution zu 4 externen Repositorien in D (MPG+) 2 verschiedene Protokolle und zwei verschiedene SW Systeme Distribution zu regionalen Rep (wichtig - Stabilität?, Anschluss?, etc.) Beschluss der MPG!!!

DOBES Beispiel Aufgaben des zentralen Repositoriums: Upload Dienst und unmittelbare Sichtbarkeit im Portal Typ/Gruppen basierte Festlegung der Zugriffsrechte (4 Klassen – ständiges Problem) Metadaten Portale Standard Browser + Suchtool (ungeliebt) web-Interface mit Bildern etc. (geliebt aber wie und aufwendig) Kollektions-Tool Annotations-Tools Erzeugung lokal und web (techno Desaster) Visualisierung lokal und web kombinierte Metadaten und Annotations-Suche Lexikon Tool kombiniert lokal und web (techno Desaster) Relations-Tool als Zugangs-Tool

DOBES Beispiel Gate Keeper Handle PID System Metadaten Daten Repli- kator Repli- kator Metadaten & Daten Index Export Generators OAI-PMH GOOGLE OLD (RDF) MD Suche Annotations- Suche Applikationen Visualisierung Annotation Navigation etc. entferne alle Software – Archiv ist doch intakt

DOBES Beispiel Was bleibt nach 15 Jahren? MPI hat entschieden, nicht mehr Träger sein zu wollen wer ist verantwortlich? Bit-Speicherung ist gesichert Basis-Zugang ist gesichert aber wie Zugriffs-Rechte sicher übertragen Software Stack nicht zu pflegen, dh. Applikationen verschwinden z.T. Übertrag auf neues Repository-System (FEDORA) intendiert, da alle Metadaten explizit in XML Dateien inklusiv der ganzen Ordnung enthalten sind

NoMaD Beispiel  Novel Materials Discovery project Computational material science  Many labs create large amounts of data about materials and compounds  Chemical compounds space is endless  How to quickly find useful compounds in case of specific needs?  In MPS several institutes (experimental + ab initio simulations)  NoMaD brings together result data into one repository (incl. metadata, DOI, etc.)  Finding patterns across results to detect hidden classes (comp + vis)  MPCDF does infra development, runs archive and provide HPC/clusters  Structure is similar to DOBES  Group of specialists find agreements  Offering central services  Driven by research questions

NoMaD = DOBES? es ist alles nicht so verschieden NoMaD will große Berechnungen auf Daten machen - aber werden das nicht auch die Linguisten? wenn das alles gleich ist – warum dann nicht Core Componenten bilden?

EUDAT-Beispiel

Overview Repositorien sind Kern Beispiel im Detail Verändern Clouds die Welt? Welt der Metadaten was sonst noch?

Cloud Welle includes a local virtualisation layer Application Software (rights, md, relations, social tags, etc.) pointer (hash code) dispatcher MD in der Applikation verborgen schnelle Indexe auch gespeichert und zugreifbar?

Global Cloud of DOs Diagram thanks to Larry Lannom.

Overview Repositorien sind Kern Beispiel im Detail Verändern Clouds die Welt? Welt der Metadaten was sonst noch?

Metadaten-Erzeugung MD werden zu verschiedenen Zeitpunkten zu verschiedenen Zwecken von verschiedenen Aktoren erzeugt MD werden von verschiedenen Aktoren zu verschiedenen Zwecken verwendet Typen von Metadaten Erzeugungs-MD (wann, wo, was, wie, wer, warum) – zB. JPEG Header System-MD (Orte, Größe, Rechte, Zeit-Dauer, etc.) Relations-MD (wie verknüpft, etc.) Kollektions-MD (Lizenz, Preis, welche Zusammenstellung, etc.) Provenance-MD (wie, wann und durch wen abgeleitet) zumeist noch manuelle Erzeugung von MD zunehmend automatische Erzeugung von MD

Metadaten-Realität wenig ist standardisiert, Spreadsheets dominieren darum...

Metadaten-Funktionen Zitierung globale Suche aus allgemeinem Interesse spezielle Such für die wissenschaftliche Analyse (nur MD, Kollektions-Bildung) Management, Kuration Auffinden verdeckter Relationen (LOD) Interpretation und Wiedernutzung von Daten Entstehung von Daten ?

Metadaten-Fragen gibt es einen MD Standard? nein – wozu auch gibt es Prinzipien? ja registriere Syntax und Semantik in offenen Registries !!!! mache MD für OAI-PMH verfügbar trenne MD Speicherung und Index registriere und verwende Vokabulare wo möglich verwende breit genutzte Tools für Index, Suchmaschine, etc. erzeuge wiederverwendbare Komponenten macht ein Gold-Standard Sinn? jein sind Spreadsheets ok? nein sind DBMS ok? – jein was sind Kollektionen? – haben nur Metadaten wann soll man MD erzeugen? – so früh wie möglich, sonst teuer  mögen Wiss MD? nein – es sei denn, dass sie Mehrwert bieten

Overview Repositorien sind Kern Beispiel im Detail Verändern Clouds die Welt? Welt der Metadaten was sonst noch?

Was noch? Sind Digitales Archiv und Digitales Repository das gleiche? analog: never touch the object digital: frequently touch the object Software-Zuverlässigkeit ist entscheidend Daten und Metadaten werden kopiert woher weiß ich, was original und richtig ist? bei Verwendung von PIDs kann ich das eindeutig angeben Können Kopien aktiv gemacht werden? man muss das Zugriffsrechte-Problem lösen man muss das Synchronisations-Problem lösen Was ist Unterschied zwischen Big Data und Long-Tail Data? in Bezug auf DO gibt es keinen technischer und sozialer Kontext der Erzeugung ist verschieden ?

Vielen Dank für Ihre Aufmerksamkeit.

Questions Do you accept