Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Trainingsmodul 1.5 Förderung der Weiterverwendung von offenen Regierungsdaten durch die Open Data Interoperability Platform (ODIP)

Ähnliche Präsentationen


Präsentation zum Thema: "Trainingsmodul 1.5 Förderung der Weiterverwendung von offenen Regierungsdaten durch die Open Data Interoperability Platform (ODIP)"—  Präsentation transkript:

1 Trainingsmodul 1.5 Förderung der Weiterverwendung von offenen Regierungsdaten durch die Open Data Interoperability Platform (ODIP)

2 Diese Präsentation wurde von PwC erstellt Autoren: Michiel De Keyzer, Nikolaos Loutas and Stijn Goedertier Disclaimer The views expressed in this presentation are purely those of the authors and may not, in any circumstances, be interpreted as stating an official position of the European Commission. The European Commission does not guarantee the accuracy of the information included in this presentation, nor does it accept any responsibility for any use thereof. Reference herein to any specific products, specifications, process, or service by trade name, trademark, manufacturer, or otherwise, does not necessarily constitute or imply its endorsement, recommendation, or favouring by the European Commission. All care has been taken by the author to ensure that s/he has obtained, where necessary, permission to use any parts of manuscripts including illustrations, maps, and graphs, on which intellectual property rights already exist from the titular holder(s) of such rights or from her/his or their legal representative. Präsentation Metadaten Slide 2 Open Data Support wird von der Europäischen Kommission finanziert, gemäß SMART 2012/0107 ‘Lot 2: Provision of services for the Publication, Access and Reuse of Open Public Data across the European Union, through existing open data portals’(Vertrag No. 30- CE /00-17).

3 Lernziele Am Ende dieses Trainingsmodul sollten Sie verstehen : wie Sie die Barrieren der Weiterverwendung für Ihre Datensätze überwinden können. wie Open Data Support die Weiterverwendung von Datensätzen fördern kann. was das DCAT Anwendungsprofil ist und wie es verwendet werden kann. was die Open Data Interoperability Platform (ODIP) ist und wie sie verwendet werden kann. Slide 3

4 Inhalt Dieses Modul enthält... einen Überblick über den Kontext von offenen Regierungsdaten in Europa. einen Überblick über das Open Data Support Projekt. Informationen über das DCAT Anwendungsprofil für Datenportale in Europa als ein homogenisiertes Metadaten Modell. Information darüber, wie die Open Data Interoperability Platform verwendet werden kann. Slide 4

5 Es gibt mehr als 150 Portale in Europa, die offene Regierungsdaten hosten Existing OGD Portal Slide 5

6 Open Data haben ein großes Potenzial, um sozialen und ökonomischen Wert zu schaffen Slide 6 Developers / Companies integrate data into app (services) Public administrations share data online Citizens/businesses benefits from the app (services) Developers / Companies search for data Publishing data Reusing data

7 Hindernisse für die Veröffentlichung und Weiterverwendung von Open Data HerausgeberWiederverwender Keine Übersicht darüber, welche Daten mit höherer Wahrscheinlichkeit wiedergenutzt werden /welche ein höheres ROI-Potenzial haben. Mangel an Überblick über vorhandene/verfügbare Datensätze Unklare Geschäftsmodelle für die Veröffentlichung von Open Data Unklare Geschäftsmodell für das Veröffentlichen von Open Data. Beschränkte Toolunterstützung.Daten sind oft von geringer Qualität, veraltet, unstrukturiert und/oder nicht maschinenlesbar Konkurrierende Lizenzen für DatensätzeMangel an Lizenzinformation oder inkompatible Lizenzen Konkurrierende Vokabulare, mit denen Datensätze beschrieben werden. Unterschiedliche Vokabulare bei der Suche nach Datensätzen Domainspezifische Metadaten - Anforderungen Mangel an Metadaten (von hoher Qualität) Anstrengungen, die nötig sind, um die Metadaten aktuell zu halten. Mangel an Informationen über die Herkunft Slide 7 Metadaten

8 Keine Weiterverwendung= kein sozialer und ökonomischer Wert Slide 8 Public administrations share data online Developers / Companies integrate data into app (services) Citizens/businesses benefits from the app (services) Developers / Companies search for data

9 Open Data Support...von der Europäischen Kommission finanziert, zielt DG CONNECT darauf ab, Zugangs- und Bewusstseinsbarrieren zu senken. Slide 9

10 Die Aufgabe von Open Data Support... Slide 10 Die Sichtbarkeit und der Zugang zu Datensätzen auf lokalen und nationalen offene Datenportalen soll verbessert werden, um damit deren Weiterverwendung innerhalb von Grenzen und grenzüberschreitend zu steigern. Siehe auch: Siehe auch:

11 Mit Hilfe von... Einem vereinheitlichten Zugang zu Metadaten- Beschreibungen von offenen Datensätzen von einem einzelnen Zugangspunkt aus. ODIPP Pan-European Data portal Slide 11

12 DCAT Anwendungsprofil Ein gemeinsames Vokabular für die Beschreibung von Datensätzen, die in Datenportalen gehostet sind und die auf dem „Data Catalogue vocabulary“ (DCAT) basieren. Slide 12

13 Eine gemeinsame Initiative von... Funded by the ISA Programme under Action 1.1. “Improving semantic interoperability in European eGovernment systems” (a.k.a the SEMIC project).SEMIC Slide 13

14 Eine internationale Arbeitsgruppe von Experten Vorsitzender: Antonio Carneiro (Amt für Veröffentlichungen) 59 Arbeitsgruppenmitglieder, bestehend aus: -16 europäischen Mitgliedstaaten (UK,IT,ES,DK,NO,DE,SK,BE,AT,SE,FI,FR,IE,NL,GR,SI ) -den USA -mehreren europäischen Institutionen und internationalen Organisationen -40 verschiedenen Datenportalen Slide 14 Siehe auch: https://joinup.ec.europa.eu/asset/dcat_application_profile/description Siehe auch: https://joinup.ec.europa.eu/asset/dcat_application_profile/description

15 Durch die Verwendung eines gemeinsamen Metadaten-Schema, um Datensätze zu beschreiben und Metadaten auszutauschen... Datenherausgeber erhöhen die Auffindbarkeit und so die Weiterverwendung ihrer Daten. Datenverwender können gleichmäßig über Plattformen hinweg suchen, ohne mit Schwierigkeiten konfrontiert zu sein, die durch die Verwendung von separaten Modellen oder durch Sprachunterschieden entstehen. Slide 15 Die Qualität und die Verfügbarkeit der Beschreibung von Metadaten hat einen direkten Einfluss darauf, wie leicht Datensätze gefunden werden können!

16 Die DCAT-AP ermöglicht den Austausch von Metadaten-Beschreibungen zwischen Datenportalen Slide 16

17 Was macht die Spezifikation aus? Slide 17

18 Wo können Sie es finden? Slide 18 https://joinup.ec.europa.eu/asset/dcat_application_profile/description

19 Die DCAT Anwendungsprofil Datenmodel Slide 19

20 Verwendung des DCAT Anwendungsprofils Obligatorische Klasse: Ein Empfänger von Daten MUSS in der Lage sein, Informationen über Instanzen der Klasse zu verarbeiten; ein Absender von Daten MUSS Informationen über Instanzen der Klasse liefern. Empfohlene Klasse: Ein Empfänger von Daten MUSS in der Lage sein, Informationen über Instanzen der Klasse zu verarbeiten; ein Absender von Daten MUSS Informationen über Instanzen der Klasse liefern, wenn diese verfügbar sind. Fakultative Klasse: Ein Empfänger von Daten MUSS in der Lage sein, Informationen über Instanzen der Klasse zu verarbeiten; ein Absender von Daten KANN die Informationen liefern, ist aber nicht verpflichtet, dies zu tun. Obligatorische Eigenschaft: Ein Empfänger von Daten MUSS in der Lage sein, Informationen für diese Eigenschaft zu verarbeiten; ein Absender von Daten MUSS Informationen für diese Eigenschaft liefern. Empfohlene Eigenschaft: Ein Empfänger von Daten MUSS in der Lage sein, Informationen für diese Eigenschaft zu verarbeiten; ein Absender von Daten SOLLTE Informationen für diese Eigenschaft liefern, wenn diese verfügbar sind. Fakultative Eigenschaft: Ein Empfänger von Daten MUSS in der Lage sein, Informationen für diese Eigenschaft zu verarbeiten; ein Absender von Daten KANN Informationen für diese Eigenschaft liefern, ist aber nicht verpflichtet, dies zu tun. Slide 20

21 Kontrollierte Vokabulare Slide 21 URI EigenschaftVerwendet für Klassevorgeschlagene Vokabular dcat:mediaTypeVerteilungMDR File types Name Authority List dcat:themeDatensatzEuroVoc domains dcat:themeTaxonomyKatalogEuroVoc dct:accrualPeriodicityDatensatz Dublin Core Collection Description Frequency Vocabulary dct:formatVerteilungMDR File Type Named Authority List dct:languageKatalog, DatensatzMDR Languages Named Authority List dct:publisherKatalog, DatensatzMDR Corporate bodies Named Authority List dct:spatialKatalog, Datensatz MDR Countries Named Authority List, MDR Places Named Authority List adms:statusKatalog, EintragungADMS change type vocabulary dct:typeLizenz DokumentADMS license type vocabulary

22 Mapping Beispiel– data.gov.uk Slide 22 dct:title (Datensatz) dct:description dct:publisher dct:title (Distribution) Dcat:accessURL dct:language dcat:keyword dct:license dcat:downloadURL, dct:issued, dct:format, dct: description dct:spatial dct:theme dct:issued dct:modified adms:contactPoint dct:temporal

23 Beispiel: Beschreibung eines Datensatzes mit der DCAT-AP data.gov.uk Description of the data portal East Sussex County Council election results A list of elections to East Sussex County Council, which leads to data about candidates, parties, electoral divisions and votes cast. Uses the Open Election Data RDF vocabulary from East Sussex County Council election 4 June 2009, and subsequent bi-elections Slide 23

24 Erstellen von Mappings zur DCAT-AP Slide 24

25 Teilen Sie Ihre Metadaten auf ODIP Die Open Data Interoperability Platform (ODIP) ermöglicht Ihnen, Metadaten Datensätze zu teilen, die mit Hilfe der DCAT-AP geschrieben sind, um so die Auffindbarkeit und Sichtbarkeit Ihrer Datensätze zu verbessern, was schließlich zu breiterer Weiterverwendung führen kann. Slide 25

26 Was kann ODIP machen? Sammeln Sie Metadaten von einem offene Datenportal. Verwandeln Sie die Metadaten in RDF. Stimmen Sie die RDF-Metadaten, die in den vorherigen Schritten mit DCAT-AP produziert wurden, aufeinander ab. Bestätigen Sie die abgestimmten Metadaten in der DCAT-AP. Veröffentlichen Sie die Beschreibung der Metadaten als Linked Open Data. Slide 26 ODIPP Pan-European Data portal

27 Wie kann ODIP Ihnen helfen, Ihre Metadaten zu verbessern? ODIP bildet Ihre Metadaten auf ein Standardmodell ab, d.h. die DCAT-AP. ODIP hilft Ihnen, standardisierte, mehrsprachige, kontrollierte Vokabulare in Ihren Metadaten wiederzuverwenden und ersetzt fehleranfällige Textwerte oder maßgeschneiderte Listen. Mittels seines Validierungsservices erlaubt Ihnen ODIP, Unstimmigkeiten und Fehler in Ihren Metadaten zu entdecken. ODIP ordnet Ihren Metadaten dauernde URIs zu. ODIP verknüpft Ihre Metadaten mit anderen Metadaten und bereichert sie durch zusätzlichen Kontext, dadurch gewinnen diese an Bedeutung. Slide 27

28 Wie sieht ODIP aus? Slide 28

29 Eine ODIP Aufgabe Die ODIP Aufgabe besteht aus drei möglichen Phasen, die in einer bestimmten Reihenfolge gemacht werden müssen, und die aus mehreren Plug-Ins zusammengesetzt sind. 1.Extraktion 2.Transformation 3.Laden Slide 29 Außerdem können diese Aufgaben geplant werden, so dass sie periodisch, nacheinander oder manuell gestartet werden können.

30 Überblick über den ODIP Prozess Extrahieren- Transformieren-Laden Slide 30

31 1. Extraktion In der Extraktionsphase werden Rohdaten aus einem gegebenen Herkunfts- Open Data Portal mit Hilfe des entsprechende Plug-Ins abgefragt, abhängig von der Technologie des Herkunftsortes. Mögliche Extraktoren:  CKAN Extractor  RDF Extractor  SPARQL Extractor  Virtuoso Extractor  CSV Extractor Slide 31

32 2. Transformation (1/3) Ziel der Transformationsphase ist es, die von den Open Data Portalen gesammelten Metadaten abzugleichen, zu bereinigen und darauf vorzubereiten, auf ODIP gespeichert zu werden. Vorhandene Transformatoren:  ODS Modification Detector.  ODS DCAT Application Profile Harmoniser.  ODS Cleaner.  SPARQL Update Query Transformer. Slide 32

33 Laden In der Ladephase werden die gesammelten und abgeglichenen Metadaten mit Hilfe des Virtuoso Loaders auf dem Virtuoso RDF Speicher gespeichert. Slide 33

34 Beispiel Die Übernahme eines CKAN-basierten offenen Datenportals 1.Erstellen Sie einen neuen Job auf ODIP 2.Extraktionphase -Fügen und konfigurieren Sie eines CKAN Extractor hinzu, um Daten von einem CKAN API zu übernehmen. 3.Transformationsphase -Fügen Sie den DCAT Application Profile Harmoniser hinzu -Fügen Sie einen Änderungsdetektor hinzu -Fügen Sie ein SPARQL Update Query Transformer mit den relevanten Fragen hinzu -ODS Cleaner 4.Ladephase -Laden Sie die extrahierten Daten mit Hilfe des Virtuoso Loader in einem Virtuoso RDF Store hoch 5.Erstellen Sie den Aufgabenplan auf ODIP Slide 34

35 Beispiel – 1. Erstellen Sie eine Job auf ODIP Um einen neuen Job zu erstellen, klicken Sie auf “New Job”. Am unteren Teil des Bildschirms können Sie die aktuelle Aufgabenstellung innerhalb jeder der drei Phasen konfigurieren, indem Sie einen Tab auswählen. Für jede Phase können Sie die entsprechenden Module hinzufügen und konfigurieren. Slide 35 Geben Sie einen Namen für den Job Präsentieren Sie den Job mit einer kurzen Beschreibung Drücken Sie auf den “Add”- Knopf, um die Plug-Ins, die zu deployen sein sollte, zu bestimmen

36 Beispiel – 2.Extraktion : Das Hinzufügen und das Konfigurieren eines CKAN Extraktors, um Daten von einem CKAN API zu übernehmen Nach dem Hinzufügen des CKAN Extraktor Plug-Ins werden Sie aufgefordert, das folgende Formular auszufüllen: Slide 36 Der Web Standort des CKAN- Portals, das Sie übernehmen möchten. Das Portal sollte API Version 3 unterstützen, und API muss aktiviert sein. Herausgeber, Lizenz, Titel und Beschreibung: Verwendet im gespeicherten Katalog für die Eigenchaften von dct:publisher, dct:license, dct:title und dct:description. Prädikat Präfix: JSON-Attribute werden in Prädikate umgewandelt, indem sie an das Prädikat-Präfix angehängt werden. Die CKAN-API-Antwort ist in JSON, die wir dann in RDF umwandeln. Themenpräfix: Das Präfix wird genutzt, um einen URI für die Metadaten der übernommenen Datensätze zu erstellen. Das Thema wird erstellt als /dataset/ Ignorierte Tasten: Eine durch Komma getrennte Liste von JSON- Attributen, die nicht in RDF-Triple umgewandelt werden sollten.

37 Beispiel – 3. Transformation : Hinzufügen und Konfigurieren von Plug-Ins, um Daten abzugleichen (1/3) Beginnen Sie, indem Sie den ODS DCAT Application Profile Harmonizer hinzufügen. Dieses Plugin erstellt die harmonisierten Katalogdaten und ein Grundgerüst für jeden Datensatz, den es identifiziert. Verwenden Sie die Modification Detector (Änderungsdetektor), um die Herkunft von Daten, die vom CKAN-Extraktor zwischen der gegenwärtigen und vorherigen Version der Rohdaten erzeugt wurde, zu vergleichen und das dct:modified Feld für Datensätze in Katalogen zu setzen. Es ist keine Konfiguration erforderlich. Slide 37 Geben Sie einen Namen, um das Katalog zu identifizieren.

38 Beispiel – 3. Transformation : Hinzufügen und Konfigurieren von Plug-Ins, um Daten abzugleichen (2/3) Das Mapping der Beschreibung des Datensatzes zu dct:description, wie es die DCAT-AP erfordert. Verwenden Sie die ODS Cleaner Plugin, um die in den aktiven Datensatz geladenen Rohdaten zu entfernen, bevor Sie diese in einer abgeglichenen Grafik speichern. Keine Konfiguration ist erforderlich. Slide 38 Verwenden Sie den SPARQL Update Query Transformer, um vorhandene Eigenschaften und Werte, zusätzlich zu den von der DCAT-AP empfohlenen, abzubilden.

39 Beispiel – 3. Transformation : Das Hinzufügen und das Konfigurieren von Plug-Ins zum Abgleichen von Daten (3/3) Das endgültige Ergebnis Ihrer Abgleichungspipeline sollte ähnlich wie das folgenden aussehen: Konfigurieren Sie den Virtuoso Loader, um die abgeglichenen Daten in Virtuoso hochzuladen. Slide 39

40 Beispiel– 4. Laden: Laden Sie die extrahierten Daten mit Virtuoso Loader in den Virtuoso RDF Store hoch Das Virtuoso Loader wird die generierten Tripel in den Virtuoso RDF-Speicher speichern. Die Tripel werden in eine Grafikdatei Ihrer Wahl eingefügt. Das Virtuoso Loader braucht einen Host, einen Port und die Benutzeranmeldedaten, um sich mit Ihrem Virtuoso-Server zu verbinden. Slide 40

41 5. Planen Sie einen Job auf ODIP Ein Job kann so geplant werden, dass er in einem festgelegten Intervall läuft, oder sich einem anderen Job anschließt: Intervallplanung:  Beispiel:  * * * - jeden Tag um 4 Uhr  * * 1 - jeden Montag um Mitternacht  0 30 * * * - jede Hälfte jeder Stunde vorbei Verkettete Planung: Wählen Sie einen Job, nach dem dieser Job ausgeführt werden soll. Slide 41

42 ODIP Reporting-Tool Slide 42 Jedes Mal wenn ein “Job” gelaufen ist, wird ein Bericht erstellt, den man einsehen kann, wie man im folgenden Screenshot sehen kann: Informiert Benutzer, ob ein Plug-In funktioniert oder nicht Wählen Sie den entsprechenden Job

43 Entdecken Sie Datensätze durch ODIP Die Open Data Interoperability Platform (ODIP) ermöglicht Ihnen, mit Hilfe der DCAT-AP Metadaten von beschriebenen Datensätzen zu teilen, und so die Auffindbarkeit und Sichtbarkeit Ihrer Datensätze zu verbessern, was schließlich zu einer breiteren Weiterverwendung führt. Slide 43

44 Der öffentliche SPARQL-Endpunkt von ODIP Abfrageschnittstelle Slide 44

45 Der öffentliche SPARQL-Endpunkt von ODIP Ergebnis-Set Slide 45

46 Mehr über ODIP ODIP basiert auf der LOD Management Suite, die ursprünglich von der Semantic Web Company im Kontext des LOD2 FP7-Projekts erstellt wurde.LOD Management SuiteSemantic Web CompanyLOD2 Die LOD Manager Suite wurde von TenForce im Kontext von Open Data Support für den Einsatz von ODIP erweitert. Es wird auf GitHub unter GPLv2 verfügbar gemacht werden.GPLv2 Slide 46

47 Schlussfolgerungen Gute Qualität von Beschreibungsmetadaten kann die Auffindbarkeit von offenen Datensätzen verbessern. DCAT-AP kann für das Abgleichen von Metadaten der Datensätze, die auf verschiedenen offenen Datenportalen gehostet sind, verwendet werden. Es ermöglicht deren Abfrage mit einem gleichförmigen Vokabular. ODIP kann die Sammlung und die Harmonisierung nach dem DCAT- AP sowie die Veröffentlichung als Linked Data der Metadaten von Datensätzen, die auf verschiedenen offenen Datenportalen veröffentlicht werden, unterstützen. Durch seinen öffentlichen SPARQL-Endpunkt liefert ODIP einen einzelnen Zugangspunkt zu Datensätzen aus ganz Europa Leichterer Zugang zu Datensätzen bedeutet höhere Widerverwendung von Datensätzen. Slide 47

48 Gruppenfragen Slide 48 Wie viele offene Regierungsdatenportale kennen Sie in Ihrem Land? Kennen Sie in Ihrem Land Anwendungen oder Dienste, die auf offenen Regierungsdaten aufbauen? Wie würden Sie die Sichtbarkeit von offenen Regierungsdatenportalen mit denjenigen von traditionellen Datenanbietern wie den nationalen statistischen Ämtern vergleichen? Haben Sie von der Initiative der Open Government Data der Europäischen Kommission gehört?

49 Vielen Dank!...und jetzt IHRE Fragen? Slide 49

50 Referenzen Folien 4, 6, 9, 10, 11 & 12: Open Data Support: How can we help you?. Open Data Support. description description Folie 12: Data Catalogue Vocabulary. Folien 13-21: DCAT Application Profile for data portals in Europe Community. ISA Programme. https://joinup.ec.europa.eu/asset/dcat_application_profile/description https://joinup.ec.europa.eu/asset/dcat_application_profile/asset_release/all https://joinup.ec.europa.eu/asset/dcat_application_profile/description https://joinup.ec.europa.eu/asset/dcat_application_profile/asset_release/all Folien 23-35: LODMS User Manual for Open Data Support. Open Data Support Folie 29: Figure from lodmshttp://www.semantic-web.at/linked-open-data-management-suite- lodms Slide 50

51 Verwandte Projekte und Initiativen DCAT Application Profile for Data Portals in Europe, https://joinup.ec.europa.eu/asset/dcat_application_profile/description https://joinup.ec.europa.eu/asset/dcat_application_profile/description Publicdata.eu, LOD2 FP7 Project, The Semantic Web Company, Linked Open Data Management Suite, web.at/linked-open-data-management-suite-lodmshttp://www.semantic- web.at/linked-open-data-management-suite-lodms OpenLink Virtuoso, Data Catalog Interoperability Protocol, Slide 51

52 Werden Sie Teil unseres Teams... Finden Sie uns auf Kontaktieren Sie uns unter Begleiten Sie uns auf Folgen Sie uns auf Open Data Support Open Data Support Slide 52


Herunterladen ppt "Trainingsmodul 1.5 Förderung der Weiterverwendung von offenen Regierungsdaten durch die Open Data Interoperability Platform (ODIP)"

Ähnliche Präsentationen


Google-Anzeigen