Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Trainingsmodul 2.1 Der Lebenszyklus von Linked Open Government Data & Metadata Die Mitglieder des PwC Netzwerks unterstützen Organisationen und Individuen.

Ähnliche Präsentationen


Präsentation zum Thema: "Trainingsmodul 2.1 Der Lebenszyklus von Linked Open Government Data & Metadata Die Mitglieder des PwC Netzwerks unterstützen Organisationen und Individuen."—  Präsentation transkript:

1 Trainingsmodul 2.1 Der Lebenszyklus von Linked Open Government Data & Metadata Die Mitglieder des PwC Netzwerks unterstützen Organisationen und Individuen dabei, die Werte zu schaffen, nach denen sie suchen. Wir sind ein Netzwerk von Unternehmen mit nahezu Mitarbeitern in 158 Ländern, die sich dazu verpflichtet fühlen Qualität in den Bereichen Assurance, Tax & Legal sowie Advisory zu liefern. Sagen Sie uns, was Ihnen wichtig ist und besuchen Sie für weitere Informationen unsere Webseite PwC bezieht sich auf das PwC Netzwerk und/oder eine oder mehrere Mitgliedsfirmen, von denen jede ein rechtlich selbstständiges Unternehmen ist. Besuchen Sie unsere Webseite für weitere Details.

2 Diese Präsentation wurde von PwC erstellt Autoren: Michiel De Keyzer, Nikolaos Loutas and Stijn Goedertier Metadaten der Präsentation Folie 2 Disclaimer 1.Die Ansichten, die in dieser Präsentation vertreten werden, spiegeln ausschließlich die Meinung des Autors wider und dürfen unter keinen Umständen als offizielle Position der Europäischen Kommission interpretiert werden. Die Europäische Kommission übernimmt weder eine Garantie für die Genauigkeit der Informationen, die Inhalt dieser Präsentation sind, noch akzeptiert sie jegliche Verantwortung für die Nutzung der selbigen. Referenzen innerhalb dieser Präsentation zu spezifischen Produkten, Spezifikationen, Prozessen oder Services durch Handelsnamen, Markenzeichen, Hersteller oder ähnliches, implizieren nicht unbedingt deren Unterstützung oder Bevorzugung durch die Europäische Kommission. Der Autor hat sämtliche Anstrengungen unternommen, um sicherzustellen, dass er/sie, wo nötig, die Erlaubnis erhalten hat, die einzelnen Teile der in dieser Präsentation genutzten Manuskripte zu benutzen. Dies beinhaltet das Einholen einer Nutzungserlaubnis von den Lizenzinhabern oder deren gesetzlichen Vertretern zur Nutzung von Illustrationen, Karten, Schaubildern, die durch Rechte des geistigen Eigentums geschützt sind. 2.Diese Präsentation wurde sorgfältig von PwC zusammengestellt, jedoch gibt PwC keine Erklärung darüber ab und übernimmt keine Garantie dafür (weder ausdrücklich noch implizit), dass die Informationen in dieser Präsentation vollständig oder akkurat sind. PwC ist nicht für die Informationen in dieser Präsentation oder jedwede Entscheidung oder Konsequenz, die aus ihr resultieren, haftbar zu machen. PwC haftet nicht für etwaige Schäden, die durch die Nutzung der Informationen in dieser Präsentation entstehen sollten. Die Informationen in dieser Präsentation sind genereller Natur und einzig dafür bestimmt, eine Orientierungshilfe für Themen allgemeinen Interesses zu sein. Diese Präsentation ist kein Ersatz für professionelle Beratung zu jedwedem speziellen Thema. Kein Leser sollte auf der Basis der Themendarstellungen in dieser Präsentation handeln, ohne vorher angemessene professionelle Beratung einzuholen. Open Data Support wird von der Europäischen Kommission, gemäß SMART 2012/0107 ‘Lot 2: Provision of services for the Publication, Access and Reuse of Open Public Data across the European Union, through existing open data portals’(Vertrag No. 30-CE /00-17) finanziert. © 2014 European Commission

3 Lernziele Am Ende dieses Trainingsmodul sollten Sie einen Überblick darüber haben, was der Lebenszyklus von Linked Open Government Data (LOGD) ist; den Unterschied zwischen Angebot und Nachfrage für Daten kennen; die verschiedenen Schritte eines LOGD Lebenszyklus kennen; die Tools und Best Practices für jeden Schritt des Lebenszyklus kennen. Folie 3

4 Inhalt Dieses Modul enthält... einen Überblick über die existierenden Lebenszyklen für Linked Open Government Data (LOGD). einen hybriden Lebenszyklus für LOGD und Metadaten, der sowohl die Angebots- als auch die Nachfrageseite bedient. einen Überblick über vorhandene Technologien für LOGD und Metadaten, einschließlich der Open Data Interoperability Platform (ODIP). Folie 4

5 Verschiedene LOGD-Lebenszyklen Der aktuelle Stand der Dinge Folie 5 Hyland et al. Hausenblas et al. Villazon- Terrazas et al. Datalift Vision LOD2 Linked Open Data Lifecycle Siehe auch: d/wiki/GLD_Life_cycle Siehe auch: d/wiki/GLD_Life_cycle

6 Unterschiedliche LOGD-Lebenszyklen Beobachtungen Es gibt keinen standardisierten LOGD-Lebenszyklus. Die meisten Ansätze sind sich bezüglich eines Kernsets an Phasen einig, z.B. die Identifizierung des Modells/seine Veröffentlichung. Die derzeitigen Lebenszyklen konzentrieren sich hauptsächlich auf die Bereitstellung von Open Data:  Identifizierung und Auswahl von LOGD.  Modellierung und Bereinigung von LOGD.  Veröffentlichung und Verknüpfung von Daten. Aber was ist mit der Nachfrageseite?  LOGD finden und abrufen.  Open Data integrieren und weiterverwenden.  Rückmeldungen zu LOGD geben. Folie 6

7 Was sind Metadaten? “Metadaten sind strukturierte Informationen, die beschreiben, erklären, lokalisieren, oder es anderweitig einfacher machen, eine Informationsquelle abzurufen, zu verwenden oder zu verwalten. Daten zu bestimmten Daten oder Informationen zu bestimmten Informationen werden oft Metadaten genannt.” -- National Information Standards Organization Folie 7 Datensatz Beschreibung (DCAT) Datensatz

8 Best Practices für die Veröffentlichung Ihrer Daten & Metadaten 1.Entwickeln Sie die Daten; 2.Benennen Sie Dinge mit URIs; 3.Verwenden Sie vorhandene Vokabulare wieder, wann immer möglich; 4.Veröffentlichen Sie von Mensch und Maschine lesbare Beschreibungen – Metadaten; 5.Konvertieren Sie die Daten in RDF; 6.Geben Sie eine passende Lizenz an; 7.Hosten Sie den verknüpften Datensatz und seine Metadaten öffentlich und geben Sie dies auch bekannt! Das W3C Linked Data Kochbuch Folie 8 Siehe auch: ta_Cookbook ta_Cookbook Siehe auch: ta_Cookbook ta_Cookbook

9 LOGD- und Metadatenlebenszyklus Fokussierung auf Angebot und Nachfrage Folie 9 AngebotNachfrage

10 LOGD & Metadaten Angebot Verwaltungen, die ihre Daten öffentlich machen und sie als Linked Data zusammen mit den entsprechenden Metadatenbeschreibungen veröffentlichen Folie 10

11 Auswahl hochwertiger Daten Mehrere Dimensionen können im Auswahlprozess von LOGD berücksichtigt werden, sowohl aus der Sicht des Herausgebers als auch des Wiederverwenders. Transparenz: Erhöht die Veröffentlichung des Datensatzes die Transparenz und die Offenheit der Verwaltung gegenüber ihren Bürgern? Gesetzliche Anforderungen: Gibt es ein Gesetz, das die Veröffentlichung verpflichtend macht oder gibt es keine solche Auflage? Verbindung mit öffentlicher Aufgabe: Sind die Daten das direkte Ergebnis einer Kernaufgabe der Verwaltung oder sind sie ein Produkt einer nicht wesentlichen Aktivität? Aktueller Stand der Veröffentlichung: Sind die Daten bereits öffentlich verfügbar oder müssen sie noch veröffentlicht werden? Art des Mehrwerts: Sind die Daten für soziale Zwecke nützlich oder haben sie kommerziellen Wert? Zielgruppe: Sind die Daten in erster Linie für die Öffentlichkeit oder für eine Back-Office-Integration bestimmt? Folie 11

12 Auswahl aus Transparenzgründen In einigen Fällen kann die Veröffentlichung eines Datensatzes die Transparenz und Offenheit der Verwaltung gegenüber ihren Bürgern erhöhen, z.B.: Parlamentsdaten, wie beispielsweise Wahlergebnisse. Öffentliche Haushaltspläne. Personalkosten der öffentlichen Verwaltungen. Alle oben genannten Beispiele tragen zur Transparenz der Arbeit öffentlicher Verwaltungen bei. Folie 12

13 Auswahl aufgrund gesetzlicher Anforderungen Einige Daten können einem Gesetz oder einer Verordnung unterliegen, das/die ihre Veröffentlichung anordnet, z.B.: Gesetzestexte, Richtlinien, Verordnungen usw. Vorschläge und Verhandlungen von Parlament und Komitees. Wahlergebnisse. Öffentliche Budgets und Ausgaben. Ausschreibungen zu Angeboten und Auftragsvergaben. Andere Daten können ein Nebenprodukt der Verwaltungsaktivität sein und es könnte für Bürger und Unternehmen nützlich sein Zugang dazu zu haben, z.B.: Zustand der Infrastruktur und öffentlicher Flächen (Straßen, Bäume). Fahrpläne der öffentlichen Verkehrsmittel und Abholzeiten der Müllabfuhr. Folie 13

14 Auswahl aufgrund eines Bezugs zur öffentlichen Aufgabe Einige Daten können das direkte Ergebnis der primären öffentlichen Verwaltungsaufgabe sein, beispielsweise die Funktionen, die in COFOG aufgeführt sind, z.B.: Exekutive, gesetzgebende Organe, Finanz-/Steuerangelegenheiten usw. Öffentliche Ordnung und Sicherheit. Umweltschutz. Gesundheit. Kultur. Bildung. Andere von der Verwaltung produzierte Daten sind unwesentlich (sie können vom privaten Sektor geliefert werden; und werden dies auch manchmal), z.B.: Kartierung zu Navigationszwecken (siehe Google Street View) Wettervorhersage (z.B. Internetseiten zum Wetter) Folie 14

15 Auswahl aufgrund öffentlicher Verfügbarkeit Einige Daten sind bereits offen und elektronisch verfügbar, z.B. (in einigen Ländern): Katasterinformationen. Topographische Karten. Verkehrsinformationen. Wettervorhersagen. Andere Daten können weiterhin der Öffentlichkeit vorenthalten werden (vielleicht weil es sehr schwer ist, sie zu veröffentlichen, weil sie persönliche oder vertrauliche Daten beinhalten oder weil sie teilweise der Lizenzierung durch Dritte unterliegen). Folie 15

16 Auswahl aufgrund der Art des Mehrwerts Einige Daten können in erster Linie gesellschaftlichen Wert haben, z.B.: Gesetze und parlamentarische Daten (z.B. Abstimmungsverhalten der Volksvertreter) Informationen vor Wahlen (z.B. Programme der politischen Parteien) E-Demokratie und E-Partizipation (z.B. öffentliche Anhörungen) Andere Daten können eher kommerziellen Wert (Geschäftsmodelle) haben, z.B.: Straßenkarten, Echtzeitverkehrsinformationen Echtzeitwetterdaten Wirtschaftsinformationen Folie 16

17 Auswahl aufgrund der Zielgruppe der Daten Einige Daten sind für die Gesellschaft (Bürger und Unternehmen) bestimmt, z.B.: rechtliche Informationen. E-Demokratie, E-Partizipation und öffentliche Anhörungen. Beschaffung. Andere Daten besitzen einen Wert für die interne Nutzung oder die Integration in das Backoffice, z.B.: Verschiedene Quellen, die zur Strafverfolgung genutzt werden. Indikatoren der Serviceleistungskennzahlen. Stellenbeschreibungen von Beamten. Folie 17

18 Auswahl aufgrund der Größe der Zielgruppe Einige Daten sind auf große Zielgruppen und Massenmärkte ausgerichtet, z.B.: Verkehrsinformationen. Öffentliche Verkehrsmittel. Wahldaten. Andere Daten sind für kleine Gruppen und Nischenmärkte von Bedeutung, z.B.: Informationen über Einrichtungen und finanzielle Unterstützung für Menschen mit Behinderung. Wirtschaftsstatistiken. Gerichtsentscheidungen. Folie 18

19 Hoher Mehrwert aus der Perspektive eines Wiederverwenders Aus der Sicht eines Wiederverwenders, hängt der Mehrwert eines Datensatzes vor allem von seinem Verwendungs- und Wiederverwendungspotenzial ab, das effektiv zur Erschließung von (neuen) Geschäftsmodellen führen kann. Das Verwendungs- und Wiederverwendungspotenzial eines Datensatzes wird bestimmt durch: Die Größe und die Dynamik der Zielgruppe des Datensatzes; sowie Die Anzahl der neuen und bestehenden Systeme und Dienstleistungen, die den Datensatz benutzen. Die Öffnung von Datensätzen mit einem hohen Verwendungs- und Wiederverwendungspotenzial führt zur Schaffung neuer Produkte und/oder Dienstleistungen, die un- oder mittelbare wirtschaftliche oder soziale Auswirkungen und/oder positive wirtschaftliche Externalitäten haben. Folie 19

20 Auswahl aufgrund der Bedürfnisse der Zielgruppe Was für Daten brauchen/wollen die Wiederverwender? Laut einer spanischen Studie werden die folgenden Arten von Informationen von Unternehmen am meisten wiederverwendet: Folie 20 Siehe auch: Estudio_infomediario/121001%20RED%20007%2 0Final%20Report_2012%20Edition_vF_en.pdf Siehe auch: Estudio_infomediario/121001%20RED%20007%2 0Final%20Report_2012%20Edition_vF_en.pdf

21 Domains für Datensätze in europäischen Datenportalen Folie 21 Source:[http://data.gov.uk/data]http://data.gov.uk/data Source:[http://publicdata.eu/] Source:[http://open-data.europa.eu/en/data/dataset]http://open-data.europa.eu/en/data/dataset Metadaten

22 Folie 22 Welche Datensätze werden auf Data.gov.uk am meisten angesehen? nach Herausgebernnach Datensätzen

23 Bei der Modellierung Ihrer Daten und Metadaten geht es darum... Ihre Daten in einer strukturierten, verständlichen und maschinenlesbaren Weise verfügbar zu machen. Wiederzuverwenden, was in Bezug auf Vokabulare und Referenzdaten bereits existiert. Durch die Bereinigung Ihrer Daten ein angemessenes Qualitätslevel zu erreichen. Lizenzinformationen bereitzustellen, damit die Konsumenten Ihrer Daten wissen, was die Bedingungen zur Weiterverwendung sind. Eine umfangreiche Beschreibung (Metadaten) zu liefern. Semantische Technologien (RDF, HTTP URIs...) für die Beschreibung Ihrer Daten zu verwenden. Folie 23

24 Modellieren Sie Ihre Daten - wiederverwenden, wenn möglich; prägen, wenn nötig Verwenden Sie vorhandene Vokabulare so oft wie möglich wieder.  Wenn Sie sehen, dass es für eine spezielle Domain keine wiederverwendbare, verbindliche Quelle gibt, erstellen Sie Ihre eigene mit Hilfe von: ◦RDF Schemata (RDFS): Basis RDF Vokabular um die Klassen und die Eigenschaften von Klassen zu beschreiben. ◦Web Ontology Language (OWL): Sprache zur Darstellung von Wissen um Ontologien zu beschreiben. Folie 24 Siehe auch: http//www.w3.org/TR/owl-features/ Siehe auch: http//www.w3.org/TR/owl-features/

25 Verwenden Sie allgemeine Vokabulare wieder, um Ihre Daten zu modellieren und zu beschreiben... (in RDF) Universelle Vokabulare: DCMI, RDFS Um Dinge zu benennen: rdfs:label, foaf:name, skos:prefLabel Um Personen zu beschreiben: FOAF, vCard, Core Person Vocabulary Um registrierte Organisationen zu beschreiben: Registered Organisation Vocabulary Um Adressen zu beschreiben: vCard, Core Location Vocabulary Um öffentliche Dienste zu beschreiben: Core Public Service Vocabulary...und Metadaten... Um Datensätze zu beschreiben (Metadaten): DCAT, DCAT Application Profile, VoID Um Projekte zu beschreiben: DOAP, ADMS.SW Um Interoperabilitätsassets zu beschreiben: ADMS Folie 25

26 Finden von wiederverwendbaren Vokabularen Joinup Online-Plattform für die Suche nach und den Austausch von Interoperabilitätsassets mit ADMS.  Entwickelt von dem ISA- Programm der EK. Folie 26 Verbessern Sie die Suchresultate, indem Sie die Suche durch unterschiedliche Filter eingrenzen. 2 Geben Sie einen Suchbegriff ein um Interoperabilitätsassets zu finden, die auf verschiedenen Websites verfügbar sind. 1 Die Suchresultate beinhalten eine relevante Beschreibung der Assets sowie den Link, wo sie diese downloaden können. 3

27 Finden von wiederverwendbaren Vokabularen Linked Open Vocabularies Folie 27 Bietet Ihnen einen einfachen Zugang zum Ökosystem der Vokabulare. Macht die Art und Weise deutlich, wie Vokabulare miteinander verknüpft sind. Liefert Metriken dazu, wie Vokabulare in der LOGD- Cloud genutzt werden. Entwickelt von der Open Knowledge Foundation.

28 Damit stellen Sie sicher, dass Daten und Metadaten auf einem angemessenen Qualitätsniveau und mit möglichst wenig Fehlern veröffentlicht werden können. Das bedeutet: Fehler festzustellen. Formate zu transformieren und zu homogenisieren. Inkonsistenzen in Daten und Metadaten auszugleichen. Doppelte/redundante Informationen zu entfernen. Fehlende Informationen zu ergänzen. Sicherzustellen, dass die Informationen aktuell sind. Bereinigung Ihrer Daten & Metadaten Folie 28 Siehe auch: Cleanse your data with Open Refine (Google Refine) - https://code.google.com/p/google-refine/ https://code.google.com/p/google-refine/ Siehe auch: Cleanse your data with Open Refine (Google Refine) - https://code.google.com/p/google-refine/ https://code.google.com/p/google-refine/

29 Datenbereinigung – Ein Beispiel Folie 29 Formatierungs- problem Fehlende Information Duplikat Fehler Redundante Information Widersprüchliche Informationen Bereinigungs- operationen

30 Modellieren Sie Ihre Metadaten Das DCAT Anwendungsprofil für Datenportale in Europa (DCAT-AP) ist eine Spezifikation, die auf dem Datenkatalogvokabular (DCAT) zur Beschreibung der Datensätze des öffentlichen Sektors in Europa basiert. DCAT-AP verbessert das Auffinden von Datensätzen des öffentlichen Sektors sowohl grenz- als auch sektorenüberschreitend. Folie 30 Siehe auch: https://joinup.ec.europa.eu/asset/dcat_application_pro file/description Siehe auch: https://joinup.ec.europa.eu/asset/dcat_application_pro file/description

31 Verwenden Sie zur Namensgebung persistente Uniform Resource Identifiers (URI) Folie 31 Siehe auch: https://joinup.ec.europa.eu/community/semic/document/10-rules-persistent-uris Siehe auch: https://joinup.ec.europa.eu/community/semic/document/10-rules-persistent-uris Persistente URIs bilden die Grundlagen für Linked Data.

32 Bei der Lizensierung Ihrer Daten und Metadaten geht es darum: Potenzielle Wiederverwender darüber zu informieren, wie Daten und Metadaten (wieder-)verwendet und/oder angepasst werden können; Ihre Daten und Metadaten mit Lizenzinformationen zu verbinden: Sollten diese fehlen ist das ein großes Hindernis für die Weiterverwendung der Daten und senkt den Mehrwert, den die Veröffentlichung Ihrer Daten generiert. Dass Open Data, per Definition, unter einer offenen Lizenz veröffentlicht werden sollten. Dass Metadaten unter einer Lizenz veröffentlicht werden sollten, die anzeigt, dass sie Allgemeingut sind. Damit fördern Sie die Weiterverwendung und die Auffindbarkeit Ihrer Daten. Folie 32 Siehe auch: auch:

33 Offene Lizenzen Creative Commons (CC) (http://creativecommons.org/licenses/)http://creativecommons.org/licenses/ -Attribution (BY): Der Schöpfer des Werkes sollte erwähnt werden. -Non Commercial (NC): Das Werk kann nicht für kommerzielle Zwecke verwendet werden. -No Derivatives (ND): Das Werk kann nicht auf andere Werke angepasst oder mit diesen vereint werden. -Share Alike (SA): Das Werk kann angepasst werden, muss aber derselben Lizenz zugeschrieben werden, wenn Sie es verfügbar machen. -CC Zero (CC0): Das Werk ist Allgemeingut. Open Data Commons (http://opendatacommons.org/licenses/)http://opendatacommons.org/licenses/ -„Open Data Commons Attribution Licence (ODC-By): kompatibel mit CC BY -Open Data Commons Open Database Licence (ODC-ODbL): kompatibel mit CC BY SA -Public Domain Dedication Licence (PDDL): kompatibel mit CC Zero The Open Government Licence (http://www.nationalarchives.gov.uk/doc/open-government-licence/)http://www.nationalarchives.gov.uk/doc/open-government-licence/ Folie 33 Siehe auch: en_Data_A_Practical_Guide.pdf en_Data_A_Practical_Guide.pdf Siehe auch: en_Data_A_Practical_Guide.pdf en_Data_A_Practical_Guide.pdf

34 Bei der Veröffentlichung von Linked Data geht es darum... … Strukturen aufzubrechen, um dadurch Mehrwerte zu schaffen. Machen Sie Ihre Daten und Metadaten öffentlich und im Internet leicht zugänglich. Verknüpfen Sie Ihre Daten und Metadaten mit anderen Daten (oder Metadaten), um:  ihnen mehr Bedeutung und Inhalt zu geben;  sie in einen Kontext zu stellen;  sie zu bereichern;  Nutzern zu erlauben, immer mehr zu entdecken. Folie 34

35 Stellen Sie einen SPARQL Endpunkt bereit Ein SPARQL Endpunkt ist ein Dienst, der es Anderen erlaubt Ihre Linked Data (und/oder Metadaten) abzufragen. Folie 35

36 Die Veröffentlichung Ihrer Metadaten Veröffentlichen Sie Ihre Metadaten auf einem zentralen Datenbroker, um ihnen mehr Sichtbarkeit zu geben und um die Weiterverwendung Ihrer Datensätze zu verbessern. Folie 36 Siehe auch: moting-the-re-use-of-open-data-through-odip moting-the-re-use-of-open-data-through-odip Siehe auch: moting-the-re-use-of-open-data-through-odip moting-the-re-use-of-open-data-through-odip The Open Data Interoperability Platform (ODIP): ODIP ist ein zentraler Datenbroker, der von der Europäischen Kommission entwickelt wurde, um die grenzüberschreitende europäische Suche nach Datensätzen zu ermöglichen. ODIP ermöglicht es Datenherausgebern und Datenportalen, Beschreibungsmetadaten für Datensätze zentral zu veröffentlichen.

37 Beim Daten- & Metadatenmanagement geht es darum... Den Lebenszyklus der Daten zu verwalten: Datensätze zu erstellen, zu aktualisieren, instand zu halten und stillzulegen. Den Lebenszyklus der Metadaten zu verwalten. Prozesse zu implementieren, die sicherstellen, dass Ihre Daten und Metadaten über ein angemessenes Qualitätsniveau verfügen. Die Besitzverhältnisse für Daten(-sätze) und Metadaten festzulegen. Folie 37 Siehe auch: introduction-to-metadata-management introduction-to-metadata-management Siehe auch: introduction-to-metadata-management introduction-to-metadata-management

38 Sammeln Sie Feedback von den Wiederverwendern Ihrer Daten Bitten Sie die (potenziellen) Verwender der Daten um ihr Feedback: Welche Daten brauchen sie. Wie haben sie die Daten genutzt. Was dachten sie über die Qualität. Stellen Sie sicher, dass Anfragen und Korrekturen Sie erreichen: Crowdsourcen Sie die Datenqualität! Folie 38 data.overheid.nl data.gov.uk

39 LOGD-Nachfrage Die Nachfrage von Unternehmen, Unternehmern, Forschern und Regierungen nach Linked Data Folie 39

40 Bei der Nachfrageseite des LOGD-Lebenszyklus geht es darum... Es Datenwiederverwendern zu ermöglichen: Passende Datensätze zu finden; Datensätze für Analysezwecke und die Entwicklung von Anwendungen und Diensten zu nutzen; Zu wissen, was ihre Regierung tut (Transparenz); Kosten zu sparen. Folie 40 Entwickler/Unternehmen integrieren Daten in Anwendungen (Services) Öffentliche Verwaltungen teilen ihre Daten online Bürger/Unternehmen profitieren von den Anwendungen (Services) Entwickler/ Unternehmen suchen nach Daten Veröffentlichung von Daten Weiterverwendung von Daten

41 Wo kann man Datensätze finden? Datensätze werden auf verschiedenen Plattformen verfügbar gemacht, die über ganz Europa verteilt sind. “Ein Datenbroker sammelt die Metadaten von verschiedenen Open Data Plattformen und veröffentlicht sie in einem gemeinsamen Metadatenmodell. Auf diese Weise können die Datensätze auf eine einheitliche Weise von einem einzelnen Zugangspunkt abgefragt werden.” Lokale Open Data Portale, z.B. -opendatamanchester.org.uk -Data.gent.be Regionale Open Data Portale z.B. -opendata.regionpaca.fr -Open public data of the government of Catalonia Nationale Open Data Portale, z.B. -Opendata.at -opendata.lu Europäische Open Data Portale, z.B. -O pen-data.europa.eu Open Data Broker, z.B. -Publicdata.eu -ODIP Folie 41

42 Verwenden Sie den SPARQL-Endpunkt oder einen Faceted Browser, um Datensätze zu finden Ein Benutzer kann eine SPARQL-Abfrage über einen SPARQL-Endpunkt ausführen um Datensätze zu finden oder sich einen Weg durch die Sammlung von Datensätzen zu „filtern“, die einen Faceted Browser verwenden. Folie 42 SPARQL-Endpunkt Facettierter Browser

43 Integration von Datensätzen und die Schaffung von Anwendungen & Dienstleistungen Einige Werkzeuge für die Integration von Datensätzen: Karma (http://www.isi.edu/integration/karma/)http://www.isi.edu/integration/karma/ Talend (http://www.talend.com/products/data-integration)http://www.talend.com/products/data-integration Folie 43 Siehe auch: introduction-to-linked-data introduction-to-linked-data Siehe auch: introduction-to-linked-data introduction-to-linked-data

44 Veröffentlichung von LoGD mittels Open Refine Folie 44

45 Modellierung und Veröffentlichung von Open Data mittels Open Refine Erste Schritte 1.Installieren Sie Open Refine: https://github.com/OpenRefinehttps://github.com/OpenRefine 2.Installieren Sie die RDF-Erweiterung: Und dann... Beschreiben Sie Ihre Daten in einer Tabelle. Erstellen Sie ein Projekt und laden Sie es in Open Refine hoch. Bilden Sie Ihre Daten auf entsprechende RDF Klassen & Eigenschaften ab. Exportieren Sie die Daten nach RDF. Folie

46 Beschreiben Sie Ihre Daten in einer Tabelle Folie 46 Unternehmensname Datum der RegistrationLand 1

47 Erstellen Sie ein Projekt und laden Sie es in Google Refine hoch Folie 47 2 Laden Sie die Tabelle hoch Wählen Sie die entsprechenden Tabs Erstellen Sie das Projekt

48 Bilden Sie Ihre Daten auf entsprechende RDF Klassen & Eigenschaften ab (modellieren Sie Ihre Daten). Folie 48 3 Definieren Sie ein Grundgerüst, um die Daten Ihrer Tabelle in RDF umzuwandeln.

49 Exportieren Sie Ihre Daten nach RDF/XML oder Turtle Folie 49 4

50 Der LOD2-Stack Werkzeuge zur Veröffentlichung und Abfrage von LOGD Folie 50

51 Veröffentlichen Sie Ihre Daten mit dem LOD2 Stack „Der LOD2-Stack ist eine integrierte Sammlung von aufeinander abgestimmten Werkzeugen, die den Lebenszyklus von Linked (Open) Data durch Extraktion, Verfassen/Erstellen über Anreicherung, Verknüpfung, Verschmelzung bis zur Visualisierung und Instandhaltung unterstützen. Der Stack umfasst Werkzeuge von LOD2 Partnern und Dritten.” Folie 51 Source: [http://stack.lod2.eu/]http://stack.lod2.eu/

52 Silk – Ein Werkzeug für die Verknüpfung Ihrer Daten “Das Silk-Framework ist ein Instrument um Beziehungen zwischen Datenelementen verschiedener Linked Data Quellen zu finden. Datenherausgeber können Silk dazu verwenden RDF-Links von ihren Datenquellen zu anderen Datenquellen im Internet zu setzen.“ Download und weitere Informationen: Folie 52

53 Schlussfolgerungen Der LOGD- und Metadatenlebenszyklus sollte sich sowohl mit der Angebots- als auch mit der Nachfrageseite befassen. Die Auswahl der Daten und Metadaten, die veröffentlicht werden sollen, sollte verschiedene Dimensionen in Betracht ziehen. Bei der Modellierung geht es darum, die Daten und Metadaten zu strukturieren und eine angemessene Qualitätsebene zu erreichen. Bei der Veröffentlichung geht es darum, die Daten und Metadaten öffentlich, leicht zugänglich und durchsuchbar zu machen. Das Daten- und Metadatenmanagement sollte sicherstellen, dass Prozesse und Richtlinien existieren, die den Lebenszyklus der Daten und Metadaten steuern. Der Datenherausgeber sollte die nötigen Instrumente liefern, um Feedback von den Datenwiederverwendern zu erhalten, um dadurch die Nachfrage und Crowdsourcing Qualität nachzuvollziehen. Es gibt mehrere Werkzeuge für die Entwicklung und Veröffentlichung von LOGD, aber nur wenige sind von einer produktionsreifen Qualität. Folie 53

54 Gruppenfragen Folie 54 Haben Sie auf betrieblicher Ebene eine Daten- und/oder Metadatenverwaltungsmethodik? Existieren Angebot und Nachfrage für LOGD in Ihrem Land? Wenn ja, wer liefert was an wen? Was sind, Ihrer Meinung nach, die größten Hindernisse bei der Bereitstellung von LOGD in Ihrem Land? Machen Sie auch den Online-Test!Online-Test

55 Vielen Dank!...und jetzt IHRE Fragen? Folie 55

56 Referenzen Folie 5: GLD Life cycle. W3C. Folie 8: Linked Data Cookbook. W3C. Folie 14: United Nations Statistics Division. COFOG (Classification of the Functions of Government). Folie 21: Characterization Study of the Infomediary Sector Edition. Datos.gob.es. %20RED%20007%20Final%20Report_2012%20Edition_vF_en.pdf %20RED%20007%20Final%20Report_2012%20Edition_vF_en.pdf Folie 21: Folie 21: Folien 24-25: Cookbook for translating Data Models to RDF Schemas. IAS Programme. https://joinup.ec.europa.eu/community/semic/document/cookbook-translating- data-models-rdf-schemas https://joinup.ec.europa.eu/community/semic/document/cookbook-translating- data-models-rdf-schemas Folie 26: ADMS Brochure. ISA Programme. https://joinup.ec.europa.eu/elibrary/document/adms-brochure https://joinup.ec.europa.eu/elibrary/document/adms-brochure Folie 27: Folie 29: DCAT application profile for data portals in Europe. ISA Programme. https://joinup.ec.europa.eu/asset/dcat_application_profile/description https://joinup.ec.europa.eu/asset/dcat_application_profile/description Folie 31: 10 Rules for Persistent URIs. ISA Programme. https://joinup.ec.europa.eu/community/semic/document/10-rules-persistent- uris https://joinup.ec.europa.eu/community/semic/document/10-rules-persistent- uris Folien 32-33: Licensing Open Data: A Practical Guide. Naomi Korn and Professor Charles Oppenheim. Folie 51: Announcement of intermediate LOD2 Stack release, March Martin Kaltenboeck. lod2-stack-release-march-2012.htmlhttp://lod2.eu/BlogPost/1034-announcement-of-intermediate- lod2-stack-release-march-2012.html Folie 52: Silk - A Link Discovery Framework for the Web of Data. University of Mannheim. Folie 56

57 Weiterführende Literatur (1/2) Linked Data Cookbook. W3C. Cookbook for translating Data Models to RDF Schemas. ISA Programme. https://joinup.ec.europa.eu/community/semic/document/cookbook- translating-data-models-rdf-schemas https://joinup.ec.europa.eu/community/semic/document/cookbook- translating-data-models-rdf-schemas Publishing Open Government Data. Daniel Bennett & Adam Harvey. N. Korn & C. Oppenheim, Licensing Open Data: A Practical Guide. Guide.pdf Folie 57

58 Weiterführende Literatur (2/2) Linked Open Data: The Essentials. Florian Bauer, Martin Kaltenböck. Linked Data: Evolving the Web into a Global Data Space. Tom Heath and Christian Bizer. Linked Open Government Data. Li Ding Qualcomm, Vassilios Peristeras and Michael Hausenblas. EUCLID - Course 1: Introduction and Application Scenarios Folie 58

59 Verwandte Projekte und Initiativen (1/2) LOD2 Technology Stack, Open Data Publishing Pipeline DERI, W3C Linked Data Cookbook, Cookbook for translating Data Models to RDF Schemas, https://joinup.ec.europa.eu/community/semic/document/cookb ook-translating-data-models-rdf-schemas https://joinup.ec.europa.eu/community/semic/document/cookb ook-translating-data-models-rdf-schemas Folie 59

60 Verwandte Projekte und Initiativen (2/2) EUCLID FP7 Project, LOD Around The Clock FP7 project, Generic Statistical Business Process Model, atistical+Business+Process+Model+Paper atistical+Business+Process+Model+Paper Folie 60

61 Werden Sie Teil unseres Teams... Folie 61 Besuchen Sie uns Kontaktieren Sie uns Lernen Sie uns kennen Folgen Sie uns Open Data Support Open Data Support


Herunterladen ppt "Trainingsmodul 2.1 Der Lebenszyklus von Linked Open Government Data & Metadata Die Mitglieder des PwC Netzwerks unterstützen Organisationen und Individuen."

Ähnliche Präsentationen


Google-Anzeigen