Trainingsmodul 2.3 Persistente URIs entwerfen und verwalten Die Mitglieder des PwC Netzwerks unterstützen Organisationen und Individuen dabei, die Werte.

Slides:



Advertisements
Ähnliche Präsentationen
Identifizierung und Ausbildung von Führungskräften
Advertisements

Die neue Sulzer Website Internet Core Team | Juli 2012.
Entwicklung von Schemata für den XML-Dokumentenaustausch mit Hilfe des Resource Description Framework (RDF) John McClure Präsentation.
On the Criteria to Be Used in Decomposing Systems into Modules
:35 Architektur Moderner Internet Applikationen – Sonderthema 1 Copyright ©2003 Christian Donner. Alle Rechte vorbehalten. Architektur Moderner.
Pflege der Internetdienste
Ontologien- Query 1 Teil2
Datenbankzugriff im WWW (Kommerzielle Systeme)
HTML - Einführung Richard Göbel.
Java: Objektorientierte Programmierung
Internetstruktur Das Internet besteht aus vielen Computern, die weltweit untereinander vernetzt sind.
XINDICE The Apache XML Project Name: Jacqueline Langhorst
Hauptseminar XML-Technologie: Resource Description Framework (RDF) Michael Kranz Betreuer: Roland Haratsch.
Access 2000 Datenbanken.
Informationsarchitektur Beschreiben und Benennen
RDF-Schema Seminar: „Semantic Web“ André Rosin,
Dublin Core Metadata Thea Spiridonidou Institut für Informatik Humboldt Universität zu Berlin SE: Grundlegende Aspekte des Semantic Web WS 02/03.
Schulen ans Netz Oberhausener Moderatoren
Seite Common Gateway Interface. Konzepte. Übersicht 1Einleitung 2Was ist CGI? 3Wozu wird CGI verwendet? 4Geschichtlicher Überblick 5Grundvoraussetzungen.
1 Grundlagen und Anwendung der Extensible Markup Language (XML ) Peter Buxmann Institut für Wirtschaftsinformatik Johann Wolfgang Goethe-Universität Frankfurt.
Data Documentation Initiative (DDI)
Wissenschaftliche Übung Metadatenformate und -standards
FH-Hof HTML - Einführung Richard Göbel. FH-Hof Komponenten des World Wide Webs WWW Browser HyperText Transfer Protocol (HTTP) via Internet WWW Server.
RDF Resource Description Framework
Welche Funktion hat die php.ini? -Beinhaltet wichtige Einstellungen für PHP. Genannt seien hier u.a. der Speicherort von Cookies, Parameter der Kompilierung,
Prof. Dr. Gerhard Schmidt pres. by H.-J. Steffens Software Engineering SS 2009Folie 1 Objektmodellierung Objekte und Klassen Ein Objekt ist ein Exemplar.
SPEAQ Workshop Von Praktikern geleitete Qualitätssicherung und Qualitätssteigerung Dieses Projekt wurde mit finanzieller Unterstützung der Europäischen.
Semantic Web-Anwendungen auf Basis des BAM-Portals Ein Prototyp Volker Conradt.
Unterrichtsmaterial (D7)
© InLoox GmbH InLoox now! Produktpräsentation Die schlüsselfertige Online-Projektplattform in der Cloud.
Urheberrecht im Internet
TWS/Graph HORIZONT Produkt-Präsentation Software für Rechenzentren
Warum brauche ich ein CMS – Content Management System?
Grundlagen: Client-Server-Modell
Wird ganz am Anfang der HTML-Datei geschrieben Doctype html public bedeutet, dass man sich auf die Öffentlichkeit der html-dtd bezieht Html ist die meist.
Entwicklung verteilter Anwendungen II, SS 13 Prof. Dr. Herrad Schmidt SS 13 Kapitel 4 Folie 2 REST Web Services (1)
Sesame Florian Mayrhuber
Das Änderungssystem für TWS Definitionen
Was Benutzer wollen – mehr als Metadaten Anette Seiler 98. Deutscher Bibliothekartag, Erfurt, 5. Juni 2009.
Ausgabe vom Seite 1, XML Eine Einführung XML - Eine Einführung.
Zauberwort Metadaten Elementares Handwerkszeug des Content- und Wissensmanagement.
Struktur von RDF Fabian Scheller.
OpenStreetMap.org Einleitung und Erläuterung von OSM 1Created by: Rudolf Kremsner.
PARTENARIAT ÉDUCATIF GRUNDTVIG PARTENARIAT ÉDUCATIF GRUNDTVIG REPERES KULTURELLER ZUSAMMENHALT UND AUSDEHNUNG DER IDEEN AUF EUROPÄISCHEM.
cs108 Programmier-Projekt Präsentation Meilenstein 3
Semantic Web - ein Thema für Bibliotheksverbünde SWIB 2010, Köln Dr. Silke Schomburg.
Feedback from WWW )18-22 mai )sheraton hotel and towers congress center, new york city, USA 3)keine teilnehmerliste, meine schätzung: ca.
Mag. Andreas Starzer weloveIT – EDV Dienstleistungen
Dieses Projekt wird von der Europäischen Kommission gefördert. Diese Publikation gibt nur die Meinung der Autoren wieder, die Kommission kann für die Verwendung.
Dokumenten- und Publikationsserver
Soziale Medien und berufliche Orientierung Thesen aus dem Projekt „Learn2Teach by social web“ Dieses Projekt wurde mit Unterstützung der Europäischen.
xRM1 Pilot Implementierung
Die Management-Tools von Z&H COACH beinhalten zentrale Hilfsmittel für ein Management-System. Sorgfältig angewendet führen diese Tools Ihr Unternehmen.
Sensible Themen Was Sie tun können, wenn die Unzufriedenheit mit dem Aussehen für eine/n Lernende/n oder KollegIn ein Problem darstellt LIFELONG LEARNING.
Trainingsmodul 2.2 Die Qualität von Open Data & Metadaten Die Mitglieder des PwC Netzwerks unterstützen Organisationen und Individuen dabei, die Werte.
Open Data Support Wie können wir Ihnen helfen?. Diese Präsentation wurde von PwC erstellt Autoren: Nikolaos Loutas, Michiel De Keyzer und Stijn Goedertier.
Trainingsmodul 2.4 Vokabulare in RDF entwerfen und entwickeln PwC firms help organisations and individuals create the value they’re looking for. We’re.
Trainingsmodul 2.3 Langlebige URIs entwerfen und verwalten
Trainingsmodul 2.4 RDF-Vokabulare entwerfen und entwickeln Die Mitglieder des PwC Netzwerks unterstützen Organisationen und Individuen dabei, die Werte.
Trainingsmodul 2.2 Die Qualität von offenen Daten & Metadaten PwC firms help organisations and individuals create the value they’re looking for. We’re.
Trainingsmodul 2.2 Die Qualität von offenen Daten & Metadaten PwC firms help organisations and individuals create the value they’re looking for. We’re.
Trainingsmodul 1.2 Einführung in Linked Data PwC firms help organisations and individuals create the value they’re looking for. We’re a network of firms.
Willkommen zum Brückensemester
Trainingsmodul 1.2 Einführung in Linked Data PwC firms help organisations and individuals create the value they’re looking for. We’re a network of firms.
Semantic Web.
Datenbanken im Web 1.
XML Die “E-Lance Economy” oder die “Digital Economy” stellt neue Anforderungen an Funktionalität im Netz. XML wurde vom World Wide Web Consortium (W3C)
Webserver, Apache und XAMPP
Open Source und Open Office Referenten: Anja Stadler & Fabian Gebauer.
Geoinformation3 Geoinformation III XML Grundlagen, Namensräume und Hyperlinks Vorlesung 12b.
 Präsentation transkript:

Trainingsmodul 2.3 Persistente URIs entwerfen und verwalten Die Mitglieder des PwC Netzwerks unterstützen Organisationen und Individuen dabei, die Werte zu schaffen, nach denen sie suchen. Wir sind ein Netzwerk von Unternehmen mit nahezu Mitarbeitern in 158 Ländern, die sich dazu verpflichtet fühlen Qualität in den Bereichen Assurance, Tax & Legal sowie Advisory zu liefern. Sagen Sie uns, was Ihnen wichtig ist und besuchen Sie für weitere Informationen unsere Webseite PwC bezieht sich auf das PwC Netzwerk und/oder eine oder mehrere Mitgliedsfirmen, von denen jede ein rechtlich selbstständiges Unternehmen ist. Besuchen Sie unsere Webseite für weitere Details.

Diese Präsentation wurde von PwC erstellt Autoren: Michiel De Keyzer, Nikolaos Loutas and Stijn Goedertier Folie 2 Open Data Support wird von der Europäischen Kommission, gemäß SMART 2012/0107 ‘Lot 2: Provision of services for the Publication, Access and Reuse of Open Public Data across the European Union, through existing open data portals’(Vertrag No. 30-CE /00-17) finanziert. © 2014 European Commission Metadaten der Präsentation Disclaimer 1.Die Ansichten, die in dieser Präsentation vertreten werden, spiegeln ausschließlich die Meinung des Autors wider und dürfen unter keinen Umständen als offizielle Position der Europäischen Kommission interpretiert werden. Die Europäische Kommission übernimmt weder eine Garantie für die Genauigkeit der Informationen, die Inhalt dieser Präsentation sind, noch akzeptiert sie jegliche Verantwortung für die Nutzung der selbigen. Referenzen innerhalb dieser Präsentation zu spezifischen Produkten, Spezifikationen, Prozessen oder Services durch Handelsnamen, Markenzeichen, Hersteller oder ähnliches, implizieren nicht unbedingt deren Unterstützung oder Bevorzugung durch die Europäische Kommission. Der Autor hat sämtliche Anstrengungen unternommen, um sicherzustellen, dass er/sie, wo nötig, die Erlaubnis erhalten hat, die einzelnen Teile der in dieser Präsentation genutzten Manuskripte zu benutzen. Dies beinhaltet das Einholen einer Nutzungserlaubnis von den Lizenzinhabern oder deren gesetzlichen Vertretern zur Nutzung von Illustrationen, Karten, Schaubildern, die durch Rechte des geistigen Eigentums geschützt sind. 2.Diese Präsentation wurde sorgfältig von PwC zusammengestellt, jedoch gibt PwC keine Erklärung darüber ab und übernimmt keine Garantie dafür (weder ausdrücklich noch implizit), dass die Informationen in dieser Präsentation vollständig oder akkurat sind. PwC ist nicht für die Informationen in dieser Präsentation oder jedwede Entscheidung oder Konsequenz, die aus ihr resultieren, haftbar zu machen. PwC haftet nicht für etwaige Schäden, die durch die Nutzung der Informationen in dieser Präsentation entstehen sollten. Die Informationen in dieser Präsentation sind genereller Natur und einzig dafür bestimmt, eine Orientierungshilfe für Themen allgemeinen Interesses zu sein. Diese Präsentation ist kein Ersatz für professionelle Beratung zu jedwedem speziellen Thema. Kein Leser sollte auf der Basis der Themendarstellungen in dieser Präsentation handeln, ohne vorher angemessene professionelle Beratung einzuholen.

Lernziele Am Ende dieses Trainingsmoduls sollten Sie wissen: was ein Uniform Resource Identifier (URI) ist. warum die Persistenz von URIs wichtig ist. wie Sie persistente URIs für Datenressourcen entwerfen und verwalten können. Folie 3

Inhalt Dieses Modul enthält... eine Einführung in die Uniform Resource Identifiers (URIs). eine Reihe von Designprinzipen für den Aufbau persistenter URIs. Service-Anforderungen für persistente URIs. Folie 4

Uniform Resource Identifiers (URIs) Als gemeinsame Bezeichnung für Dinge, z.B. Personen, Gebäude, Standorte, Informationsquellen... Folie 5

Was ist ein URI? Ein URI ist „eine kompakte Abfolge von Zeichen, die eine abstrakte oder physische Ressource identifiziert” [TBL et al, 2005]. “Kompakt” bedeutet, dass die Zeichenfolge keine Leerstellen enthalten darf; “Abstrakt oder physisch” bedeutet, dass sich der URI auf ein reales Objekt (oder Ding) beziehen kann, z.B. auf eine Person, ein Gebäude oder sogar auf abstrakte Ideen, wie beispielsweise eine Dienstleistung oder ein Web-Dokument. Folie 6

Zum Beispiel... Ein Land, z.B. Deutschland - Eine Organisation, z.B. das Amt für Veröffentlichungen - body/PUBL Ein Datensatz, z.B. Country Name Authority List - Folie 7 DE

Grundprinzipen Persistent, d.h. ein URI ist einer bestimmten Ressource permanent zugewiesen. Er ist stabil, ändert sich nicht und verschwindet nicht mit der Zeit. Dereferenzierbar, d.h. ein „User-Agent“ kann über das Internet eine Anfrage an diesen URI stellen und empfängt eine aussagekräftige Antwort.  Wenn der User-Agent ein Webbrowser ist, dann sollte das, was zurückkommt, ein von Menschen lesbares HTML-Dokument sein.  Wenn der User-Agent ein RDF Client ist, dann sollte derselbe URI RDF zurückgeben. Eindeutig, d.h. es sollte keine Verwechslungsgefahr zwischen Identifiern für Web-Dokumenten und Identifiern für andere Ressourcen bestehen.  Es sollte einen unterschiedlichen URI für die Referenz des Autors einer Webseite und der Webseite selbst geben. Folie 8

Wesentliche Voraussetzungen Um URIs zu erstellen und zu verwalten, sollte man der Besitzer der jeweiligen Internet-Domain sein und Administratorenrechte haben. Für Regierungsdomains ist es sehr wahrscheinlich, dass diese von einer zentralen Behörde verwaltet werden. Bevor Sie starten, sollten Sie Rücksprache mit Ihren Kollegen halten. Persistente und dereferenzierbare URIs müssen von einer vertrauenswürdigen zugrundeliegenden Web- Infrastruktur unterstützt werden. Eine solche Infrastruktur kann innerhalb Ihrer Organisation verfügbar sein oder von einer anderen Organisation gestellt werden: z.B. als gemeinsame Ressource. Bevor Sie starten, sollten Sie daher Rücksprache mit Ihren IT-Kollegen halten. Folie 9

Was passiert, wenn ein URI nicht dereferenzierbar und/oder persistent ist? Stellen Sie sich die folgende Situation vor... Folie 10 Resource not found Lassen Sie uns die Beschreibung für „Deutschland“ aus der Länder- Code-Liste herausfinden...

Entwerfen von persistenten URIs für Datensätze 10 Dos und Dont‘s Folie 11

Benutzen Sie ein generisches URI-Format {domain} ist eine Kombination des Hosts und des relevanten Sektors. {type} sollte ein Wert aus einer kleinen Anzahl möglicher Werte sein, die den Typ der Ressource erklären, die identifiziert wird. Typische Beispiele sind: - 'id' oder 'item' für reale Objekte; - 'doc' für Dokumente, die diese Objekte beschreiben; - 'def' für Konzepte; - 'set' für Datensätze; -eine kontextspezifische Zeichenfolge. {concept} könnte eine Sammlung, der Typ des genannten realen Objekts oder der Name des Konzeptschemas sein; {reference} ist ein bestimmtes Element, Begriff oder Konzept. Folie 12

Prägen Sie URIs, indem Sie bestehende Bezeichnungen wiederverwenden Bestehende Bezeichnungen für Ressourcen, z.B. Datenbankschlüssel, sollten in den URI eingebaut werden.  Verwenden Sie diejenigen Bezeichnungen wieder, die mit hoher Wahrscheinlichkeit selbst persistent sind.  Verwenden Sie Standardbezeichnungen wieder, anstatt interne systemspezifische Codes zu benutzen. Wenn beispielsweise die Bezeichnung eines Unternehmens in einem nationalen Geschäftsregister ein String wie AB ist, dann könnte die URI für dieses Unternehmen folgendermaßen lauten: Folie 13

Implementieren Sie 303 URIs für reale Ressourcen Wenn keine passende Darstellung für eine reale Ressource existiert (d.h. eine Ressource, die nicht auf einem Dokument basiert wie z.B. eine Person, ein Unternehmen, ein Standort...), ist es nützlich zu einem Web-Dokument geleitet zu werden, das Informationen über diese Ressource beinhaltet. Es vermeidet Unklarheiten zwischen der realen Ressource und dem Dokument, das sie darstellt. Wenn eine Regierung beispielsweise beschließt, 303 URIs zu erstellen, um Grundschulen darzustellen, kann das Ergebnis sein:   Folie 14 Siehe auch: Cool URIs for the Semantic Web. Siehe auch: Cool URIs for the Semantic Web.

Dereferenzierung von 303 URIs und Content- Negotiation Im Falle einer Dereferenzierung sollten die URIs dieser Ressourcen mit HTTP 303 auf ein Dokument antworten, welches das Objekt beschreibt. Der Web-Server muss so konfiguriert werden, dass er von hool1 zu chool1 führt.  Hier ist eine URI-Regel zum Umschreiben aktiv, die typischerweise den URI {type} von ‘id’ zu ‘doc’ ändert. Es sind verschiedene Darstellungen möglich, z.B. RDF, XML, HTML... Folie /school1.rdf /school1.html Siehe auch: Cool URIs for the Semantic Web. Siehe auch: Cool URIs for the Semantic Web.

Vermeiden Sie es, Versionsnummern in URIs einzufügen Datensätze, Konzeptschemata, Ontologien, Taxonomien und Vokabulare werden in aufeinanderfolgenden Versionen in sich wiederholenden Änderungs-/Update-Zyklen veröffentlicht. Die URIs sollten zwischen den Versionen beständig bleiben.  Versionsnummern und Statusinformationen sollten nicht in den URI aufgenommen werden. Stellen Sie sich beispielsweise zwei aufeinanderfolgende Versionen v0.01 und v0.02 des Schuldatensatzes vor. Wenn hier Versionsinformationen in dem URI enthalten wären, müsste der URI des Datensatzes jedes Mal, wenn eine neue Version herauskommt, geändert werden.   Folie 16

Vermeiden Sie es „Auto-Inkrement“ zu benutzen, wenn sie neue URIs prägen. Bei der Erstellung von URIs für einen großen Datensatz mag es einfach sein, einen Zähler automatisch hochzählen zu lassen. Dies kann jedoch zu ernsten Problemen führen.  Was passiert, wenn der Datensatz aktualisiert wird und URIs wieder neu zugeordnet werden müssen? Wie können wir sicherstellen, dass die Sequenz der Nummerierung die gleiche sein wird? Bedeutet dies, dass ich es nie tun sollte? Die Verwendung von Auto-Inkrement für URIs kann in Betracht gezogen werden, wenn:  der Prozess niemals wiederholt werden wird;  der Prozess so wiederholt werden kann, dass genau dieselben URIs für dieselben Eingabedaten zugewiesen werden und neue URIs nur für neue Elemente geprägt werden. Folie 17

Vermeiden Sie die Nutzung von Query-Strings Ein Query-String (z.B. ‘?param=value’) ist ein Text, der an das Ende einer URL angehängt wird und der Daten enthält, die an Web- Anwendungen weitergegeben werden, z.B. Suchparameter, um Begriffe in einer Datenbank nachzuschlagen.  Query-Strings sind nicht persistent, da sie auf bestimmten Anwendungen beruhen. Daher sollten sie von URIs vermeiden werden. Stellen Sie sich zum Beispiel vor, der URI eines von einem nationalen Unternehmensregister (NBR) veröffentlichten Unternehmens wäre statt Folie 18

Vermeiden Sie es, Informationen über die Eigentümerschaft einzubeziehen Eine persistente URI-Vorlage sollte nicht den Namen der Organisation oder des Projekts beinhalten, das den URI geprägt hat. Stellen Sie sich zum Beispiel vor, der URI eines von einem nationalen Unternehmensregister (NBR) veröffentlichten Unternehmens wäre Nach ein paar Jahren wird das NBR in ‚Nationales Gesellschaftsregister‘ (NGR) umbenannt. Infolgedessen müssten alle URIs aktualisiert werden. In diesem Fall wäre ein URI, der dafür entworfen wurde persistent zu sein: Folie 19

Vermeiden Sie es, Dateierweiterungen zu verwenden Dateierweiterungen zeigen den Dateityp eines bestimmten Dokuments an. Die Verwendung von Dateierweiterungen sollte in persistenten URIs vermieden werden. Beispielsweise sollte der URI von einem Datensatz, der eine Liste von Schulen in einem Mitgliedsstaat der EU enthält, eher  lauten, als  Die Dateierweiterung kann Teil der Metadaten des Dokuments sein.  z.B. dcat:mediaType im Datenkatalogvokabular von W3C zur Beschreibung von Datensätzen. Folie 20

Anbieten persistenter URIs für Datensätze Folie 21

Verwenden Sie einen speziellen Dienst Es muss ein spezieller zuverlässiger Dienst eingerichtet werden, der unabhängig vom Urheber der Daten ist. Dieser Dienst sollte, sofern nötig, leicht auf jemand anderen übertragen und von ihm ausgeführt werden können.  Dublin Core verwendet purl.org  data.gov.uk und publications.europa.eu sind ebenfalls unabhängig von einer bestimmten Behörde Es ist nicht erforderlich einen einzigen Dienst für mehrere Datenprovider einzusetzen.  Höheres Risiko, weil es eine einzelne Fehlerstelle wäre, aber:  Es ist leichter zu verwalten und kosteneffizienter. Folie 22

Schlussfolgerungen Ein URI ist „eine kompakte Zeichenfolge, die eine abstrakte oder physische Ressource identifiziert”. Folie 23 Siehe auch: 10 Rules for Persistent URIs. Siehe auch: 10 Rules for Persistent URIs.

Gruppenfragen Gibt es in Ihrem Land eine nationale Richtlinie für URIs? Wenn ja, was sind ihre Grundprinzipen? Verfügt Ihr Land über einen speziellen Dienst für die Persistenz von URIs? Wenn ja, welche Organisation verwaltet diesen Dienst? Wenn nein, warum nicht? Folie 24 Machen Sie auch den Online-Test!Online-Test

Vielen Dank!...und jetzt IHRE Fragen? Folie 25

Referenzen Folie 6: T. Berners-Lee, R. Fielding and L. Masinter (2005) "Uniform Resource Identifier (URI): Generic Syntax". Folien 11-22: UK Government, CTO Council, Designing URI sets of the UK Public Sector. /60975/designing-URI-sets-uk-public-sector.pdf /60975/designing-URI-sets-uk-public-sector.pdf EC ISA Programme, Study on persistent URIs, with identification of best practices and recommendations on the topic for the MSs and the EC. uris uris Folien 14-15: Cool URIs for the Semantic Web, Folie 26

Weiterführende Literatur (1/2) T. Berners-Lee, R. Fielding and L. Masinter (2005) "Uniform Resource Identifier (URI): Generic Syntax". UK Government, CTO Council, Designing URI sets of the UK Public Sector. nt_data/file/60975/designing-URI-sets-uk-public-sector.pdf nt_data/file/60975/designing-URI-sets-uk-public-sector.pdf EC ISA Programme, Study on persistent URIs, with identification of best practices and recommendations on the topic for the MSs and the EC. rules-persistent-urishttps://joinup.ec.europa.eu/community/semic/document/10- rules-persistent-uris Folie 27

Weiterführende Literatur (2/2) Linked Data: Evolving the Web into a Global Data Space. Tom Heath and Christian Bizer. Folie 28

Verwandte Projekte und Initiativen LOD2 FP7 project, W3C Cool URIs for the Semantic Web   URI Design Principles: Creating Unique URIs for Government Linked Data, Publications Office of the European Commission, Data.gov.uk, Folie 29

Werden Sie Teil unseres Teams... Folie 30 Besuchen Sie uns Kontaktieren Sie uns Lernen Sie uns kennen Folgen Sie uns Open Data Support Open Data Support