1 Reinhard Altenhöner Kollaboration durch das Semantic Web: Strategie und Aktivitäten der Deutschen Nationalbibliothek SWIB 2010 Köln, 29.11.2010 mit herzlichem Dank an die Kollegen A.Haffner, S. Hartmann, J.Hannemann, J.Hauser, J.Kett, L.Svensson
ToC Ausgangspunkt und Motivation Aktivitäten und Ziele 2 ToC Ausgangspunkt und Motivation Aktivitäten und Ziele Weitere Planungen / Entwicklung Zusammenfassung / Perspektiven | Reinhard Altenhöner|SWIB 2010 | 29.11.2010
1. Ausgangspunkt(e) und Motivation 3 1. Ausgangspunkt(e) und Motivation | Reinhard Altenhöner| SWIB 2010 | 29.11.2010
4 Punkt 1: (Norm)daten Personen, Körperschaften, Sachschlagwörter = Gemeinsame Normdatei GND DDC PND SWD GKD | Reinhard Altenhöner| SWIB 2010 | 29.11.2010
5 Beispiel: | Reinhard Altenhöner| SWIB 2010 | 29.11.2010
6 Die Innensicht: PICA+ | Reinhard Altenhöner| SWIB 2010 | 29.11.2010
Punkt 2 Linked Open Data: Die Prinzipien 7 Punkt 2 Linked Open Data: Die Prinzipien Use URIs (Unique Ressource Identifiers) as names for things Use HTTP URIs so that people can look up and reference those things. When someone looks up a URI, provide useful information, using the standards (RDF, SPARQL) Include links to other, related URIs, so that users can discover more things (Tim Berners-Lee, 2007) | Reinhard Altenhöner| SWIB 2010 | 29.11.2010
Linked Data: Das Konzept 8 Linked Data: Das Konzept Ein Verfahren zum Veröffentlichen, Austauschen und Verknüpfen von Daten im World Wide Web Einfaches und praxisorientiertes Grundprinzip (kein „Standard“, sondern Best-Practices) Bedingungen: Zitierbarkeit und Transparenz Persistenz von Daten und Ressourcen Nützlich: Sichtbarkeit der Urheberschaft von Daten, Änderungshistorie Global vernetzt: domänenübergreifend (Recherche, Entstehung und Anreicherung von Daten) | Reinhard Altenhöner| SWIB 2010 | 29.11.2010
Zusammenfassung: Ausgangslage 9 Zusammenfassung: Ausgangslage Positiv: Gut gepflegte, relevante Datenbestände Museen Archive Biblio-theken ... Verlage Mangelware: Interoperabilität der Daten Datentausch Kooperative Datenpflege Integrierte, übergreifende Dienstleistungen Präsenz im WWW | Reinhard Altenhöner| SWIB 2010 | 29.11.2010
Lösungsansatz „Linked Data“ 10 Lösungsansatz „Linked Data“ Museen Archive Biblio-theken ... Verlage Weltweite Datenbank aus vernetzten Daten | Reinhard Altenhöner| SWIB 2010 | 29.11.2010
Linked Data heute: Bibliotheksdaten sind drin 11 Linked Data heute: Bibliotheksdaten sind drin | 28 | Normdateien als Linked Data | 23. September 2010
12 2. Aktivitäten und Ziele | Reinhard Altenhöner| SWIB 2010 | 29.11.2010
Unsere Vision: Global Cultural Graph 13 Unsere Vision: Global Cultural Graph Bibliotheken, Museen und Archive sind integraler Bestandteil des Semantic Web Sie geben ihm die nötige Verlässlichkeit und Stabilität Persistenz als Kernaufgabe Sie sind Stützen für das Netz der Kultur und der Wissenschaft | Reinhard Altenhöner| SWIB 2010 | 29.11.2010
Linked Data Service Projekt „Linked Data“ (10/2009 – 05/2010): 14 Linked Data Service Projekt „Linked Data“ (10/2009 – 05/2010): Inbetriebnahme eines Beta-Services Erster Kontakt mit der Semantic-Web-Community Erfahrungsaustausch mit den Nutzern Projekt „Linked Data 2“ (07/2010 – 12/2010) Bessere Skalierbarkeit Neue Datasets, mehr Verlinkung Suchschnittstellen LD als vollwertiger Dienst | Reinhard Altenhöner| SWIB 2010 | 29.11.2010
Linked Data. Vorläufige Erkenntnisse 15 Linked Data. Vorläufige Erkenntnisse Datenmodellierung ist komplex Etablierte Ontologien bilden unsere Daten nicht vollständig ab Verwendung von geeigneten Teilen Ergänzung um spezielle Properties, aber: Risiko Modellierung in RDA, SKOS, etc. | Reinhard Altenhöner| SWIB 2010 | 29.11.2010
16 Für Körperschaften und Personen: Mischung aus RDA und eigenem Vokabular http://marccodes.heroku.com/languages/ger “1966” “1877“ rdaGr2:languageOfThePerson http://dbpedia.org/resource/Hermann_Hesse rdaGr2:dateOfBirth rdaGr2:dateOfDeath owl:sameAs http://d-nb.info/gnd/11855042X rdaRelGr2:relatedPersonPerson gnd:preferredNameForThePerson http://d-nb.info/gnd/118609920 gnd:foreName gnd:usedRules rdaGr2:gender gnd:surname http:// RDVocab.info/termList/gender/1002 “RAK-WB“ “Hesse“ “Hermann“ | Reinhard Altenhöner| SWIB 2010 | 29.11.2010
dnb:CoordinatedConcept 17 SWD und DDC mit SKOS „Nymphensittich“@de „Nymphicus hollandicus“@lat skos:Concept rdfs:type skos:prefLabel skos:altLabel http://d-nb.info/gnd/4042855-2 rdfs:subclassOf dnb:coordination-of skos:broader dnb:CoordinatedConcept rdfs:type dnb:det2match http://d-nb.info/gnd/4239774-1 dnb-ddc: 598.71 dnb:coordination-of skos:prefLabel skos:altLabel dnb-sg:590 Normdatei Authority file | Reinhard Altenhöner| SWIB 2010 | 29.11.2010
Verlinkungen zu LCSH, Rameau, VIAF und DBPedia 18 Verlinkungen zu LCSH, Rameau, VIAF und DBPedia LCSH VIAF DNB Rameau DBPedia | Reinhard Altenhöner| SWIB 2010 | 29.11.2010
Aktueller Stand: LD Daten 19 Aktueller Stand: LD Daten BETA Service Normdaten: Individualisierte Personen (PND) 1.797.911 Sachschlagworte (SWD) 187,743 Körperschaften (GKD) 1.320.711 DDC-Klassen 51.748 Links: PND → SWD (Beruf) 1.059.570 Verknüpfungen zu: Wikipedia 123.569 DBpedia 40.136 VIAF 1.786.975 LCSH 37.547 RAMEAU 28.249 Tripel 40.192.561 | Reinhard Altenhöner| SWIB 2010 | 29.11.2010
Aktueller Stand: Einbindung ins Portal 20 Aktueller Stand: Einbindung ins Portal | Reinhard Altenhöner| SWIB 2010 | 29.11.2010
Aktueller Stand: Technik 21 Aktueller Stand: Technik Apache Tomcat SPARQL (HTTP-Binding) Conversion Tools Jena API CBS RdfExporter Joseki Index TDB File TDB read/write read | Reinhard Altenhöner| SWIB 2010 | 29.11.2010
Aktueller Stand: Nachnutzung (Beispiele) 22 Aktueller Stand: Nachnutzung (Beispiele) TU Braunschweig: Durchsuchbare Datenbank der Normdaten mit Webinterface „Pressemappe 20. Jahrhundert“ der ZBW Museumsverband: Anreicherung einer Website für Museumsstück Rückführung unserer MACS-Mappings nach RAMEAU (und verm. LCSH) Erfahrungsaustausch mit verschiedenen Bibliotheken und Institutionen | Reinhard Altenhöner| SWIB 2010 | 29.11.2010
Nachnutzung: Beispiele 23 Nachnutzung: Beispiele | Reinhard Altenhöner| SWIB 2010 | 29.11.2010
Aktivitäten der DNB im Überblick – nächste Schritte 24 Aktivitäten der DNB im Überblick – nächste Schritte Projekt / Aktivität Zweck Linked Data Publikation von Titeldaten Ausweitung verknüpfter Datenbestände Neukonzeption der DNB-Geschäftsmodelle Klare Ausrichtung auf das WWW und seine impliziten Anforderungen (Lizenz) URN / CG Verlässlichkeit Persistenz / Zitierfähigkeit PersID / ECON Europäischer Kontext Bessere Sichtbarkeit CONTENTUS / DDB Semantische multimediale Suche Automatische Erschließung Regelwerke (RDA) Werkdatei Kumulativ-kooperative Erschließung | Reinhard Altenhöner| SWIB 2010 | 29.11.2010
25 CG | Reinhard Altenhöner| SWIB 2010 | 29.11.2010
Die Contentus-Prozesskette 26 Die Contentus-Prozesskette 1 2 Face 3 Logo Text Person Voice, music… 4 Knowledge Base 5 6 Film Information about actors, director, producers, music, sequence, year of production. Short description of the picture, video sequence… Any other relevant information as short summary of content for fast access… What is in the film, rights. Year of printing, editions, authors, summary of the book…. Related books Related internet links Related music score Related films Related songs Related news ? Digitization Automatic quality analysis & optimization Automatic content context analysis & Semi- automatic semantic linking Open knowledge network Multimedia search & access Manage, search, retrieve, reuse, … Entity Recognition Strukturerkennung / Sequenzanalysen Interferenzen Semantische Multimediasuche | Reinhard Altenhöner| SWIB 2010 | 29.11.2010 26
3. Weitere Planungen / Entwicklung 27 3. Weitere Planungen / Entwicklung | Reinhard Altenhöner| SWIB 2010 | 29.11.2010
Daten sind veröffentlicht. Und jetzt? 28 Daten sind veröffentlicht. Und jetzt? WWW PND HBZ-Titel … DNB-Titel Deutsches Filmarchiv Kleinere Museen Kleinere Archive Kleinere Bibliotheken | Reinhard Altenhöner| SWIB 2010 | 29.11.2010
Suchmaschinen? Wirklich? 29 Suchmaschinen? Wirklich? Web-Suchmaschine Unverknüpfte Dubletten hunderte URIs für dieselbe Ressource Anbindung kleinerer Einrichtungen PND HBZ-Titel … DNB-Titel Deutsches Filmarchiv Kleinere Museen Kleinere Archive Kleinere Bibliotheken | Reinhard Altenhöner| SWIB 2010 | 29.11.2010
WWW culturegraph.org … culturegraph.org PND DNB-Titel HBZ-Titel 30 culturegraph.org WWW culturegraph.org PND DNB-Titel HBZ-Titel … Deutsches Filmarchiv Kleinere Museen Kleinere Archive Kleinere Bibliotheken | Reinhard Altenhöner| SWIB 2010 | 29.11.2010
Zusammenfassung / Perspektiven 31 Zusammenfassung / Perspektiven Linked Data ist der Quasistandard für Datenveröffentlichung und Datenaustausch im WWW Es geht um Verlinkung und Interoperabilität LD ist bereits domänen- übergreifend Vertrauenswürdigkeit Langfristig unverzichtbar: offene Lizenz! Beschäftigung mit RDF / geeigneten Ontologien Kooperation und Koordination | Reinhard Altenhöner| SWIB 2010 | 29.11.2010
32 Fragen? | Reinhard Altenhöner| SWIB 2010 | 29.11.2010