DMS Expo Stuttgart, Prof. Dr. Stefan Gradmann

Slides:



Advertisements
Ähnliche Präsentationen
Relative Clauses.
Advertisements

Themenportal Europäische Geschichte / Web portal European History
H - A - M - L - E - IC T Teachers Acting Patterns while Teaching with New Media in the Subjects German, Mathematics and Computer Science Prof. S. Blömeke,
Der Supermarkt: Eine beispielhafte Erklärung für die fünf untersten Schichten des Semantic Web Protocol Stack Nicola Henze.
Der Supermarkt: Eine beispielhafte Erklärung für die fünf untersten Schichten des Semantic Web Protocol Stack Nicola Henze.
RDF Resource Description Framework
Don`t make me think! A Common Sense Approach to Web Usability
You need to use your mouse to see this presentation © Heidi Behrens.
You need to use your mouse to see this presentation © Heidi Behrens.
Christoph Durt: Wittgenstein on the possibility of philosophy: The importance of an intercultural approach
Sesame Florian Mayrhuber
XML-Query. Übersicht Was ist XML-Query? Vergleich RDB XML-Dokument Syntaktisches und Use-Cases Kritik und Diskussion.
CALPER Publications From Handouts to Pedagogical Materials.
Struktur von RDF Fabian Scheller.
Semantic Web - ein Thema für Bibliotheksverbünde SWIB 2010, Köln Dr. Silke Schomburg.
Linked Data und semantische Suchfunktionalität in Europeana
Dublin Core IT-Zertifikat Daten- und Metadatenstandards.
Der Supermarkt: Eine beispielhafte Erklärung für die fünf untersten Schichten des Semantic Web Protocol Stack Nicola Henze.
Der formelle Imperativ – the Imperative
Coordinating Conjunctions Why we need them & how to use them deutschdrang.com.
Daten im Silo, Daten im Web
Seminar: Neue Ansätze der Künstlichen Intelligenz Seite 1Ulf Schneider02. Juli 2002 Ulf Schneider Neue Ansätze der Künstlichen Intelligenz: OIL Ontology.
Linked Open Europeana: Das Europeana Data Model (EDM) Prof. Dr. Stefan Gradmann Unter Rückgriff auf M. Doerr, S. Hennicke, A. Isaac, C. Meghini, G. Schreiber,
Deutsch Eins
Literary Machines, zusammengestellt für ::COLLABOR:: von H. Mittendorfer Literary MACHINES 1980 bis 1987, by Theodor Holm NELSON ISBN
1 Linked Open Data Klaus Tochtermann ZBW – Leibniz Information Centre for Economics Hamburg/Kiel Christian-Albrechts-University Kiel Sept. 7, 2011.
RDF (Resource Descripton Network)
Collaborative Research Online: Knowledge management pilot project on Haskala Dr. Rachel Heuberger, Judaica Abteilung, Universitätsbibliothek Frankfurt.
Possessive Adjectives How to show belonging… The information contained in this document may not be duplicated or distributed without the permission of.
1/15 Thursday, 21 June 2007 Werner Sudendorf, Jürgen Keiper Deutsche Kinemathek – Museum für Film und Fernsehen Werner Sudendorf, Jürgen Keiper Reconstructing.
Kapitel 4 Grammar INDEX 1.Ordinal Numbers 2.Relative Pronouns and Relative Clauses 3.Conditional Sentences 4.Posessive: Genitive Case.
Kapitel 2 Grammar INDEX 1.Subjects & Verbs 2.Conjugation of Verbs 3.Subject Verb Agreement 4.Person and Number 5.Present Tense 6.Word Order: Position of.
The Chicago Style (2 e-publication) -1- The Practice of Citing Scientific Sources in the Chicago Style Part 2 - Electronic sources -
Chair of Business and Human Resource Education II Prof. Dr. Marc Beutner EU-StORE: The EU-StORe OER and Learning scenario conference, Rome 27 th – 29 th.
Word order: 1.In a main clause the VERB is the second idea: Helgakommteben aus der Bäckerei This may not be the second word Meiner Meinung nachsind Hobbys.
© 2012 IBM Corporation © 2013 IBM Corporation IBM Storage Germany Community Josef Weingand Infos / Find me on:
Master in Web Science Shape the Web of Tomorrow!.
Indico Meeting Dennis Klein 4. August Übersicht  Korrespondenz CERN  Trouble Ticket Queue  Integration GSI-Accounts  Subversion & Wiki  Todo.
Technische Universität München Institute of Aeronautical Engineering Prof. Dr.-Ing. Horst Baier Presentation of the Institute (December 2009)
Ralf Stockmann, Stefan Schmunk SUB Göttingen, Abteilung Forschung & Entwicklung Forschungsdaten in Raum und Zeit.
1 Bücher zu Tripel Auf dem Weg zum 'Semantic Publishing' Prof. Dr. Stefan Gradmann Humboldt-Universität zu Berlin / School of Library and Information Science.
Michael Goriany   webCampus:Projects Seminar Prof. Lachmayer _____________________________________________________________________________________________________________________________.
Linked Open Europeana: technische und andere Rahmenbedingungen für den Zugang zu Europas kulturellem Erbe Prof. Dr. Stefan Gradmann Unter Rückgriff auf.
„Repositorien-Inhalte als Linked (Open) Data“ Prof. Dr. Stefan Gradmann, HU-Berlin Julia Iwanowa, OA-Netzwerk Open Access Netzwerk als Linked (Open) Data.
1 Ist Katalogisierung zukunftsfähig? Ein Beitrag zur Begriffsverschiebung Prof. Dr. Stefan Gradmann Humboldt-Universität zu Berlin / School of Library.
LLP DE-COMENIUS-CMP Dieses Projekt wurde mit Unterstützung der Europäischen Kommission finanziert. Die Verantwortung für den Inhalt dieser.
1 Von Xanadu zu ORE und LoD Granular vernetzte, de-konstruierte Textobjekte und semantisch basierte Heuristiken Prof. Dr. Stefan Gradmann Humboldt-Universität.
Was ist eigentlich… Big Data?
Interrogatives and Verbs
Sentence Structure Questions
Thema: Umwelt: Was könnte man tun, um der Umwelt zu helfen?
Process and Impact of Re-Inspection in NRW
Synonyms are two or more words belonging to the same part of speech and possessing one or more identical or nearly identical denotational meanings, interchangeable.
Metadata - Catalogues and Digitised works
Was gibt es in deiner Stadt?
Seminarphase PG 402 Thema: Semantic Web Autor: Phillip Look
You need to use your mouse to see this presentation
PI Infrastruktur in der Max-Planck-Gesellschaft
„Förderwolke“ A Cloud-based exchange platform for the qualitative enhancement and improvement of inclusive education Dipl. Reha-Päd. Hanna Linke scientific.
Integrating Knowledge Discovery into Knowledge Management
Practical Exercises and Theory
Ist Katalogisierung zukunftsfähig?
Viel Information ist nicht genug: Vom Umgang mit Wissen in Betrieben
School supplies.
Die tiere Share: Introduce the session and PDSA.
Dokumente dekonstruieren! Ein Plädoyer für semantische Bibliotheken
Prof. Dr. Stefan Gradmann (KU Leuven)
DMS Expo Stuttgart, Prof. Dr. Stefan Gradmann
πάντα ῥεῖ (?) Ein Plädoyer für die Erhöhung der Fließgeschwindigkeit
 Präsentation transkript:

Kontext in der Wolke Semantische Kontextualisierung im Publishing und Dokumentmanagement DMS Expo Stuttgart, 23.10.2011 Prof. Dr. Stefan Gradmann Humboldt-Universität zu Berlin / School of Library and Information Science Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis (DGI) stefan.gradmann@ibi.hu-berlin.de

Überblick Was sind “Semantische Technologien”? Was ist “Kontextualisierung”? Wie kombinieren wir beides zu “Semantic Publishing”? Semantic CMS … … und der Elefant im Wohnzimmer Was kostet der Spaß? Semantische Kontextualisierung im Publishing und Dokumentmanagement Prof. Dr. Stefan Gradmann, DMS Expo, Stuttgart, 23.10.2012

“Semantische Technologien”? Was sind “Semantische Technologien”? Semantische Kontextualisierung im Publishing und Dokumentmanagement Prof. Dr. Stefan Gradmann, DMS Expo, Stuttgart, 23.10.2012

Vom Web der Dokumente zum Linked Data Web Das Web der Dokumente: Information Management: A Proposal (TBL, 1989). Baut auf Dokumenten („Information Resources“) Untypisierten HTTP links Das Web der Linked Open Data ist eine Erweiterung des Web der Dokumente in Syntax (RDF) im Umfang (unter Einschluss der Reprä- sentationen von „non- information resources“, 'Dingen', 'Daten') Semantische Kontextualisierung im Publishing und Dokumentmanagement Prof. Dr. Stefan Gradmann, DMS Expo, Stuttgart, 23.10.2012

Entitäten und Links im Web der Dokumente Mit HTTP URIs identifizierte Entitäten und Verbindungen zwischen ihnen – und doch fehlt so einiges! Was für Arten von Entitäten sind 'Louvre.html' und 'LaJoconde.jpg'? Eine Maschine weiss es nicht. Menschen schon: wir erkennen impliziten Kontext! Wie verhalten sich diese Entitäten zueinander? Menschen schon: auch hier erkennen wir impliziten Kontext! Semantische Kontextualisierung im Publishing und Dokumentmanagement Prof. Dr. Stefan Gradmann, DMS Expo, Stuttgart, 23.10.2012

Syntaktische Erweiterung des Web der Dokumente (1) Eine Syntax für Aussagen über Entitäten und die Art ihrer Verbindung: Resource Description Framework (RDF) Eine Schema-Sprache (RDFS) als 'Grammatik' mit Elementen wie Klassen (Stuhl' als Instanz der Klasse Stuhl), Hierarchien von Klassen und Relationen (Stuhl als Unterklasse von Möbel, Unterrichten als Unterklasse von Kommunizieren) Vererbung (Kommunizieren basiert auf Sprache → dann ist dies auch bei Unterrichten der Fall) Unterstützung für einfache, deterministische Schlusssysteme Semantische Kontextualisierung im Publishing und Dokumentmanagement Prof. Dr. Stefan Gradmann, DMS Expo, Stuttgart, 23.10.2012

Syntaktische Erweiterung des Web der Dokumente (2) Mit diesen Mitteln können wir Strukturen in Aggregationen von Tripeln modellieren: das Ergebnis sind leichtgewichtige Domain-Ontologien Semantische Kontextualisierung im Publishing und Dokumentmanagement Prof. Dr. Stefan Gradmann, DMS Expo, Stuttgart, 23.10.2012

Erweiterung des Geltungsbereichs is Web: Das Web der Dinge … (missverstanden) Etwas stimmt an diesem Bild nicht! Taken from Ronald Carpentier's Blog at 2007/08/08/1-2-3/ Semantische Kontextualisierung im Publishing und Dokumentmanagement Prof. Dr. Stefan Gradmann, DMS Expo, Stuttgart, 23.10.2012

… und so funktioniert das Web der Dinge tatsächlich Semantische Kontextualisierung im Publishing und Dokumentmanagement Prof. Dr. Stefan Gradmann, DMS Expo, Stuttgart, 23.10.2012

Und das Ergebnis ist … Linked Data Standard Identifiers Standard Pointers Standards for Queries and Statements Link to Context Copyright © 2008 W3C (MIT, ERCIM, Keio) http://www.w3.org/2008/Talks/0617-lod-tbl/#(4) Semantische Kontextualisierung im Publishing und Dokumentmanagement Prof. Dr. Stefan Gradmann, DMS Expo, Stuttgart, 23.10.2012

Ganz zu Anfang: 5/2007 ca. 500 Millionen RDF Tripel ca. 120.000 RDF Links zwischen Datenquellen © Richard Cyganiak Semantische Kontextualisierung im Publishing und Dokumentmanagement Prof. Dr. Stefan Gradmann, DMS Expo, Stuttgart, 23.10.2012

Deutlich mehr Kugeln: 9/2008 © Richard Cyganiak Semantische Kontextualisierung im Publishing und Dokumentmanagement Prof. Dr. Stefan Gradmann, DMS Expo, Stuttgart, 23.10.2012

Viele Kugeln: 7/2009 < Über 13.1 Milliarden RDF Tripel < Über 142 Millionen RDF-Links zwischen Datenquellen © Richard Cyganiak Semantische Kontextualisierung im Publishing und Dokumentmanagement Prof. Dr. Stefan Gradmann, DMS Expo, Stuttgart, 23.10.2012

Und wirklich viele Kugeln: 09/2010 http://richard.cyganiak.de/2007/10/lod/lod-datasets_2010-09-22_colored.html Semantische Kontextualisierung im Publishing und Dokumentmanagement Prof. Dr. Stefan Gradmann, DMS Expo, Stuttgart, 23.10.2012

… und deutlich größer im letzen Jahr Europeana intends to connect to the Linked Open Data community. In the Linked Open Data cloud we find many more knowledge sources like Dbpedia, Geonames, or Library of Congress Subject Headings. Europeana wants to use them to further contextualize and enrich the objects in its information space. At the same time Europeana wants to make its own data available to other communities. The EDM is crucial for realizing this vision. [ LOD cloud July 2009 ] ca. 31 Milliarden RDF Tripel ca. 504 Millionen Links zwischen Datenquellen Semantische Kontextualisierung im Publishing und Dokumentmanagement Prof. Dr. Stefan Gradmann, DMS Expo, Stuttgart, 23.10.2012 15

Struktur in Wikipedia Title Abstract Infoboxes Geo-coordinates 1717 Struktur in Wikipedia Title Abstract Infoboxes Geo-coordinates Categories Images Links other language versions other Wikipedia pages To the Web Redirects Disambiguations Semantische Kontextualisierung im Publishing und Dokumentmanagement Prof. Dr. Stefan Gradmann, DMS Expo, Stuttgart, 23.10.2012 © Sören Auer

Infobox templates Wikitext-Syntax RDF representation {{Infobox Korean settlement | title = Busan Metropolitan City | img = Busan.jpg | imgcaption = A view of the [[Geumjeong]] district in Busan | hangul = 부산 광역시 ... | area_km2 = 763.46 | pop = 3635389 | popyear = 2006 | mayor = Hur Nam-sik | divs = 15 wards (Gu), 1 county (Gun) | region = [[Yeongnam]] | dialect = [[Gyeongsang]] }} http://dbpedia.org/resource/Busan dbp:Busan dbpp:title ″Busan Metropolitan City″ dbp:Busan dbpp:hangul ″부산 광역시″@Hang dbp:Busan dbpp:area_km2 ″763.46“^xsd:float dbp:Busan dbpp:pop ″3635389“^xsd:int dbp:Busan dbpp:region dbp:Yeongnam dbp:Busan dbpp:dialect dbp:Gyeongsang Wikitext-Syntax RDF representation Semantische Kontextualisierung im Publishing und Dokumentmanagement Prof. Dr. Stefan Gradmann, DMS Expo, Stuttgart, 23.10.2012 © Sören Auer

Eine große multi-linguale, multi-domänen Wissensbasis Beschreibungen von 3,4 Millionen Dingen 1,5 Millionen ontologisch klassifiziert 312.000 Personen, 413.000 Orte, 94.000 Musikalben, 49.000 Filme, 15.000 Videospiele, 140.000 Organisationen, 146.000 Arten, 4.600 Krankheiten Multilingual, kategorisiert und kontextualisiert Labels und Zusammenfassungen in 92 verschiedenen Sprachen 1.460.000 Links zu Bildern 5.543.000 Links zu externen WWW-Seiten 4.887.000 Links zu externen RDF-Ressourcen 565.000 Wikipedia- und 75.000 YAGO-Kategorien Viele, viele Milliarden Aussagen (d.h. RDF-Tripel): 25% aus der englischen und 75% aus den anderen Ausgaben der Wikipedia Semantische Kontextualisierung im Publishing und Dokumentmanagement Prof. Dr. Stefan Gradmann, DMS Expo, Stuttgart, 23.10.2012 © Sören Auer

… neue Möglichkeiten: Tripel-Aggregationen und 'Reasoning' Hier könnte ein Exkurs zu RTP Doc ansetzen, wenn ich mehr als 20 Minuten Zeit hätte Semantische Kontextualisierung im Publishing und Dokumentmanagement Prof. Dr. Stefan Gradmann, DMS Expo, Stuttgart, 23.10.2012

Google ist dabei! Semantische Kontextualisierung im Publishing und Dokumentmanagement Prof. Dr. Stefan Gradmann, DMS Expo, Stuttgart, 23.10.2012

“Semantic Publishing” (Shotton 2009) Shotton et al. (2009a) definieren als 'semantic publication' alle Techniken, die einen bereits veröffentlichten Artikel mit Bedeutung anreichern, ihn mit automatisierten Ansätzen auffindbar machen, Ihn mit semantisch verwandten Artikeln verlinkbar machen, Die im Artikel enthaltenen Daten nachnutzbar machen oder Die Integration von Artikeln auf Ebene der enthaltenen Daten erleichtern. Semantische Kontextualisierung im Publishing und Dokumentmanagement Prof. Dr. Stefan Gradmann, DMS Expo, Stuttgart, 23.10.2012

Hinter den Kulissen Semantische Kontextualisierung im Publishing und Dokumentmanagement Prof. Dr. Stefan Gradmann, DMS Expo, Stuttgart, 23.10.2012

Semantische Anreicherung Generisch: Temis () → mehr von Stefan Geissler Domänenbezogen spezialisiert: Bio Taxon Finder (ml_services) ConceptWebAlliance () (Biomedical, Jan Velterop) … aber kompetent kritisiert von Roderic Page: “linking terms to HTML pages doesn't get us much further. Great for humans, not so good for computers.” Immer noch zu sehr auf das Format 'Zeitschriftenaufsatz' fokussiert. → Wir brauchen etwas mehr! → dazu auch Michael Dreusicke Semantische Kontextualisierung im Publishing und Dokumentmanagement Prof. Dr. Stefan Gradmann, DMS Expo, Stuttgart, 23.10.2012

Publikationen: “The Liquid Version” “Turning inked letters into electronic dots that can be read on a screen is simply the first essential step in creating this new library. The real magic will come in the second act, as each word in each book is cross-linked, clustered, cited, extracted, indexed, analyzed, annotated, remixed, reassembled and woven deeper into the culture than ever before. In the new world of books, every bit informs another; every page reads all the other pages.” Kevin Kelly, The New York Times Magazine, May 14, 2006 Semantische Kontextualisierung im Publishing und Dokumentmanagement Prof. Dr. Stefan Gradmann, DMS Expo, Stuttgart, 23.10.2012

... und 'Dokumente' als Aggregationen von RDF-Tripeln (1) Semantische Kontextualisierung im Publishing und Dokumentmanagement Prof. Dr. Stefan Gradmann, DMS Expo, Stuttgart, 23.10.2012

'Documents' as Aggregations of RDF-Triples (2) <nanopublication id="0"> <assertion> <subject>NG_000007.3:g.70628G>A</subject> <predicate>has variant frequency</predicate> <object>0.25%</object> </assertion> <condition>Sardinian</condition> <provenance> <dateofcreation>March 24, 2011</dateofcreation> <lastedit>March 24, 2011</lastedit> <evidenceType>empirical</evidenceType> <authorID>Giardine et. al.</authorID> <curatorID>unresolved</curatorID> <registrantID>Mons et. al.</registrantID> <PMID>6695908</PMID> <PMID>1428944</PMID> <PMID>1610915</PMID> <DOI>http://dx.doi.org/10.1038/ng.785</DOI> <linkout>http://globin.bx.psu.edu/cgi-bin/hbvar/query_vars3?mode=output&display_format=page&i=239</linkout> <linkout>http://phencode.bx.psu.edu/cgi-bin/phencode/phencode?build=hg18&id=HbVar.239</linkout> </provenance> <nanopublication id="0"> Semantische Kontextualisierung im Publishing und Dokumentmanagement Prof. Dr. Stefan Gradmann, DMS Expo, Stuttgart, 23.10.2012

Vom Nutzen der Inferenz Citation: van Haagen HHHBM, 't Hoen PAC, Botelho Bovo A, de Morrée A, van Mulligen EM, et al. (2009) Novel Protein-Protein Interactions Inferred from Literature Context. PLoS ONE 4(11): e7894. doi:10.1371/journal.pone.0007894 / Mehr unter http://nanopub.org Semantische Kontextualisierung im Publishing und Dokumentmanagement Prof. Dr. Stefan Gradmann, DMS Expo, Stuttgart, 23.10.2012

Semantic CMS Semantische Kontextualisierung im Publishing und Dokumentmanagement Prof. Dr. Stefan Gradmann, DMS Expo, Stuttgart, 23.10.2012

… und die 'Anderen' Ist das wirklich so unschuldig? Und wie hängte es mit Knowledge Graph zusammen? Wo beginnt die Paranoia … ? Semantische Kontextualisierung im Publishing und Dokumentmanagement Prof. Dr. Stefan Gradmann, DMS Expo, Stuttgart, 23.10.2012

Ein Szenario für die DMS-Branche Mobility Social Cloud Semantic CMS Unlikely Match? © Ivan Herman (W3C), Stéphane Croisier Semantische Kontextualisierung im Publishing und Dokumentmanagement Prof. Dr. Stefan Gradmann, DMS Expo, Stuttgart, 23.10.2012

Wer kann sich das leisten? Wirtschaftlich Semantic Web war lange teuer und für KMUs unerschwinglich Inzwischen ist zumindest RDF/Linked Data bald Mainstream-Technologie → Die investiven Kosten sind inzwischen sehr überschaubar → Die erforderliche Investition in kompetentes Personal ist beträchtlich (und das Outsourcingpotential gering) Offenheit Datensicherheit und Datenschutz sind problematisch Spannung zwischen Offenheit und Abschottung: wieviel Wissen können Unternehmen teilen? Aber: Wer kann es sich leisten, nicht dabei zu sein? Semantische Kontextualisierung im Publishing und Dokumentmanagement Prof. Dr. Stefan Gradmann, DMS Expo, Stuttgart, 23.10.2012

Unter dem Strich ... Bauen Sie eigene Kompetenz auf: das Outsourcing von Semantic Publishing ist ein teurer Spass! Experimentieren Sie mit Semantic Publishing ... … in nicht geschäftskritischen Bereichen Werden Sie bei Angeboten unter Beteiligung von Google misstrauisch Denken Sie ab und zu versuchsweise wie eine Maschine: Sie werden sich wundern, wie viele Links Sie explizit machen müssen! Semantische Kontextualisierung im Publishing und Dokumentmanagement Prof. Dr. Stefan Gradmann, DMS Expo, Stuttgart, 23.10.2012

Weiterführendes ... Wenn Sie deutschsprachigen Rat brauchen Sören Auer (LOD2/Universität Leipzig) auer@informatik.uni-leipzig.de Andreas Blumauer (Semantic Web Company, Wien) a.blumauer@semantic-web.at Stefan Gradmann (HU-Berlin) stefan.gradmann@ibi.hu-berlin.de Und schließlich das Buch zum Thema: Fragen? http://linkeddatabook.com/editions/1.0/ Semantische Kontextualisierung im Publishing und Dokumentmanagement Prof. Dr. Stefan Gradmann, DMS Expo, Stuttgart, 23.10.2012