Viel Information ist nicht genug: Vom Umgang mit Wissen in Betrieben

Slides:



Advertisements
Ähnliche Präsentationen
Steffen Maretzke October 2010 pers com
Advertisements

Themenportal Europäische Geschichte / Web portal European History
ELearning – The Next Five Years AIFB Rudi Studer Learning Lab Lower Saxony Institute AIFB, University of Karlsruhe
DissOnline / Digitale Dissertationen Dr. P. Schirmbacher Offene Standards und internationale / nationale Abstimmung Gliederung: 1.Open Archive.
RDF R ESOURCE D ESCRIPTION F RAMEWORK Referentin: Claudia Langer.
PinK Plattform für intelligente Kollaborationsportale Dr. Joachim Quantz, e.V. Berlin, 13. September 2005.
Fortgeschrittene Methoden der Wissensorganisation
Der Supermarkt: Eine beispielhafte Erklärung für die fünf untersten Schichten des Semantic Web Protocol Stack Nicola Henze.
Der Supermarkt: Eine beispielhafte Erklärung für die fünf untersten Schichten des Semantic Web Protocol Stack Nicola Henze.
RDF Resource Description Framework
Metadaten als Bausteine des Semantic Web META-LIB Workshop 22
Technische oder personenorientierte Lösungen?
Semantic Web-Anwendungen auf Basis des BAM-Portals Ein Prototyp Volker Conradt.
© Copyright 2010 STI INNSBRUCK Social Media im Tourismus.
Sesame Florian Mayrhuber
Struktur von RDF Fabian Scheller.
Semantic Web - ein Thema für Bibliotheksverbünde SWIB 2010, Köln Dr. Silke Schomburg.
Der Supermarkt: Eine beispielhafte Erklärung für die fünf untersten Schichten des Semantic Web Protocol Stack Nicola Henze.
Industry / Academic Partnerships for XML E-Business Forum für den Finanzdienstleistungsbereich Institute of Information Systems J. W. Goethe-University.
Daten im Silo, Daten im Web
Linked Open Europeana: Das Europeana Data Model (EDM) Prof. Dr. Stefan Gradmann Unter Rückgriff auf M. Doerr, S. Hennicke, A. Isaac, C. Meghini, G. Schreiber,
Semantic Web.
IT-Zertifikat der Phil.Fak Kurs 4: Daten- und Metadatenstandards Patrick Sahle Semantic WebWS 08/09.
XML Die “E-Lance Economy” oder die “Digital Economy” stellt neue Anforderungen an Funktionalität im Netz. XML wurde vom World Wide Web Consortium (W3C)
FishBase Offene Daten zur Meeresbiodiversität Rainer Froese IFM-GEOMAR, Kiel Semantic Web Tag Leipzig, 6. Mai 2010.
XML in der Praxis: Electronic Bill Presentment (EBP) Institut für Wirtschaftsinformatik J. W. Goethe-University J. W. Goethe University Institute of Information.
1 Linked Open Data Klaus Tochtermann ZBW – Leibniz Information Centre for Economics Hamburg/Kiel Christian-Albrechts-University Kiel Sept. 7, 2011.
RDF (Resource Descripton Network)
Collaborative Research Online: Knowledge management pilot project on Haskala Dr. Rachel Heuberger, Judaica Abteilung, Universitätsbibliothek Frankfurt.
DEUTSCHE INITIATIVE FÜR NETZWERKINFORMATION E.V. Regine Tobias & Dr. Barbara Ebert CRIS in German universities and research institutions - position paper.
COST working group 2 – EMM Erreichbarkeitsatlas
EUROPÄISCHE GEMEINSCHAFT Europäischer Sozialfonds EUROPÄISCHE GEMEINSCHAFT Europäischer Fonds für Regionale Entwicklung Workpackage 5 – guidelines Tasks.
Ralf Stockmann, Stefan Schmunk SUB Göttingen, Abteilung Forschung & Entwicklung Forschungsdaten in Raum und Zeit.
Technische Universität München, Informatik XI Angewandte Informatik / Kooperative Systeme Verteilte Anwendungen: Web Services Dr. Wolfgang Wörndl
Linked Open Europeana: technische und andere Rahmenbedingungen für den Zugang zu Europas kulturellem Erbe Prof. Dr. Stefan Gradmann Unter Rückgriff auf.
„Repositorien-Inhalte als Linked (Open) Data“ Prof. Dr. Stefan Gradmann, HU-Berlin Julia Iwanowa, OA-Netzwerk Open Access Netzwerk als Linked (Open) Data.
1 Ist Katalogisierung zukunftsfähig? Ein Beitrag zur Begriffsverschiebung Prof. Dr. Stefan Gradmann Humboldt-Universität zu Berlin / School of Library.
Christine Stohn.
Mehr als ein Modewort? Exzerpt nach Tim O‘Reilly, Michael Karrer
Firmenpräsentation Incite GmbH.
Globalisierung und Multinationale Unternehmen Teil I: Die Globalisierung als Herausforderung für Weltwirtschaft, multinationale Unternehmen und verantwortliches.
Always look on the Bright Side of Life ...
Apache Camel Christian Schneider
DaMiT - Data Mining Tutor
Premiere Conferencing GmbH
Investitionen sichern - wachse mit Forms in die neue Welt
KMUs Digitale Dinosaurier im Wandel der Zeit Benjamin Talin Digital Transformation Spezialist & Tech-Enthusiast Wenn es um die Digitalisierung geht,
Logo Corporate Center Innovation
Selbsterfüllende Prophezeiung:
Open Educational Ressources - eine sehr kurze Definition
Potenziale von Enterprise Collaboration & Social Business
Austrian Partnership Programme in Higher Education and Research for Development - appear
Friederike Kleinfercher Abteilung Forschung und Entwicklung
Projekttitel Template für die Pitch-Präsentation Team & Institut
DMS Expo Stuttgart, Prof. Dr. Stefan Gradmann
Actual participation index of lower and higher social groups over time
PI Infrastruktur in der Max-Planck-Gesellschaft
Geschäftsplanpräsentation
Semantic MediaWiki im öffentlichen Sektor
Abschluss-Keynote Captain Future
Integrating Knowledge Discovery into Knowledge Management
Wissenschaftliches Projekt
Der Optimismus in der Rekrutierungsbranche ist hoch Der Optimismus in der Rekrutierungsbranche ist hoch. Die Erwartungen an Umsatz, Budget, Investitionen.
Ist Katalogisierung zukunftsfähig?
Dokumente dekonstruieren! Ein Plädoyer für semantische Bibliotheken
Web-Mining Agents Planning
Die Messung der Zunahme der Meeresspiegels
DMS Expo Stuttgart, Prof. Dr. Stefan Gradmann
πάντα ῥεῖ (?) Ein Plädoyer für die Erhöhung der Fließgeschwindigkeit
Gemeinsame Ausschreibung von Abschlussarbeiten (Bachelor/Master) des markstones Institute of Marketing, Branding & Technology Wer, wie, was, warum? Das.
 Präsentation transkript:

Viel Information ist nicht genug: Vom Umgang mit Wissen in Betrieben IP-ShareMedia Forum Frankfurt, 29.11.2011 Prof. Dr. Stefan Gradmann Humboldt-Universität zu Berlin / School of Library and Information Science Deutsche Gesellschaft für Informationswissenschaft und Informationspraxis (DGI) stefan.gradmann@ibi.hu-berlin.de

Überblick Information und Wissen “Semantische Technologien”? Wie hängt beides zusammen? Beispiele Linked Open Data Public Sector Information / eGovernment Applikationen Was haben Betriebe davon? Wer kann sich das leisten? Unter dem Strich ... Viel Information ist nicht Genug IP-ShareMedia, Frankfurt 29.11.2011

Information und Wissen Viel Information ist nicht Genug IP-ShareMedia, Frankfurt 29.11.2011

Daten / Information vs. Wissen “80% of data is unstructured, doubling every month” “The volume of information flowing through organizations grows by 200% per year” “Fortune 1000 stands to waste at least $2.5 billion per year due to an inability to locate and retrieve information” “68% of employees recognize that it is difficult and time consuming to find information needed to do their job.” “71% agree that it’s easier to locate “knowledge” on the Web than it is to find it on internal systemss.” (Statements compiled by Stéphane Croisier) Viel Information ist nicht Genug IP-ShareMedia, Frankfurt 29.11.2011

Daten Viel Information ist nicht Genug IP-ShareMedia, Frankfurt 29.11.2011

Information Viel Information ist nicht Genug IP-ShareMedia, Frankfurt 29.11.2011

Wissen Viel Information ist nicht Genug IP-ShareMedia, Frankfurt 29.11.2011

Weißes Rauschen. Wissen? Management?? Information ohne Kontext ist wertlos! Wissen = Information + Kontext Wissen in Unternehmen ist implizit oder explizit. Zu viel implizites Wissen kann ein großes Betriebsrisiko darstellen – besonders für KMUs! → Implizites Wissen explizit machen! Wissensdokumentation (Information mit Kontextbezügen sichern) war traditionell mit prohibitivem Aufwand verbunden … … wie können wir dies mit deutlich geringerem Aufwand und maschinell prozessierbar leisten? Viel Information ist nicht Genug IP-ShareMedia, Frankfurt 29.11.2011

Semantische Technologien Viel Information ist nicht Genug IP-ShareMedia, Frankfurt 29.11.2011

Vom Web der Dokumente zum Linked Data Web Das Web der Dokumente: Information Management: A Proposal (TBL, 1989). Baut auf Dokumenten („Information Resources“) Untypisierten HTTP links Das Web der Linked Open Data ist eine Erweiterung des Web der Dokumente in Syntax (RDF) im Umfang (unter Einschluss der Reprä- sentationen von „non- information resources“, 'Dingen', 'Daten') Viel Information ist nicht Genug IP-ShareMedia, Frankfurt 29.11.2011

Entitäten und Links im Web der Dokumente Wir haben HTTP URIs als Identifikatoren von Entitäten und Links zwischen diesen – aber es fehlt Entscheidendes! Was für Arten von Entitäten sind 'Louvre.html' und 'LaJoconde.jpg'? Das kann eine Maschine nicht herausfinden. Menschen können dies: wir erkennen implizierten Kontext! Und wie genau verhalten sich diese Entitäten zueinander? Auch dies kann eine Maschine nicht herausfinden. Menschen können auch dies: auch hier kommt wieder impliziter Kontext ins Spiel! Viel Information ist nicht Genug IP-ShareMedia, Frankfurt 29.11.2011

Syntaktische Erweiterung des Web der Dokumente (1) Also definieren wir eine maschinell prozessierbare Syntax für Aussagen über Entitäten und Beziehungen: RDF Oder, allgemeiner gesprochen Tripel ... … in denen S und P durch URIs identifizierte Web-Entitäten sein müssen und O eine Web-Entität oder ein Literal ist. Viel Information ist nicht Genug IP-ShareMedia, Frankfurt 29.11.2011

Syntaktische Erweiterung des Web der Dokumente (2) Hinzu kommt eine Schema-Sprache (RDFS) mit Elementen wie Klassen, Hierarchien von Klassen und Eigenschaften, Vererbung ... … und damit Unterstützung einfacher Schlussysteme. So werden Strukturen in Tripel-Aggregationen modellierbar - eine Basis für leichtgewichtige 'Ontologien': Viel Information ist nicht Genug IP-ShareMedia, Frankfurt 29.11.2011

Erweiterung des Umfangs des Web: wie es nicht funktioniert Was stimmt an diesem Bild nicht? Taken from Ronald Carpentier's Blog at http://carpentier.wordpress.com/2007/08/08/1-2-3/ Viel Information ist nicht Genug IP-ShareMedia, Frankfurt 29.11.2011

… und die Erweiterung des 'WWW der Dokumente' um ein Web der Dinge ... Viel Information ist nicht Genug IP-ShareMedia, Frankfurt 29.11.2011

Tripel, Kontext und logische Schlüsse (1) Hier könnte ein Exkurs zu RTP Doc ansetzen, wenn ich mehr als 20 Minuten Zeit hätte Viel Information ist nicht Genug IP-ShareMedia, Frankfurt 29.11.2011

Tripel, Kontext und logische Schlüsse (2) Hier könnte ein Exkurs zu RTP Doc ansetzen, wenn ich mehr als 20 Minuten Zeit hätte Viel Information ist nicht Genug IP-ShareMedia, Frankfurt 29.11.2011

Tripel, Kontext und logische Schlüsse (3) Hier könnte ein Exkurs zu RTP Doc ansetzen, wenn ich mehr als 20 Minuten Zeit hätte → Kontext erlaubt einfache logische Schlüsse und schlussbasierte Verfahren: 'Semantische' Technologien! Viel Information ist nicht Genug IP-ShareMedia, Frankfurt 29.11.2011

Beispiele Linked (Open) Data Public Sector Information / eGovernment Anwendungen Viel Information ist nicht Genug IP-ShareMedia, Frankfurt 29.11.2011

Linked Data Standard-Identifier Standard-Zeiger Standards für Suchen und Aussagen Kontextualisierung Copyright © 2008 W3C (MIT, ERCIM, Keio) http://www.w3.org/2008/Talks/0617-lod-tbl/#(4) Viel Information ist nicht Genug IP-ShareMedia, Frankfurt 29.11.2011

Inhalte: Linking Open Data Initiative der Semantic Web Education and Outreach (SWEO) interest group of W3C http://www.w3.org/wiki/SweoIG/TaskForces/CommunityProjects/LinkingOpenData “The goal [...] is to build a data commons by making various open data sources available on the Web as RDF and by setting RDF links between data items from different data sources.” Erstes Treffen in Banff (WWW2007) mit Schlüsselpersonen wie Tom Heath, Chris Bizer, Kingsley Idehen, Yrjana Rankka, Orri Erling, Ivan Mikhailov, Danny Ayers, Steve Coast, Peter Murray Rust, Alan Ruttemberg, Ian Horrocks, Bernardo Cuenca Grau, Boris Motik, Danny Gagne. Aktuelle Diskussion: wie kommen wir von reiner Masse zu Qualität? Matching, mapping und referrals sind essentiell Tom Heath and Christian Bizer (2011) Linked Data: Evolving the Web into a Global Data Space (1st edition). Morgan & Claypool. http://linkeddatabook.com/editions/1.0/ Viel Information ist nicht Genug IP-ShareMedia, Frankfurt 29.11.2011

Ein paar Kugeln: 5/2007 < Überr 500 Millionen RDf-Tripel < Ca. 120.000 RDF-Links zwischen Datenquellen © Richard Cyganiak Viel Information ist nicht Genug IP-ShareMedia, Frankfurt 29.11.2011

Deutlich mehr Kugeln: 9/2008 © Richard Cyganiak Viel Information ist nicht Genug IP-ShareMedia, Frankfurt 29.11.2011

Viele Kugeln: 7/2009 < Über 13.1 Milliarden RDF Tripel < Über 142 Millionen RDF-Links zwischen Datenquellen © Richard Cyganiak Viel Information ist nicht Genug IP-ShareMedia, Frankfurt 29.11.2011

Noch mehr Kugeln: 09/2010 http://richard.cyganiak.de/2007/10/lod/lod-datasets_2010-09-22_colored.html Viel Information ist nicht Genug IP-ShareMedia, Frankfurt 29.11.2011

Und richtig viele Kugeln: 09/2011 Viel Information ist nicht Genug IP-ShareMedia, Frankfurt 29.11.2011

Struktur in Wikipedia Titel Abstract Infoboxen Geokoordinaten 2727 Struktur in Wikipedia Titel Abstract Infoboxen Geokoordinaten Kategorien Bilder Links anderssprachige Versionen andere Wikipedia-Seiten WWW Verweisungen Viel Information ist nicht Genug IP-ShareMedia, Frankfurt 29.11.2011 © Sören Auer

Infobox templates Wikitext-Syntax RDF Repräsentation {{Infobox Busan | title = Busan Metropolitan City | img = Busan.jpg | imgcaption = A view of the [[Geumjeong]] district in Busan | hangul = 부산 광역시 ... | area_km2 = 763.46 | pop = 3635389 | popyear = 2006 | mayor = Hur Nam-sik | divs = 15 wards (Gu), 1 county (Gun) | region = [[Yeongnam]] | dialect = [[Gyeongsang]] }} http://dbpedia.org/resource/Busan dbp:Busan dbpp:title ″Busan Metropolitan City″ dbp:Busan dbpp:hangul ″부산 광역시″@Hang dbp:Busan dbpp:area_km2 ″763.46“^xsd:float dbp:Busan dbpp:pop ″3635389“^xsd:int dbp:Busan dbpp:region dbp:Yeongnam dbp:Busan dbpp:dialect dbp:Gyeongsang Wikitext-Syntax RDF Repräsentation Viel Information ist nicht Genug IP-ShareMedia, Frankfurt 29.11.2011 © Sören Auer

Eine große multi-linguale, multi-domänen Wissensbasis Beschreibungen von 3,4 Millionen Dingen 1,5 Millionen ontologisch klassifiziert 312.000 Personen, 413.000 Orte, 94.000 Musikalben, 49.000 Filme, 15.000 Videospiele, 140.000 Organisationen, 146.000 Arten, 4.600 Krankheiten Multilingual, kategorisiert und kontextualisiert Labels und Zusammenfassungen in 92 verschiedenen Sprachen 1.460.000 Links zu Bildern 5.543.000 Links zu externen WWW-Seiten 4.887.000 Links zu externen RDF-Ressourcen 565.000 Wikipedia- und 75.000 YAGO-Kategorien Viele, viele Milliarden Aussagen (d.h. RDF-Tripel): 25% aus der englischen und 75% aus den anderen Ausgaben der Wikipedia Viel Information ist nicht Genug IP-ShareMedia, Frankfurt 29.11.2011 © Sören Auer

Public Sector Information Informationen aus öffentlichen Einrichtungen (PSI) zunehmend als LoD verfügbar So in http://data-gov.tw.rpi.edu/wiki: Oder in http://ec.europa.eu/information_society/policy/psi/index_en.htm: 27 Milliarden € Marktwert nach Schätzung im Jahr 2006! Viel Information ist nicht Genug IP-ShareMedia, Frankfurt 29.11.2011

LOD2 Large-scale integrating project co-funded by the European Commission within the FP7 framework (09/2010 – 08/2014, Total Budget: 8,58 M€, Total Funding: 6,45 M€, Total Resources: 844 PM) → http://lod2.eu/Welcome.html Erweitert die LOD-Wolke um Technik-Bausteine für die Anwendungsentwicklung. Darunter z. B.: Comprehensive Knowledge Archive Network (CKAN, Verzeichnis) D2R Server (Relational → RDF) DBPedia (Extraktion aus Wikipedia) OntoWiki (agiles, verteiltes Wissensmanagement) Silk Kontextualisierungs-Framework Openlink Virtuoso (Daten-, Informations- und Wissensmanagement) Konsortium: Universität Leipzig (Sören Auer, Leiter), Centrum Wiskunde & Informatica, Digital Enterprise Research Institut (DERI), Freie Universität Berlin, OpenLink Software, Semantic Web Company, TenForce, Exalead, Wolters Kluwer, Open Knowledge Foundation Viel Information ist nicht Genug IP-ShareMedia, Frankfurt 29.11.2011

Anwendungsbeispiel (1) Semantic Enterprise Wiki (Ontoprise, Karlsruhe) Forrester (2008): Social Computing Changes The Enterprise Collaboration Landscape Viel Information ist nicht Genug IP-ShareMedia, Frankfurt 29.11.2011

Anwendungsbeispiele (2) OntoWiki (Uni Leipzig, AKSW – Open Source) Navigation und Visualisierung Authoring Evolution der Wissensbasis Linked Data Publikation → http://demo.ontowiki.net/ Named Entity Extraction http://www.opencalais.com/ http://www.temis.com http://www.collexis.com/ Integration in Document Management-Lösungen http://www.opencalais.com/applications/topic-hubs-module-drupal Viel Information ist nicht Genug IP-ShareMedia, Frankfurt 29.11.2011

OpenCalais: Quelldatei Viel Information ist nicht Genug IP-ShareMedia, Frankfurt 29.11.2011

OpenCalais: Analyseresultat Viel Information ist nicht Genug IP-ShareMedia, Frankfurt 29.11.2011

daten.berlin.de: Zossen (1) Viel Information ist nicht Genug IP-ShareMedia, Frankfurt 29.11.2011

daten.berlin.de: Zossen (2) Viel Information ist nicht Genug IP-ShareMedia, Frankfurt 29.11.2011

daten.berlin.de: Zossen (3) Viel Information ist nicht Genug IP-ShareMedia, Frankfurt 29.11.2011

Was haben Betriebe davon? Chancen und Risiken + Informationsaggregation und -verdichtung + Effizienzsteigerung + Wissenserhalt, Wissenstransfer +- Nicht alles selber machen müssen, die 'Community' hilft / man wird abhängig von der 'Community' -+ Wie 'offen' können betriebliche Daten sein ('Open Intranet' [A. Blumauer])? -+ Linked Data 'behind a proxy' ist praktikabel – aber mit stark reduziertem Grenzwert, und nicht für alle ... Viel Information ist nicht Genug IP-ShareMedia, Frankfurt 29.11.2011

Wer kann sich das leisten? Wirtschaftlich Semantic Web war lange teuer und für KMUs unerschwinglich Inzwischen ist zumindest RDF/Linked Data bald Mainstream-Technologie → Die investiven Kosten sind inzwischen sehr überschaubar → Die erforderliche Investition in kompetentes Personal ist beträchtlich (und das Outsourcingpotential gering) Offenheit Datensicherheit und Datenschutz sind problematisch Spannung zwischen Offenheit und Abschottung: wieviel Wissen können Unternehmen teilen? Aber: Wer kann es sich leisten, nicht dabei zu sein? Denn: Mit den heute verfügbaren Informationsmengen können Sie anders gar nicht mehr umgehen! Viel Information ist nicht Genug IP-ShareMedia, Frankfurt 29.11.2011

Unter dem Strich ... Bauen Sie eigene Kompetenz auf: Ihr Firmenwissen eignet sich nicht zum Outsourcing! Experimentieren Sie mit Linked (Open) Data ... … in nicht geschäftskritischen Bereichen Werden Sie bei “Web 3.0” misstrauisch Nicht die Ablösung des “Social Web” durch das “Semantic Web” ist das Thema … … sondern deren Kombination! Hüten Sie sich vor dem Erbe der Künstlichen Intelligenz (Expertensysteme, Agenten, starke Logikkomponenten) Setzen Sie auf die 'flachen' Ansätze der Linked Data! Viel Information ist nicht Genug IP-ShareMedia, Frankfurt 29.11.2011

Weiterführendes ... Tom Heath and Christian Bizer (2011) Linked Data: Evolving the Web into a Global Data Space (1st edition). Morgan & Claypool. http://linkeddatabook.com/editions/1.0/ Wenn Sie deutschsprachigen Rat brauchen Sören Auer (LOD2/Universität Leipzig) auer@informatik.uni-leipzig.de Andreas Blumauer (Semantic Web Company, Wien) a.blumauer@semantic-web.at Stefan Gradmann (HU-Berlin) stefan.gradmann@ibi.hu-berlin.de Und schließlich das Buch zum Thema: Fragen? http://3roundstones.com/led_book/led-contents.html Viel Information ist nicht Genug IP-ShareMedia, Frankfurt 29.11.2011