© Copyright 2008 STI INNSBRUCK Social Semantic Web Semantic Web Lecture Dieter Fensel
Agenda From Web to Web 2.0 –Definition –Wikis –Tagging / folksonomies –Blogs –Applications –The Wisdom of Crowds Social Semantic Web 2
© Copyright 2008 STI INNSBRUCK From Web to Web 2.0
4 Von Web 1.0 zu Web 2.0 Entwicklung Definition Anwendungen und Erfolgsgeschichten Web 2.0 in Zahlen
5 Web 2.0 Web 2.0 ist ein Begriff für eine Reihe interaktiver und kollaborativ er Systeme des Internets. (Mitmach Web)
6 Was ist Web 2.0? Definition von OReilly. Web 1.0Web 2.0Neuerung DoubleClickGoogle AdSensepersonalisiert OfotoFlickrtagging, community Britannica OnlineWikipediacommunity, free content Webseitenbloggingdialog publishingparticipation CMSwikisflexibility, freedom directories tagging community taxonomyfolksonomy Consumers Prosumers
7 Was ist Web 2.0? - Beispiele Gmail Google Notebooks (Kollaboratives Notepad im Web) Wikis Wikipedia –Größtes Lexikon der Welt, Top 30 Webseite, 100 Sprachen Del.icio.us (Social Tagging für Bookmarks) Flickr (Photo Sharing und Tagging) Blogs, RSS, Blogger.com Programmableweb.com: 150 web-APIs
8 Blogs Einfachere Benutzungsschnittstelle zum Aktualisieren von Inhalten Einfache Organisation der Inhalte Einfachere Nutzung der Inhalte Öffentliche Kommentare Technisch wenig neues Sozial: Kollaborativ (einzeln aber stark vernetzt)
9 Wikis Wiki schnell erfunden von Ward Cunningham Eine Sammlung von HTML Seiten: lesen und editieren Bekanntestes und größtes Wiki: Wikipedia (MediaWiki) –Aber: Auch zahlreicher Einsatz in Intranets (z.B. in unserer Gruppe) Probleme werden sozial statt technisch gelöst Flexible Struktur Hintergrundalgorithmen + menschliche Intelligenz Technisch: Wenig neues Sozial: Kollaborativ (kein Besitztum an Inhalten)
Groupware und Wissensmanagement WS 2006/2007 M. Prilla, C. Ritterskamp Wikis: Prinzipien des Designs Open Should a page be found to be incomplete or poorly organized, any reader can edit it as they see fit. Incremental Pages can cite other pages, including pages that have not been written yet. Organic The structure and text content of the site are open to editing and evolution. Mundane A small number of (irregular) text conventions will provide access to the most useful page markup. Universal The mechanisms of editing and organizing are the same as those of writing so that any writer is automatically an editor and organizer. Overt The formatted (and printed) output will suggest the input required to reproduce it. Quelle:
Groupware und Wissensmanagement WS 2006/2007 M. Prilla, C. Ritterskamp Wikis: Prinzipien des Designs Unified Page names will be drawn from a flat space so that no additional context is required to interpret them. Precise Pages will be titled with sufficient precision to avoid most name clashes, typically by forming noun phrases. Tolerant Interpretable (even if undesirable) behavior is preferred to error messages. Observable Activity within the site can be watched and reviewed by any other visitor to the site. Convergent Duplication can be discouraged or removed by finding and citing similar or related content. Quelle:
12 Soziales Tagging Idee: Auszeichnen von Inhalten mit frei vergebenen Stichwörtern Weg von Ordnern hin zu Organisation durch Tags Neu: Gute (simple) Benutzungsschnittstellen für Tagging und Tag-basierte Suche Erste Schritte zum Semantic Web? Technisch: Benutzerschnittstellen Sozial: Kollaborativ (eigene Inhalte, gemeinsame Tags) (Verschlagwortung)
13 Kollaboratives Tagging
14 Tagging: Flickr.com
15 Folksonomies Die aus Tagging resultierenden Daten, Wissensstrukturen User TagResource Tag User Mary tags with wiki wikipedia encyclopediawww.wikipedia.org Bob tags with wiki web2.0 encyclopedia knowledgewww.wikipedia.org
Groupware und Wissensmanagement WS 2006/2007 M. Prilla, C. Ritterskamp Folksonomies: Taxonomie Marlow et al. (2006) Rechte für das Tagging –Self-tagging: Tags nur durch Erzeuger des Inhalts (Technorati) –Free-for-all tagging: Tags durch alle Nutzer (Yahoo!) Unterstützung des Taggings –Blind Tagging: Keine Anzeige vorhandener Tags (Flickr) –Viewable Tagging: Vorhandene Tags angezeigt (Del.icio.us) –Suggestive Tagging: Vorschläge für Tags (MyWeb 2.0) Aggregation der Tags –Bag-model: Mehrfachnennung (Del.icio.us) –Set-model: Nur einfache Nennung (YouTube)
Groupware und Wissensmanagement WS 2006/2007 M. Prilla, C. Ritterskamp Folksonomies: Taxonomie Marlow et al. (2006) Typen von Ressourcen –Text vs. Andere (Bilder, URL, Orte,...) Quelle der Ressourcen –Teilnehmer (Upcoming) –System (Last.fm) –Beliebige Webressource (Del.icio.us) Verbindung der Ressourcen –Verlinkt, gruppiert, nicht vorhanden Soziale Verbindungen
Groupware und Wissensmanagement WS 2006/2007 M. Prilla, C. Ritterskamp Social Bookmarking Tools wie Flickr oder del.icio.us sind sehr erfolgreich und haben einen großen Teilnehmerkreis. Warum nehmen Nutzer an solchen Systemen teil? Welche Ziele verfolgen sie?
Groupware und Wissensmanagement WS 2006/2007 M. Prilla, C. Ritterskamp Tag Clouds Größe der Darstellung: Anzahl Orientierung in der Informations- menge Browsen ersetzt suchen Unterschiedlicher Bezug der Tags
20 Was ist Web 2.0? Trends bei Webanwendungen Technische Entwicklung –Web-Benutzungsschnittstellen werden flüssiger (AJAX) –Desktop verlagert sich ins Web (GMail, Google Notebooks, AJAX) Soziale Entwicklung –Kollektiv von Nutzern schafft einen Mehrwert (Wiki, Tagging) –Freie Inhalte setzen sich durch (Lizenzen) –Aufmerksamkeit wird monetarisiert (Text-Ads) –Mehrwert-Webseiten durch Rekombination (Mash-Ups, RSS)
21 Powerful Web 2.0: eine Auswahl
22 Powerful Web 2.0: eine Auswahl File Sharing: –Flickr (Bilder) –YouTube (Videos) –Wikipedia (Online Enzyklopädie) –Blogs –Open Source Community (Linux) Dateimanagement –Tagging Soziale Webseiten und Kommunikation: –Facebook –LastFM –Skype –StudiVZ –LinkedIn, Xing Offene Systeme: APIs, teilweisen open source erlauben Weiterentwicklung durch Benutzer
23 Internetplattform zur Bildung von sozialen Netzwerken 2004 gegründet 64 Millionen aktive Mitglieder Durchschnittl. 250,000 Neuregistrierungen am Tag seit Jan Mehr als die Hälfte der Benutzer sind nicht mehr im College Mehr als 65 Milliarden page views im Monat Mehr als die Hälfte der Mitglieder nutzen Facebook täglich Durchschnittl. Dauer: 20 Minuten Geschätzer Marktwert 15 Milliarden Dollar
24 Freie Online Enzyklopädie 2,214,717 Artikel (englische Wikipedia) 6,383,758 registrierte Benutzer Klevere Mechanismen kombiniert mit menschlicher Intelligenz Hohe Qualität der Artikel Unkontrolliert und offen Wikipedia
25 Fast 1.5 Millionen stabile Identifikatoren für Konzepte in Wikipedia (Hepp, Siorpaes, Bachlechner 2007)
26 Videoportal: kostenloser Up- und Download von Videos In einem einzigen Monat wuchs die Anzahl der Videos um 20% auf 6.1 Millionen 45 Terabyte Videos 1.73 Milliarden Video Views Im ersten Jahr verbrachten alle User insgesamt 9,305 Jahre damit, YouTube Videos anzusehen Google kaufte YouTube letztes Jahr für ca. 1.6 Milliarden Dollar
27 Intrinsische Motivationen Altruismus Eigennutzen (Tags: Organisation, Wiederverwendbarkeit) Anerkennung in einer Gemeinschaft Zugehörigkeit zu einer Gemeinschaft, ein gemeinsames Ziel Autonomie, Willensfreiheit Aufmerksamkeit Selbstdarstellung (Facebook) Soziale Komponente (Menschen kennenlerne) (Kuznetsov, 2004; Marlow et al., 2006) Unternehmen machen sich dieses Potential bereits zu Nutze...
28 Wikinomics: Web 2.0 in Unternehmen Potential Wikinomics Wisdom of Crowds
29 Wikinomics Don Tapscott Eine neue Form des Wirtschaftens mit revolutionären Formen der Zusammenarbeit. Menschen arbeiten nach der Vorstellung selbstorganisiert ohne Hierarchien und starre Organisationsstrukturen gemeinsam an Projekten. freiwillige Zusammenarbeit, Offenheit, eine Kultur des Teilens, globales Handeln, Mass Collaboration
30 Wikinomics: Examples Open Source Bewegungen (Linux) Ideagoras: Unternehmen publizieren Probleme & rufen dazu auf, Lösungen zu finden virtual communities such as Second Life, where participants can create unique identities and interact with others (even to the point of exchanging goods and services for money in the real world) Prosumers kreieren Inhalten kollaborativ: Film Snakes on a Plane Unternehmen wie Google und Amazon öffnen ihre Systeme (APIs) zur freien Verwendung
31 The Wisdom of Crowds: Why the Many Are Smarter than the Few and How Collective Wisdom Shapes Business, Economies, Societies and Nations James Surowiecki, 2004 Collective Wisdom Koordination Kooperation Grundlagen: Informationsunterschiede (Diversity) Meinungsfreiheit Dezentralisierung Aggregation
© Copyright 2008 STI INNSBRUCK Social Semantic Web
33 Semantic Web + Web 2.0 = Web 3.0? Web 2.0Web 3.0 Tagging –annotieren Tags –Singular/Plural-Problem –Synonyme –Keinerlei Intelligenz –annotieren mit Konzepten –Inferenz (Tag Hund folgert Tag Tier) Rekombination von Daten verschiedener Quellen Mash-Ups vorab von Hand programmiert Spontan durch End-Nutzer Suche Stichwortsuche oder Tag- Suche findet Dokumente Strukturierte Suche kombiniert Daten und erzeugt Dokumente Zeithorizont – 2010 Based on Völkl, Vrandecic and colleagues.
34 Web 3.0 Ansätze Automatisches Extrahieren von Wissen auf der großen (und frei verfügbaren) Menge von Daten, die durch Web 2.0 generiert werden Integration und Wiederverwendung von Wissen (Yahoo Pipes) Motivation von Benutzern für die Generierung von semantischen Inhalten durch Anwendung von Web 2.0 Paradigmen Erstellen von Semantik als Nebeneffekt von Arbeitsprozessen (Semantic Wikis)
35 Gartner Hype Curve
36 Web 2.0 und das Semantic Web Web 2.0 und Semantic Web sind komplementäre Ansätze Semantic Blogging Semantic Wikis –Semantic MediaWiki Web 2.0 ontology building –myOntology Semantically interlinked communities –SIOC Games for semantic content creation –OntoGame
Semantic Blogging Creating blog entries in a structured fashion Based on ontologies This allows: –Acquiring complementary information from the Web –Finding blog entries better 37
Semantic Wikis A semantic wiki is a wiki that has an underlying model of the knowledge described in its pages. Regular, or syntactic, wikis have structured text and untyped hyperlinks. Semantic wikis, on the other hand, allow the ability to capture or identify information about the data within pages, and the relationships between pages, in ways that can be queried or exported like database data. Wikis: –Platypus wiki –IkeWiki –Kiwi –WikiFactory –Semantic MediaWiki 38
39 Semantic Wikipedia: Vorteile Strukturiertes Wissen wird exportiert (im RDF- Standard) Neue Web 2.0 Anwendungen möglich Wiederverwendung von Wissen über Sprachgrenzen hinweg Aggregierte Suche über mehrere Seiten Qualität: Finden von Fehlern und Widersprüchen –Hat jedes Land eine Hauptstadt? –Wird jede Person geboren bevor sie stirbt? –Passen die Geburtstagsjahreslisten zu den Geburtstagen der Personen? –Passt die Bevölkerungsdichte zu Bevölkerung und Fläche? Based on Völkl, Vrandecic and colleagues.
40 Semantic Wiki = Wiki + Semantic Web Semantic MediaWiki: Erweiterung der MediaWiki-Software (Technik der Wikipedia) Syntaxerweiterung erlaubt getypte Links Seite Karlsruhe –Bisher: … liegt im S ü den von [[Deutschland]] … –Neu: … liegt im S ü den von [[liegt in::Deutschland]] … Syntaxerweiterung erlaubt annotieren von Werten Seite Karlsruhe –Bisher: … hat eine Bev ö lkerung von 280,000 Einwohnern. … –Neur: … hat eine Bev ö lkerung von [[Bev ö lkerung:=280000]] Einwohnern. Based on Völkl, Vrandecic and colleagues.
41 Semantic MediaWiki Based on Völkl, Vrandecic and colleagues.
42 Was liegt in Kalifornien? Based on Völkl, Vrandecic and colleagues.
Web 2.0 ontology building Make use of various Web 2.0 paradigms to capture knowledge required for ontologies Lower entrance barriers for users Usually emphasis on collaboration Ontologies as community contracts Methods for consensus finding Visualization of ontologies Examples: –Myontology –Soboleo (image annotation) 43
44 myOntology Kollaboratives Erstellen von Ontologien Ein Tool, um Fachleuten und Ontologieexperten eine effiziente Kollaboration zu ermöglichen myOntology bedient sich des Web 2.0 Paradigmas
45 Sprache ist zentraler Bestandteil des Entwicklungsprozesses Lexikale Ressourcen sind in den Bau von Ontologien integriert Der Diskurs, der zu einer Definition führte ist verfügbar sein All das ermöglicht besseres Verständnis und verhindert Missverständnis
46 Reichhaltige Medien Verständlichkeit Vewenden einer Ontologie setzt Verständnis voraus –Konstrukte (subClassOf) –Beabsichtigte Bedeutung, Semantik Die Serialisierung der Ontologie ist nicht der einizge Kommunikationskanal myOntology verwendet reichhaltige Medien (Text, Bilder, Videos, etc.)
47 Verschiedene Reifegrade von Ontologien Uschold and King, 1999 Braun et al., 2007 Wissenserfassung: Fachleute unterstützt von Ontologieexperten Formalisierung des Wissens: Ontologieexperten Sammlung Relevanter Konzepte Diskussion im Entwicklungsteam Konsolidierung Formalisierung Leichtgewichtige Ontologien Formalisierung Axiomatisierte Ontologien
48 myOntology Philosophie 1.Kollaboration von Fachleuten und Ontologieexperten 2.In den ersten Phasen (bis zu leichtgewichtigen Ontologien) 3.Hohe Benutzerfreundlichkeit 4.Integration und Wiederverwendung von Wissen im Web (Web 2.0: Folksonomies, Flickr, YouTube, Wikipedia, etc.) 5.Hintergrundintelligenz unterstützt Entwicklungsteam
49 myOntology Technologien Automatische Extraktion von leichtgewichtigen Wissensstrukturen aus Folksonomies Verwendung von YouTube, Flickr, Wikipedia und Synonymen zur reichhaltigen Beschreibung von Konzepten, Attributen, Relationen und Ontologien Export der Ontologien in gängigen Standards Entdecken von Inkonsistenzen im Hintergrund
Semantically interlinked communities Semantically- Interlinked Online Communities (SIOC) Connecting forums, posts from many types of online communities (blogs, forums, mailing lists, etc.) Interesting possibilities: –Distributed linked conversations –Decentralised discussion channels and communities 50
3/1/ Games for semantic content creation A prerequisite for the Semantic Web to become a reality is the availability of annotated data. Building the Semantic Web is not a one-time task, but a continuous effort.
3/1/2014ESWC Observation There are tasks that are easy for humans but difficult for computers Cf. Von Ahn Not all the tasks on the Semantic Web can be automated. Some at least partly require human intelligence.
3/1/2014ESWC Web 2.0 is Hot, Semantic Web is Not. Why? Web 2.0 applications enjoy great popularity The incentive structures are clear (Marlow et al.,2006; Kuznetsov, 2004) Incentives for ontology building, ontology alignment, and semantic annotation have not been investigated so far
3/1/2014ESWC The OntoGame Idea and Principles Make people weave the Semantic Web by playing cool multi-player online games. 1.Fun and intellectual challenge 2.Consensus 3.Massive content generation
3/1/2014ESWC Potential - An Example 50 individuals around the globe play in every single moment for half a year 216,000 hours (50 * 24 * 180) of intellectual work Average wage of 10 for conceptual modeling tasks 2 Million on the labor market 4 conceptual choices per game round of two minutes 12 Million conceptual modeling choices in half a year (216,000 * 60 = 12,960,000)
3/1/2014ESWC Challenges 1.Identifying suitable tasks in semantic content creation 2.Designing games 3.Designing a usable, attractive interface 4.Identifying suitable knowledge corpora 5.Preventing cheating 6.Defusing typical pitfalls of conceptual modeling 7.Distribution of labor 8.Fostering user participation 9.Deriving formal representations 10.Scalability and performance
3/1/2014ESWC TheOntoGame Series
3/1/2014ESWC Features Players paired randomly and anonymously Best strategy to get points: truthful answers Live mode, single player mode, chess mode (remote) Skip Limited amount of time Cheating: –Anonymity –Pre-recorded challenges Generic gaming platform Derive formal representations of the data
3/1/2014ESWC OntoPronto: Creating a Huge Domain Ontology
3/1/2014ESWC OntoTube: Annotating YouTube videos
3/1/2014ESWC Evaluation Snapshot of RDF data 2 weeks after release 271 registered players within 2 weeks, 90% male More than 2500 games, 400 articles Is the game fun? Is the ontological data produced correct? Katharina Siorpaes and Martin Hepp: Games with a Purpose for the Semantic Web. IEEE Intelligent Systems, Vol. 23, No. 3, pp , May/June 2008.
3/1/2014ESWC Fun Factor 35 players completed a survey Rules were understandable Entertaining (enthusiasts over-represented) Most rated the game cool and entertaining Side effects: learning PROTON and Wikipedia Social component is weak (no communication, gender, age, nationality, etc.) Constructive entertainment
3/1/2014ESWC Consensus
3/1/2014ESWC Correctness
3/1/2014ESWC Conclusion Obviously, games for ontology construction, population, and alignment will not solve the knowledge acquisition bottleneck But they are a new way of combining human and computational intelligence and providing incentives Promising results Further incentives by increasing the human factor – e.g. Meet your soulmate game
© Copyright 2008 STI INNSBRUCK Questions?