Vernetzte Forschung in der Medizin

Vernetzte Forschung in der Medizin
Ein Metadata Repository für Items in klinischen, epidemiologischen und Register-Studien Matthias Löbe

Inhaltsübersicht Folksonomy Content Applications Tagging Kollaboration
Einleitung Inhaltsübersicht Folksonomy Tagging Kollaboration Content Syndizierung Microformats Lizenzen Applications Ajax Mashups Web-APIs Architekturen Das Tutorium soll im Wesentlichen einen einführenden Überblick in die Terminologie und die Trends des Web2.0 geben Aufgrund ihrer Vielzahl werden viele Technologien oder Dienste nur angerissen

Was ist das Web2.0? Einleitung
Das Web2.0 ist ein Wahrnehmungsphänomen, ein „neues Netzverständnis“ Geprägt wurde der Begriff 2004 von Tim O‘Reilly ( Viele Dienste oder Technologien existieren schon länger Technisch Das WWW wird zur Plattform aller Dienste Weder lokale Programme noch Datenspeicher nötig Kombinationen aus Diensten bieten neuen Zusatznutzen Sozial Keine Hierarchien, jeder Einzelne kann Bedeutendes beitragen Anwendungen sind vom Standardnutzer besser zu bedienen

Web1.0 >> Web2.0 Gebiet Web1.0 Web2.0 Persönliche Seite Homepage
Einleitung Web1.0 >> Web2.0 Gebiet Web1.0 Web2.0 Persönliche Seite Homepage Blog Websitemanagement CMS Wiki Struktur HTML Microformats Inhaltsverbreitung Newsletter RSS Dynamik Applets Ajax Mehrwert Portale Mashups Nutzerorganisation Hierarchie Community Klassifizierung Taxonomie Tagging

Folksonomy - 1 Soziale Software Folksonomy ist zusammengesetzt aus „folk“ und „taxonomy“ Idee: Kontexterschließung durch gemeinschaftliches Indizieren (collaborative tagging) Informationselemente werden mit Tags (Labels, Attribute, ...) versehen Im Gegensatz zu traditioneller Verschlagwortung: Kein fester Schlagwortsatz Keine Hierarchie Keine Fachexperten oder Qualitätssicherung Zurzeit nur ein Trend, Vorteile sind wissenschaftlich nicht nachgewiesen Potenzielle Probleme: Anfällig für bewusste Störungen Homonyme für Begriffe Limitationen des Tag-Konzepts, z.B. Kontextunklarheiten z.B. bei „Web2.0 Wiki“: Suche nach Wiki oder Suche in Wiki? Wird eingesetzt bei: Bookmarks (del.icio.us) Verzeichnissen (dmoz, rawsugar) Weblogs (wp, mt) Suchmaschinen (technorati) Wikis (wikipedia) Foren () Fotos (flickr) Videos (YouTube) Kontaktbörsen (hotornot) Communities (mySpace) Artikeln (amazon, ebay) Webseiten (co-op) Wissenschaftliche Publikationen (CiteULike)

Bookmarkverwaltung: del.icio.us
Folksonomy – 2 Bookmarkverwaltung: del.icio.us del.icio.us ( ist ein webbasierter Bookmarkmanager Jeder Nutzer versieht seine URLs mit Tags Das System schlägt populäre Tags vor, die von anderen Nutzern zu dieser URL angegeben wurden Ähnliche Seiten lassen sich in Kategorien gruppieren Vorteile: Schneller Zugriff auf Bookmarks Es können leicht Nutzer mit gleichen Interessen gefunden werden, da sie dieselben URLs referenzieren Es können leicht Seiten mit ähnlichem Inhalt gefunden werden, da sie dasselbe Tag benutzen

Verzeichnisse: Open Directory Project
Folksonomy – 3 Verzeichnisse: Open Directory Project Redaktionell betreute Linklisten (Verzeichnisse) existieren seit Anbeginn des Webs, aber sie waren langsam, kostenpflichtig und nicht frei benutzbar Open Directory Project (ODP), auch dmoz genannt, behebt diese Nachteile Inhalte sind logisch klassifiziert Neue Links werden nicht sofort freigeschaltet, sondern von Menschen geprüft Aufnahme als Editor muss mit Benennung der Expertise beantragt werden ODP wird von Suchmaschinen wie Google ausgewertet (Hinweis zum Inhalt einer Website) ODP hat mehr Einträge als Wikipedia Alternatives Projekt, welches mit Tags und freier Community arbeitet: RawSugar (

Homepages: Weblogs (Blogs)
Folksonomy – 4 Homepages: Weblogs (Blogs) Blogs sind (private) Homepages von Personen Einträge sind meist beginnend mit dem aktuellsten gruppiert Tags werden für den Kontext und für Kategorien genutzt Einträge sollen von anderen Nutzern kommentiert und verlinkt werden Die gute Verlinkung der Blogs untereinander sichert einen guten Rang bei Suchmaschinen Die Qualität von Blogbeiträgen kann stark schwanken Aufgrund der „unendlichen“ Haltbarkeit von Einträgen und der schwer abschätzbaren Popularität eines Blogs kann die Privatsphäre beeinträchtigt werden Bedeutende Blogsoftwarevertreter sind Wordpress ( und Movable Type ( ) Wichtige Begriffe: Permalink: Eine dauerhafte URL, die auf den Artikelzustand zum Zeitpunkt des Linksetzen verweist, spätere Korrekturen werden also nicht angezeigt Trackback/Pingback: Protokoll, welches dem Originalartikel mitteilt, dass er „zitiert“, also von anderen verlinkt wurde (Backlinks) Blogroll: Linkliste des Betreibers des Blogs Blogosphäre: das Universum aller Blogs

Suchmaschinen: Technorati
Folksonomy - 5 Suchmaschinen: Technorati Technorati ( ist eine Blog-Suchmaschine, d.h. sie indiziert Weblogs Blogeinträgen zugewiesene Tags werden ebenfalls indiziert, dadurch lässt sich ein Themenkatalog aufbauen Suchen ist daher nicht nur im Freitexts, sondern auch in Kategorien und im Katalog möglich Weitere Features: Einschränkung nach Sprache des Blogs und nach „Autorität“, d.h. Wichtigkeit und Vertrauenswürdigkeit eines Blogs Hitliste der häufigsten Suchbegriffe, Hitliste der Blogs, Beobachtungsliste Trend der letzten 30 Tage zu einem Suchbegriff Alternative: Google Blog Suche ( hat weniger Funktionen, ist aber schneller

Wikis: Wikipedia Folksonomy - 6
Wikis sind leichtgewichtige Content Management Systeme zum kooperativen Erstellen von Inhalten Vorteile: Einfach zu bedienen Einfach zu installieren Besitzen eine vereinfachte, von HTML verschiedene Syntax (2-Zeichen-Regel) Laufen im Webbrowser Erlauben schnelle Verlinkung Nachteile: Meist keine Workflows Qualitätssicherung im Produktivbetrieb Geringe Zugriffseinschränkungen Nicht layout- oder druckorientiert, kein WYSIWYG

Typen von Wikis Folksonomy - 7
Arbeitsgruppenwikis: Im Intranet oder für Forschergruppen [ Semantische Wikis: Wikiseiten werden Konzepte, verfügen über Metadaten und Relationen, meist verwendet im Bereich Semantic Web/ RDF [ Enterprise Wikis: erweiterte Funktionalitäten wie Tabellen, Formeln, Projektmanagement, Adressverwaltung [ Personal Wikis: Ein-Benutzer-Wikis ohne Softwareinstallation [

Fotos: FlickR Folksonomy - 8
FlickR ( stellt jedem Nutzer einen Speicherort für Digitalfotos zur Verfügung Auch hier gibt es Tags zum Kategorisieren Fotos können von anderen Anwendern kommentiert werden Ein Nutzer kann thematisch orientierten Fotogruppen beitreten

Webseiten: Co-Op Folksonomy - 9
Google Co-Op ( ist ein Bewertungsportal für Webseiten Besteht aus 2 Teilen: Topics Experten bewerten Webseiten, indem sie vorgegebene Tags zuweisen, z.B. für Patienten (ähnlich dem HTML-META keyword) Nutzer vertrauen Experten, indem sie diese abonnieren. Die Empfehlungen der Experten werden dann im Suchergebnis eingearbeitet Jeder kann prinzipiell Experte werden, der Status hängt von Anzahl der Vertrauenden ab Besondere, handverlesene Experten stehen im Expertenverzeichnis (Directory) Subscribed Links Webmaster können in einer XML-Datei angeben, welche Inhalte auf ihren Websites hinterlegt sind Es können einzelne Suchbegriffe oder ganze Suchmuster angegeben werden Bietet Folgendes: Subscribed Links: Grün hinterlegte Sondersuchergebnisse an vordersten Plätzen Refine Results oder Onebox: Unter dem eigentlichen Suchergebnis befindet sich ein Linkliste wichtiger Unterthemen der Seite Labels: Unter dem Suchergebnis stehen die Tags, mit der die Seite ausgezeichnet wurde Alle Funktionen stehen nur mit Google-Account zur Verfügung Vergleichbar mit Eysenbachs MedCircle, aber bottom-up statt top-down

Publikationen: CiteULike
Folksonomy - 10 Publikationen: CiteULike CiteULike ( sammelt Referenzen wissenschaftlicher Veröffentlichungen Jeder Nutzer hat eine Beobachtungsliste Paper können getaggt und kommentiert werden Fehlende Paper (meistens eigene) können ergänzt werden Nutzer können sich zu Interessengruppen zusammenschließen Import von BibTeX, Export BibTeX und Endnote Ca Journals indiziert (nur Inhaltsverzeichnis), können ebenfalls beobachtet werden

Weitere Beispiele Videos (YouTube.com) Community (MySpace.com)
Folksonomy - 11 Weitere Beispiele Videos (YouTube.com) Community (MySpace.com) Nachrichten (digg.com) Bücher (Amazon.de) Artikel (eBay.de) Alle Beispiele verwenden Tags Bewertungs- oder Kommentarfunktionen der Community Unzählbare weitere Beispiele

Really Simple Syndication (RSS)
Syndizierung - 1 Really Simple Syndication (RSS) „Wirklich einfache Verbreitung“ Erzeugt Kurzzusammenfassungen des Inhalts einer Website, die sich abonnieren lassen Verschiedene Standards, leicht inkompatibel (RSS0.92, RSS1.0, RSS2.0, ATOM) Unterstützung durch moderne Webbrowser und Mailclients Nahezu alle Folksonomy-Anwendungen exportieren / verwerten RSS-Feeds Vorteile von RSS (z.B. gegenüber -Newslettern) Automation: Inhalte werden selbsttätig geliefert Aktualität: Informationsstand des Nutzers ist immer aktuell Handlungshoheit: Anwender kann Benachrichtigungen wieder abbestellen Anonymität: Nutzer können Informationen inkognito abrufen Einfachheit: Erstellung von RSS-Feeds wird von gängiger Software (CMS/Wikis/Blogs) angeboten

RSS-Aufbau Syndizierung - 2
Ein RSS-Feed besteht neben einem beschreibenden Teil aus einer Liste von Items Items enthalten sinnvollerweise mindestens einen Titel und die zu verweisende URL

RSS-Anwendung Syndizierung - 3 Anwendungsbeispiele für RSS:
Im Internetexplorer 7 In Google Base In Outlook 2000 (mit RSS Popper Plugin) Als Popup in der Windows-Startleiste (C2TN)

Was sind Mikroformate? Microformats - 1
Mikroformate ( sind der Versuch, einfachen (X)-HTML-Code mit Semantik aufzuwerten Keine neuen Tags, nur bestehende HTML-Attribute Microformats: Sollen klein und handlich sein Genau ein Problem lösen Nutzen wo möglich bestehende Standards Sollen wiederverwendbar sein Können ineinander verschachtelt werden Können modular aufgebaut werden

Microformats - 2 Designprinzipien „Entwickelt primär für Menschen, sekundär für Maschinen“ Nützlich für den menschlichen Anwender Nützlich für Suchmaschinen „Don‘t Repeat Yourself“ Metadaten werden nicht vom Inhalt getrennt Beispiel ohne semantisches Markup: <p> Am 11. September 2006 von 13:00 Uhr-17:00 Uhr findet das Tutorium "Im WWW nichts Neues? - Web2.0" im Haus 3, Raum 03 statt, gehalten von Matthias Löbe vom IMISE Leipzig. </p> Beispiel: Kontaktinformationen Termine Social Friends Netzwerk Bewertungen Lebenslauf

Beispiel mit semantischem Markup (I)
Microformats - 3 Beispiel mit semantischem Markup (I) Benutzung der Mikroformate hCal und hCard: <div class="vevent"> Am 11. September 2006 von 13:00 Uhr-17:00 Uhr findet das Tutorium <div class="summary">Im WWW nichts Neues? - Web2.0</div> im Haus 3, Raum 03 statt, </div> <p>gehalten von</p> <div class="vcard"> <div class="fn">Matthias Löbe</div> vom IMISE <div class="locality">Leipzig</div>. Es handelt sich um einen Termin (vevent) Der Termin heißt Im WWW nichts Neues? - Web2.0 (summary) Es handelt sich um eine Person (vcard) Die Person heißt Matthias Löbe (fn) und kommt aus Leipzig (locality)

Beispiel mit semantischem Markup (II)
Microformats - 4 Beispiel mit semantischem Markup (II) <div class="vevent"> <abbr class="dtstart" title=" T "> 11. September :00 Uhr </abbr> - <abbr class="dtend" title=" T "> 17:00 Uhr </abbr> <a class="url" href=„./gmds2006-Tutorium-Im-WWW-Nichts-Neues.pdf"> <div class="summary">Im WWW nichts Neues? - Web2.0</div> </a> <div class="location">Haus 3, Raum 03</div> <div class="description">Ein Tutorium über neue Trends im WWW</div> </div> <p>gehalten von</p> <div class="vcard"> <a class="url fn" href=" Löbe</a> <div class="adr"> <span class="org">IMISE</span> (<span class="locality">Leipzig</span>) <div class="tel"> </div> Weitere Auszeichnungen bzw. Annotationen des Termins Der Termin hat ein Startdatum (dtstart) und ein Enddatum (dtend) Zum Termin gibt es nähere Informationen (url) Er findet an einem Ort (location) statt und hat eine Beschreibung (description) Weitere Auszeichnungen der Person Die Person hat eine Homepage (url) und eine Telefonnummer Sie kommt von einer Organisation (org, adr)

Beispiel mit semantischem Markup (III)
Microformats - 5 Beispiel mit semantischem Markup (III) Anwendungen Technorati unterhält eine Microformats-Suche Firefox-Plugin zeigt gefundene Microformats an ( XSL-Transformation für Outlook und Google Calendar verfügbar ( Alternative: RDF/A benutzt zusätzlich Namensräume zur Adressierung, ist daher etwas komplizierter, aber auch generischer

Creative Commons (CC) Lizenzen für:
Texte Bilder Musik Videos Hintergrund: Unsicherheit über dem Umfang des Verzichts bei Freigabe eines Werks Weitere Verbreitung durch Freigabe Wichtige Rechte können eingeschränkt werden Bei Computerprogrammen schon lange Standard, viele unterschiedliche Lizenzen bzw. Abstufungen zwischen „alle Rechte vorbehalten“ und „Public Domain“ Setzt auf RDF und Dublin Core auf

4 Säulen der CC Namensnennung Keine Kommerzielle Nutzung
Lizenzen - 2 4 Säulen der CC Namensnennung Keine Kommerzielle Nutzung Keine Bearbeitung Weitergabe unter gleichen Bedingungen Freigabe, wenn bei Weiterverwertung der Urheber genannt wird Soll die Nennung des Urhebers vorgeschrieben werden? [nur "ja" möglich] Freigabe zu nicht-kommerziellen Zwecken Ist die kommerzielle Nutzung erlaubt? Freigabe, wenn das Werk unbearbeitet weiterverwertet wird Darf das Werk verändert oder bearbeitet werden? Freigabe, wenn die veränderten Werke, in denen das ursprüngliche Werk verwendet wird unter den gleichen Lizenzbedingungen veröffentlicht werden Falls das Werk bearbeitet werden darf, muss das neue Werk unter die gleiche Lizenz wie das alte gestellt werden?

6 Lizenzmodelle (Version 2.5)
Lizenzen - 3 6 Lizenzmodelle (Version 2.5) by Namensnennung by-sa Namensnennung – Weitergabe unter gleichen Bedingungen by-nd Namensnennung – Keine Bearbeitung by-nc Namensnennung – Nicht-Kommerziell by-nc-sa Namensnennung – Nicht-Kommerziell – Weitergabe unter gleichen Bedingungen by-nc-nd Namensnennung – Nicht-Kommerziell – Keine-Bearbeitung FlickR Google Yahoo! ( Wikipedia Gutenberg

Science Commons Schutzmechanismen für Rohdaten
Lizenzen - 4 Science Commons Schutzmechanismen für Rohdaten Lizenzen für Zweitverwertungen, Vorabdrucke oder Nachdrucke Mechanismen für die persönlichen Archive der Wissenschaftler Rechtliche Implikationen von Open-Access-Modellen Verwendung maschinenlesbarer Lizenzen Derzeit noch in der Diskussionsphase

Open Access Wissenschaftliche Literatur und Materialien sollen
Lizenzen - 5 Open Access Wissenschaftliche Literatur und Materialien sollen Kostenlos Ohne Lizenzbeschränkungen abrufbar sein Öffentliche finanzierte Autoren und Gutachter sollen freie Ergebnisse liefern Budapest Open Access Initiative (2001) bzw. Berliner Erklärung (2003) Grundsatzerklärung Einbeziehung des kulturellen Erbes Im Allgemeinen muss der Autor die Veröffentlichung bezahlen Wichtige Open Access Journals: PLoS Medicine (1.500 $) BMC Bioinformatics (625 bis $) Journal of Medical Internet Research (750 $) Kritiken: Echter Peer-Review Wirklich niedrigere Kosten?

Archivierungspflicht
Lizenzen - 6 Archivierungspflicht Gesetz über die deutsche Nationalbibliothek ( ) Langzeitarchivierungspflicht für alle Webinhalte Texte, Bilder, Töne Ablieferungspflicht innerhalb 1 Woche Ablieferungspflichtiger Sitz in Deutschland Auf eigene Kosten Infrastruktur unklar Anmeldekennung für jede Lieferung Abgabe von Netzpublikationen an die Deutsche Nationalbibliothek - Schritt für Schritt (

Gadgets, Widgets, whatever
Look&Feel - 1 Gadgets, Widgets, whatever Kleine grafische Helferlein, meist spielerisch gestaltet Vorteile: API verfügbar Viele kostenlose Widgets herunterladbar Nachteile: Kein gemeinsames Bedienkonzept Widgets nicht immer stabil Beispiele: Yahoo Widget Engine, ehemals Konfabulator ( Javascript-Bibliothek Apple Dashboard ( für Apple Computer Opera Widgets ( Integration in den Opera Browser Microsoft Widgets ( ab Windows Vista verfügbar Google Gadgets ( für die lokale Sucmaschine Google Desktop

Ajax „Asynchronous Javascript and XML“ Funktionsweise Vorteile
Look&Feel - 2 Ajax „Asynchronous Javascript and XML“ Funktionsweise Vorteile Nachteile Asynchron im Sinne von: die Datenübertragung wird ausgeführt, sobald hinreichend Daten zur Verfügung stehen Webseiten werden dynamisch verändert, ohne dass ein Link oder Button angeklickt wird Keine Wartezeit, direktere Interaktion des Nutzers mit dem Programm Javascript: Clientseitige Berechnungen Modifikation des DOM-Baumes Eingabewertvalidierungen XML: Austauschformat für Methodenaufrufe und Parameter bzw. Ergebnisse Viele ausgereifte XML-APIs verfügbar Vorteile: Nutzerfreundlich Direkt im Browser ausführbar Nachteile: Kompatibilitätsprobleme Kein Zurück-Button Suchmaschinenuntauglich Nicht barrierefrei

Ajax-APIs Bibliotheken (javascriptbasiert, nur Client)
Look&Feel - 3 Ajax-APIs Bibliotheken (javascriptbasiert, nur Client) Prototype Dojo Script.aculo.us Frameworks (alle Programmiersprachen, Client und Server) Google Web Toolkit DWR Prototype (( ist die meistgenutzte Bibliothek, viele andere setzen auf ihr auf Dojo ( script.aculo.us basiert auf Prototyp ( Google Web Toolkit ( für Java DWR ( ebenfalls Java

Textverarbeitung Look&Feel - 4
Textverarbeitung auf Ajax-Basis ( Import von Word-Dateien Alternative:

Tabellenkalkulation Look&Feel - 5
Tabellenkalkulation auf Ajax-Basis ( Import von XLS-Dateien Unterstützung von Formeln

Betriebssysteme Look&Feel - 6
Betriebsysteme auf Ajax-Basis ( Emuliert eine Linuxsystem mit einigen Programmen Zu langsam, zu funktionsarm, eher technische Demo Alternative: eyeOS (

Mashup Verknüpfung unterschiedlicher externer Datenquellen
„Veredlung“, d.h. es entsteht ein Mehrwert für den Nutzer durch deren Kombination Bauen auf offenen Programmierschnittstellen auf Liste von Mashups:

Wichtige APIs Google Maps FlickR Amazon A3 Yahoo Maps del.icio.us eBay
Mashup - 2 Wichtige APIs Google Maps FlickR Amazon A3 Yahoo Maps del.icio.us eBay YouTube Google Search Liste von APIs (

Beispiel: diggdot.us Mashup - 3 Verknüpfung aus:
Digg (community-betreute Nachrichten) Slashdot (redaktionell betreute Nachrichten) del.icio.us (Tags)

Beispiel KML-Studienzentren
Mashup - 4 Beispiel KML-Studienzentren Mashup von Studienzentren und Ansprechpartnern der Studiengruppen des Kompetenznetzes Maligne Lymphome Positionen der OpenGeoDB Stadtpläne von Google Maps Anfahrtsskizzen von Map24 Bilder von FlickR

Protokolle, Architekturen und Serialisierungen
Unterstützung beliebiger Programmiersprachen Unterstützung beliebiger Betriebssysteme Kommunikation nur über Port 80 Keine Binärformate Wichtige Protokolle: SOAP, XML-RPC, HTTP Wichtige Architekturen: SOA, REST Wichtige Serialisierungen: Text, XML, JSON/YAML

Protokolle: SOAP SOAP ist das Basisprotokoll für Web Services
XML als Repräsentationssprache <soap:Envelope xmlns:soap=" <soap:Body> <getTutorialDetails xmlns=" <productID>tut-06</productID> </getTutorialDetails> </soap:Body> </soap:Envelope> Sehr generisch Ausnahmeregelungen (Exception Handling) Sicherheit/ Verschlüsslung Transaktionen Unterstützung beliebiger Programmiersprachen Geringe Nutzlast (Payload), langsam, kompliziert WSDL als Beschreibungssprache für Dienste UDDI als Serviceregistrierung

Protokolle: XML-RPC XML Remote Procedure Call Protokolle - 3
<?xml version="1.0"?> <methodCall> <methodName>gmds.getTutorialName</methodName> <params> <param> <value><id>06</id></value> </param> </params> </methodCall> Vorgänger von SOAP Viel einfacher aufgebaut, daher sehr beliebt Vergleich von SOAP und XML-RPC (

Protokolle - 4 Architektur: REST Respresentational State Transfer = „Übertragung der Darstellung eines Zustands“ REST verwendet in der Modellierung Substantive, SOAP/RPC dagegen Verben GET HTTP/1.1 HTTP ist ein REST-Protokoll 4 atomare Operationen: Create = HTTP PUT Read = HTTP GET Update = HTTP POST Delete = HTTP DELETE 1 Adresse für jedes Objekte (URI) Zustandsloses Protokoll, d.h. 2 aufeinander folgende Aufrufe können nicht chronologisch und auch nicht einem Aufrufer zugeordnet werden Alle wichtigen Zustandsdaten befinden sich innerhalb des Aufrufs und werden bei jedem Aufruf übertragen, daher REST REST-APIs nutzen im Allgemeinen HTTP als Transportprotokoll

Serialisierungen: JSON
Protokolle - 5 Serialisierungen: JSON JSON: JavaScript Object Notation Kompakte Kodierung von Datenstrukturen, geringer Overhead Gutes Unmarshalling in Javascript { "Person": { "Name": "Löbe", "Vorname": "Matthias", "Titel": null "Alter": 31, "Interessen": [ "Ajax", "Mashup", "Tagging" ], } Da JSON kompakter ist, müssen weniger Daten übertragen werden, dadurch ist JSON schneller und somit besser für zeitkritische Anwendungen wie Ajax geeignet

Serialisierungen: YAML
Protokolle - 6 Serialisierungen: YAML YAML: Ain't Markup Language Kompakte Kodierung von Datenstrukturen, geringer Overhead Keine Datentypen --- Person: Name: Löbe Vorname: Matthias Titel: null Alter: 31 Interessen: - Ajax - Mashup - Tagging Kurzbeschreibung (

Web2.0 Das Web2.0 macht wenig neu, aber vieles anders:
Zusammenfassung Web2.0 Das Web2.0 macht wenig neu, aber vieles anders: Content wird von der Community produziert Als Qualitätsmerkmal gilt seine Reichweite Sein Kontext erschließt sich durch Tags Seine Struktur wird semantisch angereichert Er steht unter freien Lizenzen zur Verfügung Web-Applikationen werden benutzerfreundlich Komfortabel wie Desktopprogramme Verzögerungsfreies Arbeiten Angereichert durch Zusatzdienste

Inhalt Die Vision des Semantic Web Grundlegende Technologien
Praktische Anwendungen Einsatzszenarien in der Medizin Dieser Teil des Tutoriums gliedert sich in vier Abschnitte Zunächst wird die Idee des Semantic Web vorgestellt. Dann gibt es eine kurze Einführung in die grundlegenden Technologien. Anschließend werden einige praktische Anwendungen erläutert. Schließlich werden einige Ideen zum Einsatz des Semantic Web in der Medizin geäußert.

Praktische Anwendungen Einsatzszenarien in der Medizin Zuerst eine Einführung in das, was man sich unter dem Semantic Web vorstellen sollte.

Das World Wide Web bisher
Was wir haben Eine Vielzahl von Dokumenten, Inhalten und Daten Sprachen zur Darstellung von Inhalten (HTML, CSS...) Werkzeuge für die Nutzung (Webbrowser, Suchmaschinen...) Anwendungsfälle (Information, Bildung, Unterhaltung, E-Commerce, Organisation, Kommunikation...) Was wir nicht haben Ein echtes Zusammenspiel der informationsverarbeitenden Systeme Was wir brauchen Semantik Zuerst ein Blick auf das, was uns das World Wide Web bisher schon bietet. Wenn die informationsverarbeitenden Systeme besser miteinander zusammenarbeiten, fällt es leichter, sich in der Flut von Informationen zurechtzufinden, die heutzutage im WWW offeriert werden.

Semantik? Bezeichnet die exakte Bedeutung von Sprachen unter Zuhilfenahme formaler, logisch-mathematischer Methoden. In Abgrenzung zur Semantik in Philosophie und Linguistik als formale Semantik bezeichnet. Ziel ist es, dass Computersysteme Inhalte nicht nur bereitstellen (Webserver), transportieren (Internet) und präsentieren (Webbrowser), sondern auch „verstehen“. Zumindest soweit verstehen, dass die bereitgestellten Daten in nutzbringender Weise miteinander in Verbindung gebracht werden können. Dass ein Computer „versteht“, was ein Termin ist, bedeutet nicht, dass man mit ihm über den tieferen Sinn eines Termins philosophieren könnte. Aber er kann immerhin feststellen, wenn etwas ein Termin sein soll und welche Daten deshalb unmittelbar, z.B. Datum und Uhrzeit, oder mittelbar, z.B. die -Adressen der beteiligten Personen, mit ihm verknüpft sein können.

Ein visionäres Beispiel
„At the doctor's office, Lucy instructed her Semantic Web agent through her handheld Web browser. The agent promptly retrieved information about Mom's prescribed treatment from the doctor's agent, looked up several lists of providers, and checked for the ones in-plan for Mom's insurance within a 20-mile radius of her home and with a rating of excellent or very good on trusted rating services. It then began trying to find a match between available appointment times and Pete's and Lucy's busy schedules. In a few minutes the agent presented them with a plan. Pete didn't like it—University Hospital was all the way across town from Mom's place, and he'd be driving back in the middle of rush hour. He set his own agent to redo the search with stricter preferences about location and time. Lucy's agent, having complete trust in Pete's agent in the context of the present task, automatically assisted by supplying access certificates and shortcuts to the data it had already sorted through.“ Zur Veranschaulichung ein recht visionäres Beispiel aus dem berühmten Semantic Web-Artikel von 2001 im Scientific American, in dem Tim Berners-Lee das erste Mal die Idee des Semantic Web einer breiten Öffentlichkeit vorgestellt hat. Die Realisierung dieses Beispiels liegt noch in weiter Ferne. Es gibt jedoch bereits heute einige vielversprechende Anwendungsmöglichkeiten. Den Artikel gibt’s im Web unter Quelle: Tim Berners-Lee, James Hendler und Ora Lassila: The Semantic Web - A new form of Web content that is meaningful to computers will unleash a revolution of new possibilities, Scientific American, May 17, 2001

Ein paar praktische Beispiele
Zusammenstellen von Nachrichten-Schlagzeilen aus verschiedenen Quellen und Filterung nach vorgegebenen Kategorien Präsentation persönlicher Kontaktinformationen auf verschiedenen Websites und zugleich im Adressbuch des -Clients, der Terminverwaltung und im PDA Import von Terminen aus verschiedenen Quellen per Drag&Drop aus dem Webbrowser in die persönliche Terminverwaltung Hier ein paar etwas praktischere Beispiele, die so zum Teil sogar schon im Einsatz sind. Generell gedeihen die meisten Semantic Web-Pflänzchen derzeit aber noch in den Laboren von Forschungsabteilungen. Das letztgenannte Beispiel soll zur Verdeutlichung der Idee des SW etwas detaillierter erläutert werden...

Beispiel: Termine aus mehreren Quellen
Website Informationsfluss SW-Baustein Im Mittelpunkt steht eine Website, die ihren Besuchern eine Sammlung von Terminen präsentiert. Die Termine bezieht sie von anderen Websites und die Nutzer schauen sich die Termine mit ihrem Browser an und importieren sie in ihre Terminverwaltung. Die Pfeile stellen die Informationsflüsse dar und die Farben der Pfeile verdeutlichen, wo bei der Präsentation von Daten unterschiedliche „Sprachen“ gesprochen und verstanden werden. Mit Hilfe der Bausteine wird die Kommunikation – auf semantischer Ebene – vereinheitlicht und somit das Zusammenspiel aller Teilnehmer ermöglicht.

Das „Web“ in Semantic Web
Anbieter von semantisch ausgezeichneten Daten und die Nutzer dieser Daten sind nur lose miteinander gekoppelt. Genauso wie Webserver und Webbrowser nur lose über HTTP und HTML miteinander in Verbindung stehen. Es gibt keine zentrale Instanz, die die Kommunikation steuert. Auch wenn im vorangegangenen Beispiel eine Website im Mittelpunkt stand, gibt es im Semantic Web keine zentrale Instanz, die das Zusammenspiel aller Anbieter und Nutzer koordiniert. Vielmehr steht jedem frei, Daten anzubieten und zu nutzen. Das gleiche Prinzip also, das auch dem WWW (in seiner ursprünglichen Form) zu Grunde liegt. Dass alle Kommunikationsteilnehmer auch wirklich dasselbe meinen, wenn sie miteinander bspw. über Termine reden, wird mit Hilfe der Semantic Web-Technologien sichergestellt. Diese Technologien werden im zweiten Abschnitt genauer vorgestellt. Website Client Zugriff

It's all about the Data Das Semantic Web wird kein Nachfolger des World Wide Web sein. Es ist vielmehr eine Ergänzung desselben. Da die Hauptnutzer Softwaresysteme sind, wird das Semantic Web für uns Menschen weitgehend im Verborgenen bleiben. Der Fokus liegt auf den Daten, die ausgetauscht und miteinander kombiniert werden. Die (visuelle) Darstellung spielt hierbei eine nachgeordnete Rolle. Es bleibt festzuhalten, dass es im Semantic Web im Wesentlich darum geht, Daten zwischen informationsverarbeitenden Systemen auszutauschen und damit neue Anwendungsmöglichkeiten für den Menschen zu schaffen.

Zwei grundlegende Philosophien
Zugang zu strukturierten Informationen in Datenbanken Diese Daten sind sonst gar nicht oder nur indirekt über Webanwendungen erreichbar. Semantisches Markup von Webdokumenten Dokumente, die für den Menschen als Nutzer gedacht sind, werden zusätzlich mit Markup versehen, der die Inhalte für Computersysteme verständlich macht. Beide Philosophien stehen nicht im Widerspruch zueinander und so werden für beide eine Vielzahl von Technologien entwickelt Zuvor jedoch müssen die Daten dem Semantic Web zur Verfügung gestellt werden. Die beiden vorgestellten Philosophien – Zugriff auf Datenbanken und Semantisches Markup von Webdokumenten – existieren friedlich nebeneinander her und haben beide ihre Vor- und Nachteile. Eine ausführlichen Artikel zu Tim Berners-Lees Sicht der Dinge findet sich unter

Praktische Anwendungen Einsatzszenarien in der Medizin Nun werden die Technologien vorgestellt, mit denen das Semantic Web realisiert werden soll.

Ein Stapel von Spezifikationen
Das Semantic Web wird vom W3C auf dem Fundament des WWW entwickelt URIs für Identifikation Unicode für universelle Zeichencodierung XML als universelle Repräsentationsform Sprachen des Semantic Web: RDF, OWL (Ontology), SPARQL (Query), SWRL (Rules) Logic, Proof und Trusted SW folgen später Die „Semantic Web Pyramide“, wie der Spezifikationsstapel manchmal genannt wird, illustriert den Bottom-Up-Ansatz bei der Entwicklung des Semantic Web. Die grundlegenden Technologien (URI, XML etc.) sind teilweise schon seit langem im WWW im Einsatz und haben ihren praktischen Nutzen bewiesen. Bei RDF und OWL ist die Spezifizierung abgeschlossen, SPARQL ist bereits Candidate Recommendation. SWRL befindet sich derzeit in Entwicklung.

Resource Description Framework
Mit RDF werden Aussagen über Dinge (Statements) ausgedrückt. Dinge (Ressourcen) können Dokumente im Web sein oder Personen oder Termine oder oder oder ... Also alles, worüber man etwas ausdrücken möchte. Die Aussagen haben die Form von Tripeln (Subjekt, Prädikat, Objekt) oder (Subject, Property, Value) Subject Property Value Eine tiefere Semantik bietet RDF selbst nicht. Es ist lediglich ein Container für die Erfassung von Aussagen. Ursprünglich wurde es dafür entwickelt, Metadaten über Webdokumente auszudrücken. Dies ist auch im Semantic Web noch ein wichtiger Anwendungsfall. Darüber hinaus lassen sich in RDF aber auch Aussagen treffen, die das „Verstehen“ von Informationen erlaubt. Einen Einstieg in RDF bietet der RDF-Primer (

RDF-Beispiele Aus RDF-Statements werden Graphen gebildet.
Die Statements können aus beliebigen Quellen stammen. Die Verbindung erfolgt über die URIs. <rdf:RDF xmlns:rdf=" xmlns:dc=" xmlns:foaf=" <rdf:Description rdf:about=" <dc:title>Im WWW nichts Neues?</dc:title> <dc:author> </rdf:Description> <rdf:Description rdf:about=" <foaf:firstname>Roland</foaf:firstname> <foaf:surename>Mücke</foaf:surename> </rdf:Description> </rdf:RDF> Dass die RDF-Statements aus beliebigen Quellen stammen können heißt, dass ein Semantic-Web-Client RDF-Dateien von unterschiedlichen Websites lädt und dann zu einem lokalen RDF-Graphen (auch „Modell“ genannt) zusammenfügt. Ein RDF-Graph kann im Arbeitsspeicher abgelegt sein oder in einer relationalen Datenbank. Wie an diesem einfachen Beispiel schon ersichtlich, kann ein RDF-Graph sehr schnell sehr viele Statements enthalten. Wir reden hier von Millionen von Statements!

Web Ontology Language (OWL)
Die explizite Festlegung von Struktur erfolgt durch Vokabulare (einfach), Schemata oder Ontologien (komplex). OWL definiert Konzepte und Beziehungen. Klassen und ihre Eigenschaften Hierarchien von Klassen und Eigenschaften Vergleichbar mit Datenbank-Schemata. Kann aber komplexere Beziehungen ausdrücken Wird in RDF ausgedrückt. Unterscheidung in z. B. OWL Lite, OWL DL und OWL Full. Grundlage für die Ableitung impliziter Statements. In der Praxis wird man derzeit hauptsächlich Vokabulare antreffen, da die beschriebenen Strukturen recht einfach sind und das Erstellen einer umfangreichen Ontologie einen erheblichen Zeitaufwand bedeutet. Ein schönes Beispiel für eine „echte“ Ontologie ist die Wine-Ontology ( Die drei OWL-Typen entstammen den Problemen bei der Verarbeitung von OWL durch Reasoner, die aus explizitem Wissen neues Wissen schließen. Die Einteilung in Lite, DL (Description Logics) und Full ist allerdings nicht ohne Kritik und es wird sich in der Zukunft zeigen, was sich in der Praxis bewährt.

OWL-Beispiel Definition der Klasse „Person“ und einer ihrer Eigenschaften „firstName“ aus dem FOAF-Schema <rdfs:Class rdf:about=" rdfs:label="Person" rdfs:comment="A person."> <rdfs:subClassOf rdf:resource=" <rdfs:subClassOf rdf:resource=" <rdfs:subClassOf rdf:resource=" <rdfs:subClassOf rdf:resource=" <rdfs:isDefinedBy rdf:resource=" <owl:disjointWith rdf:resource=" <owl:disjointWith rdf:resource=" <owl:disjointWith rdf:resource=" </rdfs:Class> <rdf:Property rdf:about=" rdfs:label="firstName" rdfs:comment="The first name of a person."> <rdf:type rdf:resource=" <rdfs:domain rdf:resource=" <rdfs:range rdf:resource=" <rdfs:isDefinedBy rdf:resource=" </rdf:Property> Das vollständige FOAF-Vokabular findet sich unter Es zeigt jedoch nur einen sehr kleinen Ausschnitt aus dem, was mit OWL ausgedrückt werden kann. Für ausführlichere Beispiele sei auf die OWL-Spezifikation ( und die Wine-Ontology ( verwiesen.

Implizites Wissen Mit den in OWL ausgedrückten Beziehungen von Konzepten und ihren Eigenschaften kann aus vorhandenem Wissen neues Wissen abgeleitet werden. Beispiel  „Im WWW nichts Neues?“ ist ein GMDS-Tutorium.  Ein GMDS-Tutorium ist eine GMDS-Veranstaltung.  „Im WWW nichts Neues?“ ist eine GMDS-Veranstaltung und gehört deswegen in jeden Tagungs-Kalender. Die Ableitung dieses impliziten Wissens (Inferenz, Entailment) wird von einem Reasoner durchgeführt, der meist direkt an einem RDF-Store angeschlossen sind. Tatsächlich wird das Ableiten von Wissen aus bestehenden Aussagen einen entscheidenden Mehrgewinn im Semantic Web bringen. Computersysteme werden damit in der Lage sein, selbstständig Schlüsse zu ziehen und sind nicht mehr darauf angewiesen, dass ihnen der Mensch jede Information haarklein vordefiniert. Wie man aber aus der KI-Forschung weiß, ist das automatische Schließen und der Umgang mit Widersprüchen durchaus problematisch.

SPARQL Protocol and RDF Query Language
Abfragesprache für RDF-Graphen Grundlage jeder anspruchsvollen SW-Anwendung Liefert einzelne Werte, Datensätze oder Teilgraphen Vergleichbar mit SQL für Datenbanken Allerdings nur mit lesendem Zugriff Die Spezifikation definiert zusätzlich ein Protokoll für die Kommunikation zwischen SPARQL-Clients und -Servern. Implementationen können auf HTTP oder SOAP aufsetzen Die Spezifikationen der SPARQL-Anfragesprache und des SPARQL-Protokolls sind in zwei separaten Dokumenten enthalten: und

SPARQL-Beispiele SELECT ?title WHERE { < dc:title ?title } SELECT ?title ?price WHERE { ?x ns:price ?price FILTER (?price < 30) ?x dc:title ?title . } SELECT ?name ?mbox ?hpage WHERE { ?x foaf:name ?name OPTIONAL { ?x foaf:mbox ?mbox } OPTIONAL { ?x foaf:homepage ?hpage } } Der Übersichtlichkeit halber wurden die PREFIX-Definitionen in den Querys weggelassen, über die den Namespaces (dc, foaf, ns) ihre URIs zugeordnet werden. Die erste Query liefert den Titel des mit der URI identifizierten Buches. Die zweite Query liefert den Titel und den Preis aller Dinge, die weniger als 30 kosten. Die dritte Query liefert die Namen aller im Graphen vorhandenen Personen und optional dazu die Mailbox und die Homepage. Dieses Beispiel zeigt also den Umgang mit unvollständigem Wissen, wie es im Semantic Web sehr häufig vorkommt.

Praktische Anwendungen Einsatzszenarien in der Medizin Nach so viel Theorie sollen nun einige praktische Anwendungen, die die Nützlichkeit des Semantic Web vorführen.

Das Semantic Web in der freien Wildbahn
Seit der „Einführung“ des Semantic Web im Scientific American im Jahre 2001 hat es nicht nur Entwicklungen im wissenschaftlichen Umfeld gegeben. Einige Anwendungen sind dabei, die Labore zu verlassen und sich im praktischen Alltag zu bewähren. Besonders empfänglich: die Blogger-Szene Der Geek-Faktor ist jedoch noch immer sehr hoch. Die einzige Ausnahme ist RSS – und das ist nicht mal echtes Semantic Web. Es sei angemerkt, dass die meisten der folgenden Anwendungen noch sehr experimentell sind und man noch lange nicht von einem breiten Einsatz von Semantic-Web-Technologie sprechen kann.

Nachrichten-Aggregation: RSS
Bereitstellung von Nachrichten-Schlagzeilen mittels „Rich Site Summary“ Clientseitige Nutzung in Newsreadern oder Live-Bookmarks Serverseitige Nutzung auf Nachrichten-Portalen, die Schlagzeilen aus vielen Quellen zusammenführen (Syndizierung) Kategorien von News (Channels) Kein allgemeiner Standard zur Kategorisierung Es existieren mehrere Versionen von RSS und nur eine (die 1.0) verwendet RDF Andere Interpretationen der Abkürzung „RSS“ sind Really Simple Syndication RDF Site Summary Richtig Schnelle Schlagzeilen (heise.de)

Netzwerk von Bekanntschaften: FOAF
FOAF steht für „Friend of a Friend“ Persönliche Beschreibung von sich und seinen Freunden Name, Mailbox, Homepages, Bild Diverse Instant-Messenger-IDs und Online-Accounts Bekanntschaften, Interessen, Publikationen, Projekte Derzeit die Visitenkarte im Semantic Web und bei Bloggern. <foaf:Person> <foaf:name>Dan Brickley</foaf:name> <foaf:mbox_sha1sum>241021fb0e6289f92815fc210f9e c252e</foaf:mbox_sha1sum> <foaf:homepage rdf:resource=" /> <foaf:img rdf:resource=" /> </foaf:Person> Die Website des FOAF-Projektes ist unter zu finden. Eine ausführliche Einführung gibt es unter

Semantisches Markup in XHTML
Die Grundidee ist, dass vorhandene Web-Dokumente mit Auszeichnungen versehen werden, die ihren Inhalt semantisch „greifbar“ machen. Die Ansätze reichen bezüglich der Auswirkungen auf den XHTML-Code von „unauffällig“ (GRDDL) bis „brachial“ (RDF/A). Das Ziel ist, eine Dopplung von Informationen in XHTML- und RDF-Dateien zu vermeiden. Minimiert Arbeit und Fehler Ideal, wenn die Inhalte nicht anderweitig strukturiert sind, z.B. in Datenbanken <HTML> <RDF> Die drei Herangehensweisen (GRDDL, Microformats, RDF/A, s. nächste Seite) sind sich recht ähnlich und stehen deshalb ein wenig in Konkurrenz zueinander. Was sich durchsetzen wird, ist noch nicht abzusehen. Microformats sind derzeit in der Blogger-Szene sehr beliebt und es gibt sogar schon Firefox-Extensions, die sie Nutzen: Sie sucht auf XHTML-Seiten selbstständig nach Microformats und zeigt sie in einem separaten Fenster an. Mit Javascript lassen sich dann bspw. Kontaktdaten einem Adressbuch hinzufügen.

GRDDL, Microformats, RDF/A
GRDDL: Gleaning Resource Descriptions from Dialects of Languages extrahiert Daten mittels XSL-Transformation aus XML-Dokumenten. XSL muss die Struktur der XML-Dialekte (z. B. XHTML) kennen, in denen die gewünschten Inhalte stecken. Microformats: Vorgegebene Konstrukte aus <div>- und <span>-Tags zusammen mit CSS-Klassen Vordefinierte Formate, die die Verarbeitung stark vereinfachen. Beispiele sind hCard oder hCalendar RDF/A: Einbettung von RDF direkt in XHTML-Code <p>Dieser Teil des Tutoriums ist von <span class="author" about="WWW-Teil2.pdf" property="dc:creator">Roland Mücke</span>.</p> Bei GRDDL wird der Verweis auf die XSL-Datei im Kopf des XML-Dokuments z. B. im <link>-Tag eingebunden. Damit für jede neue Seite nicht extra ein neues XSL geschrieben werden muss, sollte man sich als Autor an gewisse Regeln halten. Eben diese Regeln setzt Microformats schon voraus und definiert sie für verschiedene Datentypen. RDF/A bietet die größte Flexibilität, ist aber für die Autoren der Dokumente am schwierigsten zu benutzen.

SPARQL-Endpunkt für SQL-Datenbanken
Zugriff auf SQL-Datenbanken über einen Wrapper, der SPARQL-Querys in SQL-Querys umwandelt. Beispiel: D2RQ Anbindung an lokale SQL-Datenbanken Zugriff auf Datenbankinhalt als RDF-Graph möglich Beziehung zwischen Datenbankschema und RDF-Graph über Mapping, das semi-automatisch hergestellt wird. Semantic Web DB Das vorgestelle Beispiel D2RQ ( ist nur eine von vielen Implementationen für einen Datenbank-Wrapper. Endpunkt SQL SPARQL

Zum Rumprogrammieren: APIs
Für die Entwicklung von „Semantic-Web-Anwendungen“ stehen einige APIs als OpenSource zur Verfügung. Teilweise Referenzimplementationen, also kein Bastelkram! Jena, Sesame Java-APIs für RDF und SPARQL, RDF-Store Redland Gleicher Leistungsumfang, in C geschrieben Bindings u. a. für Perl, Python, Ruby und PHP Keine APIs, aber sehr leistungsfähige Browser/Editoren: Protege und Swoop Die Homepages der genannten APIs und Programme sind: Jena: Sesame: Redland: Protege: Swoop:

Wann kommt die Killer-App?
Vermutlich wird es nie eine Killer-Applikation geben, die dem Semantic Web zum Durchbruch verhelfen wird. Gab es eine Killer-Website, die dem WWW zum Durchbruch verhalf? Stattdessen wird es viele kleine Semantic Webs geben, die sich in bestimmten Nutzerkreisen oder bei bestimmten Anwendungsfällen durchsetzen, z. B. RSS oder FOAF. Der Wandel hin zum Semantic Web wird sich hinter den Kulissen vollziehen, so dass Otto-Normalsurfer nichts davon mitbekommt. Große E-Commerce-Websites könnten die Entwicklung drastisch beschleunigen. Die Entscheidung, ob und wann man auf den Semantic Web-Zug aufspringt, hängt letztendlich davon ab, wieviele personelle und finanzielle Ressourcen man hierfür bereitstellen kann und wie groß der Gewinn für die eigene Forschungsgruppe oder das eigene Projekt ist. Mögliche Einsatzgebiete, die derzeit lohnen, sind Informationsportale. Im vierten Abschnitt wird darauf näher eingegangen.

Praktische Anwendungen Einsatzszenarien in der Medizin Bislang waren die Beschreibungen und Beispiele allgemein gehalten. Deshalb folgen nun einige Ideen dazu, wie das Semantic Web im medizinischen Umfeld eingesetzt werden könnte.

Medizinische Informationsportale
RSS für Neuigkeiten und Termine FOAF als Visitenkarte Entweder aus Verzeichnisdienst generieren oder FOAF-a-Matic Microformats für Termine und Kontaktinformationen Spätestens bei der nächsten Überarbeitung mit einplanen, wenn man sich sowieso stärker mit CSS beschäftigen will Generell gilt: Catch the low hanging fruit! Mit geringem Aufwand den Nutzern einen zusätzlichen Service bieten. Ein echter Unterschied zu nicht-medizinischen Websites gibt es hier an sich nicht. Da man aber meist den Anspruch hat, ein sehr gutes Informationsportal zu besitzen und seinen Besuchern den bestmöglichen Service zu bieten, sollte man die ein oder andere neuere Technologie mit in Erwägung ziehen. Um nicht jedem Hype hinterherzujagen und die eigenen Ressourcen möglichst gewinnbringend einzusetzen, sollte man sich jedoch auf bereits erfolgreiche Semantic-Web-Ideen konzentrieren. FOAF-a-Matic:

Verteilte Studienregister
Anstelle eines zentralen Dienstes wird die bestehende Web-Infrastruktur von Studien- gruppen und Forschungsprojekten genutzt. Beschreibung von Studien mit RDF Entweder aus der lokalen Studiendatenbank Oder mittels GRDDL oder RDF/A Ein zentrales Schema für die Beschreibung ist nicht zwingend notwendig Mapping individueller Schemata aufeinander Vereinfacht die Organisation Die Bestrebungen zum Aufbau zentraler Studienregister gibt es schon lange. Meist stellen organisatorische Anforderungen die größten Probleme dar. Bei einem verteilten Studienregister müsste sich jeder Lieferant von Informationen zu Studien nur darum kümmern, diese Informationen mittels RDF zur Verfügung zu stellen. Da Studiengruppen auf ihren Websites ohnehin Informationsmaterial zu ihren Studien anbieten, ist der Mehraufwand gering. Die Konsumenten dieser Informationen (z. B. Portale, die Zugang zu einem zentralen Register anbieten), sind für die Zusammenführung der bereitgestellten Daten verantwortlich.

Planung und Durchführung von Studien
Beschreibung von Studien-Items mit RDF Nutzung dieser Beschreibungen zur Erzeugung der Studiendatenbanken Generierung von Studiendokumenten (CRFs) Annotation der Studienprotokolle Kommunikation mit Studienregistern Neben Daten zur Beschreibung ganzer Studien (z.B. Laufzeit, Indikation, Typ, Phase, Studienleiter) kann es auch sinnvoll sein, Informationen über die Daten bereitzustellen, die während der Studie erfasst werden sollen. Natürlich spielt hierbei die Geheimhaltung eine weitaus größere Rolle als bei den vorherigen Beispielen. Das Semantic Web erfordert aber auch nicht, dass alle Daten allen zur Verfügung gestellt werden. Sie sind auch dann nutzbar, wenn nur innerhalb einer Institution auf sie zugegriffen werden kann.

Semantisch annotierte SOPs
SOPs besitzen meist eine Grundstruktur, klar definierte Zielgruppen und Anwendungsfälle. Über Annotationen kann die Erreichbarkeit und Bekanntmachung von SOPs verbessert werden. Zielgruppengerichtete Information über Neuerungen Anwendungsfallbezogene Suche in SOP-Systemen Integration direkt in die Arbeitsumgebung Für die Annotation von SOPs bieten sich (selbstdefinierte) Microformats oder RDF/A an. Dies setzt aber voraus, dass der Erstellungsprozess der SOPs von geeigneten Werkzeugen unterstützt wird. Zu dieser Unterstützung gehört bspw. eine fest vorgegebene Grundstruktur der SOPs im Editor, die Erfassung von Metadaten zur SOP und darauf aufbauend eine semi-automatische Auszeichnung bestimmter Begriffe oder Abschnitte.

Semantische Wörterbücher
Wörterbücher dienen dazu, die vielschichtigen Begrifflichkeiten in der Medizin klarer zu fassen und Missverständnisse zu vermeiden. Eine semantische Beschreibung von Wörterbucheinträgen hilft, Begriffe und ihre Bedeutungen im richtigen Kontext zu gebrauchen. In Verbindung mit annotierten SOPs liefern sie die korrekten Begriffe beim Nachschlagen. Bei Studienregistern sorgen sie für eine präzise Interpretation von Studieneigenschaften (z. B. beim Begriff der „Remission“) Dieses Beispiel zeigt, wie sich ein Mehrgewinn einstellt, wenn man mehrere „Semantic Web enabled“-Applikationen hat. Die vom Wörterbuch bereitgestellten Beschreibungen in RDF lassen sich unmittelbar in mehrere andere Applikationen integrieren. Separate Schnittstellen sind in diesem Fall nicht nötig.

Medizinische Ontologien
Eine Grundlage für die Beschreibung medizinischer Sachverhalte sind Vokabulare, Terminologien und Klassifikationen. ICD-10, SNOMED, MeSH, UMLS, GALEN Das National Cancer Institute (NCI) stellt mit ihren Enterprise Vocabulary Services ein umfangreiches Vokabular für die Onkologie bereit. Wem das alles zu schwergewichtig ist, der kann sich natürlich auch seine eigene Ontologie erstellen. Die Interoperabilität wird durch Mappings gewährleistet. Mit Hilfe bereits existierender Klassifikationssysteme wird die Interoperabilität mit anderen Informationsverarbeitenden Systemen in der Medizin ermöglicht (aus genau diesem Grund wurden die Klassifikationen schließlich entwickelt). Allerdings sind die erwähnten großen Systeme auch nicht ohne Fehler und Ungenauigkeiten. Für den eigenen Anwendungsfall können sie deshalb modifiziert und an die jeweiligen Erfordernisse angepasst werden. Beim Zusammenspiel mit anderen Ontologien einigt man sich dann entweder auf den kleinsten gemeinsamen Nenner (meist einhergehend mit hohem Informationsverlust) oder entwickelt ein Mapping (geringer Informationsverlust)

Ausblick Das Semantic Web steckt noch in seinen Kinderschuhen
Noch stehen nicht alle benötigten Bausteine zur Verfügung Die Praxistauglichkeit mancher Ideen muss sich erst zeigen Medizinische Anwendungsgebiete stehen explizit im Fokus der Forschung rund um das Semantic Web Eine ergiebige Domäne mit breitem Anwendungsspektrum und einer Vielzahl von Profiteuren (Ärzte, Patienten, Wissenschaftler, Controller) Das Semantic Web wird allmählich seinen Nutzen zeigen Mitmachen ist gefragt, sonst droht das Henne-Ei-Problem Gerade die Medizin stellt in Hinblick auf Sicherheit und Vertrauenswürdigkeit hohe Anforderungen an jedes informationsverarbeitende System. Das Semantic Web hat hier noch einiges nachzuholen. Signaturen und Verschlüsselung von XML-Daten müssen die Integrität von Informationen bewahren. Zugriffsrechte auf RDF-Graphen müssen den Datenschutz sicherstellen. Die Schlussfolgerung impliziten Wissens muss korrekt und vor allem nachvollziehbar erfolgen. Bis dahin sollte man sich auf unkritische Anwendungsbereiche beschränken.

Zusammenfassung Das Semantic Web macht Wissen im World Wide Web für Maschinen verständlich und nutzbar. Es ist eine Ergänzung des bestehenden Web, die weitgehend unsichtbar für den Menschen mit Daten operiert. Die Daten stammen entweder aus Datenbanken oder aus semantisch ausgezeichneten Webdokumenten. Die Infrastruktur und Grundbausteine des WWW werden genutzt: URI, Unicode, XML Auf ihnen setzen die Sprachen des Semantic Web auf

Zusammenfassung RDF zur Beschreibung von Dingen im Semantic Web
Statements (Subject, Property, Value) bilden RDF-Graphen OWL zur Beschreibung von Vokabularen oder Ontologien Definition von Klassen, ihren Eigenschaften und Beziehungen Unerlässlich für das Schlussfolgern impliziten Wissens SPARQL zur Abfrage von RDF-Stores Das „SQL für das Semantic Web“ Regeln, Logik, Beweisen, Signatur und Verschlüsselung werden in der Zukunft ein vertrauensürdiges SW erlauben

Zusammenfassung Aktuelle Anwendungsgebiete des Semantic Web
RSS für Nachrichten-Schlagzeilen FOAF als Visitenkarte GRDDL, Microformats und RDF/A für semantisches Markup von Webdokumenten Im medizinischen Umfeld ist die Nutzung des Semantic Webs für Studienregister, SOPs oder Wörterbücher vorstellbar Neue Anwendungsfälle benötigen nur ein wenig Phantasie – und der sind keine Grenzen gesetzt!

Kontakt Roland Mücke Institut für Medizinische Informatik, Statistik und Epidemiologie (IMISE) Universität Leipzig Härtelstraße Leipzig Tel.:

Vernetzte Forschung in der Medizin

Ähnliche Präsentationen

Präsentation zum Thema: "Vernetzte Forschung in der Medizin"— Präsentation transkript:

Ähnliche Präsentationen

Über Projekt

Feedback

Anmelden

Anmeldung über soziales Netzwerk:

Vernetzte Forschung in der Medizin

Ähnliche Präsentationen

Präsentation zum Thema: "Vernetzte Forschung in der Medizin"— Präsentation transkript:

Ähnliche Präsentationen

Über Projekt

Feedback