MareThes Ein standardisierter Thesaurus für marine Anwendungen

Slides:



Advertisements
Ähnliche Präsentationen
Ebru Iscan, Andrea Kováčová Experimente Seminar "Experimentielle Evaluierung im IR"
Advertisements

Technischer Systemüberblick
Natascha Schumann TU Darmstadt IuK-Konferenz, März 2003
Die Bestandteile des Semantic Web. Sematic Web soll das WWW erweitern und nicht neuerfinden Informationen sollen Maschinenlesbar sein Schemata beschreiben.
Access 2000 Datenbanken.
Fortgeschrittene Methoden der Wissensorganisation
Zukunft des Webs? Dennis Beer Christian Blinde
Der Supermarkt: Eine beispielhafte Erklärung für die fünf untersten Schichten des Semantic Web Protocol Stack Nicola Henze.
Arbeitsstand und Arbeitsbedarf Bibliotheken
RDF Resource Description Framework
Semantic Web-Anwendungen auf Basis des BAM-Portals Ein Prototyp Volker Conradt.
Aichinger Christian, Strasser Jürgen. Inhalt JSF EJB Praxis - Integration.
Architekturen und Techniken für computergestützte Engineering Workbenches.
Wird ganz am Anfang der HTML-Datei geschrieben Doctype html public bedeutet, dass man sich auf die Öffentlichkeit der html-dtd bezieht Html ist die meist.
Sesame Florian Mayrhuber
Management- und Web Services- Architekturen
Oliver Spritzendorfer Thomas Fekete
Zauberwort Metadaten Elementares Handwerkszeug des Content- und Wissensmanagement.
XML (Extensible Markup Language)
GEMET – Thesaurus in der WSV
Integration existierender digitaler Bibliotheken in Lernumgebungen LEBONED (Learning Environment Based On Non Educational Digital Libraries) Dipl.-Inform.
Die Publikations- datenbank des AIT Karl Riedling.
Technische Kommunikation, Zusammenarbeit und Kommentierung mit RxView|RxHighlight.
Dublin Core IT-Zertifikat Daten- und Metadatenstandards.
->Prinzip ->Systeme ->Peer – to – Peer
„Wenn du den Fluss Halys überschreitest, wirst du
Linked Open Europeana: Das Europeana Data Model (EDM) Prof. Dr. Stefan Gradmann Unter Rückgriff auf M. Doerr, S. Hennicke, A. Isaac, C. Meghini, G. Schreiber,
Semantic Web.
IT-Zertifikat der Phil.Fak Kurs 4: Daten- und Metadatenstandards Patrick Sahle Semantic WebWS 08/09.
1 Wolfgang Wiese, Regionales RechenZentrum Erlangen WCMS 3. August 2000 Wolfgang Wiese RRZE / Lehrstuhl für Informatik VII
Web Services Spezielle Methoden der SWT Liste V – WS 2008/2009 Christian Boryczewski.
HYPERLINK WAS IST DAS WEB 2.0? SEMANTIC WEB.
Technische Universität München, Informatik XI Angewandte Informatik / Kooperative Systeme Verteilte Anwendungen: Web Services Dr. Wolfgang Wörndl
© 2008 TravelTainment The Amadeus Leisure Group Webanwendungen mit Java - HttpServlets 17.Dezember 2010 Sebastian Olscher Erstprüfer: Hon.-Prof. Dr. H.
PHPUG Karlsruhe 1. Juli 2009 Zend_ProgressBar und Zend_Tag_Cloud Ben Scholzen Software Entwickler DASPRiD's.
MarThes – Standardisierter Thesaurus mariner Begriffe
CMIP6-DICAD – FU Berlin Thomas Schartner
Module und Modularisierung
Datenaustausch und Interoperabilität
Robert Stephan:. PND Beacon. Verknüpfung von
(Bundesamt für Seeschifffahrt und Hydrographie)
Abschlusspräsentation Tobias Vogel
Web-Interface for Multi-FPGA Board Pamette
Daten Management in COSYNA
Das IT - Informationssystem
MarThes – Standardisierter Thesaurus mariner Begriffe
Metadaten als Grundlage der MDI-DE
Neue Entwicklungen im GeoPortal.rlp
UB - Wiki Nutzung von Wiki-Systemen in der Universitätsbibliothek Rostock März 2006 UB / Abt. IuK /
SOA-basierter Küstengazetteer als Teil der MDI-DE
Informationswirtschaft Wirtschaftsinformatik (Bachelor, 6. Semester)
Lifecycle-Management von Websites
Prof. Dr.-Ing. Franz-Josef Behr Geodaten und Datenmodell
Universität zu Köln | Hauptseminar Annotationssysteme
Einführung des Forschungsinformationssystems Pure an der CAU Kiel
Geschichte des Internets
Virtualisierung von Web-Applikationen mit Docker
Gewachsene Architektur Das kann nicht funktionieren!
1.
Wir haben doch XML, wozu RDF?
Konzepte von Terminologie-Datenbanken
Seminarphase PG 402 Thema: Semantic Web Autor: Phillip Look
Von Wietlisbach, Lenzin und Winter
Da·ten·bank /Dátenbank/ Substantiv, feminin [die]
Das IT – Informationssystem
Vergleich von Terminologie-Datenbanksystemen
Vom Feld zur Cloud eine kollaborative Online-Plattform zur Verwaltung hydrologischer Observatorien Philipp Kraft, David Windhorst, Lutz Breuer.
Fortgeschrittene Methoden der Wissensorganisation
Dies ist ein wissenschaftliches Poster – Im Format DIN A0 hoch.
„Abfrage heterogener Ressourcen durch Mediatoren“
 Präsentation transkript:

MareThes Ein standardisierter Thesaurus für marine Anwendungen

Vorstellung der vorhandenen Wortlisten Inhalt Einleitung Vorstellung der vorhandenen Wortlisten Technische Grundlagen (SKOS und iQvoc) Konzeption der Implementierung zur Konvertierung der Wortlisten Anwendung CSV2SKOS Zusammenfassung und Ausblick

Einleitung - Wortlisten: Sinn, Zweck, Defizite - „Gedanken ohne Inhalt sind leer, Anschauungen ohne Begriffe sind blind.“ Immanuel Kant: Kritik der reinen Vernunft, 1781 Begriffe ohne Erklärung sind leer, Erklärungen ohne Begriffe sind schwer. Peter Korduan: geändert nach Kant, 1996 Wir brauchen Begriffe, deren Bedeutung und die Zusammenhänge, in Wissenschaft und Verwaltung zum Beschreiben und Wiederfinden von Daten, Modellen und Prozessen

Ausgewählte marine Wortlisten Stichwortverzeichnis Küste (KFKI) Eine Excel-Tabelle Ein Datenblatt Deutsche und englische Begriffe Teilweise fehlende englische Begriffe Teilweise Verweise im Text

NOKIS Wortliste 2008 Eine Excel-Tabelle Quellen in extra Datenblatt Deutsche und englische Begriffe Teilweise Beschreibungen in deutsch und englisch Mehrere Quellenangaben in verschiedenen Spalten Verweise auf Standards

Schlagwortkatalog des Systems LANIS Habitat Mare (LHM) Ausgereifter Thesaurus Liegt in Datenbank vor Export in mehrere Excel-Tabellen 5 Hierarchieebenen Eindeutigkeit durch ID‘s Deutscher und mehrere englische und wissenschaftliche Begriffe mehrere Synonyme Sehr detailliert und vollständig

Beziehungen zwischen Begriffen Exakte Übereinstimmung (exact match) Küste => Küste Ungefähre Übereinstimmung (close match) Gewöhnliches Seegras => Echtes Seegras Überbegriff (broad match) Algen => Rotalgen Unterbegriff (narrow match) Seekabel => Nutzungen In Verbindung stehend (related match) Abrasion => Abbruchserscheinungen

Linked-Data Konzept nach Tim Berners-Lee Verwende URIs als Namen für Dinge. Verwende HTTP URIs, damit die Leute diese Namen nachschlagen können. Wenn jemand einen Namen nachschlägt, biete nützliche Information und verwende dabei die Standards (RDF, SPARQL). Biete von dort auch Links auf andere URIs, damit wir mehr Dinge entdecken können. Verlinkung vom marinen Thesaurus zu anderen bestehenden Thesauren z.B. Umthes, GEMET, AgroVoc

Technische Grundlagen iQvoc der Firma innoQ Vokabularmanagement auf Basis von Ruby und Rails Besteht aus Server und Clientkomponente nutzt Model-View-Controler (MVC) Konzept Daten gespeichert in PostgreSQL-Datenbank (auf MDI-DE Server) nutzt für die Client-Seite jQuery (JavaScript Framework) Benutzeroberfläche mehrsprachig Konzepte mit Tree view, Kollektionen, Suche, Sprachauswahl Administratoroberfläche Dashboard, Benutzer, Konfiguration Editierung mit Redaktionssystem (Sperrung, Versionierung, Status, Konsistenzprüfung) Export (RDF/Turtle, RDF/XML) und Import (RDF/Turtle) SKOS kompatibel REST Schnittstelle OpenSource Semantic Web Standards

Technische Grundlagen - SKOS - SKOS steht für Simple Knowledge Organisation System formale Sprache auf Basis von RDF (Resource Description Framework) Wortlisten im SKOS Format können SKOS Management Werkzeugen wie TopBraid Enterprise Vocabulary Net oder iQvoc übergeben werden, um Sie zu visualisieren (z.B. in einer hierarchischen Ansicht) und zu pflegen <?xml version="1.0" encoding="UTF-8"?> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:skos="http://www.w3.org/2004/02/skos/core#" xmlns="http://139.30.111.16/" xmlns:schema="http://139.30.111.16/schema#"> <rdf:Description rdf:about="http://139.30.111.16/#Abbruchkante"> <rdf:type rdf:resource="http://www.w3.org/2004/02/skos/core#Concept"/> <skos:prefLabel xml:lang="de">Abbruchkante</skos:prefLabel> <skos:prefLabel xml:lang="en">escarpment</skos:prefLabel> <skos:altLabel xml:lang="en">scarp</skos:altLabel> <skos:definition xml:lang="de">leider keine deutsche Definition</skos:definition> <skos:definition xml:lang="en">A more or less continuous line of cliffs or steep... </skos:definition> </rdf:Description> </rdf:RDF>

Implementierungskonzeption - Konvertierung von Wortlisten mit Java (1) - Verwendung der freien Java Bibliothek CSVReader, die CSV Dateien zeilenweise basierend auf den Spaltenüberschriften ausliest Einzige Voraussetzung: Spalten in Excel müssen Überschriften haben Zuordnung der Spalten zu SKOS Elementen (z.B. skos:prefLabel, skos:definition usw) erfolgt über eine grafische Benutzer- oberfläche Erzeugung eines RDF XML Dokuments mit JDOM (Java Document Object Model)

Implementierungskonzeption - Konvertierung von Wortlisten mit Java (2) - Füllung des Dokuments mit einem SKOS Konzept Element für jeweils jeden Term der Wortliste Optionale Suchmöglichkeiten: spezifischere Begriffe, z.B. Strandabschnitt -> broader -> Strand Vorkommen eines Begriffes in anderen Ontologien => skos:closeMatch Beziehungsangaben „s.“ und „s.a.“ z.B. Abrasion => related => Abbruchserscheinungen - Suche nach Begriffen, die genauso beginnen und setzen einer Beziehung (skos:narrower bzw. skos:broader) dorthin (z.B. Strandabschnitt -> skos:broader -> Strand) - Suche nach Beziehungen zu anderen Ontologien (im Moment UmThes und GEMET) und setzen eines skos:closeMatch zu den Ergebnissen - Suche nach den Beziehungsangaben „s.“ und „s.a.“ und setzen einer skos:related Beziehung (speziell für die KFKI Küsten Wortliste)

Vorführung der Anwendung. CSV2SKOS Vorführung der Anwendung.

Verbesserung des marinen Vokabulars Ausblick Verbesserung des marinen Vokabulars durch Abgleich mit anderen Thesauri durch weitere webgestützte und verteilte redaktionelle Arbeit Einbindung der Wortlisten zur Verschlagwortung in Metainformationssystemen Suche im Portal der MDI-DE Suche nach Metadaten Verknüpfung zum marinen Gazetteer Einsatz des marinen Vokabulars im Linked-Data Netz

Erweiterung Suchanfragen Format JSON in search_result_controller.rb und View für JSON-Ausgabe http://139.30.111.16/de/search.json?l[]=de&t=labeling-skos-base&qt=begins_with&q=Abw

Offene Fragen Wo werden die Quellenangaben zu den Begriffen und Definitionen im iQvoc hinterlegt? Welche Begriffe übernimmt man von oder gibt an andere Thesauri? Auto-Matches? Pluralisierung, Substantivierung Bsp: Pflanzenart/Pflanzenarten, diskretisiert/Diskretisierung Spatial Matches für Gazetteers (SKOS) Wieviele unscharfe Beziehungen? Non - Prefered Language? verschiedene Hierarchien in einem Thesaurus Wer editiert? Wie offen ist die Ontologie? Trotz vieler offener Fragen, ist es gelungen in der Infrastruktur der MDI-DE ein Werkzeug einzurichten, welches die Zusammenarbeit im Bereich der Thesauren fördert.

Vielen Dank für die Aufmerksamkeit peter. korduan@uni-rostock Vielen Dank für die Aufmerksamkeit peter.korduan@uni-rostock.de christian.rueh@uni-rostock.de

LHM

LHM - Beispielbegriff „Anthozoa“ -

Küste (KFKI)

NOKIS

NOKIS - Beziehungen - allgemeinere bzw. spezifischere Begriffe Begriff auch in GEMET und Umthes

NOKIS - Abbildung von Quellen - Abbildung von Quellen z. Zt. über redaktionelle Anmerkungen