MarThes – Standardisierter Thesaurus mariner Begriffe Peter Korduan (Universität Rostock) Tillmann Lübker (Bundesamt für Naturschutz) 1
Gliederung Ausgangssituation Konzept der Konzepte Beziehungen iQVoc und Konvertierung der Wortlisten Meeresökologischer Fachthesaurus Aufbau und Inhalte Anwendungsfälle Problemfälle
in Wissenschaft und Verwaltung zum Beschreiben und Wiederfinden „Gedanken ohne Inhalt sind leer, Anschauungen ohne Begriffe sind blind.“ Immanuel Kant: Kritik der reinen Vernunft, 1781 Begriffe ohne Erklärung sind leer, Erklärungen ohne Begriffe sind schwer. Peter Korduan: geändert nach Kant, 1996 Wir brauchen Begriffe, deren Bedeutung und die Zusammenhänge, in Wissenschaft und Verwaltung zum Beschreiben und Wiederfinden von Daten, Modellen und Prozessen
Stichwortverzeichnis Küste (KFKI) Eine Excel-Tabelle Ein Datenblatt Deutsche und englische Begriffe Teilweise fehlende englische Begriffe Teilweise Verweise im Text
NOKIS Wortliste 2008 Teilweise Beschreibungen in deutsch und englisch Eine Excel-Tabelle Quellen in extra Datenblatt Deutsche und englische Begriffe Teilweise Beschreibungen in deutsch und englisch Mehrere Quellenangaben in verschiedenen Spalten Verweise auf Standards
Schlagwortkatalog des meeresökologischen Thesaurus Ausgereifter Fachthesaurus Liegt in Datenbank vor Export in mehrere Excel-Tabellen 5 Hierarchieebenen Eindeutigkeit durch ID‘s Deutscher und mehrere englische und wissenschaftliche Begriffe mehrere Synonyme Sehr detailliert und vollständig
Linked-Data Konzept nach Tim Berners-Lee Verwende URIs als Namen für Dinge. Verwende HTTP URIs, damit die Leute diese Namen nachschlagen können. Wenn jemand einen Namen nachschlägt, biete nützliche Information und verwende dabei die Standards (RDF, SPARQL). Biete von dort auch Links auf andere URIs, damit wir mehr Dinge entdecken können. Begriffe werden zu Konzepten! Direkte Verlinkung vom marinen Thesaurus zu anderen bestehenden Thesauren! z.B. Umthes, GEMET, AgroVoc
Beziehungen zwischen Begriffen Exakte Übereinstimmung (exact match) Küste => Küste Ungefähre Übereinstimmung (close match) Gewöhnliches Seegras => Echtes Seegras Überbegriff (broad match) Algen => Rotalgen Unterbegriff (narrow match) Seekabel => Nutzungen In Verbindung stehend (related match) Abrasion => Abbruchserscheinungen
Technische Grundlagen iQvoc der Firma innoQ Vokabularmanagement auf Basis von Ruby on Rails Besteht aus Server und Clientkomponente nutzt Model-View-Controler (MVC) Konzept PostgreSQL und jQuery Mehrsprachige Benutzeroberfläche Tree view, Kollektionen, Suche, Sprachauswahl Administratoroberfläche Dashboard, Benutzer, Konfiguration Redaktionssystem (Sperrung, Versionierung, Status, Konsistenzprüfung) Export (RDF/Turtle, RDF/XML) und Import (RDF/Turtle) SKOS kompatibel REST Schnittstelle OpenSource Semantic Web Standards
Konvertierung der Wortlisten in SKOS (N-Tripple) Verwendung der freien Java Bibliothek CSVReader, die CSV-Dateien zeilenweise basierend auf den Spaltenüberschriften ausliest Zuordnung der Spalten zu SKOS-Elementen (z.B. skos:prefLabel, skos:definition usw) über eine grafische Benutzeroberfläche Optionale Suchmöglichkeiten: spezifischere Begriffe, z.B. Strandabschnitt -> broader -> Strand Vorkommen eines Begriffes in anderen Ontologien => skos:closeMatch Beziehungsangaben „s.“ und „s.a.“ z.B. Abrasion => related => Abbruchserscheinungen
Umsetzung (Hierarchien des meeresökologischen Thesaurus)
MareThes Oberfläche http://139.30.111.16/marethes allgemeinere bzw. spezifischere Begriffe Begriff auch in GEMET und Umthes Prof. Ralf Bill MDI-DE UNIVERSITÄT ROSTOCK, PROFESSUR FÜR GEODÄSIE UND GEOINFORMATIK
Client zum Suchen http://139.30.111.16/marethes//marethes_client.html Wortvorschlag Ergebnisliste Detailanzeige Rohformat http://139.30.111.16/marethes//marethes_client.html
Nutzung des meeresökologischen Fachthesaurus im BfN
Nutzung des meeresökologischen Fachthesaurus im BfN (I) Aufbau und Inhalte Mikrothesaurus für den Bereich Meeresnaturschutz Gliederung / Hierarchie ca. 2.600 Begriffe, ca. 3.200 Synonyme 2007 über Werkverträge erstellt Technische Umsetzung Zunächst: Excel-Dateien Dann: Umsetzung in RDBMS Und nun: Integration in iQvoc Stand der Realisierung Prototypisch in iQvoc umgesetzt (Uni Rostock) Integration in GDI-BfN wird derzeit realisiert
Nutzung des meeresökologischen Fachthesaurus im BfN (II) 4 Anwendungsfälle Aktualisierung und Pflege des Wortgutes Bereitstellung intern und extern Erfassung von Metadaten Suche nach Daten
Nutzung des meeresökologischen Fachthesaurus im BfN (III) Anwendungsfall 1: Aktualisierung und Pflege des Wortgutes via iQvoc-Instanz iQvoc-Editor (Redaktionssystem) Nutzung weiterer Thesauri? JA Abgleich mit anderen fachlichen Bereichen Verlinkung auf Referenzen / Matches (‚close match‘ / ‚exact match‘) => UMTHES (UBA) + GEMET (EEA)
ENTWURF Nutzung des meeresökologischen Fachthesaurus im BfN (IV) Anwendungsfall 2: Bereitstellung intern und extern via BfN-Internetauftritt Einfache, benutzerfreundliche Bereitstellung für Endanwender Öffentlichkeit, eigene Mitarbeiter via iQvoc-Instanz Bereitstellung für Experten Schnittstellen nach SKOS (RDF) Nutzung weiterer Thesauri? NEIN ENTWURF
Nutzung des meeresökologischen Fachthesaurus im BfN (V) Anwendungsfall 3: Erfassung von Metadaten via Metadateninformationssystem Verwendung des Thesaurus im BfN-MIS Terra Catalogue (con terra) Nutzung weiterer Thesauri? JA Zugriff für die Verschlagwortung => v.a. GEMET (EEA)
Nutzung des meeresökologischen Fachthesaurus im BfN (VI) Anwendungsfall 4: Suche nach Daten a) Säugetier via Darstellungskomponente a) Einfache Suche: Direkt aus der Darstellungskomponente (WebGIS) b) Erweiterte Suche: Metadatenkatalog Nutzung weiterer Thesauri? JA Für die übergreifende Suche „Föderation“ vs. „Akkordeon“ => UMTHES (UBA) + GEMET (EEA) b) http://bfn.de/habitatmare-thesaurus/saeugetiere @Säugetiere
Nutzung des meeresökologischen Fachthesaurus im BfN (VII) Problemfall: Parallele Nutzung verschiedener Thesauri Begriff kann je nach Kontext unterschiedliche Bedeutungen haben: Daher: Eineindeutige Zuordnung – bei Verschlagwortung Kontext und Bezeichner {http://www.bfn.de/habitatmare-thesaurus/abundanz}@{Abundanz} Aber: Kontext-spezifische Suche führt zu nicht-Match! Säugetiere@BfN ≠ Säugetier@UMTHES ≠ Säugetier@GEMET Lösungsansatz: Speicherung von Kontext und Bezeichner, Zerlegung bei Suche ≠
Herzlichen Dank für Ihr Interesse! Fragen? Peter Korduan (Uni Rostock) und Tillmann Lübker (BfN) 22