Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

MareThes Ein standardisierter Thesaurus für marine Anwendungen

Ähnliche Präsentationen


Präsentation zum Thema: "MareThes Ein standardisierter Thesaurus für marine Anwendungen"—  Präsentation transkript:

1 MareThes Ein standardisierter Thesaurus für marine Anwendungen

2 Vorstellung der vorhandenen Wortlisten
Inhalt Einleitung Vorstellung der vorhandenen Wortlisten Technische Grundlagen (SKOS und iQvoc) Konzeption der Implementierung zur Konvertierung der Wortlisten Anwendung CSV2SKOS Zusammenfassung und Ausblick

3 Einleitung - Wortlisten: Sinn, Zweck, Defizite -
„Gedanken ohne Inhalt sind leer, Anschauungen ohne Begriffe sind blind.“ Immanuel Kant: Kritik der reinen Vernunft, 1781 Begriffe ohne Erklärung sind leer, Erklärungen ohne Begriffe sind schwer. Peter Korduan: geändert nach Kant, 1996 Wir brauchen Begriffe, deren Bedeutung und die Zusammenhänge, in Wissenschaft und Verwaltung zum Beschreiben und Wiederfinden von Daten, Modellen und Prozessen

4 Ausgewählte marine Wortlisten
Stichwortverzeichnis Küste (KFKI) Eine Excel-Tabelle Ein Datenblatt Deutsche und englische Begriffe Teilweise fehlende englische Begriffe Teilweise Verweise im Text

5 NOKIS Wortliste 2008 Eine Excel-Tabelle
Quellen in extra Datenblatt Deutsche und englische Begriffe Teilweise Beschreibungen in deutsch und englisch Mehrere Quellenangaben in verschiedenen Spalten Verweise auf Standards

6 Schlagwortkatalog des Systems LANIS Habitat Mare (LHM)
Ausgereifter Thesaurus Liegt in Datenbank vor Export in mehrere Excel-Tabellen 5 Hierarchieebenen Eindeutigkeit durch ID‘s Deutscher und mehrere englische und wissenschaftliche Begriffe mehrere Synonyme Sehr detailliert und vollständig

7 Beziehungen zwischen Begriffen
Exakte Übereinstimmung (exact match) Küste => Küste Ungefähre Übereinstimmung (close match) Gewöhnliches Seegras => Echtes Seegras Überbegriff (broad match) Algen => Rotalgen Unterbegriff (narrow match) Seekabel => Nutzungen In Verbindung stehend (related match) Abrasion => Abbruchserscheinungen

8 Linked-Data Konzept nach Tim Berners-Lee
Verwende URIs als Namen für Dinge. Verwende HTTP URIs, damit die Leute diese Namen nachschlagen können. Wenn jemand einen Namen nachschlägt, biete nützliche Information und verwende dabei die Standards (RDF, SPARQL). Biete von dort auch Links auf andere URIs, damit wir mehr Dinge entdecken können. Verlinkung vom marinen Thesaurus zu anderen bestehenden Thesauren z.B. Umthes, GEMET, AgroVoc

9 Technische Grundlagen iQvoc der Firma innoQ
Vokabularmanagement auf Basis von Ruby und Rails Besteht aus Server und Clientkomponente nutzt Model-View-Controler (MVC) Konzept Daten gespeichert in PostgreSQL-Datenbank (auf MDI-DE Server) nutzt für die Client-Seite jQuery (JavaScript Framework) Benutzeroberfläche mehrsprachig Konzepte mit Tree view, Kollektionen, Suche, Sprachauswahl Administratoroberfläche Dashboard, Benutzer, Konfiguration Editierung mit Redaktionssystem (Sperrung, Versionierung, Status, Konsistenzprüfung) Export (RDF/Turtle, RDF/XML) und Import (RDF/Turtle) SKOS kompatibel REST Schnittstelle OpenSource Semantic Web Standards

10 Technische Grundlagen - SKOS -
SKOS steht für Simple Knowledge Organisation System formale Sprache auf Basis von RDF (Resource Description Framework) Wortlisten im SKOS Format können SKOS Management Werkzeugen wie TopBraid Enterprise Vocabulary Net oder iQvoc übergeben werden, um Sie zu visualisieren (z.B. in einer hierarchischen Ansicht) und zu pflegen <?xml version="1.0" encoding="UTF-8"?> <rdf:RDF xmlns:rdf=" xmlns:skos=" xmlns=" xmlns:schema=" <rdf:Description rdf:about=" <rdf:type rdf:resource=" <skos:prefLabel xml:lang="de">Abbruchkante</skos:prefLabel> <skos:prefLabel xml:lang="en">escarpment</skos:prefLabel> <skos:altLabel xml:lang="en">scarp</skos:altLabel> <skos:definition xml:lang="de">leider keine deutsche Definition</skos:definition> <skos:definition xml:lang="en">A more or less continuous line of cliffs or steep... </skos:definition> </rdf:Description> </rdf:RDF>

11 Implementierungskonzeption - Konvertierung von Wortlisten mit Java (1) -
Verwendung der freien Java Bibliothek CSVReader, die CSV Dateien zeilenweise basierend auf den Spaltenüberschriften ausliest Einzige Voraussetzung: Spalten in Excel müssen Überschriften haben Zuordnung der Spalten zu SKOS Elementen (z.B. skos:prefLabel, skos:definition usw) erfolgt über eine grafische Benutzer- oberfläche Erzeugung eines RDF XML Dokuments mit JDOM (Java Document Object Model)

12 Implementierungskonzeption - Konvertierung von Wortlisten mit Java (2) -
Füllung des Dokuments mit einem SKOS Konzept Element für jeweils jeden Term der Wortliste Optionale Suchmöglichkeiten: spezifischere Begriffe, z.B. Strandabschnitt -> broader -> Strand Vorkommen eines Begriffes in anderen Ontologien => skos:closeMatch Beziehungsangaben „s.“ und „s.a.“ z.B. Abrasion => related => Abbruchserscheinungen - Suche nach Begriffen, die genauso beginnen und setzen einer Beziehung (skos:narrower bzw. skos:broader) dorthin (z.B. Strandabschnitt -> skos:broader -> Strand) - Suche nach Beziehungen zu anderen Ontologien (im Moment UmThes und GEMET) und setzen eines skos:closeMatch zu den Ergebnissen - Suche nach den Beziehungsangaben „s.“ und „s.a.“ und setzen einer skos:related Beziehung (speziell für die KFKI Küsten Wortliste)

13 Vorführung der Anwendung.
CSV2SKOS Vorführung der Anwendung.

14 Verbesserung des marinen Vokabulars
Ausblick Verbesserung des marinen Vokabulars durch Abgleich mit anderen Thesauri durch weitere webgestützte und verteilte redaktionelle Arbeit Einbindung der Wortlisten zur Verschlagwortung in Metainformationssystemen Suche im Portal der MDI-DE Suche nach Metadaten Verknüpfung zum marinen Gazetteer Einsatz des marinen Vokabulars im Linked-Data Netz

15 Erweiterung Suchanfragen
Format JSON in search_result_controller.rb und View für JSON-Ausgabe

16 Offene Fragen Wo werden die Quellenangaben zu den Begriffen und Definitionen im iQvoc hinterlegt? Welche Begriffe übernimmt man von oder gibt an andere Thesauri? Auto-Matches? Pluralisierung, Substantivierung Bsp: Pflanzenart/Pflanzenarten, diskretisiert/Diskretisierung Spatial Matches für Gazetteers (SKOS) Wieviele unscharfe Beziehungen? Non - Prefered Language? verschiedene Hierarchien in einem Thesaurus Wer editiert? Wie offen ist die Ontologie? Trotz vieler offener Fragen, ist es gelungen in der Infrastruktur der MDI-DE ein Werkzeug einzurichten, welches die Zusammenarbeit im Bereich der Thesauren fördert.

17 Vielen Dank für die Aufmerksamkeit peter. korduan@uni-rostock
Vielen Dank für die Aufmerksamkeit

18 LHM

19 LHM - Beispielbegriff „Anthozoa“ -

20 Küste (KFKI)

21 NOKIS

22 NOKIS - Beziehungen - allgemeinere bzw. spezifischere Begriffe
Begriff auch in GEMET und Umthes

23 NOKIS - Abbildung von Quellen -
Abbildung von Quellen z. Zt. über redaktionelle Anmerkungen


Herunterladen ppt "MareThes Ein standardisierter Thesaurus für marine Anwendungen"

Ähnliche Präsentationen


Google-Anzeigen