Einsatz eines Thesaurus

Slides:



Advertisements
Ähnliche Präsentationen
Externe Referenzen in ODS Am Beispiel von VSIM 27.Oktober
Advertisements

WWW World Wide Web.
GESIS Bernd Hermes, Heiko Hellweg, Dr. Maximilian Stempfhuber Informationszentrum Sozialwissenschaften, Bonn Unterstützung kooperativer Verfahren beim.
Aufbau des Internets Überblick Prof. Dr. T. Hildebrandt
eLab-Aufbau und Funktionsweise aus technischer Sicht
Basis-Architekturen für Web-Anwendungen
Authentifizierung, Autorisierung und Rechteverwaltung Einsatz und Funktion des Rechteservers 2. Shibboleth-Workshop Freiburg, 23. März 2006 Gerald Schupfner,
Vorstellung von PaderWAVE Generierung von Web-Anwendungen aus visuellen Spezifikationen, SS04 Projektgruppe der AG Kastens.
Erweiterung B2B Usermanagement / LDAP-Anbindung
NATURAL Web-Integration 1 / 27/28-Feb-98 TST NATURAL Web-Integration Arbeitskreis NATURAL Süd Theo Straeten SAG Systemhaus GmbH Technologieberater Stuttgart.
Seminar: XML für Fortgeschrittene Referent: Katrin Apel
Daniel Höfler Markus Thurner XMLApplicationPlatform Siemens OpenStage 60/80.
Stefanie Selzer - Pascal Busch - Michael Kropiwoda
Colibi Bibliothekssystem der Computerlinguistik. Einführung Motivation Was braucht Colibi? Software Datenbankdesign.
ATHOS Benutzertreffen 12. November Auswerteserver Glashütten, 12. November 2008 HighQSoft GmbH, Andreas Hofmann
ATHOS Benutzertreffen 27.September Report of the Lab Glashütten, 27.September 2007 HighQSoft GmbH, Karst Schaap
AGXIS – Ein Konzept für eine generische Schnittstellenbeschreibung Dr.-Ing. Ulrich Hussels, RISA GmbH 07. Juni 2005 Workshop Umweltdatenbanken 2005.
XINDICE The Apache XML Project Name: Jacqueline Langhorst
Datenbankentwurf mit Hilfe des ER-Modells entwickeln
Christian Kästner Modellgetriebene Softwareentwicklung Eclipse Modelling Framework.
Technik Gestaltung Navigation Daten. Übersicht Client Webbrowser InternetServer.
PKJ 2005/1 Stefan Dissmann Zusammenfassung Bisher im Kurs erarbeitete Konzepte(1): Umgang mit einfachen Datentypen Umgang mit Feldern Umgang mit Referenzen.
JAVA RMI.
Schulen ans Netz Oberhausener Moderatoren
Datenmodellierung - Aufbau einer Datenbank -
Zukunft des Webs? Dennis Beer Christian Blinde
Systementwicklungsprojekt:
IS Gesamtstraßennetz SMI GDI-Forum 2004.
EVA-Sitzung, Schwarzenberg, 11/2007 Andre Swertz
Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme
Ein Toolkit für hierarchische Bibliotheksdaten Ein Toolkit zur Präsentation von hierarchischen Bibliotheksdaten Andres von Arx UB Basel, August 2006.
Applets Java für’s Web.
Der Umweltdatenkatalog (UDK) –
Einführung / Geschichte Einführung / Geschichte Motivation Motivation Beispiel Beispiel Architektur / Komponenten Architektur / Komponenten Konfiguration.
Einsatzgebiete und Anwendungen
Erstellen einer Webseitenstatistik mithilfe eines OLAP-Servers
Erstellen einer Webseitenstatistik mithilfe eines OLAP-Servers
Präsentation von Sonja Pathe
Proseminar: „Webtechnologien für Ecommerce“
Your name Bedeutung von Internet- Technologien Gruppe 1 Andreas Feuerstein Philipp Hochratner Christian Weinzinger.
Sesame Florian Mayrhuber
Beschreiben Sie eine Web Interaktion mittels Java Applets.
ESRI EUROPEAN USER CONFERENCE
Management- und Web Services- Architekturen
Zauberwort Metadaten Elementares Handwerkszeug des Content- und Wissensmanagement.
XML und Datenbanken © 2006 Markus Röder
MathCoach Ein web-basierter Mathematik-Tutor
GEMET – Thesaurus in der WSV
Quellen: Internet INTRANET Ausarbeitung von Sven Strasser und Sascha Aufderheide im Modul Netzwerktechnik, Klasse INBS Mai 2003.
Untersuchungen zur Erstellung eines
Client-Server-Modell
Folge 11/ Kapitel 4.1: Datenaustausch über Extranets
Eike Schallehn, Martin Endig
W W W - World Wide Web. Das World Wide Web kommt aus dem Englischen und bedeutet ‚Weltweites Netz‘ ist ein über das Internet abrufbares Hypertext-System.
Online GIS Online GIS – Der Nutzer Matthias Hofschen, ESRI Germany ESRI EUROPEAN USER CONFERENCE.
Generative Softwareentwicklung in der Praxis Olaf Kaus, „Java User Group“, Hannover 6.Oktober 2003.
prof. dr. dieter steinmannfachhochschule trier © prof. dr. dieter steinmann Folie 1 vom Montag, 30. März 2015.
Eingereicht von:Michael Schrank Betreuung:o.Univ.-Prof. Dr. Hanspeter Mössenböck Mitbetreuung:Dipl.-Ing. Wolfgang Beer CyberStudent A Multiuser Awareness.
Datenbanken im Web 1.
1 Wolfgang Wiese, Regionales RechenZentrum Erlangen WCMS 3. August 2000 Wolfgang Wiese RRZE / Lehrstuhl für Informatik VII
Webserver Apache & Xampp Referenten: Elena, Luziano und Sükran
Java Server Pages Technologie zur Erzeugung dynamischer Webseiten basierend auf Java-Servlets Blockseminar Wintersemester 2001/2002Jochen Pfeiffer Seite.
DaimlerChrysler Workshop Architektur HyperbolicModeler  Notes Client  Notes native Java Klassen  Mehr Informationen über Design  Zugriff auf Dokumente.
WINLearn Technische Umsetzung. Basistechnologie Oberfläche in HTML JSP (JavaServerPages) zur Datenauswertung Datenhaltung: Datenbank oder Filesystem JDBC.
© 2003, Rudolf Jansen Einsatz der XML-Features der Oracle 9i DB zur Systemintegration Rudolf Jansen Freiberuflicher Entwickler und Autor
Wiener Archivinformationssystem WAIS Heinrich BERG.
XML-Erweiterungen in ORDBMS Seminar: DBMS für spezielle Anwendungen Florian Brieler.
© 2008 TravelTainment The Amadeus Leisure Group Webanwendungen mit Java - HttpServlets 17.Dezember 2010 Sebastian Olscher Erstprüfer: Hon.-Prof. Dr. H.
MarThes – Standardisierter Thesaurus mariner Begriffe
 Präsentation transkript:

Einsatz eines Thesaurus

Fachdaten des BIS Alle Daten haben Raumbezug ! Punktdaten (derzeit ca. 150.000 Einzelobjekte) Bohrungen, bodenkundliche Profile, geologische Aufschlüsse … Schichtenverzeichnisse Proben- und Labordaten Flächendaten (31 Fachebenen mit ca. 270.000 Objekten) Geologische und Bodenkundliche Grundlagenkarten Hydrogeologische Spezialkarten Rohstoffkarten Orientierungsdaten (13 Fachebenen) Topographische Karten verschiedener Maßstäbe Verwaltungsgrenzen Naturräumliche Gliederung Alle Daten haben Raumbezug !

BIS-Clients Behördennetz Client Internet Client (GeoFachdatenAtlas) Java Swing basiert Zugang über Behördennetz Datenrecherche Datenpflege Datenexport Kompletter Datenumfang Objektzugriff nach Berechtigungsprüfung Exakte Lageinformation Internet Client (GeoFachdatenAtlas) HTML basiert Zugang über Internet Keine Zugriffsbeschränkung Alle Objekte Wenig Objekt-Details Ungenaue Lageinformation

System-Architektur (einfach) Schichtenarchitektur BIS-Client Applikations-Server Datenbank HTML-Client Web-Server CORBA JDBC HTTP TCP/IP Firewall Behörden Öffentlichkeit Datenpool Datengenerierung

Metadatenmodell (vereinfacht) Zukunft ? Objekt Fachklasse Tabelle Attributgruppe OODB XML-DB Attribut Feld

Modellierung mit Metadaten Fachliches Modell Metadaten-Repository in Oracle DB Vorgehen, um von einem Fachlichen Modell zu den operablen Metadaten im MD-Repository zu kommen. Im Objekt-Modellierungstool, bei uns zZ. Together – werden die Fachlichen Modelle erfasst. Über einen Import im Metadaten-Tool können diese Daten dann - in Teilen - importiert werden.

Metadaten-Pflegewerkzeug Fachklasse Metadaten-Pflegewerkzeug Attributgruppe Attribut

Abstraktes Metamodell Model Builder (Serverstart) Objektfabrik (Laufzeit) Abstraktes, statisches Metamodell Dynamische Klassen im Speicher Objekte Fachklasse generiert Bohrung instantiiert 7322BG000002 aus Metadaten Attributgruppe Allgemeine Stammdaten R-Wert: 44 50600 H-Wert 35 20400 Beziehung Probe Proben-ID 7322BG0001G Probenart: Gesteinsprobe

Schlüssellisten im BIS Applikationsdaten Schlüssellisten & Schlüssel Fachthesaurus Daten referenzieren Schlüssel 300 Schlüssellisten 60.000 Fachbegriffe

Schlüssellisten Vorteile der „terminologischen Kontrolle“ Eindeutigkeit bei der „Beschlagwortung“ Erleichterung bei Formulierung von Recherchen Vorgabe von zielführenden Recherchebegriffen Generierung von Suchkriterien unter Zuhilfenahme von Hierarchischen Strukturen

Zugänge zu den Inhalten des BIS Experten mit guten internen Kenntnissen über Datenmodell und internen Aufbau Interessierte „Laien“ ohne Datenmodellkenntniss u.U. lange Suchzeiten Im schlechtesten Fall erfolglose Recherche ISPU / UOK + Verweise zu den gesuchten Objekten

Felder im BIS Schlüssellisten Thesaurus, z.B. UOK-Thesaurus, UMTHES, GEMET,SNS Schlüssellisten Recherche und Beschlagwortung über Schlüssellisten Verbesserte, inhaltliche Erschließung durch Einsatz von Thesauri

Eingesetzte Thesauri GEMET (General Multilingual Environmental Thesaurus) UOK Thesaurus SNS Semantischer Netzwerk Service UMTHES (Thesaurus des UDK)

Datenmodell CONCEPT CONCEPT_PROPERTY TERM RELATION RELATION_PROPERTY concept_id name base_cc concept property_type property_value language TERM term_id concept cc term_type class cc_term_id RELATION RELATION_PROPERTY relation_id term_source term_target relation_type weight relation property_type property_value language

Crosskonkordanzbildung zwischen Thesaurus und BIS

Gewichtung der gefundenen Crosskonkordanzen 2 * nEqualStems weight= ___________________________________ nStemsThesaurus + nStemsDataSource nEqualStems = Anzahl gleicher Wortstämme zwischen Thesaurus und Datenquelle NStemsThesaurus = Anzahl aller Wortstämme im Thesaurusbegriff NStemsDataSource = Anzahl aller Stämme im BIS-Begriff

TheVi XML <?xml version="1.0" encoding="ISO-8859-1"?> <thevi_document xmlns:xi="http://www.w3.org/2001/XInclude"> <head> … </head> <concept_collection top="TheVi"> </concept_collection> <concept_collection top=„BIS_SL3451"> <concept_collection top=„Gemet"> </thevi_document> Dokumentbeschreibung Begriffssammlung Metamodell Begriffssammlung BIS Schlüsselliste Begriffssammlung Gemet

TheVi XML – Concept Collection <concept_collection top="..."> <languages> … </languages> <representations> <node_representation> … </node_representation> … <edge_representation> … </edge_representation> </representations> <terms> <term> … </term> </terms> <relations> <relation> … </relation> </relations> </concept_collection> Sprachen (Default, Alternativen) Darstellungsvorschriften Terme Relationen

TheVi XML und Transformationen Webbrowser (Javascript enabled, Java Plugin) TheVi Applikation TheVi Applet z.B. Omnigator z.B. Protégé … … export RDF XTM GIRG (Webserver mit CGI-Perl-Skripten) XSLT TheVi XML DB (Oracle 10g)

Arten von Verbindungen BIS Thesaurus, z.B. Gemet Vom Thesaurus zu BIS Klassendaten Thesaurus -> Fachklasse Thesaurus -> Attributgruppe Thesaurus -> Attribut Vom Thesaurus zu BIS Instanzdaten Thesaurus -> Instanz Stammdaten Thesaurus -> Instanz Schichtdaten Thesaurus -> Instanz Probendaten

Art des Mappings zwischen Thesaurus und BIS ~ BIS Proxies Thesaurus

Thevi Darstellung der gefundenen Beziehungen Einschränkung auf ein TK-Blatt Eine TheviXML Datei mit drei Concept Collections: 1. GEMET Thesaurus Concept Collection mit den BIS Stellvertreterobjekten des TK Blattes 7435 Pfaffenhofen a.d. Ilm 3. Eine ConceptCollection mit den zwischen GEMET und den BIS-Objekten des Blattes 7435 gefundenen Crosskonkordanzen

BIS Objekte auf Blatt 7435 Pfaffenhofen 1517 Bohrungen BG 53 Aufschluss Bodenkunde AB 25 Quellen QU 71 Einzelfundpunkt EF 43 Geologisches Profil GP 196 Aufschluss Geologie AG 1905 BIS Objekte auf Blatt Pfaffenhofen

Thevi Daten im Touchgraph

Thevi Metamodell

Thevi Instanzverweise

Erste Ergebnisse Allein zwischen GEMET Terms und BIS ergeben sich über die gewählte Methode > 16.000.000 Crosskonkordanzen Den größten Anteil an den gefundenen Konkordanzen hatten die BIS Schlüssellisten mit 82 % Das Datenmodell hat sich zur Verwaltung der Thesauri sowie der Crosskonkordanzen bewährt

Ausblick Weitere Thesauri sollen zur Crosskonkordanzbildung herangezogen werden Dazu soll auch versucht werden, die angebotenen Web-Services zu nutzen und nicht mit redundanten Offline-Beständen zu arbeiten

Vielen Dank fürs Zuhören www.bis.bayern.de