Hypertextualisierung mit Topic Maps Ein Ansatz zur Unterstützung des Textverständnisses bei der selektiven Rezeption von Fachtexten.

Slides:



Advertisements
Ähnliche Präsentationen
Zur SCORM-Fähigkeit konventioneller XML-unterstützender eLearning Developer Tools im Projekt I-can-EIB OFFIS Oldenburger Forschungs- und Entwicklungsinstitut.
Advertisements

Zur Rolle der Sprache bei der Modellierung von Datenbanken
EDIS Workshop Datenintegration - Ulm A. Kroupa / N. Hirneisen Gültige Namen und ihre Eignung als Fixpunkte in taxonomischen Datenbankprojekten.
WML – Wireless Markup Language Vortrag von Eduard Jakel.
Inhaltlich orientierter Zugriff auf unstrukturierte Daten
Ontologien- Query 1 Teil2
Kapitel 4 Datenstrukturen
SVG und X3D Referentin: Gergana Ivanova
Harmonisierung von Ontologien Martin Zobel. Was versteht man in der Informatik unter einer Ontologie? Wikipedia: Unter Ontologie versteht man in der Informatik.
Wissensmanagement mit semantischen Netzen – Analyse und Vergleich verschiedener Softwarelösungen Autor: Holger Wilhelm Referentin: Prof. Dr. Uta Störl.
HTML - Einführung Richard Göbel.
FH-Hof Extensible Markup Language Richard Göbel. FH-Hof Extensible Markup Language XML XML ist universeller Ansatz für die Strukturierung von Zeichenketten.
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/8 Thesauren In gewisser Weise bilden Thesauren (Singular Thesaurus, Plural auch Thesauri)
DOM (Document Object Model)
Internetstruktur Das Internet besteht aus vielen Computern, die weltweit untereinander vernetzt sind.
Controlled Vocabularies in XML Datenbanken vs. Markup – Prof. Dr. Thaller Mike Odenthal.
Eine Biografie aus ADB/NDB als XML Datenbanken vs. Markup Prof Dr. Manfred Thaller WS 2009 / 2010 Referent: Bilal Erkin.
Präsentation des Seminararbeitsthemas
HTML - Eine erste Annäherung
WIESEL – Integration von Wissensmanagement und E-Learning auf der Basis von Semantic Web Technologien Matthias Rust, XML-Tage 2004, Berlin WIESEL Integration.
Magnus Niemann Strukturierung von Topic Maps.
Modularization of XHTML™
Einführung XML XML Einführung Andreas Leicht.
Explizite und editierbare Metainformationen für Software Muster.
Semantisch gestützte Suche im Internet
Indexierung - Verschlagwortung
Informationsarchitektur Beschreiben und Benennen
Fortgeschrittene Methoden der Wissensorganisation
Jakob Voß: Grundlegende Aspekte des Semantic Web: Modellierung von Ontologien ( ) Modellierung von Ontologien Jakob Voß
1 Grundlagen und Anwendung der Extensible Markup Language (XML ) Peter Buxmann Institut für Wirtschaftsinformatik Johann Wolfgang Goethe-Universität Frankfurt.
Referentin: Martina Hänsel
Der Supermarkt: Eine beispielhafte Erklärung für die fünf untersten Schichten des Semantic Web Protocol Stack Nicola Henze.
FH-Hof HTML - Einführung Richard Göbel. FH-Hof Komponenten des World Wide Webs WWW Browser HyperText Transfer Protocol (HTTP) via Internet WWW Server.
Spatial Decision Support Systems (SDSS)
Prof. Dr. Gerhard Schmidt pres. by H.-J. Steffens Software Engineering SS 2009Folie 1 Objektmodellierung Objekte und Klassen Ein Objekt ist ein Exemplar.
Zhu, Lin Liu, Yang Zhu, Yuelong. 1. Theoretisches Grundlagen Medium Hypermedia Multimedia 2. Analysebeispiel von Website SONY Vorteile Nachteile 3. Quellen.
Knowledge Discovery mit Wordnet und Alembic Workbench
Hypertext Markup Language
Was ist das Internet? Größtes (globales) Netzwerk der Welt
XML - Konzepte XHTML XML Base XPath XInclude XLink XForms XPointer
Automatic composition of UI mashups Vortrag zum Seminar Webengineering 2011 Michael Reißner.
Cedric Heid, Lukas Burkhardt
Fachsprachen als Varietäten?
Typo3 Templates und TypoScript
Wird ganz am Anfang der HTML-Datei geschrieben Doctype html public bedeutet, dass man sich auf die Öffentlichkeit der html-dtd bezieht Html ist die meist.
Java für Fortgeschrittene
Daniel Kucher Proseminar XHTML. 1. HTML – Struktur und Versionen 2. Der – Teil 3. Der – Teil 4. Stylesheets (CSS) – Das Rückrat von XHTML.
ANDREAS LOHR, OLONDA S.R.O. Einfach anfangen mit HTML.
Paradigmenwechsel in der Unternehmensmodellierung Prof. Dr. Wolfgang Voigt Dipl.-Ing. Päd. Alexander Huwaldt UML Extrakt UML Seminar, Chemnitz
Beispiele von Objektkatalogen
Struktur von RDF Fabian Scheller.
Mathematik 1. Studienjahr Modul M1: Elemente der Mathematik
XML (Extensible Markup Language)
XJustiz: Elektronischer Rechtsverkehr mit XML
Eike Schallehn, Martin Endig
Eike Schallehn, Martin Endig
Richtlinien für die Annotation von Koreferenzen
Semantic Web.
Lexit.at Michael Hausenblas Semantische Darstellung und Abfrage von Rechtsnormen – IRIS 2004 Semantische Darstellung und Abfrage von Rechtsnormen am Beispiel.
Datenbanken im Web 1.
Topic Maps: Personal Brain
Semantische Netze im Recht
Text Encoding Initiative Universität zu Köln Daten- und Metadatenstandards Seminarleitung: Patrick Sahle Seminarleitung: Patrick Sahle Referentin: Anna.
Geoinformation3 Geoinformation III XML Grundlagen, Namensräume und Hyperlinks Vorlesung 12b.
Lexikalische Semantik
Tanja Eder Slawische Korpuslinguistik Prof. Tosovic, SS 2006 Lexikalische Datenbanken WordNet – RussNet EuroWordNet und Global WordNet Association.
Das Internet Ein Netzwerk, das viele Rechner miteinander verbindet
Was gibt’s neues im Bereich Anpassung Fabian Moritz Consultant, Developer SharePointCommunity.de.
Semi-automatische Komposition von Dienstbenutzerschnittstellen auf mehreren Abstraktionsebenen Christian Jäckel Universität des Saarlandes Bachelor.
13.Dezember 2006–1Elektronisches Publizieren: Schemasprachen — Relax NG Schemasprachen für XML — Relax NG — Anne Brüggemann-Klein TU München.
 Präsentation transkript:

Hypertextualisierung mit Topic Maps Ein Ansatz zur Unterstützung des Textverständnisses bei der selektiven Rezeption von Fachtexten Eva Anna Lenz Michael Beißwenger Angelika Storrer Universität Dortmund

Anwendungsszenario Ein Textrezipient sucht in großen Dokumentenmengen benötigt schnellen Überblick über Inhalte muss selektiv lesen ist ein Semi-Experte der Domäne z.B. im Kontext interdisziplinärer Forschung, Studium und Ausbildung, Journalismus, Fachlexikographie. Fokus des Vortrags: terminologiebedingte Probleme Wurde ein Fachterminus vom Autor eingeführt? nicht alle Termini bekannt / erkennbar

Linking nach Wissensvoraussetzungen Mögliche Lösung: beim Lesen werden genau die notwendigen Wissensvoraussetzungen angeboten hier: durch Links in einem Hypertext Linking nach Wissensvoraussetzungen Bei terminologiebedingten Wissensvoraussetzungen: Kennzeichnung eines Terminus als solcher Informationen über den Terminus z.B. Links zu Definitionen bei einschlägigen Autoren Darstellung der Beziehungen des Terminus zu anderen Termini

Vortragsüberblick 1. : Projektrahmen, Ziel, Architektur 2. Modellierung terminologischen Wissens mit WordNet 3. Implementierung durch Topic Maps 4. Nutzung terminologischen Wissens zum Linking HyTex

Projektrahmen, Ziel, Architektur

Projektrahmen : Hypertextualisierung auf textgrammatischer Grundlage gefördert seit November 2001 von der DFG im Rahmen der Forschergruppe Texttechnologische Informationsmodellierung interdisziplinäres Projekt mit linguistischem Schwerpunkt Kontext des Semantic Web -Nutzung und Erprobung von Techniken (XML, Topic Maps, XSLT) -Ziel: mit konzeptionellen Ansätzen das Semantic Web für die menschliche Informationsverarbeitung besser erschließbar zu machen zunächst abgeschlossenes Textkorpus HyTex

Ziel und Ansatz Ziel: Erforschung von konzeptionellen Strategien zur Hypertextualisierung eines Fachtextkorpus Domäne: Texttechnologie und Hypermedia Hypertextualisierungsstrategien basierend auf -textgrammatischem Markup u.a. Koreferenz-Relationen, thematische Verweise, Definitionen und Gebrauch von Fachausdrücken -domänenspezifischem terminologischem Wissen (Schwerpunkt des Vortrags) Ergänzung zu statistischen und KI-basierten Methoden Hypertext-Sichten: Erhaltung der ursprünglichen linearen Struktur

Transformation alle Komponenten: XML Transformationsregeln werden automatisch in XSLT-Code übersetzt beschreiben Hypertext- Generierung

Modellierung terminologischen Wissens mit WordNet

WordNet für terminologisches Wissen lexikalische Datenbank ursprünglich für englische Sprache (Version 1.6: 138,838 Wörter), inzwischen auch für viele andere Sprachen (u.a. EuroWordNet) verschiedene Anwendungen im Bereich Language Engineering und Information Retrieval ursprünglich Allgemeinsprache, nicht Fachsprache nicht als Ontologie konzipiert, inzwischen aber in einigen Bereichen als Ontologie genutzt (mit Anpassungen)

Organisation von WordNet Grundeinheit: Konzept (Begriff), repräsentiert durch ein Synset Synset besteht aus lexikalischen Einheiten (Wörtern), die das Konzept lexikalisieren semantisch-konzeptionelle Relationen zwischen Synsets, z.B. Hyponymie, Meronymie lexikalische Relationen zwischen lexikalischen Einheiten

TermNet wir nutzen nicht die Datenbank als solche, sondern übernehmen Organisation von WordNet für ein eigenes TermNet der Domäne Erweiterungen -in Richtung Ontologie (z.B. class-instance) XTM ist ein XML-Standard -neue domänenspezifische und lexikalische Relationen: XTM ist eine Abkürzung für XML Topic Maps (Akronymrelation) Auszeichnungssprache ist der deutsche Ausdruck für Markup Language (sprachkontaktbedingte Lexemkonkurrenz) -Klassifizierung der Termini, u.a. nach Varietäten: Fachhochsprache ( annotieren ) vs. Werkstattsprache ( taggen )

Implementierung durch Topic Maps

Synsets und lexikalische Einheiten für jeden terminologisierten Ausdruck (lexikalische Einheit) ein Topic mit dem Ausdruck als Basisnamen: Wort-Topic für jedes Synset ein Topic: Konzept-Topic jedes Wort-Topic wird mit zugehörigem Konzept-Topic durch eine Assoziation vom Typ lexikalisiert verbunden

Semantische und lexikalische Relationen für jede semantische Relation eine Assoziation des entsprechenden Typs dieser Typ ist wiederum ein Topic vom Typ semantische_Relation für jede lexikalische Relation eine Assoziation des entsprechenden Typs dieser Typ ist wiederum ein Topic vom Typ lexikalische_Relation

Verbindungen zu Ressourcen Verbindungen von Wort- Topics zu Ressourcen durch Topic-Anker (occurrences): -zu jedem Vorkommen des Terminus -zu Erklärungen, Definitionen usw. eingebettete Ressourcen enthalten eine allgemeine Definition

Skopi thematische Skopi auf der Ebene der Synsets: Hypertext, Texttechnologie, WordNet Skopi zur Unterscheidung von Sprachen: deutsch, englisch Skopi zur Unterscheidung zwischen Varietäten: Fachhochsprache, Werkstattsprache

Nutzung terminologischen Wissens zum Linking

Erweitertes Glossar G LINK Definitionen und Erklärungen allgemeine Definition Definition von Kuhlen FAQ Verwendung in der KI Verwandte Begriffe andere Bezeichnung: Hyperlink Gegenteil: – Oberbegriffe: – Unterbegriffe: Typisierter Link ist Teil von: Hypertext hat als Bestandteile: – implementierbar durch: HTML-Linking- Element siehe auch: Anker Die Spezifikation des Anker-Konzepts von Tochtermann (1995) erweitert die einfache Unterscheidung von globalen und lokalen Ankern um eine gestufte Definition von Ankerbereichen auf den Präzisionsstufen Modul – Kompo- nente – Bereich. Weiterhin unterscheidet er nach der Anzahl der in einem Link involvierten Anker in 1:1-Links, in denen ein Ausgangs- Anker mit genau einem Zielanker verknüpft ist; 1:n-Links, in denen ein Ausgangs-Anker mit mehreren Zielankern verbunden ist, und n:m-Links, in denen mehrere Anker unabhängig von der Traversierungsrichtung miteinander zu einem Linking-Muster kombiniert sind. Im Linking- Element von HTML sind nur 1:1-Links vorgesehen; die obige Spezifikation und das Konzept des Extended Link (im Sinne der Xlink-Spezifikation) sehen auch Links mit mehreren Ankern vor. in der Community bekannte Definition Links zu verschie- denen Textsorten homographe Termini anderer Fachbereiche Synonym(e) Hyponym(e) Hyperonym Antonym Holonym Meronym(e) domänenspezifische Relationen Termini, die Wissens- voraussetzung sind

Verwendung der Skopi Filter -thematische Filter ( Hypertext, Texttechnologie ) -Varietätenfilter ( Werkstattsprache, Fachhochsprache ) -Sprachenfilter Generierung von Anmerkungen -z.B. taggen: Werkstattsprache für annotieren

Erweitertes Glossar G LINK Definitionen und Erklärungen allgemeine Definition Definition von Kuhlen FAQ Verwendung in der KI Verwandte Begriffe andere Bezeichnung: Hyperlink Gegenteil: – Oberbegriffe: – Unterbegriffe: Typisierter Link ist Teil von: Hypertext hat als Bestandteile: – implementierbar durch: HTML-Linking- Element siehe auch: Anker Die Spezifikation des Anker-Konzepts von Tochtermann (1995) erweitert die einfache Unterscheidung von globalen und lokalen Ankern um eine gestufte Definition von Ankerbereichen auf den Präzisionsstufen Modul – Kompo- nente – Bereich. Weiterhin unterscheidet er nach der Anzahl der in einem Link involvierten Anker in 1:1-Links, in denen ein Ausgangs- Anker mit genau einem Zielanker verknüpft ist; 1:n-Links, in denen ein Ausgangs-Anker mit mehreren Zielankern verbunden ist, und n:m-Links, in denen mehrere Anker unabhängig von der Traversierungsrichtung miteinander zu einem Linking-Muster kombiniert sind. Im Linking- Element von HTML sind nur 1:1-Links vorgesehen; die obige Spezifikation und das Konzept des Extended Link (im Sinne der Xlink-Spezifikation) sehen auch Links mit mehreren Ankern vor. in der Community bekannte Definition Links zu verschie- denen Textsorten homographe Termini anderer Fachbereiche Synonym(e) Hyponym(e) Hyperonym Antonym Holonym Meronym(e) domänenspezifische Relationen Termini, die Wissens- voraussetzung sind