EDIOD Editing Images on Desktop Zur Integration semantischer Beschreibungen in Bilddateien Magisterarbeit von Jan Schnasse

Slides:



Advertisements
Ähnliche Präsentationen
FDCML Field Device Configuration Markup Language systemneutrale XML-Beschreibung für Automatisierungskomponenten
Advertisements

Stefan Lohrum Konrad-Zuse-Zentrum für Informationstechnik Berlin (ZIB)
Heterogene Informationssysteme
Übung Datenbanksysteme WS 2003/ Übung Datenbanksysteme Entwurf eines Bibliothekssystems
Datenbanken Einführung.
Extensible Markup Language
Idee und Realisierung des Internet der Zukunft
Objektorientierte Datenbanken
Library of Labs Co-funded by the Community programme eContentplus Library of Labs WP 4: Metadaten Definition Universitätsbibliothek Stuttgart (UBS)
Dublin Core Antje Schregel, Dublin Core Was ist DC? Architektur von DC (Elements, Qualifiers) Anwendung Aktuelle Situation Projekte.
Was bedeutet XML in Office-Applikationen für Systemadministratoren? Ruprecht Dröge MCSE MCSD MCT Microsoft Pre Sales Consultant.
Natascha Schumann TU Darmstadt IuK-Konferenz, März 2003
PADLR Submodul Modular Content Archives Ein Content Browser für Lehr- materialien aus der Elektrotechnik Dipl.-Ing. Mark Painter Institut für Nachrichtentechnik.
Dipl.- Dok. Rusalka Offer
Java: Objektorientierte Programmierung
DOM (Document Object Model)
Internetstruktur Das Internet besteht aus vielen Computern, die weltweit untereinander vernetzt sind.
RDF R ESOURCE D ESCRIPTION F RAMEWORK Referentin: Claudia Langer.
Web 3.0 – Programmierung – Semantic Web / CIDOC CRM
CIDOC-CRM Universität zu Köln Historisch-kulturwissenschaftliche Informationsverarbeitung AM 2 Dozent: Prof. Dr. Manfred Thaller Referent: Nelson Marambio.
METS/MODS Referat im Rahmen des IT-Zertifikats f ü r Geisteswissenschaftler Leitung: P. Sahle Referentin: C. Ottnad.
Ressource Description Language
Die Bestandteile des Semantic Web. Sematic Web soll das WWW erweitern und nicht neuerfinden Informationen sollen Maschinenlesbar sein Schemata beschreiben.
Datenbankentwurf mit Hilfe des ER-Modells entwickeln
Cross-Search in Renardus Göttingen State and University Library, Germany (SUB) Dr. Heike Neuroth The Academic Subject.
XML Standardisierungen und Abfragesprachen
Einführung XML XML Einführung Andreas Leicht.
Hauptseminar XML-Technologie: Resource Description Framework (RDF) Michael Kranz Betreuer: Roland Haratsch.
Access 2000 Datenbanken.
RDF-Schema Seminar: „Semantic Web“ André Rosin,
1 Grundlagen und Anwendung der Extensible Markup Language (XML ) Peter Buxmann Institut für Wirtschaftsinformatik Johann Wolfgang Goethe-Universität Frankfurt.
Extensible Characterisation Definition Language (XCDL) Volker Heydegger HKI Kolloquium, Köln,
Langzeitarchivierung und Metadaten. NAA Preservation Strategy Link: ml.
Wissenschaftliche Übung Metadatenformate und -standards
METS (Metadata Encoding Transmission Standard). Wer und Was Digital Library Federation Vorgänger: MoA II (1997) Standard zur Beschreibung einer Teilmenge.
Der Supermarkt: Eine beispielhafte Erklärung für die fünf untersten Schichten des Semantic Web Protocol Stack Nicola Henze.
RDF Resource Description Framework
Metadaten als Bausteine des Semantic Web META-LIB Workshop 22
Schnelles und effizientes Suchen. Was ist MPEG 7? Wie funktioniert MPEG? Was bietet MPEG 7? Wo wird MPEG 7 verwendet?
Entwurf und Realisierung einer digitalen Bibliothek zur Verwaltung von Notenhandschriften Dipl.-Ing. Temenushka Ignatova Datenbank- und Informationssysteme,
Nestor Workshop im Rahmen der GES 2007 Digitale Langzeitarchivierung und Grid: Gemeinsam sind wir stärker? Anforderungen von eScience und Grid-Technologie.
Datenbank.
Nicolas Frings Maximilian Bernd Stefan Piernikarcyk
Proseminar: „Webtechnologien für Ecommerce“
Java für Fortgeschrittene
Windows Presentation Foundation, Vorlesung Wintersemester 2013/14 Prof. Dr. Herrad Schmidt WS 13/14 Kapitel 9 Folie 2 ADO.NET (1) Klassen für Zugriffe.
Sesame Florian Mayrhuber
Allgemeines zu Datenbanken
Ausgabe vom Seite 1, XML Eine Einführung XML - Eine Einführung.
CRM TimeLog… TimeLog … Wie gross ist der Anteil der Lohnkosten in Ihrem Unternehmen?
Paradigmenwechsel in der Unternehmensmodellierung Prof. Dr. Wolfgang Voigt Dipl.-Ing. Päd. Alexander Huwaldt UML Extrakt UML Seminar, Chemnitz
Zauberwort Metadaten Elementares Handwerkszeug des Content- und Wissensmanagement.
XML (Extensible Markup Language)
Trust and context using the RDF- Source related Storage System (RDF‑S3) and easy RQL (eRQL) Karsten Tolle und Fabian Wleklinski.
Dublin Core IT-Zertifikat Daten- und Metadatenstandards.
Eike Schallehn, Martin Endig
Eike Schallehn, Martin Endig
© 2001 Sven Dammann1 Aufbau Integrierter Informationssysteme XML Bearbeitung und relationale Abbildung Sven Dammann Martin-Luther-Universität Halle-Wittenberg.
Daten- und Metadatenstandards SoSe 2009 IT-Zertifikat der Philosophischen Fakultät der Universität zu Köln Dozent: Patrick Sahle 26. Juni 2009: Dublin.
Seminar: Neue Ansätze der Künstlichen Intelligenz Seite 1Ulf Schneider02. Juli 2002 Ulf Schneider Neue Ansätze der Künstlichen Intelligenz: OIL Ontology.
Semantic Web.
IT-Zertifikat der Phil.Fak Kurs 4: Daten- und Metadatenstandards Patrick Sahle Semantic WebWS 08/09.
Dedizierte Systeme – Opus Eva Cynkar Dedizierte Systeme - Digital Library.
IT-Zertifikat der Phil.Fak Kurs 4: Daten- und Metadatenstandards Patrick Sahle XML-BasicsWS 08/09.
XML Die “E-Lance Economy” oder die “Digital Economy” stellt neue Anforderungen an Funktionalität im Netz. XML wurde vom World Wide Web Consortium (W3C)
Seminar zur Geoinformation Folie 1 Inhalt: –XML –XML- SCHEMA –XSL –Syntax –GML Seminar zur Geoinformation Datenaustausch mit XML / GML im InternetDatenaustausch.
Text Encoding Initiative Universität zu Köln Daten- und Metadatenstandards Seminarleitung: Patrick Sahle Seminarleitung: Patrick Sahle Referentin: Anna.
Web Services Spezielle Methoden der SWT Liste V – WS 2008/2009 Christian Boryczewski.
Vorteile von XML Die installed base von HTML, HTTP und Webbrowsern XML ist einfach und portabel XML kann Dokumente beliebiger Komplexität abbilden XML.
Semantic Markup für Zwecke der Langzeitarchivierung in digitalen Bibliotheken Neubiberg,
 Präsentation transkript:

EDIOD Editing Images on Desktop Zur Integration semantischer Beschreibungen in Bilddateien Magisterarbeit von Jan Schnasse

Einleitung Bilddaten nehmen bei der Bereitstellung geisteswissenschaftlicher Quellen im WWW eine herausragende Stellung ein. Zum heutigen Zeitpunkt ist im geisteswissenschaftlichen Kontext die Erschließung von Bilddaten durch Menschengenerierte Metadaten der Normalfall. Die Arbeit beschäftigt sich mit der Frage, inwiefern sich Probleme im Umgang mit Bildern durch das Verspeichern von Metadaten direkt in der Bilddatei lösen lassen. Ein Softwaretool zur Verspeicherung von XML Daten in PNG Bildern, dass eine semantische Bildsuche erlaubt, wird vorgestellt.

Theoretische Überlegungen

Aufbau 1.Probleme bei der Bearbeitung geisteswissenschaftlicher Quellen in herkömmlichen Datenbanksystemen 2.Verfahren zur Bestimmung und Unterscheidung von räumlichen Verhältnissen von Bildobjekten 3.Entwurf eines XML-Schemas zur Einbindung von bildbeschreibenden Metadaten 4.Verspeicherung von Metadaten in PNG Bildern 5.Bestehende Metadatenstandards

Probleme bei der Bearbeitung geisteswissenschaftlicher Quellen in herkömmlichen Datenbanksystemen Datensätze bleiben unvollständig bestimmt, da sie nur von dem Forschungsdiskurs bestimmt werden, der Zugangsberechtigung hat. Der Quellenwert eines Objektes lässt sich für bestimmte Forschungsgebiete nicht im Voraus bestimmen. Geisteswissenschaftliche Quellen sind oft heterogen. Ein Problem ist die Verteiltheit der Objekte eines Forschungsgebietes auf verschiedene Institutionen. Aufgrund der schnellen Entwicklung des IT-Sektors müssen die Daten auch in neue Umgebungen integrierbar sein.

Datenbanksysteme Relationale Datenbanken Nicht geeignet für eine Datensammlung, bei der nicht alle Merkmale im Voraus bekannt sind. Objektorientierte Datenbanken Objektorientierte Datenbanken erlauben beim Entwurf der Datenbank eigene Objekte zu definieren. Das objektorientierte Modell erlaubt es, Daten sei nah am realen Objekt zu modellieren. Objektrelationale Datenbanken Mit Objektrelationale Datenbanken wird der Versuch unternommen das Relationale System um objektorientiere Features zu erweitern.

Datenbanksysteme Verteilte Datenbanken Verteilte Datenbanken versuchen einen Zugriff auf mehrere physikalisch getrennte Datenbanken zu gewährleisten. Web-Datenbanken Eine Datenbank, die sich über das WWW bedienen läßt.

Lösungsansatz: Selbstbeschreibende Objekte Ein Selbstbeschreibendes Objekt enthält neben den Daten, die das eigentliche Objekt konstituieren weitere Daten, die die inhaltliche Interpretation der Objektdaten erleichtern oder ermöglichen. Im Fall von Bilddaten wäre eine Bildbeschreibung hinzuzufügen; einzelne Objekte könnten durch Polygonzüge identifiziert werden. Durch die Kombination mehrerer Selbstbeschreibender Objekte in einer Webseite können komplexe Objektstrukturen abgebildet werden.

Verfahren zur Bestimmung und Unterscheidung von räumlichen Verhältnissen von Bildobjekten Gesucht ist eine Bildsuche, die räumliche Beziehungen zwischen Objekten mit einbezieht. Die Identifizierung verschiedener Objekte erfolgt durch Polygonzüge. Bounding-Boxes und Rectangles Bounding Boxes werden v.a. in der Spiele- und Grafikprogrammierung angewandt, um zu überprüfen, ob Objekte sich überlappen. Oriented bounding boxes (OBB) können beliebig im Raum liegen, aligned bounding boxes (AABB) sind an den Achsen des Koordinatensystems ausgerichtet.

Verfahren zur Bestimmung und Unterscheidung von räumlichen Verhältnissen von Bildobjekten Es wird der Versuch unternommen, menschliche Beschreibungen von Bildern algorithmisch zu erzeugen. Probleme: Bounding Boxes nicht für alles geeignet Techniken der Bildverarbeitung versprechen größere Erfolge, müssen aber noch erforscht werden.

Entwurf eines XML-Schemas zur Einbindung von bildbeschreibenden Metadaten Immer wenn ein Datenformat erweiterbar bleiben soll, bietet sich der Entwurf in XML (Extensible Markup Language) an. Entwurf eines Arbeitsschemas: Das Schema soll es ermöglichen an verschiedenen Stellen benutzerdefinierte Daten einzubinden. Ein bildbeschreibendes Dokument besteht aus einem Header gefolgt von beliebig vielen Objekten. sci Element für strukturierte Beschreibungen desc für natürlichsprachliche Bildbeschreibungen Polygon Element

Entwurf eines XML-Schemas zur Einbindung von bildbeschreibenden Metadaten zu beachten: Inhaltsmodell any Defaultwerte setzen Namespaces vorschreiben Erweiterungen: image Element layer Atrribut higherResolutionImage Element

Verspeicherung von Metadaten in PNG Bildern Für eine Verspeicherung von textueller Information eignet sich neben dem PNG Bildformat auch das TIFF. Vorteil PNG-Format: ist in fast jedem Browser darstellbar Aufbau eines PNG-Bildes: PNGs verspeichern die in ihnen enthaltenen Daten in aufeinanderfolgenden Einheiten, den sogenannten Chunks. Jeder Chunk besteht aus vier voneinander unterschiedenen Elementen: length, type, data, CRC. Jedes PNG Bild besteht aus der PNG-Signatur gefolgt von mindestens drei Chunks: dem IHDR(Image Header Chunk), dem IDAT(Image Data Chunk) und dem IEND (Image End) Chunk.

Möglichkeiten zur Verspeicherung eigener Daten in PNG Die PNG-Spezifikation sieht mehrere Möglichkeiten vor, Metadaten zu den Bilddaten zu verspeichern. Eine ist die Definition eines eigenen Chunks, z.B. sdIM für selfdescribing-image-metadata. Weitere Möglichkeiten zur Verspeicherung textueller Information, bietet die Benutzung und Erweiterung schon vorhandener Chunks. Für textuelle Informationen sieht die PNG-Spezifikation drei unterschiedliche Chunks vor: tEXt, zTXt und iTXt. Für alle Textchunks steht ein Set von 10 Keywords zur Verfügung, die standardmäßig zu verarbeiten sind: Author, Title, Description, Creation Time, Copyright, Disclaimer, Warning, Software, Source, Comment.

Bestehende Metadatenstandards MPEG-7 definiert u.a. Möglichkeiten zur Auszeichnung von Multimediadaten. DDL (Data Definition Language) ermöglicht Definition von Descriptoren und Description Schemes. Annotationstypen, die MPEG-7 bereitstellt: FreeTextAnnotation entspricht dem desc Element StructuredAnnotation bietet Subelemente wie: who, whatObject, whatAction, where, when, why, how Unterhalb der Subelemente befindet immer natürlichsprachlicher Text KeywordAnnotation erlaubt die Definition von Schlüsselworten, die für die Bildsuche nützlich sein könnten

Beispiel für StructuredAnnotation Papst Gregor kniet betend vor dem Altar während der Messe mit einer Gebärde des Erstaunens

Dublin Core standardisiert eine Gruppe von 15 Elementen, die eine einfache Beschreibung von Digitalen Ressourcen ermöglichen (etwa Author, Title etc.). Die Empfohlene Implementierung von Dublin Core soll in RDF (Resource Description Framework) erfolgen. RDF hat eine eigene Schema Sprache. RDF Schema erlaubt es extrem abstrakte Beschreibungen von Ressourcen anzulegen. Validierbares XML aus beliebigen Namensräumen kann eingebunden werden. Bestehende Metadatenstandards

CIDOC CRM (CIDOC Conceptual Reference Model) stellt eine Ontologie zur Beschreibung von Materialien des Kulturellen Erbes zur Verfügung. Der Standard soll als Orientierung für den Aufbau von Informationssystemen dienen. Die Interoperabilität zwischen unterschiedlichen Systemen wird unterstützt. Bestehende Datenbanksysteme orientieren sich an CIDOC. CIDOC kann in RDF implementiert werden, jedoch nicht in XML. CIDOC eignet sich eher für die Beschreibung von Dingen einer realen Welt. Bestehende Metadatenstandards

Schluss Für den Zugriff auf die Materialien eignen sich Datenbanken, die eine objektorientierte Modellierung und Verspeicherung ermöglichen, derzeit am besten. Offene Datenformate fördern die Interoperabilität zwischen unterschiedlichen Datenbanksystemen. Selbstbeschreibende Objekte unterstützen die semantische Suche und verbessern die Duplizierbarkeit von Datenbankwissen.

Schluss XML Dokumente lassen sich in PNGs verspeichern; mit Hilfe von XML Schema lässt sich ein Datenformat definieren, das Platz für die Einbindung unterschiedlicher Metadaten bereitstellt. Teilausschnitte von Bildern können mit Hilfe von Polygonzügen ebenfalls ausgezeichnet werden und in räumliche Beziehungen miteinander gestellt werden.

Beispiel Screenshot