IT-Zertifikat der Phil.Fak

Slides:



Advertisements
Ähnliche Präsentationen
Entwicklung von Schemata für den XML-Dokumentenaustausch mit Hilfe des Resource Description Framework (RDF) John McClure Präsentation.
Advertisements

XML-basierte Techniken
Extensible Markup Language
Worzyk FH Anhalt Datenbanksysteme für FÜ WS 2004/2005 XML - 1 XML Extensible Markup Language.
Was bedeutet XML in Office-Applikationen für Systemadministratoren? Ruprecht Dröge MCSE MCSD MCT Microsoft Pre Sales Consultant.
Anmerkungen zu XML Im September 2000 Entwicklung/Anspruch von XML
1. Einführung. 1. Einführung Inhalt Einführung Vorlagen XPath Kontrollstrukturen Sortierung, Gruppierung und Nummerierung Parameter und Variablen Ein-
XML - Aufbau und Struktur - mit Einsatz im B2B
Hands On – Einführung in XML
IMS Universität Stuttgart 1 Einführung in XML Hannah Kermes HS: Elektronische Wörterbücher Do,
HTML - Einführung Richard Göbel.
FH-Hof Extensible Markup Language Richard Göbel. FH-Hof Extensible Markup Language XML XML ist universeller Ansatz für die Strukturierung von Zeichenketten.
DOM (Document Object Model)
Seminar XML und Datenbanken Sven Wiegelmann SS 2002.
XINDICE The Apache XML Project Name: Jacqueline Langhorst
XPATH XML Path Language. Xpath – XML Path Language IT Zertifikat - Daten und Metadatenstandards: XPath 2 Entwicklung des W3C Adressierungssprache für.
Universität zu Köln IT – Zertifikat der Philosophischen Fakultät / Kurs: Daten- und Metadatenstandards mit Patrick Sahle M. A. Lingua Franca für Daten:
XML-Schema HKI Proseminar Wintersemester 2010/11 Dozentin: Frau Kurz von Jan Kohl und Christian Lütticke.
METS/MODS Referat im Rahmen des IT-Zertifikats f ü r Geisteswissenschaftler Leitung: P. Sahle Referentin: C. Ottnad.
Eine Biografie aus ADB/NDB als XML Datenbanken vs. Markup Prof Dr. Manfred Thaller WS 2009 / 2010 Referent: Bilal Erkin.
HTML - Eine erste Annäherung
© 2002 Prof. Dr. G. Hellberg 1 XML-Seminar XML-Technologie: XML in Theorie und Praxis Prof. Dr. G. Hellberg XML-Technologie: XML in Theorie und Praxis.
XHTML 1.1 C. Nimz Abstrakte Module XHTML 1.1 C. Nimz Was ist ein abstraktes Modul? Definition eines XHTML-Moduls in spezieller leichter.
Modularization of XHTML™
XML Standardisierungen und Abfragesprachen
Einführung XML XML Einführung Andreas Leicht.
© data2type 2005, 1 Publishing mit XML Einsatz von XSL für das multimediale, automatisierte Publishing.
Tobias Högel & Dennis Böck,
1 Grundlagen und Anwendung der Extensible Markup Language (XML ) Peter Buxmann Institut für Wirtschaftsinformatik Johann Wolfgang Goethe-Universität Frankfurt.
Was versteht man unter XML Schema?
Wissenschaftliche Übung Metadatenformate und -standards
Der Supermarkt: Eine beispielhafte Erklärung für die fünf untersten Schichten des Semantic Web Protocol Stack Nicola Henze.
Architektur und Funktionalitäten der Oracle XML DB - ein Überblick mit ausgewählten praktischen Beispielen - im Rahmen des 17. Workshop Grundlagen von.
- XML-Path Language (xPath) ist eine Empfehlung des W3C - es wurde entwickelt, um durch ein XML- Dokument zu navigieren - und ist ein großer Teil von.
XML eXtensible Markup Language
Wird ganz am Anfang der HTML-Datei geschrieben Doctype html public bedeutet, dass man sich auf die Öffentlichkeit der html-dtd bezieht Html ist die meist.
Java für Fortgeschrittene
Information und ihre Darstellung: XHTML & CSS
Wohlgeformtheit und Gültigkeit Grundlagen der Datenmodellierung Anke Jackschina.
Ausgabe vom Seite 1, XML Eine Einführung XML - Eine Einführung.
Oliver Spritzendorfer Thomas Fekete
XML (Extensible Markup Language)
ADAT©2004 Dipl. - Ing. Walter SabinSeite: 1 Version 1.0a XML EXTENSIBLE MARKUP LANGUAGE.
XML1 XML-Motivation HTML definiert nur einen bestimmten Dokumenttyp Viele Web-Technologien benötigen eine allgemeinere Sprache zur Dokumentstrukturierung.
Daten- und Metadatenstandards SoSe 2009 IT-Zertifikat der Philosophischen Fakultät der Universität zu Köln Dozent: Patrick Sahle 26. Juni 2009: Dublin.
HTML Hypertext Markup Language
Hauptseminar Web-Services und verteilte Datenbanken Thema XML, DTDs und XML-Schema XML, DTDs und XML-Schema - Stefan Kurz, 25. April 2003.
IT-Zertifikat der Phil.Fak Kurs 4: Daten- und Metadatenstandards Patrick Sahle Semantic WebWS 08/09.
- Warum: Das HTML-Dilemma
IT-Zertifikat der Phil.Fak Kurs 4: Daten- und Metadatenstandards Patrick Sahle XML-BasicsWS 08/09.
XML Die “E-Lance Economy” oder die “Digital Economy” stellt neue Anforderungen an Funktionalität im Netz. XML wurde vom World Wide Web Consortium (W3C)
Seminar zur Geoinformation Folie 1 Inhalt: –XML –XML- SCHEMA –XSL –Syntax –GML Seminar zur Geoinformation Datenaustausch mit XML / GML im InternetDatenaustausch.
IT-Zertifikat der Phil.Fak Kurs 4: Daten- und Metadatenstandards Patrick Sahle BAM-SektorWS 08/09.
- XML: Das Sprachkonzept
- XML: Das Sprachkonzept
Text Encoding Initiative Universität zu Köln Daten- und Metadatenstandards Seminarleitung: Patrick Sahle Seminarleitung: Patrick Sahle Referentin: Anna.
Peter Brezany Institut für Softwarewissenschaften Universität Wien
Geoinformation3 Geoinformation III XML Grundlagen und Dokumentspezifikation Vorlesung 12b.
TEI Die Text Encoding Initiative (TEI-Konsortium), 1987 gegründet - Dokumentenformat (zunächst SGML)‏
Vorteile von XML Die installed base von HTML, HTTP und Webbrowsern XML ist einfach und portabel XML kann Dokumente beliebiger Komplexität abbilden XML.
XML - Warum: Das HTML-Dilemma HTML, SGML, XML - Wie: Syntax, Konzepte, Sprachelemente Basics Wohlgeformte XML-Dokumente (ohne DTD) Gültige XML-Dokumente.
XML - Warum: Das HTML-Dilemma HTML, SGML, XML - Wie: Syntax, Konzepte, Sprachelemente Basics Wohlgeformte XML-Dokumente (ohne DTD) Gültige XML-Dokumente.
IT-Zertifikat_Seminar: Metadatenstandards XSLT Eine Transformationssprache.
XSLT I Re-usable Content in 3D und Simulationssystemen Dozent: Prof. Manfred Thaller Referentin: Elisabeth Chang.
Document Type Definitions (DTDs) Marko Harasic Freie Universität Berlin Institut für Informatik Netzbasierte Informationssysteme
Datentransformation mit XSLT Seminarvortrag von Johannes Engels.
13.Dezember 2006–1Elektronisches Publizieren: Schemasprachen — Relax NG Schemasprachen für XML — Relax NG — Anne Brüggemann-Klein TU München.
Text Encoding Initiative (TEI) Universität zu Köln, SS 2009, HKI Seminar: Daten- und Metadatenstandards Dozent: Herr Sahle Referentin: Ulrike Henny Datum:
 Präsentation transkript:

IT-Zertifikat der Phil.Fak Kurs 4: Daten- und Metadatenstandards Patrick Sahle WS 08/09

Einführung: Begriffe Daten, Information, Wissen, Weisheit Datenformate? Datentypen? Datenmodelle? Datenstandards? Warum sind Datenstandards wichtig? Metadaten? Metadatenformate? Metadatenstandards? Warum sind Metadatenstandards wichtig? Metadatenformate: eine Liste Data formats are everywhere! XML is everywhere! Daten  Formate  Standards  Meta  Meta XML, TEI

Wofür braucht man das alles? Projektelandschaft CEEC ZVDD OPAL Stadtbuchinventar dMGH Robert Graves TextGrid Werke Friedrichs Der junge Goethe Europeana World Digital Library Telota-Pom Corpus Vitrearum Medii Aevi Corpus Medicorum Graecorum Antique Works Kalliope Sammlung Ponickau Foto Marburg BAM-Portal Bundesarchiv Aphrodisias

XML-Einstieg Oxygen läuft? XML-Tutorials http://www.w3schools.com/xml/default.asp http://www.uzi-web.de/xml/xml_toc.htm http://www.jeckle.de/vorlesung/xml/script.html http://heindl.de/xml/index.html http://www-i3.informatik.rwth-aachen.de/teaching/02/proseminar/prosem-xml.pdf

XML ist wie HTML nur anders … Themen … Auszeichnungssprache? Geschichte und Kontext Relevanz und Verbreitung Warum sollte man XML benutzen? Elementare Regeln "Wohlgeformtheit" und "Gültigkeit" Erste Übungen XML als Datenmodell? Datenzentriertes und Dokumentorientiertes XML

XML … als Auszeichnungssprache "Textauszeichnung"? wp: Schriftauszeichnung, Auszeichnungssprache Textauszeichnung als Anmerkung zum Text Textauszeichnung als Übersetzung von Typographie in Struktur / Information Textauszeichnung als Informationsmodellierung

XML Geschichte und Kontext GML 1968 SGML 1986 (ISO-Standard) XML 1998 (W3C-Standard) XML ist eine vereinfachte Fassung von SGML XML ist eine "Metasprache" XML hat selbst kein Vokabular XML liefert nur einen allgemeinen Rahmen (einen Satz Regeln) auf der Basis von XML werden Auszeichnungssprachen definiert xHTML ist eine Anwendung von XML Die TEI-Guidelines sind eine Anwendung von XML Beliebige lokale / eigene Vokabularien / Modelle können eine Anwendung von XML sein: Definiere deine eigenen Tags!

XML Relevanz und Verbreitung XML is everywhere Vielzahl von XML-basierten Sprachen und Anwendungen Web (xhtml) Software (word, oo) Dateaustausch XML kann verschiedene Funktionen erfüllen Datenmodellierung, Datenbeschreibung Export/Import Kommunikation Programmiersprachen; Grafikformate Ontologien Konkret: word-doc, websites, rss, mail, eLearning, Bücher, Überweisung, Bahn-Ticket,

XML Warum sollte man XML benutzen? XML ist ein allgemeiner, offener Standard des W3C seit 1998 XML ist unabhängig von Plattformen (Betriebssystemen) oder Programmen XML ist einfach XML ist „plain text“ (Zukunftssicherheit) XML ist flexibel XML ist dokumentennah XML beschreibt abstrakte Datenstrukturen XML ist mächtig (XML tut nichts, XML beschreibt Daten, mit XML kann man viel tun) XML umfasst eine ganze Familie von begleitenden Standards XML wird von einer breiten Softwarepalette unterstützt XML ist ein weit verbreiteter Standard für die Beschreibung und den Austausch von Daten. XML ist die Grundlage vieler Anwendungsstandards („XML is everywhere“) XML ist in zunehmendem Maße die Grundlage von Online-Ressourcen

XML  Handout Elementare Regeln XML besteht aus Textdaten und "Tags". Tags sind durch spitze Klammern gekennzeichnet. Es gibt öffnende und schließende Tags. Diese bilden mit dem umschlossenen Text ein "Element". Es gibt auch leere Elemente. <tag>Text</tag> <leeresElement/> Elemente können Attribute haben, die Paare aus Attributname und Attributwert sind Attributnamen dürfen sich nicht wiederholen. Attributwerte in Anführungszeichen. <tag attribut="wert"> … </tag> Die Zeichen "<", ">" und "&" sind aus der normalen Verwendung herausgenommen und müssen im Text anders codiert werden < > & Elemente können geschachtelt sein, müssen aber sauber geschachtelt sein. Überlappung ist strengstens verboten! Gut: <a> … <b> … </b> … </a> Böse: <a> … <b> … </a> … </b>

XML  Handout Elementare Regeln Alles muss in einem obersten Element eingeschlossen sein: dem Wurzelelement. Ein XML-Dokument muss ein Wurzelelement haben und darf nur ein Wurzelelement haben. Vor dem Wurzelelement können nur noch die XML-Deklaration und verschiedene weitere Angaben zum XML-Dokument stehen (Processing Instructions) Es gibt Kommentare <!-- Dies ist ein Kommentar --> Es gibt Entities. Entities sind Platzhalter für etwas anderes. &entity; Beispiel: & Die Namenswahl für Tags ist im wesentlichen frei

XML "Wohlgeformtheit" und "Gültigkeit" Ein XML-Dokument, das die Regeln von XML erfüllt, nennt man wohlgeformt (well formed) es kann geparsed und verarbeitet werden Ein XML-Dokument, das die Regeln einer Auszeichnungssprache erfüllt, nennt man gültig man sagt: es ist gültig (valid) gegen ein Schema (das ist die formale Beschreibung einer Auszeichnungssprache)

XML XML als Datenmodell? XML-Daten können selbstbeschreibend sein XML-Daten sind sequentiell XML-Daten sind hierarchisch (Baum) XML-Daten können ein Netz sein XML kann rekursive Strukturen abbilden XML kann komplexe Strukturen abbilden XML kann ein Modell vorgeben (XML kann präskriptiv sein); ein XML-Modell kann allmählich auf bestehenden Daten entwickelt werden (XML kann deskriptiv sein) XML (und ein XML-Modell) kann die Semantik von Daten beschrei- ben. Die Semantik selbst kann aber kaum formal gefasst werden. Elemente und Attribute haben unterschiedliche Ausdrucksmöglich- keiten

XML Datenzentriertes und Dokumentorientiertes XML

XML herstellen XML bildet ein Modell ab; mit XML werden Daten modelliert Wo kommen die XML-Daten her? Man kann bestehende Datenstrukturen in XML abbilden Man kann Daten in ein XML-Modell einfügen Man kann bestehende Daten mit XML auszeichnen Beispielszenario: Digitale Texte mit XML Häufig werden mit XML implizite Befunde explizit gemacht In der Überführung typographischer Daten in XML werden typographische Informationen (Layoutinformationen) verallgemeinernd gedeutet

Die X-Familie XML … beschreibt strukturierte Daten XPath … erlaubt die Navigation in XML-Daten XMLSchema … beschreibt ein striktes Datenmodell XSL … eXtensible Style Language XSLT … transformiert XML-Dokumente XSL-FO … beschreibt eine formatierte Ausgabe (z.B. für den Druck) XLink … beschreibt komplexe Links XPointer … beschreibt XML-Zeiger XQuery … ist eine XML-Datenbankabfragesprache XForms … beschreibt Eingabeformulare

Schema? DTD als Beispiel … Es gibt verschiedene "Schema-Sprachen" z.B. DTD (Document Type Definition), XML Schema, RelaxNG (REgular LAnguage description for Xml New Generation) Ein Schema beschreibt, welche Elemente und Attribute (ggf. Attri- butwerte) es in einem Modell gibt und welche Elemente wo (worin) wie oft vorkommen dürfen ("Inhaltsmodelle") Beispiel: <!ELEMENT buch (titel)> <!ATTLIST buch isbn CDATA #IMPLIED <!ELEMENT titel (#PCDATA | sortierwort)* > <!ELEMENT sortierwort (#PCDATA) > Syntax: "," = Abfolge,"|" = oder; Quantoren: "", "?", "+", "*" … aber wo kriege ich meine DTD eigentlich her? übernehmen, schreiben, generieren

Navigation im Baum? XPath! XPath bietet eine Syntax, um Elemente, Knoten und Knoten-Sätze in einem XML-Dokument anzusteuern Die Adressierung von Elementen kann mit Bedingungen verknüpft werden XPath stellt weitere Funktionen zur Verfügung um z.B. Knotensätze zu zählen, Positionen abzufragen oder Zeichenketten (strings) zu bearbeiten XPath-Ausdrücke können absolute oder relative Pfade beschrei- ben. Relative Pfade sind abhängig von der gegenwärtigen Position (dem "selbst" bzw. "Kontextknoten")

XPath-Achsen In der Regel steuert man Elemente über ihre Eltern-Kind-Bezie- hung und/oder ihre Namen an. Oft ist ihre Position aber genauer anzugeben. Dabei helfen die XPath-Achsen parent / ancestor / ancestor-or-self child / descendant / descendant-or-self preceding / preceding-or-self / preceding-sibling following / following-or-self / following-sibling attribute

XPath – Syntax und Beispiele I /  das Dokument; die Wurzel .  das Selbst; der Kontextknoten *  ein beliebiger Name |  eine oder-Verknüpfung @...  ein Attribut […]  eine Bedingung [not (…)]  eine verneinte Bedingung titel  Kindelemente des Kontextknotens, die auf den Namen "titel" hören //titel  Elemente mit dem Namen "titel" in beliebiger Tiefe des Baumes (unterhalb des Kontextknotens) ../absatz  Elemente mit Namen "absatz" als Kinder eine Hierarchiestufe über dem Kontextknoten ancestor::playlist  Elemente mit Namen "playlist" beliebig viele Hierarchiestufen über dem Kontextknoten preceding::index  Elemente mit dem Namen "index",die im XML- Dokument vor dem Kontextknoten kommen

XPath – Syntax und Beispiele II @typ  der Wert des Attributs "typ" des Kontextknotens @*  alle Attribute des Kontextknotens song[album]  ein Kindelement "song", das ein Kindelement "album" hat //index[@typ='band']  ein Kindelement "index" in beliebiger Tiefe des Baums mit einem Attribut "typ" mit einem Attributwert "band" //sendung[not (programm)] – alle Sendungen, bei denen das programm- Element fehlt absatz[contains(.,'DJ')]  ein Kindelement "absatz", das die Zeichenkette "DJ" enthält count(//song)  die Anzahl der Elemente "song" in beliebiger Tiefe des Baumes name(*)  die Namen aller Kindknoten //person[not (contains(.,' '))  Personen, die kein Space haben (also keine Vor-Nachnamenkombination sind)

XSLT - Grundsätzliches eXtensible Stylesheet Language Transformation Sprache zur Transformation von XML-Dokumenten … in XML notiert … Geschichte: aus DSSSL entwickelt XSLT 1.0: W3C-recommendation von 1999 XSLT 2.0: W3C-recommendation von 2007 XSLT als Teilmenge von XSL (der andere Teil: XSL-FO)

XSLT - Hilfsmittel Flyer Erklärung der einzelnen Elemente (dt.)  http://de.selfhtml.org/xml/darstellung/xsltelemente.htm Tutorial (en.)  http://www.w3schools.com/xsl/ Offizielle Referenz des W3C  http://www.w3.org/TR/xslt20/

XSLT - Funktionsweise Aus einem Ausgangsdokument (.xml) wird mit Hilfe einer Verarbeitungsanweisung (.xslt) ein Ergebnisdokument (z.B. .html) generiert. Es gibt verschiedene XSLT-Prozessoren Saxon, Xalan, MSXML Es gibt ca. 50 Elemente = "Befehle" in XSLT 2.0 (im xsl-Namensraum) Konzept der drei Bäume (Traversieren der Bäume) Konzept der Schablonen (templates) Verknüpfung von XML- und XSLT-Dokument

XSLT – wichtige Elemente <xsl:template match="XPath-Ausdruck"> <xsl:apply-templates> <xsl:value-of select="XPath-Ausdruck"> <xsl:for-each select="XPath-Ausdruck"> <xsl:sort> <xsl:if test="Ausdruck"> <xsl:element>, <xsl:attribute>, <xsl:text>