IT-Zertifikat der Phil.Fak Kurs 4: Daten- und Metadatenstandards Patrick Sahle XML-BasicsWS 08/09.

Slides:



Advertisements
Ähnliche Präsentationen
XML-basierte Techniken
Advertisements

25. Mai 2001Kleyer/Oyen/ReuseFolie 1 Fallstudie im Rahmen des Studienganges Wirtschaftsinformatik Christian Kleyer, Daniel Oyen, Svend Reuse Grundkonzeption.
Extensible Markup Language
Worzyk FH Anhalt Datenbanksysteme für FÜ WS 2004/2005 XML - 1 XML Extensible Markup Language.
IT-Zertifikat der Phil.Fak
Anmerkungen zu XML Im September 2000 Entwicklung/Anspruch von XML
Zeitplan. Zeitplan Inhalt Datenmodellierung Syntax Java / .NET-Einsatz Datenbanken.
1. Einführung. 1. Einführung Inhalt Einführung Vorlagen XPath Kontrollstrukturen Sortierung, Gruppierung und Nummerierung Parameter und Variablen Ein-
XML Einführungskurs Referentin: Dipl.-Dok. Rusalka Offer
XML - Aufbau und Struktur - mit Einsatz im B2B
Hands On – Einführung in XML
IMS Universität Stuttgart 1 Einführung in XML Hannah Kermes HS: Elektronische Wörterbücher Do,
HTML - Einführung Richard Göbel.
FH-Hof Extensible Markup Language Richard Göbel. FH-Hof Extensible Markup Language XML XML ist universeller Ansatz für die Strukturierung von Zeichenketten.
DOM (Document Object Model)
Seminar XML und Datenbanken Sven Wiegelmann SS 2002.
XPATH XML Path Language. Xpath – XML Path Language IT Zertifikat - Daten und Metadatenstandards: XPath 2 Entwicklung des W3C Adressierungssprache für.
XML-Schema HKI Proseminar Wintersemester 2010/11 Dozentin: Frau Kurz von Jan Kohl und Christian Lütticke.
Eine Biografie aus ADB/NDB als XML Datenbanken vs. Markup Prof Dr. Manfred Thaller WS 2009 / 2010 Referent: Bilal Erkin.
HTML - Eine erste Annäherung
Gottfried Vossen 5. Auflage 2008 Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme Kapitel 10: Einführung in XML.
© 2002 Prof. Dr. G. Hellberg 1 XML-Seminar XML-Technologie: XML in Theorie und Praxis Prof. Dr. G. Hellberg XML-Technologie: XML in Theorie und Praxis.
XHTML 1.1 C. Nimz Abstrakte Module XHTML 1.1 C. Nimz Was ist ein abstraktes Modul? Definition eines XHTML-Moduls in spezieller leichter.
Modularization of XHTML™
Überblick XML: Extensible Markup Language Entwickelt, um Informationen bereitzustellen, zu speichern und zu übertragen Im Gegensatz zu HTML keine vordefinierten.
Grundlagen von XML. © Prof. T. Kudraß, HTWK Leipzig Geschichte Grundidee generic coding - Trennung Information/Form formal definierter Dokumenttyp verschachtelte.
XML Standardisierungen und Abfragesprachen
Grundlagen von XML. © Prof. T. Kudraß, HTWK Leipzig Geschichte Grundidee generic coding - Trennung Information/Form formal definierter Dokumenttyp verschachtelte.
Einführung XML XML Einführung Andreas Leicht.
Tobias Högel & Dennis Böck,
1 Grundlagen und Anwendung der Extensible Markup Language (XML ) Peter Buxmann Institut für Wirtschaftsinformatik Johann Wolfgang Goethe-Universität Frankfurt.
Was versteht man unter XML Schema?
Der Supermarkt: Eine beispielhafte Erklärung für die fünf untersten Schichten des Semantic Web Protocol Stack Nicola Henze.
Vortrag HTML, XHTML, DHTML
XML eXtensible Markup Language
Java für Fortgeschrittene
Information und ihre Darstellung: XHTML & CSS
Wohlgeformtheit und Gültigkeit Grundlagen der Datenmodellierung Anke Jackschina.
Ausgabe vom Seite 1, XML Eine Einführung XML - Eine Einführung.
Kongress99-xml.ppt-1 ( ) 1999 © Maximilian Riegel XML Kommunikationsnetz Franken e.V. XML - die zukünftige Sprache des WWW? Max Riegel Daten im.
XML (Extensible Markup Language)
ADAT©2004 Dipl. - Ing. Walter SabinSeite: 1 Version 1.0a XML EXTENSIBLE MARKUP LANGUAGE.
© 2001 Sven Dammann1 Aufbau Integrierter Informationssysteme XML Bearbeitung und relationale Abbildung Sven Dammann Martin-Luther-Universität Halle-Wittenberg.
Hauptseminar Web-Services und verteilte Datenbanken Thema XML, DTDs und XML-Schema XML, DTDs und XML-Schema - Stefan Kurz, 25. April 2003.
IT-Zertifikat der Phil.Fak Kurs 4: Daten- und Metadatenstandards Patrick Sahle Semantic WebWS 08/09.
- Warum: Das HTML-Dilemma
XML Die “E-Lance Economy” oder die “Digital Economy” stellt neue Anforderungen an Funktionalität im Netz. XML wurde vom World Wide Web Consortium (W3C)
Seminar zur Geoinformation Folie 1 Inhalt: –XML –XML- SCHEMA –XSL –Syntax –GML Seminar zur Geoinformation Datenaustausch mit XML / GML im InternetDatenaustausch.
- XML: Das Sprachkonzept
- XML: Das Sprachkonzept
Text Encoding Initiative Universität zu Köln Daten- und Metadatenstandards Seminarleitung: Patrick Sahle Seminarleitung: Patrick Sahle Referentin: Anna.
Peter Brezany Institut für Softwarewissenschaften Universität Wien
Geoinformation3 Geoinformation III XML Grundlagen und Dokumentspezifikation Vorlesung 12b.
Institut für Kartographie und Geoinformation Prof. Dr. Lutz Plümer Dr. Thomas H. Kolbe Geoinformation III XML Grundlagen und Dokumentspezifikationen Vorlesung.
Geoinformation3 Geoinformation III XML Grundlagen, Namensräume und Hyperlinks Vorlesung 12b.
XML Grundlagen, Namensräume & Hyperlinks
TEI Die Text Encoding Initiative (TEI-Konsortium), 1987 gegründet - Dokumentenformat (zunächst SGML)‏
Vorteile von XML Die installed base von HTML, HTTP und Webbrowsern XML ist einfach und portabel XML kann Dokumente beliebiger Komplexität abbilden XML.
XML - Warum: Das HTML-Dilemma HTML, SGML, XML - Wie: Syntax, Konzepte, Sprachelemente Basics Wohlgeformte XML-Dokumente (ohne DTD) Gültige XML-Dokumente.
XML - Warum: Das HTML-Dilemma HTML, SGML, XML - Wie: Syntax, Konzepte, Sprachelemente Basics Wohlgeformte XML-Dokumente (ohne DTD) Gültige XML-Dokumente.
IT-Zertifikat_Seminar: Metadatenstandards XSLT Eine Transformationssprache.
XSLT I Re-usable Content in 3D und Simulationssystemen Dozent: Prof. Manfred Thaller Referentin: Elisabeth Chang.
Semantic Markup für Zwecke der Langzeitarchivierung in digitalen Bibliotheken Neubiberg,
8.November 2006 ― 1Elektronisches Publizieren: XML Namespaces Kodierung strukturierter Dokumente im Web — XML Namespaces —
Document Type Definitions (DTDs) Marko Harasic Freie Universität Berlin Institut für Informatik Netzbasierte Informationssysteme
13.Dezember 2006–1Elektronisches Publizieren: Schemasprachen — Relax NG Schemasprachen für XML — Relax NG — Anne Brüggemann-Klein TU München.
Text Encoding Initiative (TEI) Universität zu Köln, SS 2009, HKI Seminar: Daten- und Metadatenstandards Dozent: Herr Sahle Referentin: Ulrike Henny Datum:
Einführung in XML 1-Tages-Kurs.
 Präsentation transkript:

IT-Zertifikat der Phil.Fak Kurs 4: Daten- und Metadatenstandards Patrick Sahle XML-BasicsWS 08/09

XML: allgemeines vorweg XML steht für: eXtensible Markup Language = erweiterbare Auszeichnungssprache XML ist eine Weiterentwicklung aus SGML XML ist eine Metasprache, die einen Satz Regeln vorgibt, nach denen Auszeichnungssprachen (ein Vokabular, ein „tag set“) entwickelt werden können XML ist wie HTML, nur anders XML ist eine Metasprache (s.o.) xHTML ist eine Anwendung von XML Die Richtlinien der TEI sind eine Anwendung von XML Beliebige lokale / eigene Vokabularien / Modelle können eine Anwendung von XML sein: Definiere deine eigenen Tags!

Warum sollte man XML benutzen? XML ist ein allgemeiner, offener Standard des W3C seit 1998 XML ist unabhängig von Plattformen (Betriebssystemen) oder Programmen XML ist einfach XML ist „plain text“ (Zukunftssicherheit) XML ist flexibel XML ist dokumentennah XML beschreibt abstrakte Datenstrukturen XML ist mächtig (XML tut nichts, XML beschreibt Daten, mit XML kann man viel tun) XML umfasst eine ganze Familie von begleitenden Standards XML wird von einer breiten Softwarepalette unterstützt XML ist ein weit verbreiteter Standard für die Beschreibung und den Austausch von Daten. XML ist die Grundlage vieler Anwendungsstandards („XML is everywhere“) XML ist in zunehmendem Maße die Grundlage von Online- Ressourcen

Ein paar grundsätzliche Regeln I Ein XML-Dokument besteht aus Textdaten und Tags. Es gibt namensgleiche öffnende ( ) und schließende ( ) Tags. Diese bilden zusammen mit den Textdaten ein „Element“. Es gibt auch leere Elemente ( ). Elementnamen sind „case sensitive“ ( ≠ ). Tags werden in spitzen Klammern ( ) notiert. Die spitzen Klammern dürfen in den Textdaten nicht vorkommen und werden durch Entities ersetzt: < - > Das gleiche gilt für "&"  & Textdaten. 10 > 9

Ein paar grundsätzliche Regeln II Elemente können geschachtelt werden und müssen sauber ge- schachtelt sein. Überlappung ist streng verboten! Die geschachtelten Elemente bilden einen „Baum“ Außer den eigentlichen XML-Elementen gibt es eine „xml declaration“ ( ) und ggf.weitere „processing instructions“ Ein XML-Dokument besteht aus einem Prolog und einem XML- Baum (einem – und nur einem! - Wurzelelement mit seinen „Kindern“ bzw. „Nachkommen“) text text text

Ein paar grundsätzliche Regeln III Elemente können Attribute enthalten. Attribute sind Paare aus Attributname und Attributwert. Der Attributwert steht in Anfüh- rungszeichen. Ein Element darf nicht zweimal das gleiche Attribut (Attributnamen) enthalten. Festschrift für Margarete Mustermann

Ein paar grundsätzliche Regeln IV Kommentare Entities Entities sind Platzhalter für etwas anderes. Sie werden bei der Verarbeitung des XML-Dokuments durch dieses "andere" ersetzt Syntax &name; - Beispiel > (für ">") Namespaces Namensräume geben an, in welcher Domäne (und damit: in welchem Sinne) ein Elementname verwendet wird. … tei:body ≠ html:body

XML als Datenstruktur XML-Daten können selbstbeschreibend sein XML-Daten sind sequentiell XML-Daten sind hierarchisch (Baum) XML-Daten können ein Netz sein XML kann rekursive Strukturen abbilden XML kann komplexe Strukturen abbilden Datenzentriertes XML vs. Dokumentorientiertes XML XML kann ein Modell vorgeben (XML kann präskriptiv sein); ein XML-Modell kann allmählich auf bestehenden Daten entwickelt werden (XML kann deskriptiv sein) XML (und ein XML-Modell) kann die Semantik von Daten beschrei- ben. Die Semantik selbst kann aber kaum formal gefasst werden. Elemente und Attribute haben unterschiedliche Ausdrucksmöglich- keiten

Wohlgeformt und gültig Man nennt ein XML-Dokument „wohlgeformt“ („well formed“), wenn es die Regeln von XML einhält. Ein wohlgeformtes Dokument kann geparsed, (z.B. mit XPath) navigiert und mit anderen XML-Standards verarbeitet werden Man nennt ein XML-Dokument „gültig“ („valid“), wenn es den Regeln eines Schemas entspricht. Strukturen und Inhalte eines gültigen XML-Dokuments können leichter kontrolliert, konsistent gehalten und verarbeitet werden. Ein Schema beschreibt ein Modell explizit.

XML herstellen XML bildet ein Modell ab; mit XML werden Daten modelliert Wo kommen die XML-Daten her? Man kann bestehende Datenstrukturen in XML abbilden Man kann Daten in ein XML-Modell einfügen Man kann bestehende Daten mit XML auszeichnen Beispielszenario: Digitale Texte mit XML Häufig werden mit XML implizite Befunde explizit gemacht In der Überführung typographischer Daten in XML werden typographische Informationen (Layoutinformationen) verallgemeinernd gedeutet

Die X-Familie XML … beschreibt strukturierte Daten XPath … erlaubt die Navigation in XML-Daten XMLSchema … beschreibt ein striktes Datenmodell XSL … eXtensible Style Language XSLT … transformiert XML-Dokumente XSL-FO … beschreibt eine formatierte Ausgabe (z.B. für den Druck) XLink … beschreibt komplexe Links XPointer … beschreibt XML-Zeiger XQuery … ist eine XML-Datenbankabfragesprache XForms … beschreibt Eingabeformulare

Schema? DTD als Beispiel … Es gibt verschiedene "Schema-Sprachen" z.B. DTD (Document Type Definition), XML Schema, RelaxNG (REgular LAnguage description for Xml New Generation) Ein Schema beschreibt, welche Elemente und Attribute (ggf. Attri- butwerte) es in einem Modell gibt und welche Elemente wo (worin) wie oft vorkommen dürfen ("Inhaltsmodelle") Beispiel: <!ATTLIST buch isbn CDATA #IMPLIED Syntax: "," = Abfolge,"|" = oder; Quantoren: "", "?", "+", "*" … aber wo kriege ich meine DTD eigentlich her? übernehmen, schreiben, generieren

Navigation im Baum? XPath! XPath bietet eine Syntax, um Elemente, Knoten und Knoten-Sätze in einem XML-Dokument anzusteuern Die Adressierung von Elementen kann mit Bedingungen verknüpft werden XPath stellt weitere Funktionen zur Verfügung um z.B. Knotensätze zu zählen, Positionen abzufragen oder Zeichenketten (strings) zu bearbeiten XPath-Ausdrücke können absolute oder relative Pfade beschrei- ben. Relative Pfade sind abhängig von der gegenwärtigen Position (dem "selbst" bzw. "Kontextknoten")

XPath-Achsen In der Regel steuert man Elemente über ihre Eltern-Kind-Bezie- hung und/oder ihre Namen an. Oft ist ihre Position aber genauer anzugeben. Dabei helfen die XPath-Achsen parent / ancestor / ancestor-or-self child / descendant / descendant-or-self preceding / preceding-or-self / preceding-sibling following / following-or-self / following-sibling attribute

XPath – Syntax und Beispiele I /  das Dokument; die Wurzel.  das Selbst; der Kontextknoten *  ein beliebiger Name |  eine  ein Attribut […]  eine Bedingung [not (…)]  eine verneinte Bedingung titel  Kindelemente des Kontextknotens, die auf den Namen "titel" hören //titel  Elemente mit dem Namen "titel" in beliebiger Tiefe des Baumes (unterhalb des Kontextknotens)../buch  Elemente mit Namen "buch" als Kinder eine Hierarchie- stufe überdem Kontextknoten ancestor::buch  Elemente mit Namen "buch" beliebig viele Hierarchiestufen über dem Kontextknoten preceding::titel  Elemente mit dem Namen "kind",die im XML- Dokument vor dem Kontextknoten kommen

XPath – Syntax und Beispiele  der Wert des Attributs "isbn" des  alle Attribute des Kontextknotens buch[titel]  ein Kindelement "buch", das ein Kindelement "titel" hat  ein Element "kind" in beliebiger Tiefe des Baums mit einem Attribut "lang" mit einem Attributwert "de" p[contains(.,'Walter')]  ein Kindelement "p", das die Zeichenkette "Walter" enthält count(//buch)  die Anzahl der Elemente "buch" in beliebiger Tiefe des Baumes name(*)  die Namen aller Kindknoten //buch[not  Bücher, die nicht im deutsch- sprachigen Raum verlegt worden sind