ECM – Enterprise Content Management

Slides:



Advertisements
Ähnliche Präsentationen
25. Mai 2001Kleyer/Oyen/ReuseFolie 1 Fallstudie im Rahmen des Studienganges Wirtschaftsinformatik Christian Kleyer, Daniel Oyen, Svend Reuse Grundkonzeption.
Advertisements

Extensible Markup Language
Worzyk FH Anhalt Datenbanksysteme für FÜ WS 2004/2005 XML - 1 XML Extensible Markup Language.
DTD XML-Technik Dino Azzano. Definition Document Type Definition Beschreibung der Regeln zum Aufbau aller XML-Dokumente, die zu einer Dokumentklasse.
Anmerkungen zu XML Im September 2000 Entwicklung/Anspruch von XML
XML - Aufbau und Struktur - mit Einsatz im B2B
Hands On – Einführung in XML
IMS Universität Stuttgart 1 Einführung in XML Hannah Kermes HS: Elektronische Wörterbücher Do,
HTML - Einführung Richard Göbel.
FH-Hof Extensible Markup Language Richard Göbel. FH-Hof Extensible Markup Language XML XML ist universeller Ansatz für die Strukturierung von Zeichenketten.
DOM (Document Object Model)
Seminar XML und Datenbanken Sven Wiegelmann SS 2002.
XINDICE The Apache XML Project Name: Jacqueline Langhorst
XML-Schema HKI Proseminar Wintersemester 2010/11 Dozentin: Frau Kurz von Jan Kohl und Christian Lütticke.
HTML - Eine erste Annäherung
XML-basierte Techniken
© 2002 Prof. Dr. G. Hellberg 1 XML-Seminar XML-Technologie: XML in Theorie und Praxis Prof. Dr. G. Hellberg XML-Technologie: XML in Theorie und Praxis.
XHTML 1.1 C. Nimz Abstrakte Module XHTML 1.1 C. Nimz Was ist ein abstraktes Modul? Definition eines XHTML-Moduls in spezieller leichter.
Modularization of XHTML™
Überblick XML: Extensible Markup Language Entwickelt, um Informationen bereitzustellen, zu speichern und zu übertragen Im Gegensatz zu HTML keine vordefinierten.
Edgar - Ein Texteditor Ein Vortrag von Carsten Severin.
XML in Datenbanksystemen. © Prof. T. Kudraß, HTWK Leipzig 2 2 Warum wird XML eingesetzt? Antworten von Unternehmen: erweiterte Suchmöglichkeiten im Unternehmen.
SQL/XML. © Prof. T. Kudraß, HTWK Leipzig 2 2 Motivation Speicherung von XML in allen großen kommerziellen DBMS vorhanden proprietäre Lösungen für die.
Grundlagen von XML. © Prof. T. Kudraß, HTWK Leipzig Geschichte Grundidee generic coding - Trennung Information/Form formal definierter Dokumenttyp verschachtelte.
XML Standardisierungen und Abfragesprachen
Grundlagen von XML. © Prof. T. Kudraß, HTWK Leipzig Geschichte Grundidee generic coding - Trennung Information/Form formal definierter Dokumenttyp verschachtelte.
Einführung XML XML Einführung Andreas Leicht.
Vorlesung: 1 Betriebliche Informationssysteme XML © 2002 Prof. Dr. G. Hellberg Studiengang Informatik FHDW Vorlesung: Betriebliche Informationssysteme.
DVG Kommentare1 Kommentare. DVG Kommentare 2 Kommentare Es gibt zwei Arten von Kommentaren: einzeilige Kommentare // der Kommentar geht.
DVG Kommentare 1 Kommentare. 2 Kommentare Es gibt zwei Arten von Kommentaren: einzeilige Kommentare // der Kommentar geht bis zum Ende der Zeile.
1 XML und Datenbanken Kapitel 7: Modellierung, Teil 1 Meike Klettke Universität Rostock Fakultät für Informatik und Elektrotechnik
XML und Datenbanken - Einführung in XML -
Tobias Högel & Dennis Böck,
1 Grundlagen und Anwendung der Extensible Markup Language (XML ) Peter Buxmann Institut für Wirtschaftsinformatik Johann Wolfgang Goethe-Universität Frankfurt.
Integration operativer Systeme für Electronic Business
Was versteht man unter XML Schema?
XSLT.
Vortrag HTML, XHTML, DHTML
XML DTD.
XML eXtensible Markup Language
DTD – Deklaration von Elementen Beschreibt die Einschränkungen des Inhalts eines Elements Syntax: Einziger atomarer Typ: #PCDATA (Parsed Character DATA)
XML – Schema (DTD).
Fortsetzung DTDs, UML  XML
Wird ganz am Anfang der HTML-Datei geschrieben Doctype html public bedeutet, dass man sich auf die Öffentlichkeit der html-dtd bezieht Html ist die meist.
Java für Fortgeschrittene
Information und ihre Darstellung: XHTML & CSS
Windows Presentation Foundation, Vorlesung Wintersemester 2013/14 Prof. Dr. Herrad Schmidt WS 13/14 Kapitel 2 Folie 2 XAML (1) s.a.
Daniel Kucher Proseminar XHTML. 1. HTML – Struktur und Versionen 2. Der – Teil 3. Der – Teil 4. Stylesheets (CSS) – Das Rückrat von XHTML.
Wohlgeformtheit und Gültigkeit Grundlagen der Datenmodellierung Anke Jackschina.
Ausgabe vom Seite 1, XML Eine Einführung XML - Eine Einführung.
XML in relationalen Datenbanken
XML (Extensible Markup Language)
ADAT©2004 Dipl. - Ing. Walter SabinSeite: 1 Version 1.0a XML EXTENSIBLE MARKUP LANGUAGE.
Kurzpräsentation von Herbert Schlechta
© 2001 Sven Dammann1 Aufbau Integrierter Informationssysteme XML Bearbeitung und relationale Abbildung Sven Dammann Martin-Luther-Universität Halle-Wittenberg.
Hauptseminar Web-Services und verteilte Datenbanken Thema XML, DTDs und XML-Schema XML, DTDs und XML-Schema - Stefan Kurz, 25. April 2003.
- Warum: Das HTML-Dilemma
IT-Zertifikat der Phil.Fak Kurs 4: Daten- und Metadatenstandards Patrick Sahle XML-BasicsWS 08/09.
Seminar zur Geoinformation Folie 1 Inhalt: –XML –XML- SCHEMA –XSL –Syntax –GML Seminar zur Geoinformation Datenaustausch mit XML / GML im InternetDatenaustausch.
Peter Brezany Institut für Softwarewissenschaften Universität Wien
XML Schema Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung WS2011/2012 Hist.-kult.wiss. Informationsverarbeitung (Teil.
Geoinformation3 Geoinformation III XML Grundlagen und Dokumentspezifikation Vorlesung 12b.
Institut für Kartographie und Geoinformation Prof. Dr. Lutz Plümer Dr. Thomas H. Kolbe Geoinformation III XML Grundlagen und Dokumentspezifikationen Vorlesung.
Geoinformation3 Geoinformation III XML Grundlagen, Namensräume und Hyperlinks Vorlesung 12b.
DTD und W3C XML Schema Seminar XML und Datenbanken Vortrag: Sven Blüge.
Einführung xHTML / cHTML Stefan Pietschmann | Katja Pischke Gliederung Einführung xHTML  Überblick  Gründe für xHTML  Unterschiede zu HTML  DTDs und.
Document Type Definitions (DTDs) Marko Harasic Freie Universität Berlin Institut für Informatik Netzbasierte Informationssysteme
13.Dezember 2006–1Elektronisches Publizieren: Schemasprachen — Relax NG Schemasprachen für XML — Relax NG — Anne Brüggemann-Klein TU München.
Validierung vom XML mit XML Schema
Dokumentenproduktion im Medienzentrum
 Präsentation transkript:

ECM – Enterprise Content Management Konzepte und Techniken rund um Dokumente 2009 / 1. Auflage Kapitel 2 / Capture - XML © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags

XML- Historie, Ziel, Position zu HTML Struktur und Syntax Gliederung XML- Historie, Ziel, Position zu HTML Struktur und Syntax XPath, XQuery, Ablage © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 2

XML ist die einzige Möglichkeit, Warum XML ? XML ist die einzige Möglichkeit, die Vielzahl der Daten, Anwendungen und Geräte des E-Business zu verwalten © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 3

Historische Entwicklung © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 4

Zwei Motive haben die Entwicklung von XML ausgelöst: Entwicklungsmotive Zwei Motive haben die Entwicklung von XML ausgelöst: Die seit 1969 für die Beschreibung von Dokumentenstrukturen verwendete Standard Generalized Markup Language SGML war zu komplex. HTML als die einflussreichste aus SGML abgeleitete Auszeichnungssprache erwies sich wegen des weitgehend fixierten Satzes von Elementtypen als zu starr © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 5

XML-Beispiel Quelle: GS1 Germany 6 © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 6

XML ist ein offener Standard XML-Merkmale XML ist ein offener Standard XML basiert auf selbstbeschreibenden Merkmalen (Kontext als auch Inhalt) XML ist leicht erlernbar XML ist leicht sowohl von Rechnern als auch von Menschen zu lesen XML Dokumente sind leicht erweiterbar XML ist plattform- und anwendungsunabhängig © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 7

XML als Integrationswerkzeug EDI Business-to-Consumer Transaktion VS. Inhaltsverteilung Kommunikation zwischen Anwendungen Quelle : Hochberg, SAG-Symposium, 2000 © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 8

zentrales Datenmanagement XML-Dokumententypen Briefe kj flsjd kjs lskjlkj lskjd lksjl fslk jdlksj fksjdlkjlkjf lskjdlkjf slkjkj flskdjljdkfj s lkjlkjlsd s dfl skjd f slkdjflskdj lslkjdflk lskjd lfksjdlk lskdjfl aölskjdfölskdjf söldkfjlskdj föaslkdjlskdjf ösldkfjlskd föalskdj ksjdlfkjslkjd existierende Datenbanken Fax Edmund Boister Minimillennium Minga Kunden# 08/15-4711 Sehr geehrte Damen und Herren! Bitte fakturieren Sie folgenden Auftrag: # Beschreibung Listen asdas ddas(asdsad) asdasddasda asdasdsd asdasdsdasdsdasdas sdassdsdasd sdas sdasds dassdasdsdasd(werwe) sdasdaskjl lkjf ölkjglkdf jgs kjlkfjgölkfjg lkdfjg ldkfjglö dkfjlgdkk E-Mails kjfskdjfl asdasdasdasd lkjfkjdflks fa sdf asdfsdf as kjlfkjslkjkjl df asdf sdfsd laskjdkdjf lskdj sd hflaksjdhf sdksldjfslkdf skk fksjdlfj öalsjdlfksjdf slkd lksdjf slkdfjlkdj aölskdjf skdjf slkjlj öa södlfjlkd föjkal llksd fjlakkjshd fkahlkh kshd flaksh slkdf lkjflksjdföa ljls df lskjd flkj kj flkahksjd flkajkjsh flkajsh dfkj h ksj fksjdhf la Projekt- daten Prozess- beschreibungen Bilder Video Audio zentrales Datenmanagement © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 9

XML für verschiedene Layouts und Geräte Bild Drucker Internet CD Bericht Frankfurt: Wind 4 WNW / Rain / 22°C News Ticker Wetter- daten © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 10

Einordnung – Demo-Video XML - Überblick Einordnung – Demo-Video © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 11

XML: Trennung von Content und Layout Darstellung der logischen Struktur von Dokumenten Layoutinformationen davon separat Quelle: Roland Boendgen © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 12

XML-Strukturphilosophie © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 13

erlaubt selbstbeschreibende Daten XML Programming Interface XML-Nutzen XML Tags erlaubt selbstbeschreibende Daten XML Programming Interface arbeitet mit jedem Programmiermodell zusammen XML Style Sheets erleichtert die Personalisierung von Informationen XML Document Type Definitions gestattet eine Dokumentenbeschreibung für unterschiedlichste Belange Quelle : Viljoen, SAG-Symposium, 2000 © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 14

Im Mittelpunkt stehen Dokumente Struktur von XML Im Mittelpunkt stehen Dokumente © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 15

HTML vs. XML HTML XML Struktur Festgelegt durch Struktur-Tags.   HTML XML Struktur Festgelegt durch Struktur-Tags. Dokumentstruktur bestimmt Anordnung der Tags. Nicht erweiterbar. Festlegung einer eigenen Struktur durch selbstdefinierte Tags. Anordnung der Tags bestimmt Struktur des Dokuments. Beliebig erweiterbar. Inhalt Wird vom Autor festgelegt. Tags dienen der Formatierung des Textes zwischen den Tags. Dynamischer Zugriff auf den Text ohne Hilfsmittel nicht möglich. Tags beinhalten den Text des Dokuments. Dynamischer Zugriff durch spezielle Zugriffsmethoden auf den Inhalt der Tags möglich. Darstellung Zentral im HTML Dokument durch Tags, die Formatanweisungen enthalten Formatanweisungen sind ausgelagert in externe Datei © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 16

Darstellung von XML-Dokumenten HMTL Seiten nutzen vordefinierte Tags für die Formatierung – der Browser interpretiert diese XML zeichnet sich durch eine unendliche Menge möglicher Tags aus – daher ist es unmöglich ein definiertes Layout für diese Tags im Browser festzulegen XSL (Extensible Stylesheet Language) ist ein Zusatzstandard, der XML-Dokumente formatiert und mit bedingten Anweisungen ausgeben kann © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 17

XML- Historie, Ziel, Position zu HTML Struktur und Syntax Gliederung XML- Historie, Ziel, Position zu HTML Struktur und Syntax XPath, XQuery, Ablage © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 18

Inhaltliche Strukturen lassen sich in beliebiger Tiefe schachteln Besonderheiten Anwender definieren ihre eigenen Tags oder greifen auf öffentlich verfügbare Tagmengen zurück, die für verschiedene Anwendungsbereiche angeboten werden. Inhaltliche Strukturen lassen sich in beliebiger Tiefe schachteln Die verwendeten Tagnamen lassen einen Rückschluss auf die Bedeutung der Daten zu. Dagegen wird die Darstellung nicht explizit festgelegt. XML erlaubt die Festlegung externer Bezüge für ein Dokument. Derartige Referenzen werden aufgelöst und durch die entsprechende Entität ersetzt. Mittels Referenzen werden Entitäten in einem Dokument bei Bedarf mehrfach verwendet. Auf diese Weise lässt sich ein XML-Dokument aus vorgefertigten Teilen zusammensetzen. © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 19

Informationseinheiten Elf Typen von Informationseinheiten werden unterschieden: Dokument Element Attribut Verarbeitungsanweisung Entitätsreferenz Zeichen Kommentar Dokumenttyp-Deklaration Ungeparste Entität Notation Namensraum © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 20

Bedeutung der Informationseinheiten Die wichtigsten Komponenten in der sich der Inhalt widerspiegelt, sind Elemente und Attribute. Das XML-Dokument ist als Baum strukturiert mit einer Wurzel, die alle Elemente umschließt © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 21

Danach sind Kommentare oder Verarbeitungsanweisungen erlaubt. XML-Syntax Um wohlgeformt zu sein, muss ein Dokument syntaktische Regeln der XML-Grammatik erfüllen. Dabei gilt: Jedes wohlgeformte Dokument beginnt mit einem Prolog, dem mindestens ein Element folgt. Danach sind Kommentare oder Verarbeitungsanweisungen erlaubt. Hinter dem Prolog beginnen die XML-Daten in Form eines Baumes aus Elementen und Attributen. Das erste Element ist das Wurzelelement, das alle anderen Elemente einschließt © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 22

XML-Deklaration - Video © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 23

XML - Baum © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 24

Aufbau eines XML-Dokumentes Bestandteile eines XML-Dokumentes Vorspann DTD (intern oder extern) XML © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 25

XML-Dokumentenstruktur © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 26

XML-Dokumentenbeispiel © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 27

XML definiert Baumstruktur! Wurzel heißt Dokumentelement XML-Dokument - Baum XML definiert Baumstruktur! Wurzel heißt Dokumentelement Blattelemente enthalten Werte Einziger Datentyp: Zeichenkette © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 28

XML nennt seine Objekte Elemente Elemente sind begrenzt durch Tags XML - Objekte XML nennt seine Objekte Elemente Elemente sind begrenzt durch Tags Tagnamen sind "case-sensitive" Jedes geöffnete Tag muss auch wieder geschlossen werden Tags dürfen einander nicht überlappen; nicht erlaubt z. B.: <A> <B> </A> </B> Tags leerer Elemente haben besondere Syntax: <A/> (Shortcut für <A> </A>) Tags können Attribute enthalten: <A Attributname="Wert" ...> </A> Eine korrekte Schachtelung ist notwendig (anders als in HTML). XML-Elemente dürfen nicht überlappen. © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 29

Vorspann eines XML-Dokumentes version gegenwärtig nur 1.0, 1.1 falls zukünftig weitere Versionen als Empfehlung vom W3C verabschiedet werden, dann ermöglicht der Parameter die Verarbeitung verschiedener Versionen. encoding (optional) Kodierung des Dokuments, Beispiele (UTF-8 – auch Defaultwert, UTF-16 - müssen ebenfalls alle XML-Prozessoren unterstützen). standalone (optional) 'yes' - spezifiziert, dass dem Dokument eine externe Markup-Deklaration (DTD oder XML-Schema) zugeordnet wird, sonst 'no' Defaultwert 'no'‚ wenn externe Deklaration definiert ist und standalone nicht angegeben ist © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 30

<?XML version="1.0" encoding="UTF-8" standalone="yes"> Beispiele - Vorspann <?XML version="1.0" encoding="UTF-8" standalone="yes">   <?XML version="1.0" encoding="UTF-16" standalone="no"> <!DOCTYPE tourismus-infos SYSTEM "tourismus.dtd"> © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 31

XML - Grammatik © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 32

Grammatik - Besonderheiten Anders als bei HTML ist auf Groß- und Kleinschreibung zu achten. Ein Name muss mit einem Buchstaben, einem Unterstrich oder einem Doppelpunkt beginnen Elemente sind mit beliebig vielen Attributen definierbar, mit Paaren von Attributname und Attributwert Jedes angegebene Attribut muss einen Wert haben, der in Hochkommata oder Anführungszeichen eingeschlossen ist. Mehrere Attribute werden durch Leerzeichen getrennt. Ob in einer Dokumentenstruktur ein Objekt besser als Element oder Attribut behandelt wird, obliegt dem Anwender © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 33

Grammatik - Namensräume Die freie Namenswahl bei Elementen und Attributen wirft Probleme auf, wenn die gleichen Namen mit unterschiedlicher Bedeutung verwendet werden. <beitrag> kann Mitgliedsbeiträge oder Artikel für eine Zeitschrift bedeuten. Um Mehrdeutigkeiten zu vermeiden, ordnet man Namen Namensräumen zu. Diese werden durch eine eindeutige URI-Referenz identifiziert. Der URI wird über ein xmlns-Attribut ein Präfix zugeordnet: <mitglieder xmlns:mtg=„http://mitglieder.de/organisation“> Ein Element dieses Namensraums wird wie folgt angesprochen: <mtg:beitrag>100</mtg:beitrag> © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 34

Aufbau von XML-Dokumenten 1 Komponenten eines Buchs Elemente eines XML Dokuments © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 35

Aufbau von XML-Dokumenten 2 <order> <customer>Meyer</customer> <position> <isbn>1-234-56789-0</isbn> <number>2</number> <price currency=´Euro´>30.00</price> </position> </order> <content> XML builds on the principles of two existing languages, <emph>HTML </emph> and <emph>SGML </emph> to create a simple mechanism .. The generalized markup concept .. </content> Markup in Volltexten Mixed Content Elemente Elemente und Attribute hierarchische Schachtelung Sequenz Quelle: Viele der folgenden Folien basieren auf Meike Klettke, UNI Rostock © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 36

Ein Element besteht aus: Start-Tag Ende-Tag und Elementinhalt Syntax von Elementen /1 Ein Element besteht aus: Start-Tag Ende-Tag und Elementinhalt Beispiel: <vortragender> Ronald Bourret </vortragender> Start-Tag Elementinhalt Ende-Tag © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 37

Leere Elemente sind möglich: Beispiel: <koordinaten/> Syntax von Elementen /2 Leere Elemente sind möglich: Beispiel: <koordinaten/> Elemente können verschachtelt werden: <vortragender> <name>Bourret</name> <vorname>Ronald</vorname> </vortragender> Start-Tag Elementinhalt Ende-Tag © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 38

Graphische Darstellung von XML-Dokumenten XML-Dokumente sind Bäume! Beispiel: <vortragender> <name>Bourret</name> <vorname>Ronald</vorname> </vortragender> korrekte Schachtelung der Elemente notwendig Elementknoten Textknoten © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 39

Document Type Definition Einordnung von Dokumenten in Kategorien, macht Dokumente unterscheidbar Entscheidend dafür sind die Elemente, die das jeweilige Dokument enthält Um Elemente, die zu einem Dokument gehören zu definieren, verwendet man in XML die DTD © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 40

Schemabeschreibung - DTD Darstellung, welche Elemente auftreten können und wie sie geschachtelt werden Deklaration von Strukturinformationen Vorteile einer DTD: Entspricht einer Dokumentation für die XML-Dokumente Anwendungen können darauf reagieren Fehler in XML-Dokumenten können erkannt werden Oft: bessere Qualität der XML-Dokumente, weil durchdachteres Vorgehen PCDATA = Parsed Character Data © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 41

Definition von Elementen in einer DTD XML-Dokument: <vortragender> Ronald Bourret </vortragender> Zugehörige DTD: <!ELEMENT vortragender (#PCDATA)> <vortragender> <name> Bourret </name> <vorname> Ronald </vorname> </vortragender> <!ELEMENT vortragender (name, vorname)> <!ELEMENT name (#PCDATA)> <!ELEMENT vorname (#PCDATA)> © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 42

Definition von Elementen in einer DTD (Inhaltsmodelle) Sequenz (A , B) A und B müssen in der angegebenen Reihenfolge im Dokument auftreten Alternative (A | B) entweder A oder B treten im Dokumente auf Wiederholung A? - 0..1 Mal A+ - 1..n Mal A* - 0..n Mal Mixed Content (#PCDATA | A | B)* A, B oder beliebiger Text treten im Dokument auf <!ELEMENT hotel (name, adresse)> <!ELEMENT name (#PCDATA)> <!ELEMENT adresse (plz, ort, ((strasse, nummer?) | postfach))> <!ELEMENT beschreibung (#PCDATA | ausstattung | gastronomie)*> © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 43

Beispiele zur Definition von Elementen in einer DTD /1 <!ELEMENT hotel (name, adresse)> <hotel> <name>Hotel am Leuchtturm</name> <adresse>...</adresse> </hotel> © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 44

Beispiele zur Definition von Elementen in einer DTD /2 <!ELEMENT adresse (plz, ort, ((strasse, nummer?) | postfach))> <adresse> <plz>18119</plz> <ort>Warnemuende</ort> <strasse>Seestrasse</strasse> <nummer>12</nummer> </adresse> <plz>18051</plz> <ort>Rostock</ort> <postfach>12345</postfach> © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 45

Beispiele zur Definition von Elementen in einer DTD /3 <!ELEMENT beschreibung (# PCDATA | ausstattung | gastronomie)*> <beschreibung>Das Hotel am Leuchtturm befindet sich direkt am Alten Strom, mit Blick auf die Hafeneinfahrt, die Mole und den Strand.</beschreibung> <beschreibung>Unser Hotel verfügt über eine <ausstattung> Sauna </ausstattung> und eine <ausstattung> Meerwasserschwimmhalle </ausstattung>. Das <gastronomie> Hotelrestaurant</gastronomie> bietet regionale Küche und Fischspezialitäten. </beschreibung> © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 46

Syntax von Attributen /1 Attribute werden einem Element des XML-Dokumentes zugeordnet: <vortragender tutorial=´T1´> Ronald Bourret </vortragender> Attributwert Attributname Start-Tag Elementinhalt Ende-Tag Zugehörige DTD: <!ELEMENT vortragender (#PCDATA)> <!ATTLIST vortragender tutorial CDATA #REQUIRED> © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 47

Syntax von Attributen / 2 XML-Dokument <koordinaten x=´200´ y=´300´ z=´150´ /> DTD <!ELEMENT koordinaten (EMPTY)> <!ATTLIST koordinaten x CDATA #REQUIRED y CDATA #REQUIRED z CDATA #IMPLIED > © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 48

Darstellung von XML-Dokumenten XML-Dokumente sind Bäume! Beispiel: <vortragender tutorial=´T1´> <name>Bourret</name> <vorname>Ronald</vorname> </vortragender> vortragender tutorial name vorname T1 Ronald Bourret Elementknoten Textknoten Attributknoten © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 49

Deklaration von Attributen in einer DTD Attribute haben einen Namen einen Typ (CDATA, ID, IDREF/IDREFs, ENTITY/ENTITYS, NMTOKEN/NMTOKENS oder (wert1|wert2|...) Aufzählung möglicher Werte eine Angabe, ob das Attribut auftreten muss (#REQUIRED, #IMPLIED oder #FIXED) oder einen optionalen Defaultwert (bei #FIXED ist dieser auch erforderlich) <!ATTLIST preis waehrung CDATA #REQUIRED> <!ATTLIST projekt id ID #REQUIRED> <!ATTLIST person projekt IDREF #REQUIRED> <!ATTLIST plz xml-sqltype CDATA #FIXED ´INTEGER´> © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 50

Zusammenfassung der DTD-Deklarationen © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 51

DTD-Elementdeklaration © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 52

DTD-Attributdeklaration © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 53

DTD-Attributdeklaration - Beispiel © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 54

Beispiel: Bookstore © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 55

DTD-Deklarationsformen © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 56

Beispiel – externe Deklaration © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 57

Kommentare können in DTDs und in XML-Dokumenten auftreten Kommentare lassen sich durch Applikationen auswerten (z.B. mit XML-Prozessoren, XSLT) Syntax: <!-- Dies ist ein Beispielkommentar --> © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 58

XML-Editoren - Video XML-Editoren 59 © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 59

XML- Historie, Ziel, Position zu HTML Struktur und Syntax Gliederung XML- Historie, Ziel, Position zu HTML Struktur und Syntax XPath, XQuery, Ablage © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 60

XML-Zugriff Quelle: Gorke, 2006 61 © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 61

XPath Quelle: Gorke, 2006 © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 62

XQuery Quelle: Gorke, 2006 © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 63

Den Ablauf einer Bestellung unter Verwendung von XML Materialien Den Ablauf einer Bestellung unter Verwendung von XML zeigt eine Simulation IBM stellt unterschiedliche Tutorials bereit (in englisch) XML-Tutorial (in deutsch) und ein zweites XML-Tutorial (in deutsch) Die UNI Rostock bietet einen Foliensatz zum Thema Videos und Tutorials bietet Stylusstudio Empfehlenswertes Online-Buch Tutorials zu XML-Begleitstandards © Wolfgang Riggert | ECM – Enterprise Content Management Vieweg+TeubnerPLUS Zusatzinformationen zu Medien des Vieweg+Teubner Verlags 64