30.Oktober / 6.November 2006 ― 1Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML Kodierung strukturierter Dokumente im Web — XML.

Slides:



Advertisements
Ähnliche Präsentationen
Extensible Markup Language
Advertisements

Anmerkungen zu XML Im September 2000 Entwicklung/Anspruch von XML
XML - Aufbau und Struktur - mit Einsatz im B2B
IMS Universität Stuttgart 1 Einführung in XML Hannah Kermes HS: Elektronische Wörterbücher Do,
HTML - Einführung Richard Göbel.
FH-Hof Extensible Markup Language Richard Göbel. FH-Hof Extensible Markup Language XML XML ist universeller Ansatz für die Strukturierung von Zeichenketten.
DOM (Document Object Model)
XML-Schema HKI Proseminar Wintersemester 2010/11 Dozentin: Frau Kurz von Jan Kohl und Christian Lütticke.
Eine Biografie aus ADB/NDB als XML Datenbanken vs. Markup Prof Dr. Manfred Thaller WS 2009 / 2010 Referent: Bilal Erkin.
HTML - Eine erste Annäherung
XML-basierte Techniken
Gottfried Vossen 5. Auflage 2008 Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme Kapitel 10: Einführung in XML.
© 2002 Prof. Dr. G. Hellberg 1 XML-Seminar XML-Technologie: XML in Theorie und Praxis Prof. Dr. G. Hellberg XML-Technologie: XML in Theorie und Praxis.
XHTML 1.1 C. Nimz Abstrakte Module XHTML 1.1 C. Nimz Was ist ein abstraktes Modul? Definition eines XHTML-Moduls in spezieller leichter.
Modularization of XHTML™
Überblick XML: Extensible Markup Language Entwickelt, um Informationen bereitzustellen, zu speichern und zu übertragen Im Gegensatz zu HTML keine vordefinierten.
XML in Datenbanksystemen. © Prof. T. Kudraß, HTWK Leipzig 2 2 Warum wird XML eingesetzt? Antworten von Unternehmen: erweiterte Suchmöglichkeiten im Unternehmen.
Grundlagen von XML. © Prof. T. Kudraß, HTWK Leipzig Geschichte Grundidee generic coding - Trennung Information/Form formal definierter Dokumenttyp verschachtelte.
XML Standardisierungen und Abfragesprachen
Grundlagen von XML. © Prof. T. Kudraß, HTWK Leipzig Geschichte Grundidee generic coding - Trennung Information/Form formal definierter Dokumenttyp verschachtelte.
Einführung XML XML Einführung Andreas Leicht.
Hauptseminar XML-Technologie: Resource Description Framework (RDF) Michael Kranz Betreuer: Roland Haratsch.
XPointer Die Xpointer beschreiben einen Ort oder Bereich innerhalb einer XML-Instanz. Die XPointer bauen auf der XML Path Language auf. Die XPointer ist.
© data2type 2005, 1 Publishing mit XML Einsatz von XSL für das multimediale, automatisierte Publishing.
1 XML und Datenbanken Kapitel 7: Modellierung, Teil 1 Meike Klettke Universität Rostock Fakultät für Informatik und Elektrotechnik
XML und Datenbanken - Einführung in XML -
Tobias Högel & Dennis Böck,
1 Grundlagen und Anwendung der Extensible Markup Language (XML ) Peter Buxmann Institut für Wirtschaftsinformatik Johann Wolfgang Goethe-Universität Frankfurt.
FH-Hof HTML - Einführung Richard Göbel. FH-Hof Komponenten des World Wide Webs WWW Browser HyperText Transfer Protocol (HTTP) via Internet WWW Server.
Projekt Textorientierte Autorentools Werkzeugentwicklung aTool Springer Verlag – RWTH Aachen – TU München19. Februar 2001 Lehrstuhl für Informatik III.
Vortrag HTML, XHTML, DHTML
XML eXtensible Markup Language
Fortsetzung DTDs, UML  XML
Wird ganz am Anfang der HTML-Datei geschrieben Doctype html public bedeutet, dass man sich auf die Öffentlichkeit der html-dtd bezieht Html ist die meist.
Java für Fortgeschrittene
Wohlgeformtheit und Gültigkeit Grundlagen der Datenmodellierung Anke Jackschina.
Ausgabe vom Seite 1, XML Eine Einführung XML - Eine Einführung.
XML in relationalen Datenbanken
XML (Extensible Markup Language)
ADAT©2004 Dipl. - Ing. Walter SabinSeite: 1 Version 1.0a XML EXTENSIBLE MARKUP LANGUAGE.
IT-Zertifikat Kurs IV Gunther Sarling
© 2001 Sven Dammann1 Aufbau Integrierter Informationssysteme XML Bearbeitung und relationale Abbildung Sven Dammann Martin-Luther-Universität Halle-Wittenberg.
CSS Cascading Style Sheets
Hauptseminar Web-Services und verteilte Datenbanken Thema XML, DTDs und XML-Schema XML, DTDs und XML-Schema - Stefan Kurz, 25. April 2003.
- Warum: Das HTML-Dilemma
IT-Zertifikat der Phil.Fak Kurs 4: Daten- und Metadatenstandards Patrick Sahle XML-BasicsWS 08/09.
Seminar zur Geoinformation Folie 1 Inhalt: –XML –XML- SCHEMA –XSL –Syntax –GML Seminar zur Geoinformation Datenaustausch mit XML / GML im InternetDatenaustausch.
Peter Brezany Institut für Softwarewissenschaften Universität Wien
Geoinformation3 Geoinformation III XML Grundlagen und Dokumentspezifikation Vorlesung 12b.
Institut für Kartographie und Geoinformation Prof. Dr. Lutz Plümer Dr. Thomas H. Kolbe Geoinformation III XML Grundlagen und Dokumentspezifikationen Vorlesung.
Geoinformation3 Geoinformation III XML-Schema Vorlesung 13a.
JAVA und XML Programmierpraktikum XML 1.0 / Namespaces Von Markus Lucht & Timo Stollenwerk.
XML Grundlagen, Namensräume & Hyperlinks
DTD und W3C XML Schema Seminar XML und Datenbanken Vortrag: Sven Blüge.
Einführung xHTML / cHTML Stefan Pietschmann | Katja Pischke Gliederung Einführung xHTML  Überblick  Gründe für xHTML  Unterschiede zu HTML  DTDs und.
Vorteile von XML Die installed base von HTML, HTTP und Webbrowsern XML ist einfach und portabel XML kann Dokumente beliebiger Komplexität abbilden XML.
XML - Warum: Das HTML-Dilemma HTML, SGML, XML - Wie: Syntax, Konzepte, Sprachelemente Basics Wohlgeformte XML-Dokumente (ohne DTD) Gültige XML-Dokumente.
XML - Warum: Das HTML-Dilemma HTML, SGML, XML - Wie: Syntax, Konzepte, Sprachelemente Basics Wohlgeformte XML-Dokumente (ohne DTD) Gültige XML-Dokumente.
8.November 2006 ― 1Elektronisches Publizieren: XML Namespaces Kodierung strukturierter Dokumente im Web — XML Namespaces —
27.November / 4.Dezmber 2006 ― 1Elektronisches Publizieren: XML Schema Schemasprachen für XML — XML Schema — Anne Brüggemann-Klein TU München.
25.Oktober 2006 ― 1Elektronisches Publizieren: Dokumenten-Modellierung Grundlagen — Modellierung von Dokumenten und Daten — Anne Brüggemann-Klein TU München.
5.Februar 2007 – 1Vorlesung Elektronisches Publizieren: Formatierung von XML-Dokumenten mit XSL Formatierung von XML-Dokumenten — XSL — Anne Brüggemann-Klein.
Document Type Definitions (DTDs) Marko Harasic Freie Universität Berlin Institut für Informatik Netzbasierte Informationssysteme
Datentransformation mit XSLT Seminarvortrag von Johannes Engels.
13.Dezember 2006–1Elektronisches Publizieren: Schemasprachen — Relax NG Schemasprachen für XML — Relax NG — Anne Brüggemann-Klein TU München.
Key-Value Paare (KVP) - Metadaten für Kanäle speichern und nach MDF4 exportieren PM (V1.0)
1 XML Extensible Markup Language Meiko Lösch Juli 1999.
Validierung vom XML mit XML Schema
Fortsetzung DTDs, UML  XML
Document Type Definitions (DTDs)
 Präsentation transkript:

30.Oktober / 6.November 2006 ― 1Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML Kodierung strukturierter Dokumente im Web — XML —

30.Oktober / 6.November 2006 ― 2Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML Aufgaben Zum Modell der strukturierten Dokumente o Aufgabe 1: Definieren Sie das Modell der strukturierten Dokumente. o Aufgabe 2: Beschreiben Sie strukturierte Dokumente in Baumterminologie. o Aufgabe 3: Wozu wurde das Modell der strukturierten Dokumente eingeführt? o Aufgabe 4: Wie werden strukturierte Dokumente in XML kodiert? Erläutern Sie dazu auch den Begriff „eingebettetes Markup“. o Aufgabe 5: Nennen Sie mindestens drei Vorteile des Modells der strukturierten Dokumente.

30.Oktober / 6.November 2006 ― 3Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML Lösung zu Aufgabe 1 o In strukturierten Dokumenten werden Inhalt und logische Struktur explizit repräsentiert, nicht jedoch Vorgaben zum Präsentationsformat. o Die Vorgaben zum Format und eventuelle weitere Bearbeitungsvorschriften werden separat vom Dokument gehalten und sind somit austauschbar und mehrfach anwendbar.

30.Oktober / 6.November 2006 ― 4Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML Lösung zu Aufgabe 2 o Dokument als Baum von Knoten [../../xmlSamples/compBookModel.pdf]../../xmlSamples/compBookModel.pdf o Knoten o benannt, optional mit Attributierung [Elementknoten, für Strukturelemente] o anonym, mit Stringwert (nur bei Blättern) [Textknoten, für Inhaltstext] o Attributierung: Menge von Schlüssel-Wert-Paaren o Schlüssel sind Namen o Werte haben Typ

30.Oktober / 6.November 2006 ― 5Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML Lösung zu Aufgabe 3 o Das Modell der strukturierten Dokumente wurde ursprünglich im Verlagswesen und in der technischen Dokumentation eingeführt, um Erstellung und Verwaltung von Dokumenten von ihrer Präsentation zu trennen. o Es hat sich dann auch pragmatisch als geeignet herausgestellt, um die Anforderungen moderner Dokumente zu erfüllen, nämlich sie in sinnvoller semantischer Tiefe automatisch interpretieren zu können.

30.Oktober / 6.November 2006 ― 6Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML Lösung zu Aufgabe 4 o Kodierung von strukturierten Dokumenten als Textstring, bestehend aus dem Inhaltstext und eingebettetem Markup für Strukturelemente o Syntaktische Trennung zwischen Inhaltstext und Markup o An Anfang und Ende des Ausdehnungsbereich eines Strukturelements Markierung durch Tags

30.Oktober / 6.November 2006 ― 7Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML Lösung zu Aufgabe 5 o In strukturierten Dokumente ist semantische Information explizit kodiert; verarbeitende Programme können diese semantische Information ausnutzen. o Strukturierte Dokumente können durch Stylesheets einheitlich formatiert werden (innerhalb von Dokumenten, über Dokumentgrenzen hinweg). o Strukturierte Dokumente können durch Kombination mit geeigneten Stylesheets über unterschiedliche Kanäle angeboten werden. o Strukturierte Dokumente unterstützen Funktionen der Dokumentenverwaltung (Nummerierungen, Verzeichnisse)

30.Oktober / 6.November 2006 ― 8Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML Wiederholung … Dokumentenmodell: Modell der strukturierten Dokumente o explizite Repräsentation von textuellem Inhalt und (logischer) Struktur (Annotation von Textbereichen mit semantisch bedeutsamer Metainformation)  Dokumente als computerbearbeitbare Daten Inhalt und Struktur für sich alleine von intelligenten Anwendungen nutzbar Kombinierbarkeit mit separaten Bearbeitungsvorschriften o separate, auswechselbare Formatvorlage (Stylesheet) Format aus beiden zusammen berechenbar  multi-channel, cross-media Publishing (eine Quelle, viele Präsentationen)

30.Oktober / 6.November 2006 ― 9Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML Drehscheibencharakter strukturierter Dokumente str.Dok RDMS.doc.xml.html.xml.gif.rtf.html.pdf.wml.doc

30.Oktober / 6.November 2006 ― 10Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML … Wiederholung … o Grenzen: Genre, Diskurs ( o Konkretisierung: Inhalt und Struktur im Modell der strukturierten Dokumente o hierarchische Struktur (Baumstruktur) von Elementen (mit Attributen) über Inhaltstext o linearisierte Repräsentation als Zeichenstrom (eingebettetes Markup): Einbettung von Anfangs- und Endemarkierungen für Elementgrenzen (Markup) in Form von öffnenden und schließendenTags in den Inhaltstext (Character data)

30.Oktober / 6.November 2006 ― 11Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML … Wiederholung o Anforderung: anwendungsspezifische Markup-Sprachen (Namen von Elementen und Attributen, Typen) o Anforderung: Verbindlichkeit des Vokabulars durch formale Definition von Markup-Sprachen über Strukturvorgaben, Validierbarkeit von Dokumenten. Anders ausgedrückt: Modellierung von Klassen von Dokumenten o Methode (SGML/XML): Dokumentengrammatik oder Document Type Definition (DTD), legt Vokabular und mögliche Reihenfolgen und Schachtelungen von Elementen fest

30.Oktober / 6.November 2006 ― 12Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML XML (Extensible Markup Language) am Beispiel o Dokumentenformat des W3C für Webdokumente o Markupsprache: Markiert Textbereiche an Anfang und Ende mit Tags (attributierte Elemente):../../compProp/Konzept.xml,../../compProp../../compProp/Konzept.xml../../compProp o Tag-Syntax wie bei HTML: … o Freies Vokabular für Elementnamen und Attributnamen, formal definierbar in Document Type Definition (DTD):../.. /compProp/Konzept.dtd../.. /compProp/Konzept.dtd o Formatierung von XML-Dokumenten:../../compProp/KonzeptXML.css../../compProp/KonzeptXML.css

30.Oktober / 6.November 2006 ― 13Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML Erster Steckbrief für XML … o HTML mit freien Elementen, Attributen, Referenzen  XML (ohne DTDs) o XML als Syntax für strukturierte Dokumente und Markupsprachen (Sprache für strukturierte Dokumente) Standardisiertes allgemeines Format für moderne Dokumente (Kodierung von Text und semantischen Rollen) o XML-Anwendung, Markupsprache: spezifisches Vokabular/Format für spezifische Anwendungen Beispiele: XHTML, MathML, CML, Persistente Objektrepräsentation (Java), B2B (EDI), ECommerce (OTP), Topic Map Markup Language, XSL-FO, Konfigurationen, Metadaten

30.Oktober / 6.November 2006 ― 14Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML … Erster Steckbrief für XML o Durch Strukturvorgabe (DTD) Markupsprache formal definierbar und verifizierbar: Standardisiertes Format für Definition spezifischer Formate (Metasprache für Markupsprachen) Wohlgeformtheit und Validität o Portabilität o Satellitenstandards: Dokumentenmodell, Strukturvorgaben, Stylesheets, Hypertextlinks, Transformation, Abfragesprachen, Formularbeschreibung, APIs für Programmiersprachen, Data Binding

30.Oktober / 6.November 2006 ― 15Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML XML als Erbe von SGML o SGML = Standard Generalized Markup Language ISO-Standard 8879 seit 1986 o Beide: Sprachen zur syntaktischen Repräsentation von strukturierten Dokumenten und ihren Strukturvorgaben o Beide: Metasprachen zur Definition von Markup-Sprachen o SGML: Im Verlagswesen und in der Dokumentation großer Systeme von Bedeutung, Praxis-Einsatz und Software- Entwicklung schlecht o XML = Extensible Markup Language W3C-Standard Version 1.0 vom (inzwischen dritte Auflage) W3C-Standard Version 1.1 vom Vereinfachte Fassung von SGML für das Web

30.Oktober / 6.November 2006 ― 16Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML XML-Syntax: Dokument (Instanz) … o XML-Deklaration o Element mit Attributen Element-Inhalt o Einschränkungen zu Alphabet (alphanumerisch plus '-', '_', '.', ':') und Syntax für Namen (Elemente, Attribute etc.) o Ausschluß bestimmter Funktionszeichen für Attributwerte und textuellen Inhalt o Mixed Content (erzählerische Dokumente, Daten)

30.Oktober / 6.November 2006 ― 17Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML … XML-Syntax: Dokument (Instanz) o Zeichen: Attributwerte und textueller Inhalt o Direkte Code-Position o Character Reference &#Dezimalzahl; oder &#xHexzahl; o Vordefinierte Entity References für Funktionszeichen: <, >, &, &apos;, " o Deklarierte Entity References o CDATA Section ']]> Markup im Innern einer CDATA Section wird nicht erkannt; nicht schachtelungsfähig o White Space

30.Oktober / 6.November 2006 ― 18Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML XML-Syntax: DTD … o Deklaration der DTD: Internes und externes Subset o Deklaration für Element: o Content Model: Element Content EMPTY, ANY Ausdruck über Elementnamen mit Operatoren,|?+*, Content Model: Mixed Content Ausdruck (#PCDATA), Ausdruck (#PCDATA | N1 |... | Nx)* Eindeutigkeit von Inhaltsmodellen (Forschungsarbeiten)

30.Oktober / 6.November 2006 ― 19Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML … XML-Syntax: DTD o Deklaration für Attributliste (Elementname, Attributname, Wertebereich, Defaultregel) o Wertebereiche CDATA, ID, IDREF, (v1, …,vn), ENTITY o Defaultregelungen #REQUIRED, #IMPLIED, v, #FIXED v Einsatz von Defaultwerten durch Parser o Kommentar (nicht schachtelungsfähig), auch in Instanz o Prozessor-Anweisung, auch in Instanz '?>

30.Oktober / 6.November 2006 ― 20Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML XML und XML-Modelle am Beispiel … o Formatiertes Dokument [../../xmlSamples/compBook.pdf] in XML-Kodierung [../../xmlSamples/compBook.xml] (semantisch reich, normalisiert, bearbeitbar) und als Baummodell [../../xmlSamples/compBookModel.pdf]../../xmlSamples/compBook.pdf../../xmlSamples/compBook.xml../../xmlSamples/compBookModel.pdf o Allgemein: Baummodell für strukturierte Dokumente o Baum von Knoten o benannt, optional mit Attributierung [Elementknoten, für Strukturelemente] o anonym, mit Stringwert (nur bei Blättern) [Textknoten, für Inhaltstext] o Attributierung: Menge von Schlüssel-Wert-Paaren o Schlüssel sind Namen o Werte haben Typ

30.Oktober / 6.November 2006 ― 21Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML … XML und XML-Modelle am Beispiel … o Visualisierung des Baummodells für Dokumente o Knoten als Ellipsen, Eltern-Kind-Beziehung als Linien (von oben nach unten oder von links nach rechts) o Namen für Elemente im Knoten o anonyme Knoten mit Schlüsselwort #Text im Knoten, Text in Anführungszeichen am Knoten o Attribute als Tabelle am Knoten (1. Spalte: Attributname, 2. Spalte: Attributwert)

30.Oktober / 6.November 2006 ― 22Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML … XML und XML-Modelle am Beispiel o XML-DTD [../../xmlSamples/book.dtd] als Baummodell [../../xmlSamples/bookModel.pdf]../../xmlSamples/book.dtd../../xmlSamples/bookModel.pdf o Verallgemeinerung für Strukturvorgaben (DTDs) o Namen für Elemente bzw. Schlüsselwort #Text im Knoten o Verbindungen zwischen Element und den Bestandteilen seines Inhaltsmodells am Platz, aber ohne Wiederholungen [Spezialfall Russian Doll, wenn jedes Element nur einmal referenziert wird; insbesondere dann keine Rekursion] o unterschiedliche Verbindungen je nach Operator o Attribute als Tabelle am Knoten (1. Spalte: Attributname, 2. Spalte: Attributtyp) Fragezeichen an Verbindung zwischen Knoten und Attribut für optionale Attribute

30.Oktober / 6.November 2006 ― 23Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML Wohlgeformtheit und Validität o XML-Dokumente müssen wohlgeformt sein (Überprüfung durch alle Parser, auch nicht-validierende) o DTD optional o korrekte Klammerung o keine mehrfachen Attribute in Elementen o Zusätzlich: Validität (Überprüfung durch validierende Parser) o Referenzen definiert (nächste Stunde: Entities) o Instanz erfüllt Deklarationen von Elementen und Attributen (Typen, Defaults) o validierender Parser setzt Defaultwerte ein und erkennt Attributtypen wie ID und ENTITY

30.Oktober / 6.November 2006 ― 24Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML XML-Konzept: Entities … Doppelfunktion DTDs o Strukturvorgabe o Festlegung eines Vokabulars von Element- und Attributnamen und ihren Verwendungsweisen o Regeln für Aufbau der logischen Struktur von XML-Dokumenten mit Elementen und Attributen (Instanzen) o Verbindlichkeit und Überprüfbarkeit o Festlegung der Komponenten eines XML-Dokuments, aus denen es physisch zusammengesetzt ist (physische Struktur)

30.Oktober / 6.November 2006 ― 25Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML … XML-Konzept: Entities … o XML-Dokumente sind physisch in Entities organisiert (Entity als Speichereinheit) o Gesamtes Dokument bildet eine Entity inkludiert untergeordnete Entities durch Entity-Referenz Beispiele für Entity-Referenzen: ä %KonzeptLog; o Entities müssen in der DTD definiert werden: der Name wird an seinen Ersetzungstext gebunden o Expansion: Auflösen von Entity-Referenzen o Anders als bei HTML nur sehr wenige vordefinierte Entities (für Funktionssymbole): & < > " &apos; o Entities als Makro-Mechanismus

30.Oktober / 6.November 2006 ― 26Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML … XML-Konzept: Entities … o Modularisierung o Aufteilen großer Dokumente; z.B. Buch in Kapitel o Abgestufter Gültigkeitsbereich (DTDs): intern, firmenweit, global o explizite Benennung, Redundanzvermeidung (z.B. HTML) o Anpassbarkeit o Überschreiben von Definitionen in DTDs o DokBook: DTD von OASIS für technische Dokumentation o Wiederverwendbarkeit o Abkürzungen (Sonderzeichen, Textbausteine) o Teildokumente (Logos, DTDs) o Plattformunabhängigkeit o Kapselung des Speicherorts für Ersetzungstext an Definitionsort

30.Oktober / 6.November 2006 ― 27Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML … XML-Konzept: Entities o Ersetzungstext einer Entity kann intern (innerhalb der Deklaration der Entity) oder extern definiert werden; bei einer externen Definition wird eine Ressource (beispielsweise ein Dateiname) angegeben, die den Ersetzungstext enthält (Speicherort für Speichereinheit) o Orthogonal zwei Typen von Entities o General Entity: Expansion in Instanz o Parameter Entity: Expansion in DTD Vorteil: Getrennte Namensräume, Verbergen des Namensraums für DTD-interne Entitäten (Transparenz)

30.Oktober / 6.November 2006 ― 28Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML XML-Syntax: Entities … o Generelle Entities: in DTD deklariert, in Instanz verwendet Beispiele für Deklaration interner genereller Entity Beispiele für Deklaration externer genereller Entity Verwendung in Dokumenteninstanz (Text und Attributwerte) &AHK;

30.Oktober / 6.November 2006 ― 29Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML … XML-Syntax: Entities o Parameter-Entities: in DTD deklariert, in DTD verwendet Beispiele für Deklaration interner Parameter-Entity Beispiele für Deklaration externer Parameter-Entity Verwendung in DTD

30.Oktober / 6.November 2006 ― 30Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML Customizing DTDs o DocBook DTD für technische Dokumentation (OASIS) o Ziel: Erweiterung, Wiederverwendbarkeit, Anpassbarkeit o Mittel: Extensive Verwendung von Parameter-Entitäten o Entitäten in einer DTD mehrfach definierbar o erste Definition “zählt” (überschreibt spätere) o Methoden in DocBook o Aufteilung der DTD in Module, die nach Bedarf genutzt werden o Typisierung der Elemente: Metadaten, Gliederungselemente, Informationsbausteine, Informationsschnipsel, dann Klassenbildung (Klasse aller Listenarten etc.) über Parameter-Entitäten mit leeren “Aufhängern” für lokale Erweiterungen o kleinere Module und einzelne Elemente mit Möglichkeit zur Inklusion/Exklusion (marked section)

30.Oktober / 6.November 2006 ― 31Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML XML-Syntax: Entities für Fremddaten … Fremddaten über Attribute vom Typ ENTITY assoziieren o Assoziation durch Attribut vom Typ ENTITY mit dem Namen der zu referenzierenden Entity als Wert (Indirektion über dokumenteninternen Namen) o Notation (Datentyp) o Entity-Deklaration mit Notation (Binden des externen Namens an internen Namen, Vereinbarung des Datentyps der Fremddaten) Tutorial aus Praktikum XML-Technologie SS 2005 (..\..\Tutorielles\FremddatenEntities.pdf)..\..\Tutorielles\FremddatenEntities.pdf

30.Oktober / 6.November 2006 ― 32Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML … XML-Syntax: Entities für Fremddaten … o Beispiel o Aufruf der Fremddaten mit Attribut vom Typ ENTITY o Voraussetzungen o Deklaration des Attributs als vom Typ ENTITY o Deklaration der Entity als Fremddatentyp (Notation) o Deklaration der Notation o Anwendung im Computer-Propädeutikum (..\..\compProp)..\..\compProp

30.Oktober / 6.November 2006 ― 33Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML … XML-Syntax: Entities für Fremddaten Zusammenfassung o Standardisierte Assoziation von Fremddaten, nicht Import Behandlung der Assoziation durch Anwendungssysteme o Spiel mit Namen Kapselung der Plattformabhängigkeiten o Empfehlenswert: Aufteilung in dokumentinterne und externe Teile der DTD o Benennung der Fremddaten o Deklaration der Aufhängepunkte und Datentypen

30.Oktober / 6.November 2006 ― 34Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML Diskussion Syntax o "Flache" Syntaxdefinition: Abstraktion von Token für lexikalische Analyse fehlt o Alternative: xmlRulesRewritten.htmxmlRulesRewritten.htm o XMLLight für Instanzen: xmlLightI.htmxmlLightI.htm o Physische und logische Struktur nicht in getrennten Schichten (vgl. Präprozessoren für Makros in Programmiersprachen) o Viele Nebenbedingungen

30.Oktober / 6.November 2006 ― 35Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML Konzeptionelles Modell für XML … o XML: Sprache, in der strukturierte Dokumente und ihre Strukturvorgaben syntaktisch repräsentiert werden o Daten als Zeichenstrom unter bestimmten syntaktischen Regeln, Überprüfung und Abstraktion durch Parser, Datenmodell, APIs, Anwendungssysteme o In den Worten des XML-Standards: whatIsXML.htmwhatIsXML.htm o Wert liegt in Standardisierung durch W3C und Adaption im Web o Konzeptionelles Modell für XML-Dokumente nur implizit, nicht explizit (explizite konzeptionelle Beschreibung von XML unter xmlMod.htm)xmlMod.htm

30.Oktober / 6.November 2006 ― 36Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML … Konzeptuelles Modell für XML Begriffe (../../Tutorielles/xmlMod.htm)../../Tutorielles/xmlMod.htm o Element o Name oder Typ o Attribut o Name, Typ und Wert o XML-Dokument o XML-Instanz o XML-DTD (Document Type Definition) o Entitätenreferenz o Zeichenreferenz o Kommentar, Processing Instruction

30.Oktober / 6.November 2006 ― 37Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML Hausaufgabe (Abgabe Samstag, ) Formalisieren Sie das konzeptionelle Modell von XML in einem UML-Klassendiagramm

30.Oktober / 6.November 2006 ― 38Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML Formales Modell für XML (1) GCSDocument  DocInstance  DocGrammar. (2) DocInstance = DocSort  Attributes  Content. (3) Attributes = F fin (AttSort  AttValue  Character*  DocID). (4) Content = (DocInstance  Character)*. (5) DocGrammar = ContentRules  AttRules. (6) ContentRules = F fin (DocSort  DocDomain). (7) DocDomain = Reg(DocSort)  RReg(Character,DocSort). (8) AttRules = F fin (DocSort  AttSort  AttDomain). (9) AttDomain = P fin (AttValue)  { String, ID, IDREF }.

30.Oktober / 6.November 2006 ― 39Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML XML-Parser … o Programme zur XML-Syntaxüberprüfung heißen XML-Prozessoren oder Parser o Aufgaben eines Parsers o Syntaxüberprüfung (gegenüber XML-Grammatik) o Überprüfen der Wohlgeformtheit o Expansion von Referenzen o Einsetzen von Attributwerten o Validierung o Abstraktion von syntaktischem Zucker und von Alternativen o Weitergabe der erforderlichen Information (APIs)

30.Oktober / 6.November 2006 ― 40Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML … XML-Parser o Parser-Software Xerces von Apache XML unter zum Beispiel als Java-Implementierung Xerces-J o xercesImpl.jar, xml-apis.jar und xercesSamples im Classpath o Aufruf java sax.Counter [-v] XMLDocument o Online-Parser o o

30.Oktober / 6.November 2006 ― 41Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML XML-Browser o Microsoft Internet Explorer ab Version 5 zur Darstellung von XML-Dokumenten, auch mit CSS-Stylesheets o Netscape Navigator ab Version 6 zur Darstellung von XML- Dokumenten, nur mit CSS-Stylesheets o Anbindung eines Stylesheets mit Processing Instruction [Associating Style Sheets with XML documents W3C Recommendation 29 June o Beispiel (..\..\compProp)..\..\compProp

30.Oktober / 6.November 2006 ― 42Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML XML-Status … o Definition und Umsetzung von Formaten für XML o Stylesheet-Sprache CSS Umsetzung durch XML/CSS-fähigen Browser o Sprache XSLT zur Transformation von XML o nach HTML o nach XML (Anpassung der logischen Struktur) o nach PDF (über Zwischenstufe) Umsetzung durch Server oder Browser mit XSLT-Prozessor o mit XSLT auch andere Formate (z.B. LaTeX) erreichbar  XML dadurch operationabel für narrative Dokumente

30.Oktober / 6.November 2006 ― 43Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML … XML-Status … o Ergänzende Stylesheet- und Linking-Standards sowie Schema-Sprachen, Query-Sprachen o Software-Unterstützung ordentlich o Parser mit standardisierten APIs o Editoren o Document Management / Datenbank-Systeme o XSLT-Prozessoren o Browser o Stylesheet-Unterstützung

30.Oktober / 6.November 2006 ― 44Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML … XML-Status o Situation im EP-Bereich: XML-Studie Börsenverein o XML-Anwendungen (DTDs) o MathML, CML, DocBook, TEI, XHTML o Metadaten (auch Austauschformate) für Kataloganwendungen: RDF, Dublin Core o Authentifizierung, digitale Unterschriften o Electronic Commerce: Open Trading Protocol, EDI o Web Services: WSDL, SOAP o Ontologien: OWL o Content Syndication: RSS, ATOM

30.Oktober / 6.November 2006 ― 45Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML Verhältnis SGML-XML-HTML-XHTML … o Jedes gültige (valid ) XML-Dokument ist ein gültiges SGML- Dokument (nach leichter Anpassung des SGML-Standards) o XML-Dokumente können nur wohlgeformt sein (well-formed ): nur eine vollständig geklammerte Instanz, keine DTD oder keine Übereinstimmung zwischen DTD und Instanz SGML-Dokumente müssen immer DTD haben

30.Oktober / 6.November 2006 ― 46Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML … Verhältnis SGML-XML-HTML-XHTML … o HTML ist eine SGML-Anwendung; HTML ist über eine SGML-DTD definiert o HTML-Dokumente sind keine gültigen XML-Dokumente, aber Anpassung in Form von XHTML inzwischen vom W3C verabschiedet o XHTML (Januar 2000), HTML4 als XML-DTD definiert Richtlinien für Kompatibilität von XHTML-Dokumenten mit heutigen Browsern unter

30.Oktober / 6.November 2006 ― 47Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML … Verhältnis SGML-XML-HTML-XHTML … o XML: freies Vokabular für Elemente, Attribute, Entitäten HTML: festes Vokabular für Elemente, Attribute, Entitäten o XML: keine definierte Semantik für Sprachelemente HTML: definierte Semantik, von Browsern verstanden o HTML hat liberalere Syntax als XHTML o keine schließenden Tags bei leeren Elementen o Attributwerte ohne Anführungszeichen o Boolesche Attribute ohne Attributnamen Definition von XHTML mit HTML-Vokabular, aber strengerer XML-Syntax (JTidy zur Konvertierung von HTML nach XHTML)

30.Oktober / 6.November 2006 ― 48Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML … Verhältnis SGML-XML-HTML-XHTML o Einschränkungen/Änderungen von XML gegenüber SGML o feste SGML-Deklaration o explizite und vollständige Klammerung, keine Markup-Minimierung in DTD o Markierung für leeres Element X o Einschränkungen bei Content models: Exceptions, &-operator, Mixed content o Attributwerte immer in Anführungsstrichen o restriktivere Entity-Grenzen o ISO (Unicode) Zeichenkodierung, auch für Namen

30.Oktober / 6.November 2006 ― 49Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML Aufgaben Kodierung mit XML … Grundlage der Aufgaben ist das XML-Dokument „Wie ich das Rad erfand“ [..\..\xmlSamples\radBook.xml]..\..\xmlSamples\radBook.xml o Markieren Sie jedes Vorkommen der folgenden Sprachelemente von XML: XML-Deklaration, Dokumenttypdeklaration, Elementdeklaration, Attributdeklaration, (Entitydefinition), Element, Attribut, (Entityreferenz), Zeichenreferenz, Tag. o Führen Sie die Bestandteile einer Elementdeklaration und einer Attributdeklaration auf und markieren Sie sie ebenfalls.

30.Oktober / 6.November 2006 ― 50Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML … Aufgaben Kodierung mit XML o Visualisieren Sie das konzeptionelle Modell zum XML- Dokument als Baum. Müssen Sie Ihren Baum ändern, wenn in dem öffnenden Tag zum ersten Element chapter die beiden Attribute in umgekehrter Reihenfolge angegeben werden? o Erläutern Sie anhand Ihrer Überführung des XML- Dokuments in einen Baum die Aufgaben eines XML-Parsers. Gehen Sie auch auf die Begriffe „Wohlgeformtheit“ und „Validität“ ein.

30.Oktober / 6.November 2006 ― 51Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML XML-Steckbrief … o XML als Sprache für strukturierte Dokumente Dokumente als Daten, Daten als Dokumente o Priorität von logischer Auszeichnung in Gegensatz zu Machbarkeit (HTML) o Flexibilität bei Vokabular o Verifizierbarkeit o XML als Metasprache o homogene Syntax für Markup o frei definierbares Vokabular o Definition des Vokabulars mit homogener Syntax

30.Oktober / 6.November 2006 ― 52Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML … XML-Steckbrief o Document Management mit XML: Physikalische Aufspaltung in Entitäten o Zerlegung in separate Speichereinheiten (Modularisierung) o Wiederverwendbare Inhalte (Textbausteine) o Abkürzungen/Namen für Sonderzeichen Verwendung von Entitäten (Auflösung) über Namensreferenzen (Name/Ersetzungstext) o Multifunktionales Markup: Elemente mit Attributen, Referenzen, DTD-Deklarationen, Kommentare, Prozessanweisungen, XML-Deklarationen, Whitespace (außerhalb des Wurzeldokuments)

30.Oktober / 6.November 2006 ― 53Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML DTDs konzeptionell o Formale Beschreibung einer Klasse von XML-Dokumenten o Analogien o DTD  kontextfreie Grammatik syntaktischer Zucker implizit o Instanz  Wort der Grammatik o Baummodell  Syntaxbaum o Enge Korrespondenz zwischen Instanz/Baummodell bzw. Wort/Syntaxbaum: Niedrige Sprachklasse innerhalb der kontextfreien Sprachen (LL(1)) o Generierbarkeit von DTD-spezifischen Werkzeugen aus DTD (Forschung)

30.Oktober / 6.November 2006 ― 54Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML Literatur o XML-Seite des W3C ( o E.R. Harold, W.S. Means: XML in a Nutshell. O'Reilly o E.T. Ray: Einführung in XML. O'Reilly o Neil Bradley: The XML Companion. Addison-Wesley o Mark Johnson: XML for the Absolute Beginner. Javaworld, April ( ) o Online-Tutorial von W3Schools ( o XML-Portal von O‘Reilly (

30.Oktober / 6.November 2006 ― 55Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML Aufgabe (Abgabe Samstag, den ) o Entwerfen Sie ein Gedicht als strukturiertes Dokument. Berücksichtigen Sie die Klassifizierung von Strukturelementen. Visualisieren Sie das Gedicht als Baum. Kodieren Sie das Gedicht in XML. Überprüfen Sie das Gedicht auf Wohlgeformtheit o mit einem Browser oder o mit einem Online-Validierer oder o mit einem selbstinstallierten Parser. o Entwerfen Sie eine Strukturvorgabe für Gedichte und visualisieren Sie sie als Baum. Kodieren Sie die Strukturvorgabe als DTD und binden Sie sie in Ihr Gedicht ein. o Validieren Sie das Gedicht mit den drei obigen Methoden