Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

30.Oktober / 6.November 2006 ― 1Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML Kodierung strukturierter Dokumente im Web — XML.

Ähnliche Präsentationen


Präsentation zum Thema: "30.Oktober / 6.November 2006 ― 1Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML Kodierung strukturierter Dokumente im Web — XML."—  Präsentation transkript:

1 30.Oktober / 6.November 2006 ― 1Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML Kodierung strukturierter Dokumente im Web — XML —

2 30.Oktober / 6.November 2006 ― 2Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML Aufgaben Zum Modell der strukturierten Dokumente o Aufgabe 1: Definieren Sie das Modell der strukturierten Dokumente. o Aufgabe 2: Beschreiben Sie strukturierte Dokumente in Baumterminologie. o Aufgabe 3: Wozu wurde das Modell der strukturierten Dokumente eingeführt? o Aufgabe 4: Wie werden strukturierte Dokumente in XML kodiert? Erläutern Sie dazu auch den Begriff „eingebettetes Markup“. o Aufgabe 5: Nennen Sie mindestens drei Vorteile des Modells der strukturierten Dokumente.

3 30.Oktober / 6.November 2006 ― 3Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML Lösung zu Aufgabe 1 o In strukturierten Dokumenten werden Inhalt und logische Struktur explizit repräsentiert, nicht jedoch Vorgaben zum Präsentationsformat. o Die Vorgaben zum Format und eventuelle weitere Bearbeitungsvorschriften werden separat vom Dokument gehalten und sind somit austauschbar und mehrfach anwendbar.

4 30.Oktober / 6.November 2006 ― 4Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML Lösung zu Aufgabe 2 o Dokument als Baum von Knoten [../../xmlSamples/compBookModel.pdf]../../xmlSamples/compBookModel.pdf o Knoten o benannt, optional mit Attributierung [Elementknoten, für Strukturelemente] o anonym, mit Stringwert (nur bei Blättern) [Textknoten, für Inhaltstext] o Attributierung: Menge von Schlüssel-Wert-Paaren o Schlüssel sind Namen o Werte haben Typ

5 30.Oktober / 6.November 2006 ― 5Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML Lösung zu Aufgabe 3 o Das Modell der strukturierten Dokumente wurde ursprünglich im Verlagswesen und in der technischen Dokumentation eingeführt, um Erstellung und Verwaltung von Dokumenten von ihrer Präsentation zu trennen. o Es hat sich dann auch pragmatisch als geeignet herausgestellt, um die Anforderungen moderner Dokumente zu erfüllen, nämlich sie in sinnvoller semantischer Tiefe automatisch interpretieren zu können.

6 30.Oktober / 6.November 2006 ― 6Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML Lösung zu Aufgabe 4 o Kodierung von strukturierten Dokumenten als Textstring, bestehend aus dem Inhaltstext und eingebettetem Markup für Strukturelemente o Syntaktische Trennung zwischen Inhaltstext und Markup o An Anfang und Ende des Ausdehnungsbereich eines Strukturelements Markierung durch Tags

7 30.Oktober / 6.November 2006 ― 7Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML Lösung zu Aufgabe 5 o In strukturierten Dokumente ist semantische Information explizit kodiert; verarbeitende Programme können diese semantische Information ausnutzen. o Strukturierte Dokumente können durch Stylesheets einheitlich formatiert werden (innerhalb von Dokumenten, über Dokumentgrenzen hinweg). o Strukturierte Dokumente können durch Kombination mit geeigneten Stylesheets über unterschiedliche Kanäle angeboten werden. o Strukturierte Dokumente unterstützen Funktionen der Dokumentenverwaltung (Nummerierungen, Verzeichnisse)

8 30.Oktober / 6.November 2006 ― 8Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML Wiederholung … Dokumentenmodell: Modell der strukturierten Dokumente o explizite Repräsentation von textuellem Inhalt und (logischer) Struktur (Annotation von Textbereichen mit semantisch bedeutsamer Metainformation)  Dokumente als computerbearbeitbare Daten Inhalt und Struktur für sich alleine von intelligenten Anwendungen nutzbar Kombinierbarkeit mit separaten Bearbeitungsvorschriften o separate, auswechselbare Formatvorlage (Stylesheet) Format aus beiden zusammen berechenbar  multi-channel, cross-media Publishing (eine Quelle, viele Präsentationen)

9 30.Oktober / 6.November 2006 ― 9Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML Drehscheibencharakter strukturierter Dokumente str.Dok RDMS.doc.xml.html.xml.gif.rtf.html.pdf.wml.doc

10 30.Oktober / 6.November 2006 ― 10Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML … Wiederholung … o Grenzen: Genre, Diskurs (http://jodi.tamu.edu/Articles/v03/i01/Hillesund)http://jodi.tamu.edu/Articles/v03/i01/Hillesund o Konkretisierung: Inhalt und Struktur im Modell der strukturierten Dokumente o hierarchische Struktur (Baumstruktur) von Elementen (mit Attributen) über Inhaltstext o linearisierte Repräsentation als Zeichenstrom (eingebettetes Markup): Einbettung von Anfangs- und Endemarkierungen für Elementgrenzen (Markup) in Form von öffnenden und schließendenTags in den Inhaltstext (Character data)

11 30.Oktober / 6.November 2006 ― 11Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML … Wiederholung o Anforderung: anwendungsspezifische Markup-Sprachen (Namen von Elementen und Attributen, Typen) o Anforderung: Verbindlichkeit des Vokabulars durch formale Definition von Markup-Sprachen über Strukturvorgaben, Validierbarkeit von Dokumenten. Anders ausgedrückt: Modellierung von Klassen von Dokumenten o Methode (SGML/XML): Dokumentengrammatik oder Document Type Definition (DTD), legt Vokabular und mögliche Reihenfolgen und Schachtelungen von Elementen fest

12 30.Oktober / 6.November 2006 ― 12Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML XML (Extensible Markup Language) am Beispiel o Dokumentenformat des W3C für Webdokumente o Markupsprache: Markiert Textbereiche an Anfang und Ende mit Tags (attributierte Elemente):../../compProp/Konzept.xml,../../compProp../../compProp/Konzept.xml../../compProp o Tag-Syntax wie bei HTML: … o Freies Vokabular für Elementnamen und Attributnamen, formal definierbar in Document Type Definition (DTD):../.. /compProp/Konzept.dtd../.. /compProp/Konzept.dtd o Formatierung von XML-Dokumenten:../../compProp/KonzeptXML.css../../compProp/KonzeptXML.css

13 30.Oktober / 6.November 2006 ― 13Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML Erster Steckbrief für XML … o HTML mit freien Elementen, Attributen, Referenzen  XML (ohne DTDs) o XML als Syntax für strukturierte Dokumente und Markupsprachen (Sprache für strukturierte Dokumente) Standardisiertes allgemeines Format für moderne Dokumente (Kodierung von Text und semantischen Rollen) o XML-Anwendung, Markupsprache: spezifisches Vokabular/Format für spezifische Anwendungen Beispiele: XHTML, MathML, CML, Persistente Objektrepräsentation (Java), B2B (EDI), ECommerce (OTP), Topic Map Markup Language, XSL-FO, Konfigurationen, Metadaten

14 30.Oktober / 6.November 2006 ― 14Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML … Erster Steckbrief für XML o Durch Strukturvorgabe (DTD) Markupsprache formal definierbar und verifizierbar: Standardisiertes Format für Definition spezifischer Formate (Metasprache für Markupsprachen) Wohlgeformtheit und Validität o Portabilität o Satellitenstandards: Dokumentenmodell, Strukturvorgaben, Stylesheets, Hypertextlinks, Transformation, Abfragesprachen, Formularbeschreibung, APIs für Programmiersprachen, Data Binding

15 30.Oktober / 6.November 2006 ― 15Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML XML als Erbe von SGML o SGML = Standard Generalized Markup Language ISO-Standard 8879 seit 1986 o Beide: Sprachen zur syntaktischen Repräsentation von strukturierten Dokumenten und ihren Strukturvorgaben o Beide: Metasprachen zur Definition von Markup-Sprachen o SGML: Im Verlagswesen und in der Dokumentation großer Systeme von Bedeutung, Praxis-Einsatz und Software- Entwicklung schlecht o XML = Extensible Markup Language W3C-Standard Version 1.0 vom 10.2.1998 (inzwischen dritte Auflage) W3C-Standard Version 1.1 vom 4.2.2004 Vereinfachte Fassung von SGML für das Web

16 30.Oktober / 6.November 2006 ― 16Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML XML-Syntax: Dokument (Instanz) … o XML-Deklaration o Element mit Attributen Element-Inhalt o Einschränkungen zu Alphabet (alphanumerisch plus '-', '_', '.', ':') und Syntax für Namen (Elemente, Attribute etc.) o Ausschluß bestimmter Funktionszeichen für Attributwerte und textuellen Inhalt o Mixed Content (erzählerische Dokumente, Daten)

17 30.Oktober / 6.November 2006 ― 17Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML … XML-Syntax: Dokument (Instanz) o Zeichen: Attributwerte und textueller Inhalt o Direkte Code-Position o Character Reference &#Dezimalzahl; oder &#xHexzahl; o Vordefinierte Entity References für Funktionszeichen: <, >, &, &apos;, " o Deklarierte Entity References o CDATA Section ']]> Markup im Innern einer CDATA Section wird nicht erkannt; nicht schachtelungsfähig o White Space

18 30.Oktober / 6.November 2006 ― 18Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML XML-Syntax: DTD … o Deklaration der DTD: Internes und externes Subset o Deklaration für Element: o Content Model: Element Content EMPTY, ANY Ausdruck über Elementnamen mit Operatoren,|?+*, Content Model: Mixed Content Ausdruck (#PCDATA), Ausdruck (#PCDATA | N1 |... | Nx)* Eindeutigkeit von Inhaltsmodellen (Forschungsarbeiten)

19 30.Oktober / 6.November 2006 ― 19Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML … XML-Syntax: DTD o Deklaration für Attributliste (Elementname, Attributname, Wertebereich, Defaultregel) o Wertebereiche CDATA, ID, IDREF, (v1, …,vn), ENTITY o Defaultregelungen #REQUIRED, #IMPLIED, v, #FIXED v Einsatz von Defaultwerten durch Parser o Kommentar (nicht schachtelungsfähig), auch in Instanz o Prozessor-Anweisung, auch in Instanz '?>

20 30.Oktober / 6.November 2006 ― 20Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML XML und XML-Modelle am Beispiel … o Formatiertes Dokument [../../xmlSamples/compBook.pdf] in XML-Kodierung [../../xmlSamples/compBook.xml] (semantisch reich, normalisiert, bearbeitbar) und als Baummodell [../../xmlSamples/compBookModel.pdf]../../xmlSamples/compBook.pdf../../xmlSamples/compBook.xml../../xmlSamples/compBookModel.pdf o Allgemein: Baummodell für strukturierte Dokumente o Baum von Knoten o benannt, optional mit Attributierung [Elementknoten, für Strukturelemente] o anonym, mit Stringwert (nur bei Blättern) [Textknoten, für Inhaltstext] o Attributierung: Menge von Schlüssel-Wert-Paaren o Schlüssel sind Namen o Werte haben Typ

21 30.Oktober / 6.November 2006 ― 21Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML … XML und XML-Modelle am Beispiel … o Visualisierung des Baummodells für Dokumente o Knoten als Ellipsen, Eltern-Kind-Beziehung als Linien (von oben nach unten oder von links nach rechts) o Namen für Elemente im Knoten o anonyme Knoten mit Schlüsselwort #Text im Knoten, Text in Anführungszeichen am Knoten o Attribute als Tabelle am Knoten (1. Spalte: Attributname, 2. Spalte: Attributwert)

22 30.Oktober / 6.November 2006 ― 22Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML … XML und XML-Modelle am Beispiel o XML-DTD [../../xmlSamples/book.dtd] als Baummodell [../../xmlSamples/bookModel.pdf]../../xmlSamples/book.dtd../../xmlSamples/bookModel.pdf o Verallgemeinerung für Strukturvorgaben (DTDs) o Namen für Elemente bzw. Schlüsselwort #Text im Knoten o Verbindungen zwischen Element und den Bestandteilen seines Inhaltsmodells am Platz, aber ohne Wiederholungen [Spezialfall Russian Doll, wenn jedes Element nur einmal referenziert wird; insbesondere dann keine Rekursion] o unterschiedliche Verbindungen je nach Operator o Attribute als Tabelle am Knoten (1. Spalte: Attributname, 2. Spalte: Attributtyp) Fragezeichen an Verbindung zwischen Knoten und Attribut für optionale Attribute

23 30.Oktober / 6.November 2006 ― 23Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML Wohlgeformtheit und Validität o XML-Dokumente müssen wohlgeformt sein (Überprüfung durch alle Parser, auch nicht-validierende) o DTD optional o korrekte Klammerung o keine mehrfachen Attribute in Elementen o Zusätzlich: Validität (Überprüfung durch validierende Parser) o Referenzen definiert (nächste Stunde: Entities) o Instanz erfüllt Deklarationen von Elementen und Attributen (Typen, Defaults) o validierender Parser setzt Defaultwerte ein und erkennt Attributtypen wie ID und ENTITY

24 30.Oktober / 6.November 2006 ― 24Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML XML-Konzept: Entities … Doppelfunktion DTDs o Strukturvorgabe o Festlegung eines Vokabulars von Element- und Attributnamen und ihren Verwendungsweisen o Regeln für Aufbau der logischen Struktur von XML-Dokumenten mit Elementen und Attributen (Instanzen) o Verbindlichkeit und Überprüfbarkeit o Festlegung der Komponenten eines XML-Dokuments, aus denen es physisch zusammengesetzt ist (physische Struktur)

25 30.Oktober / 6.November 2006 ― 25Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML … XML-Konzept: Entities … o XML-Dokumente sind physisch in Entities organisiert (Entity als Speichereinheit) o Gesamtes Dokument bildet eine Entity inkludiert untergeordnete Entities durch Entity-Referenz Beispiele für Entity-Referenzen: ä %KonzeptLog; o Entities müssen in der DTD definiert werden: der Name wird an seinen Ersetzungstext gebunden o Expansion: Auflösen von Entity-Referenzen o Anders als bei HTML nur sehr wenige vordefinierte Entities (für Funktionssymbole): & < > " &apos; o Entities als Makro-Mechanismus

26 30.Oktober / 6.November 2006 ― 26Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML … XML-Konzept: Entities … o Modularisierung o Aufteilen großer Dokumente; z.B. Buch in Kapitel o Abgestufter Gültigkeitsbereich (DTDs): intern, firmenweit, global o explizite Benennung, Redundanzvermeidung (z.B. HTML) o Anpassbarkeit o Überschreiben von Definitionen in DTDs o DokBook: DTD von OASIS für technische Dokumentation o Wiederverwendbarkeit o Abkürzungen (Sonderzeichen, Textbausteine) o Teildokumente (Logos, DTDs) o Plattformunabhängigkeit o Kapselung des Speicherorts für Ersetzungstext an Definitionsort

27 30.Oktober / 6.November 2006 ― 27Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML … XML-Konzept: Entities o Ersetzungstext einer Entity kann intern (innerhalb der Deklaration der Entity) oder extern definiert werden; bei einer externen Definition wird eine Ressource (beispielsweise ein Dateiname) angegeben, die den Ersetzungstext enthält (Speicherort für Speichereinheit) o Orthogonal zwei Typen von Entities o General Entity: Expansion in Instanz o Parameter Entity: Expansion in DTD Vorteil: Getrennte Namensräume, Verbergen des Namensraums für DTD-interne Entitäten (Transparenz)

28 30.Oktober / 6.November 2006 ― 28Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML XML-Syntax: Entities … o Generelle Entities: in DTD deklariert, in Instanz verwendet Beispiele für Deklaration interner genereller Entity Beispiele für Deklaration externer genereller Entity Verwendung in Dokumenteninstanz (Text und Attributwerte) &AHK;

29 30.Oktober / 6.November 2006 ― 29Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML … XML-Syntax: Entities o Parameter-Entities: in DTD deklariert, in DTD verwendet Beispiele für Deklaration interner Parameter-Entity Beispiele für Deklaration externer Parameter-Entity Verwendung in DTD

30 30.Oktober / 6.November 2006 ― 30Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML Customizing DTDs o DocBook DTD für technische Dokumentation (OASIS) o Ziel: Erweiterung, Wiederverwendbarkeit, Anpassbarkeit o Mittel: Extensive Verwendung von Parameter-Entitäten o Entitäten in einer DTD mehrfach definierbar o erste Definition “zählt” (überschreibt spätere) o Methoden in DocBook o Aufteilung der DTD in Module, die nach Bedarf genutzt werden o Typisierung der Elemente: Metadaten, Gliederungselemente, Informationsbausteine, Informationsschnipsel, dann Klassenbildung (Klasse aller Listenarten etc.) über Parameter-Entitäten mit leeren “Aufhängern” für lokale Erweiterungen o kleinere Module und einzelne Elemente mit Möglichkeit zur Inklusion/Exklusion (marked section)

31 30.Oktober / 6.November 2006 ― 31Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML XML-Syntax: Entities für Fremddaten … Fremddaten über Attribute vom Typ ENTITY assoziieren o Assoziation durch Attribut vom Typ ENTITY mit dem Namen der zu referenzierenden Entity als Wert (Indirektion über dokumenteninternen Namen) o Notation (Datentyp) o Entity-Deklaration mit Notation (Binden des externen Namens an internen Namen, Vereinbarung des Datentyps der Fremddaten) Tutorial aus Praktikum XML-Technologie SS 2005 (..\..\Tutorielles\FremddatenEntities.pdf)..\..\Tutorielles\FremddatenEntities.pdf

32 30.Oktober / 6.November 2006 ― 32Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML … XML-Syntax: Entities für Fremddaten … o Beispiel o Aufruf der Fremddaten mit Attribut vom Typ ENTITY o Voraussetzungen o Deklaration des Attributs als vom Typ ENTITY o Deklaration der Entity als Fremddatentyp (Notation) o Deklaration der Notation o Anwendung im Computer-Propädeutikum (..\..\compProp)..\..\compProp

33 30.Oktober / 6.November 2006 ― 33Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML … XML-Syntax: Entities für Fremddaten Zusammenfassung o Standardisierte Assoziation von Fremddaten, nicht Import Behandlung der Assoziation durch Anwendungssysteme o Spiel mit Namen Kapselung der Plattformabhängigkeiten o Empfehlenswert: Aufteilung in dokumentinterne und externe Teile der DTD o Benennung der Fremddaten o Deklaration der Aufhängepunkte und Datentypen

34 30.Oktober / 6.November 2006 ― 34Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML Diskussion Syntax o "Flache" Syntaxdefinition: Abstraktion von Token für lexikalische Analyse fehlt o Alternative: xmlRulesRewritten.htmxmlRulesRewritten.htm o XMLLight für Instanzen: xmlLightI.htmxmlLightI.htm o Physische und logische Struktur nicht in getrennten Schichten (vgl. Präprozessoren für Makros in Programmiersprachen) o Viele Nebenbedingungen

35 30.Oktober / 6.November 2006 ― 35Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML Konzeptionelles Modell für XML … o XML: Sprache, in der strukturierte Dokumente und ihre Strukturvorgaben syntaktisch repräsentiert werden o Daten als Zeichenstrom unter bestimmten syntaktischen Regeln, Überprüfung und Abstraktion durch Parser, Datenmodell, APIs, Anwendungssysteme o In den Worten des XML-Standards: whatIsXML.htmwhatIsXML.htm o Wert liegt in Standardisierung durch W3C und Adaption im Web o Konzeptionelles Modell für XML-Dokumente nur implizit, nicht explizit (explizite konzeptionelle Beschreibung von XML unter xmlMod.htm)xmlMod.htm

36 30.Oktober / 6.November 2006 ― 36Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML … Konzeptuelles Modell für XML Begriffe (../../Tutorielles/xmlMod.htm)../../Tutorielles/xmlMod.htm o Element o Name oder Typ o Attribut o Name, Typ und Wert o XML-Dokument o XML-Instanz o XML-DTD (Document Type Definition) o Entitätenreferenz o Zeichenreferenz o Kommentar, Processing Instruction

37 30.Oktober / 6.November 2006 ― 37Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML Hausaufgabe (Abgabe Samstag, 11.11.2006) Formalisieren Sie das konzeptionelle Modell von XML in einem UML-Klassendiagramm

38 30.Oktober / 6.November 2006 ― 38Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML Formales Modell für XML (1) GCSDocument  DocInstance  DocGrammar. (2) DocInstance = DocSort  Attributes  Content. (3) Attributes = F fin (AttSort  AttValue  Character*  DocID). (4) Content = (DocInstance  Character)*. (5) DocGrammar = ContentRules  AttRules. (6) ContentRules = F fin (DocSort  DocDomain). (7) DocDomain = Reg(DocSort)  RReg(Character,DocSort). (8) AttRules = F fin (DocSort  AttSort  AttDomain). (9) AttDomain = P fin (AttValue)  { String, ID, IDREF }.

39 30.Oktober / 6.November 2006 ― 39Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML XML-Parser … o Programme zur XML-Syntaxüberprüfung heißen XML-Prozessoren oder Parser o Aufgaben eines Parsers o Syntaxüberprüfung (gegenüber XML-Grammatik) o Überprüfen der Wohlgeformtheit o Expansion von Referenzen o Einsetzen von Attributwerten o Validierung o Abstraktion von syntaktischem Zucker und von Alternativen o Weitergabe der erforderlichen Information (APIs)

40 30.Oktober / 6.November 2006 ― 40Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML … XML-Parser o Parser-Software Xerces von Apache XML unter http://xml.apache.org/, zum Beispiel als Java-Implementierung Xerces-J http://xml.apache.org/ o xercesImpl.jar, xml-apis.jar und xercesSamples im Classpath o Aufruf java sax.Counter [-v] XMLDocument o Online-Parser o http://www.hcrc.ed.ac.uk/~richard/xml-check.html http://www.hcrc.ed.ac.uk/~richard/xml-check.html o http://www.stg.brown.edu/service/xmlvalid/ http://www.stg.brown.edu/service/xmlvalid/

41 30.Oktober / 6.November 2006 ― 41Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML XML-Browser o Microsoft Internet Explorer ab Version 5 zur Darstellung von XML-Dokumenten, auch mit CSS-Stylesheets o Netscape Navigator ab Version 6 zur Darstellung von XML- Dokumenten, nur mit CSS-Stylesheets o Anbindung eines Stylesheets mit Processing Instruction [Associating Style Sheets with XML documents W3C Recommendation 29 June 1999 http://www.w3.org/TR/xml-stylesheet] http://www.w3.org/TR/xml-stylesheet o Beispiel (..\..\compProp)..\..\compProp

42 30.Oktober / 6.November 2006 ― 42Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML XML-Status … o Definition und Umsetzung von Formaten für XML o Stylesheet-Sprache CSS Umsetzung durch XML/CSS-fähigen Browser o Sprache XSLT zur Transformation von XML o nach HTML o nach XML (Anpassung der logischen Struktur) o nach PDF (über Zwischenstufe) Umsetzung durch Server oder Browser mit XSLT-Prozessor o mit XSLT auch andere Formate (z.B. LaTeX) erreichbar  XML dadurch operationabel für narrative Dokumente

43 30.Oktober / 6.November 2006 ― 43Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML … XML-Status … o Ergänzende Stylesheet- und Linking-Standards sowie Schema-Sprachen, Query-Sprachen o Software-Unterstützung ordentlich o Parser mit standardisierten APIs o Editoren o Document Management / Datenbank-Systeme o XSLT-Prozessoren o Browser o Stylesheet-Unterstützung

44 30.Oktober / 6.November 2006 ― 44Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML … XML-Status o Situation im EP-Bereich: XML-Studie Börsenverein 2004 http://www.boersenverein.de/sixcms/media.php/686/AKEP_Branchenbarometer2004.pdfXML-Studie http://www.boersenverein.de/sixcms/media.php/686/AKEP_Branchenbarometer2004.pdf o XML-Anwendungen (DTDs) o MathML, CML, DocBook, TEI, XHTML o Metadaten (auch Austauschformate) für Kataloganwendungen: RDF, Dublin Core o Authentifizierung, digitale Unterschriften o Electronic Commerce: Open Trading Protocol, EDI o Web Services: WSDL, SOAP o Ontologien: OWL o Content Syndication: RSS, ATOM

45 30.Oktober / 6.November 2006 ― 45Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML Verhältnis SGML-XML-HTML-XHTML … o Jedes gültige (valid ) XML-Dokument ist ein gültiges SGML- Dokument (nach leichter Anpassung des SGML-Standards) o XML-Dokumente können nur wohlgeformt sein (well-formed ): nur eine vollständig geklammerte Instanz, keine DTD oder keine Übereinstimmung zwischen DTD und Instanz SGML-Dokumente müssen immer DTD haben

46 30.Oktober / 6.November 2006 ― 46Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML … Verhältnis SGML-XML-HTML-XHTML … o HTML ist eine SGML-Anwendung; HTML ist über eine SGML-DTD definiert o HTML-Dokumente sind keine gültigen XML-Dokumente, aber Anpassung in Form von XHTML inzwischen vom W3C verabschiedet o XHTML (Januar 2000), HTML4 als XML-DTD definiert Richtlinien für Kompatibilität von XHTML-Dokumenten mit heutigen Browsern unter http://www.w3.org/TR/xhtml1/#guidelines http://www.w3.org/TR/xhtml1/#guidelines

47 30.Oktober / 6.November 2006 ― 47Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML … Verhältnis SGML-XML-HTML-XHTML … o XML: freies Vokabular für Elemente, Attribute, Entitäten HTML: festes Vokabular für Elemente, Attribute, Entitäten o XML: keine definierte Semantik für Sprachelemente HTML: definierte Semantik, von Browsern verstanden o HTML hat liberalere Syntax als XHTML o keine schließenden Tags bei leeren Elementen o Attributwerte ohne Anführungszeichen o Boolesche Attribute ohne Attributnamen Definition von XHTML mit HTML-Vokabular, aber strengerer XML-Syntax (JTidy zur Konvertierung von HTML nach XHTML)

48 30.Oktober / 6.November 2006 ― 48Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML … Verhältnis SGML-XML-HTML-XHTML o Einschränkungen/Änderungen von XML gegenüber SGML o feste SGML-Deklaration o explizite und vollständige Klammerung, keine Markup-Minimierung in DTD o Markierung für leeres Element X o Einschränkungen bei Content models: Exceptions, &-operator, Mixed content o Attributwerte immer in Anführungsstrichen o restriktivere Entity-Grenzen o ISO 10646 (Unicode) Zeichenkodierung, auch für Namen

49 30.Oktober / 6.November 2006 ― 49Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML Aufgaben Kodierung mit XML … Grundlage der Aufgaben ist das XML-Dokument „Wie ich das Rad erfand“ [..\..\xmlSamples\radBook.xml]..\..\xmlSamples\radBook.xml o Markieren Sie jedes Vorkommen der folgenden Sprachelemente von XML: XML-Deklaration, Dokumenttypdeklaration, Elementdeklaration, Attributdeklaration, (Entitydefinition), Element, Attribut, (Entityreferenz), Zeichenreferenz, Tag. o Führen Sie die Bestandteile einer Elementdeklaration und einer Attributdeklaration auf und markieren Sie sie ebenfalls.

50 30.Oktober / 6.November 2006 ― 50Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML … Aufgaben Kodierung mit XML o Visualisieren Sie das konzeptionelle Modell zum XML- Dokument als Baum. Müssen Sie Ihren Baum ändern, wenn in dem öffnenden Tag zum ersten Element chapter die beiden Attribute in umgekehrter Reihenfolge angegeben werden? o Erläutern Sie anhand Ihrer Überführung des XML- Dokuments in einen Baum die Aufgaben eines XML-Parsers. Gehen Sie auch auf die Begriffe „Wohlgeformtheit“ und „Validität“ ein.

51 30.Oktober / 6.November 2006 ― 51Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML XML-Steckbrief … o XML als Sprache für strukturierte Dokumente Dokumente als Daten, Daten als Dokumente o Priorität von logischer Auszeichnung in Gegensatz zu Machbarkeit (HTML) o Flexibilität bei Vokabular o Verifizierbarkeit o XML als Metasprache o homogene Syntax für Markup o frei definierbares Vokabular o Definition des Vokabulars mit homogener Syntax

52 30.Oktober / 6.November 2006 ― 52Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML … XML-Steckbrief o Document Management mit XML: Physikalische Aufspaltung in Entitäten o Zerlegung in separate Speichereinheiten (Modularisierung) o Wiederverwendbare Inhalte (Textbausteine) o Abkürzungen/Namen für Sonderzeichen Verwendung von Entitäten (Auflösung) über Namensreferenzen (Name/Ersetzungstext) o Multifunktionales Markup: Elemente mit Attributen, Referenzen, DTD-Deklarationen, Kommentare, Prozessanweisungen, XML-Deklarationen, Whitespace (außerhalb des Wurzeldokuments)

53 30.Oktober / 6.November 2006 ― 53Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML DTDs konzeptionell o Formale Beschreibung einer Klasse von XML-Dokumenten o Analogien o DTD  kontextfreie Grammatik syntaktischer Zucker implizit o Instanz  Wort der Grammatik o Baummodell  Syntaxbaum o Enge Korrespondenz zwischen Instanz/Baummodell bzw. Wort/Syntaxbaum: Niedrige Sprachklasse innerhalb der kontextfreien Sprachen (LL(1)) o Generierbarkeit von DTD-spezifischen Werkzeugen aus DTD (Forschung)

54 30.Oktober / 6.November 2006 ― 54Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML Literatur o XML-Seite des W3C (http://www.w3.org/XML/).http://www.w3.org/XML/ o E.R. Harold, W.S. Means: XML in a Nutshell. O'Reilly 2001. o E.T. Ray: Einführung in XML. O'Reilly 2001. o Neil Bradley: The XML Companion. Addison-Wesley 2002. o Mark Johnson: XML for the Absolute Beginner. Javaworld, April 1999. ( http://www.javaworld.com/javaworld/jw-04-1999/jw-04-xml_p.html ) http://www.javaworld.com/javaworld/jw-04-1999/jw-04-xml_p.html o Online-Tutorial von W3Schools (http://www.w3schools.com/xml/).http://www.w3schools.com/xml/ o XML-Portal von O‘Reilly (http://www.xml.com/).http://www.xml.com/

55 30.Oktober / 6.November 2006 ― 55Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML Aufgabe (Abgabe Samstag, den 4.10.2006) o Entwerfen Sie ein Gedicht als strukturiertes Dokument. Berücksichtigen Sie die Klassifizierung von Strukturelementen. Visualisieren Sie das Gedicht als Baum. Kodieren Sie das Gedicht in XML. Überprüfen Sie das Gedicht auf Wohlgeformtheit o mit einem Browser oder o mit einem Online-Validierer oder o mit einem selbstinstallierten Parser. o Entwerfen Sie eine Strukturvorgabe für Gedichte und visualisieren Sie sie als Baum. Kodieren Sie die Strukturvorgabe als DTD und binden Sie sie in Ihr Gedicht ein. o Validieren Sie das Gedicht mit den drei obigen Methoden


Herunterladen ppt "30.Oktober / 6.November 2006 ― 1Elektronisches Publizieren: Kodierung strukturierter Dokumente mit XML Kodierung strukturierter Dokumente im Web — XML."

Ähnliche Präsentationen


Google-Anzeigen