Seminar : XML und Datenbanken Die Auszeichnungssprache XML Lutz GarsteckiJena, 27.Mai 2004.

Slides:



Advertisements
Ähnliche Präsentationen
Extensible Markup Language
Advertisements

Worzyk FH Anhalt Datenbanksysteme für FÜ WS 2004/2005 XML - 1 XML Extensible Markup Language.
Anmerkungen zu XML Im September 2000 Entwicklung/Anspruch von XML
XML - Aufbau und Struktur - mit Einsatz im B2B
Hands On – Einführung in XML
IMS Universität Stuttgart 1 Einführung in XML Hannah Kermes HS: Elektronische Wörterbücher Do,
HTML - Einführung Richard Göbel.
FH-Hof Extensible Markup Language Richard Göbel. FH-Hof Extensible Markup Language XML XML ist universeller Ansatz für die Strukturierung von Zeichenketten.
DOM (Document Object Model)
Seminar XML und Datenbanken Sven Wiegelmann SS 2002.
XINDICE The Apache XML Project Name: Jacqueline Langhorst
XML-Schema HKI Proseminar Wintersemester 2010/11 Dozentin: Frau Kurz von Jan Kohl und Christian Lütticke.
HTML - Eine erste Annäherung
XML-basierte Techniken
XML-Parser Manuel Röllinghoff.
© 2002 Prof. Dr. G. Hellberg 1 XML-Seminar XML-Technologie: XML in Theorie und Praxis Prof. Dr. G. Hellberg XML-Technologie: XML in Theorie und Praxis.
Modularization of XHTML™
Überblick XML: Extensible Markup Language Entwickelt, um Informationen bereitzustellen, zu speichern und zu übertragen Im Gegensatz zu HTML keine vordefinierten.
SQL/XML. © Prof. T. Kudraß, HTWK Leipzig 2 2 Motivation Speicherung von XML in allen großen kommerziellen DBMS vorhanden proprietäre Lösungen für die.
Grundlagen von XML. © Prof. T. Kudraß, HTWK Leipzig Geschichte Grundidee generic coding - Trennung Information/Form formal definierter Dokumenttyp verschachtelte.
XML Standardisierungen und Abfragesprachen
Grundlagen von XML. © Prof. T. Kudraß, HTWK Leipzig Geschichte Grundidee generic coding - Trennung Information/Form formal definierter Dokumenttyp verschachtelte.
Einführung XML XML Einführung Andreas Leicht.
Vorlesung: 1 Betriebliche Informationssysteme XML © 2002 Prof. Dr. G. Hellberg Studiengang Informatik FHDW Vorlesung: Betriebliche Informationssysteme.
DVG Kommentare1 Kommentare. DVG Kommentare 2 Kommentare Es gibt zwei Arten von Kommentaren: einzeilige Kommentare // der Kommentar geht.
DVG Kommentare 1 Kommentare. 2 Kommentare Es gibt zwei Arten von Kommentaren: einzeilige Kommentare // der Kommentar geht bis zum Ende der Zeile.
1 XML und Datenbanken Kapitel 7: Modellierung, Teil 1 Meike Klettke Universität Rostock Fakultät für Informatik und Elektrotechnik
XML und Datenbanken - Einführung in XML -
1 Grundlagen und Anwendung der Extensible Markup Language (XML ) Peter Buxmann Institut für Wirtschaftsinformatik Johann Wolfgang Goethe-Universität Frankfurt.
Was versteht man unter XML Schema?
Vortrag HTML, XHTML, DHTML
XML eXtensible Markup Language
Fortsetzung DTDs, UML  XML
Copyright 2011 Bernd Brügge, Christian Herzog Grundlagen der Programmierung TUM Wintersemester 2011/12 Kapitel 11, Folie 1 2 Dr. Christian Herzog Technische.
Wird ganz am Anfang der HTML-Datei geschrieben Doctype html public bedeutet, dass man sich auf die Öffentlichkeit der html-dtd bezieht Html ist die meist.
Wo finde ich Meta-Tags…? Was sind Metatags…? Welche Meta-Tags sind am beliebtesten…? Sprachen von Meta-Tags…? Was ist eine Profildatei…? VTAB-09 Fenster.
Java für Fortgeschrittene
Information und ihre Darstellung: XHTML & CSS
Windows Presentation Foundation, Vorlesung Wintersemester 2013/14 Prof. Dr. Herrad Schmidt WS 13/14 Kapitel 2 Folie 2 XAML (1) s.a.
Tutorium zur LV Online Research Ein Computerprogramm tut, was Du schreibst, nicht was Du willst.
Wohlgeformtheit und Gültigkeit Grundlagen der Datenmodellierung Anke Jackschina.
Ausgabe vom Seite 1, XML Eine Einführung XML - Eine Einführung.
Programmierung 1. Einführung Seite 1
XML (Extensible Markup Language)
ADAT©2004 Dipl. - Ing. Walter SabinSeite: 1 Version 1.0a XML EXTENSIBLE MARKUP LANGUAGE.
Vortrag: Frames & Javascript.
© 2001 Sven Dammann1 Aufbau Integrierter Informationssysteme XML Bearbeitung und relationale Abbildung Sven Dammann Martin-Luther-Universität Halle-Wittenberg.
CSS Cascading Style Sheets
© Prof. Dr.-Ing. habil. Dierk Langbein 2005 Dierk Langbein LE 4 1 Datenverarbeitung mittels XML 1. XML-Grundlagen.
7. Formale Sprachen und Grammatiken
Hauptseminar Web-Services und verteilte Datenbanken Thema XML, DTDs und XML-Schema XML, DTDs und XML-Schema - Stefan Kurz, 25. April 2003.
- Warum: Das HTML-Dilemma
IT-Zertifikat der Phil.Fak Kurs 4: Daten- und Metadatenstandards Patrick Sahle XML-BasicsWS 08/09.
Seminar zur Geoinformation Folie 1 Inhalt: –XML –XML- SCHEMA –XSL –Syntax –GML Seminar zur Geoinformation Datenaustausch mit XML / GML im InternetDatenaustausch.
Peter Brezany Institut für Softwarewissenschaften Universität Wien
(Syntax, Strings/Zahlen, Variablen, Arrays)
XML Schema Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung WS2011/2012 Hist.-kult.wiss. Informationsverarbeitung (Teil.
Geoinformation3 Geoinformation III XML Grundlagen und Dokumentspezifikation Vorlesung 12b.
Institut für Kartographie und Geoinformation Prof. Dr. Lutz Plümer Dr. Thomas H. Kolbe Geoinformation III XML Grundlagen und Dokumentspezifikationen Vorlesung.
Geoinformation3 Geoinformation III XML Grundlagen, Namensräume und Hyperlinks Vorlesung 12b.
Geoinformation3 Geoinformation III XML-Schema Vorlesung 13a.
JAVA und XML Programmierpraktikum XML 1.0 / Namespaces Von Markus Lucht & Timo Stollenwerk.
XML Grundlagen, Namensräume & Hyperlinks
XML - Warum: Das HTML-Dilemma HTML, SGML, XML - Wie: Syntax, Konzepte, Sprachelemente Basics Wohlgeformte XML-Dokumente (ohne DTD) Gültige XML-Dokumente.
XML - Warum: Das HTML-Dilemma HTML, SGML, XML - Wie: Syntax, Konzepte, Sprachelemente Basics Wohlgeformte XML-Dokumente (ohne DTD) Gültige XML-Dokumente.
Pool Informatik, Sj 11/12 GZG FN W.Seyboldt 1 Pool Informatik 5 GZG FN Sj. 11/12 Kopieren, Daten, Programme.
Einführung in XML - Teil 1
8.November 2006 ― 1Elektronisches Publizieren: XML Namespaces Kodierung strukturierter Dokumente im Web — XML Namespaces —
Document Type Definitions (DTDs) Marko Harasic Freie Universität Berlin Institut für Informatik Netzbasierte Informationssysteme
13.Dezember 2006–1Elektronisches Publizieren: Schemasprachen — Relax NG Schemasprachen für XML — Relax NG — Anne Brüggemann-Klein TU München.
 Präsentation transkript:

Seminar : XML und Datenbanken Die Auszeichnungssprache XML Lutz GarsteckiJena, 27.Mai 2004

Lutz GarsteckiJena, 27.Mai 2004 Geschichtliche Entwicklung 1964 GML als erste moderne Auszeichnungssprache entwickelt 1986 SGML (Standard Generalized Markup Language) von ISO als Standard für Speicherung und Austausch v. Daten festgelegt (ISO 8879) 1996 begann W3C (WWW-Consortium) mit Entwicklung von XML (Extensible Markup Language) –sollte Mächtigkeit von SGML mit Akzeptanz von HTML verbinden Februar 1998 erklärt W3C XML 1.0 zu einer Empfehlung –formale Spezifikation und Grammatik in EBNF unter

Was ist Markup und warum XML? Markup –Methode zur Übermittlung von Metadaten –MLs benutzen Literale und Tags um Metadaten zu beschreiben und von eigentlichen Inhalt zu trennen Bei Entwicklung starker Bezug auf Spezifikation von SGML aber einfacher –zB. XML-Parser leichter zu erstellen, benutzt bereits existierende Internet- Protokolle und –Anwendungen, bleibt aufwärtskompatibel Datenaustausch übers Internet mit XML –Offenes System –Weitgehend selbstdokumentierend –auch ohne vorhergehende Koordination basiert auf UCS (Universal Character Set) –definiert im Standard ISO/IEC (Unicode) Lutz GarsteckiJena, 27.Mai 2004

Standard-API (Application Programming Interface) von W3C für XML entwickelt Unterstützung von Internationalisierung alle bekannten und beliebten Features von HTML –trotzdem kein Ersatz Obwohl hauptsächlich Daten selbst im Vordergrund, trotzdem Möglichkeiten der Darstellung –Stylesheets Lutz GarsteckiJena, 27.Mai 2004 „XML ist eine mächtige und elegante Art und Weise, wie man mit Daten umgeht, diese mit anderen austauschen kann und das alles über die Grenzen von unterschiedlichen Betriebssystemen hinweg.“ Was ist Markup und warum XML? (2)

Syntax: Entity, Tag, Zeichen Markup = Auszeichnung zur Beschreibung und Strukturierung des Inhalts von XML-Dokumenten (XML-Entity) Auszeichnung mittels Tags –Abgrenzung einzelne Abschnitte des Inhalts, dienen als Referenzen auf Teile von Inhalt, können spezielle Anweisungen enthalten oder dienen als Kommentar für Autoren ! >> Groß- und Kleinschreibung (case sensitivity) da viel Wert auf Internationalisierung Zeichen: 16 bit und Unicode 2.1 Zeichensatz –entspricht ISO/IEC Lutz GarsteckiJena, 27.Mai 2004

Syntax: Namen und Bezeichner Fast alle Strukturen in XML tragen Namen Alle XML-Namen oder Bezeichner müssen mit Buchstaben, Unterstrich (_) oder Doppelpunkt (:) beginnen und Danach nur gültige Zeichen für Namen (name characters), d.h. Ziffern, Bindestrich und Punkt Doppelpunkt (:) sollte nicht benutzt werden, nur als Trennsymbol bei Namensräumen Zeichen nicht mehr auf ASCII-Zeichensatz beschränkt –z.B. Umlaute usw. für Markup verwendbar Zeichenketten, die mit xml, XML,... beginnen nicht erlaubt –solche Namen nur für W3C reserviert Erlaubt: Auto, AUTO Nich gültig: -Auto, 320BMW, xmlData wieder gültig: _320BMW, _xmlData Lutz GarsteckiJena, 27.Mai 2004

Anatomie eines Dokuments Prolog (optional) Rumpf –mehrere Elemente, die miteinander baumartig verschachtelt sind, können beliebige character data enthalten Epilog (optional) –Kommentare, Verarbeitungsanweisungen, und/oder Leerstellen Lutz GarsteckiJena, 27.Mai 2004

Anatomie: Elemente Grundbausteine eines Dokuments (andere Elemente, Zeichen, Zeichenreferenzen, Entity-Referenzen, Verarbeitungsanweisungen, Kommentare und/oder CDATA-Abschnitte) = element content Konzept: Element als „Container“ – Ausnahme: Kommentare, PIs, Leerstellen werden durch Tags begrenzt ( aus Name des Elementtyps ) Beginn mit Start-Tag und Ende mit End-Tag (zwingend) Bsp.: hier steht der Inhalt Vorsicht! Namen müssen korrespondieren, Groß-/Kleinschreibung Leeres-Element-Tag: haben keinerlei Inhalt –beispielsweise zum Hervorheben gewisser Stellen im Dokument –z.Bsp. Datei-Ende-Kennung ) – oder abkürzende Mischform: Lutz GarsteckiJena, 27.Mai 2004

Anatomie: Elementtypen Jedes XML-Dokument muss baumartige Struktur haben Jedes XML-Dokument darf nur einen Baum haben –Ursprungsknoten = document entity oder document root –darf PIs und/oder Kommentare enthalten document root muss TB enthalten, dessen Wurzel das Dokument-Element ist –Elternelement; darf in keinem anderen Element auftreten –Wurzel des Element-Baums aber nicht document root Kind-Element: alle anderen Elemente im Dokument sind Nachfahren (Kinder) vom Dokument-Element –Eltern/Kind-Beziehung wichtiges Merkmal Jeder Elementtyp kann einen von 4 Inhaltstypen haben Lutz GarsteckiJena, 27.Mai 2004 –element content –mixed content –empty content –character content

Anatomie: korrekte und falsche Schachtelung XML fordert strikt, dass Elemente korrekt geschachtelt sein müssen Korrekte Schachtelung –Beispiel: Buchtransport zum Bücherladen ein echter Karton kann ein Buch nicht nur zum Teil enthalten Buch kann nur in einem Karton sein usw. Falsche Schachtelung –Beispiel: überlappende HTML-Elemente  in XML verboten Lutz GarsteckiJena, 27.Mai 2004

Text-Literale und Character Data Text-Literale dienen als Werte für Attribute, interne Entities und externe Bezeichner –müssen von Begrenzern ( ‘ oder “ ) umschlossen sein aber innerhalb der Literale darf jeweilige Begrenzer nicht auftauchen sollte man beide brauchen, muss das Zeichen mit entity reference (&apos; bzw. ") geschützt werden Character Data: jeder Text, der nicht zum Markup gehört –dass heißt: Inhalt von Elementen oder die Werte von Attributen aber: & und < dienen als Begrenzungssymbole für Markup  dürfen nicht ungeschützt in Texten auftauchen (Ausnahme: CDATA-Blöcke)  Schutz durch Benutzen der Entities (& bzw. <) Lutz GarsteckiJena, 27.Mai 2004

Attribute in XML Oft will man Aussagen über den Inhalt von Elementen machen (diese Infos sind aber nicht Teil des Inhalts selbst) Solche Informationen werden durch Attribute angegeben Name = ‘Wert‘ bzw. Name = “Wert“ Werte von Attributen sind immer Textliterale –Achtung: in HTML auch numerische Werte zB. oder unklar begrenzte Werte zB. erlaubt.  in XML verboten ! Inhalt eines Start-Tags oder eines Leere-Element-Tags jeweils nur eine Instanz eines Attribut-Namens erlaubt! –<img src=“bild01.jpg“ src=“alternativBild.jpg“ nicht erlaubt Deswegen vereinfachte Handhabung von Attributen durch XML-Parser Lutz GarsteckiJena, 27.Mai 2004

Spezielle Attribute in XML xml:space (Darstellung)  Zur Beibehaltung von Text-Formatierungen einschließlich aller Sonder- und Trennzeichen  Was Anwendung dann tatsächlich tut, ist abhängig vom Programmierer  Attribut-Wert auf Element selbst und alle seine Kinder angewendet  Bei validierendem Parser nur Werte >>preserve >default<< (DTD) Lutz GarsteckiJena, 27.Mai 2004 Zusätzlich: Attribute mit festgelegter Bedeutung -Weiterleiten von Mitteilungen an Applikation Nutzung der Syntax von XML-Namensräumen (xml : eigentlicher Name)

Jena, 27.Mai 2004Lutz Garstecki xml:lang (bei internationalen XML-Dok.)  zur Internationalisierung  bei bidirektionalen semitischen Texten, Hinweise zur Komposition asiatischer Schriftzeichen, lexikale Sortierreihenfolge von Zeichen, Rechtschreibprüfung,...  Bei validierendem Parser muss Attribut in DTD deklariert werden (wie alle anderen auch)  beschränkt auf: ISO 639 (zB. fr, ja),RFC 1766 benutzerdefinierte (ISO 3166)  Anwendung wie bei xml-space; auch hier Anwendung nicht verpflichtet zur Auswertung oder Reaktion Spezielle Attribute in XML (2)

Leerstellen und Trennzeichen (white spaces) Wichtiges linguistisches Konzept für natürliche und normale Sprachen In XML werden nur 4 Zeichen als Leerstellen bzw. Trennzeichen verwendet Regeln zur Handhabung sind sehr simpel: –alle Leerräume innerhalb des Dokumentes vom Parser beachtet und an Anwendung unverändert weitergegeben –Leeräume innerhalb von Tags und Werten von Attributen entfernt Bearbeitung der Anwendung überlassen –dass heißt, alle Behandlungen, die durch LF u./o. CR impliziert wurden Zeichencode(hex)/Beschreibung 09- HT (horr.Tabulator) 10- LF (Zeilenvorschub) 0D- CR (Wagenrücklauf) 20- Leerzeichen (ASCII)  Tabulatoren nicht zu mehreren Leerzeichen expandiert (also als ein Zeichen behandelt) Lutz GarsteckiJena, 27.Mai 2004

Handhabung von Zeilenenden XML-Dokumente oft in Form einzelner Dateien abgespeichert –sie bestehen aus einzelnen „Zeilen“ Text Leerräume CR u. LF auch zur Markierung für Zeilenende (wie im ASCII-Zeichensatz) 3 gängige Kombinationen dieser 2 Zeichen zur Markierierung innerhalb von Dateien –CR und LF (DOS, Windows) –LF allein (UNIX) –CR allein (MacOS) Zur Erleichterung der Erstellung von XML-Applikationen wandelt Parser jede Kombination in einfaches LF (line-feed) um, dass heißt, XML erzwingt ein Zeilenende, wie es bei UNIX üblich ist! Lutz GarsteckiJena, 27.Mai 2004

Zeichen- und Entity-Referenzen Wie auch SGML und HTML bietet XML eine einfache Methode zur Codierung von Zeichen, die nicht im ASCII-Zeichensatz enthalten sind. Zeichenreferenzen: als Ersatz für literale Form, wenn diese die Spezifikation verletzen würde –repräsentieren druckbare Zeichen u. bestehen aus dezimalen oder hexadezimalen Zahlen, die &# oder &#x davor haben –in XML hexadezimale Form bevorzugt, da Codierung in Unicode auch hexadezimale Notation Beispiel:© oder © im HTML-Browser © ® oder ­ im HTML-Browser ® Lutz GarsteckiJena, 27.Mai 2004

Entity-Referenzen erlauben es, beliebige Textliterale in Elemente oder Attribut-Werte einzufügen oder bieten die Möglichkeit, symbolische Namen (mnemonics) für Zeichenreferenzen zu definieren –&Name; wobei Name ein gültiger XML-Name sei muss –5 Entities als integraler Bestandteil von XML definiert (zum Schutz der Symbole aus dem XML-Markup): & < > &apos; " Beispiele: - AT&T = AT&T - "Jack&apos;s Auto" = “Jack‘s Auto“ –Außer diesen müssen alle Entity-Referenzen in der DTD eines Dokuments definiert werden, bevor man sie nutzen kann. Dabei kann DTD in separater Datei gespeichert =externe Teilmenge oder im Dokument selbst stehen = als Teil der -deklaration = interne Teilmenge. –Trifft Parser auf nichtdefinierte Referenz, wird Verarbeitung mit „fatal error“ abgebrochen! Lutz GarsteckiJena, 27.Mai 2004 Zeichen- und Entity-Referenzen (2)

Verarbeitungsanweisungen Verarbeitungsanweisungen (PIs) bieten Mechanismus, um mit dem Dokument Hinweise an die Anwendung weiterzugeben Ziel der PI ist zwingend anzugeben, Name muss gültiger XML-Name sein (zur Bezeichnung einer Anwendung an die sich die Anweisungen richten) Anweisungen ist einfaches Text-Literal (außer: ?> alle Zeichen) Viele Diskussionen über: –Nachteile Fehlende Unterstützung durch Browser Möglichkeit der Bildung inkompatibler Anweisungen durch Regelmangel für Definition von Pis –und Vorteile Schemataerweiterung Dukumenterweiterung ohne Änderung von Überprüfungsmechanismus durch DTD Einbettung von Anweisungen über Darstellung im Dokument selbst ohne Strukturänderung Lutz GarsteckiJena, 27.Mai 2004

Kommentare und CDATA-Blöcke Kommentare: zum Protokollieren der Entwicklung des Dokuments oder jede andere Art von Metadaten, die für Autor oder Leser wichtig sind, aber nicht zum Inhalt gehören. –können überall stehen, außer innerhalb vom Markup –im Kommentar, Entities nicht expandiert und Tags nicht interpretiert (belieb. Zeichen außer -- möglich) CDATA-Blöcke: Möglichkeit der Einbettung von Texten, welche Zeichen enthalten, die sonst als Markup interpretiert würden – „... “ können beliebige Zeichenketten sein, außer Textliteral „ ]]>“ aber: keine gute Möglichkeit zur Speicherung binärer Daten im Dokument (Bytefolge „5D5D3E“ dürfte nicht enthalten sein) Lutz GarsteckiJena, 27.Mai 2004

Logische Struktur von Dokumenten Prolog: Jedes XML-Dokument beginnt mit Prolog - OPTIONAL –Zeigt Beginn von XML-Daten an und beschreibt, welche Zeichenkodierung verwendet wird oder beinhaltet andere Infos, die für Parser oder Anwendung wichtig sind! XML-Deklaration –Jedes Dokument darf und sollte mit einer einzelnen XML-Deklaration beginnen! –Wenn, dann als erstes im Dokument (keine Leerzeichen oder Kommentare vorangestellt)! –erlaubt Anwendung einiger Optimierungen bei der Verarbeitung: XML-Version Codierung yes or no obligatorisch optional optional Lutz GarsteckiJena, 27.Mai 2004

Logische Struktur von Dokumenten Prolog: Deklaration des Dokumenttyps (Nicht verwechseln mit DTD!) –enthällt interne Teilmenge oder referenziert externe Teilmenge einer DTD –jedes gültige XML-Dokument muss Deklaration des Dokumenttyps enthalten Einfache, nur wohlgeformte Dokumente brauchen keine, solange im Dokument keine Entity-Referenzen außer 5 Standard-Entities auftauchen! –Referenzen auf externe Teilmenge: Referenz mit Name als Einstiegspunkt –Referenzen auf interne Teilmenge: Entity-Referenzen müssen in interner Teilmenge der DTD deklariert werden –Deklaration erfolgt dann in Deklaration des Dokumenttyps (mit [...] drum) !!! Definition interne Teilmenge hat Vorrang !!! (Bei Überschneidung von interner und externer Teilmenge!) Lutz GarsteckiJena, 27.Mai 2004

Logische Struktur von Dokumenten Epilog: kann Kommentare, PIs und/oder Leerzeichen enthalten Tim Bray: „Der Epilog in XML ist ein echter Designfehler“  nicht ohne driftigen Grund einen Epilog schreiben denn: XML-Dokument besitzt keine speziellen Kennzeichen für Dokumentende viele XML-Anwendungen nehmen den End-Tag des Dokument-Elements als Ende –Epilog könnte ignoriert werden (anwendungsspezifisch) –Verarbeitungsanweisungen zwischen 2 Dokumenten können allenfalls mehrdeutig sein Lutz GarsteckiJena, 27.Mai 2004

Ein wohlgeformtes XML-Dokument... ist ein XML-Dokument, das der Spezifikation und der darin festgelegten Syntax entspricht auch ohne DTD oder Schema, welches die Struktur beschreibt  „standalone document“ –können sich dann aber nicht auf externe Deklaration stützen –Attributwerte werden nicht besonders behandelt und bekommen keine Default-Werte zugewiesen Eigenschaften: - korrekte Schachtelung der Elemente - alle Elemente zusammen bilden einfachen Elementbaum - einzige direkte Relation zwischen 2 Elementen ist Kind-/Eltern-Beziehung Wenn Parser Konstrukt entdeckt, dass Bedingung der „Wohlgeformtheit“ widerspricht  „fatal error“ an die Anwendung Lutz GarsteckiJena, 27.Mai 2004

XML-Parser 2 Typen von XML-Prozessoren (Parser) - nicht validierend (Prüfung nur auf Wohlgeformtheit) - validierend (verwendet auch DTDs, um zu prüfen, ob Dokument in Form und Inhalt „gültig“ ist) Um Handhabung der XML-Daten aus Anwendung heraus zu erleichtern (z.Bsp. Symbole, die Zeilenende oder Dateiende markeieren, sind abhängig vom Betriebssystem  Parser reduziert alle Markierungen für Zeilenende auf LF; Weitergabe aller Leerzeichen an Anwendung; Auflösung aller Zeichenreferenzen, sowie sie in interner oder externer Deklaration definiert sind; Normalisierung aller Attributwerte vor Weitergabe an Anwendung) 2 Ansätze, Parser zu definieren –ereignisgesteuert, baumorientiert - wobei beide ihre Vorteile haben Lutz GarsteckiJena, 27.Mai 2004 Ende